- Gigantes tecnológicos como Apple, Nvidia y Anthropic han empleado miles de videos de YouTube para perfeccionar sus algoritmos de inteligencia artificial.
- A pesar de las políticas de YouTube contra la recolección no autorizada de materiales, las empresas han utilizado los subtítulos de más de 173,536 videos de más de 48,000 canales, incluyendo contenido de educación y entretenimiento.
- El uso no autorizado ha afectado a creadores prominentes como ‘Mr. Beast’, ‘Marques Brownlee’, ‘Jacksepticeye’ y ‘PewDiePie’.
En el mundo actual, regido por el avance tecnológico, la inteligencia artificial (IA) se ha convertido en una herramienta fundamental para el desarrollo de diversas industrias. Sin embargo, detrás de este progreso se esconde una práctica poco conocida que ha generado controversia: la utilización silenciosa de videos de YouTube por parte de las empresas tecnológicas para entrenar sus sistemas de IA.
La IA se alimenta de todo lo que encuentra en YouTube, sin permiso
Una investigación de Proof News ha revelado que las empresas tecnológicas Apple, Nvidia y Anthropic han estado utilizando miles de videos de YouTube para entrenar sus algoritmos de inteligencia artificial, sin el consentimiento de los creadores de contenido.
Aunque YouTube prohíbe expresamente la recolección de materiales sin permiso, estas empresas han accedido a los subtítulos de más de 173,536 videos de más de 48,000 canales, que incluyen desde contenido educativo de ‘Khan Academy’ y MIT, hasta programas populares como ‘The Late Show With Stephen Colbert’ y ‘Last Week Tonight With John Oliver’.
Además de afectar a canales de renombre, el uso no autorizado también ha incluido contenido de megaestrellas de YouTube como ‘Mr. Beast’ (289 millones de suscriptores, dos videos recopilados), ‘Marques Brownlee’ (19 millones de suscriptores, siete videos), ‘Jacksepticeye’ (casi 31 millones de suscriptores, 377 videos) y ‘PewDiePie’ (111 millones de suscriptores, 337 videos). Este descubrimiento subraya las preocupaciones éticas y legales en torno al uso de datos digitales sin el consentimiento explícito de los creadores originales.