-
Un tribunal francés ordena nuevas pesquisas en el caso contra el chileno Zepeda por asesinato
-
La ONU advierte que se desaceleran los avances contra la mortalidad infantil
-
Un juez ordena al gobierno de Trump reincorporar a personal de Voice of America
-
Con la aprobación de Paraguay, Mercosur deja ratificado el acuerdo comercial con la UE
-
La selección femenina iraní de fútbol regresó a su país
-
El Parlamento de Escocia rechaza legalizar la ayuda a la muerte
-
Un exgeneral del ejército es nombrado jefe de gabinete de Perú
-
Rusia acusa al documental que ganó el Óscar de filmar niños sin consentimiento
-
El primer ministro irlandés planta cara cortésmente a Trump
-
La fiscalía noruega pide más de 7 años de cárcel contra el hijo de la princesa heredera, juzgado por violaciones
-
El comisionado de DDHH de la ONU es "enemigo de Venezuela", dice el jefe del parlamento
-
Nvidia reanuda la producción de chips para clientes chinos
-
Mueren cinco personas en el incendio de una refinería de Pemex en México
-
Alí Larijani, el estratega de la guerra en Irán
-
Brasil refuerza la protección de menores en su acceso a internet
-
Es "sumamente grave" la situación de la libertad de prensa en Ecuador, según RSF
-
El sistema político cubano no está en debate, dice una enviada diplomática en Washington
-
Kast frena decenas de decretos de protección al ambiente en Chile
-
Bukele endurece su guerra antipandillas con la cadena perpetua en El Salvador
-
Israel anuncia que suspende la entrada de ayuda de la Unicef proveniente de Egipto a Gaza debido al "contrabando"
-
Messi está en "perfectas condiciones" para enfrentar a Nashville, dice Mascherano
-
Una comisión de la Cámara de Representantes de EEUU cita a la fiscal general por el caso Epstein
-
Milei arremete contra Irán en el aniversario del atentado contra la embajada israelí en Argentina
-
El expresidente francés Sarkozy niega actos "de corrupción" en su juicio en apelación por el financiamiento libio de su campaña
-
La Fiscalía de Ecuador investiga la muerte de un hombre en un operativo militar
-
"Aterrados": Colombia denuncia un presunto bombardeo de Ecuador en plena crisis diplomática
-
Sin Finalissima, Argentina jugará un amistoso ante Guatemala en Buenos Aires
-
Sheinbaum presenta un nuevo plan de reforma electoral enfocado en reducir costos
-
Al menos 12 muertos en bombardeos israelíes en el centro de Beirut
-
EEUU aumenta la presión sobre Cuba, que restablece la electricidad tras un apagón
-
Aumentan a 20 los casos sospechosos de meningitis en el Reino Unido en un brote "sin precedentes"
-
Trump espera viajar a China dentro de "cinco o seis semanas"
-
El presidente de Colombia recupera su visa para EEUU tras su acercamiento con Trump
-
Francia incauta un récord de 13 toneladas de cocaína en el puerto de Dunkerque
-
Investigan posibles relaciones con Irán de los atacantes de una sinagoga en Países Bajos
-
EEUU abre con sus aliados en América Latina una nueva era de cooperación antidrogas
-
El precio del petróleo WTI cae, pero aún ronda los 100 dólares
-
"Cientos de muertos y heridos" en el ataque a una clínica de Kabul, confirma una ONG
-
Al borde de la carretera, los ucranianos reciben a sus prisioneros de guerra
-
Ryan Gosling y su "Proyecto Fin del mundo", el filme que aconseja "ver en los cines"
-
Irán jura vengar la muerte de su jefe de seguridad Larijani
-
EEUU bombardea cerca de estrecho, Irán promete vengar muerte de jefe de seguridad
-
Los Óscar pierden un 9% de audiencia
-
EEUU aumenta presión sobre Cuba, que restablece electricidad tras apagón
-
Los favoritos no dan margen a la sorpresa, fin de aventura del Bodo/Glimt
-
Real Madrid vuelve a cortar el paso al City y a Guardiola
-
La subida del precio del petróleo por la guerra en Irán se modera
-
Bolsonaro mejora de su neumonía, pero sin alta prevista del hospital
-
Un tribunal del Vaticano ordena un nuevo juicio contra el cardenal acusado de malversación
-
EEUU aumenta presión sobre Cuba mientras la isla lucha contra masivo apagón
El riesgo de alimentar la inteligencia artificial con datos generados por el propio sistema
Los modelos de inteligencia artificial (IA) se abastecen sin parar de datos generados por la propia IA, lo que desemboca en la creación de contenidos cada vez más incoherentes, un problema que ya han señalado varios estudios científicos.
Los modelos en los que se basan las herramientas de IA generativa, como ChatGPT, que permiten crear todo tipo de contenidos con simples preguntas, necesitan ser ejercitados con un nombre colosal de datos.
Estos datos a menudo vienen de internet, que cada vez contiene más imágenes y textos creados por la propia IA.
Esta autoalimentación de la IA lleva a un deterioro de los modelos, que producen respuestas que van siendo cada vez menos originales y pertinentes y acaban por no tener ningún sentido, según un artículo publicado a finales de julio por la revista científica Nature.
Con el uso de este tipo de datos, llamados "datos sintéticos" porque están generados artificialmente, la muestra en la que se basan los modelos de IA para dar respuestas va perdiendo calidad.
- Como las vacas locas -
Investigadores de las Universidades de Rice y de Stanford, en Estados Unidos, llegaron a la misma conclusión analizando los modelos de IA generadores de imágenes Midjourney, Dall-E y Stable Diffusion.
Los estudios mostraron que las imágenes generadas eran cada vez menos originales e iban incorporando elementos incoherentes a medida que se añadían datos "artificiales" en el modelo, y compararon este fenómeno con la enfermedad de las vacas locas.
Esta epidemia, surgida en el Reino Unido, empezó con el uso para alimentar a los bovinos de harinas animales, obtenidas a partir de partes no consumidas de restos vacunos o de cadáveres de animales contaminados.
Las empresas del sector de la IA utilizan a menudo "datos sintéticos" para alimentar a sus programas debido a su fácil acceso, su abundancia y el bajo coste, comparado con datos creados por humanos.
Estas "fuentes de datos humanos sin explotar, de alta calidad" son cada vez más minoritarias, explica a AFP Jathan Sadowski, investigador especializado en las nuevas tecnologías de la Universidad de Monash, en Australia.
"Sin ningún control durante varias generaciones", la peor hipótesis sería que la degradación de los modelos "envenene la calidad y la diversidad de los datos en todo internet", advierte Richard Baraniuk, uno de los autores del artículo de la Universidad de Rice, en un comunicado.
Así como la crisis de las vacas locas hundió la industria cárnica en los años 1990, un internet repleto de contenidos hechos con IA y de modelos descontrolados podría amenazar el futuro del sector, en pleno auge, según los científicos.
"La verdadera pregunta para los investigadores y las empresas que construyen los sistemas de IA es: ¿cuándo el uso de los datos sintéticos es demasiado?", dice Sadowski.
- "Basura" -
Para otros especialistas, no obstante, el problema es exagerado.
Anthropic y Hugging Face, dos líderes del sector que afirman tener en cuenta el lado ético de la tecnología, confirman a AFP utilizar datos generados por la IA.
El artículo de la revista Nature presenta una perspectiva teórica interesante, pero poco realista, según Anton Lozhkov, ingeniero en aprendizaje automático en Hugging Face.
"El entrenamiento [de los modelos] en varias series de datos sintéticos es algo que simplemente no se hace en realidad", asegura.
Lozhkov admite sin embargo que los expertos de la IA se sienten frustrados ante la situación en que se encuentra internet.
"Una gran parte de internet es una basura", dice, y agrega que su empresa ha hecho grandes esfuerzos para limpiar este tipo de datos, suprimiendo a veces hasta un 90% de contenido.
P.M.Smith--AMWN