
-
Nuevas lluvias monzónicas dejan más de 20 muertos en Pakistán
-
Todo lo que hay que saber sobre las regiones ucranianas ocupadas por Rusia
-
"Tiene ese espíritu competitivo argentino", destaca Alonso de Mastantuono
-
Air Canada cancela la reanudación de vuelos debido a la continuación de la huelga
-
La policía de Dubái recupera un diamante robado valorado en 25 millones de dólares
-
Rusos optimistas tras el encuentro Trump-Putin
-
En una cumbre de alto riesgo, Trump, no Putin, parece haber cedido
-
Bolsonaro regresa a prisión domiciliaria tras unos exámenes médicos a semanas de su veredicto
-
España combate sin tregua más de 20 incendios, en el año de mayor devastación por el fuego
-
Unos 200 ecologistas, incluida Greta Thunberg, bloquean la principal refinería de Noruega
-
Sube a 20 muertos el balance de una explosión en una fábrica de armas rusa
-
El Salvador prolonga la detención de presuntos pandilleros de cara a juicios masivos
-
El Canal de Panamá promete reducir la contaminación, pero ambientalistas son escépticos
-
Mueren cuatro migrantes al caer al mar en Turquía
-
Swatch retira una publicidad tras acusaciones de racismo en China
-
Amnistía Internacional denuncia una "campaña de hambruna deliberada" de Israel en Gaza
-
Birmania celebrará elecciones legislativas en diciembre pese a la guerra civil
-
La justicia multa a la aerolínea australiana Qantas por despidos en la pandemia
-
Una masacre en un billar deja siete muertos en Ecuador
-
Más de 40 personas desparecidas en Nigeria en un accidente de barco
-
Alcaraz y Sinner, la nueva tiranía del tenis, se reencuentran en la final de Cincinnati
-
Más de 250 personas evacuadas tras un nuevo incendio en Turquía
-
Murió el actor británico Terence Stamp, villano de Superman, a los 87 años
-
Nueve muertos por inundaciones en el norte de China
-
"Estoy plantando comida, no odio": Lula envía un recado a Trump desde su jardín
-
Un bombardeo en Sudán deja 17 muertos en una ciudad sitiada de Darfur del Norte
-
El argentino Guede deja la dirección técnica del Puebla con la Leagues Cup por jugar
-
El exabogado de Álvaro Uribe, culpable en un caso ligado a una condena contra el expresidente de Colombia
-
El fundador del Foro de Davos, exonerado de conducta indebida tras una investigación
-
Un muerto y varios heridos en un accidente de tren en Dinamarca
-
La economía colombiana crece pero queda corta frente a las expectativas
-
Hospitalizada en Rusia una periodista que intentó suicidarse en prisión
-
De Snoop Dogg a Tom Brady, las estrellas desembarcan en el Championship
-
Artesanos mexicanos reclaman apropiación cultural de Adidas por sandalias tradicionales
-
Los talibanes celebran su cuarto aniversario al frente de Afganistán
-
Muere un bombero que combatía el fuego en España, ascienden a 4 los fallecidos en la ola de incendios
-
Sequía e inundaciones repentinas obligan a los afganos a abandonar sus hogares
-
El huracán Erin amenaza con volver a intensificarse al acercarse a Bahamas
-
Un senador y un expresidente, las caras del inédito balotaje en Bolivia
-
Zelenski y líderes europeos negocian en Washington los términos de un acuerdo de paz
-
Bolivia elegirá presidente en balotaje entre dos candidatos de derecha
-
Bolivia elegirá presidente en balotaje entre dos candidatos de derecha, según proyecciones
-
Resbalón del Atlético de Madrid en su arranque en LaLiga
-
Atlético de Madrid pierde 2-1 ante Espanyol pese a gol de Julián Álvarez
-
Una Bolivia en crisis busca un cambio tras 20 años de socialismo
-
Air Canada cancela la reanudación de vuelos debido a continuación de huelga
-
Inmensa manifestación en Tel-Aviv en apoyo a los rehenes de Gaza
-
Sánchez propone un pacto nacional por "emergencia climática" en plenos incendios en España
-
Una Bolivia en crisis vota para cambiar de rumbo tras 20 años de socialismo
-
Dirigentes europeos acompañarán a Zelenski a la Casa Blanca el lunes

El riesgo de alimentar la inteligencia artificial con datos generados por el propio sistema
Los modelos de inteligencia artificial (IA) se abastecen sin parar de datos generados por la propia IA, lo que desemboca en la creación de contenidos cada vez más incoherentes, un problema que ya han señalado varios estudios científicos.
Los modelos en los que se basan las herramientas de IA generativa, como ChatGPT, que permiten crear todo tipo de contenidos con simples preguntas, necesitan ser ejercitados con un nombre colosal de datos.
Estos datos a menudo vienen de internet, que cada vez contiene más imágenes y textos creados por la propia IA.
Esta autoalimentación de la IA lleva a un deterioro de los modelos, que producen respuestas que van siendo cada vez menos originales y pertinentes y acaban por no tener ningún sentido, según un artículo publicado a finales de julio por la revista científica Nature.
Con el uso de este tipo de datos, llamados "datos sintéticos" porque están generados artificialmente, la muestra en la que se basan los modelos de IA para dar respuestas va perdiendo calidad.
- Como las vacas locas -
Investigadores de las Universidades de Rice y de Stanford, en Estados Unidos, llegaron a la misma conclusión analizando los modelos de IA generadores de imágenes Midjourney, Dall-E y Stable Diffusion.
Los estudios mostraron que las imágenes generadas eran cada vez menos originales e iban incorporando elementos incoherentes a medida que se añadían datos "artificiales" en el modelo, y compararon este fenómeno con la enfermedad de las vacas locas.
Esta epidemia, surgida en el Reino Unido, empezó con el uso para alimentar a los bovinos de harinas animales, obtenidas a partir de partes no consumidas de restos vacunos o de cadáveres de animales contaminados.
Las empresas del sector de la IA utilizan a menudo "datos sintéticos" para alimentar a sus programas debido a su fácil acceso, su abundancia y el bajo coste, comparado con datos creados por humanos.
Estas "fuentes de datos humanos sin explotar, de alta calidad" son cada vez más minoritarias, explica a AFP Jathan Sadowski, investigador especializado en las nuevas tecnologías de la Universidad de Monash, en Australia.
"Sin ningún control durante varias generaciones", la peor hipótesis sería que la degradación de los modelos "envenene la calidad y la diversidad de los datos en todo internet", advierte Richard Baraniuk, uno de los autores del artículo de la Universidad de Rice, en un comunicado.
Así como la crisis de las vacas locas hundió la industria cárnica en los años 1990, un internet repleto de contenidos hechos con IA y de modelos descontrolados podría amenazar el futuro del sector, en pleno auge, según los científicos.
"La verdadera pregunta para los investigadores y las empresas que construyen los sistemas de IA es: ¿cuándo el uso de los datos sintéticos es demasiado?", dice Sadowski.
- "Basura" -
Para otros especialistas, no obstante, el problema es exagerado.
Anthropic y Hugging Face, dos líderes del sector que afirman tener en cuenta el lado ético de la tecnología, confirman a AFP utilizar datos generados por la IA.
El artículo de la revista Nature presenta una perspectiva teórica interesante, pero poco realista, según Anton Lozhkov, ingeniero en aprendizaje automático en Hugging Face.
"El entrenamiento [de los modelos] en varias series de datos sintéticos es algo que simplemente no se hace en realidad", asegura.
Lozhkov admite sin embargo que los expertos de la IA se sienten frustrados ante la situación en que se encuentra internet.
"Una gran parte de internet es una basura", dice, y agrega que su empresa ha hecho grandes esfuerzos para limpiar este tipo de datos, suprimiendo a veces hasta un 90% de contenido.
P.M.Smith--AMWN