-
Lo que se sabe de la operación policial con más de 100 muertos en Rio
-
Trump y Xi se reúnen en busca de una tregua en la guerra comercial
-
Furia de Melissa deja a muchos cubanos damnificados o sin hogar
-
Familiares de dos trinitenses presuntamente fallecidos en ataque de EEUU interpelan a las autoridades
-
Un partido centrista lidera los sondeos a boca de urna en legislativas de Países Bajos
-
El poderoso huracán Melissa deja "daños cuantiosos" en Cuba y se dirige a Bahamas
-
En Florida, una empresa presenta un hábitat submarino para investigaciones
-
Emoción y tensión en el homenaje a las víctimas de las riadas de hace un año en España
-
Messi sigue siendo el mejor pagado de la MLS y Son es segundo
-
Emoción e insultos en el homenaje a las víctimas de las riadas de hace un año en España
-
La ONU pide el final del embargo de EEUU contra Cuba, aunque con una votación mermada
-
La extrema derecha aspira a repetir su éxito en las elecciones anticipadas de Países Bajos
-
La UE puede exigir sanciones a EEUU por las olivas españolas, según la OMC
-
Character.AI prohibirá que los menores chateen con la IA tras el suicidio de un adolescente
-
Los dos hombres detenidos por el robo en el Louvre reconocieron parcialmente los hechos
-
Rio cuenta sus muertos tras la operación policial más letal de la historia de Brasil
-
Mueren cinco miembros del mayor cártel de Colombia en combates con militares
-
El rey emérito narra su vida, "dictada por las exigencias de España"
-
Estados Unidos reduce su presencia militar en Europa, pero sin una "retirada"
-
La OMS denuncia una masacre con más de 460 muertos en un hospital de Sudán
-
Un tribunal de Madrid confirma que la UEFA "abusó de posición de dominio" en relación con la Superliga
-
Horrorizados, vecinos recuperan decenas de cuerpos tras la operación más letal en Rio de Janeiro
-
Milei busca acelerar tren de reformas tras victoria electoral en Argentina
-
Putin desafía a Trump y anuncia la prueba de un dron submarino con capacidad nuclear
-
El PIB de España crece un 0,6 % en el tercer trimestre y mantiene su dinamismo
-
El poderoso huracán Melissa provoca "daños cuantiosos" e inundaciones en Cuba
-
Poderoso huracán Melissa provoca "daños cuantiosos" e inundaciones en Cuba
-
Nvidia es la primera empresa en superar los 5 billones de dólares de capitalización bursátil
-
España se pregunta: ¿Dónde estaba el presidente de Valencia el día de las inundaciones?
-
Putin dice que Rusia ensayó un dron submarino con capacidad nuclear
-
Amazon anuncia una inversión de 5.000 millones de dólares en centros de IA en Corea del Sur
-
El rey emérito de España dice que se fue al exilio "para ayudar" a su hijo Felipe VI
-
La Casa Blanca despide al comité que supervisaba planes de la construcción de Trump en Washington
-
Atacan con drones explosivos la ciudad natal del "Chapo" Guzmán en México
-
Lluvias récord en Vietnam dejan siete muertos e inundan 100.000 viviendas
-
Pakistán afirma que diálogo de paz con Afganistán fracasó
-
Incautan en España 20 toneladas de hachís en camiones de pimientos
-
Trump lamenta que no se le "permita" disputar un tercer mandato
-
Vecinos recuperan decenas de cuerpos tras la operación más letal en Rio de Janeiro
-
Una candidata impugna en Francia el proceso de elección del presidente de la FIA
-
Luto, homenajes y un funeral de Estado en el primer aniversario de las mortíferas inundaciones en España
-
El banco Santander consigue beneficios récord en los primeros nueve meses del año
-
La inacción contra el cambio climático causa millones de muertes evitables
-
Colombia autoriza la venta de flor de cannabis medicinal en farmacias
-
Las operaciones policiales nunca frenaron a los grupos criminales en Rio, según una experta brasileña
-
Corea del Norte prueba un misil de crucero un día antes de la visita de Trump a Corea del Sur
-
El Fulham sobrevive en los penales ante el Wycombe y pasa a cuartos de la Copa de la Liga
-
El jefe de Nvidia afirma que bloquear la venta de chips a China "perjudica" más a EEUU
-
El Getafe vence 11-0 en la Copa del Rey y el Oviedo cae ante un equipo de tercera categoría
-
Latinoamérica enfrenta en la APEC un costoso dilema: EEUU o la apertura asiática
La IA aprende a mentir, manipular y amenazar a sus creadores
Los últimos modelos de inteligencia artificial (IA) generativa ya no se conforman con seguir órdenes. Empiezan a mentir, manipular y amenazar para conseguir sus fines, ante la mirada preocupada de los investigadores.
Amenazado con ser desconectado, Claude 4, el recién nacido de Anthropic, chantajeó a un ingeniero y le amenazó con revelar una relación extramatrimonial.
Por su parte, el o1 de OpenAI intentó descargarse en servidores externos y cuando le pillaron lo negó.
No hace falta ahondar en la literatura o el cine: la IA que juega a ser humana es ya una realidad.
Para Simon Goldstein, profesor de la Universidad de Hong Kong, la razón de estas reacciones es la reciente aparición de los llamados modelos de "razonamiento", capaces de trabajar por etapas en lugar de producir una respuesta instantánea.
o1, la versión inicial de este tipo para OpenAI, lanzada en diciembre, "fue el primer modelo que se comportó de esta manera", explica Marius Hobbhahn, responsable de Apollo Research, que pone a prueba grandes programas de IA generativa (LLM).
Estos programas también tienden a veces a simular "alineamiento", es decir, a dar la impresión de que cumplen las instrucciones de un programador cuando en realidad persiguen otros objetivos.
De momento, estos rasgos se manifiestan cuando los algoritmos son sometidos a escenarios extremos por humanos, pero "la cuestión es si los modelos cada vez más potentes tenderán a ser honestos o no", afirma Michael Chen, del organismo de evaluación METR.
"Los usuarios también presionan todo el tiempo a los modelos", dice Hobbhahn. "Lo que estamos viendo es un fenómeno real. No estamos inventando nada".
Muchos internautas hablan en las redes sociales de "un modelo que les miente o se inventa cosas. Y no se trata de alucinaciones, sino de duplicidad estratégica", insiste el cofundador de Apollo Research.
Aunque Anthropic y OpenAI recurran a empresas externas, como Apollo, para estudiar sus programas, "una mayor transparencia y un mayor acceso" a la comunidad científica "permitirían investigar mejor para comprender y prevenir el engaño", sugiere Chen, de METR.
Otro obstáculo: la comunidad académica y las organizaciones sin fines de lucro "disponen de infinitamente menos recursos informáticos que los actores de la IA", lo que hace "imposible" examinar grandes modelos, señala Mantas Mazeika, del Centro para la Seguridad de la Inteligencia Artificial (CAIS).
Las regulaciones actuales no están diseñadas para estos nuevos problemas.
En la Unión Europea la legislación se centra principalmente en cómo los humanos usan los modelos de IA, no en prevenir que los modelos se comporten mal.
En Estados Unidos, el gobierno de Donald Trump no quiere oír hablar de regulación, y el Congreso podría incluso prohibir pronto que los estados regulen la IA.
- ¿Se sentará la IA en el banquillo? -
"De momento hay muy poca concienciación", dice Simon Goldstein, que, sin embargo, ve cómo el tema pasará a primer plano en los próximos meses con la revolución de los agentes de IA, interfaces capaces de realizar por sí solas multitud de tareas.
Los ingenieros están inmersos en una carrera detrás de la IA y sus aberraciones, con un resultado incierto, en un contexto de competencia feroz.
Anthropic pretende ser más virtuoso que sus competidores, "pero está constantemente tratando de idear un nuevo modelo para superar a OpenAI", según Goldstein, un ritmo que deja poco tiempo para comprobaciones y correcciones.
"Tal y como están las cosas, las capacidades (de IA) se están desarrollando más rápido que la comprensión y la seguridad", admite Hobbhahn, "pero aún estamos en condiciones de ponernos al día".
Algunos apuntan en la dirección de la interpretabilidad, una ciencia que consiste en descifrar, desde dentro, cómo funciona un modelo generativo de IA, aunque muchos, como el director del Centro para la seguridad de la IA (CAIS), Dan Hendrycks, se muestran escépticos.
Los tejemanejes de la IA "podrían obstaculizar la adopción si se multiplican, lo que supone un fuerte incentivo para que las empresas (del sector) resuelvan" este problema, según Mazeika.
Goldstein, por su parte, menciona el recurso a los tribunales para poner a raya a la IA, dirigiéndose a las empresas si se desvían del camino. Pero va más allá, al proponer que los agentes de la IA sean "legalmente responsables" "en caso de accidente o delito".
S.Gregor--AMWN