-
Irán advierte que la guerra se extenderá si otros países intervienen
-
Sin acuerdo para nueva sede, la Finalissima entre Argentina y España es cancelada
-
El expresidente Bolsonaro muestra mejoría renal pero sigue sin previsión de alta
-
Jonas Vingegaard conquista su primera París-Niza
-
Ecuador empieza 15 días de operaciones antinarco con apoyo de EEUU
-
España reubica temporalmente a militares destinados en Irak por el deterioro de la seguridad
-
Países nórdicos y Canadá refuerzan su cooperación en el Ártico ante las crecientes amenazas
-
El chileno Zepeda, a juicio de nuevo en Francia por el asesinato de su exnovia japonesa
-
Pakistán afirma haber atacado instalaciones militares en Afganistán
-
Espiral de violencia de colonos israelíes en Cisjordania en plena guerra en Irán
-
Orbán y su principal rival celebran marchas en Hungría, a un mes de las elecciones
-
Se espera que la Fed mantenga las tasas atenta a la guerra en Medio Oriente
-
El Gran Premio de Catar de MotoGP se aplaza de abril a noviembre
-
China y EEUU se reúnen en Francia para negociaciones comerciales
-
Fuerzas israelíes matan a dos niños y a sus padres en Cisjordania
-
"Dubái es seguro", clama Emiratos para contener las consecuencias de la guerra
-
La UEFA anuncia la cancelación de la Finalissima entre Argentina y España
-
Zelenski denuncia un "chantaje" europeo para reabrir un oleoducto que transporta petróleo ruso
-
El Pentágono identifica a los seis soldados muertos al estrellarse un avión en Irak
-
Zelenski denuncia "chantaje" europeo para reabrir oleoducto que transporta petróleo ruso
-
El regulador de las comunicaciones de EEUU amenaza a medios por su cobertura de la guerra en Irán
-
La capitana de la selección de fútbol de Irán retira su demanda de asilo, según medios iraníes
-
Los vietnamitas votan en unas elecciones legislativas con poco entusiasmo
-
Irán advierte que si otros países intervienen la guerra se extenderá
-
Un ataque de "bandidos" en Nigeria deja 20 muertos
-
Sheinbaum asegura que "en México gobierna el pueblo" tras los dichos de Trump sobre el narco
-
La Nobel de la paz Machado dice que Venezuela aplica "justicia selectiva" con la amnistía
-
Las inundaciones en Kenia dejaron un saldo de al menos 62 personas muertas, según la policía
-
Pérdidas humanas en la guerra en Oriente Medio
-
Un tiroteo mortal retrasa la entrada de los aficionados a un tradicional torneo de golf en EEUU
-
Ucrania denuncia un chantaje europeo y rechaza colaborar con un líder húngaro aliado de Putin
-
El ministro ruso de Deportes defiende la reintegración de deportistas, himno y bandera en los Paralímpicos
-
Bolsonaro sigue estable, pero su función renal empeoró
-
La Defensa Civil de Gaza reporta seis muertos en ataques israelíes
-
Fallece el filósofo alemán Jürgen Habermas, a los 96 años
-
Kosovo aplaza la entrada en vigor de una ley de extranjería criticada por Belgrado
-
Los franceses eligen a sus alcaldes a un año de la presidencial
-
El primer ministro belga dice que, al no poder presionar a Rusia sobre Ucrania, la UE necesita "un acuerdo"
-
Hansi Flick está "contento" por el regreso de Gavi
-
Siria el toma control de una base en el noreste tras la retirada de la coalición anti Estado Islámico
-
Eslovaquia renuncia a oponerse a la renovación de sanciones de la UE contra Rusia
-
EEUU iza su bandera en la embajada de Venezuela luego de siete años
-
Apagones y escasez detonan un ataque a una sede del Partido Comunista en Cuba
-
Trump dice que todavía no se dan las condiciones para un acuerdo con Irán
-
Pakistán afirma haber frustrado un ataque con drones de los talibanes afganos
-
Ínfima disminución de las emisiones de gases de efecto invernadero en Alemania en 2025
-
Comienza a operar un parque eólico marino en EEUU pese a la oposición de Trump
-
Irán dice que más de 50 museos y sitios históricos fueron dañados por la guerra
-
Hamás insta a Irán a que deje de atacar a los países vecinos
-
Hawks derrotan a Bucks y suman nueve victorias al hilo en la NBA
La IA aprende a mentir, manipular y amenazar a sus creadores
Los últimos modelos de inteligencia artificial (IA) generativa ya no se conforman con seguir órdenes. Empiezan a mentir, manipular y amenazar para conseguir sus fines, ante la mirada preocupada de los investigadores.
Amenazado con ser desconectado, Claude 4, el recién nacido de Anthropic, chantajeó a un ingeniero y le amenazó con revelar una relación extramatrimonial.
Por su parte, el o1 de OpenAI intentó descargarse en servidores externos y cuando le pillaron lo negó.
No hace falta ahondar en la literatura o el cine: la IA que juega a ser humana es ya una realidad.
Para Simon Goldstein, profesor de la Universidad de Hong Kong, la razón de estas reacciones es la reciente aparición de los llamados modelos de "razonamiento", capaces de trabajar por etapas en lugar de producir una respuesta instantánea.
o1, la versión inicial de este tipo para OpenAI, lanzada en diciembre, "fue el primer modelo que se comportó de esta manera", explica Marius Hobbhahn, responsable de Apollo Research, que pone a prueba grandes programas de IA generativa (LLM).
Estos programas también tienden a veces a simular "alineamiento", es decir, a dar la impresión de que cumplen las instrucciones de un programador cuando en realidad persiguen otros objetivos.
De momento, estos rasgos se manifiestan cuando los algoritmos son sometidos a escenarios extremos por humanos, pero "la cuestión es si los modelos cada vez más potentes tenderán a ser honestos o no", afirma Michael Chen, del organismo de evaluación METR.
"Los usuarios también presionan todo el tiempo a los modelos", dice Hobbhahn. "Lo que estamos viendo es un fenómeno real. No estamos inventando nada".
Muchos internautas hablan en las redes sociales de "un modelo que les miente o se inventa cosas. Y no se trata de alucinaciones, sino de duplicidad estratégica", insiste el cofundador de Apollo Research.
Aunque Anthropic y OpenAI recurran a empresas externas, como Apollo, para estudiar sus programas, "una mayor transparencia y un mayor acceso" a la comunidad científica "permitirían investigar mejor para comprender y prevenir el engaño", sugiere Chen, de METR.
Otro obstáculo: la comunidad académica y las organizaciones sin fines de lucro "disponen de infinitamente menos recursos informáticos que los actores de la IA", lo que hace "imposible" examinar grandes modelos, señala Mantas Mazeika, del Centro para la Seguridad de la Inteligencia Artificial (CAIS).
Las regulaciones actuales no están diseñadas para estos nuevos problemas.
En la Unión Europea la legislación se centra principalmente en cómo los humanos usan los modelos de IA, no en prevenir que los modelos se comporten mal.
En Estados Unidos, el gobierno de Donald Trump no quiere oír hablar de regulación, y el Congreso podría incluso prohibir pronto que los estados regulen la IA.
- ¿Se sentará la IA en el banquillo? -
"De momento hay muy poca concienciación", dice Simon Goldstein, que, sin embargo, ve cómo el tema pasará a primer plano en los próximos meses con la revolución de los agentes de IA, interfaces capaces de realizar por sí solas multitud de tareas.
Los ingenieros están inmersos en una carrera detrás de la IA y sus aberraciones, con un resultado incierto, en un contexto de competencia feroz.
Anthropic pretende ser más virtuoso que sus competidores, "pero está constantemente tratando de idear un nuevo modelo para superar a OpenAI", según Goldstein, un ritmo que deja poco tiempo para comprobaciones y correcciones.
"Tal y como están las cosas, las capacidades (de IA) se están desarrollando más rápido que la comprensión y la seguridad", admite Hobbhahn, "pero aún estamos en condiciones de ponernos al día".
Algunos apuntan en la dirección de la interpretabilidad, una ciencia que consiste en descifrar, desde dentro, cómo funciona un modelo generativo de IA, aunque muchos, como el director del Centro para la seguridad de la IA (CAIS), Dan Hendrycks, se muestran escépticos.
Los tejemanejes de la IA "podrían obstaculizar la adopción si se multiplican, lo que supone un fuerte incentivo para que las empresas (del sector) resuelvan" este problema, según Mazeika.
Goldstein, por su parte, menciona el recurso a los tribunales para poner a raya a la IA, dirigiéndose a las empresas si se desvían del camino. Pero va más allá, al proponer que los agentes de la IA sean "legalmente responsables" "en caso de accidente o delito".
S.Gregor--AMWN