
-
La ola de calor se intensifica en el sur de Europa, donde autoridades instan a protegerse
-
Irán expresa "serias dudas" de que Israel respete el alto al fuego
-
El gobierno británico condena declaraciones de dúo de rap contra Israel durante un festival
-
La Defensa Civil de Gaza reporta más de 20 muertos en operaciones militares israelíes
-
Fumadores molestos porque prohibieron los cigarrillos en las playas de Francia
-
Comienza votación en Chile para elegir al candidato presidencial del oficialismo
-
Nuevo golpe sobre la mesa de Márquez en GP de Países Bajos
-
Irán tiene "serias dudas" de que Israel respete el alto al fuego
-
Zelenski firma un decreto para retirar a Ucrania del tratado contra las minas antipersona
-
La IA aprende a mentir, manipular y amenazar a sus creadores
-
Caos e incertidumbre en fábrica de EEUU por aranceles de Trump
-
Uno de los últimos partidos opositores en Hong Kong anuncia su disolución
-
La ola de calor se prolonga en el sur de Europa, donde autoridades instan a protegerse
-
De Inglaterra-2022 a Suiza-2025: los tres años de la revolución española
-
Montse Tomé, la seleccionadora española perseguida por su pasado
-
Nuevos bombardeos rusos hieren a varios civiles en Ucrania
-
Luchadores de dambe nigerianos conquistan al público con amuletos y talismanes
-
La península ibérica afronta otra jornada de calor con temperaturas que podrían alcanzar 43 ºC
-
La represión se intensifica en Hong Kong, cinco años después de la ley de seguridad nacional
-
Trump "no tolerará" que siga el juicio por corrupción contra Netanyahu
-
El senado de EEUU abre el debate sobre la ley presupuestaria de Trump
-
Miles de personas participan en la Marcha del Orgullo de Budapest pese a la prohibición de Orban
-
Unas 140.000 personas desafían la prohibición de Orban en una Marcha del Orgullo en Budapest
-
Hermès propone un verano en la ciudad, KidSuper un cuento infantil
-
Una ola de calor se extiende por el sur de Europa con temperaturas de 46 ºC en España
-
Una ola de calor se extiende por el sur de Europa con temperaturas sobre los 45 ºC en España
-
La Defensa Civil de Gaza reporta 37 muertos por varios ataques de Israel
-
"No hay espacio para Bezos" en Venecia, clama protesta después de la boda del fundador de Amazon
-
Raducanu dice que ella y Carlos Alcaraz son "sólo amigos"
-
Miles de personas desafían la prohibición de Orban en una Marcha del Orgullo con afluencia récord en Budapest
-
Miles de personas desafían la prohibición de Orban en una Marcha del Orgullo con afluencia récord
-
La Defensa Civil de Gaza reporta 23 muertos por varios ataques de Israel
-
Irán despide a militares y científicos muertos en la guerra con Israel en un funeral de Estado
-
Peligra la Eurocopa para Aitana Bonmatí, ingresada por meningitis vírica
-
Al menos 32 muertos en Pakistán por inundaciones súbitas al inicio del monzón
-
Seis israelíes detenidos en Cisjordania tras atacar a soldados
-
Francia prohíbe fumar en playas y parques
-
Veinticuatro muertos en tres días en inundaciones repentinas en Pakistán
-
El abuelo de la futura jefa del MI6 británico espiaba para los nazis
-
Una ola de calor se extiende por el sur de Europa
-
La Unión Africana saluda el acuerdo RDC-Ruanda, un "paso importante" hacia la paz
-
Dos muertos en un bombardeo ruso en Odesa, en el sur de Ucrania
-
Lausana, la idílica y olímpica casa de España en la Eurocopa
-
Ligamento cruzado: ¿Cómo prevenir la lesión que más amenaza a las futbolistas?
-
La Unión Africana saluda el acuerdo RDC-Ruanda, una etapa hacia la paz
-
España entra en la primera ola de calor del verano, que podría dejar temperaturas superiores a 42 ºC
-
Catar insta a Israel y a Hamás a aprovechar la "oportunidad" para la tregua en Gaza
-
Irán celebra funerales de Estado para los militares y científicos muertos en la guerra con Israel
-
Hungría se prepara para celebrar la Marcha del Orgullo pese a la prohibición del gobierno
-
Irán celebra funerales nacionales por los muertos en la guerra contra Israel

La IA aprende a mentir, manipular y amenazar a sus creadores
Los últimos modelos de inteligencia artificial (IA) generativa ya no se conforman con seguir órdenes. Empiezan a mentir, manipular y amenazar para conseguir sus fines, ante la mirada preocupada de los investigadores.
Amenazado con ser desconectado, Claude 4, el recién nacido de Anthropic, chantajeó a un ingeniero y le amenazó con revelar una relación extramatrimonial.
Por su parte, el o1 de OpenAI intentó descargarse en servidores externos y cuando le pillaron lo negó.
No hace falta ahondar en la literatura o el cine: la IA que juega a ser humana es ya una realidad.
Para Simon Goldstein, profesor de la Universidad de Hong Kong, la razón de estas reacciones es la reciente aparición de los llamados modelos de "razonamiento", capaces de trabajar por etapas en lugar de producir una respuesta instantánea.
o1, la versión inicial de este tipo para OpenAI, lanzada en diciembre, "fue el primer modelo que se comportó de esta manera", explica Marius Hobbhahn, responsable de Apollo Research, que pone a prueba grandes programas de IA generativa (LLM).
Estos programas también tienden a veces a simular "alineamiento", es decir, a dar la impresión de que cumplen las instrucciones de un programador cuando en realidad persiguen otros objetivos.
De momento, estos rasgos se manifiestan cuando los algoritmos son sometidos a escenarios extremos por humanos, pero "la cuestión es si los modelos cada vez más potentes tenderán a ser honestos o no", afirma Michael Chen, del organismo de evaluación METR.
"Los usuarios también presionan todo el tiempo a los modelos", dice Hobbhahn. "Lo que estamos viendo es un fenómeno real. No estamos inventando nada".
Muchos internautas hablan en las redes sociales de "un modelo que les miente o se inventa cosas. Y no se trata de alucinaciones, sino de duplicidad estratégica", insiste el cofundador de Apollo Research.
Aunque Anthropic y OpenAI recurran a empresas externas, como Apollo, para estudiar sus programas, "una mayor transparencia y un mayor acceso" a la comunidad científica "permitirían investigar mejor para comprender y prevenir el engaño", sugiere Chen, de METR.
Otro obstáculo: la comunidad académica y las organizaciones sin fines de lucro "disponen de infinitamente menos recursos informáticos que los actores de la IA", lo que hace "imposible" examinar grandes modelos, señala Mantas Mazeika, del Centro para la Seguridad de la Inteligencia Artificial (CAIS).
Las regulaciones actuales no están diseñadas para estos nuevos problemas.
En la Unión Europea la legislación se centra principalmente en cómo los humanos usan los modelos de IA, no en prevenir que los modelos se comporten mal.
En Estados Unidos, el gobierno de Donald Trump no quiere oír hablar de regulación, y el Congreso podría incluso prohibir pronto que los estados regulen la IA.
- ¿Se sentará la IA en el banquillo? -
"De momento hay muy poca concienciación", dice Simon Goldstein, que, sin embargo, ve cómo el tema pasará a primer plano en los próximos meses con la revolución de los agentes de IA, interfaces capaces de realizar por sí solas multitud de tareas.
Los ingenieros están inmersos en una carrera detrás de la IA y sus aberraciones, con un resultado incierto, en un contexto de competencia feroz.
Anthropic pretende ser más virtuoso que sus competidores, "pero está constantemente tratando de idear un nuevo modelo para superar a OpenAI", según Goldstein, un ritmo que deja poco tiempo para comprobaciones y correcciones.
"Tal y como están las cosas, las capacidades (de IA) se están desarrollando más rápido que la comprensión y la seguridad", admite Hobbhahn, "pero aún estamos en condiciones de ponernos al día".
Algunos apuntan en la dirección de la interpretabilidad, una ciencia que consiste en descifrar, desde dentro, cómo funciona un modelo generativo de IA, aunque muchos, como el director del Centro para la seguridad de la IA (CAIS), Dan Hendrycks, se muestran escépticos.
Los tejemanejes de la IA "podrían obstaculizar la adopción si se multiplican, lo que supone un fuerte incentivo para que las empresas (del sector) resuelvan" este problema, según Mazeika.
Goldstein, por su parte, menciona el recurso a los tribunales para poner a raya a la IA, dirigiéndose a las empresas si se desvían del camino. Pero va más allá, al proponer que los agentes de la IA sean "legalmente responsables" "en caso de accidente o delito".
S.Gregor--AMWN