
-
Milhares bloqueam estradas na segunda noite de protestos na Sérvia
-
Comunista Jeannette Jara será candidata presidencial da coalizão governista no Chile
-
Reconstruído, City enfrenta o invicto Al Hilal nas oitavas da Copa de Clubes
-
Sob ameaça de prisão, Bolsonaro se defende perante apoiadores em São Paulo
-
Bayern vence Flamengo (4-2) e vai enfrentar PSG nas quartas da Copa de Clubes
-
Onda de calor se intensifica no sul da Europa, onde surgem primeiros incêndios
-
Fluminense e Inter de Milão fazem duelo entre gigantes com artilheiros sul-americanos
-
Governo britânico condena declarações de dupla de rap contra Israel em Glastonbury
-
Netanyahu vê 'oportunidades' de libertar reféns em Gaza, onde ataques de Israel deixam 34 mortos
-
Presidente da Suprema Corte dos EUA alerta para retórica contra juízes
-
Swiatek chega a Wimbledon com "confiança" após sua final em Bad Homburg
-
João Fonseca conta com apoio da torcida brasileira em sua estreia em Wimbledon
-
Milhares de +bolsonaristas pedem 'justiça' em manifestação em São Paulo
-
GP da Áustria no Red Bull Ring continuará na F1 até 2041
-
PSG goleia Inter Miami (4-0) e avança às quartas de final da Copa de Clubes
-
Guerra Irã-Israel abre 'nova via' para o Oriente Médio, diz enviado dos EUA
-
Fumantes manifestam incômodo com proibição do cigarro nas praias da França
-
Zelensky assina decreto para tirar Ucrânia de tratado contra uso de minas antipessoais
-
LeBron James seguirá no Lakers para sua 23ª temporada na NBA
-
Top 10 do ranking da ATP não tem mudanças antes de Wimbledon; João Fonseca é 54º
-
Repressão se intensifica em Hong Kong, cinco anos após lei de segurança nacional
-
Esquerda governista realiza primárias para as eleições presidenciais no Chile
-
'Temos um comprador para o TikTok', anuncia Trump
-
Defesa Civil de Gaza reporta mais de 20 mortos em ações militares israelenses
-
Onda de calor continua no sul da Europa, onde autoridades pedem que população se proteja
-
Investigadores avaliam todas as pistas, inclusive a sabotagem, em acidente da Air India
-
IA aprende a mentir, manipular e ameaçar seus criadores
-
Lando Norris (McLaren) vence GP da Áustria de F1; Bortoleto é 8º
-
Irã tem 'sérias dúvidas' de que Israel vá respeitar o cessar-fogo
-
Tribunal israelense adia audiências de Netanyahu em julgamento por corrupção
-
Bolsonaro convoca apoiadores para manifestação 'por justiça' na Avenida Paulista
-
Novos bombardeios russos deixam vários civis feridos na Ucrânia
-
Senado americano inicia debate sobre projeto orçamentário de Trump
-
Chelsea vence Benfica (4-1) na prorrogação e vai enfrentar Palmeiras nas quartas da Copa de Clubes
-
Messi reencontra seu ex-time PSG nas oitavas de final da Copa de Clubes
-
Flamengo encara Bayern de Munique por vaga nas quartas de final da Copa de Clubes
-
John Textor faz mea culpa e diz que vai se afastar do Lyon
-
G7 quer isentar multinacionais dos EUA de imposto mínimo global
-
Onda de calor se espalha pelo sul da Europa, com temperaturas de 46º C na Espanha
-
Defesa Civil de Gaza registra 37 mortos em vários ataques israelenses
-
'Sem espaço para Bezos', clama protesto em Veneza contra casamento do fundador da Amazon
-
Rappers Kneecap desafiam críticas e defendem causa palestina em Glastonbury
-
Seul tem grande desfile por ocasião da última temporada de 'Round 6'
-
Corpo de alpinista japonesa morta no pico mais alto do Peru é recuperado
-
Palmeiras vence Botafogo (1-0) na prorrogação e vai às quartas da Copa de Clubes
-
Marcha do Orgulho em Budapeste tem participação recorde, apesar da proibição de Orban
-
EUA sanciona o Sudão pelo suposto uso de armas químicas
-
Hermès propõe uma coleção de verão para o homem urbano
-
Fritz conquista torneio de Eastbourne pela 4ª vez em sua carreira
-
Marcha do Orgulho em Paris denuncia 'a internacional reacionária'

IA aprende a mentir, manipular e ameaçar seus criadores
Os últimos modelos de inteligência artificial (IA) generativa não se conformam mais em cumprir ordens. Começam a mentir, manipular e ameaçar para alcançar seus objetivos, diante dos olhares preocupados dos pesquisadores.
Ameaçado em ser desconectado, Claude 4, recém-criado pela Anthropic, chantageou um engenheiro e ameaçou revelar uma relação extraconjugal.
Por sua vez, o o1, da OpenAI, tentou se baixar em servidores externos e quando flagrado, negou.
Não é preciso se aprofundar na literatura ou no cinema: a IA que emula o comportamento humano já é uma realidade.
Para Simon Goldstein, professor da Universidade de Hong Kong, a razão para estas reações é o surgimento recente dos chamados modelos de "raciocínio", capazes de trabalhar por etapas em vez de produzir uma resposta instantânea.
O o1, versão inicial deste tipo da OpenAI, lançada em dezembro, "foi o primeiro que se comportou desta maneira", explica Marius Hobbhahn, encarregado da Apollo Research, que põe à prova grandes programas de IA generativa (LLM).
Estes programas também tendem, às vezes, a simular um "alinhamento", ou seja, dão a impressão de que seguem as instruções de um programador, quando na verdade buscam outros objetivos.
Por enquanto, estes traços se manifestam quando os algoritmos são submetidos a cenários extremos por humanos, mas "a questão é se os modelos cada vez mais potentes tenderão a ser honestos ou não", afirma Michael Chen, do organismo de avaliação METR.
"Os usuários também pressionam os modelos o tempo todo", diz Hobbhahn. "O que estamos vendo é um fenômeno real. Não estamos inventando nada".
Muitos internautas falam nas redes sociais de "um modelo que mente para eles ou inventa coisas. E não se tratam de alucinações, mas de duplicidade estratégica", insiste o cofundador da Apollo Research.
Embora Anthropic e OpenAI recorram a empresas externas, como a Apollo, para estudar seus programas, "uma maior transparência e um acesso maior" da comunidade científica "permitiriam investigar melhor para compreender e prevenir a farsa", sugere Chen, do METR.
Outro obstáculo: a comunidade acadêmica e as organizações sem fins lucrativos "dispõem de infinitamente menos recursos informáticos que os atores da IA", o que torna "impossível" examinar grandes modelos, assinala Mantas Mazeika, do Centro para a Segurança da Inteligência Artificial (CAIS).
As regulamentações atuais não estão desenhadas para enfrentar estes novos problemas.
Na União Europeia, a legislação se centra principalmente em como os humanos usam os modelos de IA, não em prevenir que os modelos se comportem mal.
Nos Estados Unidos, o governo de Donald Trump não quer nem ouvir falar em regulamentação, e o Congresso americano poderia, inclusive, proibir em breve que os estados regulem a IA.
- A IA no banco dos réus? -
"Por enquanto há muito pouca conscientização", diz Simon Goldstein, que, no entanto, avalia que o tema passará ao primeiro plano nos próximos meses com a revolução dos agentes de IA, interfaces capazes de realizar sozinhas uma multiplicidade de tarefas.
Os engenheiros estão em uma corrida atrás da IA e suas aberrações, com resultado duvidoso, em um contexto de forte concorrência.
A Anthropic pretende ser mais virtuosa que suas concorrentes, "mas está tentando idealizar um novo modelo para superar a OpenAI", segundo Goldstein. O ritmo dá pouco tempo para comprovações e correções.
"Como estão as coisas, as capacidades [da IA] estão se desenvolvendo mais rápido que a compreensão e a segurança", admite Hobbhahn, "mas ainda estamos em condições de nos atualizarmos".
Alguns apontam na direção da interpretabilidade, ciência que consiste em decifrar, do lado de dentro, como funciona um modelo de IA generativa, embora muitos, como o diretor do Centro para a Segurança da IA (CAIS), Dan Hendrycks, se mostrem céticos.
As trapaças da IA "poderiam obstaculizar a adoção caso se multipliquem, o que supõe um forte incentivo para que as empresas [do setor] resolvam" este problema, afirma Mazeika.
Goldstein, por sua vez, menciona o recurso aos tribunais para enquadrar a IA, dirigindo-se às empresas caso se desviem do caminho. Mas ele vai além, ao propor que os agentes da IA sejam "legalmente responsabilizados" em caso "de acidente ou delito".
G.Stevens--AMWN