-
Prêmio Princesa de Astúrias premia a 'madrinha do punk' Patti Smith
-
Ator Sam Neill, de 'Jurassic Park', diz que superou câncer
-
'É melhor ficarem espertos!', adverte Trump ao Irã diante de impasse nas negociações
-
A destruição de florestas tropicais desacelerou em 2025, mas continua preocupante
-
Justiça suspende direitos de voto da Eagle na SAF do Botafogo
-
Fifa aumenta premiações para a Copa do Mundo de 2026
-
Canal do Panamá descarta especulação com preços por bloqueio de Ormuz
-
Licença de emissora de TV passará por revisão após críticas de Trump a apresentador
-
Enviada de Trump na Ucrânia deixará cargo após um ano
-
Fifa afirma que Infantino desconhecia pedido de escolta policial no Canadá
-
Ex-diretor do FBI é acusado de ameaçar a vida de Donald Trump
-
'Independência': países em Santa Marta pedem fim do uso de combustíveis fósseis
-
PSG vence Bayern (5-4) no jogo de ida da semifinal da Champions
-
Trump terá sua foto impressa nos passaportes americanos
-
Sabalenka é eliminada por Haley Baptiste nas quartas de final do WTA 1000 de Madri
-
Artista francês se tranca em jaula para denunciar domínio das 'big techs'
-
Charles III pede que EUA se mantenha fiel aos aliados ocidentais
-
Ex-diretor do FBI e desafeto de Trump é alvo de nova acusação judicial
-
"Terei minhas chances", diz Jódar, antes do duelo contra Sinner em Madri
-
Jogadores que taparem a boca em discussões na Copa de 2026 poderão ser expulsos
-
Militares mataram quase 7.900 civis entre 1990 e 2016 na Colômbia
-
Blockx vence Francisco Cerúndolo e vai às quartas do Masters 1000 de Madri
-
Atlético de Madrid aposta no 'faz-tudo' Llorente para conquistar vaga na final da Champions
-
Musk e Altman se enfrentam em julgamento sobre a OpenAI
-
'The White Lotus' escala Laura Dern para quarta temporada
-
Luca Zidane sofre fratura na mandíbula a um mês e meio da Copa do Mundo
-
Chefe da junta militar do Mali recebe embaixador da Rússia
-
Jódar vence Kopriva e vai enfrentar Sinner nas quartas do Masters 1000 de Madri
-
John Stones vai deixar o Manchester City após dez anos como 'Citizen'
-
Trump diz ao rei Charles III que EUA 'não tem amigos mais próximos que os britânicos'
-
Banco JPMorgan Chase é o novo patrocinador do COI
-
EUA analisa recente proposta do Irã para reabrir o Estreito de Ormuz
-
Musk e Altman, frente à frente em ação judicial sobre a OpenAI
-
Ruud sofre para vencer Tsitsipas e vai às quartas de final em Madri
-
Londres, em pé de guerra contra a praga do roubo de celulares
-
Bombardeios deixam 6 mortos na Rússia e na Ucrânia; Kiev registra explosões
-
Emirados Árabes Unidos deixarão Opep em maio para proteger 'interesse nacional'
-
Lucro líquido da montadora chinesa BYD cai 55% no 1º trimestre
-
Emirados Árabes Unidos vão deixar Opep a partir de maio
-
Preços das commodities sobem com guerra e outros fatores, diz Banco Mundial
-
Parlamento Europeu pede definição de estupro que inclua a noção de consentimento
-
Museu nas Filipinas resgata história da mortal e lucrativa rota dos galeões espanhóis
-
Jimmy Kimmel rebate críticas por piada sobre Melania Trump
-
Alta do combustível derruba voos de companhias aéreas de baixo custo
-
Batalha judicial entre Elon Musk e OpenAI começa na Califórnia
-
Militão passa por cirurgia e está praticamente fora da Copa do Mundo
-
Tribunal sul-coreano aumenta para 4 anos a pena de prisão contra ex-primeira-dama
-
Parlamento Europeu aprova normas para proteger gatos e cães no bloco
-
Jovem se declara culpado na Áustria de planejar atentado contra show de Taylor Swift
-
Quase 60 países participam de primeiro encontro na Colômbia para superar as energias fósseis
IA aprende a mentir, manipular e ameaçar seus criadores
Os últimos modelos de inteligência artificial (IA) generativa não se conformam mais em cumprir ordens. Começam a mentir, manipular e ameaçar para alcançar seus objetivos, diante dos olhares preocupados dos pesquisadores.
Ameaçado em ser desconectado, Claude 4, recém-criado pela Anthropic, chantageou um engenheiro e ameaçou revelar uma relação extraconjugal.
Por sua vez, o o1, da OpenAI, tentou se baixar em servidores externos e quando flagrado, negou.
Não é preciso se aprofundar na literatura ou no cinema: a IA que emula o comportamento humano já é uma realidade.
Para Simon Goldstein, professor da Universidade de Hong Kong, a razão para estas reações é o surgimento recente dos chamados modelos de "raciocínio", capazes de trabalhar por etapas em vez de produzir uma resposta instantânea.
O o1, versão inicial deste tipo da OpenAI, lançada em dezembro, "foi o primeiro que se comportou desta maneira", explica Marius Hobbhahn, encarregado da Apollo Research, que põe à prova grandes programas de IA generativa (LLM).
Estes programas também tendem, às vezes, a simular um "alinhamento", ou seja, dão a impressão de que seguem as instruções de um programador, quando na verdade buscam outros objetivos.
Por enquanto, estes traços se manifestam quando os algoritmos são submetidos a cenários extremos por humanos, mas "a questão é se os modelos cada vez mais potentes tenderão a ser honestos ou não", afirma Michael Chen, do organismo de avaliação METR.
"Os usuários também pressionam os modelos o tempo todo", diz Hobbhahn. "O que estamos vendo é um fenômeno real. Não estamos inventando nada".
Muitos internautas falam nas redes sociais de "um modelo que mente para eles ou inventa coisas. E não se tratam de alucinações, mas de duplicidade estratégica", insiste o cofundador da Apollo Research.
Embora Anthropic e OpenAI recorram a empresas externas, como a Apollo, para estudar seus programas, "uma maior transparência e um acesso maior" da comunidade científica "permitiriam investigar melhor para compreender e prevenir a farsa", sugere Chen, do METR.
Outro obstáculo: a comunidade acadêmica e as organizações sem fins lucrativos "dispõem de infinitamente menos recursos informáticos que os atores da IA", o que torna "impossível" examinar grandes modelos, assinala Mantas Mazeika, do Centro para a Segurança da Inteligência Artificial (CAIS).
As regulamentações atuais não estão desenhadas para enfrentar estes novos problemas.
Na União Europeia, a legislação se centra principalmente em como os humanos usam os modelos de IA, não em prevenir que os modelos se comportem mal.
Nos Estados Unidos, o governo de Donald Trump não quer nem ouvir falar em regulamentação, e o Congresso americano poderia, inclusive, proibir em breve que os estados regulem a IA.
- A IA no banco dos réus? -
"Por enquanto há muito pouca conscientização", diz Simon Goldstein, que, no entanto, avalia que o tema passará ao primeiro plano nos próximos meses com a revolução dos agentes de IA, interfaces capazes de realizar sozinhas uma multiplicidade de tarefas.
Os engenheiros estão em uma corrida atrás da IA e suas aberrações, com resultado duvidoso, em um contexto de forte concorrência.
A Anthropic pretende ser mais virtuosa que suas concorrentes, "mas está tentando idealizar um novo modelo para superar a OpenAI", segundo Goldstein. O ritmo dá pouco tempo para comprovações e correções.
"Como estão as coisas, as capacidades [da IA] estão se desenvolvendo mais rápido que a compreensão e a segurança", admite Hobbhahn, "mas ainda estamos em condições de nos atualizarmos".
Alguns apontam na direção da interpretabilidade, ciência que consiste em decifrar, do lado de dentro, como funciona um modelo de IA generativa, embora muitos, como o diretor do Centro para a Segurança da IA (CAIS), Dan Hendrycks, se mostrem céticos.
As trapaças da IA "poderiam obstaculizar a adoção caso se multipliquem, o que supõe um forte incentivo para que as empresas [do setor] resolvam" este problema, afirma Mazeika.
Goldstein, por sua vez, menciona o recurso aos tribunais para enquadrar a IA, dirigindo-se às empresas caso se desviem do caminho. Mas ele vai além, ao propor que os agentes da IA sejam "legalmente responsabilizados" em caso "de acidente ou delito".
G.Stevens--AMWN