-
Curaçao espera "complicar a vida" da Alemanha na estreia na Copa do Mundo
-
Jalen Brunson (Knicks) é eleito MVP das Finais da NBA
-
New York Knicks vence Spurs na final e conquista seu 1º título da NBA após 53 anos
-
Escócia sofre mas vence Haiti (1-0) e lidera Grupo C, do Brasil
-
Neuer será titular no gol da Alemanha contra Curaçao, diz técnico Julian Nagelsmann
-
Com estreia do Brasil, Copa do Mundo invade Nova York enlouquecida pelos Knicks
-
"Não se ganha a Copa do Mundo no primeiro jogo", diz Ancelotti
-
Com Memphis, seleção holandesa estreia na Copa contra Japão sem capitão
-
'Não tem muito o que falar, é trabalhar', diz Vini Jr. após empate do Brasil com Marrocos
-
Candidatos presidenciais na Colômbia encerram campanhas com comícios no fim de semana
-
Brasil empata com Marrocos (1-1) em sua estreia na Copa do Mundo de 2026
-
Vitinha destaca 'qualidade' de Portugal, mas descarta favoritismo na Copa
-
Equador pode gerar 'perigo a qualquer momento', alerta técnico da Costa do Marfim
-
Catar arranca empate nos acréscimos com Suíça (1-1) na Copa do Mundo
-
Argentina faz primeiro treino com zagueiro Marcos Senesi
-
Calor extremo põe à prova preparativos da França para Copa do Mundo
-
Uruguai aposta na 'intensidade' para estreia na Copa contra a Arábia Saudita
-
Kane destaca 'excelente preparação' da Inglaterra para estreia na Copa contra a Croácia
-
Presidente da FIA quer carros mais leves e menos caros na F1
-
De Minaur avança à final do ATP 250 de 's-Hertogenbosch; Medvedev cai nas semis
-
Raducanu lutará pelo título em casa contra Vekic na final do torneio de Queen's
-
Shelton e Fritz farão final 100% americana em Stuttgart
-
Astro da NBA James Harden é preso em Houston por porte ilegal de arma
-
Trump afirma que acordo com Irã será assinado no domingo e Ormuz permanecerá aberto
-
Curaçao estreia na Copa do Mundo desafiando dois gigantes: Alemanha e Neuer
-
Roubo de material de treino da Inglaterra em Kansas City está sob investigação oficial
-
Serena Williams disputará as duplas com Karolina Muchova no Aberto de Berlim
-
Remoção do nome de Trump da fachada do Kennedy Center é concluída
-
Reis da Suécia celebram bodas de ouro
-
George Russell faz a pole do GP de Barcelona-Catalunha de F1
-
Luka Modric, o rosto eterno da Croácia
-
Anthropic suspende acesso à sua IA mais poderosa por ordem do governo dos EUA
-
Harry Kane, artilheiro e capitão insubstituível da Inglaterra
-
Governo de Gana protesta contra visto canadense negado a Thomas Partey
-
Paquistão afirma que Irã e EUA estão próximos de acordo de paz
-
Russell lidera treinos livres no GP de Barcelona-Catalunha de F1
-
Brasil entra em campo na Copa do Mundo em meio a dúvidas
-
Acordo de paz EUA-Irã provavelmente será finalizado em 24 horas, diz Paquistão
-
Juiz nega recurso para impedir retirada do nome 'Trump' do Kennedy Center
-
Argentino Martín Anselmi é o novo técnico do Elche
-
Polícia dos EUA investiga roubo de material de treino da Inglaterra
-
Pulisic descarta lesão grave após ser substituído na vitória sobre o Paraguai
-
EUA estreia na Copa do Mundo com goleada (4-1) sobre o Paraguai
-
Chefe da gangue venezuelana Tren de Aragua morre em ataque dos EUA
-
Mboko ficará de fora de Wimbledon, mas espera voltar a jogar duplas com Serena
-
Fifa renomeia estádios da Copa do Mundo para ocultar marcas comerciais de terceiros
-
Pressão sobre chefe de gabinete argentino aumenta após dinheiro não declarado
-
Irã e EUA preveem acordo de paz iminente
-
Cadáver é encontrado em frente ao estádio onde a seleção iraniana treina no México
-
França treina diante de 400 torcedores a quatro dias da estreia na Copa
IA aprende a mentir, manipular e ameaçar seus criadores
Os últimos modelos de inteligência artificial (IA) generativa não se conformam mais em cumprir ordens. Começam a mentir, manipular e ameaçar para alcançar seus objetivos, diante dos olhares preocupados dos pesquisadores.
Ameaçado em ser desconectado, Claude 4, recém-criado pela Anthropic, chantageou um engenheiro e ameaçou revelar uma relação extraconjugal.
Por sua vez, o o1, da OpenAI, tentou se baixar em servidores externos e quando flagrado, negou.
Não é preciso se aprofundar na literatura ou no cinema: a IA que emula o comportamento humano já é uma realidade.
Para Simon Goldstein, professor da Universidade de Hong Kong, a razão para estas reações é o surgimento recente dos chamados modelos de "raciocínio", capazes de trabalhar por etapas em vez de produzir uma resposta instantânea.
O o1, versão inicial deste tipo da OpenAI, lançada em dezembro, "foi o primeiro que se comportou desta maneira", explica Marius Hobbhahn, encarregado da Apollo Research, que põe à prova grandes programas de IA generativa (LLM).
Estes programas também tendem, às vezes, a simular um "alinhamento", ou seja, dão a impressão de que seguem as instruções de um programador, quando na verdade buscam outros objetivos.
Por enquanto, estes traços se manifestam quando os algoritmos são submetidos a cenários extremos por humanos, mas "a questão é se os modelos cada vez mais potentes tenderão a ser honestos ou não", afirma Michael Chen, do organismo de avaliação METR.
"Os usuários também pressionam os modelos o tempo todo", diz Hobbhahn. "O que estamos vendo é um fenômeno real. Não estamos inventando nada".
Muitos internautas falam nas redes sociais de "um modelo que mente para eles ou inventa coisas. E não se tratam de alucinações, mas de duplicidade estratégica", insiste o cofundador da Apollo Research.
Embora Anthropic e OpenAI recorram a empresas externas, como a Apollo, para estudar seus programas, "uma maior transparência e um acesso maior" da comunidade científica "permitiriam investigar melhor para compreender e prevenir a farsa", sugere Chen, do METR.
Outro obstáculo: a comunidade acadêmica e as organizações sem fins lucrativos "dispõem de infinitamente menos recursos informáticos que os atores da IA", o que torna "impossível" examinar grandes modelos, assinala Mantas Mazeika, do Centro para a Segurança da Inteligência Artificial (CAIS).
As regulamentações atuais não estão desenhadas para enfrentar estes novos problemas.
Na União Europeia, a legislação se centra principalmente em como os humanos usam os modelos de IA, não em prevenir que os modelos se comportem mal.
Nos Estados Unidos, o governo de Donald Trump não quer nem ouvir falar em regulamentação, e o Congresso americano poderia, inclusive, proibir em breve que os estados regulem a IA.
- A IA no banco dos réus? -
"Por enquanto há muito pouca conscientização", diz Simon Goldstein, que, no entanto, avalia que o tema passará ao primeiro plano nos próximos meses com a revolução dos agentes de IA, interfaces capazes de realizar sozinhas uma multiplicidade de tarefas.
Os engenheiros estão em uma corrida atrás da IA e suas aberrações, com resultado duvidoso, em um contexto de forte concorrência.
A Anthropic pretende ser mais virtuosa que suas concorrentes, "mas está tentando idealizar um novo modelo para superar a OpenAI", segundo Goldstein. O ritmo dá pouco tempo para comprovações e correções.
"Como estão as coisas, as capacidades [da IA] estão se desenvolvendo mais rápido que a compreensão e a segurança", admite Hobbhahn, "mas ainda estamos em condições de nos atualizarmos".
Alguns apontam na direção da interpretabilidade, ciência que consiste em decifrar, do lado de dentro, como funciona um modelo de IA generativa, embora muitos, como o diretor do Centro para a Segurança da IA (CAIS), Dan Hendrycks, se mostrem céticos.
As trapaças da IA "poderiam obstaculizar a adoção caso se multipliquem, o que supõe um forte incentivo para que as empresas [do setor] resolvam" este problema, afirma Mazeika.
Goldstein, por sua vez, menciona o recurso aos tribunais para enquadrar a IA, dirigindo-se às empresas caso se desviem do caminho. Mas ele vai além, ao propor que os agentes da IA sejam "legalmente responsabilizados" em caso "de acidente ou delito".
G.Stevens--AMWN