
-
Soldados retidos em zona guerrilheira são libertados na Colômbia
-
Brasil estuda responder a Trump com tarifas recíprocas
-
Vini Jr e Rodrygo: duas questões que Xabi Alonso precisa solucionar no Real Madrid
-
Ataque russo deixa 23 mortos em Kiev e ameaça esforços de paz
-
'Não há como entrarem na Venezuela', afirma Maduro frente a 'ameaças' dos EUA
-
Lyon-Olympique de Marselha é destaque da 3ª rodada da Ligue 1
-
Jovem que lançou sanduíche em policial em Washington é acusado de infração
-
Ataque russo deixa 22 mortos em Kiev e ameaça esforços de paz
-
EUA aprova venda de mísseis para a Ucrânia por US$ 825 milhões
-
Escultura de sapos da civilização mais antiga da América é encontrada no Peru
-
Besiktas anuncia demissão do técnico norueguês Solskjaer
-
Venus Williams e Leylah Fernández vencem na estreia nas duplas do US Open
-
Atirador de Minneapolis estava "obcecado com a ideia de matar crianças", segundo autoridades
-
Cientistas descobrem 'estranho' dinossauro coberto por armadura de espinhos
-
Sinner vence Popyrin e avança à terceira rodada do US Open
-
Milei culpa 'grupelho violento' por pedradas e nega corrupção
-
Kai Havertz, do Arsenal, passa por cirurgia no joelho
-
Ataque russo deixa 21 mortos em Kiev e ameaça esforços de paz
-
F1 retorna no GP dos Países Baixos com aguardado duelo entre McLarens
-
Pequenos pacotes no limbo antes de entrada em vigor de tarifas nos EUA
-
Robert Kennedy Jr. critica agência de saúde dos EUA após demitir sua diretora
-
Jessica Fox, campeã olímpica de canoagem, se recupera após remoção de tumor
-
Unesco alerta para escassez mundial de professores
-
Chefe da ONU lamenta 'catálogo de horrores sem fim' em Gaza, onde Israel amplia ofensiva
-
Messi, Mastantuono e duas novidades na lista de convocados da Argentina
-
Goleiro Arnau Tenas troca PSG pelo Villarreal
-
Plataforma Kick afirma que França 'se aproveita' da morte de usuário em live
-
Meio-campista dominicano Pablo Rosario deixa Nice e assina com Porto
-
Medvedev é multado em US$ 42.500 por conduta antidesportiva no US Open
-
ONU aprova retirada das forças de paz do Líbano em 2027
-
Força-tarefa mira esquema de lavagem de ativos do crime no setor de combustíveis
-
Caminho difícil para PSG e Real Madrid na Liga dos Campeões, Barça tem mais sorte
-
Swiatek perde um set mas se classifica para 3ª rodada do US Open
-
Bia Haddad vence e avança à 3ª rodada do US Open
-
Lisa Cook, governadora do Fed, processa Trump por tentar demiti-la
-
Extrema direita e esquerda radical rejeitam acordo para salvar primeiro-ministro da França
-
Megaoperação contra lavagem de dinheiro do crime organizado no setor de combustíveis
-
Sheinbaum classifica como 'lamentável' briga entre senadores no México
-
França, Reino Unido e Alemanha ativam mecanismo para reimpor sanções da ONU ao Irã
-
Ataque russo em larga escala contra Kiev deixa 19 mortos
-
Por que os países aceitam receber os deportados dos EUA?
-
Governadora do Fed, Lisa Cook, processa Trump por tentar demiti-la
-
Vítima do tarifaço de Trump, café brasileiro quer minimizar prejuízo
-
Cartel de los Soles: existe um suposto grupo narcotraficante de Maduro?
-
Três pontos do escândalo de corrupção que atinge irmã de Milei na Argentina
-
Ataque russo em larga escala contra Kiev deixa 15 mortos
-
Festival de Veneza recebe George Clooney e Emma Stone
-
Ataque russo em larga escala contra Kiev deixa 14 mortos
-
China fortalecerá alianças não ocidentais com reunião e desfile militar
-
Trump quer limitar período de permanência de estudantes e jornalistas

IA aprende a mentir, manipular e ameaçar seus criadores
Os últimos modelos de inteligência artificial (IA) generativa não se conformam mais em cumprir ordens. Começam a mentir, manipular e ameaçar para alcançar seus objetivos, diante dos olhares preocupados dos pesquisadores.
Ameaçado em ser desconectado, Claude 4, recém-criado pela Anthropic, chantageou um engenheiro e ameaçou revelar uma relação extraconjugal.
Por sua vez, o o1, da OpenAI, tentou se baixar em servidores externos e quando flagrado, negou.
Não é preciso se aprofundar na literatura ou no cinema: a IA que emula o comportamento humano já é uma realidade.
Para Simon Goldstein, professor da Universidade de Hong Kong, a razão para estas reações é o surgimento recente dos chamados modelos de "raciocínio", capazes de trabalhar por etapas em vez de produzir uma resposta instantânea.
O o1, versão inicial deste tipo da OpenAI, lançada em dezembro, "foi o primeiro que se comportou desta maneira", explica Marius Hobbhahn, encarregado da Apollo Research, que põe à prova grandes programas de IA generativa (LLM).
Estes programas também tendem, às vezes, a simular um "alinhamento", ou seja, dão a impressão de que seguem as instruções de um programador, quando na verdade buscam outros objetivos.
Por enquanto, estes traços se manifestam quando os algoritmos são submetidos a cenários extremos por humanos, mas "a questão é se os modelos cada vez mais potentes tenderão a ser honestos ou não", afirma Michael Chen, do organismo de avaliação METR.
"Os usuários também pressionam os modelos o tempo todo", diz Hobbhahn. "O que estamos vendo é um fenômeno real. Não estamos inventando nada".
Muitos internautas falam nas redes sociais de "um modelo que mente para eles ou inventa coisas. E não se tratam de alucinações, mas de duplicidade estratégica", insiste o cofundador da Apollo Research.
Embora Anthropic e OpenAI recorram a empresas externas, como a Apollo, para estudar seus programas, "uma maior transparência e um acesso maior" da comunidade científica "permitiriam investigar melhor para compreender e prevenir a farsa", sugere Chen, do METR.
Outro obstáculo: a comunidade acadêmica e as organizações sem fins lucrativos "dispõem de infinitamente menos recursos informáticos que os atores da IA", o que torna "impossível" examinar grandes modelos, assinala Mantas Mazeika, do Centro para a Segurança da Inteligência Artificial (CAIS).
As regulamentações atuais não estão desenhadas para enfrentar estes novos problemas.
Na União Europeia, a legislação se centra principalmente em como os humanos usam os modelos de IA, não em prevenir que os modelos se comportem mal.
Nos Estados Unidos, o governo de Donald Trump não quer nem ouvir falar em regulamentação, e o Congresso americano poderia, inclusive, proibir em breve que os estados regulem a IA.
- A IA no banco dos réus? -
"Por enquanto há muito pouca conscientização", diz Simon Goldstein, que, no entanto, avalia que o tema passará ao primeiro plano nos próximos meses com a revolução dos agentes de IA, interfaces capazes de realizar sozinhas uma multiplicidade de tarefas.
Os engenheiros estão em uma corrida atrás da IA e suas aberrações, com resultado duvidoso, em um contexto de forte concorrência.
A Anthropic pretende ser mais virtuosa que suas concorrentes, "mas está tentando idealizar um novo modelo para superar a OpenAI", segundo Goldstein. O ritmo dá pouco tempo para comprovações e correções.
"Como estão as coisas, as capacidades [da IA] estão se desenvolvendo mais rápido que a compreensão e a segurança", admite Hobbhahn, "mas ainda estamos em condições de nos atualizarmos".
Alguns apontam na direção da interpretabilidade, ciência que consiste em decifrar, do lado de dentro, como funciona um modelo de IA generativa, embora muitos, como o diretor do Centro para a Segurança da IA (CAIS), Dan Hendrycks, se mostrem céticos.
As trapaças da IA "poderiam obstaculizar a adoção caso se multipliquem, o que supõe um forte incentivo para que as empresas [do setor] resolvam" este problema, afirma Mazeika.
Goldstein, por sua vez, menciona o recurso aos tribunais para enquadrar a IA, dirigindo-se às empresas caso se desviem do caminho. Mas ele vai além, ao propor que os agentes da IA sejam "legalmente responsabilizados" em caso "de acidente ou delito".
G.Stevens--AMWN