-
A ressurreição do Palmeiras, um gigante da Libertadores
-
Trump revela banheiro reformado da Casa Branca
-
Tarifas de Trump impactaram menos que o previsto na América Latina, diz presidente do CAF
-
Milei nomeia porta-voz como chefe dos ministros para 'renovar diálogo'
-
Trinidad e Tobago coloca Exército em 'alerta geral' frente a crise EUA-Venezuela
-
Após operação mais letal da história, revolta toma conta das ruas da Vila Cruzeiro
-
Trump se dispõe a financiar assistência alimentar, ameaçada por paralisação orçamentária
-
Casa Branca restringe acesso de jornalistas ao gabinete de imprensa
-
Trump mantém o mundo em suspense com surpreendente ordem de testes nucleares
-
Casa Branca restringe acesso de jornalistas a gabinete de imprensa
-
Após anulação de condenação, ex-presidente colombiano Uribe anuncia que se candidatará ao Senado
-
Furacão se afasta do Caribe após deixar cerca de 50 mortos
-
Chevron defende suas operações na Venezuela
-
Justiça dos EUA ordena manter ajuda alimentar apesar da paralisação do governo
-
Borussia Dortmund vence Augsburg e sobe na tabela do Alemão
-
Morre o ator franco-turco Tchéky Karyo, conhecido por 'O Urso' e 'Nikita'
-
Menos de 60 líderes confirmaram presença na COP30
-
Ordem de Trump de realizar testes nucleares pode acentuar corrida armamentista
-
Sinner avança à semifinal do Masters 1000 de Paris
-
Trump ressuscita fantasma nuclear com mais dúvidas que certezas
-
Café mais caro do mundo, produzido no Panamá, chega a Dubai
-
Oposição denuncia quase 700 mortos em protestos contra o governo na Tanzânia
-
China envia seu astronauta mais jovem ao espaço
-
Justiça britânica absolve autores de protesto em Stonehenge
-
México comemora 'primeiro passo' da Espanha ao reconhecer abusos durante a conquista
-
Fechamento do governo privará milhões de americanos de ajuda alimentar
-
Trump diz que não planeja ataques dos EUA à Venezuela
-
Munique é candidata única a sediar final da Champions de 2028; Londres ou Barcelona em 2029
-
Barcelona voltará ao Camp Nou no dia 7 de novembro em treino aberto ao público
-
'Diddy' Combs é transferido de prisão para cumprir sentença nos EUA
-
Xabi Alonso revela reunião com Vini Jr. após polemica no Clássico: 'tudo resolvido'
-
Candidato de centro reivindica vitória nas legislativas dos Países Baixos
-
Desemprego no Brasil se mantém no mínimo histórico, apesar das tarifas de Trump
-
Museu do Louvre instalará 'dispositivos anti-intrusão' antes do fim do ano
-
Melissa perde força após deixar 50 mortos no Caribe
-
Projeções apontam vitória do partido de centro D66 nas eleições dos Países Baixos
-
Nasa responde a Kim Kardashian: pouso na Lua de 1969 realmente aconteceu
-
Sombra de Trump paira sobre eleições decisivas nos EUA
-
Britânicos celebram fim do 'príncipe Andrew', símbolo de escândalo e vergonha
-
Manizha Bakhtari desafia talibãs como embaixadora do Afeganistão na Áustria
-
Egito inaugura seu grande museu dedicado aos faraós no sábado
-
Inflação na zona do euro desacelerou em outubro: 2,1% na comparação anual
-
ONU denuncia 'execuções extrajudiciais' nos ataques dos EUA a embarcações no Caribe e Pacífico
-
Apec: Xi Jinping ameniza tensões com Canadá e Japão; Boric defende o 'multilateralismo'
-
Trump provoca tensões globais ao ordenar retomada dos testes nucleares
-
Apec: Xi Jinping ameniza tensões com Canadá e Boric defende o 'multilateralismo'
-
Furacão Melissa deixa quase 50 mortos no Haiti e na Jamaica
-
Autoridades prendem 16 suspeitos do assassinato de dois músicos colombianos no México
-
Palmeiras goleia LDU (4-0) e vai enfrentar o Flamengo na final da Libertadores
-
Furacão Melissa deixa ao menos 30 mortos no Haiti e se aproxima de Bermudas
IA aprende a mentir, manipular e ameaçar seus criadores
Os últimos modelos de inteligência artificial (IA) generativa não se conformam mais em cumprir ordens. Começam a mentir, manipular e ameaçar para alcançar seus objetivos, diante dos olhares preocupados dos pesquisadores.
Ameaçado em ser desconectado, Claude 4, recém-criado pela Anthropic, chantageou um engenheiro e ameaçou revelar uma relação extraconjugal.
Por sua vez, o o1, da OpenAI, tentou se baixar em servidores externos e quando flagrado, negou.
Não é preciso se aprofundar na literatura ou no cinema: a IA que emula o comportamento humano já é uma realidade.
Para Simon Goldstein, professor da Universidade de Hong Kong, a razão para estas reações é o surgimento recente dos chamados modelos de "raciocínio", capazes de trabalhar por etapas em vez de produzir uma resposta instantânea.
O o1, versão inicial deste tipo da OpenAI, lançada em dezembro, "foi o primeiro que se comportou desta maneira", explica Marius Hobbhahn, encarregado da Apollo Research, que põe à prova grandes programas de IA generativa (LLM).
Estes programas também tendem, às vezes, a simular um "alinhamento", ou seja, dão a impressão de que seguem as instruções de um programador, quando na verdade buscam outros objetivos.
Por enquanto, estes traços se manifestam quando os algoritmos são submetidos a cenários extremos por humanos, mas "a questão é se os modelos cada vez mais potentes tenderão a ser honestos ou não", afirma Michael Chen, do organismo de avaliação METR.
"Os usuários também pressionam os modelos o tempo todo", diz Hobbhahn. "O que estamos vendo é um fenômeno real. Não estamos inventando nada".
Muitos internautas falam nas redes sociais de "um modelo que mente para eles ou inventa coisas. E não se tratam de alucinações, mas de duplicidade estratégica", insiste o cofundador da Apollo Research.
Embora Anthropic e OpenAI recorram a empresas externas, como a Apollo, para estudar seus programas, "uma maior transparência e um acesso maior" da comunidade científica "permitiriam investigar melhor para compreender e prevenir a farsa", sugere Chen, do METR.
Outro obstáculo: a comunidade acadêmica e as organizações sem fins lucrativos "dispõem de infinitamente menos recursos informáticos que os atores da IA", o que torna "impossível" examinar grandes modelos, assinala Mantas Mazeika, do Centro para a Segurança da Inteligência Artificial (CAIS).
As regulamentações atuais não estão desenhadas para enfrentar estes novos problemas.
Na União Europeia, a legislação se centra principalmente em como os humanos usam os modelos de IA, não em prevenir que os modelos se comportem mal.
Nos Estados Unidos, o governo de Donald Trump não quer nem ouvir falar em regulamentação, e o Congresso americano poderia, inclusive, proibir em breve que os estados regulem a IA.
- A IA no banco dos réus? -
"Por enquanto há muito pouca conscientização", diz Simon Goldstein, que, no entanto, avalia que o tema passará ao primeiro plano nos próximos meses com a revolução dos agentes de IA, interfaces capazes de realizar sozinhas uma multiplicidade de tarefas.
Os engenheiros estão em uma corrida atrás da IA e suas aberrações, com resultado duvidoso, em um contexto de forte concorrência.
A Anthropic pretende ser mais virtuosa que suas concorrentes, "mas está tentando idealizar um novo modelo para superar a OpenAI", segundo Goldstein. O ritmo dá pouco tempo para comprovações e correções.
"Como estão as coisas, as capacidades [da IA] estão se desenvolvendo mais rápido que a compreensão e a segurança", admite Hobbhahn, "mas ainda estamos em condições de nos atualizarmos".
Alguns apontam na direção da interpretabilidade, ciência que consiste em decifrar, do lado de dentro, como funciona um modelo de IA generativa, embora muitos, como o diretor do Centro para a Segurança da IA (CAIS), Dan Hendrycks, se mostrem céticos.
As trapaças da IA "poderiam obstaculizar a adoção caso se multipliquem, o que supõe um forte incentivo para que as empresas [do setor] resolvam" este problema, afirma Mazeika.
Goldstein, por sua vez, menciona o recurso aos tribunais para enquadrar a IA, dirigindo-se às empresas caso se desviem do caminho. Mas ele vai além, ao propor que os agentes da IA sejam "legalmente responsabilizados" em caso "de acidente ou delito".
G.Stevens--AMWN