-
Alcaraz perde para Medvedev nas semis de Indian Wells, sua 1ª derrota do ano
-
Real Madrid vence Elche (4-1) e coloca pressão sobre líder Barça
-
Arsenal vence Everton (1-0) e acelera rumo ao título; City não consegue seguir ritmo
-
Sinner vence Zverev e vai disputar sua 1ª final de Indian Wells
-
Atlético de Madrid vence Getafe (1-0) e reassume 3º lugar no Espanhol
-
Arsenal derrota Everton (1-0) e acelera rumo ao título; Newcastle vence Chelsea
-
Trump diz que outros países 'devem se ocupar' da segurança do Estreito de Ormuz
-
Lens é derrotado na visita ao Lorient (2-1) e perde chance de tomar liderança do PSG
-
Inter de Milão tropeça em casa contra Atalanta (1-1)
-
Perdas humanas na guerra do Oriente Médio
-
Bolsonaro segue estável, mas sua função renal piorou
-
Embaixada dos EUA é atacada e bombardeios a grupo pró-Irã matam três no Iraque
-
Bayern de Munique arranca empate (1-1) contra Leverkusen; Dortmund vence, mas continua distante
-
Trump quer envolvimento internacional para garantir tráfego no Estreito de Ormuz
-
Ministro do Esporte da Rússia defende reintegração de atletas, hino e bandeira nos Jogos Paralímpicos
-
Israel afirma que guerra contra Irã entra em 'fase decisiva'
-
Defesa Civil de Gaza reporta seis mortos em ataques israelenses
-
'Branca de Neve' e 'Guerra dos Mundos' levam Framboesa de Ouro
-
Morre, aos 96 anos, o filósofo alemão Jürgen Habermas
-
Trump pede que outros países enviem forças navais ao Estreito de Ormuz
-
Quem vai levar o Oscar de Melhor Filme? Confira os dez indicados
-
Coreia do Sul acusa Pyongyang de lançar cerca de 10 mísseis balísticos não identificados
-
Ataque à embaixada dos EUA e três mortos em bombardeios contra grupo pró-Irã no Iraque
-
Antonelli se torna, no GP da China, o mais jovem da história a conquistar pole position
-
Brasil e Paraguai impulsionam relações após tensão diplomática
-
Presidente da Venezuela pede fim de sanções dos EUA em reunião com missão colombiana
-
EUA bombardeia principal centro petrolífero do Irã no Golfo
-
Homem que atacou sinagoga nos EUA deu um tiro na cabeça (FBI)
-
Olympique de Marselha vence Auxerre e se consolida em 3º no Francês
-
Cuba confirma 'negociações' com EUA e inicia libertação de presos
-
Bolívia captura um dos narcotraficantes mais procurados do Cone Sul
-
Roma recebe sinal verde para construir novo estádio que pode ser usado na Euro 2032
-
Lula revoga visto de assessor dos EUA que queria visitar Bolsonaro
-
Fornecimento de gás é retomado no Peru após semanas de racionamento
-
Cássio sofre grave lesão no joelho esquerdo e terá que fazer cirurgia
-
Ucrânia inaugura embaixada no Panamá, um parceiro fundamental
-
GPs de F1 do Bahrein e da Arábia Saudita devem ser 'cancelados ou adiados'
-
Em ano eleitoral, Lula revoga visto de assessor dos EUA que queria visitar Bolsonaro
-
Fortes explosões abalam o Irã durante manifestação com autoridades
-
Marset, um dos narcotraficantes mais procurados do Cone Sul, é capturado na Bolívia
-
Ministra das Relações Exteriores da Groenlândia renuncia
-
Martín Anselmi vive momento de pressão máxima no Botafogo
-
Canadá constrói novo quebra-gelo para reforçar presença no Ártico
-
Diretores de elenco finalmente serão reconhecidos no Oscar
-
Lula revoga visto de diplomata dos EUA que queria visitar Bolsonaro
-
Com semana livre para treinar, Manchester United quer voltar a vencer no Inglês
-
Ex-presidente Bolsonaro dá entrada na UTI com broncopneumonia
-
EUA faz forte revisão para baixo do PIB nos últimos meses de 2025
-
Russell lidera dobradinha da Mercedes na classificação sprint do GP da China
-
Petróleo recua levemente, mas se mantém perto dos 100 dólares
IA aprende a mentir, manipular e ameaçar seus criadores
Os últimos modelos de inteligência artificial (IA) generativa não se conformam mais em cumprir ordens. Começam a mentir, manipular e ameaçar para alcançar seus objetivos, diante dos olhares preocupados dos pesquisadores.
Ameaçado em ser desconectado, Claude 4, recém-criado pela Anthropic, chantageou um engenheiro e ameaçou revelar uma relação extraconjugal.
Por sua vez, o o1, da OpenAI, tentou se baixar em servidores externos e quando flagrado, negou.
Não é preciso se aprofundar na literatura ou no cinema: a IA que emula o comportamento humano já é uma realidade.
Para Simon Goldstein, professor da Universidade de Hong Kong, a razão para estas reações é o surgimento recente dos chamados modelos de "raciocínio", capazes de trabalhar por etapas em vez de produzir uma resposta instantânea.
O o1, versão inicial deste tipo da OpenAI, lançada em dezembro, "foi o primeiro que se comportou desta maneira", explica Marius Hobbhahn, encarregado da Apollo Research, que põe à prova grandes programas de IA generativa (LLM).
Estes programas também tendem, às vezes, a simular um "alinhamento", ou seja, dão a impressão de que seguem as instruções de um programador, quando na verdade buscam outros objetivos.
Por enquanto, estes traços se manifestam quando os algoritmos são submetidos a cenários extremos por humanos, mas "a questão é se os modelos cada vez mais potentes tenderão a ser honestos ou não", afirma Michael Chen, do organismo de avaliação METR.
"Os usuários também pressionam os modelos o tempo todo", diz Hobbhahn. "O que estamos vendo é um fenômeno real. Não estamos inventando nada".
Muitos internautas falam nas redes sociais de "um modelo que mente para eles ou inventa coisas. E não se tratam de alucinações, mas de duplicidade estratégica", insiste o cofundador da Apollo Research.
Embora Anthropic e OpenAI recorram a empresas externas, como a Apollo, para estudar seus programas, "uma maior transparência e um acesso maior" da comunidade científica "permitiriam investigar melhor para compreender e prevenir a farsa", sugere Chen, do METR.
Outro obstáculo: a comunidade acadêmica e as organizações sem fins lucrativos "dispõem de infinitamente menos recursos informáticos que os atores da IA", o que torna "impossível" examinar grandes modelos, assinala Mantas Mazeika, do Centro para a Segurança da Inteligência Artificial (CAIS).
As regulamentações atuais não estão desenhadas para enfrentar estes novos problemas.
Na União Europeia, a legislação se centra principalmente em como os humanos usam os modelos de IA, não em prevenir que os modelos se comportem mal.
Nos Estados Unidos, o governo de Donald Trump não quer nem ouvir falar em regulamentação, e o Congresso americano poderia, inclusive, proibir em breve que os estados regulem a IA.
- A IA no banco dos réus? -
"Por enquanto há muito pouca conscientização", diz Simon Goldstein, que, no entanto, avalia que o tema passará ao primeiro plano nos próximos meses com a revolução dos agentes de IA, interfaces capazes de realizar sozinhas uma multiplicidade de tarefas.
Os engenheiros estão em uma corrida atrás da IA e suas aberrações, com resultado duvidoso, em um contexto de forte concorrência.
A Anthropic pretende ser mais virtuosa que suas concorrentes, "mas está tentando idealizar um novo modelo para superar a OpenAI", segundo Goldstein. O ritmo dá pouco tempo para comprovações e correções.
"Como estão as coisas, as capacidades [da IA] estão se desenvolvendo mais rápido que a compreensão e a segurança", admite Hobbhahn, "mas ainda estamos em condições de nos atualizarmos".
Alguns apontam na direção da interpretabilidade, ciência que consiste em decifrar, do lado de dentro, como funciona um modelo de IA generativa, embora muitos, como o diretor do Centro para a Segurança da IA (CAIS), Dan Hendrycks, se mostrem céticos.
As trapaças da IA "poderiam obstaculizar a adoção caso se multipliquem, o que supõe um forte incentivo para que as empresas [do setor] resolvam" este problema, afirma Mazeika.
Goldstein, por sua vez, menciona o recurso aos tribunais para enquadrar a IA, dirigindo-se às empresas caso se desviem do caminho. Mas ele vai além, ao propor que os agentes da IA sejam "legalmente responsabilizados" em caso "de acidente ou delito".
G.Stevens--AMWN