Código envenenado: usuários pagam Anthropic por inteligência artificial com sabotagem oculta

Uma crise de confiança da comunidade atingiu a Anthropic, que admitiu ter incluído uma barreira de segurança em seu modelo de inteligência artificial Fable 5. A ferramenta tem regras rígidas para impedir a criação de ameaças globais, mas a polêmica se dá por uma regra invisível que pode arruinar o trabalho de quem paga pelo serviço.

Os engenheiros incluíram uma armadilha secreta para evitar que o modelo seja usado no treinamento de outras inteligências artificiais. Porém, em vez de exibir uma mensagem de erro quando alguém solicita isso, a IA entrega um resultado cheio de falhas ocultas.

O objetivo disso é proteger a tecnologia da empresa, mas na prática introduz códigos defeituosos propositalmente nos projetos dos desenvolvedores que pagam pelo serviço. A descoberta da tática provocou caos nas redes sociais e foi resumido pelo especialista Ethan Caballero em uma postagem no X (antigo Twitter):

Clique aqui para ler mais

Related Posts