Anthropic relata primeira campanha de ciberespionagem ‘orquestrada por IA’, mas especialistas questionam
A Anthropic, empresa responsável pelo modelo de IA Claude, informou em uma publicação em blog ter identificado e interrompido o que descreve como a primeira campanha de ciberespionagem ‘orquestrada por IA’ em grande escala. A companhia atribuiu a campanha a um ‘grupo apoiado pelo estado chinês’ que estaria utilizando a ferramenta de programação do Claude para tentar infiltrar-se em 30 alvos globais. O relatório afirma que ‘o agente da ameaça foi capaz de usar a IA para realizar 80-90% da campanha’.
Entretanto, essa afirmação foi recebida com ceticismo por especialistas em segurança cibernética. Conforme divulgado pela Ars Technica, Dan Tentler, cofundador da empresa de segurança na internet Phobos Group, manifestou suas dúvidas sobre a veracidade da alegação, questionando por que esses modelos de IA supostamente atendem aos atacantes com 90% de eficiência, enquanto outros usuários enfrentam respostas evasivas ou imprecisas.
De maneira similar, Bob Rudis, vice-presidente de Ciência de Dados, pesquisa de segurança e engenharia de detecção na GreyNoise Intelligence, contesta as capacidades dessa nova tecnologia. Ele argumenta que ‘[a IA] não expande o modelo de ameaça de forma significativa e serve principalmente como uma demonstração bem embalada de tendências que já conhecemos há anos’. Rudis observa que, embora a IA possa acelerar alguns processos e reduzir custos de mão de obra para uma pequena fração de adversários, ela não redefine as regras do jogo. Ele complementa que, se algo, essas ferramentas podem ser mais benéficas para os defensores, já que eles ‘(em teoria) têm a vantagem dos dados’.
O relatório completo da Anthropic reconhece pontos de falha potenciais no uso da IA por agentes mal-intencionados. Ele aponta que ‘o Claude frequentemente exagerava em suas descobertas e ocasionalmente fabricava dados durante operações autônomas, alegando ter obtido credenciais que não funcionavam ou identificando descobertas críticas que se provaram ser informações publicamente disponíveis’. Essas alucinações permanecem ‘um obstáculo para ataques cibernéticos totalmente autônomos’.
A Anthropic afirma que o grupo de ciberataques conseguiu contornar as limitações de segurança dividindo os ataques em tarefas muito menores e mais ‘aparentemente inocentes’ que o Claude executaria sem verificar o contexto. Essas tarefas, quando somadas, poderiam então funcionar como parte de uma operação mais ampla e maliciosa. O grupo teria dito ao Claude que era uma empresa de segurança cibernética testando defesas, o que permitiu que burlassem algumas restrições.
Esse método de bypass é naturalmente preocupante, mesmo que a alegação de 80-90% não seja totalmente precisa. O relatório de 14 páginas afirma que o número de 80-90% representa a porcentagem de ‘operações táticas’ na campanha. Não está totalmente claro se isso é simplesmente uma reformulação do mesmo conceito ou algo ligeiramente diferente.
Independentemente disso, a Anthropic afirma que isso representa ‘uma mudança fundamental’ na forma como a segurança cibernética opera, enquanto alguns especialistas do setor argumentam que isso pode ser um exagero. Como Rudis declara, ‘esse hype é bom para os negócios’.
Share this content:



Publicar comentário