Um grupo de usuários do Discord conseguiu obter acesso não autorizado ao modelo de inteligência artificial Mythos da empresa Anthropic. De acordo com informações do Wired, o acesso foi obtido através de métodos simples de detecção, utilizando dados de uma recente violação da Mercor, uma startup de treinamento de IA que trabalha com desenvolvedores.
O grupo fez uma suposição informada sobre a localização online do modelo, baseado no formato usado para outros modelos da Anthropic. Adicionalmente, o acesso foi facilitado por permissões já possuídas por um dos membros, devido a seu trabalho para uma firma contratante da Anthropic, permitindo o acesso a outros modelos de IA não lançados.
Como aconteceu o acesso não autorizado?
Segundo o Wired, o grupo utilizou dados de uma violação recente na Mercor. Essa informação, aliada a um conhecimento prévio da estrutura dos modelos da Anthropic, permitiu que eles encontrassem a localização digital do Mythos.
Os usuários exploraram dados disponibilizados pela Mercor e aplicaram técnicas simples de dedução para mapear a estrutura utilizada por Anthropic, levando os pesquisadores a acessar o Mythos de maneira não autorizada.
Quais foram as consequências do acesso?
Felizmente, o grupo que acessou o Mythos limitou seu uso à criação de simples websites. Esse uso cuidadoso tem o objetivo de evitar a detecção pela Anthropic. Segundo as informações, eles não usaram o modelo para atividades maliciosas significativas, como hacking em larga escala.
Esses acontecimentos destacam a importância da segurança e controle de acesso em sistemas de inteligência artificial avançados, que são frequentemente alvos de tentativas de violação, devido ao seu potencial de uso.