“Este trabalho é um passo significativo no reforço da nossa vantagem informacional à medida que combatemos as ameaças de campanhas sofisticadas de desinformação e dos meios de comunicação sintéticos”, afirma Bustamante. A Hive foi selecionada entre 36 empresas para testar sua tecnologia de detecção e atribuição de falsificações profundas com o DOD. O contrato poderia permitir ao departamento detectar fraudes de IA em grande escala.
Kevin Guo, CEO da Hive AI, diz que a defesa contra falsificações profundas é “existencial”. “Esta é a evolução da guerra cibernética”.
A tecnologia do Hive foi treinada para uma grande quantidade de conteúdo, alguns gerados por IA e outros não. Ele captura sinais e padrões em conteúdo gerado por IA que são invisíveis ao olho humano, mas detectados pelo modelo de IA.
“Acontece que toda imagem gerada por esses geradores tem esse padrão se você souber onde procurá-lo”, diz Guo. A equipe do Hive monitora constantemente novos modelos e atualiza sua tecnologia de acordo.
As ferramentas e metodologias desenvolvidas através desta iniciativa podem ser adaptadas para uma utilização mais ampla, não só para enfrentar desafios específicos da defesa, mas também para proteger as agências civis da desinformação, fraude e engano, afirmou o DOD num comunicado.
A tecnologia do Hive oferece desempenho de última geração na identificação de conteúdo gerado por IA, diz Siwei Lyu, professor de ciência da computação e engenharia da Universidade de Buffalo. Ele não esteve envolvido no trabalho do Hive, mas testou suas ferramentas de detecção.
Ben Zhao, professor da Universidade de Chicago que também é independente apreciado A tecnologia de falsificação profunda da Hive AI concorda, mas ressalta que está longe de ser infalível.
“O Hive é certamente melhor do que a maioria das entidades comerciais e alguns dos métodos de pesquisa que tentamos, mas também mostramos que não é nada difícil de contornar”, diz Zhao. A equipe descobriu que os adversários podem adulterar as imagens de maneiras que contornam a detecção do Hive.