Na semana passada, Niantic planos anunciados para criar um modelo de IA para navegar no mundo físico usando varreduras coletadas de jogadores de seus jogos para celular, como Pokémon Goe dos usuários de seu Scaniverso aplicativo, relatórios 404 Mídia.

Todos os modelos de IA requerem dados de treinamento. Até agora, as empresas coletaram dados de sites, vídeos do YouTube, livros, fontes de áudio e muito mais, mas esta é talvez a primeira vez que ouvimos falar de dados de treinamento de IA coletados por meio de um aplicativo de jogos para dispositivos móveis.

“Nos últimos cinco anos, a Niantic se concentrou na construção de nosso Sistema de Posicionamento Visual (VPS), que usa uma única imagem de um telefone para determinar sua posição e orientação usando um mapa 3D construído a partir de pessoas escaneando locais interessantes em nossos jogos e no Scaniverse. ” escreveu Niantic em uma postagem no blog da empresa.

A empresa chama sua criação de “Grande Modelo Geoespacial” (LGM), traçando paralelos com grandes modelos de linguagem (LLMs) como o que alimenta o ChatGPT. Enquanto os modelos de linguagem processam texto, o modelo da Niantic processará espaços físicos usando imagens geolocalizadas coletadas por meio de seus aplicativos.

A escala da coleta de dados da Niantic revela a presença considerável da empresa no espaço AR. O modelo baseia-se em mais de 10 milhões de locais escaneados em todo o mundo, com os usuários capturando cerca de 1 milhão de novos escaneamentos semanalmente por meio de Pokémon Go e Scaniverso. Essas varreduras vêm da perspectiva de pedestres, capturando áreas inacessíveis a carros e câmeras de rua.

Verificações em primeira pessoa

A empresa informa que treinou mais de 50 milhões de redes neurais, cada uma representando um local ou ângulo de visão específico. Estas redes comprimem milhares de imagens de mapeamento em representações digitais de espaços físicos. Juntos, eles contêm mais de 150 trilhões de parâmetros – valores ajustáveis ​​que ajudam as redes a reconhecer e compreender locais. Múltiplas redes podem contribuir para mapear um único local, e a Niantic planeja combinar seu conhecimento em um modelo abrangente que possa compreender qualquer local, mesmo de ângulos desconhecidos.

Source link