Como marcamos na rodada passada? Nós quatro tendências importantes a serem observadas em 2024 incluíam os chamados chatbots personalizados – aplicativos de assistência interativos alimentados por modelos multimodais de grandes linguagens (verifique: ainda não sabíamos disso, mas estávamos falando sobre o que todo mundo chama agora agentesa coisa mais quente em IA no momento); vídeo generativo (verificar: poucas tecnologias melhoraram tão rapidamente nos últimos 12 mesesonde OpenAI e Google DeepMind lançaram seus principais modelos de geração de vídeo, Sora e Veo, com uma diferença de uma semana em dezembro); e mais bots de uso geral que podem executar uma gama mais ampla de tarefas (verifique: a receita de grandes modelos de linguagem continua a diminuir outras partes da indústria de tecnologiae robótica está no topo da lista).

Também dissemos que a desinformação eleitoral criada pela inteligência artificial está por todo o lado, mas aqui felizmente erramos. Houve muitas coisas para se preocupar neste ano, no entanto as profundas falsificações políticas eram escassas.

Então, o que virá em 2025? Vamos ignorar o óbvio aqui: pode apostar agentes e modelos de linguagem menores e mais eficientes continua a moldar a indústria. Em vez disso, aqui estão cinco opções alternativas de nossa equipe de IA.

1. Playgrounds virtuais generativos

Quando 2023 foi o ano imagens generativas e 2024 foi o ano vídeo generativo– o que acontece a seguir? Se você adivinhou mundos virtuais generativos (também conhecidos como videogames), de todas as maneiras.

Tivemos um vislumbre dessa tecnologia em fevereiro, quando o Google DeepMind revelou um um modelo generativo chamado Genie que poderia pegar uma imagem estática e transformá-la em um jogo de plataforma 2D de rolagem lateral com o qual os jogadores poderiam interagir. Em dezembro, a empresa anunciou Gênio 2um modelo que pode transformar uma imagem de inicialização em um mundo virtual inteiro.

Outras empresas estão construindo tecnologia semelhante. Em outubro, as startups de inteligência artificial Decart e Etched revelaram um hack não oficial do Minecraft que poderia acessar todos os frames do jogo. é criado durante o jogo. E o World Labs, uma startup co-fundada por Fei-Fei Li – o criador do ImageNet, o enorme conjunto de dados fotográficos que lançou o boom do aprendizado profundo – está construindo o que chama de grandes modelos mundiais, ou LWMs.

Uma aplicação óbvia são os videogames. Esses primeiros experimentos têm um tom lúdico e simulações 3D generativas podem ser usadas para explorar novos conceitos de design de jogos, transformando um esboço em um ambiente jogável em tempo real. Isto pode levar a um tipo completamente novo de jogos.

Mas eles também poderiam ser usados ​​para treinar robôs. O World Labs quer desenvolver a chamada inteligência espacial – a capacidade das máquinas de interpretar e interagir com o mundo cotidiano. Mas os investigadores em robótica carecem de bons dados sobre cenários do mundo real para treinar essa tecnologia. Girando e caindo em inúmeros mundos virtuais robôs virtuais aprender por tentativa e erro pode ajudar a compensar isso.

Source link