A Microsoft acabou de introduzir Magma, o novo modelo de IA Projetado para ajudar os robôs a ver, entender e agir de maneira mais inteligente. Ao contrário do tradicional Inteligência artificial Modelos, o magma processa diferentes tipos de dados ao mesmo tempo – o esforço da Microsoft chama um grande salto para o “agente AI”. ou sistemas que podem planejar e executar tarefas em nome do usuário.

O modelo que usa uma combinação de visão e processamento da linguagem é treinado em vídeos, imagens, dados robóticos e interação da interface para ser mais versátil do que os modelos anteriores.

Em sua página do GitHub, a equipe de pesquisa da Microsoft descreveu como o Magma pode executar tarefas, por exemplo, como pode manipular robôs e navegar nas interfaces do usuário, como clicar nos botões.

Para desenvolver essa tecnologia, a empresa se uniu a cientistas da Universidade de Maryland, da Universidade de Wisconsin-Madison e da Universidade de Washington.

A partida vem quando os gigantes da tecnologia competem no desenvolvimento de agentes de IA que podem automatizar mais aspectos da vida cotidiana. O Google desenvolveu modelos de idiomas focados na robótica enquanto Ferramenta de operador da operai Ele foi projetado para lidar com tarefas seculares, como reservas, pedindo alimentos e preenchendo formulários usando escrita, clicando e movendo em um navegador especializado.



Source link