IA infinita lançou oficialmente o Lloyd, um assistente de IA inovador que traz análise de vídeo em tempo real para smartphones sem a necessidade de hardware adicional. Disponível agora na iOS App Store, Lloyd aproveita modelos avançados de grandes linguagens (LLMs), como ChatGPT e o próximo Gemini do Google, para fornecer aos usuários insights imediatos sobre o mundo ao seu redor. Desde o lançamento, há apenas algumas semanas, Lloyd acumulou organicamente dezenas de milhares de usuários e parece que seu assistente de vídeo de IA pode representar a próxima evolução da IA generativa.
Quebrando a barreira do vídeo na IA
Um dos desafios significativos no dimensionamento da IA generativa tem sido o custo computacional associado ao processamento de dados de vídeo. Os LLMs tradicionais exigem imenso poder de computação para ingerir e analisar quadros de vídeo, tornando impraticáveis as aplicações em tempo real. EndlessAI tem a missão de “decifrar o código” desenvolvendo algoritmos proprietários e processos patenteados que visam otimizar dados de vídeo para LLMs de forma eficiente.
“Os LLMs requerem um poder computacional muito extenso para compreender os dados visuais. Com um vídeo 1080p rodando 86.400 quadros por hora, a análise de vídeo contínua e em tempo real estava fora de alcance. EndlessAI capacita LLMs existentes, incluindo as famílias ChatGPT, Gemini e Claude, para ingerir e compreender vídeos complexos em tempo real com a máxima eficiência”, disse Roi Ginat, cofundador e CEO da EndlessAI.
Aplicações do mundo real do Lloyd’s
Lloyd se destaca por permitir que os smartphones “vejam” o mundo real, e não apenas imagens estáticas. Os usuários podem interagir com Lloyd de várias maneiras inovadoras:
- Assistência Domiciliar: Deixe um quarto à prova de crianças ou obtenha conselhos sobre decoração de sua sala de estar.
- Correções DIY: Conserte uma pia com vazamento ou uma roda de bicicleta desalinhada sem ajuda profissional.
- Apoio Educacional: folheie as páginas do dever de casa e obtenha ajuda com aulas particulares.
- Conteúdo Criativo: redija postagens no TikTok com base no ambiente ao seu redor ou faça perguntas sobre o que está passando na TV.
- Conveniência diária: encontre itens perdidos, como óculos, em um espaço desordenado ou traduza sinalização, menus e muito mais.
O Lloyd’s também pode ser usado para puro entretenimento – já que os fundadores já estão vendo esses casos de uso. Lloyd pode criar histórias personalizadas para dormir; ao gravar um vídeo panorâmico do quarto de uma criança e especificar um herói ou tema, “Lloyd contará a eles uma história fascinante onde os elementos do quarto ganham vida. Escolha um novo herói, um novo tema ou um novo quarto todas as noites. As crianças querem outra história? Sem problemas; que tal mais dois!
Não é necessário hardware adicional
Ao contrário de outros assistentes visuais de IA que necessitam de compras de hardware, Lloyd opera inteiramente através de smartphones existentes. Esta abordagem elimina a necessidade de os consumidores investirem em dispositivos adicionais que podem rapidamente tornar-se obsoletos.
“Alguns de nossos concorrentes parecem estar adotando a abordagem oposta de construir seus próprios smartphones ou outros dispositivos inteligentes para obter melhores recursos de IA. Essa abordagem não faz mais sentido: por que alguém iria querer comprar um dispositivo separado para obter o que deveriam ser melhores recursos de IA que Lloyd já superou? disse Tomás Pompidoucofundador e presidente executivo da EndlessAI. “Em vez de exigir que os usuários comprem novos telefones ou outro hardware e fiquem limitados às suas modestas capacidades de IA, Lloyd aproveita smartphones conectados à nuvem para fornecer uma experiência muito superior.”
Privacidade e segurança de dados
EndlessAI enfatiza medidas robustas de privacidade no processamento de entradas de vídeo e áudio ao vivo. A empresa emprega protocolos de login seguros, criptografia de dados em trânsito e em repouso e controles de acesso rígidos. As políticas de retenção de dados garantem que os dados dos utilizadores não sejam retidos para além do tempo necessário para cumprir a finalidade pretendida.
“A EndlessAI está comprometida em cumprir todas as leis e regulamentos aplicáveis relacionados à proteção e privacidade de dados”, acrescentou Ginat. “Extensas proteções no que diz respeito à adequação do conteúdo também são fornecidas pelas próprias proteções das operadoras de LLM; OpenAI, Google, Meta, Anthropic, etc., todos possuem processos e treinamento em vigor para evitar conteúdo impróprio e que viola a privacidade.”
Uma plataforma em evolução
À medida que os LLMs continuam a avançar, o Lloyd é projetado para melhorar junto com eles. O assistente funciona over-the-top (OTT), otimizando os dados de entrada ingeridos pelos LLMs. Isso significa que à medida que modelos como ChatGPT, Gemini e outros evoluem, as capacidades do Lloyd’s serão automaticamente aprimoradas.
“Somos um multiplicador de força para ChatGPT, Gemini, Claude, Llama, etc. e estamos preparados para expandir significativamente suas oportunidades de mercado e torná-los imediatamente viáveis em escala para casos de uso de análise de vídeo. Como resultado, à medida que os LLMs melhoram, Lloyd melhora. É simples assim”, explicou Pompidou.
Desenvolvimentos futuros e oportunidades B2B
EndlessAI planeja apresentar novos recursos ao Lloyd, incluindo “Poderes” especializados, como um modo “Guia Turístico” que usa geolocalização precisa para informações contextuais e um “Modo de Ação” para conselhos sobre esportes e condicionamento físico. A empresa também está se preparando para lançar uma API para empresas, permitindo que as empresas incorporem análise de vídeo em tempo real em seus processos em grande escala.
“A integração de vídeo em escala nessas soluções abre novas oportunidades muito amplas, mas enfrenta grandes desafios de precisão, velocidade e custo”, disse Ginat. “Isso permitirá que empresas, empresas, ampliadores de IA e desenvolvedores construam e operem soluções de IA generativa altamente escaláveis, adaptadas às suas necessidades exclusivas.”
Por trás da EndlessAI
Fundada há mais de uma década, a EndlessAI está na vanguarda da análise de vídeo e da tecnologia de comunicação. A equipe de liderança reúne experiência em desenvolvimento de software, capital de risco, marketing e especialização em IA:
- Roi Ginatcofundador e CEO: 28 anos de experiência em desenvolvimento de software. Construímos e vendemos três start-ups de tecnologia anteriores: Giant Steps, MyFrame, Inc.
- Tomás Pompidoucofundador e presidente executivo: 18 anos em capital de risco, incluindo sócio e cofundador da Marker LLC, sócio de risco e membro do comitê de investimentos da NightDragon e Team8 e vice-presidente da Crescent Point. 14 anos em banco de investimento, inclusive nos grupos de tecnologia Lazard e Wasserstein Perella. Vice-presidente da Academia de Ciências de Nova York.
- Matt Frischercofundador e CMO: 25 anos de experiência em marketing e publicidade, incluindo posições de liderança na ZenithOptimedia, WWE e Branchout.
- Liron Hertzlíder da equipe de desenvolvimento: 25 anos de experiência em desenvolvimento de tecnologia.
- Doron Adlerlíder da equipe de IA: 20 anos de experiência em desenvolvimento de tecnologia, incluindo funções na AT&T e Flixwagon, e especialização em IA generativa desde 2019. Co-inventor das ferramentas pioneiras de IA de transformação facial Toonify.
Uma nova era para assistentes de IA
O lançamento do Lloyd’s representa um passo significativo para tornar as capacidades avançadas de IA acessíveis ao público em geral, sem a barreira dos custos adicionais de hardware. Ao aproveitar o poder dos smartphones existentes e dos LLMs de última geração, a EndlessAI visa redefinir a forma como interagimos com os mundos digital e físico.
“Pergunte-se ‘e se a IA pudesse ver o mundo real como as pessoas veem?’ e então pergunte a si mesmo ‘por que não acontece?’ A resposta é “pode, mas é demasiado caro para fazer sentido”. Rompemos a barreira dos custos e agora permitimos que os LLMs ‘vejam’ o mundo real como ele é: um mundo de vídeo em tempo real”, ponderou Pompidou.
A redação e a equipe editorial da VentureBeat não estiveram envolvidas na criação deste conteúdo.