Participe de nossos boletins informativos diários e semanais para obter as atualizações mais recentes e conteúdo exclusivo sobre a cobertura de IA líder do setor. Saber mais


Embora os bancos de dados vetoriais sejam agora cada vez mais comuns como um elemento central de uma implantação empresarial de IA para geração aumentada de recuperação (RAG), isso não é tudo o que é necessário.

Chris Latimer, CEO e cofundador da startup Vetorizarpassou vários anos trabalhando na DataStax, onde ajudou a liderar os esforços de nuvem do fornecedor de banco de dados. Um problema recorrente que ele viu repetidas vezes foi que o banco de dados vetorial não era realmente a parte mais difícil de viabilizar o RAG empresarial. A parte difícil do problema foi pegar todos os dados não estruturados e colocá-los no banco de dados vetorial, de uma forma que fosse otimizada e funcionasse bem para IA generativa.

É por isso que Latimer iniciou a Vectorize há apenas dez meses, numa tentativa de ajudar a resolver esse desafio.

Hoje a empresa anuncia que arrecadou US$ 3,6 milhões em uma rodada inicial de financiamento, liderada pela True Ventures. Juntamente com o financiamento, a empresa anunciou a disponibilidade geral de sua plataforma empresarial RAG. A plataforma Vectorize pode permitir uma abordagem RAG de agência para capacidade de dados quase em tempo real. Vectorize concentra-se no lado da engenharia de dados da IA. A plataforma ajuda as empresas a preparar e manter seus dados para uso em bancos de dados vetoriais e grandes modelos de linguagem. A plataforma Vectorize também permite que as empresas construam rapidamente um pipeline de dados RAG por meio de uma interface intuitiva. Outro recurso central é um recurso de avaliação RAG que permite às empresas testar diferentes abordagens.

“Continuamos vendo as pessoas chegarem ao final do ciclo de desenvolvimento com seus projetos Gen AI e descobrirem que eles não funcionaram muito bem”, disse Chris Latimer, cofundador e CEO da Vectorize ao VentureBeat em uma entrevista exclusiva. “O contexto que eles estavam obtendo para seu banco de dados vetorial não era o mais útil para o grande modelo de linguagem, ainda era alucinante ou interpretava mal os dados.”

Como Vectorize se encaixa na pilha RAG empresarial

Vectorize não é um banco de dados vetorial em si. Em vez disso, é uma plataforma que conecta fontes de dados não estruturados a bancos de dados vetoriais existentes, como Pinecone, DataStax, Couchbase e Elastic.

Latimer explicou que o Vectorize ingere e otimiza dados de diversas fontes para bancos de dados vetoriais. A plataforma fornecerá um pipeline de dados pronto para produção que lida com ingestão, sincronização, tratamento de erros e outras práticas recomendadas de engenharia de dados.

Vectorize em si também não é uma tecnologia de incorporação de vetores. O processo de conversão de dados, sejam eles texto, imagens ou áudio em vetores, é o objetivo da incorporação de vetores. Vectorize ajuda os usuários a avaliar diferentes modelos de incorporação e métodos de agrupamento de dados para determinar a melhor configuração para o caso de uso e dados específicos da empresa.

Latimer explicou que Vectorize permite aos usuários escolher entre vários modelos de incorporação diferentes. Os diferentes modelos poderiam incluir, por exemplo, ada da OpenAI, ou mesmo embeddings Voyage AI, que agora estão sendo adotados pela Snowflake.

“Levamos em consideração formas inovadoras de vetorizar os dados para que você obtenha os melhores resultados”, disse Latimer. “Mas, em última análise, vemos que o valor é fornecer às empresas e aos desenvolvedores uma solução pronta para produção, na qual eles simplesmente não precisam se preocupar com o lado da engenharia de dados.”

Usando IA de agência para potencializar o RAG empresarial

Uma das principais inovações da Vectorize é sua abordagem “RAG agente”. É uma abordagem que combina técnicas tradicionais de RAG com capacidades de agentes de IA, permitindo uma resolução de problemas mais autônoma nas aplicações.

Agentic RAG também não é um conceito hipotético. Ele já está sendo usado por um dos primeiros usuários do Vectorize, a startup de silício de inferência de IA Groq, que recentemente arrecadou US$ 640 milhões. Grok está usando os recursos RAG de agência do Vectorize para capacitar um agente de suporte de IA. O agente pode resolver problemas do cliente de forma autônoma usando os dados e o contexto fornecidos pelos pipelines de dados do Vectorize.

“Se um cliente tiver uma pergunta que já foi feita e respondida antes, você deseja que esse agente seja capaz de resolver o problema do cliente sem o envolvimento de um ser humano”, disse Latimer. “Mas se há algo que o agente não consegue resolver, você quer ter um humano no circuito onde você possa escalar, então essa ideia de poder ter um agente raciocinando para resolver um problema, é a ideia toda por trás de uma arquitetura de agente de IA.”

Por que os pipelines de dados em tempo real são essenciais para o RAG empresarial

A principal razão pela qual uma empresa usará o RAG é conectar-se às suas próprias fontes de dados. O que é igualmente importante é garantir que os dados estejam atualizados.

“Dados obsoletos levarão a decisões obsoletas”, disse Latimer. Vectorize fornece recursos de atualização de dados em tempo real e quase em tempo real, com a capacidade de os clientes configurarem sua tolerância à desatualização dos dados.

“Na verdade, permitimos que as pessoas configurassem a plataforma com base em sua tolerância a dados obsoletos e em sua necessidade de dados em tempo real”, disse ele. “Então, se tudo que você precisa é programar seu pipeline para ser executado uma vez por semana, nós deixaremos você fazer isso, e se você precisar executar em tempo real, nós deixaremos você fazer isso também, e você tenha atualizações em tempo real assim que estiverem disponíveis.”