Junte-se aos nossos boletins informativos diários e semanais para obter as atualizações mais recentes e conteúdo exclusivo sobre a principal cobertura de IA. Mais informações
Lightricksa empresa israelense por trás do aplicativo viral de edição de fotos Facetuneestá lançando um esforço ambicioso para sacudir o cenário da IA generativa. A empresa anunciou o lançamento hoje Vídeo LTX (LTXV)um modelo de inteligência artificial de código aberto capaz de gerar cinco segundos de vídeo de alta qualidade em apenas quatro segundos. Ao disponibilizar gratuitamente seu modelo de vídeo, a Lightricks visa diretamente o crescente domínio de sistemas proprietários de IA de gigantes da tecnologia como OpenAI, Adobee Google.
“Acreditamos que os modelos principais se tornarão uma mercadoria e não é possível construir um negócio real com base nos modelos principais”, disse Zeev Farbman, cofundador e CEO da Lightricks, em entrevista exclusiva ao VentureBeat. “Se as startups querem ter uma chance séria de competir, a tecnologia tem que ser aberta, e você quer ter certeza de que as pessoas nas melhores universidades do mundo possam acessar seu modelo e adicionar capacidades a ele”.
Com processamento em tempo real, escalabilidade para vídeos longos e uma arquitetura compacta que funciona com eficiência em hardware de consumo, a LTXV está preparada para levar a tecnologia de vídeo generativo profissional a um público mais amplo – uma abordagem que pode perturbar o status quo da indústria.
Como Lightricks está usando código aberto para enfrentar os gigantes da IA
A decisão da Lightricks de emitir LTXV como código aberto é uma aposta calculada projetada para diferenciar a empresa em um mercado de IA generativa cada vez mais lotado. O modelocom seus dois bilhões de parâmetros, ele foi projetado para funcionar com eficiência em GPUs amplamente disponíveis, como NVIDIA RTX4090mantendo alta fidelidade visual e consistência de movimento.
A mudança ocorre em um momento em que muitos modelos líderes de IA – da OpenAI DALL-E no Google Imagem—são bloqueados por APIs, exigindo que os desenvolvedores paguem pelo acesso. Lightricks, por outro lado, aposta que a abertura incentivará a inovação e a adoção.
Farbman comparou o lançamento do LTXV ao lançamento de seu Meta de código aberto Modelos de linguagem lhamaque rapidamente ganhou força na comunidade de IA e ajudou a Meta a se estabelecer em um espaço dominado pela OpenAI Bate-papoGPT. “O resultado final dos negócios é que se a comunidade o adotar, se as pessoas na academia o adotarem, nós, como sociedade, nos beneficiaremos muito”, disse Farbman.
Diferentemente do Meta, que gerencia a infraestrutura de seus modelos, o Lightricks foca apenas no modelo em si, trabalhando com plataformas como Abraço facial para ser acessível. “Neste momento, não vamos ganhar nenhum dinheiro com este modelo”, enfatizou Farbman. “Algumas pessoas implantam-no localmente em seu hardware, como um PC para jogos. É tudo uma questão de adoção.”
Vídeo de IA ultrarrápido: quebrando recordes de velocidade em hardware de consumo
Uma característica marcante do LTXV é sua velocidade. O modelo pode gerar cinco segundos de vídeo – 121 quadros em resolução 768×512 – em apenas quatro segundos na NVIDIA. GPU H100. Mesmo em hardware de consumo, como RTX4090O LTXV oferece desempenho quase em tempo real, tornando-o um dos modelos mais rápidos do gênero.
Essa velocidade é alcançada sem reduzir a qualidade. Modelo Transformação de transmissão a arquitetura garante movimento suave e consistência estrutural entre quadros, abordando uma limitação importante dos modelos de geração de vídeo anteriores. Para estúdios menores, criadores independentes e pesquisadores, a capacidade de iterar rapidamente e gerar resultados de alta qualidade em hardware acessível é uma virada de jogo.
“Quando você espera vários minutos por um resultado, é uma experiência terrível para o usuário”, disse Farbman. “Mas depois de obter feedback rapidamente, você pode experimentar e iterar com mais rapidez. Você cria um modelo mental do que o sistema pode fazer e isso desbloqueia a criatividade.”
Lightricks também projetou o LTXV para suportar produções de vídeo mais longas, oferecendo aos criadores mais flexibilidade e controle. Essa escalabilidade, combinada com tempos de processamento rápidos, abre novas possibilidades para setores que vão desde jogos até comércio eletrônico.
Por exemplo, em jogos, o LTXV pode ser usado para aprimorar os gráficos de jogos mais antigos e transformá-los em experiências visualmente impressionantes. No comércio eletrônico, a velocidade e a eficiência do modelo permitiriam que as empresas criassem milhares de variações de anúncios para testes A/B direcionados.
“Imagine escolher um ator – real ou virtual – e ajustar o visual em tempo real para encontrar o melhor criativo para um público específico”, disse Farbman.
Do aplicativo de fotos à IA: o jogo ousado do Lightricks no mercado
Com o LTXV, a Lightricks está se posicionando como um disruptor em uma indústria cada vez mais dominada por um punhado de gigantes da tecnologia. Esta é uma jogada ousada para uma empresa que começou como fabricante de aplicativos móveis e é mais conhecida pelo Facetune, o aplicativo de edição de fotos para consumidores que se tornou um sucesso global.
Desde então, Lightricks expandiu suas ofertas e adquiriu uma plataforma de marketing de influenciadores com sede em Chicago Pagamentos populares e inicialização Estúdio LTXuma plataforma de narrativa baseada em IA voltada para criadores profissionais. Espera-se que a integração do LTXV ao LTX Studio aprimore os recursos da plataforma e permita aos usuários gerar vídeos mais longos e dinâmicos com maior velocidade e precisão.
No entanto, Lightricks enfrenta desafios significativos. Competir com pesos pesados da indústria, como Adobe e Autodeskque têm bolsos mais fundos e uma base de usuários estabelecida, não será fácil. Por exemplo, a Adobe já integrou inteligência artificial generativa em seus próprios Nuvem Criativa Suite, o que lhe confere uma vantagem natural entre os usuários profissionais.
Farbman reconhece os riscos, mas acredita que a inovação de código aberto é o único caminho viável para os pequenos players. “Se você quer ter a chance de lutar como uma startup contra os gigantes, você tem que garantir que a tecnologia seja aberta e aceita pela academia e pela comunidade em geral”, disse ele.
Por que o código aberto poderia vencer a corrida de geração de vídeo de IA
O lançamento do LTXV também destaca a crescente tensão na indústria de IA entre abordagens de código aberto e proprietárias. Embora os modelos fechados ofereçam às empresas opções de controle e monetização mais rígidas, eles correm o risco de alienar desenvolvedores e pesquisadores que não têm acesso a ferramentas de ponta.
“Parte do que está acontecendo no momento é que os modelos de difusão estão se tornando um paradigma alternativo às formas clássicas de fazer as coisas na computação gráfica”, explicou Farbman. “Mas se você realmente deseja criar alternativas, uma API definitivamente não é suficiente. Você tem que dar às pessoas – academia, indústria, entusiastas – modelos para brincar e criar novas ideias incríveis.”
Lightricks planeja lançar LTXV em ambos GitHub e Abraço facialcom uma fase inicial de “visualização da comunidade” para permitir testes e feedback. O modelo será eventualmente lançado sob Licença OpenRAILgarantindo que os derivados permaneçam abertos para uso acadêmico e comercial.
As apostas são altas para os Lightricks. A empresa aposta não só no sucesso do LTXV, mas também na adoção mais ampla de modelos abertos de IA numa indústria cada vez mais dominada por ecossistemas fechados.
“O futuro dos modelos abertos é brilhante”, disse Farbman com confiança.
Ainda não se sabe se esta visão se tornará realidade. Mas ao disponibilizar gratuitamente a sua tecnologia mais avançada, a Lightricks está a enviar uma mensagem clara: na corrida para definir o futuro da IA de vídeo, a abertura e a colaboração podem ser uma grande vantagem competitiva.
Source link