Esses tipos de modelos são mais eficazes na solução de problemas complexos; portanto, se você tiver um doutorado no nível da matemática que quebra, poderá experimentá -los. Como alternativa, se você teve problemas para obter modelos anteriores para responder às suas instruções mais avançadas, pode querer experimentar esse novo modelo de justificativa. Para tentar o3 para experimentar, basta selecionar “causa” se o seu Comece um novo Viiba no chatgptPara.

Embora existam novas oportunidades para modelos de pensamento, eles têm custo. Openai O1-Lin 20 vezes Mais caro de correr do que seu modelo não justificado equivalente GPT-4O Mini. Segundo a empresa, seu novo modelo custa 63% menos que O1 por marca de entrada, mas US $ 1,10 por milhão de marcas de entrada, ainda é cerca de sete vezes mais caro que o GPT-4O Mini.

Não é por acaso que esse novo modelo ocorre imediatamente após o lançamento da Deepseek, que abalou a IA no mundo há menos de duas semanas. O novo modelo de Deepsek funciona, bem como os melhores modelos Openai, mas a empresa chinesa afirma que o treinamento custa cerca de US $ 6 milhões, ao contrário das estimativas de treinamento do OpenAI GPT-4, em mais de US $ 100 milhões. (Vale a pena notar que muitas pessoas interrogam esta afirmação.)

Além disso, a linha de raciocínio de Deepsek custa US $ 0,55 por milhão de marcas de entrada, que é metade do preço do O3, portanto o OpenAil ainda tem uma maneira de reduzir seus custos. Acredita -se também que os modelos de raciocínio tenham custos de energia muito mais altos do que outros tipos, dado o maior número de cálculos necessários para obter a resposta.

Esta nova onda de modelos de pensamento também oferece novos problemas de segurança. OpenAI usou a técnica nomeada alinhamento Para treinar seus próprios modelos de série, em princípio, deixe -os se referir à política doméstica da OpenAI em todas as etapas para garantir que não ignorem nenhuma regra.

No entanto, a empresa descobriu que, como o modelo O1, bem como o modelo O1, é significativamente melhor do que os modelos não dirigidos de carrinhos e “avaliação de segurança desafiadora”-isso é muito mais difícil de controlar ao controlar o modelo de consideração, levando em consideração suas opções avançadas. O O3 min é o primeiro modelo que resulta em um risco médio de avaliação de autonomia do modelo, porque é melhor do que os modelos anteriores em tarefas específicas de codificação-“maior potencial de auto-aperfeiçoamento e pesquisa de IA acelerando”. De acordo com para abrir. No entanto, o modelo ainda é ruim em pesquisa real. Se fosse melhor, seria avaliado em alto risco e o OpenAI limitaria a liberação do modelo.

Source link