A OpenAI Lança Novo Modelo de IA de “Raciocínio”, o1
A OpenAI anunciou hoje seu mais recente modelo de IA, o o1, o primeiro de uma nova família de modelos de “raciocínio” projetados para lidar com problemas complexos de maneira mais rápida e precisa do que os modelos anteriores.
Junto com o o1, a empresa também está lançando uma versão menor e mais acessível chamada o1-mini. Este lançamento está sendo descrito como uma “prévia”, sinalizando que a tecnologia ainda está em seus estágios iniciais.
o1, anteriormente conhecido pelo codinome “Strawberry”, é o primeiro de uma série de modelos de “raciocínio” que a OpenAI planeja lançar, conforme observado pelo TechCrunch.
Jerry Tworek, líder de pesquisa da OpenAI, disse ao The Verge que o treinamento por trás do o1 difere significativamente dos modelos anteriores, embora a empresa tenha sido pouco clara sobre os detalhes específicos.
Ao contrário de seus predecessores, que foram projetados para imitar padrões de dados de treinamento, o o1 usa aprendizado por reforço, um método que ensina o sistema a resolver problemas por meio de recompensas e penalidades.
Uma das características mais impressionantes do o1 é sua capacidade de resolver problemas de várias etapas e escrever códigos com um grau de precisão superior em comparação aos modelos anteriores.
Por exemplo, em um exame de qualificação para a Olimpíada Internacional de Matemática, o1 superou o modelo GPT-4o anterior da OpenAI, resolvendo 83% dos problemas em comparação com os 13% do GPT-4o.
Este salto no desempenho é atribuído ao novo processo de treinamento do o1, que incorpora o que a OpenAI chama de mecanismo de “cadeia de pensamento”, permitindo que o modelo decomponha e resolva problemas passo a passo.
Tworek observa que, embora o modelo tenha reduzido sua tendência a “alucinar”, ou fornecer informações imprecisas, o problema não foi totalmente resolvido, conforme relatado por The Verge.
Além de sua habilidade matemática, o1 se classificou no percentil 89 em competições de programação competitiva, demonstrando seu potencial como uma ferramenta para desenvolvedores e pesquisadores.
De acordo com o The Verge, o que se destacou foi o quão intencionalmente o o1 pareceu imitar o pensamento humano. Frases como “Estou curiosa”, “Estou pensando” e “Deixe-me ver” deram a ilusão de um processo de pensamento, embora o modelo não esteja realmente pensando. Então, por que fazer parecer que está?
O The Verge relata que Tworek explica que essa interface tem como objetivo demonstrar como o modelo leva mais tempo para processar e explorar problemas em maior profundidade.
Apesar desses avanços, a OpenAI reconhece que o o1 ainda tem limitações. Embora seja excelente na resolução de problemas complexos, ele é menos hábil em lidar com conhecimentos factuais sobre o mundo. Além disso, falta-lhe algumas das características que tornam o GPT-4o altamente versátil, como a capacidade de navegar na web ou processar arquivos e imagens.
Além disso, as novas capacidades do o1 têm um custo. O modelo é significativamente mais caro para usar do que o GPT-4o. Na API do OpenAI, o1-preview custa $15 por 1 milhão de tokens de entrada e $60 por 1 milhão de tokens de saída, o que é três a quatro vezes mais alto do que o custo do GPT-4o.
Embora a tecnologia ainda esteja em seus estágios iniciais, o lançamento do o1 destaca os contínuos avanços na capacidade da IA de lidar com tarefas complexas, oferecendo benefícios potenciais em vários campos que exigem capacidades avançadas de resolução de problemas.
Deixe um comentário
Cancelar