Pesquisadores Criam Modelo de IA por $50 que Rivaliza com a OpenAI e a DeepSeek

Image by lucabravo, from Freepik

Pesquisadores Criam Modelo de IA por $50 que Rivaliza com a OpenAI e a DeepSeek

Tempo de leitura: 3 minuto

Um grupo de pesquisadores de IA de Stanford e da Universidade de Washington treinou um modelo de raciocínio de IA de alto desempenho por menos de $50 em custos de computação em nuvem, de acordo com um artigo de pesquisa divulgado na última sexta-feira, como foi inicialmente relatado por TechCrunch.

Com pressa? Aqui estão os fatos rápidos!

  • Pesquisadores treinaram um modelo de raciocínio de IA por menos de $50 em custos de computação em nuvem.
  • O modelo, s1, tem desempenho tão bom quanto o o1 da OpenAI e o R1 da DeepSeek.
  • O s1 é de código aberto e está disponível no GitHub com seus dados de treinamento e código.

O modelo, chamado de s1, tem um desempenho equiparado a AIs de raciocínio avançado como o o1 da OpenAI e o R1 do DeepSeek em testes de matemática e programação. Está disponível gratuitamente no GitHub, juntamente com os dados de treinamento e código.

Para desenvolver o s1, os pesquisadores começaram com um modelo de IA pré-existente e o aprimoraram usando um processo chamado destilação. Este método extrai habilidades de raciocínio de uma IA mais avançada ao treinar com suas respostas.

A equipe revelou que o s1 foi destilado do modelo experimental de pensamento rápido Gemini 2.0 do Google.

O grupo de pesquisadores construiu o modelo de IA de código aberto que rivaliza com o o1-preview da OpenAI na resolução de problemas complicados de matemática e lógica. O segredo deles? Um truque simples que dá mais tempo para a IA pensar antes de responder.

O método, chamado “forçamento de orçamento”, funciona fazendo a IA dar passos extras na resolução de problemas em vez de correr para uma resposta. Ao dar a si mesma mais tempo, a IA pode verificar novamente seu trabalho e melhorar a precisão.

A equipe treinou seu modelo, chamado s1-32B, usando apenas 1.000 perguntas de exemplo cuidadosamente escolhidas com explicações passo a passo.

Apesar deste pequeno conjunto de dados, o modelo superou o o1-preview da OpenAI em testes complexos de matemática, como MATH e AIME24, melhorando os resultados em até 27%. Ele até conseguiu aumentar sua própria pontuação em um teste de 50% para 57% apenas pensando mais antes de finalizar as respostas – sem nenhum treinamento extra.

Isso é muito importante porque a maioria das melhorias em IA depende de grandes quantidades de novos dados de treinamento. Em vez disso, essa pesquisa sugere que muitos modelos de IA já possuem fortes habilidades de raciocínio escondidas dentro deles – eles só precisam das técnicas certas para desbloqueá-los.

O estudo também testou diferentes maneiras de prolongar o tempo de pensamento de uma IA. Um método envolvia permitir que a IA refinasse suas respostas passo a passo, enquanto outro permitia gerar várias respostas possíveis de uma vez e escolher a melhor. Uma combinação de ambos, usando um processo de decisão semelhante a uma árvore, funcionou melhor.

Embora esta técnica tenha limites – como o espaço de memória da IA para cálculos – os pesquisadores acreditam que ajustes adicionais poderiam ampliar ainda mais suas habilidades. Eles também sugerem que o aprendizado por reforço, um método em que a IA aprende através de tentativa e erro, poderia tornar o raciocínio durante o teste ainda mais inteligente.

Ao disponibilizar gratuitamente seu modelo e pesquisa, a equipe espera incentivar um desenvolvimento de IA mais aberto e transparente, ajudando outros a construir sistemas de IA mais inteligentes e confiáveis.

Gostou desse artigo? Avalie!
Eu detestei Eu não gostei Achei razoável Muito bom! Eu adorei!

Estamos muito felizes que tenha gostado do nosso trabalho!

Como um leitor importante, você se importaria de nos avaliar no Trustpilot? É rápido e significa muito para nós. Obrigado por ser incrível!

Avalie-nos no Trustpilot
0 Votado por 0 usuários
Título
Comentar
Obrigado por seu feedback
Loader
Please wait 5 minutes before posting another comment.
Comment sent for approval.

Deixe um comentário

Loader
Loader Mostrar mais...