Image by Matheus Bertelli, from Pexels

A IA da DeepSeek Aprende a Pensar por si Própria

Tempo de leitura: 2 minuto

Última atualização: Apr 8, 2025

Escrito por Kiara Fabbri Jornalista multimídia
Traduzido por Equipe de localização e tradução Serviços de localização e tradução

A startup chinesa DeepSeek, em parceria com a Universidade Tsinghua, afirma ter desenvolvido uma maneira mais inteligente de ajudar os modelos de inteligência artificial a pensar melhor e mais rápido, sem a necessidade de grandes computadores ou recursos caros.

Está com pressa? Aqui estão os fatos rápidos:

DeepSeek criou uma IA autoaprimorável usando Ajuste de Crítica Baseado em Princípios Próprios (ACBPP).
ACBPP ensina a IA a avaliar seu próprio trabalho usando regras auto-geradas.
O método aumenta o desempenho sem necessidade de um enorme poder de computação.

O avanço vem de uma nova técnica chamada Ajuste de Crítica Auto-Principiada (SPCT, na sigla em inglês). SPCT é diferente de simplesmente tornar os modelos de IA maiores para melhorar o desempenho – SPCT não requer muita energia e poder computacional para ensinar a IA a julgar seu próprio trabalho usando um conjunto de regras criadas por ela mesma.

A maneira como funciona é através de um “juiz” embutido que verifica se a resposta da IA adere tanto às suas regras internas de raciocínio, quanto parece adequada para a produção humana. Quando a IA fornece uma resposta sólida, recebe feedback positivo, o que ajuda a melhorar sua capacidade de responder a perguntas semelhantes em situações futuras.

DeepSeek implementa este método como parte de seu sistema DeepSeek-GRM, que significa Modelagem de Recompensa Generativa. O GRM opera de maneira diferente dos métodos tradicionais porque realiza verificações paralelas para aprimorar tanto a precisão quanto a consistência.

“Propomos o ajuste de crítica auto-principiada (Self-Principled Critique Tuning – SPCT) para fomentar comportamentos de geração de recompensa escaláveis”, escreveram os pesquisadores em seu artigo. “O SPCT permite que [o modelo] adapte princípios e críticas de forma adaptativa com base na consulta de entrada e nas respostas, levando a melhores recompensas de resultado”.

Com este sistema, a DeepSeek afirma que sua IA agora pode superar concorrentes como o Gemini do Google, o Llama do Meta e o GPT-4o da OpenAI, especialmente quando se trata de tarefas complexas como raciocínio ou tomada de decisão, conforme observado pelo Euronews.

Importante ressaltar, a DeepSeek diz que planeja lançar essas novas ferramentas como software de código aberto, embora nenhuma data de lançamento tenha sido divulgada.

A IA da DeepSeek Aprende a Pensar por si Própria

Estamos muito felizes que tenha gostado do nosso trabalho!

Deixe um comentário