A IA da DeepSeek Aprende a Pensar por si Própria

Image by Matheus Bertelli, from Pexels

A IA da DeepSeek Aprende a Pensar por si Própria

Tempo de leitura: 2 minuto

A startup chinesa DeepSeek, em parceria com a Universidade Tsinghua, afirma ter desenvolvido uma maneira mais inteligente de ajudar os modelos de inteligência artificial a pensar melhor e mais rápido, sem a necessidade de grandes computadores ou recursos caros.

Está com pressa? Aqui estão os fatos rápidos:

  • DeepSeek criou uma IA autoaprimorável usando Ajuste de Crítica Baseado em Princípios Próprios (ACBPP).
  • ACBPP ensina a IA a avaliar seu próprio trabalho usando regras auto-geradas.
  • O método aumenta o desempenho sem necessidade de um enorme poder de computação.

O avanço vem de uma nova técnica chamada Ajuste de Crítica Auto-Principiada (SPCT, na sigla em inglês). SPCT é diferente de simplesmente tornar os modelos de IA maiores para melhorar o desempenho – SPCT não requer muita energia e poder computacional para ensinar a IA a julgar seu próprio trabalho usando um conjunto de regras criadas por ela mesma.

A maneira como funciona é através de um “juiz” embutido que verifica se a resposta da IA adere tanto às suas regras internas de raciocínio, quanto parece adequada para a produção humana. Quando a IA fornece uma resposta sólida, recebe feedback positivo, o que ajuda a melhorar sua capacidade de responder a perguntas semelhantes em situações futuras.

DeepSeek implementa este método como parte de seu sistema DeepSeek-GRM, que significa Modelagem de Recompensa Generativa. O GRM opera de maneira diferente dos métodos tradicionais porque realiza verificações paralelas para aprimorar tanto a precisão quanto a consistência.

“Propomos o ajuste de crítica auto-principiada (Self-Principled Critique Tuning – SPCT) para fomentar comportamentos de geração de recompensa escaláveis”, escreveram os pesquisadores em seu artigo. “O SPCT permite que [o modelo] adapte princípios e críticas de forma adaptativa com base na consulta de entrada e nas respostas, levando a melhores recompensas de resultado”.

Com este sistema, a DeepSeek afirma que sua IA agora pode superar concorrentes como o Gemini do Google, o Llama do Meta e o GPT-4o da OpenAI, especialmente quando se trata de tarefas complexas como raciocínio ou tomada de decisão, conforme observado pelo Euronews.

Importante ressaltar, a DeepSeek diz que planeja lançar essas novas ferramentas como software de código aberto, embora nenhuma data de lançamento tenha sido divulgada.

Gostou desse artigo? Avalie!
Eu detestei Eu não gostei Achei razoável Muito bom! Eu adorei!

Estamos muito felizes que tenha gostado do nosso trabalho!

Como um leitor importante, você se importaria de nos avaliar no Trustpilot? É rápido e significa muito para nós. Obrigado por ser incrível!

Avalie-nos no Trustpilot
0 Votado por 0 usuários
Título
Comentar
Obrigado por seu feedback
Loader
Please wait 5 minutes before posting another comment.
Comment sent for approval.

Deixe um comentário

Loader
Loader Mostrar mais...