
Image by Matheus Bertelli, from Pexels
A IA da DeepSeek Aprende a Pensar por si Própria
A startup chinesa DeepSeek, em parceria com a Universidade Tsinghua, afirma ter desenvolvido uma maneira mais inteligente de ajudar os modelos de inteligência artificial a pensar melhor e mais rápido, sem a necessidade de grandes computadores ou recursos caros.
Está com pressa? Aqui estão os fatos rápidos:
- DeepSeek criou uma IA autoaprimorável usando Ajuste de Crítica Baseado em Princípios Próprios (ACBPP).
- ACBPP ensina a IA a avaliar seu próprio trabalho usando regras auto-geradas.
- O método aumenta o desempenho sem necessidade de um enorme poder de computação.
O avanço vem de uma nova técnica chamada Ajuste de Crítica Auto-Principiada (SPCT, na sigla em inglês). SPCT é diferente de simplesmente tornar os modelos de IA maiores para melhorar o desempenho – SPCT não requer muita energia e poder computacional para ensinar a IA a julgar seu próprio trabalho usando um conjunto de regras criadas por ela mesma.
A maneira como funciona é através de um “juiz” embutido que verifica se a resposta da IA adere tanto às suas regras internas de raciocínio, quanto parece adequada para a produção humana. Quando a IA fornece uma resposta sólida, recebe feedback positivo, o que ajuda a melhorar sua capacidade de responder a perguntas semelhantes em situações futuras.
DeepSeek implementa este método como parte de seu sistema DeepSeek-GRM, que significa Modelagem de Recompensa Generativa. O GRM opera de maneira diferente dos métodos tradicionais porque realiza verificações paralelas para aprimorar tanto a precisão quanto a consistência.
“Propomos o ajuste de crítica auto-principiada (Self-Principled Critique Tuning – SPCT) para fomentar comportamentos de geração de recompensa escaláveis”, escreveram os pesquisadores em seu artigo. “O SPCT permite que [o modelo] adapte princípios e críticas de forma adaptativa com base na consulta de entrada e nas respostas, levando a melhores recompensas de resultado”.
Com este sistema, a DeepSeek afirma que sua IA agora pode superar concorrentes como o Gemini do Google, o Llama do Meta e o GPT-4o da OpenAI, especialmente quando se trata de tarefas complexas como raciocínio ou tomada de decisão, conforme observado pelo Euronews.
Importante ressaltar, a DeepSeek diz que planeja lançar essas novas ferramentas como software de código aberto, embora nenhuma data de lançamento tenha sido divulgada.
Deixe um comentário
Cancelar