DeepSeek Revela o Modelo 3V, o Mais Poderoso AI de Código Aberto Até Agora

Photo by Mimi Thian on Unsplash

DeepSeek Revela o Modelo 3V, o Mais Poderoso AI de Código Aberto Até Agora

Tempo de leitura: 2 minuto

A empresa chinesa de IA, DeepSeek, lançou seu mais recente modelo de código aberto, o DeepSeek-V3, esta semana. A startup afirma que seu novo modelo grande inclui 671B parâmetros e pode ter um desempenho melhor que modelos de ponta como o GPT-4o da OpenAI e o Claude-Sonnet-3.5 da Anthropic.

Com pressa? Aqui estão os fatos rápidos!

  • DeepSeek lançou seu mais recente modelo de IA, o DeepSeek-V3, alegando que ele tem um desempenho superior ao GPT 4o e ao Claude-Sonnet-3.5.
  • A empresa chinesa de IA explicou que o novo modelo inclui 671B de parâmetros e é três vezes mais rápido do que o modelo anterior.
  • DeepSeek-V3 é agora o modelo de IA de código aberto mais poderoso no mercado

Os usuários podem interagir com o modelo através do site oficial, ler o artigo da empresa e acessar o modelo via Hugging Face. DeekSeek disse que este novo modelo é três vezes mais rápido que a versão anterior lançada em novembro e possui capacidades aprimoradas e compatibilidade com API.

“Apresentamos o DeepSeek-V3, um forte modelo de linguagem Mixture-of-Experts (MoE) com um total de 671B parâmetros, dos quais 37B são ativados para cada token”, escreveu a empresa no GitHub. “Avaliações abrangentes revelam que o DeepSeek-V3 supera outros modelos de código aberto e alcança desempenho comparável aos principais modelos de código fechado.”

Muitos usuários, organizações e empresas parabenizaram a DeepSeek por sua conquista. “Parabéns pelo lançamento estelar!” escreveu Hugging Face no X, “Os pontos de verificação do modelo e um relatório detalhado – verdadeiramente, o Natal está aqui!”

Andrej Karpathy—ex-pesquisador da OpenAI e chefe de IA na Tesla—também compartilhou alguns pensamentos. “DeepSeek (empresa de IA chinesa) fazendo parecer fácil hoje com o lançamento aberto de pesos de um LLM de nível de fronteira treinado com um orçamento ridículo (2048 GPUs por 2 meses, $6M).”

DeepSeek-V3 é agora um dos modelos de IA de código aberto mais fortes do mercado e sua API paga continua sendo uma das mais acessíveis no mercado.

Gostou desse artigo? Avalie!
Eu detestei Eu não gostei Achei razoável Muito bom! Eu adorei!

Estamos muito felizes que tenha gostado do nosso trabalho!

Como um leitor importante, você se importaria de nos avaliar no Trustpilot? É rápido e significa muito para nós. Obrigado por ser incrível!

Avalie-nos no Trustpilot
0 Votado por 0 usuários
Título
Comentar
Obrigado por seu feedback
Loader
Please wait 5 minutes before posting another comment.
Comment sent for approval.

Deixe um comentário

Loader
Loader Mostrar mais...