DeepSeek Revela o Modelo 3V, o Mais Poderoso AI de Código Aberto Até Agora
A empresa chinesa de IA, DeepSeek, lançou seu mais recente modelo de código aberto, o DeepSeek-V3, esta semana. A startup afirma que seu novo modelo grande inclui 671B parâmetros e pode ter um desempenho melhor que modelos de ponta como o GPT-4o da OpenAI e o Claude-Sonnet-3.5 da Anthropic.
Com pressa? Aqui estão os fatos rápidos!
- DeepSeek lançou seu mais recente modelo de IA, o DeepSeek-V3, alegando que ele tem um desempenho superior ao GPT 4o e ao Claude-Sonnet-3.5.
- A empresa chinesa de IA explicou que o novo modelo inclui 671B de parâmetros e é três vezes mais rápido do que o modelo anterior.
- DeepSeek-V3 é agora o modelo de IA de código aberto mais poderoso no mercado
Os usuários podem interagir com o modelo através do site oficial, ler o artigo da empresa e acessar o modelo via Hugging Face. DeekSeek disse que este novo modelo é três vezes mais rápido que a versão anterior lançada em novembro e possui capacidades aprimoradas e compatibilidade com API.
🚀 Apresentando o DeepSeek-V3!
Maior avanço até agora:
⚡ 60 tokens/segundo (3x mais rápido que o V2!)
💪 Capacidades aprimoradas
🛠 Compatibilidade de API intacta
🌍 Modelos e artigos totalmente de código aberto🐋 1/n pic.twitter.com/p1dV9gJ2Sd
— DeepSeek (@deepseek_ai) 26 de dezembro de 2024
“Apresentamos o DeepSeek-V3, um forte modelo de linguagem Mixture-of-Experts (MoE) com um total de 671B parâmetros, dos quais 37B são ativados para cada token”, escreveu a empresa no GitHub. “Avaliações abrangentes revelam que o DeepSeek-V3 supera outros modelos de código aberto e alcança desempenho comparável aos principais modelos de código fechado.”
Muitos usuários, organizações e empresas parabenizaram a DeepSeek por sua conquista. “Parabéns pelo lançamento estelar!” escreveu Hugging Face no X, “Os pontos de verificação do modelo e um relatório detalhado – verdadeiramente, o Natal está aqui!”
Andrej Karpathy—ex-pesquisador da OpenAI e chefe de IA na Tesla—também compartilhou alguns pensamentos. “DeepSeek (empresa de IA chinesa) fazendo parecer fácil hoje com o lançamento aberto de pesos de um LLM de nível de fronteira treinado com um orçamento ridículo (2048 GPUs por 2 meses, $6M).”
DeepSeek-V3 é agora um dos modelos de IA de código aberto mais fortes do mercado e sua API paga continua sendo uma das mais acessíveis no mercado.
Deixe um comentário
Cancelar