Alibaba Lança Novo Modelo de IA Qwen e Afirma que Ele Supera o DeepSeek-V3

Photo by John Schnobrich on Unsplash

Alibaba Lança Novo Modelo de IA Qwen e Afirma que Ele Supera o DeepSeek-V3

Tempo de leitura: 2 minuto

A gigante chinesa Alibaba lançou a versão mais recente de seu principal modelo de IA, Qwen, nesta quarta-feira. A empresa afirma que ele pode ter um desempenho melhor do que o popular DeepSeek-V3.

Com Pressa? Aqui estão os Fatos Rápidos!

  • A Alibaba lançou seu mais recente modelo de raciocínio, o Qwen 2.5-Max, nesta quarta-feira.
  • O gigante chinês afirma que ele supera modelos populares como DeepSeek-V3, GPT-4o e Llama-3.1-405B.
  • A empresa também lançou o Qwen2.5-VL esta semana, um modelo de IA capaz de processar imagens e atuar como um agente de IA usando computadores e celulares para realizar tarefas.

De acordo com a Reuters, a Alibaba lançou o novo Qwen 2.5-Max, como nomeou seu novo modelo de raciocínio, justamente durante as festividades do Ano Novo Lunar na China, para se juntar aos massivos desenvolvimentos de IA dos últimos dias e adicionar competição doméstica.

Na segunda-feira, o DeepSeek alcançou o primeiro lugar na App Store da Apple nos Estados Unidos, ultrapassando o ChatGPT, preocupando outras empresas na indústria de IA e assustando investidores – as ações da Nvidia caíram 17% em apenas um dia.

Agora, a Alibaba anunciou as versões mais recentes de seu modelo Qwen – ela lançou 100 modelos de IA de código aberto para o conjunto Qwen em setembro do ano passado – prometendo melhores resultados do que os populares modelos de fronteira.

“Qwen 2.5-Max supera (…) quase em todos os aspectos GPT-4o, DeepSeek-V3 e Llama-3.1-405B”, escreveu a empresa em sua conta oficial no WeChat.

A nova API do modelo de raciocínio Qwen 2.5-Max está disponível através do cloud da Alibaba e os usuários também podem testar o modelo em sua página de chat.

“Estamos desenvolvendo o Qwen2.5-Max, um modelo MoE de grande escala que foi pré-treinado em mais de 20 trilhões de tokens e posteriormente pós-treinado com metodologias Supervised Fine-Tuning (SFT) e Reinforcement Learning from Human Feedback (RLHF) selecionadas”, escreveu a Equipe Qwen no Github.

A gigante chinesa também lançou na segunda-feira o Qwen2.5-VL, uma série de modelos de IA multimodais que também podem processar imagens e acessar celulares e computadores para realizar tarefas. A OpenAI anunciou um recurso semelhante, Operator, que permite ao ChatGPT realizar tarefas de forma autônoma, assumindo o controle do computador do usuário.

De acordo com a equipe da Alibaba, todos os modelos Qwen superam as versões semelhantes da OpenAI, Microsoft, Google, Meta e DeepSeek.

Gostou desse artigo? Avalie!
Eu detestei Eu não gostei Achei razoável Muito bom! Eu adorei!

Estamos muito felizes que tenha gostado do nosso trabalho!

Como um leitor importante, você se importaria de nos avaliar no Trustpilot? É rápido e significa muito para nós. Obrigado por ser incrível!

Avalie-nos no Trustpilot
0 Votado por 0 usuários
Título
Comentar
Obrigado por seu feedback
Loader
Please wait 5 minutes before posting another comment.
Comment sent for approval.

Deixe um comentário

Loader
Loader Mostrar mais...