Photo by John Schnobrich on Unsplash

Alibaba Lança Novo Modelo de IA Qwen e Afirma que Ele Supera o DeepSeek-V3

Tempo de leitura: 2 minuto

Publicado pela primeira vez em: Jan 31, 2025

Atualizado 2 vezes desde a publicação

Escrito por Andrea Miliani Ex-especialista em notícias de tecnologia
Traduzido por Equipe de localização e tradução Serviços de localização e tradução

A gigante chinesa Alibaba lançou a versão mais recente de seu principal modelo de IA, Qwen, nesta quarta-feira. A empresa afirma que ele pode ter um desempenho melhor do que o popular DeepSeek-V3.

Com Pressa? Aqui estão os Fatos Rápidos!

A Alibaba lançou seu mais recente modelo de raciocínio, o Qwen 2.5-Max, nesta quarta-feira.
O gigante chinês afirma que ele supera modelos populares como DeepSeek-V3, GPT-4o e Llama-3.1-405B.
A empresa também lançou o Qwen2.5-VL esta semana, um modelo de IA capaz de processar imagens e atuar como um agente de IA usando computadores e celulares para realizar tarefas.

De acordo com a Reuters, a Alibaba lançou o novo Qwen 2.5-Max, como nomeou seu novo modelo de raciocínio, justamente durante as festividades do Ano Novo Lunar na China, para se juntar aos massivos desenvolvimentos de IA dos últimos dias e adicionar competição doméstica.

Na segunda-feira, o DeepSeek alcançou o primeiro lugar na App Store da Apple nos Estados Unidos, ultrapassando o ChatGPT, preocupando outras empresas na indústria de IA e assustando investidores – as ações da Nvidia caíram 17% em apenas um dia.

Agora, a Alibaba anunciou as versões mais recentes de seu modelo Qwen – ela lançou 100 modelos de IA de código aberto para o conjunto Qwen em setembro do ano passado – prometendo melhores resultados do que os populares modelos de fronteira.

“Qwen 2.5-Max supera (…) quase em todos os aspectos GPT-4o, DeepSeek-V3 e Llama-3.1-405B”, escreveu a empresa em sua conta oficial no WeChat.

A nova API do modelo de raciocínio Qwen 2.5-Max está disponível através do cloud da Alibaba e os usuários também podem testar o modelo em sua página de chat.

“Estamos desenvolvendo o Qwen2.5-Max, um modelo MoE de grande escala que foi pré-treinado em mais de 20 trilhões de tokens e posteriormente pós-treinado com metodologias Supervised Fine-Tuning (SFT) e Reinforcement Learning from Human Feedback (RLHF) selecionadas”, escreveu a Equipe Qwen no Github.

A gigante chinesa também lançou na segunda-feira o Qwen2.5-VL, uma série de modelos de IA multimodais que também podem processar imagens e acessar celulares e computadores para realizar tarefas. A OpenAI anunciou um recurso semelhante, Operator, que permite ao ChatGPT realizar tarefas de forma autônoma, assumindo o controle do computador do usuário.

De acordo com a equipe da Alibaba, todos os modelos Qwen superam as versões semelhantes da OpenAI, Microsoft, Google, Meta e DeepSeek.

Alibaba Lança Novo Modelo de IA Qwen e Afirma que Ele Supera o DeepSeek-V3

Estamos muito felizes que tenha gostado do nosso trabalho!

Deixe um comentário