
Photo by John Schnobrich on Unsplash
Alibaba Lança Novo Modelo de IA Qwen e Afirma que Ele Supera o DeepSeek-V3
A gigante chinesa Alibaba lançou a versão mais recente de seu principal modelo de IA, Qwen, nesta quarta-feira. A empresa afirma que ele pode ter um desempenho melhor do que o popular DeepSeek-V3.
Com Pressa? Aqui estão os Fatos Rápidos!
- A Alibaba lançou seu mais recente modelo de raciocínio, o Qwen 2.5-Max, nesta quarta-feira.
- O gigante chinês afirma que ele supera modelos populares como DeepSeek-V3, GPT-4o e Llama-3.1-405B.
- A empresa também lançou o Qwen2.5-VL esta semana, um modelo de IA capaz de processar imagens e atuar como um agente de IA usando computadores e celulares para realizar tarefas.
De acordo com a Reuters, a Alibaba lançou o novo Qwen 2.5-Max, como nomeou seu novo modelo de raciocínio, justamente durante as festividades do Ano Novo Lunar na China, para se juntar aos massivos desenvolvimentos de IA dos últimos dias e adicionar competição doméstica.
Na segunda-feira, o DeepSeek alcançou o primeiro lugar na App Store da Apple nos Estados Unidos, ultrapassando o ChatGPT, preocupando outras empresas na indústria de IA e assustando investidores – as ações da Nvidia caíram 17% em apenas um dia.
Agora, a Alibaba anunciou as versões mais recentes de seu modelo Qwen – ela lançou 100 modelos de IA de código aberto para o conjunto Qwen em setembro do ano passado – prometendo melhores resultados do que os populares modelos de fronteira.
“Qwen 2.5-Max supera (…) quase em todos os aspectos GPT-4o, DeepSeek-V3 e Llama-3.1-405B”, escreveu a empresa em sua conta oficial no WeChat.
A nova API do modelo de raciocínio Qwen 2.5-Max está disponível através do cloud da Alibaba e os usuários também podem testar o modelo em sua página de chat.
“Estamos desenvolvendo o Qwen2.5-Max, um modelo MoE de grande escala que foi pré-treinado em mais de 20 trilhões de tokens e posteriormente pós-treinado com metodologias Supervised Fine-Tuning (SFT) e Reinforcement Learning from Human Feedback (RLHF) selecionadas”, escreveu a Equipe Qwen no Github.
A gigante chinesa também lançou na segunda-feira o Qwen2.5-VL, uma série de modelos de IA multimodais que também podem processar imagens e acessar celulares e computadores para realizar tarefas. A OpenAI anunciou um recurso semelhante, Operator, que permite ao ChatGPT realizar tarefas de forma autônoma, assumindo o controle do computador do usuário.
De acordo com a equipe da Alibaba, todos os modelos Qwen superam as versões semelhantes da OpenAI, Microsoft, Google, Meta e DeepSeek.
Deixe um comentário
Cancelar