A Organização Sem Fins Lucrativos Ai2 Lança Novo LLM Competitivo com a Llama da Meta

Photo by Sigmund on Unsplash

A Organização Sem Fins Lucrativos Ai2 Lança Novo LLM Competitivo com a Llama da Meta

Tempo de leitura: 3 minuto

A organização sem fins lucrativos de pesquisa The Allen Institute for Artificial Intelligence (Ai2) lançou o OLMo 2, a segunda família do seu modelo aberto de linguagem, com ferramentas e capacidades altamente competitivas comparáveis aos modelos líderes no mercado, como o Llama 3.1 da Meta.

Com pressa? Aqui estão os fatos rápidos!

  • A Ai2 lançou ontem o OLMo 2, um modelo de linguagem avançado e de código aberto
  • A organização o descreve como “o melhor modelo de linguagem totalmente aberto até o momento”
  • OLMo 2 compete com outros modelos de código aberto, como o Llama 3.1 da Meta

Ai2, fundada pelo co-fundador da Microsoft, Paul Allen, em 2014, descreveu este modelo como “o melhor modelo de linguagem totalmente aberto até o momento”.

“Apresentamos o OLMo 2, uma nova família de modelos 7B e 13B treinados em até 5T tokens”, escreveu a organização em um anúncio em seu site. “Esses modelos estão em pé de igualdade com ou melhores do que modelos totalmente abertos de tamanho equivalente, e competitivos com modelos de pesos abertos como o Llama 3.1 em benchmarks acadêmicos em inglês.”

OLMo 2 é o resultado de uma atualização das versões anteriores de modelos lançados ao longo do ano – Ai2 anunciou seu primeiro modelo, OLMo, em fevereiro – focando em melhorar aspectos críticos como estabilidade de treinamento, pré-treinamento, pós-treinamento de última geração e desempenho por meio de um framework de avaliação.

O novo modelo está atualmente disponível apenas em inglês e há uma demonstração online disponível ao público para testar o OLMo 2.

De acordo com o TechCrunch, o OLMo 2 atende aos critérios para ser considerado uma IA de código aberto, já que seus dados e ferramentas estão publicamente disponíveis e prontos para serem testados.

A Ai2 compartilhou dados comprovando que este novo modelo pode superar outros modelos populares com estruturas semelhantes.

“Descobrimos que OLMo 2 7B e 13B são os melhores modelos totalmente abertos até o momento, muitas vezes superando modelos de peso aberto de tamanho equivalente”, afirma o documento compartilhado pela organização. “Não apenas observamos uma melhoria dramática no desempenho em todas as tarefas em comparação com o nosso modelo OLMo 0424 anterior, mas, notavelmente, o OLMo 2 7B supera o LLama-3.1 8B e o OLMo 2 13B supera o Qwen 2.5 7B apesar de seu total inferior de FLOPs de treinamento.”

Alibaba lançou os novos modelos Qwen 2.5, considerados para comparação pela Ai2, em setembro.

Gostou desse artigo? Avalie!
Eu detestei Eu não gostei Achei razoável Muito bom! Eu adorei!

Estamos muito felizes que tenha gostado do nosso trabalho!

Como um leitor importante, você se importaria de nos avaliar no Trustpilot? É rápido e significa muito para nós. Obrigado por ser incrível!

Avalie-nos no Trustpilot
0 Votado por 0 usuários
Título
Comentar
Obrigado por seu feedback
Loader
Please wait 5 minutes before posting another comment.
Comment sent for approval.

Deixe um comentário

Loader
Loader Mostrar mais...