Photo by Sigmund on Unsplash

A Organização Sem Fins Lucrativos Ai2 Lança Novo LLM Competitivo com a Llama da Meta

Tempo de leitura: 3 minuto

Última atualização: Nov 28, 2024

Escrito por Andrea Miliani Especialista em notícias de tecnologia
Traduzido por Equipe de localização e tradução Serviços de localização e tradução

A organização sem fins lucrativos de pesquisa The Allen Institute for Artificial Intelligence (Ai2) lançou o OLMo 2, a segunda família do seu modelo aberto de linguagem, com ferramentas e capacidades altamente competitivas comparáveis aos modelos líderes no mercado, como o Llama 3.1 da Meta.

Com pressa? Aqui estão os fatos rápidos!

A Ai2 lançou ontem o OLMo 2, um modelo de linguagem avançado e de código aberto
A organização o descreve como “o melhor modelo de linguagem totalmente aberto até o momento”
OLMo 2 compete com outros modelos de código aberto, como o Llama 3.1 da Meta

Ai2, fundada pelo co-fundador da Microsoft, Paul Allen, em 2014, descreveu este modelo como “o melhor modelo de linguagem totalmente aberto até o momento”.

“Apresentamos o OLMo 2, uma nova família de modelos 7B e 13B treinados em até 5T tokens”, escreveu a organização em um anúncio em seu site. “Esses modelos estão em pé de igualdade com ou melhores do que modelos totalmente abertos de tamanho equivalente, e competitivos com modelos de pesos abertos como o Llama 3.1 em benchmarks acadêmicos em inglês.”

OLMo 2 é o resultado de uma atualização das versões anteriores de modelos lançados ao longo do ano – Ai2 anunciou seu primeiro modelo, OLMo, em fevereiro – focando em melhorar aspectos críticos como estabilidade de treinamento, pré-treinamento, pós-treinamento de última geração e desempenho por meio de um framework de avaliação.

O novo modelo está atualmente disponível apenas em inglês e há uma demonstração online disponível ao público para testar o OLMo 2.

De acordo com o TechCrunch, o OLMo 2 atende aos critérios para ser considerado uma IA de código aberto, já que seus dados e ferramentas estão publicamente disponíveis e prontos para serem testados.

A Ai2 compartilhou dados comprovando que este novo modelo pode superar outros modelos populares com estruturas semelhantes.

“Descobrimos que OLMo 2 7B e 13B são os melhores modelos totalmente abertos até o momento, muitas vezes superando modelos de peso aberto de tamanho equivalente”, afirma o documento compartilhado pela organização. “Não apenas observamos uma melhoria dramática no desempenho em todas as tarefas em comparação com o nosso modelo OLMo 0424 anterior, mas, notavelmente, o OLMo 2 7B supera o LLama-3.1 8B e o OLMo 2 13B supera o Qwen 2.5 7B apesar de seu total inferior de FLOPs de treinamento.”

Alibaba lançou os novos modelos Qwen 2.5, considerados para comparação pela Ai2, em setembro.

A Organização Sem Fins Lucrativos Ai2 Lança Novo LLM Competitivo com a Llama da Meta

Estamos muito felizes que tenha gostado do nosso trabalho!

Deixe um comentário