A Organização Sem Fins Lucrativos Ai2 Lança Novo LLM Competitivo com a Llama da Meta
A organização sem fins lucrativos de pesquisa The Allen Institute for Artificial Intelligence (Ai2) lançou o OLMo 2, a segunda família do seu modelo aberto de linguagem, com ferramentas e capacidades altamente competitivas comparáveis aos modelos líderes no mercado, como o Llama 3.1 da Meta.
Com pressa? Aqui estão os fatos rápidos!
- A Ai2 lançou ontem o OLMo 2, um modelo de linguagem avançado e de código aberto
- A organização o descreve como “o melhor modelo de linguagem totalmente aberto até o momento”
- OLMo 2 compete com outros modelos de código aberto, como o Llama 3.1 da Meta
Ai2, fundada pelo co-fundador da Microsoft, Paul Allen, em 2014, descreveu este modelo como “o melhor modelo de linguagem totalmente aberto até o momento”.
“Apresentamos o OLMo 2, uma nova família de modelos 7B e 13B treinados em até 5T tokens”, escreveu a organização em um anúncio em seu site. “Esses modelos estão em pé de igualdade com ou melhores do que modelos totalmente abertos de tamanho equivalente, e competitivos com modelos de pesos abertos como o Llama 3.1 em benchmarks acadêmicos em inglês.”
OLMo 2 é o resultado de uma atualização das versões anteriores de modelos lançados ao longo do ano – Ai2 anunciou seu primeiro modelo, OLMo, em fevereiro – focando em melhorar aspectos críticos como estabilidade de treinamento, pré-treinamento, pós-treinamento de última geração e desempenho por meio de um framework de avaliação.
O novo modelo está atualmente disponível apenas em inglês e há uma demonstração online disponível ao público para testar o OLMo 2.
De acordo com o TechCrunch, o OLMo 2 atende aos critérios para ser considerado uma IA de código aberto, já que seus dados e ferramentas estão publicamente disponíveis e prontos para serem testados.
A Ai2 compartilhou dados comprovando que este novo modelo pode superar outros modelos populares com estruturas semelhantes.
“Descobrimos que OLMo 2 7B e 13B são os melhores modelos totalmente abertos até o momento, muitas vezes superando modelos de peso aberto de tamanho equivalente”, afirma o documento compartilhado pela organização. “Não apenas observamos uma melhoria dramática no desempenho em todas as tarefas em comparação com o nosso modelo OLMo 0424 anterior, mas, notavelmente, o OLMo 2 7B supera o LLama-3.1 8B e o OLMo 2 13B supera o Qwen 2.5 7B apesar de seu total inferior de FLOPs de treinamento.”
Alibaba lançou os novos modelos Qwen 2.5, considerados para comparação pela Ai2, em setembro.
Deixe um comentário
Cancelar