Nova empresa de IA, Deep Cogito, lança seus primeiros modelos híbridos de IA

Photo by Steve Johnson on Unsplash

Nova empresa de IA, Deep Cogito, lança seus primeiros modelos híbridos de IA

Tempo de leitura: 3 minuto

A nova empresa americana de IA, Deep Cogito, lançou seus primeiros modelos de linguagem grande e abertos (LLMs) chamados Cogito v1 na terça-feira. A startup afirma que seus modelos híbridos e de código aberto superam modelos de IA abertos similares, incluindo DeepSeek, Qwen e LLaMA da Meta.

Com pressa? Aqui estão os fatos rápidos:

  • Deep Cogito lançou seu primeiro LLM chamado Cogito v1 nesta terça-feira.
  • A nova empresa americana afirma que seu modelo supera os modelos de código aberto equivalentes, incluindo Qwen, DeepSeek e LLaMA da Meta.
  • Os modelos Cogito v1 funcionam em modo de raciocínio e modo padrão, e foram otimizados para chamada de função, codificação e uso agente.

A Deep Cogito, com sede em São Francisco, apresentou o Cogito v1 por meio de um anúncio oficial em seu site, incluindo detalhes de seus LLMs, seu desempenho e lançamentos futuros.

“Estamos lançando os LLMs mais poderosos de tamanhos 3B, 8B, 14B, 32B e 70B sob licença aberta”, afirma o documento. “Cada modelo supera os melhores modelos abertos disponíveis do mesmo tamanho, incluindo contrapartes da LLaMA, DeepSeek e Qwen, na maioria dos benchmarks padrão. Em particular, o modelo 70B também supera o recém-lançado modelo Llama 4 109B MoE.”

O novo modelo foi treinado com a Iterated Distillation and Amplification (IDA), uma estrutura que treina modelos de IA para construir sistemas alinhados para superinteligência geral, e inclui recursos de “raciocínio”. Todos os modelos podem funcionar em raciocínio e modo padrão – uma modalidade híbrida – e foram otimizados para chamada de função, codificação e uso agente.

De acordo com a pesquisa e resultados da startup, o Cogito v1 superou a maioria dos modelos equivalentes nos modos direto e de raciocínio, considerando benchmarks populares. A empresa espera lançar modelos maiores nos próximos meses.

“Nosso próximo lançamento apresentará pontos de verificação atualizados para cada tamanho de modelo (3B a 70B), com períodos de treinamento estendidos, bem como modelos maiores nas próximas semanas e meses”, escreveu a empresa. “Todos os modelos serão de código aberto.”

O Cogito v1 pode ser baixado no Ollama ou Hugging Face, ou acessado através de APIs no Together AI ou Fireworks AI.

De acordo com o TechCrunch, Deep Cogito foi fundada em junho de 2024 por Drishan Arora e Dhruv Malhotra — ambos ex-funcionários do Google. A empresa tem o apoio do South Park Commons, e seu principal objetivo é construir uma superinteligência geral que possa superar os humanos.

O novo modelo de IA chega para acompanhar a intensidade e velocidade do mercado de IA e se juntar à tendência de código aberto. O gigante motor de busca chinês Baidu anunciou um novo modelo de IA de código aberto que será lançado em breve em fevereiro, e DeepSeek compartilhou mais detalhes e uma iniciativa de transparência para o seu código há algumas semanas.

Gostou desse artigo? Avalie!
Eu detestei Eu não gostei Achei razoável Muito bom! Eu adorei!

Estamos muito felizes que tenha gostado do nosso trabalho!

Como um leitor importante, você se importaria de nos avaliar no Trustpilot? É rápido e significa muito para nós. Obrigado por ser incrível!

Avalie-nos no Trustpilot
0 Votado por 0 usuários
Título
Comentar
Obrigado por seu feedback
Loader
Please wait 5 minutes before posting another comment.
Comment sent for approval.

Deixe um comentário

Loader
Loader Mostrar mais...