
Photo by Steve Johnson on Unsplash
Nova empresa de IA, Deep Cogito, lança seus primeiros modelos híbridos de IA
A nova empresa americana de IA, Deep Cogito, lançou seus primeiros modelos de linguagem grande e abertos (LLMs) chamados Cogito v1 na terça-feira. A startup afirma que seus modelos híbridos e de código aberto superam modelos de IA abertos similares, incluindo DeepSeek, Qwen e LLaMA da Meta.
Com pressa? Aqui estão os fatos rápidos:
- Deep Cogito lançou seu primeiro LLM chamado Cogito v1 nesta terça-feira.
- A nova empresa americana afirma que seu modelo supera os modelos de código aberto equivalentes, incluindo Qwen, DeepSeek e LLaMA da Meta.
- Os modelos Cogito v1 funcionam em modo de raciocínio e modo padrão, e foram otimizados para chamada de função, codificação e uso agente.
A Deep Cogito, com sede em São Francisco, apresentou o Cogito v1 por meio de um anúncio oficial em seu site, incluindo detalhes de seus LLMs, seu desempenho e lançamentos futuros.
“Estamos lançando os LLMs mais poderosos de tamanhos 3B, 8B, 14B, 32B e 70B sob licença aberta”, afirma o documento. “Cada modelo supera os melhores modelos abertos disponíveis do mesmo tamanho, incluindo contrapartes da LLaMA, DeepSeek e Qwen, na maioria dos benchmarks padrão. Em particular, o modelo 70B também supera o recém-lançado modelo Llama 4 109B MoE.”
O novo modelo foi treinado com a Iterated Distillation and Amplification (IDA), uma estrutura que treina modelos de IA para construir sistemas alinhados para superinteligência geral, e inclui recursos de “raciocínio”. Todos os modelos podem funcionar em raciocínio e modo padrão – uma modalidade híbrida – e foram otimizados para chamada de função, codificação e uso agente.
De acordo com a pesquisa e resultados da startup, o Cogito v1 superou a maioria dos modelos equivalentes nos modos direto e de raciocínio, considerando benchmarks populares. A empresa espera lançar modelos maiores nos próximos meses.
“Nosso próximo lançamento apresentará pontos de verificação atualizados para cada tamanho de modelo (3B a 70B), com períodos de treinamento estendidos, bem como modelos maiores nas próximas semanas e meses”, escreveu a empresa. “Todos os modelos serão de código aberto.”
O Cogito v1 pode ser baixado no Ollama ou Hugging Face, ou acessado através de APIs no Together AI ou Fireworks AI.
A prévia do Cogito v1 já está ao vivo no Together AI ✨
Esses modelos abertos do Deep Cogito expandem os limites do raciocínio e alinhamento, com opções de até 70B parâmetros.
Disponível agora por meio de Endpoints Dedicados do Together. pic.twitter.com/hc0gYXU7x1
— Together AI (@togethercompute) 8 de abril de 2025
De acordo com o TechCrunch, Deep Cogito foi fundada em junho de 2024 por Drishan Arora e Dhruv Malhotra — ambos ex-funcionários do Google. A empresa tem o apoio do South Park Commons, e seu principal objetivo é construir uma superinteligência geral que possa superar os humanos.
O novo modelo de IA chega para acompanhar a intensidade e velocidade do mercado de IA e se juntar à tendência de código aberto. O gigante motor de busca chinês Baidu anunciou um novo modelo de IA de código aberto que será lançado em breve em fevereiro, e DeepSeek compartilhou mais detalhes e uma iniciativa de transparência para o seu código há algumas semanas.
Deixe um comentário
Cancelar