Microsoft treina novo modelo de IA para competir com principais LLMs
A Microsoft está desenvolvendo um novo grande modelo de linguagem (LLM) com o codinome MAI-1, que tem o potencial de competir com os LLMs de IA desenvolvidos pelo Google e pela OpenAI. É a primeira vez que a Microsoft desenvolve um LLM tão grande desde que investiu bilhões de dólares na OpenAI para os direitos de usar sua tecnologia em seu pacote de software de produtividade.
O desenvolvimento do MAI-1 está sendo supervisionado pelo pelo cofundador da Inflection e Google DeepMind, Mustafa Suleyman, de acordo com um relatório do The Information. Em março de 2024, a Microsoft adquiriu vários funcionários da Inflection em um acordo no valor de 650 milhões de dólares.
Conforme relatório publicado em 6 de maio, o MAI-1 terá aproximadamente 500 bilhões de parâmetros, colocando-o em algum lugar entre os trilhões de parâmetros relatados do GPT-4 da OpenAI e os 70 bilhões de parâmetros do modelo de AI Llama 3 da Meta. Também espera-se que seja “muito maior” e mais caro do que qualquer um dos anteriores menores AIs de código aberto da Microsoft (Phi-3 e WizardLM-2), pois exigirá mais poder computacional e dados de treinamento.
Embora o MAI-1 possa aproveitar as técnicas e dados de treinamento da Inflection, permanece distinto de qualquer modelo ou tecnologia produzido por ela ou pela OpenAI. De acordo com funcionários da Microsoft familiarizados com o projeto, o MAI-1 é um LLM completamente novo desenvolvido internamente pela Microsoft.
A Microsoft ainda não anunciou o propósito exato do MAI-1, e seu uso dependerá de seu desempenho. Enquanto isso, a empresa tem alocado um grande cluster de servidores com GPUs Nvidia e usando grandes quantidades de dados de várias fontes para melhorar o modelo.
Dependendo de seu progresso, relatórios afirmam que a empresa pode apresentar o MAI-1 na conferência de desenvolvedores Build ainda este mês, mas isso não foi confirmado.
Deixe um comentário
Cancelar