Novo Algoritmo do MIT Aumenta a Eficiência da Tomada de Decisões de IA em até 50 Vezes
Pesquisadores do MIT desenvolveram um algoritmo eficiente para treinamento de IA, aumentando o desempenho ao selecionar as melhores tarefas, melhorando a tomada de decisões e reduzindo os custos de treinamento.
Com pressa? Aqui estão os Fatos Rápidos!
- O Aprendizado de Transferência Baseado em Modelos (MBTL) melhora o desempenho ao mesmo tempo que reduz as necessidades de dados e computacionais.
- O MBTL foi cinco a 50 vezes mais eficiente do que os métodos tradicionais de aprendizado por reforço.
- Os pesquisadores planejam estender o MBTL para problemas do mundo real mais complexos.
Pesquisadores do MIT apresentaram um novo algoritmo projetado para tornar os modelos de tomada de decisão de IA mais eficientes, especialmente para tarefas complexas como o controle de tráfego nas cidades.
O algoritmo melhora o aprendizado de reforço tradicional, que frequentemente enfrenta dificuldades com a variabilidade entre diferentes tarefas.
O comunicado de imprensa do MIT explica que, por exemplo, um modelo de IA treinado para controlar o tráfego em um cruzamento pode falhar quando aplicado a outros com diferentes padrões de tráfego, número de faixas ou limites de velocidade.
A nova abordagem, conhecida como Aprendizado por Transferência Baseado em Modelos (MBTL), seleciona estrategicamente um subconjunto de tarefas para treinar o agente de IA, focando naquelas que proporcionarão as melhorias mais significativas no desempenho.
Ao restringir o foco do treinamento, este método reduz os dados e os recursos computacionais necessários, ao mesmo tempo que aumenta a eficiência do processo de aprendizado, diz o MIT.
A pesquisa da equipe, que será apresentada na Conferência sobre Sistemas de Processamento de Informações Neurais, demonstrou que o MBTL foi entre cinco e 50 vezes mais eficiente do que os métodos padrão.
“Conseguimos ver melhorias de desempenho incríveis, com um algoritmo muito simples, ao pensar fora da caixa”, disse Cathy Wu, autora principal e professora associada no MIT.
“Um algoritmo que não é muito complicado tem mais chances de ser adotado pela comunidade porque é mais fácil de implementar e mais fácil para os outros entenderem.”
Tipicamente, modelos de IA para tarefas como controle de tráfego são treinados de uma de duas maneiras: ou usando dados de todas as tarefas, ou treinando modelos separados para cada tarefa.
O MIT explica que ambos os métodos têm desvantagens – treinar modelos separados requer enormes quantidades de dados, enquanto o treinamento em todas as tarefas muitas vezes leva a um desempenho abaixo do esperado.
O método dos pesquisadores encontra um meio termo, treinando um algoritmo em um subconjunto menor de tarefas que são estrategicamente selecionadas para maximizar o desempenho em todas as tarefas.
O MBTL utiliza aprendizado de transferência zero-shot, um conceito onde um modelo treinado em uma tarefa é aplicado a tarefas semelhantes sem treinamento adicional.
O MIT explica que esse método estima o quão bem o modelo performará em tarefas para as quais não foi diretamente treinado, selecionando assim tarefas que irão melhorar a generalização geral.
“Com um aumento de eficiência de 50x, o algoritmo MBTL poderia treinar em apenas duas tarefas e obter o mesmo desempenho de um método padrão que usa dados de 100 tarefas”, explicou Wu.
Essa abordagem reduz significativamente a quantidade de dados de treinamento necessários, melhorando tanto a velocidade quanto a relação custo-benefício do desenvolvimento de modelos de IA para tomada de decisões complexas, de acordo com o MIT.
Olhando para o futuro, a equipe planeja aprimorar o método MBTL para sistemas mais complexos e aplicações do mundo real, como sistemas de mobilidade de próxima geração.
Deixe um comentário
Cancelar