Pesquisadores Antropocêntricos Descobrem a Capacidade da IA de Planejar com Antecedência e Raciocinar

Photo by Steve Johnson on Unsplash

Pesquisadores Antropocêntricos Descobrem a Capacidade da IA de Planejar com Antecedência e Raciocinar

Tempo de leitura: 3 minuto

A startup de IA Anthropic lançou dois novos artigos nesta quinta-feira, revelando uma compreensão mais profunda de como funcionam os Grandes Modelos de Linguagem (LLMs). Os estudos, que se concentraram em analisar o modelo Claude 3.5 Haiku da empresa, revelam mais detalhes sobre como os modelos de IA sofisticados se comportam, bem como suas vulnerabilidades e oportunidades para desenvolver ambientes mais seguros.

Está com pressa? Aqui estão os fatos rápidos:

  • Anthropic publicou dois novos artigos revelando como seu modelo Claude 3.5 Haiku processa a linguagem e o raciocínio.
  • Os pesquisadores utilizaram gráficos de atribuição para descobrir circuitos de IA e entender como os modelos tomam decisões, escrevem poesia ou têm alucinações.
  • Os estudos visam trazer mais clareza à “natureza de caixa preta” dos avançados modelos gerativos de IA.

Os novos estudos da Anthropic visam trazer mais clareza para a “natureza caixa-preta” dos modelos. Em um dos artigos, Sobre a Biologia de um Grande Modelo de Linguagem, pesquisadores comparam seus trabalhos aos desafios enfrentados por biólogos e encontraram soluções que podem ser comparadas às utilizadas para avanços na biologia.

“Embora os modelos de linguagem sejam gerados por algoritmos de treinamento simples, projetados por humanos, os mecanismos nascidos desses algoritmos parecem ser bastante complexos”, afirma o documento. “Assim como as células formam os blocos de construção dos sistemas biológicos, hipotetizamos que as características formam as unidades básicas de cálculo dentro dos modelos.”

Os especialistas contaram com uma ferramenta de pesquisa chamada “gráficos de atribuição” que lhes permitiu mapear conexões, acompanhar o desempenho e os circuitos do modelo de IA e obter mais insights sobre vários fenômenos, inclusive aqueles já explorados.

A empresa revelou várias descobertas, como o fato de que o modelo de IA aplica um processo de raciocínio de várias etapas “em sua cabeça” antes de fornecer uma resposta, que ele planeja seus poemas com antecedência encontrando palavras que rimam primeiro, que desenvolveu circuitos independentes de idioma e como ele alucina ao passar por entidades desconhecidas em seus circuitos.

“Muitos dos nossos resultados nos surpreenderam”, escreveram os pesquisadores no artigo. “Às vezes isso acontecia porque os mecanismos de alto nível eram inesperados.”

No artigo Circuit Tracing: Revealing Computational Graphs in Language Models, pesquisadores fornecem mais detalhes técnicos sobre como a metodologia dos gráficos de atribuição foi aplicada para obter uma melhor compreensão dos “neurônios” artificiais – unidades computacionais.

No ano passado, a Anthropic publicou outro estudo científico revelando que seu principal modelo de IA pode se envolver em engano estratégico e simular alinhamento para manter seus princípios originais.

Gostou desse artigo? Avalie!
Eu detestei Eu não gostei Achei razoável Muito bom! Eu adorei!

Estamos muito felizes que tenha gostado do nosso trabalho!

Como um leitor importante, você se importaria de nos avaliar no Trustpilot? É rápido e significa muito para nós. Obrigado por ser incrível!

Avalie-nos no Trustpilot
0 Votado por 0 usuários
Título
Comentar
Obrigado por seu feedback
Loader
Please wait 5 minutes before posting another comment.
Comment sent for approval.

Deixe um comentário

Loader
Loader Mostrar mais...