Ciência e tecnologia

O agente de AI do Google DeepMind sonha algoritmos além da experiência humana

Uma questão -chave na inteligência artificial é a frequência com que os modelos vão além de apenas regurgitar e remixar o que aprenderam e produzem idéias ou idéias verdadeiramente novas.

Um novo projeto do Google DeepMind mostra que, com alguns ajustes inteligentes, esses modelos podem pelo menos superar a experiência humana, projetando certos tipos de algoritmos – incluindo os que são úteis para avançar a própria IA.

O mais recente projeto de IA da empresa, chamado Alfa evolvecombina as habilidades de codificação de seu modelo Gemini AI com um método para testar a eficácia de novos algoritmos e um método evolutivo para produzir novos designs.

A AlphaEvolve criou algoritmos mais eficientes para vários tipos de computação, incluindo um método para cálculos que envolvem matrizes que melhoram uma abordagem chamada algoritmo de Strassen que se baseia há 56 anos. A nova abordagem melhora a eficiência computacional, reduzindo o número de cálculos necessários para produzir um resultado.

O DeepMind também usou o AlphaEvolve para criar melhores algoritmos para vários problemas do mundo real, incluindo tarefas de agendamento dentro de datacenters, esboçando o design de chips de computador e otimizando o design dos algoritmos usados ​​para criar grandes modelos de linguagem como o próprio Gemini.

“Esses são três elementos críticos do ecossistema moderno da IA”, diz Pushmeet Kohli, chefe da IA ​​da ciência da DeepMind. “Este agente de codificação sobre -humano é capaz de assumir determinadas tarefas e ir muito além do que se sabe em termos de soluções para elas”.

Matej Balog, uma das pesquisas que lidera o AlphaEvolve, diz que muitas vezes é difícil saber se um grande modelo de idioma criou uma peça de escrita ou código verdadeiramente nova, mas é possível mostrar que nenhuma pessoa encontrou uma solução melhor para certos problemas. “Mostramos com muita precisão que você pode descobrir algo que é comprovadamente novo e comprovadamente correto”, diz Balog. “Você pode ter certeza de que o que você encontrou não poderia estar nos dados de treinamento”.

Sanjeev Arora, cientista da Universidade de Princeton especializado em design de algoritmos, diz que os avanços feitos pelo AlphaVolve são relativamente pequenos e se aplicam apenas a algoritmos que envolvem a pesquisa em um espaço de possíveis respostas. Mas ele acrescenta: “A pesquisa é uma ideia bastante geral aplicável a muitas configurações”.

A codificação movida a IA está começando a mudar a maneira como desenvolvedores e empresas escrevem software. Os modelos mais recentes de IA tornam trivial para os novatos criarem aplicativos e sites simples, e alguns desenvolvedores experientes estão usando a IA para automatizar mais de seu trabalho.

O AlphaEvolve demonstra o potencial de IA criar idéias completamente novas por meio de experimentação e avaliação contínuas. As empresas DeepMind e outras empresas de IA esperam que os agentes da IA ​​aprendam gradualmente a exibir uma engenhosidade mais geral em muitas áreas, talvez gerando soluções engenhosas para um problema de negócios ou novas idéias quando recebem um problema específico.

Josh Alman, professor assistente da Universidade de Columbia que trabalha em design de algoritmos, diz que a AlphaEvolve parece estar gerando novas idéias em vez de remixar coisas que aprendeu durante o treinamento. “Tem que estar fazendo algo novo e não apenas regurgitando”, diz ele.

Fonte

Artigos Relacionados

Botão Voltar ao Topo