Ciência e tecnologia

Gemini 2.5 Pro está aqui com números maiores e ótimas vibrações

Apenas alguns meses depois de lançar seus primeiros modelos de IA Gemini 2.0, o Google está atualizando novamente. A empresa diz O novo Gemini 2.5 Pro Experimental é seu modelo “mais inteligente” até agora, oferecendo uma enorme janela de contexto, multimodalidade e recursos de raciocínio. O Google aponta para uma série de benchmarks que mostram o novo Gemini batendo outros modelos de idiomas grandes (LLMs), e nossos testes parecem apoiar isso – a Legemini 2.5 Pro é um dos modelos generativos de IA mais impressionantes que já vimos.

O Gemini 2.5, como todos os modelos do Google daqui para frente, possui um raciocínio incorporado. A IA essencialmente se checks ao longo do caminho para gerar uma saída. Gostamos de chamar isso de “raciocínio simulado”, pois não há evidências de que esse processo seja semelhante ao raciocínio humano. No entanto, pode percorrer um longo caminho para melhorar as saídas do LLM. O Google cita especificamente os recursos de codificação “Agentic” do modelo como beneficiário desse processo. Gemini 2.5 Pro Experimental Can, por exemplo, gerar um videogame completo a partir de um único prompt. Testamos isso e funciona com a versão publicamente disponível do modelo.

https://www.youtube.com/watch?v=rlcbspgos6s

O Gemini 2.5 Pro constrói um jogo em um passo.

O Google diz muitas coisas sobre Gemini 2.5 Pro; É mais inteligente, é reconhecido pelo contexto, é pensa– mas é difícil quantificar o que constitui uma melhoria nos bots de IA generativos. Existem algumas vantagens técnicas claras, no entanto. O Gemini 2.5 Pro vem com uma janela de contexto de 1 milhão de token, o que é comum para os grandes modelos de Gêmeos, mas é enorme em comparação com modelos concorrentes como o OpenAI GPT ou o Anthropic Claude. Você pode alimentar vários livros muito longos ao Gemini 2.5 Pro em um único prompt e a saída maximiza 64.000 tokens. É o mesmo que Flash 2.0, mas ainda é objetivamente muitos tokens em comparação com outros LLMs.

Naturalmente, o Google executou o Gemini 2.5 Experimental através de uma bateria de benchmarks, na qual pontua um pouco mais do que outros sistemas de IA. Por exemplo, ele risca o O3-mini do Openai em GPQA e Aime 2025, que medem o quão bem a IA responde a perguntas complexas sobre ciência e matemática, respectivamente. Ele também estabeleceu um novo recorde no último referência do exame da humanidade, que consiste em 3.000 perguntas com curadoria de especialistas em domínio. A nova IA do Google conseguiu uma pontuação de 18,8 % nos 14 % da OpenAI.

Fonte

Artigos Relacionados

Botão Voltar ao Topo