Ciência e tecnologia

Gemini 2.5 Pro vence outros AIS em matemática, ciências e raciocínio

Googleé novo Gemini Pro é mais inteligente que outro AIS no raciocínio, ciência e codificação.

Isso está de acordo com uma série de resultados de referência publicados pelo Google na quinta -feira. Em suma, a Gemini 2.5 Pro vence os principais concorrentes em quase tudo – embora tenhamos certeza de que as empresas por trás desses concorrentes discordariam.

De acordo com os dados do Google, o Gemini 2.5 Pro tem uma liderança saudável sobre Openai O3Assim, Trabalho próximo 4Assim, Grok 3 betae Deepseek R1no último referência da humanidade, que avalia a matemática, a ciência, o conhecimento e o raciocínio de um modelo. Também é melhor na edição de código (de acordo com a referência de poliglota de periane) e vence todos os concorrentes em vários benchmarks de factualidade, incluindo o aterramento de fatos, o que significa que é menos provável que forneça texto factualmente impreciso.

Velocidade de luz mashable

A única referência em que o Gemini 2.5 Pro não é um vencedor claro é o Aime 2025, focado em matemática, e mesmo lá as diferenças entre os resultados são bem pequenas.

Como resultado de todas as melhorias no Gemini 2.5 Pro, este modelo está agora no topo do RABELA DE LIGADOR DE LMARENA com uma pontuação de 1470.

Há um problema: a versão final do Gemini 2.5 Pro ainda não está disponível. O Google chama esta versão mais recente de “pré -visualização atualizada”, com uma versão estável chegando “em algumas semanas”. A visualização agora deve estar disponível no aplicativo Gemini.



Fonte

Artigos Relacionados

Botão Voltar ao Topo