Google libera ‘mais inteligente’ experimental gemini 2.5 pro – veja como experimentá -lo

Momentos depois que a Deepseek lançou seu mais recente modelo, outro gigante da IA já roubou alguns dos holofotes.
Na terça -feira, Google anunciado Gemini 2.5, seu modelo “mais inteligente”. A empresa anunciou que esse lançamento inicial é uma “versão experimental do 2.5 Pro, que é de última geração em uma ampla gama de benchmarks e estréia em primeiro lugar na Lmarena por uma margem significativa”.
Além disso: tentei a nova atualização avançada de modo de voz do ChatGPT – eis o que mudou
Uma família de modelos de pensamento, o que significa que eles argumentam através de suas respostas, o lançamento segue o Thinking Flash de Gemini 2.0 do Google, que chegou em dezembro.
Mais notavelmente, o Gemini 2.5 Propulário superou o Open Mini e o Antropic Claude 3,7 sonetos no último exame da humanidade (HLE), uma referência recentemente criada para combater a saturação ou o problema dos testes da indústria se tornando fácil demais para evolução de modelos em rápida evolução. O HLE é, portanto, um teste relativamente mais difícil para ter um bom desempenho; Gemini 2,5 obteve 18,8% em comparação com 14% do O3 Mini (avaliado usando apenas problemas de texto, sem imagens) e Claude 3,7 8,9%.
Já no topo do Chatbot Arena Tabela de classificação, o novo modelo também superou os concorrentes em benchmarks comuns para ciências, matemática e codificação, embora geralmente por uma margem menor, que agora se espera, dada a taxa na qual novos modelos estão acelerando. O Google relatou que a Gemini 2.5 Pro Experimental mostra melhorias nos recursos de raciocínio, multimodal e agêntico, mesmo de um “prompt de linha única”.
Google disse que a Gemini 2.5 Pro está disponível hoje com uma janela de contexto de um milhão de token para usuários avançados de Gemini Google para estudar e o Aplicativo Geminie estará “chegando a Vértice ai em breve. “A empresa acrescentou que divulgará informações de preços nas próximas semanas.
Quer mais histórias sobre a IA? Inscreva -se para a inovaçãonossa newsletter semanal.