Google anunciou na quarta -feira Gemma 3a próxima iteração na família Gemma de modelos de peso aberto. É um sucessor do modelo Gemma 2 lançado no ano passado.
O modelo pequeno vem em uma variedade de tamanhos de parâmetros – 1b, 4b, 12b e 27b. O modelo também suporta uma janela de contexto mais longa de 128 mil tokens. Ele pode analisar vídeos, imagens e texto, suporta 35 idiomas prontos para uso e fornece suporte pré-treinado para 140 idiomas.
Na Arena de Chatbot, Gemma 3 27b superou o Deepseek-V3, o O3-Mini do Openai e o modelo Llama 3-405B da Meta. Os modelos na arena do chatbot são avaliados entre si através de avaliações lado a lado dos seres humanos.
Além disso, Gemma 3 27b marcou 67,5% e 42,4 em Benchmarks padrão Como MMLU-Pro, GPQA Diamond, respectivamente. O modelo tem um bom desempenho em comparação com outros pequenos modelos na competição.
Claude 3,5 Haiku obteve 63% no benchmark MMLU-Pro e 41% no diamante GPQA, enquanto o Mini GPT-4O do OpenAI alcançou 65% e 43% nos mesmos testes, respectivamente. O LLAMA 3,3 da Meta, 70b, superou os dois, com 71% no MMLU-PRO e 50% no diamante GPQA, tornando-o o candidato mais forte entre esses modelos.
No entanto, a principal superpotência da Gemma-3 parece ser um uso eficiente de computação. O Google disse que a Gemma 327B alcançou as pontuações com uma única GPU da NVIDIA H100, enquanto outros modelos exigiam até 32 GPUs.
Fonte: Google
A empresa também revelou que a arquitetura do modelo foi modificada para reduzir a memória do cache KV, o que tende a aumentar com um contexto mais longo.
Google tem publicou um relatório técnico detalhado descrevendo as técnicas usadas para construir o modelo, seu desempenho e outras especificações. Gemma 3 pode ser acessado através de vários métodos. O Google está oferecendo o modelo na web usando o Google para estudaratravés do chatbot padrão ou da API, e também está disponível no Google Genai SDK.
Além disso, o modelo pode ser baixado para implantação local em Abraçando o rostoAssim, Ollamae Kaggle.
Juntamente com a Gemma 3, o Google também lançou o Shieldgemma 2, um verificador de segurança de imagem de parâmetro 4B construído na fundação da Gemma 3. Isso fornece rótulos de segurança para imagens nocivas que envolvem conteúdo perigoso, sexualmente explícito e violento.