Um ano após o avanço do ChatGPT, o Google está ingressando na corrida. No Mobile World Congress, em Barcelona, o Google revelou o Gemini Live, um desenvolvimento para transformar smartphones em assistentes pessoais interativos capazes de ver e entender o mundo ao seu redor em tempo real.
Cerca de um ano atrás, o Google introduziu o Project Astra, uma demonstração de IA capaz de processar vídeo ao vivo e responder perguntas em tempo real. Agora, essa tecnologia está se tornando realidade com a Gemini Live, que estará disponível para usuários do Android até o final de março.
Até agora, Gemini poderia processar texto, imagens e vários tipos de documentos. Com o Gemini Live, ele ganhou uma nova habilidade: processamento de vídeo ao vivo e compartilhamento de tela.
Simplificando, os usuários poderão abrir a câmera do telefone, mostrar algo para o Gemini Live e receber respostas em tempo real e informações relevantes. Além disso, os usuários podem compartilhar suas telas e solicitar assistência com várias tarefas, como compras on -line ou solução de problemas técnicos.
Em um vídeo de demonstração, um usuário examinou o telefone em torno de uma sala. A Gemini Live forneceu informações sobre diferentes objetos, como um trecho de código de computador, alto -falantes e um diagrama de rede. A IA até lembrou onde o usuário havia colocado seus óculos no início do vídeo.
Os recursos de processamento de vídeo da Gemini Live serão lançados no aplicativo Gemini para Android no final de março, mas o acesso será restrito a assinantes do Plano Premium de IA, que custa US $ 20 por mês. Esta assinatura concede acesso aos modelos de IA mais avançados do Google.
O processamento de vídeo ao vivo é uma tarefa computacionalmente intensiva, exigindo significativamente mais recursos do que o processamento de texto ou imagem. O Google reconhece que a execução do Gemini Live exigirá maior poder de processamento, o que pode resultar em perdas financeiras substanciais nos estágios iniciais.
No entanto, a empresa acredita que essa inovação impulsionará uma maior adoção de Gêmeos e ajudará a competir com o OpenAI e outros líderes da indústria de IA.
Competindo com “Seeing Eye” de Chatgpt
Apesar da forte presença do Google no mercado móvel, a adoção de Gemini permanece significativamente menor que as ferramentas de AI da OpenAI, que já estão oferecendo a característica “Seeing Eye” do ChatGPT há cerca de um ano. O Google espera que o Gemini Live feche a lacuna e estabeleça sua IA como um sério candidato na corrida para o futuro da inteligência artificial.