Ciência e tecnologia

O recurso de voz de Chatgpt faz com que pareça mais humano do que nunca

Depois de anos lidando com assistentes de voz que constantemente me suaviam ou me interrompem no meio da frase, eu não esperava muito quando tocei o pequeno ícone do comprimento de onda para tentar o modo de voz do Chatgpt. Achei que seria outro recurso que parecia legal, mas caiu em uso real. Mas este me surpreendeu. O modo de voz não cuspiu apenas respostas. Na verdade, parece uma conversa real.

Ele pega pausas, pensamentos murmurados e até mesmo aquelas palavras de preenchimento como “uhhh” sem quebrar o fluxo. Quer eu esteja dirigindo, cozinhando ou apenas tentando multitarefa, posso falar naturalmente e obter respostas úteis sem pegar meu telefone. Não é apenas mais rápido do que digitar-parece mais fácil, mais intuitivo e muito mais eficiente. Se você ainda não deu uma chance, aqui está por que o modo de voz do ChatGPT pode se tornar sua maneira favorita de usar a IA.

Não perca: O que é chatgpt? Tudo o que você precisa saber sobre o chatbot da IA

Chatgptde Openai, não é o único Chatbot indo de mãos livres. Google’s Gêmeos ao vivo Oferece a mesma vibração “conversa sobre mim, e eu vou acompanhar”. Claude do Anthrópico tem uma versão beta de seu modo de voz em seus aplicativos móveis, completa com pontos de bala na tela enquanto ele fala, e Perplexidade O assistente do iOS e o Android também responde a perguntas faladas e inicia aplicativos como OpenTable ou Uber on Command.

Mas mesmo com todo mundo correndo para dominar a conversa em tempo real da IA, o Chatgpt continua sendo o meu objetivo. Seja qual for o seu chatbot de escolha, faça uma pausa na digitação e experimente a opção de voz. É muito mais útil do que você pensa.

(Divulgação: Ziff Davis, empresa controladora da CNET, em abril entrou com uma ação contra o Openai, alegando que ele violou a Ziff Davis Copyrights em treinamento e operação de seus sistemas de IA.)

Assista isto: Recurso viral do ChatGPT: transformar as pessoas em figuras de ação

O que exatamente é o modo de voz?

O bate-papo por voz (ou “conversas de voz”) é o modo de chatgpt que permite falar com o modelo de IA e ouvir ele voltar para você, não é necessário digitar. Há um ícone de voz que você encontrará no aplicativo móvel, desktop e web no fundo direito de qualquer conversa em que estiver. Se você pressionar o botão, poderá dizer que sua pergunta em voz alta e o ChatGPT o transcrevem, raciocinará e responderá. Assim que terminar de falar, começa a ouvir novamente, criando um diálogo natural e para trás.

Lembre -se: O modo de voz é executado no mesmo modelo de linguagem grande que o ChatGPT regular, para que ainda possa alucinar ou errar os fatos. Você sempre deve verificar novamente qualquer coisa importante.

O OpenAI oferece duas versões dessas conversas de voz: Voz padrão (a opção padrão e leve de graça) e Voz avançada (disponível apenas para usuários pagos).

A voz padrão converte primeiro seu discurso em texto e o processa com GPT-4O (e GPT-4O Mini), demorando um pouco mais para responder a você. A voz avançada, por outro lado, usa modelos nativamente multimodais, o que significa que “ouve” você e gera áudio, então a conversa é mais natural e feita em tempo real. Ele pode capturar sugestões que não sejam as próprias palavras, como a velocidade que você está falando ou a emoção em sua voz e se ajustar a isso.

Observação: Usuários gratuitos podem acessar uma visualização diária da voz avançada.

Modo de voz chatgpt em um telefone

Awe

Nelson Aguilar/CNET

7 motivos pelos quais você deve começar a usar o recurso de modo de voz do ChatGPT

1. É genuinamente conversacional
Ao contrário da digitação, quando falo com o ChatGPT, não estou procurando a palavra certa ou o backspacing após cada erro de digitação. Estou apenas falando, como faria com qualquer amigo ou membro da família, cheio de “ummmmms” e “curtidas” e outros quebras desajeitadas. O modo de voz rola com todos os meus pensamentos semi-acabado e responde com uma resposta totalmente desenvolvida ou uma pergunta para me ajudar a aprimorar o que eu preciso. Essa oferta sem esforço é muito mais natural do que digitar.

2. Você pode usar o chatgpt de mãos livres
Obviamente, ainda preciso abrir o aplicativo ChatGPT e tocar no botão Modo de voz para iniciar, mas quando começo, não preciso mais usar minhas mãos para continuar uma conversa com o AI Chatbot. Eu posso ficar preso no trânsito e debater umas férias que quero tirar ainda este ano. Posso perguntar sobre voos, hotéis, pontos de referência, restaurantes e qualquer outra coisa, sem tocar meu telefone, e essa conversa é salva no aplicativo, para que não precise me lembrar de tudo o que o ChatGpt me diz.

3. É bom para aprender um novo idioma com tradução em tempo real
Mencionei anteriormente que uso o modo de voz para praticar idiomas, em que o modo de voz se destaca. Eu posso falar em inglês e fazer com que o ChatGPT responda em polimento impecável, completo com dicas de pronúncia. Basta perguntar ao modo de voz: “Você pode me ajudar a praticar meu (idioma)” e ele responderá com algumas maneiras de ajudá -lo, como iniciantes, vocabulário básico ou números. E lembra -se de onde você parou, para que você possa, de certa forma, fazer lições; Nenhum duolingo precisava.

4. Obtenha respostas sobre as coisas que você vê no mundo real
Esse recurso é exclusivo da Voz Advanced, mas esse é provavelmente o meu recurso favorito no modo de voz. Graças às suas superpotências multimodais, posso ligar a câmera do meu telefone ou tirar um vídeo/foto e pedir chatgpt para me ajudar. Por exemplo, tive problemas para reconhecer uma pintura que encontrei em um brechó, e o proprietário não tinha idéia de onde veio. Eu puxei o bate -papo por voz, liguei minha câmera e perguntei ao modo de voz de onde era a pintura. Em segundos, poderia me dizer o título da pintura, o nome do artista e quando foi pintado.

5. É uma opção melhor para pessoas com determinadas deficiências
Para qualquer pessoa com baixa visão ou dislexia, conversando com certeza batidas digitando. O modo de voz pode transcrever seu discurso e, em seguida, ler sua resposta em voz alta em qualquer ritmo que você escolher (você pode ajustar isso em suas configurações ou pedir que o Chatgpt para desacelerar). A opção de mãos livres também ajuda qualquer pessoa com desafios de habilidades a motor, porque tudo o que você precisa fazer é um tapp para iniciar e outro para parar, sem digitar extenso em um teclado.

6. Brainstorming mais rápido
Às vezes, recebo uma explosão de idéias e penso mais rápido do que posso digitar, então o modo de voz do Chatgpt é perfeito para idéias de histórias de cuspir, descobrir um novo layout para minha sala de estar ou decidir refeições interessantes para cozinhar para a semana. Como estou pensando em voz alta, em vez de olhar para o meu telefone, minhas idéias fluem muito mais fáceis e rápidas, especialmente com os acompanhamentos instantâneos do ChatGPT. Ajuda a manter o momento rolando até que eu tenha uma ideia polida para o que estou pensando.

7. Resumos instantâneos que você pode ouvir
Solte um PDF de 90 páginas no bate-papo, como para um script ou livro de filmes, peça um resumo e peça à IA em voz alta enquanto dobra a roupa. É como transformar qualquer documento (eu até faço páginas da Wikipedia) em um podcast – sob demanda.

O modo de voz não é apenas um truque interessante; É uma maneira rápida e mais natural de usar o ChatGPT. Esteja você traduzindo placas de rua, debatendo uma idéia ou acompanhando as notícias em voz alta, conversar com o ChatGpt parece menos como usar um chatbot e mais como ter uma conversa com um especialista em tamanho morto. Depois de se acostumar a pensar em voz alta, você pode nunca mais voltar ao teclado.



Fonte

Artigos Relacionados

Deixe um comentário

O seu endereço de email não será publicado. Campos obrigatórios marcados com *

Botão Voltar ao Topo