SODP logo

    Guia definitivo para SEO em busca por voz [Edição para Editores]

    Houve um tempo em que dar comandos ou fazer perguntas a uma máquina e receber uma resposta era algo saído de um futuro de ficção científica. Bem, para mais de 110 milhões de pessoas…
    Atualizado em: 1 de dezembro de 2025
    Carlos Alonso

    Criado por

    Carlos Alonso

    Vahe Arabian

    Verificado por

    Vahe Arabian

    Vahe Arabian

    Editado por

    Vahe Arabian

    Houve um tempo em que dar comandos ou fazer perguntas a uma máquina e receber uma resposta era algo saído de um futuro de ficção científica. Bem, por mais de 110 milhões de pessoas só nos EUA, esse é o presente que eles têm todos os dias. De acordo com a Gartner, 30% das buscas serão realizadas por voz em 2020. A voz é a interface padrão para mais de A Canalys prevê que haverá 200 milhões de alto-falantes inteligentes até o final de 2019Mas a maioria dos smartphones atuais também possui algum tipo de assistente digital instalado, que permite uma interface de voz. A empresa de pesquisa Juniper Research estima que Em 2023, haverá 8 bilhões de assistentes de voz digitais em usoA maioria estará em smartphones, mas TVs inteligentes, wearables, alto-falantes inteligentes e outros dispositivos da IoT também experimentarão um crescimento significativo em seu uso por meio de comandos de voz. O mercado de assistentes de voz digitais é dominado por quatro grandes empresas:
    • Assistente do Google. Este assistente digital vem instalado em todos os celulares Android como parte do aplicativo Google. Ele usa a busca do Google para responder às suas perguntas. Outros serviços do Google, como o YouTube e o Google Maps, também estão intimamente ligados ao assistente. As empresas podem expandir as funcionalidades do assistente desenvolvendo Ações. Essas Ações podem ser usadas para interagir com dispositivos eletrônicos ("Ok Google, apague as luzes da sala") ou com qualquer outro serviço online ("Ok Google, mostre as principais notícias do meu site favorito hoje").
    • Amazon Alexa. A assistente digital da Amazon é mais conhecida por estar presente na linha de alto-falantes inteligentes Echo. Mas, na verdade, ela está disponível em mais de 20.000 dispositivos, incluindo não apenas alto-falantes inteligentes e wearables, mas também TVs e até carros. A Alexa também permite a criação de aplicativos de voz por meio das Alexa Skills. A Amazon oferece até mesmo a possibilidade de assinaturas premium para as Skills , para que os desenvolvedores possam monetizar seus trabalhos oferecendo mais opções de personalização ou conteúdo mais detalhado. A Alexa utiliza o Bing como mecanismo de busca.
    • Siri da Apple. O que começou em 2011 como um aplicativo para iOS, voltado para o iPhone, agora é um assistente de voz digital completo, integrado a todos os produtos da Apple, incluindo sua linha de smart TVs, alto-falantes e wearables. A Apple oferece o SiriKit para permitir que empresas expandam seus aplicativos e possibilitem a interação por voz através da Siri. O mecanismo de busca padrão usado pela Siri é o Google, embora possa ser configurado para usar um mecanismo de busca diferente, como o DuckDuckGo ou o Bing.
    • Microsoft Cortana. A assistente digital da Microsoft está disponível nativamente no Windows e como aplicativo independente em dispositivos Android e iOS. A Cortana parece estar ficando para trás em termos de adoção em comparação com outras assistentes digitais, e a estratégia da Microsoft parece ser a de integrá-la a outras assistentes digitais, em vez de competir com elas . A Microsoft também permite o desenvolvimento de Skills de terceiros para a Cortana, mas apenas para o mercado americano por enquanto. Dada essa mudança de estratégia, não está claro se as Skills da Cortana se tornarão mais amplamente disponíveis. A Cortana usa o Bing como mecanismo de busca.  

    A busca por voz não é apenas para dispositivos móveis, faz parte do nosso dia a dia

    Os estágios iniciais da busca por voz foram impulsionados pela crescente adoção de telefones celulares. O Google Now, a versão anterior do Assistente, foi lançado em 2012, e a Siri ainda antes, em 2011. Isso mudou com a introdução da Alexa em 2014. A assistente digital passou a residir em um dispositivo projetado para nunca sair de casa. Os assistentes digitais estão agora integrados em uma ampla gama de dispositivos, de telefones a relógios, de TVs a carros. As pessoas podem interagir com eles em uma variedade maior de situações. Mas a forma como interagimos com o assistente é, obviamente, radicalmente diferente da interface de texto usual dos mecanismos de busca.

    Como a pesquisa por voz difere da pesquisa por texto

    • Consultas mais complexas e longas. O reconhecimento de voz evoluiu muito nos últimos anos e agora permite consultas mais complexas do que há alguns anos. Isso leva o usuário a empregar uma linguagem mais natural para suas consultas e comandos.
    • Mais perguntas. De acordo com uma pesquisa da seoClarity , mais de 15% das buscas por voz começam com como, o quê, onde, quando, por quê e quem. Isso se deve à interface diferente em comparação com um mecanismo de busca baseado em texto.
    • Respostas curtas e concisas. Mesmo que o usuário utilize consultas mais longas para expressar o que deseja que o assistente faça ou pesquise, as pessoas esperam respostas curtas e claras.
    • Ausência de hierarquia visual de informações. Estamos acostumados a usar e detectar pistas visuais para organizar o conteúdo e destacar os aspectos mais importantes da mensagem que queremos transmitir ao usuário. O conteúdo de uma landing page deve ser repensado para interfaces exclusivamente de voz, a fim de identificar o que destacar e como fazê-lo sem as pistas visuais que um navegador oferece.
    • O vencedor leva tudo. Ao usar um mecanismo de busca, você pode percorrer os resultados da pesquisa rapidamente e, embora raramente chegue à segunda página da SERP (página de resultados da pesquisa), pode muito bem clicar em um link abaixo dos três primeiros resultados. Em uma interface de voz, as pessoas não recebem uma página de resultados a partir da qual podem escolher para onde ir. O assistente digital retornará apenas um resultado.
    • Busca local. Considerando que entre 30 e 40% das buscas em dispositivos móveis são consultas locais, podemos esperar também que uma alta porcentagem de consultas em buscas por voz solicitem resultados locais.
    A principal diferença entre fazer pesquisa de palavras-chave para voz e para texto é que você usará palavras-chave em linguagem muito mais natural. A maneira como falamos é completamente diferente da maneira como digitamos. Usamos frases naturais em vez de uma sequência curta de palavras-chave. Para descobrir quais palavras-chave segmentar, precisamos usar uma ferramenta de pesquisa semântica de palavras-chave. Responda ao público é a ferramenta mais utilizada nesses casos. Insira sua palavra-chave inicial e você obterá uma lista de perguntas com essa palavra-chave. Os dados são apresentados inicialmente em um gráfico, que é bonito, mas não muito útil. Felizmente, você pode baixar os dados em um prático arquivo CSV.  Twinword's ferramenta de pesquisa de palavras-chave Também possui alguns filtros úteis para extrair ideias de palavras-chave. Você pode filtrar os resultados por intenção de busca e por padrões de palavras-chave, o que permite visualizar apenas as perguntas que incluem sua palavra-chave inicial. Você também pode observar o trecho "As pessoas também perguntam" na Busca do Google para descobrir mais oportunidades de palavras-chave. Se você possui uma central de atendimento telefônico, um chat ao vivo ou um chatbot, analise os dados dessas conversas para encontrar as perguntas mais frequentes.

    Consultas 'perto de mim'

    Como as buscas locais representam uma grande parcela das buscas por voz, você pode esperar muitas consultas terminando com a frase "perto de mim". Por exemplo: "qual o melhor restaurante de sushi perto de mim" ou "qual a melhor academia perto de mim". Como otimizar para isso? Empresas locais devem manter seus dados atualizados em diretórios como o Yelp, sites de avaliação como o TripAdvisor e serviços como o Kayak. Para editores, a resposta está nos dados estruturados.

    Otimize seu site para dispositivos móveis

    A maioria das otimizações que você deve fazer em seu site para garantir um bom desempenho em buscas móveis também beneficiará seu posicionamento em buscas por voz. Um dos fatores mais importantes é a velocidade do site. Seja por voz ou em um dispositivo móvel, as pessoas esperam resultados rápidos.

    Utilize AMP e dados estruturados

    Os dados estruturados são essenciais para ajudar o Google a entender e analisar melhor o seu conteúdo, permitindo que ele forneça ao seu público as respostas que ele procura. Você pode ajudar o Google a identificar pessoas, organizações, eventos, receitas, produtos e lugares.  AMP significa Accelerated Mobile Pages (Páginas Móveis Aceleradas). É um projeto de código aberto lançado pelo Google que restringe a funcionalidade das páginas da web para aumentar drasticamente sua velocidade. O AMP é frequentemente usado com dados estruturados, pois é isso que permite que as páginas AMP sejam exibidas em resultados avançados na página de resultados de pesquisa. Além disso, para os editores, exibir seu conteúdo por meio do formato AMP com dados estruturados é uma das.. Requisitos para criar uma ação para o Google Assistente. Existe um esquema de dados estruturados chamado “speakable” (falável)Atualmente em versão beta, essa funcionalidade identifica seções de um artigo adequadas para reprodução de texto por voz. O conteúdo marcado com esse esquema será identificado pelo Google Assistente como conteúdo que pode ser lido em um dispositivo compatível com o Google Assistente. O conteúdo é atribuído à fonte e o URL é enviado para o dispositivo móvel do usuário. Este esquema de dados estruturados está disponível apenas para usuários de língua inglesa nos EUA, por meio de editores que fazem parte do Google Notícias.

    Responda às perguntas dos usuários de forma concisa

    De acordo com uma pesquisa da BacklinkoO resultado típico de uma busca por voz tem apenas 29 palavras, mas a página de resultados de busca por voz contém 2.312 palavras. Isso não é contraditório. No primeiro caso, estamos falando do assistente digital respondendo a uma pergunta ou consulta específica. No segundo caso, a contagem de palavras se refere à fonte da resposta. Não está claro se o Google prioriza conteúdo extenso como um indicador de qualidade ou se simplesmente mais conteúdo significa maior probabilidade de uma página ser usada como resposta a uma consulta.  De qualquer forma, o que essas duas estatísticas combinadas nos mostram é que precisamos pensar na estrutura do nosso conteúdo para abordar as ideias principais e os pontos-chave em parágrafos curtos que possam ser captados por um assistente de voz.

    Escreva conteúdo que seja fácil de ler e entender

    Se você deseja que seu conteúdo seja usado em interações por voz, ele precisa ser fácil de ler e, principalmente, fácil de entender para seus leitores. Lembre-se de que os usuários não poderão usar recursos visuais ou elementos para entender melhor seu conteúdo, como títulos ou gráficos. Lembre-se de que a maioria das perguntas será feita usando linguagem natural, como se estivessem conversando. Tenha isso em mente ao desenvolver seu conteúdo e escreva de forma conversacional ao responder perguntas específicas.

    Busque uma classificação alta e trechos em destaque

    Este é um caso de correlação e não de causalidade. Mas há evidências, analisadas pela Backlinko em sua pesquisa sobre resultados de busca por voz no Google Assistente, de que mais de 75% dos resultados de busca por voz vêm das três primeiras posições na SERP (página de resultados do Google) e que 40% vieram de um snippet em destaque. Isso é mais uma prova de que o Google Assistente e outros assistentes de voz digitais priorizarão resultados de alta autoridade para garantir que a consulta do usuário seja atendida na primeira resposta. Como os trechos em destaque já são respostas curtas para perguntas específicas, faz sentido que o Assistente os utilize. Isso significa que seus esforços de otimização para a busca do Google também terão um impacto mensurável na forma como seu conteúdo é usado por um assistente de voz digital.

    Analise e responda à intenção do usuário

    Identifique a intenção do usuário para a qual você está fornecendo conteúdo. Três intenções principais podem ser atendidas por meio da busca por voz. A primeira é obter informações: o que é isso? como faço isso? A segunda é navegar: onde fica isso? E a terceira e última intenção é agir: reservar uma mesa em um restaurante, comprar um par de sapatos, obter uma lista de todos os shows que acontecerão neste fim de semana. A L'Oréal vem implementando Uma estratégia de conteúdo baseada em responder a perguntas do tipo "Como fazer"A pesquisa deles mostra que é isso que os usuários procuram ao usar consultas de pesquisa por voz.

    Construa sua confiança e autoridade

    Como vimos, a busca por voz é um jogo onde só um vence. Um assistente de voz digital não exibe uma lista de resultados, mas fornece diretamente uma resposta dentre os resultados da busca. Como só podem fornecer um resultado, faz sentido que tendam a priorizar resultados de domínios com alta autoridade, mesmo que não sejam o primeiro resultado para aquela consulta. 

    O SEO local é fundamental para a pesquisa por voz

    Um grande volume de buscas por voz se concentra em resultados locais. A otimização para SEO local não se resume a produzir conteúdo com palavras-chave locais, mas sim a manter uma presença ativa e atualizada em determinados serviços e diretórios. Por exemplo, empresas locais devem reivindicar seu cadastro em plataformas como Google Search Console e Google Drive Google Meu Negócio, Bing Places para Empresas e Apple Maps ConnectDessa forma, você teria um maior controle sobre as informações coletadas pelo Google Assistente, Alexa, Cortana e Siri, que também utilizam dados e avaliações do Yelp. Editores (e empresas locais também) podem implementar dados estruturados para destacar elementos locais em seu conteúdo, da mesma forma que o Yelp e o Ticketmaster fazem com suas avaliações e eventos. Crie ações do Google ou skills da Alexa para permitir que os usuários interajam com seu conteúdo Todos os principais assistentes de voz digitais permitem a criação de aplicativos de voz que possibilitam aos usuários interagir com seu conteúdo por meio desses assistentes. O Google vai um pouco além e Cria automaticamente ações para o seu conteúdo Com base nos dados estruturados do seu site, o proprietário do site, conforme especificado nos dados do Google Search Console, receberá um e-mail. Em seguida, você poderá reivindicar a ação ou desativá-la. Por exemplo, o Google criará uma Ação para podcasts com base em seu feed RSS, que permitirá aos usuários encontrar e reproduzir episódios em seus dispositivos por meio do Assistente. Guias práticos, perguntas frequentes e receitas também usam marcação de dados estruturados para gerar Ações automaticamente. Para editores de notícias, é necessário já estar incluído no Google Notícias e usar AMP e dados estruturados em seus artigos para ser elegível para gerar uma ação automaticamente. As editoras já começaram a desenvolver parcerias com o Google para criar Ações especializadas. A Vogue lançou um recurso em 2017 em que os usuários podiam Interaja com a publicação no Google Home Para obter mais informações sobre determinadas histórias, contadas pelos próprios autores. Outras editoras, como Bloomberg ou O Washington Post, Desenvolvemos Skills para Alexa que permitem aos usuários ouvir resumos diários das notícias mais importantes do dia. O Daily Mail foi um passo além, como Eles disponibilizaram toda a edição diária na AlexaEnquanto outras editoras gravam o áudio elas mesmas, neste caso, o Daily Mail utiliza os recursos de conversão de texto em fala da Alexa. Outra diferença é que, neste caso, o Daily Mail disponibiliza esse recurso apenas para seus assinantes. A resposta curta é não. Pelo menos não ainda. Mesmo que o Google tenha dito o contrário pelo menos desde 2016 Embora desejem incluir a análise de pesquisa por voz no Google Search Console, o fato é que, até o momento, não há como analisar consultas e resultados de pesquisa por voz. Existem alguns desafios que impedem o Google e outros fornecedores de análises de disponibilizar esse recurso:
    • A primeira questão é que as consultas em linguagem natural tendem a ser mais longas do que as consultas baseadas em palavras-chave. Além disso, as pessoas formulam essencialmente a mesma consulta usando palavras ou construções de frases diferentes. Isso significa que a mesma consulta terá muitas variações de baixo volume, o que dificulta a análise e a extração de informações relevantes.
    • O segundo desafio é que as consultas de busca por voz são frequentemente encadeadas, como em uma conversa. Por exemplo, você pode perguntar a um assistente de voz digital: “Quem é Stephen Curry?”. O assistente retornará um resumo das conquistas do astro da NBA. Você pode perguntar “Qual a altura dele?”, e o assistente saberá que você está se referindo a Stephen Curry. O problema se complica ainda mais quando percebemos que ambas as perguntas podem ser respondidas pelo assistente usando duas fontes de conteúdo diferentes.
    Qualquer funcionalidade de análise de pesquisa por voz precisa levar em consideração tanto os desafios quanto: 
    1. Fornecer uma maneira de agrupar consultas semelhantes, ao mesmo tempo que se dá aos analistas a liberdade de explorar quais são essas variações, para melhor compreender a linguagem do usuário.
    2. Exibir árvores de conversação para entender como os usuários navegam pelas informações, quais consultas os mantêm em nosso conteúdo e quais resultam em respostas com conteúdo de outros sites.
    Editores que desejam entender como a busca por voz está impactando sua presença online podem começar analisando as consultas que levam as pessoas ao seu site e procurar por consultas mais longas e conversacionais, bem como consultas formuladas como perguntas. Você também pode realizar testes com diferentes assistentes de voz digitais para verificar quais fontes eles usam para suas respostas (os assistentes de voz começam suas respostas com "de acordo com..."), e como isso se correlaciona com os resultados de pesquisa do Google. 

    A busca por voz já é o nosso presente

    A mudança nos hábitos de consumo e o papel cada vez maior que os dispositivos inteligentes e assistentes digitais desempenham em nosso dia a dia significam que a busca por voz não é algo do futuro, mas sim uma realidade que precisamos enfrentar. As editoras precisam levar em consideração a mudança na interface, que passa de referências textuais e visuais para uma abordagem exclusivamente por voz. Essa mudança altera a forma como as pessoas acessam e consomem nosso conteúdo. A falta de análises confiáveis ​​para entender o desempenho da busca por voz dificulta o alcance desse objetivo. Mas, como em qualquer outra faceta da busca, tudo se resume a construir a confiança do seu público por meio de conteúdo de alta qualidade e com autoridade.