Hubo una época en la que dar órdenes o hacer preguntas a una máquina y recibir una respuesta era algo propio de un futuro de ciencia ficción. Bueno, para más de 110 millones de personas solo en EE. UUEse es su presente cotidiano. Según Gartner, 3El 0% de las búsquedas se realizarán mediante voz en 2020.
La voz es la interfaz predeterminada para más de Canalys predice que habrá 200 millones de altavoces inteligentes a finales de 2019Pero la mayoría de los teléfonos inteligentes actuales también incorporan algún tipo de asistente digital que permite una interfaz de voz. La empresa de investigación Juniper Research estima que Para 2023 habrá 8 mil millones de asistentes de voz digitales en usoLa mayoría de ellos estarán en teléfonos inteligentes, pero los televisores inteligentes, los wearables, los altavoces inteligentes y otros dispositivos IoT también experimentarán un crecimiento significativo en su uso a través de comandos de voz.
El mercado de los asistentes de voz digitales está dominado por cuatro grandes actores:
Palabras gemelas herramienta de investigación de palabras clave También incluye filtros útiles para extraer ideas de palabras clave. Puedes filtrar los resultados por intención de búsqueda y por patrones de palabras clave, lo que te permitirá ver solo las preguntas que incluyan tu palabra clave inicial.
También puede tomar nota del fragmento "La gente también pregunta" en la Búsqueda de Google para descubrir más oportunidades de palabras clave.
Si tiene un centro de llamadas o una función de chat en vivo o chatbot, extraiga los datos de esas conversaciones para encontrar las preguntas más frecuentes.
Dado que las consultas locales representan una gran parte de la búsqueda por voz, puede esperar que muchas consultas terminen con la frase "cerca de mí". Como en: "cuál es el mejor sushi cerca de mí" o "cuál es el mejor gimnasio cerca de mí". ¿Cómo optimizar para eso? Las empresas locales deben tener sus datos actualizados en directorios como Yelp, sitios de reseñas como Tripadvisor y servicios como Kayak. Para los editores, los datos estructurados son la respuesta.
Crea Google Actions o Alexa Skills para permitir que los usuarios interactúen con tu contenido
Todos los principales asistentes de voz digitales permiten la creación de aplicaciones de voz para permitir a los usuarios interactuar con su contenido a través de los asistentes.
Google va un poco más allá y Crea automáticamente acciones para tu contenido Basado en los datos estructurados de tu sitio web. Cuando esto ocurra, el propietario de tu sitio, según lo especificado en los datos de Google Search Console, recibirá un correo electrónico. Luego, podrás reclamar tu acción o inhabilitarla.
Por ejemplo, Google creará una acción para podcasts basada en su fuente RSS que permitirá a los usuarios buscar y reproducir episodios en sus dispositivos a través del Asistente. Las guías prácticas, las preguntas frecuentes y las recetas también utilizan marcado de datos estructurados para generar acciones automáticamente.
Para los editores de noticias, ya deben estar incluidos en Google News y utilizar AMP y datos estructurados en sus artículos para poder generar automáticamente una acción.
Los editores ya han comenzado a desarrollar colaboraciones con Google para desarrollar acciones especializadas. Vogue lanzó una función en 2017 donde los usuarios podían interactuar con la publicación en Google Home para obtener más información sobre ciertas historias, contadas por los propios escritores.
Otros editores, como Bloomberg o El Washington Post, Han desarrollado Alexa Skills que permiten a los usuarios escuchar resúmenes diarios de las noticias más importantes del día.
El Daily Mail fue un paso más allá, al afirmar: Ponen toda su edición diaria en AlexaMientras que otros editores graban el audio ellos mismos, en este caso, el Daily Mail utiliza las funciones automatizadas de conversión de texto a voz de Alexa. Otra diferencia es que, en este caso, el Daily Mail solo ofrece esta función a sus suscriptores actuales.
El mercado de los asistentes de voz digitales está dominado por cuatro grandes actores:
- Asistente de Google. Este asistente digital viene instalado en todos los teléfonos Android como parte de la aplicación de Google. Por supuesto, utiliza la búsqueda de Google para responder a tus consultas. Otras propiedades de Google, como YouTube o Google Maps, también están estrechamente vinculadas al asistente. Las empresas pueden ampliar las capacidades del Asistente desarrollando Acciones. Estas Acciones se pueden utilizar para interactuar con hardware (“Hola Google, apaga las luces de la sala”) o con cualquier otro servicio en línea (“Hola Google, dame los titulares de hoy de mi sitio web favorito”).
- AmazonAlexa. El asistente digital de Amazon está disponible principalmente en la línea de parlantes inteligentes de Amazon, Echo. Pero, de hecho, está disponible en más de 20.000 dispositivos, incluidos no solo parlantes o dispositivos portátiles inteligentes, sino también televisores e incluso automóviles. Alexa también permite la creación de aplicaciones de voz a través de Alexa Skills. Amazon incluso permite la posibilidad de suscripciones premium para Skills , para que los editores puedan monetizar sus esfuerzos ofreciendo más opciones de personalización o una cobertura más detallada. Alexa utiliza Bing como motor de búsqueda.
- Siri de manzana. Lo que comenzó en 2011 como una aplicación iOS para iPhone es ahora un asistente de voz digital completo integrado en todos los productos Apple, incluida su línea de televisores inteligentes, parlantes y dispositivos portátiles. Apple ofrece SiriKit para permitir a las empresas ampliar sus aplicaciones y permitir la interacción de voz a través de Siri. El motor de búsqueda predeterminado que utiliza Siri es Google, aunque se puede configurar para utilizar un motor de búsqueda diferente, como Duck Duck Go o Bing.
- Microsoft Cortana. El asistente digital de Microsoft está disponible de forma nativa en Windows y en dispositivos Android e iOS como una aplicación independiente. Cortana parece haberse quedado rezagada en adopción frente a otros asistentes digitales, y la estrategia de Microsoft parece ser integrar Cortana con otros asistentes digitales, en lugar de competir con ellos . Microsoft también permite el desarrollo de Skills de terceros para Cortana, pero por ahora sólo para el mercado estadounidense. Dado su cambio de estrategia, no está claro si Cortana Skills estaría más disponible. Cortana utiliza Bing como motor de búsqueda.
La búsqueda por voz no es sólo para dispositivos móviles, es para nuestra vida diaria
Las primeras etapas de la búsqueda por voz fueron impulsadas por la adopción cada vez mayor de los teléfonos móviles. Google Now, la encarnación anterior del Asistente, se lanzó en 2012 y Siri se lanzó incluso antes, en 2011. Esto cambió con la introducción de Alexa en 2014. El asistente digital ahora vivía en una pieza de hardware diseñada para nunca salir de casa. Los asistentes digitales ahora están integrados en una amplia gama de dispositivos, desde teléfonos hasta relojes, televisores y automóviles. Ahora las personas pueden interactuar con ellos en una gama más amplia de situaciones. Pero la forma en que interactuamos con el asistente es, por supuesto, radicalmente diferente de la interfaz de texto habitual de los motores de búsqueda.En qué se diferencia la búsqueda por voz de la búsqueda basada en texto
- Consultas más complejas y más largas. El reconocimiento de voz ha evolucionado mucho en los últimos años y ahora permite realizar consultas más complejas que hace unos años. Esto lleva al usuario a emplear un lenguaje más natural para sus consultas y comandos.
- Más preguntas. Según una investigación de seoClarity , más del 15% de las búsquedas por voz comienzan con cómo, qué, dónde, cuándo, por qué y quién. Esto se debe a la interfaz diferente en comparación con un motor de búsqueda basado en texto.
- Respuestas breves y concisas. Aunque el usuario puede utilizar consultas más largas para expresar lo que quiere que haga el asistente o que busque, la gente espera respuestas breves y claras.
- Sin jerarquía de información visual. Estamos acostumbrados a emplear y detectar señales visuales para organizar el contenido y resaltar los aspectos más importantes de lo que queremos transmitir al usuario. El contenido de una página de destino debe repensarse para que las interfaces solo de voz identifiquen qué resaltar y cómo hacerlo sin las señales visuales que permite un navegador.
- El ganador se lleva todo. Cuando utiliza un motor de búsqueda, puede hojear los resultados de la búsqueda y, aunque rara vez llegará a la segunda página del SERP, puede hacer clic en un enlace debajo de los primeros tres resultados principales. En una interfaz de voz, las personas no obtienen una página de resultados desde donde pueden elegir adónde ir. El asistente digital devolverá solo un resultado.
- Busqueda local. Teniendo en cuenta que entre el 30 y el 40% de las búsquedas móviles son consultas locales, también podemos esperar que un alto porcentaje de consultas en la búsqueda por voz soliciten resultados locales.
Investigación de palabras clave para búsqueda por voz
La principal diferencia al realizar una investigación de palabras clave para voz en lugar de texto es que utilizará palabras clave en lenguaje mucho más natural. La forma en que hablamos es completamente diferente a la forma en que escribimos. Usamos frases naturales en lugar de una breve serie de palabras clave. Para descubrir qué palabras clave utilizar, necesitamos utilizar una herramienta de investigación de palabras clave semánticas. Responder al público Es la herramienta más utilizada en estos casos. Introduce tu palabra clave inicial y obtendrás una lista de preguntas con esa palabra clave. Los datos se presentan primero en un gráfico, que es atractivo, pero no muy útil. Por suerte, puedes descargar los datos en un práctico archivo CSV.
Palabras gemelas herramienta de investigación de palabras clave También incluye filtros útiles para extraer ideas de palabras clave. Puedes filtrar los resultados por intención de búsqueda y por patrones de palabras clave, lo que te permitirá ver solo las preguntas que incluyan tu palabra clave inicial.
También puede tomar nota del fragmento "La gente también pregunta" en la Búsqueda de Google para descubrir más oportunidades de palabras clave.
Si tiene un centro de llamadas o una función de chat en vivo o chatbot, extraiga los datos de esas conversaciones para encontrar las preguntas más frecuentes.
Consultas 'cerca de mí'
Dado que las consultas locales representan una gran parte de la búsqueda por voz, puede esperar que muchas consultas terminen con la frase "cerca de mí". Como en: "cuál es el mejor sushi cerca de mí" o "cuál es el mejor gimnasio cerca de mí". ¿Cómo optimizar para eso? Las empresas locales deben tener sus datos actualizados en directorios como Yelp, sitios de reseñas como Tripadvisor y servicios como Kayak. Para los editores, los datos estructurados son la respuesta.
Cómo optimizar su contenido para la búsqueda por voz
Optimice su sitio para dispositivos móviles
La mayoría de las optimizaciones que debe realizar en su sitio para garantizar que funcione bien en la búsqueda móvil también serán beneficiosas para su clasificación en la búsqueda por voz. Uno de los factores más importantes es la velocidad del sitio. Ya sea que la interfaz sea de voz o de un dispositivo móvil, la gente espera resultados rápidos.Utilice AMP y datos estructurados
Los datos estructurados son clave para ayudar a Google a comprender y analizar mejor su contenido para poder brindarle mejor a su audiencia las respuestas que busca. Puedes ayudar a Google a identificar personas, organizaciones, eventos, recetas, productos y lugares. AMP significa páginas móviles aceleradas. Es un proyecto de código abierto lanzado por Google que restringe la funcionalidad de las páginas web para aumentar drásticamente su velocidad. AMP se utiliza a menudo con datos estructurados, ya que eso es lo que permite que las páginas AMP aparezcan en resultados enriquecidos en la página de resultados de búsqueda. Además, para los editores, mostrar su contenido a través del formato AMP con datos estructurados es una de las Requisitos para crear una acción para el Asistente de Google. Existe un esquema de datos estructurado llamado “hablable”, actualmente en fase beta, que identifica las secciones de un artículo aptas para la reproducción de texto a voz. El Asistente de Google identificará el contenido etiquetado con este esquema como contenido legible a través de un dispositivo compatible con el Asistente de Google. El contenido se atribuye a la fuente y la URL se envía al dispositivo móvil del usuario. Este esquema de datos estructurados solo está disponible para usuarios de habla inglesa en EE. UU., a través de editores que están en Google News.Responda las preguntas de los usuarios de forma concisa
Según una investigación de BacklinkoEl resultado típico de una búsqueda por voz tiene solo 29 palabras, pero el recuento de palabras de una página de resultados de búsqueda por voz es de 2312. Esto no es contradictorio. En el primer caso, se trata de que el asistente digital responde a una pregunta o consulta específica. En el segundo, el recuento de palabras se refiere a la fuente de la respuesta. No está claro si Google prioriza el contenido extenso como una marca de calidad o si simplemente un mayor contenido implica mayores probabilidades de que una página se utilice como respuesta a una consulta. De cualquier manera, lo que estas dos estadísticas combinadas nos dicen es que debemos pensar en la estructura de nuestro contenido para abordar las ideas principales y las conclusiones clave en párrafos cortos que un asistente de voz pueda captar.Escriba contenido que sea fácil de leer y comprender.
Si desea que su contenido se utilice en la interacción de voz, debe ser fácil de leer y, sobre todo, fácil de entender para sus lectores. Recuerde que los usuarios no podrán utilizar señales o elementos visuales para comprender mejor su contenido, como titulares o gráficos. Recuerde que la mayoría de consultas se realizarán utilizando el habla-lenguaje natural como si estuvieran manteniendo una conversación. Tenga esto en cuenta al desarrollar su contenido y escriba de manera conversacional al responder preguntas específicas.Apunte a una clasificación alta y fragmentos destacados
Este es un caso de correlación y no de causalidad. Pero hay evidencia, como lo analizó Backlinko en su investigación de resultados de voz en Google Assistant, de que más del 75% de los resultados de búsqueda por voz provienen de las tres primeras posiciones en el SERP, y que el 40% proviene de un fragmento destacado. Esta es solo una prueba más de que el Asistente de Google y otros asistentes de voz digitales favorecerán resultados altamente autorizados para garantizar que satisfagan la consulta del usuario en su primera respuesta. Como los fragmentos destacados ya son respuestas breves a preguntas específicas, tiene sentido que el Asistente los utilice. Esto significa que sus esfuerzos de optimización para la búsqueda de Google también tendrán un impacto mensurable en cómo un asistente de voz digital utiliza su contenido.Analizar y responder a la intención del usuario.
Identifique cuál es la intención del usuario para la que proporciona contenido. Se pueden responder tres intenciones principales del usuario mediante la búsqueda por voz. Lo primero es obtener información: ¿qué es esto? ¿Cómo hago esto?. El segundo es navegar: ¿dónde está esto?. Y la tercera y última intención es actuar: reservar una mesa en un restaurante, comprarse un par de zapatos, obtener una lista de todos los conciertos de música que tendrán lugar este fin de semana. L'Oréal ha estado implementando una estrategia de contenido basada en responder preguntas de “Cómo”Su investigación muestra que eso es lo que buscan sus usuarios cuando utilizan consultas de búsqueda por voz.Construya su confianza y autoridad
Como vimos, la búsqueda por voz es un juego en el que el ganador se lo lleva todo. Un asistente de voz digital no mostrará una lista de resultados, sino que proporcionará directamente una respuesta a partir de esos resultados de búsqueda. Como solo pueden proporcionar un resultado, tiene sentido que tiendan a favorecer los resultados de dominios con alta autoridad, aunque no sean el resultado principal para esa consulta.El SEO local es clave para la búsqueda por voz
Un gran volumen de consultas de búsqueda por voz se dirige a resultados locales. Optimizar las consultas SEO locales no se trata tanto de generar contenido con palabras clave locales como de mantener una presencia sólida y actualizada en ciertos servicios y directorios. Por ejemplo, las empresas locales deberían reclamar su presencia en Google Mi Negocio, Bing Places para empresas y Conexión de Apple MapsDe esta forma, podrás tener un mayor control sobre la información obtenida por Google Assistant, Alexa, Cortana y Siri, que también utiliza datos y reseñas de Yelp. Los editores (y las empresas locales también) pueden implementar datos estructurados para resaltar elementos locales en su contenido, tal como lo hacen Yelp y Ticketmaster con sus reseñas y eventos.
Crea Google Actions o Alexa Skills para permitir que los usuarios interactúen con tu contenido
Todos los principales asistentes de voz digitales permiten la creación de aplicaciones de voz para permitir a los usuarios interactuar con su contenido a través de los asistentes.
Google va un poco más allá y Crea automáticamente acciones para tu contenido Basado en los datos estructurados de tu sitio web. Cuando esto ocurra, el propietario de tu sitio, según lo especificado en los datos de Google Search Console, recibirá un correo electrónico. Luego, podrás reclamar tu acción o inhabilitarla.
Por ejemplo, Google creará una acción para podcasts basada en su fuente RSS que permitirá a los usuarios buscar y reproducir episodios en sus dispositivos a través del Asistente. Las guías prácticas, las preguntas frecuentes y las recetas también utilizan marcado de datos estructurados para generar acciones automáticamente.
Para los editores de noticias, ya deben estar incluidos en Google News y utilizar AMP y datos estructurados en sus artículos para poder generar automáticamente una acción.
Los editores ya han comenzado a desarrollar colaboraciones con Google para desarrollar acciones especializadas. Vogue lanzó una función en 2017 donde los usuarios podían interactuar con la publicación en Google Home para obtener más información sobre ciertas historias, contadas por los propios escritores.
Otros editores, como Bloomberg o El Washington Post, Han desarrollado Alexa Skills que permiten a los usuarios escuchar resúmenes diarios de las noticias más importantes del día.
El Daily Mail fue un paso más allá, al afirmar: Ponen toda su edición diaria en AlexaMientras que otros editores graban el audio ellos mismos, en este caso, el Daily Mail utiliza las funciones automatizadas de conversión de texto a voz de Alexa. Otra diferencia es que, en este caso, el Daily Mail solo ofrece esta función a sus suscriptores actuales.
¿Puedes analizar el impacto de la búsqueda por voz?
La respuesta corta es no. Al menos todavía no. Aunque Google ha estado diciendo desde al menos 2016 que quieren incluir análisis de búsqueda por voz en Google Search Console, lo cierto es que, a día de hoy, no hay forma de analizar las consultas y los resultados de la búsqueda por voz. Existen algunos desafíos que impiden que Google y otros proveedores de análisis ofrezcan esta función:- La primera es que las consultas en lenguaje natural tienden a ser más largas que las consultas basadas en palabras clave. Y la gente formulará lo que es esencialmente la misma consulta utilizando diferentes palabras o construcciones de oraciones. Esto significa que la misma consulta tendrá muchas variaciones de bajo volumen, lo que dificulta analizar y extraer información significativa.
- El segundo desafío es que las consultas de búsqueda por voz a menudo están encadenadas, como en una conversación. Por ejemplo, puedes preguntarle a un asistente de voz digital: "¿Quién es Stephen Curry?". El asistente le devolverá un resumen de los logros de las estrellas de la NBA. Puedes preguntarles "¿Cuánto mide?" y el asistente sabrá que te refieres a Stephen Curry. El problema se complica cuando te das cuenta de que el asistente podría responder ambas consultas utilizando dos fuentes de contenido diferentes.
- Proporcione una forma de agrupar consultas similares y, al mismo tiempo, brinde a los analistas la libertad de explorar cuáles son esas variaciones para comprender mejor el lenguaje del usuario.
- Mostrar árboles conversacionales para entender cómo los usuarios navegan por la información y qué consultas los mantienen en nuestro contenido y cuáles resultan en que la consulta sea respondida con contenido de otros sitios.
La búsqueda por voz ya es nuestro presente
El cambio en los hábitos de consumo y el papel cada vez más importante que desempeñan los dispositivos inteligentes y los asistentes digitales en nuestra vida cotidiana significan que la búsqueda por voz no es cosa del futuro. Ya es un presente con el que debemos lidiar. Los editores deben tener en cuenta el cambio de la interfaz de texto y referencias visuales a solo voz. Es un cambio que cambia la forma en que las personas acceden y consumen nuestro contenido. La falta de análisis confiables para comprender el rendimiento de la búsqueda por voz hace que este objetivo sea difícil de lograr. Pero, como ocurre con cualquier otra faceta de la búsqueda, todo se reduce a desarrollar la confianza de su audiencia a través de contenido autorizado y de alta calidad.Contenido de nuestros socios









