Il fut un temps où donner des commandes ou poser des questions à une machine et recevoir une réponse relevait d'un avenir de science-fiction. Eh bien, pour plus de 110 millions de personnes aux États-Unis seulement , c'est leur cadeau quotidien. Selon Gartner, 30 % des recherches seront effectuées via la voix en 2020 .
La voix est l'interface par défaut pour les plus de 200 millions de haut-parleurs intelligents qui, selon Canalys, existeront d'ici la fin de 2019 . Mais la plupart des smartphones d'aujourd'hui ont également installé une sorte d'assistant numérique qui permet une interface vocale. La société de recherche Juniper Research estime que d'ici 2023, 8 milliards d'assistants vocaux numériques seront utilisés . La plupart d'entre eux seront sur des smartphones, mais les téléviseurs intelligents, les appareils portables, les haut-parleurs intelligents et d'autres appareils IoT connaîtront également une croissance significative de leur utilisation grâce aux commandes vocales.
Le marché des assistants vocaux numériques est dominé par quatre grands acteurs :
- Assistant Google. Cet assistant numérique est installé avec tous les téléphones Android dans le cadre de l'application Google. Bien sûr, il utilise la recherche Google pour répondre à vos questions. D'autres propriétés de Google, comme YouTube ou Google Maps, sont également étroitement liées à l'assistant. Les entreprises peuvent développer les capacités de l'assistant en développant des actions. Ces actions peuvent être utilisées pour interagir avec du matériel ("Hey Google, éteins les lumières dans le salon") ou avec tout autre service en ligne ("Hey Google, donne-moi les titres d'aujourd'hui pour mon site Web préféré").
- Amazon Alexa. L'assistant numérique d'Amazon est disponible le plus célèbre sur la gamme de haut-parleurs intelligents d'Amazon, Echo. Mais en fait, il est disponible sur plus de 20 000 appareils, y compris non seulement des haut-parleurs intelligents ou des appareils portables, mais aussi des téléviseurs et même des voitures. Alexa permet également la création d'applications vocales via Alexa Skills. Amazon permet même la possibilité d'abonnements premium pour Skills , afin que les éditeurs puissent monétiser leurs efforts en offrant plus d'options de personnalisation ou une couverture plus détaillée. Alexa utilise Bing comme moteur de recherche.
- Pomme Siri. Ce qui a commencé en 2011 en tant qu'application iOS pour iPhone est désormais un assistant vocal numérique à part entière intégré à tous les produits Apple, y compris leur gamme de téléviseurs intelligents, de haut-parleurs et de dispositifs portables. Apple propose SiriKit pour permettre aux entreprises d'étendre leurs applications et de permettre l'interaction vocale via Siri. Le moteur de recherche par défaut utilisé par Siri est Google, bien qu'il puisse être configuré pour utiliser un moteur de recherche différent, comme Duck Duck Go ou Bing.
- Microsoft Cortana. L'assistant numérique de Microsoft est disponible dans Windows de manière native et dans les appareils Android et iOS en tant qu'application autonome. Cortana semble avoir pris du retard dans son adoption par rapport aux autres assistants numériques, et la stratégie de Microsoft semble être d'intégrer Cortana à d'autres assistants numériques, plutôt que de les concurrencer . Microsoft autorise également le développement de Skills tiers pour Cortana, mais uniquement pour le marché américain pour l'instant. Compte tenu de leur changement de stratégie, il n'est pas clair si Cortana Skills deviendrait plus largement disponible. Cortana utilise Bing comme moteur de recherche.
Table des matières
La recherche vocale n'est pas seulement pour le mobile, c'est pour notre vie quotidienne
Les premiers stades de la recherche vocale ont été déclenchés par l'adoption croissante des téléphones mobiles. Google Now, l'incarnation précédente des assistants, a été lancé en 2012 et Siri a été lancé même avant, en 2011. Cela a changé avec l'introduction d'Alexa en 2014. L'assistant numérique vivait désormais dans un matériel conçu pour ne jamais quitter votre maison.
Les assistants numériques sont désormais intégrés dans une large gamme d'appareils, des téléphones aux montres en passant par les téléviseurs et les voitures. Les gens peuvent désormais interagir avec eux dans un plus large éventail de situations. Mais la façon dont nous interagissons avec l'assistant est bien sûr radicalement différente de l'interface textuelle habituelle des moteurs de recherche.
En quoi la recherche vocale est différente de la recherche textuelle
- Requêtes plus complexes et plus longues. La reconnaissance vocale a beaucoup évolué ces dernières années et permet désormais des requêtes plus complexes qu'il y a quelques années. Cela pousse l'utilisateur à utiliser un langage plus naturel pour ses requêtes et ses commandes.
- Plus de questions. Selon une étude de seoClarity , plus de 15 % des recherches vocales commencent par comment, quoi, où, quand, pourquoi et qui. Cela est dû à l'interface différente par rapport à un moteur de recherche textuel.
- Réponses courtes et concises. Même si l'utilisateur peut utiliser des requêtes plus longues pour exprimer ce qu'il veut que l'assistant fasse ou recherche, les gens s'attendent à des réponses courtes et claires.
- Aucune hiérarchie d'informations visuelles. Nous sommes habitués à utiliser et à détecter des repères visuels pour organiser le contenu et mettre en évidence les aspects les plus importants de ce que nous voulons transmettre à l'utilisateur. Le contenu d'une page de destination doit être repensé pour les interfaces vocales uniquement afin d'identifier ce qu'il faut mettre en évidence et comment le faire sans les repères visuels qu'un navigateur autorise.
- Le gagnant prend tout. Lorsque vous utilisez un moteur de recherche, vous pouvez parcourir les résultats de la recherche, et même si vous atteignez rarement la deuxième page du SERP, vous pouvez très bien cliquer sur un lien sous les trois premiers résultats. Dans une interface vocale, les utilisateurs n'obtiennent pas de page de résultats à partir de laquelle ils peuvent choisir où aller. L'assistant numérique renverra un seul résultat.
- Recherche locale. Considérant qu'entre 30 et 40% des recherches mobiles sont des requêtes locales, on peut également s'attendre à ce qu'un pourcentage élevé de requêtes en recherche vocale demande des résultats locaux.
Recherche de mots clés pour la recherche vocale
La principale différence dans la recherche de mots-clés pour la voix au lieu du texte est que vous utiliserez beaucoup plus de mots-clés en langage naturel. La façon dont nous parlons est complètement différente de la façon dont nous tapons. Nous utilisons des expressions naturelles au lieu d'une courte chaîne de mots-clés.
Pour découvrir quels mots clés cibler, nous devons utiliser un outil de recherche sémantique de mots clés. Répondre au public est l'outil le plus couramment utilisé dans ces cas. Insérez votre mot-clé de départ et vous obtiendrez une liste de questions avec ce mot-clé. Les données sont présentées d'abord dans un graphique, ce qui est joli, mais pas très utile. Heureusement, vous pouvez télécharger les données dans un CSV pratique.
outil de recherche de mots clés de Twinword propose également des filtres utiles pour extraire des idées de mots clés. Vous pouvez filtrer les résultats par intention de recherche et par modèles de mots-clés, ce qui vous permettrait de ne voir que les questions incluant votre mot-clé de départ.
Vous pouvez également prendre note de l'extrait "Les gens demandent également" dans la recherche Google pour découvrir plus d'opportunités de mots clés.
Si vous avez un centre d'appels ou une fonctionnalité de chat en direct ou de chatbot, exploitez les données de ces conversations pour trouver les questions les plus fréquemment posées.
Requêtes "à proximité"
Comme les requêtes locales représentent une part importante de la recherche vocale, vous pouvez vous attendre à de nombreuses requêtes se terminant par l'expression « près de chez moi ». Comme dans : « quel est le meilleur sushi près de chez moi » ou « quel est le meilleur club de gym près de chez moi ». Comment optimiser pour cela ? Les entreprises locales doivent mettre à jour leurs données dans des annuaires comme Yelp, des sites d'avis comme Tripadvisor et des services comme Kayak. Pour les éditeurs, les données structurées sont la réponse.
Comment optimiser votre contenu pour la recherche vocale
Optimisez votre site pour le mobile
La plupart des optimisations que vous devriez apporter à votre site pour vous assurer qu'il fonctionne bien dans la recherche mobile seront également bénéfiques pour votre classement de recherche vocale. L'un des facteurs les plus importants est la vitesse du site. Que l'interface soit vocale ou mobile, les gens s'attendent à des résultats rapides.
Utiliser AMP et des données structurées
Les données structurées sont essentielles pour aider Google à mieux comprendre et analyser votre contenu afin de mieux fournir à votre public les réponses qu'il recherche. Vous pouvez aider Google à identifier des personnes, des organisations, des événements, des recettes, des produits, des lieux.
AMP signifie Accelerated Mobile Pages. Il s'agit d'un projet open source lancé par Google qui restreint la fonctionnalité des pages Web pour augmenter considérablement leur vitesse. AMP est souvent utilisé avec des données structurées, car c'est ce qui permet aux pages AMP d'être présentées dans des résultats riches sur la page de résultats de recherche.
De plus, pour les éditeurs, l'affichage de votre contenu au format AMP avec des données structurées est l'une des conditions requises pour créer une action pour Google Assistant .
Il existe un schéma de données structuré appelé "speakable" , actuellement en version bêta, qui identifie les sections d'un article adaptées à la lecture texte-voix. Le contenu balisé avec ce schéma sera identifié par l'Assistant Google comme un contenu pouvant être lu via un appareil compatible avec l'Assistant Google. Le contenu est attribué à la source et l'URL est envoyée à l'appareil mobile de l'utilisateur.
Ce schéma de données structurées n'est disponible que pour les utilisateurs anglophones aux États-Unis, par l'intermédiaire d'éditeurs présents sur Google Actualités.
Répondre avec concision aux questions des utilisateurs
Selon les recherches de Backlinko , le résultat typique de la recherche vocale ne contient que 29 mots, mais le nombre de mots d'une page de résultats de recherche vocale est de 2 312 mots. Ce n'est pas contradictoire. Dans le premier cas, on parle de l'assistant numérique répondant à une question ou requête précise. Dans le second cas, le nombre de mots fait référence à la source de la réponse. Il n'est pas clair si Google favorise le contenu long comme marque de qualité ou si c'est simplement que plus de contenu signifie qu'il y a plus de chances qu'une page soit utilisée comme réponse à une requête.
Quoi qu'il en soit, ce que ces deux statistiques combinées nous disent, c'est que nous devons réfléchir à la structure de notre contenu afin d'aborder les idées principales et les principaux points à retenir dans de courts paragraphes pouvant être repris par un assistant vocal.
Rédiger un contenu facile à lire et à comprendre
Si vous souhaitez que votre contenu soit utilisé dans une interaction vocale, il doit être facile à lire et, surtout, facile à comprendre pour vos lecteurs. N'oubliez pas que les utilisateurs ne pourront pas utiliser d'indices ou d'éléments visuels pour mieux comprendre votre contenu, comme des titres ou des graphiques.
N'oubliez pas que la plupart des requêtes seront effectuées en utilisant le langage naturel de la parole, comme s'ils avaient une conversation. Gardez cela à l'esprit lorsque vous développez votre contenu et écrivez de manière conversationnelle lorsque vous répondez à des questions spécifiques.
Visez un rang élevé et des extraits en vedette
C'est un cas de corrélation et non de causalité. Mais il existe des preuves, telles qu'analysées par Backlinko dans leur recherche de résultats vocaux dans Google Assistant, que plus de 75% des résultats de recherche vocale proviennent des trois premières positions du SERP, et que 40% proviennent d'un extrait en vedette.
C'est juste une preuve de plus que Google Assistant et d'autres assistants vocaux numériques privilégieront les résultats faisant autorité pour s'assurer qu'ils satisfont la requête de l'utilisateur dès leur première réponse.
Comme les extraits de code sont déjà des réponses courtes à des questions spécifiques, il est logique que l'assistant les utilise.
Cela signifie que vos efforts d'optimisation pour la recherche Google auront également un impact mesurable sur la façon dont votre contenu est utilisé par un assistant vocal numérique.
Analyser et répondre à l'intention de l'utilisateur
Identifiez l'intention de l'utilisateur pour laquelle vous fournissez du contenu. Trois intentions principales de l'utilisateur peuvent être répondues par la recherche vocale. Premièrement, obtenir des informations : qu'est-ce que c'est ? Comment puis-je faire cela?. La seconde est la navigation : où est-ce ?. Et la troisième et dernière intention est d'agir : réserver une table dans un restaurant, acheter une paire de chaussures, obtenir une liste de tous les concerts de musique qui se déroulent ce week-end.
L'Oréal a mis en place une stratégie de contenu basée sur la réponse aux questions "Comment faire" . Leurs recherches montrent que c'est ce que leurs utilisateurs recherchent en utilisant des requêtes de recherche vocale.
Renforcez votre confiance et votre autorité
Comme nous l'avons vu, la recherche vocale est un jeu gagnant-gagnant. Un assistant vocal numérique n'affichera pas une liste de résultats mais fournira directement une réponse à partir de ces résultats de recherche. Comme ils ne peuvent fournir qu'un seul résultat, il est logique qu'ils aient tendance à favoriser les résultats des domaines à haute autorité, même s'ils ne sont peut-être pas le meilleur résultat pour cette requête.
Le référencement local est la clé de la recherche vocale
Un volume élevé de requêtes de recherche vocale concerne les résultats locaux. L'optimisation pour les requêtes de référencement local ne consiste pas tant à produire du contenu avec des mots-clés locaux qu'à maintenir une présence saine et mise à jour sur certains services et annuaires. Par exemple, les entreprises locales doivent revendiquer leur fiche sur Google My Business , Bing Places for Business et Apple Maps Connect . Vous pourrez alors avoir un plus grand contrôle sur les informations extraites par Google Assistant, Alexa, Cortana et Siri, qui utilise également les données et les avis de Yelp.
Les éditeurs (et les entreprises locales également) peuvent mettre en œuvre des données structurées pour mettre en évidence les éléments locaux dans leur contenu, comme le font Yelp et Ticketmaster pour leurs avis et événements. Créez des actions Google ou des compétences Alexa pour permettre aux utilisateurs d'interagir avec votre contenu
Tous les principaux assistants vocaux numériques permettent la création d'applications vocales pour permettre aux utilisateurs d'interagir avec votre contenu via les assistants.
Google va un peu plus loin et crée automatiquement des actions pour votre contenu en fonction des données structurées de votre site Web. Lorsque cela se produit, le propriétaire de votre site, tel que spécifié dans les données de la console de recherche Google, recevra un e-mail. Ensuite, vous pouvez réclamer votre action ou la désactiver.
Par exemple, Google créera une action pour les podcasts basée sur leur flux RSS qui permettra aux utilisateurs de rechercher et de lire des épisodes sur leurs appareils via l'assistant. Les guides pratiques, les FAQ et les recettes utilisent également un balisage de données structuré pour générer automatiquement des actions.
Pour les éditeurs d'actualités, vous devez déjà être inclus dans Google Actualités et utiliser des données AMP et structurées dans vos articles pour pouvoir générer automatiquement une action.
Les éditeurs ont déjà commencé à développer des partenariats avec Google pour développer des Actions spécialisées. Vogue a lancé une fonctionnalité en 2017 où les utilisateurs pouvaient interagir avec la publication dans Google Home pour obtenir plus d'informations sur certaines histoires, racontées par les écrivains eux-mêmes.
D'autres éditeurs, comme Bloomberg ou The Washington Post , ont développé des Alexa Skills qui permettent aux utilisateurs d'écouter quotidiennement les brèves de l'actualité la plus importante de la journée.
Le Daily Mail est allé plus loin en mettant toute son édition quotidienne sur Alexa . Alors que d'autres éditeurs enregistrent eux-mêmes l'audio, dans ce cas, le Daily Mail utilise les capacités de synthèse vocale automatisées d'Alexa. Une autre différence est que dans ce cas, le Daily Mail rend cette fonctionnalité disponible uniquement pour ses abonnés actuels.
Pouvez-vous analyser l'impact de la recherche vocale ?
La réponse courte est non. Pas encore, du moins. Même si Google dit depuis au moins 2016 qu'il souhaite inclure l'analyse de la recherche vocale dans Google Search Console, le fait est qu'à ce jour, il n'y a aucun moyen d'analyser les requêtes et les résultats de la recherche vocale.
Il existe quelques défis qui empêchent Google et d'autres fournisseurs d'analyse de fournir cette fonctionnalité :
- La première est que les requêtes en langage naturel ont tendance à être plus longues que les requêtes basées sur des mots clés. Et les gens formuleront essentiellement la même requête en utilisant différents mots ou constructions de phrases. Cela signifie que la même requête comportera de nombreuses variations à faible volume, ce qui rend difficile l'analyse et l'extraction d'informations significatives.
- Le deuxième défi est que les requêtes de recherche vocale sont souvent enchaînées, comme dans une conversation. Par exemple, vous pouvez demander à un assistant vocal numérique : "Qui est Stephen Curry ?". L'assistant vous rendra un résumé des réalisations de la star de la NBA. Vous pouvez leur demander « Combien mesure-t-il ? » et l'assistant saura que vous faites référence à Stephen Curry. Le problème se complique lorsque vous vous rendez compte que l'assistant peut répondre aux deux requêtes en utilisant deux sources de contenu différentes.
Toute fonctionnalité d'analyse de recherche vocale doit prendre en compte à la fois les défis et :
- Fournissez un moyen de regrouper des requêtes similaires, tout en laissant aux analystes la liberté d'explorer quelles sont ces variations, afin de mieux comprendre la langue de l'utilisateur.
- Affichez des arbres conversationnels pour comprendre comment les utilisateurs naviguent dans les informations et quelles requêtes les maintiennent dans notre contenu et lesquelles aboutissent à une réponse à la requête avec le contenu d'autres sites.
Les éditeurs qui souhaitent comprendre l'impact de la recherche vocale sur leur présence en ligne peuvent commencer par analyser les requêtes qui attirent les internautes sur votre site et rechercher des requêtes plus longues et plus conversationnelles, ainsi que des requêtes formulées sous forme de question.
Vous pouvez également effectuer des tests avec différents assistants vocaux numériques pour vérifier quelles sources ils utilisent pour leurs réponses (les assistants vocaux commencent leurs réponses par « selon… »), et comment cela est corrélé avec les SERP sur la recherche Google.
La recherche vocale est déjà notre présent
L'évolution des habitudes de consommation et le rôle croissant que jouent les appareils intelligents et les assistants numériques dans notre vie quotidienne signifient que la recherche vocale n'est pas une chose du futur. Est déjà un présent dont nous devons nous occuper.
Les éditeurs doivent prendre en compte le changement d'interface des références textuelles et visuelles à la simple voix. C'est un changement qui change la façon dont les gens accèdent et consomment notre contenu. Le manque d'analyses fiables pour comprendre les performances de la recherche vocale rend cet objectif difficile à atteindre. Mais, comme pour toute autre facette de la recherche, tout se résume à développer la confiance avec votre public grâce à un contenu faisant autorité et de haute qualité.