L'intelligence artificielle (IA) dans le secteur de l'édition a progressé de manière constante depuis plus d'une décennie, certains grands médias ayant adopté des systèmes automatisés pour la production de contenu. Initialement utilisée pour couvrir les prévisions météorologiques , les résumés sportifs et les rapports financiers , cette automatisation s'est étendue à un éventail plus large de tâches créatives .
Dans les années 2020, l'attention s'est largement portée sur l'IA générative capable de traiter et d'imiter le langage humain. Ce changement est principalement dû aux modèles d'apprentissage automatique avancés qui identifient des schémas au sein d'ensembles de données non structurés. Ces modèles peuvent analyser des millions d'images, de livres et d'articles pour générer un contenu écrit original et remarquablement naturel, à partir de paramètres d'entrée spécifiques.
Le lancement de ChatGPT en novembre 2022 a considérablement accru l'intérêt du public pour les technologies d'IA, suscitant l'inquiétude des professionnels des médias quant à la possibilité de perdre leur emploi au profit des robots. L'interface conviviale du chatbot a permis à un plus grand nombre de personnes d'explorer les capacités du traitement automatique du langage naturel (TALN), et la qualité globale de son contenu a incité des acteurs de référence tels que Nature Publishing Group et les revues PNAS à revoir leurs politiques éditoriales.
ChatGPT a conquis 100 millions d'utilisateurs à un rythme sans précédent , propulsant son développeur, OpenAI, à un chiffre d'affaires de plus d'un milliard de dollars . Ce succès fulgurant a stimulé les investissements des sociétés de capital-risque dans l'IA, qui ont atteint 40 milliards de dollars au premier semestre 2023, et a incité les entreprises à explorer les capacités de l'IA dans de nombreux secteurs.

Le marché mondial de l'IA dans les médias et le divertissement devrait passer de 16,1 milliards de dollars en 2023 à 85,6 milliards de dollars en 2030. Source : Research and Markets
Malgré la puissance de calcul sans cesse croissante disponible pour l'entraînement des modèles, les chatbots de traitement automatique du langage naturel (TALN) avancés n'ont pas encore atteint leur plein potentiel. Cependant, l'IA a déjà profondément transformé le monde de l'édition, à l'instar de l'avènement d'Internet.

Une enquête menée par WAN-IFRA auprès d'éditeurs de presse a révélé qu'en mai 2023, environ la moitié d'entre eux utilisaient activement ChatGPT ou des outils similaires, et que 70 % d'entre eux estimaient qu'ils seraient utiles aux journalistes. Source : WAN-IFRA
Les nouvelles technologies ont transformé le paysage de l'édition, engendrant des défis et des avantages pour les auteurs et de nouvelles opportunités pour les fournisseurs de contenu. Cette approche axée sur les données oblige les entreprises à intégrer ces changements, rendant la maîtrise des outils d'intelligence artificielle indispensable aux journalistes et aux rédacteurs pour consolider leur position.
Qu'est-ce que l'IA générative ?
L'intelligence artificielle générative (IA générative) est un modèle d'apprentissage automatique capable de générer du contenu nouveau, comme du texte, des images, de la musique, des animations ou du code. Ces modèles traitent d'énormes quantités de contenu produit par l'homme grâce à un format d'apprentissage auto-supervisé qui leur permet d'imiter les créateurs humains.
Longtemps, l'intelligence artificielle s'est principalement développée autour de l'interprétation des données, notamment l'entraînement des algorithmes d'apprentissage automatique à comprendre le contenu d'une image. Cependant, cette nouvelle technologie a suscité un vif intérêt lorsque les chercheurs sont passés de la reconnaissance d'images à la génération d'images. En janvier 2021, OpenAI a lancé DALL-E , un modèle capable de convertir les descriptions textuelles des utilisateurs en illustrations.

La couverture du magazine The Economist a été réalisée avec Midjourney, un autre générateur d'illustrations qui a connu un grand succès après son lancement en 2022. Source : The Economist
Les applications d'IA générative traitent les données d'entrée grâce à de grands modèles de langage (LLM). Inspirés du cerveau humain, les LLM considèrent les mots et leurs parties comme des nœuds sur une carte multidimensionnelle . Ils déterminent la distance entre ces nœuds et prédisent ainsi le mot le plus susceptible de suivre dans une séquence donnée. Avec davantage de données, un LLM peut rédiger des textes plus complexes ou créer des visuels pertinents.
Microsoft a confirmé que son chatbot Bing utilise le modèle GPT-4 LLM d'OpenAI, également disponible pour les abonnés de ChatGPT. Ceux qui préfèrent ne pas s'abonner peuvent toujours accéder gratuitement à GPT-3.5. Ces deux services offrent des expériences différentes , tandis que Bard de Google repose sur un modèle différent .
Les capacités de ces chatbots avancés vont bien au-delà de la simple génération de texte. Ils modifient notre interaction avec les moteurs de recherche, rendant les requêtes et les résultats plus conversationnels. Google affirme franchir une nouvelle étape dans cette transformation avec son Search Generative Experience (SGE) , disponible via Google Labs aux États-Unis et au Royaume-Uni.

L'image ci-dessus illustre comment SGE organise la page de résultats pour permettre aux utilisateurs d'obtenir davantage de résultats à partir d'une seule recherche. Source : Google Labs
SGE propose une vue d'ensemble d'un sujet et l'appuie par des liens vers des ressources permettant d'approfondir la question. Cela donne une idée des questions auxquelles une publication particulière répondra.
Ces résumés et compilations facilitent la navigation pour les utilisateurs. Cependant, ils soulèvent des questions chez les créateurs de contenu : doivent-ils autoriser les moteurs de recherche à utiliser leur contenu à des fins de formation ?
En définitive, les moteurs de recherche et les chatbots peuvent utiliser des informations créées par l'homme pour aider leurs utilisateurs sans les obliger à consulter les pages sources.
Où l'IA est-elle utilisée aujourd'hui ?
Les algorithmes d'intelligence artificielle (IA) sont utilisés dans tout le secteur de l'édition, de la conception de la diffusion de l'information à la personnalisation du parcours des abonnés d'un système de paiement .
Par exemple, Reuters utilisait déjà son outil News Tracer en 2016 pour repérer et vérifier automatiquement les informations de dernière minute sur Twitter. À l'origine, l'IA visait à automatiser les processus afin d'aider les éditeurs à se concentrer sur la création de contenu.
Le New York Times a expérimenté une interface pilotée par l'IA en 2015, automatisant les tâches quotidiennes d'étiquetage et d'annotation. Source : NYTLabs
Le New York Times a également été pionnier dans l'utilisation de l'analyse prescriptive pour gérer son système d'abonnement. Le Dynamic Meter a analysé la manière dont les abonnés interagissaient avec le contenu afin de déterminer le nombre d'articles que les utilisateurs non inscrits pouvaient lire gratuitement.
De nouvelles capacités ont élargi le champ d'application de l'IA pour inclure la création et la curation de contenu.
D'après une enquête mondiale de JournalismAI, 90 % des rédactions utilisent l'IA à différentes étapes de la production de contenu. Source : JournalismAI
Détection des tendances et des sujets
Les services de veille tels que Google Trends ou CrowdTangle aident les éditeurs à identifier les sujets tendance pour des régions ou des groupes démographiques spécifiques. De plus, les outils d'IA peuvent faciliter la réflexion collective, en proposant des idées qui serviront de point de départ à des discussions plus approfondies.

En juin 2023, des scientifiques ont présenté AngleKindling, un outil basé sur GPT-3 destiné à aider les journalistes à explorer les communiqués de presse. Source : Github (téléchargement PDF)
Transcription et traduction
La transcription des entretiens et des discussions a toujours été l'une des tâches les plus ingrates du métier de journaliste. Cependant, des applications comme Otter , Sembly et Airgram peuvent générer des notes et des résumés, permettant ainsi aux créateurs de contenu de se concentrer sur des missions à plus forte valeur ajoutée.
Ces services fonctionnent dans un nombre limité de langues, mais le journal numérique danois Zetland a développé la plateforme Good Tape , capable de transcrire l'audio dans plus de 90 langues.
La traduction automatique pour différentes langues s'est également développée de manière inégale, mais elle permet principalement de transmettre un message avec un risque minimal de désinformation ou d'insulte.
En 2022, la chaîne de télévision publique finlandaise Yle a lancé un service destiné aux réfugiés ukrainiens proposant des reportages traduits automatiquement et vérifiés par un locuteur natif. Yle avait déjà commencé à diffuser des informations en somali, en arabe, en kurde et en farsi pendant la pandémie.
Rédaction et révision
Les grands modèles de langage (LLM) peuvent vérifier la grammaire et proposer des résumés de contenu concis, créer des notifications, les adapter aux newsletters ou aux plateformes de médias sociaux et transformer des textes écrits en scripts pour des podcasts ou des vidéos.
ChatGPT, Bing, Claude et d'autres services utilisant l'apprentissage automatique peuvent suggérer des listes de titres accrocheurs. Bien que leur validation soit encore nécessaire, ces algorithmes simplifient et accélèrent la production de contenu.

Une enquête menée par AuthorityHacker auprès de 3 812 spécialistes du marketing numérique a révélé que 85,1 % d'entre eux, utilisant l'IA, s'en servaient pour rédiger des articles ou des billets de blog. Source : AuthorityHacker
En juillet 2023, News Corp Australia a révélé que l'intelligence artificielle permettait à quatre employés de produire 3 000 articles d'actualité locale par semaine . Grâce à cela, les titres de presse hyperlocaux représentaient 55 % de l'ensemble des abonnements.
Cependant, News Corp a précisé par la suite que l'automatisation concerne principalement les informations standardisées , telles que les mises à jour des prix du carburant ou les listes quotidiennes des tribunaux, et que tous les articles sont vérifiés par l'équipe humaine.
Création de visuels
Les réseaux neuronaux tels que Midjourney, DALL-E ou Stable Diffusion permettent aux auteurs et aux éditeurs de créer des illustrations pour leurs articles. La création, le choix et la modification de l'image de couverture de base de cet article ont pris environ sept minutes avant l'ajout d'éléments graphiques supplémentaires.
Le coût de création d'une image unique est un abonnement de 8 $ par mois, ce qui est relativement faible compte tenu du fait que les images uniques ont plus de chances d'être bien référencées dans la recherche d'images de Google que les photos d'illustration.

Une autre image créée spécialement pour cet article à l'aide de Midjourney
Distribution de contenu
L'IA aide les éditeurs à segmenter leurs clients et à identifier les canaux, les formats et les moments les plus pertinents pour diffuser du contenu adapté à un groupe de lecteurs spécifique. De nombreux sites web personnalisent leur page d'accueil en fonction des caractéristiques démographiques et du comportement antérieur du visiteur.
La personnalisation du contenu comprend la traduction automatique des articles, les campagnes de marketing par courriel dynamiques ou l'adaptation du contenu existant aux différentes plateformes de médias sociaux.
Les outils dédiés aux réseaux sociaux, comme WordStream ou Emplifi, offrent une planification intelligente, une optimisation des campagnes publicitaires, un suivi avancé et des informations sur l'audience.
Avantages de l'IA dans l'édition
L'intelligence artificielle (IA) offre aux maisons d'édition, aux médias et aux journalistes la possibilité de gagner du temps et de l'argent grâce à des opérations quotidiennes plus rapides et des décisions plus éclairées. Elle permet également aux éditeurs de renforcer leurs relations avec leurs lecteurs, d'attirer de nouveaux publics et d'améliorer la qualité de leurs contenus.
Efficacité en matière de coûts
L'IA peut réduire considérablement les coûts opérationnels des éditeurs en automatisant les tâches manuelles répétitives et en allégeant la charge de travail de leurs employés. Les algorithmes d'apprentissage automatique fournissent des informations exploitables pour optimiser leurs stratégies de contenu et de marketing, sans les coûts élevés liés aux études de marché. Associée aux outils de création de contenu disponibles, elle permet aux petites équipes d'opérer à plus grande échelle.
Le ciblage avancé des audiences, la génération rapide et économique d'images et les outils d'aide à la rédaction et à la correction, tels que Grammarly, offrent des opportunités sans précédent à l'édition numérique. Une meilleure précision de diffusion permet aux médias spécialisés de toucher leurs lecteurs sans investissements publicitaires importants. En gagnant en efficacité, les éditeurs peuvent couvrir un plus large éventail d'événements.
Assistance à la recherche et vérification des faits
L'IA peut aider les journalistes à naviguer dans de grandes quantités de textes pour identifier les articles pertinents et les liens cachés entre les faits, les événements, les entités et les personnes.
new/s/leak , maintenu par le département de technologie du langage de l'université de Hambourg, est un outil gratuit conçu pour analyser les informations diffusées par Wikileaks. DMINR, ,
L'IA permet de distinguer les faits des contrefaçons en comparant les informations nouvellement publiées à des ensembles de données provenant de sources fiables ou en retraçant l'historique d'une image depuis sa première détection par les moteurs de recherche.

Une capture d'écran confirme que les « robots » aperçus au SoFi Stadium de Los Angeles étaient en réalité des acteurs faisant la promotion du film The Creator. Sources : Reuters , Fact Check Explorer
Personnalisation du contenu
Malgré les préoccupations liées à la protection de la vie privée, la demande d'expériences personnalisées ne cesse de croître. Une étude a montré que cette demande pourrait inciter plus de la moitié des consommateurs à devenir des clients fidèles (téléchargement PDF) , soit une hausse de 7 % par rapport à l'année précédente.
Les outils basés sur l'IA permettent aux médias de personnaliser leur contenu pour une diffusion ciblée. En 2020, le Washington Post a lancé des mises à jour audio sur les élections , générées par l'IA et personnalisées en fonction de la localisation de ses auditeurs de podcasts politiques.

Captures d'écran d'un chatbot avancé personnalisé pour les entreprises de médias. Source : Techcrunch
L'IA générative offre aux éditeurs la possibilité d'une interaction personnalisée avec leurs lecteurs, et ils peuvent désormais intégrer des modèles existants à leurs services d'assistance client.
En février 2023, les cofondateurs d'Instagram ont lancé Artifact , une application d'actualités personnalisée qui suggère des articles fiables et vérifiés en fonction des préférences de l'utilisateur. De plus, Artifact permet aux utilisateurs de choisir entre la lecture et l'écoute, grâce à un système de synthèse vocale utilisant des voix naturelles.

Une capture d'écran montre que les utilisateurs d'Artifact peuvent écouter des reportages et des articles lus avec les voix de Snoop Dogg ou de Gwyneth Paltrow. Source : Medium
Exemples de réussite de l'IA dans l'édition
Les applications de l'intelligence artificielle (IA) dans l'édition se multiplient, offrant de nouvelles perspectives d'amélioration de l'efficacité. Examinons quelques exemples de réussite pour mieux comprendre comment cette technologie transforme le secteur.
5 projets médias pilotés par l'IA
1. BuzzFeed
BuzzFeed a annoncé en janvier 2023 qu'il expérimentait ChatGPT pour automatiser son processus de création de quiz.
Le test a été concluant en termes d'engagement accru des utilisateurs. Les visiteurs ont passé 40 % de temps en plus sur les quiz générés par l'IA que sur ceux créés par des rédacteurs humains.

Une page entière de BuzzFeed consacrée aux quiz générés par l'IA. Source : BuzzFeed
2 Forbes
Le géant de l'information financière a lancé Bertie , une plateforme de publication propriétaire, en juillet 2018. Ce système de gestion de contenu (CMS) fournissait aux journalistes et aux contributeurs des listes de sujets tendance en fonction de leurs publications précédentes.
De plus, le site proposait des titres accrocheurs et des images pertinentes, sans toutefois rédiger d'articles complets. Après son lancement, Forbes a doublé le nombre de ses visiteurs mensuels.

Le CMS Bertie suggère des idées de titres. Source : Forbes
3. Bloomberg
Bloomberg a dévoilé BloombergGPT , un modèle de langage spécifique au domaine basé sur 50 milliards de paramètres, en mars 2023.
Contenu provenant de nos partenaires

Le tableau montre comment BloombergGPT surpasse les modèles ouverts existants de taille similaire pour les tâches financières. Source : arXiv
4. Le BMJ
Le British Medical Journal (BMJ) a examiné la capacité de GPT-3 à générer des titres accrocheurs sur le thème de Noël pour les articles de recherche. Fait intéressant, les participants ont jugé les titres générés par l'IA au moins aussi agréables à lire que ceux rédigés par des auteurs humains.

Le test présenté par le BMJ suggère de reconnaître les titres générés automatiquement. Source : BMJ
5. Le Globe and Mail
Le journal canadien a vendu sa plateforme de curation et d'analyse de contenu , Sophi Inc., à la société mondiale de gestion des revenus Mather Economics en août 2023. Cet outil basé sur l'IA était conçu pour gérer les paywalls du Globe and Mail, mais il s'est étendu à d'autres domaines après la transition.
Défis liés à la mise en œuvre des solutions d'IA
Les organisations qui adoptent l'intelligence artificielle (IA) sont souvent confrontées à des contraintes financières et techniques. Par exemple, les petits médias peuvent manquer de fonds pour embaucher des ingénieurs qualifiés.
Les éditeurs doivent également prendre en compte les risques juridiques et de réputation que peut engendrer une application négligente de l'IA.

Plus de 40 % des responsables médias rencontrent des difficultés techniques, notamment un besoin accru de financement, lors de leurs projets d'intégration de l'IA. Source : JournalismAi
Problèmes techniques
Malgré les avantages liés à l'adoption des nouvelles technologies, la difficulté d'apprentissage initiale peut dissuader les éditeurs. Ils doivent non seulement obtenir l'adhésion de la rédaction, mais aussi intégrer les nouvelles solutions à leurs systèmes existants. S'ajoute à cela la crainte de devenir dépendants d'un outil qu'ils ne maîtrisent pas pleinement.
Qualité du contenu
Le contenu généré peut s'avérer décevant, ce qui entraîne de vives critiques à l'encontre des éditeurs . De plus, les grands modèles de langage (LLM) ont tendance à perpétuer les erreurs des jeux de données sur lesquels ils ont été entraînés.
Un problème notable est la perpétuation de divers biais, une caractéristique commune de l'IA, constamment soulignée par la recherche .
Défis éthiques
Les biais posent un problème éthique qu'il convient de résoudre. Un autre défi concerne les risques professionnels liés à l'IA, notamment pour les postes de cadres. Sa mise en œuvre pourrait susciter des inquiétudes chez les employés, ce qui exige une communication interne proactive.
Risques juridiques
L'IA soulève également des préoccupations en matière de sécurité des données, étant donné la nécessité de traiter d'importants volumes de données utilisateur pour générer du contenu personnalisé. De plus, les entreprises s'inquiètent de plus en plus des fuites de données dues à la saisie d'informations sensibles par les utilisateurs pour l'analyse automatisée de texte.
De plus, le contenu produit par l'IA se trouve encore dans une zone grise en matière de protection du droit d'auteur, car les dossiers sont toujours en cours de traitement par le système.

Les éditeurs ne sont pas encore prêts à dépendre entièrement du contenu généré par l'IA. Source : WAN-IFRA
Parmi les autres risques figurent la surautomatisation et la perte conséquente d'un ton unique et d'une approche plus humaine. Ce qui nous amène directement à souligner la nécessité d'une supervision continue par l'équipe éditoriale.
Réflexions finales
On estime que d'ici 2026, 90 % du contenu en ligne pourrait être généré synthétiquement. Si cette prévision se confirme, l'intelligence artificielle (IA) devrait avoir un impact profond sur l'ensemble du secteur de l'édition et de la création de contenu.
Rédacteurs en chef, créateurs de contenu TikTok, graphistes, auteurs : tous les acteurs du secteur créatif seront touchés d’une manière ou d’une autre par cette expansion. Le marché du travail s’en trouvera bouleversé, soulignant l’importance des compétences en ingénierie des données et des connaissances techniques pour les journalistes.
À mesure que l'intégration de l'IA progresse, les éditeurs doivent adopter des stratégies transparentes et éthiques et constituer des groupes de travail dédiés. Les ambitions commerciales du secteur de l'édition s'aligneront davantage sur les valeurs éthiques, compte tenu de la nécessité de vérifier les faits pour se prémunir contre les risques d'atteinte à la réputation.
Cela dit, les éditeurs doivent tout de même tirer parti de l'IA pour maintenir leur autorité, analyser le comportement des lecteurs et toucher un public plus large s'ils veulent rester compétitifs.








