Tactiques de croissance des éditeurs pour la saison électorale | SÉMINAIRE EN LIGNE

Apprendre encore plus

SODP

SODP Media

  • Insights
    • Articles
      • Audience Development
      • Content Strategy
      • Digital Publishing
      • Monetization
      • SEO
      • Digital Platforms & Tools
    • Top Tools & Reviews
    • Opinion
    • Podcast
  • Education
    • Publisher SEO Course
    • Events
      • Monetization Week 2025
  • Resources
  • Community
    • Slack Channel
    • Newsletter
  • About
    • About Us
    • Contact Us
    • Editorial Policy
  • English
sodp logo
SODP logo
    Recherche
    Fermez ce champ de recherche.
    Connexion
    • Connaissances
      • Podcast
      • Des articles
        • Développement du public
        • Stratégie de contenu
        • Édition numérique
        • Monétisation
        • Référencement
        • Plateformes et outils numériques
      • Meilleurs outils et avis
        • Des articles
        • Meilleurs outils et avis
        • Avis
        • Baladodiffusions
        • Développement du public
        • Stratégie de contenu
        • Édition numérique
        • Monétisation
        • Référencement
        • Plateformes et outils numériques
        • Plateformes CMS sans tête
        • Plateformes de publication numérique
        • Logiciel de calendrier éditorial
        • Applications de magazines
        • Plateformes de newsletter par e-mail
        • Plus de listes de meilleurs outils
    • Éducation
      • Cours SEO pour les éditeurs
        • Cours SEO pour les éditeurs
        • Événements
        • Gérer des millions
        • Voir tout
    • Ressources
    • Communauté
      • Canal mou
      • Heures de travail
      • Bulletin
        • Canal mou
        • Bulletin
    • À propos
      • À propos de nous
      • Contactez-nous
      • Politique éditoriale
        • À propos de nous
        • Contactez-nous
        • Politique éditoriale
    espace réservé
    SODP logo
    Devenez partenaire de marque

    Accueil ▸ Plateformes et outils numériques ▸ Deepseek: comment une petite entreprise d'IA chinoise secoue les poids lourds de la technologie américaine

    Deepseek: comment une petite entreprise d'IA chinoise secoue les poids lourds de la technologie américaine

    Tongliang LiuTongliang Liu
    28 janvier 2025
    Fait vérifié par The Conversation
    La conversation
    La conversation

    The Conversation est une collaboration unique entre universitaires et journalistes qui est devenue en une décennie le premier éditeur mondial d'informations et d'analyses fondées sur la recherche. Tout ce que vous lisez sur ces pages est… Lire la suite

    Édité par Tongliang Liu
    Tongliang Liu
    Tongliang Liu

    Tongliang Liu est professeur agrégé en apprentissage automatique à la School of Computer Science et directeur du Sydney AI Center de l'Université de Sydney. Il s'intéresse largement aux domaines de la confiance… Lire la suite

    Deepseek comment une petite entreprise d'IA chinoise secoue les poids lourds de la technologie américaine

    La société chinoise en matière d'intelligence artificielle (IA) Deepseek a envoyé des ondes de choc via la communauté technologique , avec la publication de modèles d'IA extrêmement efficaces qui peuvent rivaliser avec les produits de pointe de sociétés américaines telles que OpenAI et anthropic.

    Fondée en 2023, Deepseek a obtenu ses résultats avec une fraction de l'argent et de la puissance de calcul de ses concurrents.

    Le modèle R1 «raisonnement» de Deepseek, publié la semaine dernière, a provoqué l'excitation parmi les chercheurs, le choc parmi les investisseurs et les réponses des poids lourds de l'IA. L'entreprise a suivi le 28 janvier avec un modèle qui peut fonctionner avec des images ainsi que du texte.

    Le R1 de Deepseek est un modèle impressionnant, en particulier autour de ce qu'ils sont en mesure de livrer pour le prix.

    Nous fournirons évidemment de bien meilleurs modèles et il est également légitime revigorant d'avoir un nouveau concurrent! Nous allons tirer quelques versions.

    - Sam Altman (@sama) 28 janvier 2025

    Alors, que fait Deepseek, et comment l'a-t-il fait?

    Ce que Deepseek a fait

    En décembre, Deepseek a publié son modèle V3 . Il s'agit d'un modèle de grande langue «standard» très puissant qui fonctionne à un niveau similaire au GPT-4O d'OpenAI et à Claude 3.5 d'Anthropic.

    Bien que ces modèles soient sujets à des erreurs et constituent parfois leurs propres faits , ils peuvent effectuer des tâches telles que répondre aux questions, écrire des essais et générer du code informatique. Lors de certains tests de résolution de problèmes et de raisonnement mathématique, ils obtiennent mieux que l'humain moyen.

    V3 a été formé à un coût rapporté d'environ 5,58 millions de dollars. Ceci est considérablement moins cher que le GPT-4, par exemple, qui a coûté plus de 100 millions de dollars pour développer.

    Deepseek prétend également avoir formé V3 en utilisant environ 2 000 puces informatiques spécialisées, en particulier les GPU H800 fabriqués par NVIDIA . C'est encore beaucoup moins que les autres sociétés, ce qui peut avoir utilisé jusqu'à 16 000 des puces H100 les plus puissantes.

    On January 20, DeepSeek released another model, called R1 . Il s'agit d'un modèle soi-disant «raisonnement», qui essaie de résoudre des problèmes complexes étape par étape. Ces modèles semblent être meilleurs dans de nombreuses tâches qui nécessitent un contexte et ont plusieurs pièces interdépendantes, telles que la compréhension en lecture et la planification stratégique.

    Le modèle R1 est une version modifiée de V3, modifiée avec une technique appelée apprentissage de renforcement. R1 semble fonctionner à un niveau similaire à l'O1 d'Openai , sorti l'année dernière.

    Deepseek a également utilisé la même technique pour fabriquer des versions de «raisonnement» de petits modèles open source qui peuvent fonctionner sur des ordinateurs domestiques.

    Cette version a suscité une énorme augmentation d'intérêt pour Deepseek, ce qui a fait monter la popularité de son application Chatbot propulsée par V3 et déclencher un accident de prix massif dans les actions technologiques alors que les investisseurs réévaluent l'industrie de l'IA. Au moment de la rédaction du moment de la rédaction du théâtre, le fabricant de puces Nvidia a perdu environ 600 milliards de dollars de valeur.

    Comment Deepseek l'a fait

    Les percées de Deepseek ont ​​été une plus grande efficacité: obtenir de bons résultats avec moins de ressources. En particulier, les développeurs de Deepseek ont ​​été les pionniers de deux techniques qui peuvent être adoptées par les chercheurs de l'IA plus largement.

    Le premier a à voir avec une idée mathématique appelée «rareté». Les modèles AI ont de nombreux paramètres qui déterminent leurs réponses aux entrées (V3 a environ 671 milliards), mais seule une petite fraction de ces paramètres est utilisée pour une entrée donnée.

    Cependant, prédire les paramètres nécessaires n'est pas facile. Deepseek a utilisé une nouvelle technique pour ce faire, puis n'a formé que ces paramètres. En conséquence, ses modèles nécessitaient beaucoup moins de formation qu'une approche conventionnelle.

    L'autre astuce concerne la façon dont V3 stocke les informations dans la mémoire de l'ordinateur. Deepseek a trouvé un moyen intelligent de comprimer les données pertinentes, il est donc plus facile de stocker et d'accéder rapidement.

    Deepseek a ébranlé l'industrie de l'IA de plusieurs milliards de dollars. Robert Way / Shutterstock
    Deepseek a ébranlé l'industrie de l'IA de plusieurs milliards de dollars. Robert Way / Shutterstock

    Ce que cela signifie

    Les modèles et techniques de Deepseek ont ​​été publiés sous la licence MIT , ce qui signifie que n'importe qui peut les télécharger et les modifier.

    Contenu de nos partenaires

    Construire un guide de réseau publicitaire

    Comment construire votre propre réseau publicitaire: un guide étape par étape

    AI, l'épée de créativité à double tranchant, et pourquoi les éditeurs doivent l'adopter

    AI, l'épée de créativité à double tranchant, et pourquoi les éditeurs doivent l'adopter

    Pourquoi les éditeurs en ligne ont besoin d'un VPN: protection des données, des sources et des revenus

    Pourquoi les éditeurs en ligne ont besoin d'un VPN: protection des données, des sources et des revenus

    Bien que cela puisse être une mauvaise nouvelle pour certaines sociétés d'IA - dont les bénéfices pourraient être érodés par l'existence de modèles puissants disponibles gratuitement - c'est une excellente nouvelle pour la communauté de recherche plus large de l'IA.

    À l'heure actuelle, une grande partie de la recherche sur l'IA nécessite l'accès à d'énormes quantités de ressources informatiques. Des chercheurs comme moi qui sont basés dans les universités (ou partout sauf les grandes entreprises technologiques) ont eu une capacité limitée à effectuer des tests et des expériences.

    Des modèles et techniques plus efficaces modifient la situation. L'expérimentation et le développement peuvent désormais être beaucoup plus faciles pour nous.

    Pour les consommateurs, l'accès à l'IA peut également devenir moins cher. Plus de modèles d'IA peuvent être exécutés sur les appareils des utilisateurs, tels que des ordinateurs portables ou des téléphones, plutôt que d'exécuter «dans le cloud» pour des frais d'abonnement.

    Pour les chercheurs qui ont déjà beaucoup de ressources, plus d'efficacité peut avoir moins d'effet. Il n'est pas clair si l'approche de Deepseek aidera à créer des modèles avec de meilleures performances dans son ensemble, ou simplement des modèles plus efficaces.

    Tongliang Liu, professeur agrégé d'apprentissage automatique et directeur du Sydney AI Center, Université de Sydney

    Cet article est republié à partir de la conversation sous une licence Creative Commons. Lisez l' article original .

    Choix de l'éditeur
    Qu'est-ce qu'un créateur de contenu ? Le quoi, le pourquoi et le comment de l'économie des créateurs
    Stratégie de contenu

    Qu'est-ce qu'un créateur de contenu ?

    Meilleures plateformes de newsletter par e-mail pour les éditeurs
    Plateformes et outils numériques

    8 meilleures plateformes de newsletter par e-mail pour les éditeurs en 2024

    Référencement Google Actualités
    Référencement

    Guide SEO Google Actualités 2024 : meilleures pratiques pour les éditeurs d'actualités

    Articles Similaires

    • En profondeur
      Mettre en profondeur à l'épreuve: comment ses performances se comparent aux autres outils d'IA
    • Questions et réponses de Clara Soteras : opportunités et batailles de référencement pour les éditeurs numériques
      Questions et réponses de Clara Soteras : opportunités et batailles de référencement pour les éditeurs numériques
    • Meilleurs outils d'écriture d'IA
      10 meilleurs outils d'écriture d'IA
    • Jan Thoresen
      Questions et réponses sur le CMS du Labrador : aller au-delà d'un CMS sans tête pour une plus grande flexibilité et une plus grande rapidité pour les éditeurs
    SODP logo

    State of Digital Publishing crée une nouvelle publication et une nouvelle communauté pour les professionnels des médias numériques et de l'édition, dans les nouveaux médias et technologies.

    • Meilleurs outils
    • SEO pour les éditeurs
    • Politique de confidentialité
    • Politique éditoriale
    • Plan du site
    • Recherche par entreprise
    Facebook X-twitter Mou Linkedin

    ÉTAT DE L’ÉDITION NUMÉRIQUE – COPYRIGHT 2025

    Logo GPP

    Gérer des millions

    Meilleur engagement du public sans les maux de tête technologiques

    Comment éviter le piège technologique Goldilocks qui fait des ravages pour donner au public ce qu'ils veulent

    11 juin 2025

    14 h BST

    Événement en ligne

    Apprendre encore plus