Tattiche di crescita degli editori per la stagione elettorale | SEMINARIO WEB

Saperne di più

SODP

SODP Media

  • Insights
    • Articles
      • Audience Development
      • Content Strategy
      • Digital Publishing
      • Monetization
      • SEO
      • Digital Platforms & Tools
    • Top Tools & Reviews
    • Opinion
    • Podcast
  • Education
    • Publisher SEO Course
    • Events
      • Monetization Week 2025
  • Resources
  • Community
    • Slack Channel
    • Newsletter
  • About
    • About Us
    • Contact Us
    • Editorial Policy
  • English
sodp logo
SODP logo
    Ricerca
    Chiudi questa casella di ricerca.
    Login
    • Approfondimenti
      • Podcast
      • Articoli
        • Sviluppo del pubblico
        • Strategia dei contenuti
        • Editoria digitale
        • Monetizzazione
        • SEO
        • Piattaforme e strumenti digitali
      • Strumenti e recensioni migliori
        • Articoli
        • Strumenti e recensioni migliori
        • Opinione
        • Podcast
        • Sviluppo del pubblico
        • Strategia dei contenuti
        • Editoria digitale
        • Monetizzazione
        • SEO
        • Piattaforme e strumenti digitali
        • Piattaforme CMS senza testa
        • Piattaforme di editoria digitale
        • Software per calendari editoriali
        • App per riviste
        • Piattaforme di newsletter via e-mail
        • Altri elenchi dei migliori strumenti
    • Istruzione
      • Corso SEO per editori
        • Corso SEO per editori
        • Eventi
        • Gestire milioni
        • Visualizza tutto
    • Risorse
    • Comunità
      • Canale lento
      • Orari d'ufficio
      • Notiziario
        • Canale lento
        • Notiziario
    • Di
      • Chi siamo
      • Contattaci
      • Politica editoriale
        • Chi siamo
        • Contattaci
        • Politica editoriale
    segnaposto
    SODP logo
    Diventa un marchio partner

    Home ▸ Piattaforme e strumenti digitali ▸ Mettere al test DeepSeek: come le sue prestazioni si confrontano con altri strumenti di intelligenza artificiale

    Mettere alla prova DeepSeek: come le sue prestazioni si confrontano con altri strumenti di intelligenza artificiale

    Simon ThorneSimon Thorne
    5 febbraio 2025
    Fatto verificato da The Conversation
    La conversazione
    La conversazione

    The Conversation è una collaborazione unica tra accademici e giornalisti che in un decennio è diventata l'editore leader a livello mondiale di notizie e analisi basate sulla ricerca. Tutto quello che leggi in queste pagine è... Leggi di più

    Modificato da Simon Thorne
    Simon Thorne
    Simon Thorne

    La mia ricerca è principalmente fondata sull'informatica con applicazioni nei sistemi di informazione. Penso a me stesso come uno scienziato naturale che preferisce indagine scientifica quando conducendo ricerche. Il mio dottorato di ricerca ... Leggi di più

    Deep -Week

    Il nuovo Modello di linguaggio di DEEPEEK della Cina (LLM) ha interrotto il mercato dominato dagli Stati Uniti , offrendo un modello di chatbot relativamente ad alte prestazioni a costi significativamente più bassi.

    Il costo ridotto di sviluppo e i prezzi di abbonamento più bassi rispetto agli strumenti USA AI hanno contribuito al produttore di chip americano Nvidia perdendo $ 600 miliardi (£ 480 miliardi) di valore di mercato per un giorno. NVIDIA rende i chip del computer utilizzati per addestrare la maggior parte degli LLM, la tecnologia sottostante utilizzata in Chatgpt e in altri chatbot di AI. DeepSeek utilizza chip Nvidia H800 più economici sulle versioni all'avanguardia più costose.

    Secondo quanto riferito, lo sviluppatore di CHATGPT Openai ha speso tra 100 milioni di dollari e 1 miliardo di dollari per lo sviluppo di una versione molto recente del suo prodotto chiamato O1. Al contrario, DeepSeek ha realizzato la sua formazione in soli due mesi al costo di 5,6 milioni di dollari utilizzando una serie di innovazioni intelligenti.

    Ma quanto bene si confronta con AI Chatbot di Deepseek, R1, con altri strumenti di intelligenza artificiale simili sulle prestazioni?

    DeepSeek afferma che i suoi modelli si comportano comparabilmente alle offerte di Openi, anche superando il modello O1 in alcuni test di riferimento. Tuttavia, i parametri di riferimento che utilizzano test di comprensione della lingua multitasking (MMLU) utilizzano la conoscenza di più argomenti utilizzando domande a scelta multipla. Molti LLM sono addestrati e ottimizzati per tali test, rendendoli inaffidabili come veri indicatori di prestazioni del mondo reale.

    Una metodologia alternativa per la valutazione obiettiva di LLMS utilizza una serie di test sviluppati dai ricercatori delle università di Cardiff Metropolitan, Bristol e Cardiff - noto collettivamente come il gruppo di osservazione della conoscenza (KOG). Questi test sondano la capacità di LLMS di imitare il linguaggio e la conoscenza umani attraverso domande che richiedono una comprensione umana implicita per rispondere. I test di base sono tenuti segreti, per evitare che le aziende LLM addestrassero i loro modelli per questi test.

    KOG ha distribuito test pubblici ispirati al lavoro di Colin Fraser, uno scienziato di dati di Meta , per valutare DeepSeek contro altri LLM. Sono stati osservati i seguenti risultati:

    Test delle prestazioni LLM.
    Test delle prestazioni LLM.

    I test utilizzati per produrre questa tabella sono di natura "contraddittoria". In altre parole, sono progettati per essere "difficili" e per testare LLM in modo che non siano solidali per il modo in cui sono progettati. Ciò significa che le prestazioni di questi modelli in questo test sono probabilmente diverse dalle loro prestazioni nei test di benchmarking tradizionale.

    DeepSeek ha segnato 5,5 su 6, sovraperformando l'O1 di Openi-il suo modello avanzato (noto come modello "catena di pensiero")-così come Chatgpt-4o, la versione gratuita di CHATGPT. Ma DeepEek è stato marginalmente sovraperformato da Claudeai di Antropico e O1 Mini di Openi, entrambi i quali hanno segnato un perfetto 6/6. È interessante che O1 abbia sottoperformato contro la sua controparte "più piccola", O1 Mini.

    Deepthink R1-Uno strumento AI della catena di pensiero realizzato da DeepSeek-sottoperformato rispetto a DeepSeek con un punteggio di 3,5.

    Questo risultato mostra quanto sia già competitivo il chatbot di Deepseek, battendo i modelli di punta di Openi. È probabile che stimoli ulteriormente lo sviluppo per DeepSeek, che ora ha una solida base su cui costruire. Tuttavia, la società tecnologica cinese ha un problema serio che gli altri LLM non fanno: censura.

    Sfide di censura

    Nonostante la sua forte performance e popolarità, DeepSeek ha subito critiche sulle sue risposte a argomenti politicamente sensibili in Cina. Ad esempio, i suggerimenti relativi a Tiananmen Square, Taiwan, Musulmani Uyghur e movimenti democratici sono accolti con la risposta: "Mi dispiace, questo è oltre il mio ambito attuale".

    Ma questo problema non è necessariamente unico per DeepSeek e il potenziale per l'influenza politica e la censura negli LLM più in generale è una preoccupazione crescente. progetto Stargate LLM da 500 miliardi di dollari di Donald Trump , che coinvolge Openai, Nvidia, Oracle, Microsoft e ARM, solleva anche timori di influenza politica.

    Inoltre, la recente decisione di Meta di abbandonare il controllo dei fatti su Facebook e Instagram suggerisce una tendenza crescente verso il populismo sulla veridicità.

    Contenuti dei nostri partner

    Build AD Network Guide

    Come costruire la tua rete pubblicitaria: una guida passo-passo

    AI, la spada a doppio taglio della creatività e perché gli editori devono abbracciarla

    AI, la spada a doppio taglio della creatività e perché gli editori devono abbracciarla

    Perché gli editori online hanno bisogno di una VPN: proteggere dati, fonti e entrate

    Perché gli editori online hanno bisogno di una VPN: proteggere dati, fonti e entrate

    L'arrivo di Deepseek ha causato gravi interruzioni del mercato LLM. Le aziende statunitensi come Openai e Antropic saranno costrette a innovare i loro prodotti per mantenere la pertinenza e abbinare le sue prestazioni e i suoi costi.

    Il successo di Deepseek sta già sfidando lo status quo, dimostrando che i modelli LLM ad alte prestazioni possono essere sviluppati senza budget da miliardi di dollari. Sottolinea inoltre i rischi della censura LLM, la diffusione della disinformazione e perché le valutazioni indipendenti sono importanti.

    Man mano che gli LLM diventano più profondamente incorporati nella politica e negli affari globali, la trasparenza e la responsabilità saranno essenziali per garantire che il futuro degli LLM sia sicuro, utile e affidabile.

    Simon Thorne, docente senior in Sistemi informatici e informatici, Università Metropolitan di Cardiff

    Questo articolo è ripubblicato dalla conversazione con una licenza Creative Commons. Leggi l' articolo originale .

    Scelte dell'editore
    Che cos'è un creatore di contenuti Il cosa, il perché e il come della Creator Economy
    Strategia dei contenuti

    Cos'è un creatore di contenuti?

    Le migliori piattaforme di newsletter via email per gli editori
    Piattaforme e strumenti digitali

    8 migliori piattaforme di newsletter via email per editori nel 2024

    SEO di Google Notizie
    SEO

    Guida SEO 2024 di Google News: best practice per gli editori di notizie

    Articoli correlati

    • I migliori strumenti di scrittura AI
      10 migliori strumenti di scrittura AI
    • I migliori strumenti di trascrizione AI
      11 migliori strumenti di trascrizione AI nel 2024
    • Strumenti AI per la creazione di contenuti
      12 migliori strumenti di intelligenza artificiale per la creazione di contenuti
    • I 17 migliori strumenti di monitoraggio dei media nel 2023
      13 migliori strumenti di monitoraggio dei media nel 2025
    SODP logo

    State of Digital Publishing sta creando una nuova pubblicazione e comunità per i media digitali e i professionisti dell'editoria, nei nuovi media e nella tecnologia.

    • I migliori strumenti
    • SEO per gli editori
    • Politica sulla riservatezza
    • Politica editoriale
    • Mappa del sito
    • Cerca per azienda
    Facebook X-twitter Lento Linkedin

    STATO DELL’EDITORIA DIGITALE – COPYRIGHT 2025

    Logo GPP

    Gestire milioni

    Migliore coinvolgimento del pubblico senza mal di testa tecnologica

    Come evitare la trappola tecnologica Goldilocks che provoca il caos per dare al pubblico ciò che vogliono

    11 giugno 2025

    14:00 BST

    Evento on-line

    Saperne di più