Taktik pertumbuhan penerbit untuk musim pilihan raya | WEBINAR

Ketahui Lebih Lanjut

SODP

SODP Media

  • Insights
    • Articles
      • Audience Development
      • Content Strategy
      • Digital Publishing
      • Monetization
      • SEO
      • Digital Platforms & Tools
    • Top Tools & Reviews
    • Opinion
    • Podcast
  • Education
    • Publisher SEO Course
    • Events
      • Monetization Week 2025
  • Resources
  • Community
    • Slack Channel
    • Newsletter
  • About
    • About Us
    • Contact Us
    • Editorial Policy
  • English
sodp logo
SODP logo
    Cari
    Tutup kotak carian ini.
    Log masuk
    • Wawasan
      • Podcast
      • Artikel
        • Pembangunan Khalayak
        • Strategi Kandungan
        • Penerbitan Digital
        • Pengewangan
        • SEO
        • Platform & Alat Digital
      • Alat & Ulasan Terbaik
        • Artikel
        • Alat & Ulasan Terbaik
        • Pendapat
        • Podcast
        • Pembangunan Khalayak
        • Strategi Kandungan
        • Penerbitan Digital
        • Pengewangan
        • SEO
        • Platform & Alat Digital
        • Platform CMS Tanpa Kepala
        • Platform Penerbitan Digital
        • Perisian Kalendar Editorial
        • Apl Majalah
        • Platform Surat Berita E-mel
        • Lagi Senarai Alat Terbaik
    • Pendidikan
      • Kursus SEO Penerbit
        • Kursus SEO Penerbit
        • Peristiwa
        • Menguruskan berjuta -juta
        • Lihat semua
    • Sumber
    • Komuniti
      • Saluran Slack
      • Waktu Pejabat
      • Surat berita
        • Saluran Slack
        • Surat berita
    • Tentang
      • Tentang Kami
      • Hubungi Kami
      • Dasar Editorial
        • Tentang Kami
        • Hubungi Kami
        • Dasar Editorial
    pemegang tempat
    SODP logo
    Menjadi Rakan Kongsi Jenama

    Laman Utama ▸ Platform & Alat Digital ▸ Meletakkan DeepSeek ke ujian: Bagaimana prestasinya membandingkan dengan alat AI yang lain

    Meletakkan Deepseek ke Ujian: Bagaimana Prestasinya Membandingkan Dengan Alat AI Lain

    Simon ThorneSimon Thorne
    5 Februari 2025
    Fakta disemak oleh The Conversation
    Perbualan
    Perbualan

    The Conversation ialah kerjasama unik antara ahli akademik dan wartawan yang dalam sedekad telah menjadi penerbit berita dan analisis berasaskan penyelidikan terkemuka di dunia. Semua yang anda baca di halaman ini adalah … Baca lebih lanjut

    Disunting oleh Simon Thorne
    Simon Thorne
    Simon Thorne

    Penyelidikan saya kebanyakannya didasarkan pada sains komputer dengan aplikasi dalam sistem maklumat. Saya fikir diri saya sebagai lebih banyak saintis semulajadi yang lebih suka siasatan saintifik ketika menjalankan penyelidikan. Rese PhD saya ... Baca lebih lanjut

    Deepseek

    Model Bahasa Besar Deepseek baru China (LLM) telah mengganggu pasaran yang didominasi AS , yang menawarkan model chatbot berprestasi tinggi dengan kos yang jauh lebih rendah.

    Kos pembangunan yang dikurangkan dan harga langganan yang lebih rendah berbanding dengan alat AI AS yang menyumbang kepada pembuat cip Amerika NVIDIA kehilangan US $ 600 bilion (£ 480 bilion) dalam nilai pasaran selama satu hari. NVIDIA membuat cip komputer digunakan untuk melatih majoriti LLM, teknologi asas yang digunakan dalam chatgpt dan chatbots AI yang lain. DeepSeek menggunakan cip Nvidia H800 yang lebih murah ke atas versi canggih yang lebih mahal.

    Pemaju Chatgpt Openai dilaporkan menghabiskan masa antara AS $ 100 juta dan US $ 1 bilion pada pembangunan versi produknya yang sangat baru -baru ini yang dipanggil O1. Sebaliknya, DeepSeek mencapai latihannya dalam masa dua bulan dengan kos sebanyak AS $ 5.6 juta menggunakan satu siri inovasi pintar.

    Tetapi seberapa baik DeepSeek's AI Chatbot, R1, bandingkan dengan alat AI yang lain, yang serupa dengan prestasi?

    DeepSeek mendakwa modelnya berbanding dengan tawaran Openai, walaupun melebihi model O1 dalam ujian penanda aras tertentu. Walau bagaimanapun, tanda aras yang menggunakan ujian bahasa multitask yang besar (MMLU) menilai pengetahuan merentasi pelbagai subjek menggunakan pelbagai soalan pilihan. Ramai LLM dilatih dan dioptimumkan untuk ujian sedemikian, menjadikannya tidak boleh dipercayai sebagai petunjuk sebenar prestasi dunia sebenar.

    Metodologi alternatif untuk penilaian objektif LLMS menggunakan satu set ujian yang dibangunkan oleh penyelidik di universiti Cardiff Metropolitan, Bristol dan Cardiff - dikenali secara kolektif sebagai Kumpulan Pemerhatian Pengetahuan (KOG). Ujian ini menyiasat keupayaan untuk meniru bahasa dan pengetahuan manusia melalui soalan yang memerlukan pemahaman manusia yang tersirat untuk dijawab. Ujian teras dirahsiakan, untuk mengelakkan syarikat LLM melatih model mereka untuk ujian ini.

    KOG mengerahkan ujian awam yang diilhamkan oleh kerja oleh Colin Fraser, seorang saintis data di Meta , untuk menilai DeepSeek terhadap LLM lain. Keputusan berikut diperhatikan:

    Ujian Prestasi LLM.
    Ujian Prestasi LLM.

    Ujian yang digunakan untuk menghasilkan jadual ini adalah "musuh". Dalam erti kata lain, mereka direka untuk menjadi "keras" dan untuk menguji LLM dengan cara yang tidak bersimpati dengan cara mereka direka. Ini bermakna prestasi model -model ini dalam ujian ini mungkin berbeza dengan prestasi mereka dalam ujian penanda aras arus perdana.

    DeepSeek menjaringkan 5.5 daripada 6, mengatasi Openai's O1-model penalaran lanjutan (dikenali sebagai "rantai-of-shought")-serta Chatgpt-4o, versi percuma ChatGPT. Tetapi Deepseek sedikit lebih baik daripada Claudeai dan Openai's O1 Mini, yang kedua -duanya menjaringkan 6/6 yang sempurna. Adalah menarik bahawa O1 kurang berprestasi terhadap rakan sejawatannya yang "lebih kecil", O1 Mini.

    Deepthink R1-alat AI yang dipikirkan rantaian yang dibuat oleh DeepSeek-kurang baik berbanding dengan DeepSeek dengan skor 3.5.

    Hasil ini menunjukkan bagaimana chatbot DeepSeek yang kompetitif sudah, mengalahkan model perdana Openai. Ia mungkin merangsang pembangunan lebih lanjut untuk Deepseek, yang kini mempunyai asas yang kukuh untuk dibina. Walau bagaimanapun, syarikat teknologi Cina mempunyai satu masalah yang serius yang LLM lain tidak: penapisan.

    Cabaran penapisan

    Walaupun prestasi dan populariti yang kuat, DeepSeek telah menghadapi kritikan terhadap tindak balasnya terhadap topik sensitif politik di China. Sebagai contoh, meminta yang berkaitan dengan Tiananmen Square, Taiwan, Uyghur Muslim dan pergerakan demokratik dipenuhi dengan respons: "Maaf, itu adalah di luar skop saya sekarang."

    Tetapi isu ini tidak semestinya unik untuk Deepseek, dan potensi untuk pengaruh politik dan penapisan di LLMs lebih umum adalah kebimbangan yang semakin meningkat. Pengumuman projek Donald Trump $ 500 bilion Stargate LLM , yang melibatkan Openai, Nvidia, Oracle, Microsoft, dan ARM, juga menimbulkan ketakutan terhadap pengaruh politik.

    Di samping itu, keputusan META baru-baru ini untuk meninggalkan pemeriksaan fakta di Facebook dan Instagram mencadangkan trend yang semakin meningkat ke arah populisme atas kebenaran.

    Kandungan daripada rakan kongsi kami

    Bina panduan rangkaian iklan

    Cara Membina Rangkaian Iklan Anda Sendiri: Panduan Langkah demi Langkah

    Ai, pedang kreativiti bermata dua, dan mengapa penerbit mesti memeluknya

    Ai, pedang kreativiti bermata dua, dan mengapa penerbit mesti memeluknya

    Mengapa Penerbit Dalam Talian Memerlukan VPN: Melindungi Data, Sumber, dan Pendapatan

    Mengapa Penerbit Dalam Talian Memerlukan VPN: Melindungi Data, Sumber, dan Pendapatan

    Ketibaan Deepseek telah menyebabkan gangguan serius ke pasaran LLM. Syarikat -syarikat AS seperti OpenAI dan Anthropic akan dipaksa untuk berinovasi produk mereka untuk mengekalkan kaitan dan memadankan prestasi dan kosnya.

    Kejayaan DeepSeek sudah mencabar status quo, menunjukkan bahawa model LLM berprestasi tinggi boleh dibangunkan tanpa belanjawan bilion dolar. Ia juga menyoroti risiko penapisan LLM, penyebaran maklumat salah, dan mengapa penilaian bebas.

    Memandangkan LLM menjadi lebih tertanam dalam politik dan perniagaan global, ketelusan dan akauntabiliti akan menjadi penting untuk memastikan bahawa masa depan LLM adalah selamat, berguna dan boleh dipercayai.

    Simon Thorne, Pensyarah Kanan dalam Sistem Pengkomputeran dan Maklumat, Cardiff Metropolitan University

    Artikel ini diterbitkan semula dari perbualan di bawah lesen Creative Commons. Baca artikel asal .

    Pilihan Editor
    Apakah Pencipta Kandungan Apa, Mengapa dan Bagaimana Ekonomi Pencipta
    Strategi Kandungan

    Apakah Pencipta Kandungan?

    Platform Surat Berita E-mel Terbaik untuk Penerbit
    Platform & Alat Digital

    8 Platform Surat Berita E-mel Terbaik untuk Penerbit pada 2024

    SEO Berita Google
    SEO

    Panduan SEO Berita Google 2024: Amalan Terbaik untuk Penerbit Berita

    Catatan Berkaitan

    • Alat Penulisan AI Terbaik
      10 Alat Penulisan AI Terbaik
    • Alat Transkripsi AI Terbaik
      11 Alat Transkripsi AI Terbaik pada 2024
    • Alat AI untuk Penciptaan Kandungan
      12 Alat AI Terbaik untuk Penciptaan Kandungan
    • 17 Alat Pemantauan Media Terbaik pada 2023
      13 alat pemantauan media terbaik pada tahun 2025
    SODP logo

    State of Digital Publishing sedang mencipta penerbitan dan komuniti baharu untuk media digital dan profesional penerbitan, dalam media dan teknologi baharu.

    • Alat teratas
    • SEO untuk penerbit
    • Dasar privasi
    • Dasar editorial
    • Peta laman
    • Cari mengikut syarikat
    Facebook X-twitter Kendur Linkedin

    NEGERI PENERBITAN DIGITAL – HAK CIPTA 2025