Mga taktika sa paglago ng publisher para sa panahon ng halalan | WEBINAR

Matuto pa

SODP

SODP Media

  • Insights
    • Articles
      • Audience Development
      • Content Strategy
      • Digital Publishing
      • Monetization
      • SEO
      • Digital Platforms & Tools
    • Top Tools & Reviews
    • Opinion
    • Podcast
  • Education
    • Publisher SEO Course
    • Events
      • Monetization Week 2025
  • Resources
  • Community
    • Slack Channel
    • Newsletter
  • About
    • About Us
    • Contact Us
    • Editorial Policy
  • English
sodp logo
SODP logo
    Maghanap
    Isara ang box para sa paghahanap na ito.
    Mag-login
    • Mga Insight
      • Podcast
      • Mga artikulo
        • Pag-unlad ng Madla
        • Diskarte sa Nilalaman
        • Digital Publishing
        • Monetization
        • SEO
        • Mga Digital na Platform at Tool
      • Mga Nangungunang Tool at Review
        • Mga artikulo
        • Mga Nangungunang Tool at Review
        • Opinyon
        • Mga podcast
        • Pag-unlad ng Madla
        • Diskarte sa Nilalaman
        • Digital Publishing
        • Monetization
        • SEO
        • Mga Digital na Platform at Tool
        • Mga Platform ng CMS na walang ulo
        • Mga Digital Publishing Platform
        • Editoryal Calendar Software
        • Mga App ng Magazine
        • Mga Platform ng Newsletter sa Email
        • Higit pang Mga Listahan ng Pinakamahusay na Tool
    • Edukasyon
      • Publisher SEO Course
        • Publisher SEO Course
        • Mga kaganapan
        • Pamamahala ng milyon -milyon
        • Tingnan lahat
    • Mga mapagkukunan
    • Komunidad
      • Slack Channel
      • Mga Oras ng Opisina
      • Newsletter
        • Slack Channel
        • Newsletter
    • Tungkol sa
      • Tungkol sa Amin
      • Makipag-ugnayan sa Amin
      • Patakaran sa Editoryal
        • Tungkol sa Amin
        • Makipag-ugnayan sa Amin
        • Patakaran sa Editoryal
    placeholder
    SODP logo
    Maging isang Brand Partner

    Home ▸ Mga Digital Platform at Tool ▸ Deepseek: Paano Ang Isang Maliit na Chinese AI Company ay Nanginginig sa Amin Tech Heavyweights

    Deepseek: Paano ang isang maliit na kumpanya ng AI na Tsino ay nanginginig sa amin ng mga heavyweights ng tech

    Tongliang LiuTongliang Liu
    Enero 28, 2025
    Sinuri ng katotohanan ng The Conversation
    Ang Pag-uusap
    Ang Pag-uusap

    Ang Pag-uusap ay isang natatanging pakikipagtulungan sa pagitan ng mga akademya at mga mamamahayag na sa loob ng isang dekada ay naging nangungunang publisher sa mundo ng mga balita at pagsusuri na nakabatay sa pananaliksik. Lahat ng mababasa mo sa mga pahinang ito ay … Magbasa pa

    Na-edit ni Tongliang Liu
    Tongliang Liu
    Tongliang Liu

    Si Tongliang Liu ay isang associate professor sa pag -aaral ng machine kasama ang School of Computer Science at ang Direktor ng Sydney AI Center sa University of Sydney. Malawak siyang interesado sa larangan ng mapagkakatiwalaan ... Magbasa nang higit pa

    Deepseek kung paano ang isang maliit na kumpanya ng Tsino na AI ay nanginginig sa amin tech heavyweights

    Ang Chinese Artipisyal na Intelligence (AI) Company Deepseek ay nagpadala ng mga shockwaves sa pamamagitan ng tech na komunidad , kasama ang pagpapalabas ng mga napaka-mahusay na mga modelo ng AI na maaaring makipagkumpetensya sa mga produktong pagputol mula sa mga kumpanya ng US tulad ng OpenAi at Anthropic.

    Itinatag noong 2023, nakamit ng Deepseek ang mga resulta nito na may isang maliit na bahagi ng cash at computing power ng mga katunggali nito.

    Ang "pangangatuwiran" na modelo ng R1 ng Deepseek, na inilabas noong nakaraang linggo, ay nagtulak ng kaguluhan sa mga mananaliksik, pagkabigla sa mga namumuhunan, at mga tugon mula sa mga bigat ng AI. Sinundan ang kumpanya noong Enero 28 na may isang modelo na maaaring gumana sa mga imahe pati na rin ang teksto.

    Ang Deepseek's R1 ay isang kahanga -hangang modelo, lalo na sa paligid ng kung ano ang kanilang maihatid para sa presyo.

    Malinaw na maghahatid kami ng mas mahusay na mga modelo at din ito ay lehitimo na magkaroon ng isang bagong katunggali! Hihila kami ng ilang mga paglabas.

    - Sam Altman (@sama) Enero 28, 2025

    Kaya ano ang nagawa ng Deepseek, at paano ito nagawa?

    Ano ang ginawa ni Deepseek

    Noong Disyembre, pinakawalan ng Deepseek ang modelo ng V3 . Ito ay isang napakalakas na "pamantayang" malaking modelo ng wika na gumaganap sa isang katulad na antas sa GPT-4O ng OpenAi at Claude ng Anthropic 3.5.

    Habang ang mga modelong ito ay madaling kapitan ng mga pagkakamali at kung minsan ay bumubuo ng kanilang sariling mga katotohanan , maaari silang magsagawa ng mga gawain tulad ng pagsagot sa mga katanungan, pagsulat ng mga sanaysay at pagbuo ng computer code. Sa ilang mga pagsubok sa paglutas ng problema at pangangatuwiran sa matematika, mas mahusay ang marka nila kaysa sa average na tao.

    Ang V3 ay sinanay sa isang naiulat na gastos na halos US $ 5.58 milyon. Ito ay kapansin-pansing mas mura kaysa sa GPT-4, halimbawa, na nagkakahalaga ng higit sa US $ 100 milyon upang mabuo.

    Inaangkin din ng Deepseek na sinanay ang V3 gamit ang halos 2,000 dalubhasang mga computer chips, partikular na ang mga H800 GPU na ginawa ng NVIDIA . Ito ay muli mas kaunti kaysa sa iba pang mga kumpanya, na maaaring gumamit ng hanggang sa 16,000 ng mas malakas na H100 chips.

    On January 20, DeepSeek released another model, called R1 . Ito ay isang tinatawag na "pangangatuwiran" na modelo, na sumusubok na magtrabaho sa pamamagitan ng mga kumplikadong problema nang hakbang-hakbang. Ang mga modelong ito ay tila mas mahusay sa maraming mga gawain na nangangailangan ng konteksto at may maraming magkakaugnay na mga bahagi, tulad ng pag -unawa sa pagbabasa at pagpaplano ng estratehikong.

    Ang modelo ng R1 ay isang naka -tweak na bersyon ng V3, na binago sa isang pamamaraan na tinatawag na pag -aaral ng pampalakas. Ang R1 ay lilitaw na gumana sa isang katulad na antas sa OpenAi's O1 , na inilabas noong nakaraang taon.

    Ginamit din ng Deepseek ang parehong pamamaraan upang gumawa ng mga "pangangatuwiran" na mga bersyon ng mga maliliit na open-source na modelo na maaaring tumakbo sa mga computer sa bahay.

    Ang paglabas na ito ay nagdulot ng isang malaking pag-agos ng interes sa Deepseek, na nagmamaneho ng katanyagan ng V3 na pinapagana ng chatbot app at nag-trigger ng isang napakalaking pag-crash ng presyo sa mga stock ng tech habang sinuri muli ng mga namumuhunan ang industriya ng AI. Sa oras ng pagsulat, ang Chipmaker Nvidia ay nawala sa paligid ng US $ 600 bilyon na halaga.

    Gaano kalalim ito

    Ang mga breakthrough ng Deepseek ay nakamit ang higit na kahusayan: pagkuha ng magagandang resulta na may mas kaunting mga mapagkukunan. Sa partikular, ang mga developer ng Deepseek ay nagpayunir ng dalawang pamamaraan na maaaring pinagtibay ng mga mananaliksik ng AI.

    Ang una ay may kinalaman sa isang ideya sa matematika na tinatawag na "sparsity". Ang mga modelo ng AI ay may maraming mga parameter na tumutukoy sa kanilang mga tugon sa mga input (ang V3 ay may halos 671 bilyon), ngunit isang maliit na bahagi lamang ng mga parameter na ito ang ginagamit para sa anumang naibigay na input.

    Gayunpaman, ang paghula kung aling mga parameter ang kakailanganin ay hindi madali. Gumamit ang Deepseek ng isang bagong pamamaraan upang gawin ito, at pagkatapos ay sinanay lamang ang mga parameter na iyon. Bilang isang resulta, ang mga modelo nito ay nangangailangan ng mas kaunting pagsasanay kaysa sa isang maginoo na diskarte.

    Ang iba pang trick ay may kinalaman sa kung paano nag -iimbak ng impormasyon ang V3 sa memorya ng computer. Natagpuan ng Deepseek ang isang matalino na paraan upang i -compress ang may -katuturang data, kaya mas madaling mag -imbak at mabilis na ma -access.

    Inalog ng Deepseek ang industriya ng multi-bilyong dolyar na AI. Robert Way/Shutterstock
    Inalog ng Deepseek ang industriya ng multi-bilyong dolyar na AI. Robert Way/Shutterstock

    Ano ang ibig sabihin nito

    Ang mga modelo at pamamaraan ng DeepSeek ay pinakawalan sa ilalim ng libreng lisensya ng MIT , na nangangahulugang ang sinuman ay maaaring mag -download at baguhin ang mga ito.

    Nilalaman mula sa aming mga kasosyo

    Bumuo ng gabay sa network ng ad

    Paano Bumuo ng Iyong Sariling AD Network: Isang Gabay sa Hakbang-Hakbang

    Ai, ang dobleng talim ng pagkamalikhain, at kung bakit dapat yakapin ito ng mga publisher

    Ai, ang dobleng talim ng pagkamalikhain, at kung bakit dapat yakapin ito ng mga publisher

    Bakit ang mga online publisher ay nangangailangan ng isang VPN: Pagprotekta ng data, mapagkukunan, at kita

    Bakit ang mga online publisher ay nangangailangan ng isang VPN: Pagprotekta ng data, mapagkukunan, at kita

    Habang ito ay maaaring masamang balita para sa ilang mga kumpanya ng AI - na ang kita ay maaaring mabura sa pagkakaroon ng malayang magagamit, malakas na mga modelo - ito ay mahusay na balita para sa mas malawak na pamayanan ng pananaliksik ng AI.

    Sa kasalukuyan, maraming pananaliksik sa AI ang nangangailangan ng pag -access sa napakalaking halaga ng mga mapagkukunan ng computing. Ang mga mananaliksik tulad ng aking sarili na nakabase sa mga unibersidad (o kahit saan maliban sa mga malalaking kumpanya ng tech) ay may limitadong kakayahang magsagawa ng mga pagsubok at eksperimento.

    Ang mas mahusay na mga modelo at pamamaraan ay nagbabago sa sitwasyon. Ang eksperimento at pag -unlad ay maaari na ngayong maging mas madali para sa amin.

    Para sa mga mamimili, ang pag -access sa AI ay maaari ring maging mas mura. Marami pang mga modelo ng AI ang maaaring patakbuhin sa sariling mga aparato ng mga gumagamit, tulad ng mga laptop o telepono, sa halip na tumakbo "sa ulap" para sa isang bayad sa subscription.

    Para sa mga mananaliksik na mayroon nang maraming mga mapagkukunan, ang higit na kahusayan ay maaaring magkaroon ng mas kaunting epekto. Hindi malinaw kung ang diskarte ng Deepseek ay makakatulong upang makagawa ng mga modelo na may mas mahusay na pagganap sa pangkalahatan, o simpleng mga modelo na mas mahusay.

    Si Tongliang Liu, Associate Professor ng Machine Learning at Direktor ng Sydney AI Center, University of Sydney

    Ang artikulong ito ay nai -publish mula sa pag -uusap sa ilalim ng isang lisensya ng Creative Commons. Basahin ang orihinal na artikulo .

    Mga Pinili ng Editor
    Ano ang Tagalikha ng Nilalaman Ang Ano, Bakit at Paano ng Ekonomiya ng Lumikha
    Diskarte sa Nilalaman

    Ano ang Tagalikha ng Nilalaman?

    Pinakamahusay na Mga Platform ng Newsletter sa Email para sa Mga Publisher
    Mga Digital na Platform at Tool

    8 Pinakamahusay na Email Newsletter Platform para sa Mga Publisher sa 2024

    Google News SEO
    SEO

    Gabay sa SEO ng Google News 2024: Pinakamahuhusay na Kasanayan para sa Mga Publisher ng Balita

    Mga Kaugnay na Post

    • Deepseek
      Paglalagay ng Deepseek sa Pagsubok: Paano Inihahambing ang Pagganap nito Laban sa Iba pang Mga Tool sa AI
    • Clara Soteras Q&A: SEO Opportunities & Battles for Digital Publishers
      Clara Soteras Q&A: SEO Opportunities & Battles for Digital Publishers
    • Pinakamahusay na AI Writing Tools
      10 Pinakamahusay na AI Writing Tools
    • Jan Thoresen
      Labrador CMS Q&A: Moving Beyond a Headless CMS for Greater Publisher Flexibility and Speed
    SODP logo

    Ang State of Digital Publishing ay lumilikha ng bagong publikasyon at komunidad para sa digital media at mga propesyonal sa pag-publish, sa bagong media at teknolohiya.

    • Mga nangungunang tool
    • SEO para sa mga publisher
    • Patakaran sa privacy
    • Patakaran sa editoryal
    • Sitemap
    • Maghanap ayon sa kumpanya
    Facebook X-twitter Slack Linkin

    ESTADO NG DIGITAL PUBLISHING – COPYRIGHT 2025

    Logo ng GPP

    Pamamahala ng milyon -milyon

    Mas mahusay na pakikipag -ugnayan sa madla nang walang sakit sa ulo ng tech

    Paano maiwasan ang Goldilocks Tech Trap na naganap sa pagbibigay ng mga madla kung ano ang gusto nila

    11 Hunyo 2025

    2 PM BST

    Online na Kaganapan

    Matuto pa