Taktik pertumbuhan penerbit untuk musim pilihan raya | WEBINAR

Ketahui Lebih Lanjut

SODP

SODP Media

  • Education
    • Articles
      • Audience Development
      • Content Strategy
      • Digital Publishing
      • Monetization
      • SEO
      • Digital Platforms & Tools
    • Opinion
    • Podcast
    • Events
      • SODP Dinner Event London 2025
      • SODP Dinner Event Dubai 2025
      • SODP Dinner Event California 2025
      • All Events
  • Top Tools & Reviews
  • Research & Resources
  • Community
    • Slack Channel
    • Newsletter
  • About
    • About Us
    • Contact Us
    • Editorial Policy
  • English
sodp logo
SODP logo
    Cari
    Tutup kotak carian ini.
    Log masuk
    • Pendidikan
      • Podcast
      • Artikel
        • Pembangunan Khalayak
        • Strategi Kandungan
        • Penerbitan Digital
        • Pengewangan
        • SEO
        • Platform & Alat Digital
        • Artikel
        • Pendapat
        • Podcast
        • Peristiwa
        • Pembangunan Khalayak
        • Strategi Kandungan
        • Penerbitan Digital
        • Pengewangan
        • SEO
        • Platform & Alat Digital
        • Acara Makan Malam California 2025
        • PUBTECH2025
        • Lihat Semua
    • Alat & Ulasan Terbaik
        • Platform CMS Tanpa Kepala
        • Platform Penerbitan Digital
        • Perisian Kalendar Editorial
        • Apl Majalah
        • Platform Surat Berita E-mel
        • Lagi Senarai Alat Terbaik
        • Ulasan
    • Penyelidikan & Sumber
    • Komuniti
      • Saluran Slack
      • Waktu Pejabat
      • Surat berita
        • Saluran Slack
        • Surat berita
    • Tentang
      • Tentang Kami
      • Hubungi Kami
      • Dasar Editorial
        • Tentang Kami
        • Hubungi Kami
        • Dasar Editorial
    pemegang tempat
    SODP logo
    Menjadi Rakan Kongsi Jenama
    Laman Utama > Kursus SEO Penerbit > Bab 2: SEO Teknikal > Kelajuan dan Kekerapan Merangkak
    6

    Kelajuan dan Kekerapan Merangkak

    Kelajuan dan Kekerapan Merangkak
    Modul Sebelumnya
    Kembali ke Bab
    Modul Seterusnya

    Objektif Pembelajaran

    Selepas melalui modul ini, anda harus memahami belanjawan rangkak, cara ia diperuntukkan ke tapak web dan cara mengoptimumkannya.

    Tempoh Video

    23:27

    Jawab Kuiz

    Ambil Kuiz Modul Semasa

    Bahan

    Templat sedia untuk digunakan

    Sumber

    Laporan dan Sumber

    Had masa: 0

    Ringkasan Kuiz

    0 daripada 9 soalan selesai

    Soalan:

    Maklumat

    Anda telah pun menyelesaikan kuiz sebelum ini. Oleh itu anda tidak boleh memulakannya semula.

    Kuiz sedang dimuatkan…

    Anda mesti mendaftar masuk atau mendaftar untuk memulakan kuiz.

    Anda mesti melengkapkan perkara berikut terlebih dahulu:

    Keputusan

    Kuiz selesai. Keputusan sedang direkodkan.

    Keputusan

    0 dari 9 soalan dijawab dengan betul

    Masa anda:

    Masa telah berlalu

    Anda telah mencapai 0 daripada 0 mata, ( 0 )

    Mata Diperolehi: 0 daripada 0 , ( 0 )
    0 Esei(s) Belum Selesai (Possible Point(s): 0 )

    Kategori

    1. Tidak dikategorikan 0%
    1. 1
    2. 2
    3. 3
    4. 4
    5. 5
    6. 6
    7. 7
    8. 8
    9. 9
    1. semasa
    2. Semakan
    3. Dijawab
    4. Betul
    5. tak betul
    1. Soalan 1 dari 9
      1. soalan

      Berapakah bajet merangkak?

      Betul
      tak betul
    2. Soalan 2 dari 9
      2. soalan

      Ukuran seberapa kerap Google ingin kembali (merangkak) halaman/laman web tertentu dipanggil ____.

      Betul
      tak betul
    3. Soalan 3 dari 9
      3. soalan

      Belanjawan merangkak secara amnya hanya menjadi kebimbangan bagi penerbit yang mempunyai lebih daripada berapa banyak halaman di laman web mereka?

      Betul
      tak betul
    4. Soalan 4 dari 9
      4. soalan

      Di mana anda boleh mencari statistik merangkak?

      Betul
      tak betul
    5. Soalan 5 dari 9
      5. soalan

      Apa itu robots.txt?

      Betul
      tak betul
    6. Soalan 6 dari 9
      6. soalan

      Antara berikut yang manakah dapat mengurangkan anggaran merangkak anda?

      Betul
      tak betul
    7. Soalan 7 dari 9
      7. soalan

      Antara tugas berikut yang manakah crawler pihak ketiga seperti Semrush atau menjerit katak tidak dapat dilakukan?

      Betul
      tak betul
    8. Soalan 8 dari 9
      8. soalan

      Apa yang berikut Tag berkomunikasi dengan crawler?

      Betul
      tak betul
    9. Soalan 9 dari 9
      9. soalan

      Apakah maksud kod ralat 503?

      Betul
      tak betul

    2.6.1 Apakah Belanjawan Merangkak?

    Belanjawan rangkak ialah bilangan halaman di tapak web anda yang akan dirangkak oleh perangkak web dalam jangka masa tertentu.

    Setiap kali anda menekan butang terbitkan, Google perlu merangkak dan mengindeks kandungan untuk mula muncul dalam hasil carian. Memandangkan skala dan volum kandungan di internet, merangkak menjadi sumber berharga yang perlu dianggarkan dan dicatuan untuk penggunaan yang paling cekap.

    Secara ringkasnya, sukar untuk Google merangkak dan mengindeks setiap halaman di internet setiap hari. Jadi, Google merangkak setiap tapak web mengikut belanjawan yang ditetapkan.

    2.6.2 Bagaimanakah Belanjawan Crawl Ditugaskan kepada Laman Web?

    Belanjawan rangkak diperuntukkan kepada tapak web berdasarkan dua faktor — had rangkak dan permintaan rangkak.

    Had Merangkak

    Ini ialah kapasiti dan/atau kesediaan tapak web untuk dirangkak.

    Tidak setiap laman web dibina untuk dirangkak setiap hari. Merangkak melibatkan Googlebot menghantar permintaan ke pelayan tapak web anda yang, jika dilakukan terlalu kerap, boleh menekankan kapasiti pelayan.

    Selain itu, bukan setiap penerbit mahu tapak mereka dirangkak secara berterusan.

    Permintaan Merangkak

    Permintaan rangkak ialah ukuran kekerapan halaman tertentu mahu (semula) dirangkak. Halaman atau halaman popular yang kerap dikemas kini perlu dirangkak dan dirangkak semula dengan lebih kerap.

    2.6.3 Mengapakah Penerbit Perlu Mementingkan Belanjawan Merangkak?

    Jika Google tidak dapat merangkak dan mengindeks kandungan anda, kandungan itu tidak akan dipaparkan pada hasil carian.

    Walau bagaimanapun, belanjawan rangkak biasanya hanya membimbangkan penerbit sederhana hingga besar yang mempunyai lebih daripada 10,000 halaman di tapak web mereka. Penerbit yang lebih kecil tidak perlu terlalu risau tentang belanjawan merangkak.

    Penerbit dengan 10,000 atau lebih halaman di laman web mereka, bagaimanapun, akan mahu mengelakkan halaman Googlebot merangkak yang tidak penting. Meletakkan belanjawan merangkak anda pada kandungan yang tidak relevan atau kurang penting bermakna halaman nilai yang lebih tinggi mungkin tidak merangkak.

    Lebih -lebih lagi, penerbit berita akan ingin berhati -hati mengenai belanjawan merangkak yang dibazirkan memandangkan Crawling adalah salah satu daripada tiga cara Google News mendapati kandungan segar tepat pada masanya. Dua yang lain adalah dengan menggunakan SiteMaps dan Google Publisher Centre, yang telah kami pelajari lebih lanjut di Modul Pusat Google News dan Google Pusat Google

    2.6.4 Mengoptimumkan untuk Crawler

    Mengoptimumkan kekerapan dan kelajuan yang mana Googlebot merangkak laman web anda melibatkan pemantauan pelbagai pembolehubah. Kami bermula dengan menyenaraikan faktor -faktor yang paling penting yang terlibat dalam mengoptimumkan belanjawan dan kekerapan merangkak.

    Memantau merangkak kandungan

    Kedua -dua taktik yang paling berguna untuk memantau bagaimana kandungan anda merangkak adalah menganalisis fail log dan laporan statistik merangkak Google Search (GSC).

    1. Analisis fail log

    Fail log adalah dokumen teks yang merekodkan setiap aktiviti di pelayan laman web anda. Ini termasuk semua data mengenai permintaan merangkak, permintaan halaman, permintaan imej, permintaan untuk fail JavaScript dan sebarang sumber lain yang diperlukan untuk menjalankan laman web anda.

    Untuk tujuan SEO teknikal, analisis fail log membantu menentukan banyak maklumat berguna tentang merangkak URL, termasuk tetapi tidak terhad kepada:

    • URL yang telah merangkak.
    • URL yang paling kerap merangkak.
    • Mengenalpasti jika mana-mana URL bernilai rendah atau tidak penting sedang merangkak, dengan itu membuang belanjawan merangkak.

    Cara melakukan ini

    Analisis fail log adalah tugas yang memerlukan beberapa tahap kebiasaan teknikal dengan backend laman web. Atas sebab ini, kami mengesyorkan menggunakan perisian Log File Analyzer. Terdapat beberapa alat analisis log percuma dan berbayar yang tersedia seperti Graylog , Loggly , Stack Elastic , Screaming Frog Log Analyzer dan Nagios untuk menamakan beberapa.

    Jika anda seorang pemaju atau pentadbir sistem yang berpengalaman, anda juga boleh melakukan analisis fail log secara manual juga.

    Untuk melakukan ini, ikuti langkah -langkah ini:

    1. Log masuk ke canel penyedia hosting anda
    1. Navigasi ke Meric dan kemudian akses mentah
    1. Muat turun fail log

    Sebaik sahaja anda telah memuat turun fail log, anda boleh menukar pelanjutan ke .csv dan membukanya menggunakan Microsoft Excel atau Google Sheets. Seperti yang kita katakan, bagaimanapun, pendekatan ini memerlukan tahap kepakaran tertentu untuk memahami fail log.

    Anda juga boleh mengakses fail log menggunakan klien FTP dengan memasukkan laluan fail log. Laluan fail log biasa kelihatan seperti ini:

    Nama pelayan (contohnya, Apache) /var/log/access.log

    Walau bagaimanapun, lebih mudah untuk menggunakan alat analisis log sebaliknya. Sebaik sahaja anda telah memuat naik fail log ke dalam alat, anda boleh menyusun data menggunakan beberapa penapis. Sebagai contoh, anda dapat melihat URL mana yang paling kerap diakses oleh Googlebot.

    Anda juga akan dapat melihat sama ada Googlebot telah mengakses URL yang tidak penting atau rendah seperti URL navigasi faceted, URL pendua, dan lain-lain. Mengenalpasti ini adalah penting kerana mereka membuang belanjawan merangkak anda.

    Lihat tangkapan skrin di bawah, diambil dari menganalisis fail Log SEO menjerit, untuk melihat apa yang kami maksudkan.

    Analisis fail log

    2. Laporan Statistik merangkak GSC

    GSC menyediakan pemilik laman web dengan data dan pandangan yang komprehensif tentang bagaimana Google merangkak kandungan mereka. Ini termasuk laporan terperinci mengenai:

    • Fail/halaman mana yang merangkak dan untuk tujuan apa.
    • Jenis Googlebot (berita, video, mudah alih, dll) melakukan merangkak.
    • Jumlah permintaan merangkak, dll.

    GSC juga mudah difahami untuk memahami graf dan carta untuk menyediakan pemilik laman web dengan lebih banyak maklumat. Tangkapan skrin di bawah adalah apa yang dilaporkan oleh statistik merangkak tipikal mengenai GSC.

    Laporan Statistik merangkak GSC

    Sumber

    GSC juga membolehkan anda tahu jika ada masalah dengan merangkak. Ia memeriksa beberapa kesilapan dan memberikan setiap kod. Kesalahan yang paling biasa yang disemak oleh GSC termasuk:

    • Ralat pelayan [5xx]
    • Ralat ubah hala
    • URL yang diserahkan disekat oleh robots.txt
    • URL yang diserahkan bertanda 'noindex'
    • URL yang diserahkan nampaknya 404 lembut
    • URL yang dikemukakan kembali 401
    • URL yang diserahkan tidak ditemui (404)
    • URL yang dikemukakan kembali 403
    • URL yang diserahkan disekat kerana isu 4xx yang lain

    Laporan GSC juga menunjukkan berapa banyak halaman yang telah terjejas oleh setiap ralat di samping status pengesahan.

    Cara melakukan ini

    Berikut adalah cara anda boleh mengakses laporan Statistik GSC Crawl untuk laman web atau laman web anda:

    1. Untuk menggunakan GSC, anda perlu mendaftar .
    1. Seterusnya, anda perlu membuktikan anda memiliki laman web yang anda ingin tambahkan ke GSC. Ini boleh dilakukan dengan menambah apa yang Google memanggil "harta". Harta adalah apa -apa yang perlu diperiksa di GSC. Ia boleh menjadi satu halaman atau seluruh laman web.
    1. Untuk mengesahkan pemilikan tapak, pilih Open GSC, navigasi ke Pemilih Harta dan klik "Tambah Harta Baru" dari pemilih harta.
    1. Anda kemudian akan melihat senarai kaedah pengesahan yang akan membolehkan anda mengesahkan pemilikan laman web/halaman.

    Ini termasuk:

    • Muat naik fail html
    • Tag html
    • Kod Penjejakan Google Analytics
    • Pengurus tag Google
    • Pembekal nama domain
    • Laman web Google, blogger atau akaun domain.
    1. Pilih kaedah pengesahan anda. Sebaik sahaja harta anda telah disahkan, ia akan muncul di GSC dan anda boleh melihat analisis terperinci untuk bajet dan aktiviti merangkaknya.

    Mengoptimumkan bajet merangkak 

    Sekarang kita tahu bahawa belanjawan merangkak adalah sumber yang berharga yang penggunaannya mesti dioptimumkan untuk hasil terbaik. Berikut adalah beberapa teknik untuk melakukan ini:

    1. Betulkan kandungan pendua

    Kandungan pendua mungkin akan merangkak secara berasingan, yang membawa kepada pembaziran bajet merangkak. Untuk mengelakkan ini daripada berlaku, sama ada menyatukan halaman pendua di laman web anda ke dalam satu, atau memadam halaman pendua.

    2. Gunakan robots.txt

    Robots.txt adalah fail yang menyajikan beberapa tujuan, salah satunya adalah untuk memberitahu Googlebot untuk tidak merangkak halaman tertentu atau bahagian halaman. Ini adalah strategi penting yang boleh digunakan untuk mencegah Googlebot daripada merangkak kandungan atau kandungan bernilai rendah yang tidak memerlukan merangkak.

    Berikut adalah beberapa amalan terbaik apabila menggunakan robots.txt untuk mengoptimumkan bajet merangkak:

    • Berikan keutamaan kepada parameter yang perlu disekat dari merangkak mengikut urutan keutamaan anda.
    • Tentukan robot, arahan dan parameter yang menyebabkan rangkak tambahan menggunakan fail log.
    • Sekat laluan biasa yang biasanya ada pada CMS seperti 404, pentadbir, halaman log masuk, dsb.

    Cara melakukan ini

    Mewujudkan dan melaksanakan fail robots.txt untuk menyekat akses Googlebot memerlukan pengetahuan pengekodan. Berikut adalah langkah -langkah yang terlibat:

    1. Fail robots.txt dibuat menggunakan editor teks seperti notepad. Fail ini perlu dinamakan robots.txt untuk Googlebot untuk mengenalinya.
    1. Sebaik sahaja fail telah dibuat, kami menambah peraturan kepadanya, iaitu mengatakan bahawa kami menentukan satu set arahan yang memberitahu fail untuk menyekat akses kepada ejen tertentu di bawah syarat -syarat tertentu.

    Fail robots.txt biasa akan mempunyai elemen berikut:

    • Ejen pengguna, seperti Googlebot, yang mana akses akan dinafikan
    • Tidak membenarkan atau membenarkan kemasukan, menentukan fail atau direktori yang mana akses akan dihadkan untuk ejen pengguna
    • Sitemap untuk memberitahu Google kandungan mana yang harus merangkak.

    Berikut adalah apa yang kelihatan seperti robots.txt yang kelihatan seperti.

    Gunakan robots.txt

    Sumber 

    Kod ini bermaksud bahawa ejen pengguna - Googlebot dalam contoh ini - tidak dibenarkan merangkak sebarang URL yang bermula dengan " http://www.example.com/nogooglebot/ ".

    1. Sebaik sahaja fail anda telah dibuat dan disimpan di mesin tempatan anda, ia perlu dimuat naik ke laman web anda. Melakukan ini bergantung pada pelayan anda dan penyedia hosting anda. Anda perlu menghubungi pembekal anda untuk memastikan langkah -langkah yang tepat untuk ini.

    Kami mencadangkan mendapatkan bantuan pakar jika anda tidak merasa selesa membuat dan memuat naik fail robots.txt sendiri.

    3. Segmen XML Sitemaps

    Bot merangkak tiba di tapak dengan peruntukan umum jumlah halaman yang akan dirangkak. Peta laman XML secara berkesan mengarahkan bot untuk membaca URL yang dipilih, memastikan penggunaan belanjawan tersebut dengan berkesan.

    Ambil perhatian bahawa prestasi kedudukan halaman bergantung pada beberapa faktor termasuk kualiti kandungan dan pautan dalaman/luaran. Pertimbangkan untuk memasukkan hanya halaman peringkat teratas dalam peta. Imej boleh diperuntukkan peta laman XML mereka sendiri.

    Ikuti cadangan ini untuk memastikan pelaksanaan sitemap XML yang optimum:

    • Rujuk peta laman XML daripada fail robots.txt.
    • Cipta berbilang peta laman untuk tapak yang sangat besar. Jangan tambahkan lebih daripada 50,000 URL pada satu peta laman XML.
    • Pastikan ia bersih dan hanya masukkan halaman boleh diindeks.
    • Pastikan peta laman XML dikemas kini.
    • Pastikan saiz fail kurang daripada 50MB.

    Untuk melihat lebih terperinci di sitemaps, rujuk kepada modul khusus kami mengenai topik ini .

    4. Melaksanakan strategi penyambungan dalaman yang cekap

    Pautan dalaman Melaksanakan tiga fungsi penting:

    • Mengatur kandungan di sekitar tema, yang membantu membina kuasa topikal.
    • Menyebarkan ekuiti halaman antara halaman bernilai tinggi ke halaman lain.
    • Membantu pengguna dan crawler web lebih mudah menavigasi laman web ini.

    Oleh itu, untuk merangkak yang cekap, adalah penting untuk melaksanakan strategi penghubung dalaman yang cekap. Untuk lebih lanjut mengenai pautan dalaman, rujuk modul kursus terperinci kami di sini.

    5. Menaik taraf hosting

    Sekiranya laman web berjalan pada platform hosting bersama, belanjawan merangkak akan dikongsi dengan laman web lain yang berjalan di platform tersebut. Penerbit besar mungkin mendapati hosting bebas untuk menjadi alternatif yang berharga.

    Sebelum menaik taraf hosting anda untuk menyelesaikan beban trafik bot, terdapat beberapa faktor yang patut dipertimbangkan yang mungkin memberi kesan kepada pelayan sebaliknya.

    • Imej proses menggunakan rangkaian pengedaran kandungan berasingan (CDN) yang juga dioptimumkan untuk menjadi tuan rumah format imej gen seterusnya seperti WEBP.
    • Pertimbangkan hosting CPU, ruang cakera berdasarkan fungsi dan keperluan laman web anda.
    • Memantau aktiviti menggunakan penyelesaian seperti Relik Baru untuk memantau penggunaan lebihan plugin dan bot.

    Untuk lebih lanjut mengenai kelebihan CDN, lihat modul pengalaman halaman .

    6. Gunakan JavaScript dengan bijak

    Apabila Googlebot mendarat di halaman web, ia memaparkan semua aset pada halaman tersebut, termasuk Javascript. Walaupun merangkak HTML agak mudah, Googlebot mesti memproses Javascript beberapa kali agar dapat memaparkannya dan memahami kandungannya.

    Ini boleh menghabiskan belanjawan rangkak Google dengan cepat untuk tapak web. Penyelesaiannya adalah untuk melaksanakan rendering Javascript pada bahagian pelayan.

    Cara melakukan ini

    Mengatasi JavaScript dalam kod sumber laman web anda memerlukan kepakaran pengekodan dan kami mengesyorkan berunding dengan pemaju web jika anda merancang untuk membuat sebarang perubahan sedemikian. Yang mengatakan, berikut adalah beberapa garis panduan mengenai apa yang perlu dicari ketika cuba mengoptimumkan penggunaan JavaScript.

    • Elakkan menghantar aset JavaScript kepada pelanggan untuk memberikan supaya bot merangkak tidak membelanjakan sumber mereka dan dapat berfungsi dengan lebih cekap
    • Gunakan pemuatan malas peringkat pelayar dan bukannya berasaskan JavaScript.
    • Gunakan penandaan sampingan pelayan untuk analisis dan penandaan pihak ketiga, sama ada host sendiri atau menggunakan penyelesaian seperti stape.io.

    7. Memantau CWVS

    CWV adalah ukuran prestasi halaman yang secara langsung mempengaruhi bagaimana halaman anda berfungsi dalam kedudukan carian.

    Laporan CWV GSC Kumpulan Kumpulan URL di bawah tiga kategori:

    • Jenis metrik ( LCP, FID dan CLS)
    • Status
    • Kumpulan URL

    CWV juga boleh memberi kesan kepada bajet merangkak anda. Sebagai contoh, halaman pemuatan perlahan boleh memakan belanjawan merangkak anda kerana Google mempunyai masa yang terhad untuk tugas merangkak. Jika halaman anda dimuatkan dengan cepat, Google boleh merangkak lebih banyak daripada mereka dalam masa yang terhad. Begitu juga, terlalu banyak laporan status ralat boleh melambatkan merangkak dan membuang belanjawan merangkak anda.

    Untuk pemeriksaan CWV yang lebih teliti, lihat modul kami pada pengalaman halaman .

    8. Gunakan Crawler Pihak Ketiga

    Crawler pihak ketiga seperti Semrush , Sitechecker.Pro atau menjerit katak membolehkan pemaju web mengaudit semua URL tapak dan mengenal pasti isu-isu yang berpotensi.

    Crawler pihak ketiga boleh digunakan untuk mengenal pasti:

    • Pautan terputus
    • Kandungan pendua
    • Tiada tajuk halaman

    Program ini menawarkan laporan statistik rangkak untuk membantu menyerlahkan masalah yang mungkin tidak dilakukan oleh alatan Google sendiri.

    Memperbaik data berstruktur dan mengurangkan isu kebersihan akan menyelaraskan tugas Googlebot merangkak dan mengindeks tapak.

    Kami mengesyorkan amalan terbaik berikut apabila menggunakan crawler pihak ketiga:

    • Tiru Googlebot, melalui tetapan rangkak carian, untuk mengelakkan daripada disekat daripada penyedia pengehosan dan untuk mengenal pasti dan membetulkan semua isu teknikal dengan betul.
    • Debug yang hilang halaman dari merangkak menggunakan panduan hebat ini dari menjerit katak .

    9. Memantau parameter URL

    Parameter URL — bahagian alamat web yang mengikuti “?” — digunakan pada halaman untuk pelbagai sebab, termasuk penapisan, penomboran dan carian.

    Walaupun ini boleh meningkatkan pengalaman pengguna, ia juga boleh menyebabkan isu merangkak apabila kedua-dua URL asas dan URL dengan parameter mengembalikan kandungan yang sama. Contoh ini ialah "http://mysite.com" dan "http://mysite.com?id=3" yang mengembalikan halaman yang sama.

    Parameter membenarkan tapak mempunyai bilangan pautan yang hampir tidak terhad — seperti apabila pengguna boleh memilih hari, bulan dan tahun pada kalendar. Jika bot dibenarkan merangkak halaman ini, belanjawan rangkak akan digunakan sia-sia.

    Ini terutamanya menjadi masalah untuk kebimbangan jika laman web anda menggunakan navigasi atau pengenal sesi yang boleh ditanam yang boleh menanam beberapa halaman pendua yang, jika merangkak, boleh menyebabkan pembaziran bajet merangkak.

    URL Duplikat juga boleh menghasilkan jika anda mempunyai versi setempat laman web anda dalam bahasa yang berbeza, dan kandungan di halaman ini belum diterjemahkan.

    Kami mengesyorkan yang berikut untuk menangani ini:

    • Gunakan robots.txt untuk tidak membenarkan Googlebot dari merangkak halaman pendua.
    • Gunakan<hreflang> Tag untuk menentukan variasi bahasa kandungan. Tab Hreflang memberitahu crawler bahawa halaman itu adalah variasi serantau kandungan utama, dengan itu menghalang crawler daripada mendaftarkannya sebagai pendua sekiranya ia belum diterjemahkan.

    Inilah caranya sederhana<hreflang> Nampaknya dalam kod sumber anda:

    https://examplesite.com/news/hreflang-tags "/>

    Ini memberitahu crawler bahawa URL yang ditentukan adalah varian Sepanyol (Mexico) dari URL utama, dan ia tidak boleh dianggap sebagai pendua.

    2.6.5 Senang ada

    Kami telah membincangkan keperluan pengurusan bajet merangkak. Penunjuk yang disenaraikan dalam bahagian ini, walaupun tidak penting untuk pengurusan bajet merangkak yang sihat, pergi jauh ke arah menambah teknik yang dibincangkan sebelumnya.

    Mengendalikan kecemasan merangkak

    Kecemasan merangkak berlaku apabila Googlebot mengatasi laman web anda dengan lebih banyak permintaan merangkak daripada yang dapat dikendalikan. Adalah penting untuk mengenal pasti isu secepat mungkin, yang boleh dilakukan dengan memantau log pelayan dan merangkak statistik dalam konsol carian Google.

    Sekiranya lonjakan secara tiba -tiba merangkak tidak diuruskan dalam masa, ia boleh menyebabkan pelayan melambatkan. Kelembapan pelayan akan meningkatkan masa tindak balas purata untuk crawler dan, akibat masa tindak balas yang tinggi ini, enjin carian akan secara automatik mengurangkan kadar merangkak mereka. Ini bermasalah kerana kadar merangkak yang dikurangkan akan menyebabkan kerugian dalam penglihatan, dengan artikel -artikel baru tidak merangkak segera.

    Sekiranya anda melihat mengenai merangkak adalah menafikan pelayan anda, di sini beberapa perkara yang boleh anda lakukan:

    1. Hadkan kadar merangkak

    Google mempunyai algoritma canggih yang mengawal kadar merangkak. Jadi idealnya, seseorang tidak boleh merosakkan kadar merangkak. Walau bagaimanapun, dalam keadaan kecemasan, anda boleh log masuk ke akaun GSC anda dan menavigasi ke tetapan kadar merangkak untuk harta anda.

    Jika anda melihat kadar merangkak di sana sebagai dikira sebagai optimum, anda tidak akan dapat mengubahnya secara manual. Permintaan khas perlu difailkan dengan Google untuk menukar kadar merangkak.

    Jika ini tidak berlaku, anda hanya boleh menukar merangkak kadar diri anda kepada nilai yang anda inginkan. Nilai ini akan tetap sah selama 90 hari.

    Sekiranya anda tidak mahu merosakkan kadar merangkak di GSC, anda juga boleh menyekat akses ke halaman oleh Googlebot menggunakan robots.txt. Prosedur untuk melakukan ini telah dijelaskan sebelum ini.

    2. Periksa kadar merangkak tapak

    Ia boleh mengambil Google sehingga tiga hari untuk merangkak kebanyakan laman web. Satu-satunya pengecualian ialah laman berita atau laman web lain yang menerbitkan kandungan sensitif masa yang boleh merangkak setiap hari.

    Untuk memeriksa berapa kerap halaman anda sedang merangkak, memantau log tapak anda. Sekiranya anda masih merasakan kandungan anda tidak merangkak seberapa kerap yang sepatutnya, ikuti langkah -langkah ini:

    • Hantar sitemap berita terkini anda ke Google. Sitemap berita adalah sitemap yang dibuat khusus dari Google News.
    • Jika anda telah membuat sebarang perubahan pada sitemap berita anda, gunakan alat ping untuk memaklumkan Google yang sama, ini boleh dilakukan dengan menghantar permintaan GET dari baris arahan anda atau penyemak imbas anda ke alamat berikut:

    https://www.google.com/ping?sitemap=full_url_of_sitemap

    • Gunakan<lastmod> Tag in sitemaps untuk ditunjukkan apabila URL yang diindeks terakhir dikemas kini atau diubahsuai.

    3. Kembalikan kod ralat 503 atau 429

    Sila ambil perhatian: Langkah ini harus dilihat sebagai tindakan terakhir yang perlu diambil oleh sesiapa sahaja kerana ia membawa tahap risiko tertentu. Jika Googlebot melihat 503 dan 429 kesilapan maka ia akan mula merangkak lebih perlahan dan boleh menghentikan merangkak, yang membawa kepada penurunan sementara dalam bilangan halaman yang diindeks.

    Kod ralat 503 bermakna pelayan sementara turun, manakala 429 bermakna pengguna telah menghantar terlalu banyak permintaan dalam masa tertentu. Kod -kod ini membolehkan Googlebot tahu bahawa masalah itu bersifat sementara, dan ia harus kembali untuk merangkak halaman pada masa yang akan datang.

    Walaupun langkah yang seolah-olah kecil, ini penting kerana jika Googlebot tidak tahu sifat masalah laman web yang sedang dialami, ia menganggap masalahnya adalah sifat jangka panjang dan boleh menandakan halaman itu sebagai tidak responsif, yang boleh menjejaskan SEO.

    Mewujudkan kod ralat 503 dilakukan melalui fail PHP, yang dimasukkan ke dalam kod sumber HTML sedia ada halaman anda bersama -sama dengan mesej ralat. Anda juga perlu menulis beberapa baris tambahan kod HTML yang menyebutkan apabila tapak dijangka akan kembali.

    Inilah kod untuk redirect 503 seperti:

    Kembalikan kod ralat 503 atau 429

    Sumber

    Melakukan 503 atau 429 pengalihan memerlukan kemahiran pengekodan HTML yang maju dan kami mencadangkan berunding dengan pemaju web anda sebelum mencuba ini.

    2.6.6 Elakkan perangkap biasa ini

    Kami kini mempunyai pemahaman yang baik tentang bajet merangkak dan bagaimana untuk mengoptimumkannya. Walau bagaimanapun, mengetahui apa yang tidak perlu dilakukan ketika datang ke belanjawan merangkak adalah sama pentingnya.

    Berikut adalah beberapa perangkap biasa untuk dielakkan untuk memastikan anda memanfaatkan sepenuhnya bajet merangkak laman web anda:

    Mencuba meningkatkan kadar merangkak tanpa alasan yang baik

    Kekerapan Google merangkak laman web anda ditentukan oleh algoritmanya, yang mengambil kira beberapa isyarat untuk mencapai frekuensi merangkak yang optimum.

    Meningkatkan kadar merangkak tidak semestinya membawa kepada kedudukan yang lebih baik dalam hasil carian. Kekerapan merangkak atau merangkak sendiri bukan faktor ranking dalam dan dari dirinya sendiri.

    Berulang kali mengemukakan kandungan lama untuk merangkak 

    Google tidak semestinya lebih suka kandungan lebih segar berbanding kandungan yang lebih lama. Google meletakkan halaman berdasarkan kaitan dan kualiti kandungan tanpa mengira sama ada ia sudah lama atau baru. Oleh itu, tidak perlu untuk terus merangkak.

    Menggunakan arahan merangkak-melayari untuk mengawal Googlebot

    Arahan Crawl-Delay tidak membantu mengawal Googlebot. Sekiranya anda ingin melambatkan kekerapan merangkak sebagai tindak balas kepada merangkak berlebihan yang menggembirakan laman web anda, rujuk arahan yang disediakan di bahagian di atas.

    Mempunyai laman web pemuatan perlahan

    Kelajuan pemuatan laman web anda boleh menjejaskan belanjawan merangkak anda. Halaman pemuatan cepat bermakna Google boleh mengakses lebih banyak maklumat mengenai bilangan sambungan yang sama.

    Untuk petua mengenai pengoptimuman kelajuan pemuatan, lihat modul kami pada pengalaman halaman .

    Hanya menggunakan pautan nofollow untuk menyekat crawler

    Pautan Nofollow mungkin masih menjejaskan belanjawan merangkak anda kerana ini mungkin masih merangkak. Sebaliknya, pautan yang robots.txt telah tidak dibenarkan tidak memberi kesan ke atas bajet merangkak.

    Juga, URL alternatif dan kandungan JavaScript mungkin akan merangkak, memakan belanjawan merangkak anda, jadi penting untuk menyekat akses kepada mereka dengan sama ada mengeluarkannya atau dengan menggunakan robots.txt.

    2.6.7 Tindakan dan Takeaways

    Belanjawan merangkak adalah sumber yang berharga dan sangat penting untuk mengoptimumkannya. Isu merangkak dan pengindeksan boleh menjejaskan prestasi kandungan anda, terutamanya jika laman web anda mempunyai sejumlah besar halaman.

    Kedua -dua operasi yang paling asas yang terlibat dalam mengoptimumkan belanjawan merangkak adalah menjaga sitemap anda dikemas kini dan kerap memantau isu pengindeksan dari laporan Statistik GSC Crawl dan fail log.

    Adalah penting untuk belajar bagaimana untuk menggunakan amalan terbaik pengurusan merangkak semasa pelancaran ciri-ciri laman web baru dan juga apabila kesilapan satu kali berlaku.

    Modul Sebelumnya
    Kembali ke Bab
    Modul Seterusnya

    Aktif sekarang

    6

    Kelajuan dan Kekerapan Merangkak

    Lihat lagi

    1

    Reka Bentuk dan Susun Atur

    2

    Seni Bina Tapak

    3

    Pengalaman Halaman

    4

    Peta Laman Berita

    5

    Skema

    7

    Pautan ke Kandungan Tajaan dan Dijana Pengguna

    8

    Pusat Penerbit Google

    9

    Bing News PubHub

    10

    Iklan, Pop timbul dan Amalan Terbaik

    SODP logo

    State of Digital Publishing sedang mencipta penerbitan dan komuniti baharu untuk media digital dan profesional penerbitan, dalam media dan teknologi baharu.

    • Alat teratas
    • SEO untuk penerbit
    • Dasar privasi
    • Dasar editorial
    • Peta laman
    • Cari mengikut syarikat
    Facebook X-twitter Kendur Linkedin

    NEGERI PENERBITAN DIGITAL – HAK CIPTA 2025