Taktik pertumbuhan penerbit untuk musim pilihan raya | WEBINAR

Ketahui Lebih Lanjut

SODP

SODP Media

  • Education
    • Articles
      • Audience Development
      • Content Strategy
      • Digital Publishing
      • Monetization
      • SEO
      • Digital Platforms & Tools
    • Opinion
    • Podcast
    • Events
      • SODP Dinner Event London 2025
      • SODP Dinner Event Dubai 2025
      • SODP Dinner Event California 2025
      • All Events
  • Top Tools & Reviews
  • Research & Resources
  • Community
    • Slack Channel
    • Newsletter
  • About
    • About Us
    • Contact Us
    • Editorial Policy
  • English
sodp logo
SODP logo
    Carian
    Tutup kotak carian ini.
    Log masuk
    • Pendidikan
      • Podcast
      • Artikel
        • Pembangunan Khalayak
        • Strategi Kandungan
        • Penerbitan Digital
        • Pengewangan
        • SEO
        • Platform & Alatan Digital
        • Artikel
        • Pendapat
        • Podcast
        • Acara
        • Pembangunan Khalayak
        • Strategi Kandungan
        • Penerbitan Digital
        • Pengewangan
        • SEO
        • Platform & Alatan Digital
        • Lihat Semua
    • Alatan & Ulasan Terbaik
        • Platform CMS Tanpa Kepala
        • Platform Penerbitan Digital
        • Perisian Kalendar Editorial
        • Aplikasi Majalah
        • Platform Surat Berita E-mel
        • Lebih Banyak Senarai Alat Terbaik
        • Ulasan
    • Penyelidikan & Sumber
    • Komuniti
      • Saluran Slack
      • Waktu Pejabat
      • Surat Berita
        • Saluran Slack
        • Surat Berita
    • Mengenai
      • Tentang Kami
      • Hubungi Kami
      • Dasar Editorial
        • Tentang Kami
        • Hubungi Kami
        • Dasar Editorial
    pemegang tempat
    SODP logo
    Jadilah Rakan Kongsi Jenama

    Laman Utama > Kursus SEO Penerbit > Bab 2: SEO Teknikal > Kelajuan dan Kekerapan Perayapan
    6

    Kelajuan dan Kekerapan Merangkak

    Kelajuan dan Kekerapan Merangkak
    Modul Sebelumnya
    Kembali ke Bab
    Modul Seterusnya

    Objektif Pembelajaran

    Selepas membaca modul ini, anda harus memahami apa itu bajet perayapan, bagaimana ia diperuntukkan kepada laman web dan cara mengoptimumkannya.

    Tempoh Video

    23:27

    Jawab Kuiz

    Ambil kuiz modul semasa

    Bahan

    Templat sedia untuk digunakan

    Sumber

    Laporan dan Sumber

    Had masa: 0

    Ringkasan Kuiz

    0 daripada 9 Soalan yang telah diselesaikan

    Soalan:

    Maklumat

    Anda telah pun menyelesaikan kuiz ini sebelum ini. Oleh itu, anda tidak boleh memulakannya semula.

    Kuiz sedang dimuatkan…

    Anda mesti log masuk atau mendaftar untuk memulakan kuiz.

    Anda mesti melengkapkan perkara berikut terlebih dahulu:

    Keputusan

    Kuiz selesai. Keputusan sedang direkodkan.

    Keputusan

    0 daripada 9 Soalan dijawab dengan betul

    Masa anda:

    Masa telah berlalu

    Anda telah mencapai 0 daripada 0 mata, ( 0 )

    Mata Diperoleh: 0 daripada 0 , ( 0 )
    0 Esei Belum Selesai (Mata Kemungkinan: 0 )

    Kategori

    1. Tidak dikategorikan 0%
    1. 1
    2. 2
    3. 3
    4. 4
    5. 5
    6. 6
    7. 7
    8. 8
    9. 9
    1. Semasa
    2. Ulasan
    3. Dijawab
    4. Betul
    5. Salah
    1. Soalan 1 daripada 9
      1Soalan

      Apakah itu bajet merangkak?

      Betul
      Salah
    2. Soalan 2 daripada 9
      2Soalan

      Ukuran kekerapan Google mahu merayapi semula halaman/laman web tertentu dipanggil ____.

      Betul
      Salah
    3. Soalan 3 daripada 9
      3Soalan

      Bajet perayapan biasanya hanya menjadi perhatian penerbit yang mempunyai lebih daripada berapa banyak halaman di laman web mereka?

      Betul
      Salah
    4. Soalan 4 daripada 9
      4Soalan

      Di manakah anda boleh menemui statistik perayapan?

      Betul
      Salah
    5. Soalan 5 daripada 9
      5Soalan

      Apakah robots.txt itu?

      Betul
      Salah
    6. Soalan 6 daripada 9
      6Soalan

      Antara berikut, yang manakah boleh mengurangkan bajet perayapan anda?

      Betul
      Salah
    7. Soalan 7 daripada 9
      7Soalan

      Antara tugas berikut, yang manakah TIDAK BOLEH dilakukan oleh crawler pihak ketiga seperti Semrush atau Screaming Frog?

      Betul
      Salah
    8. Soalan 8 daripada 9
      8Soalan

      Apakah yang dilakukan oleh perkara berikut teg berkomunikasi dengan perayap?

      Betul
      Salah
    9. Soalan 9 daripada 9
      9Soalan

      Apakah maksud kod ralat 503?

      Betul
      Salah

    2.6.1 Apakah Bajet Rangkaian?

    Bajet perayapan ialah bilangan halaman di laman web anda yang akan dirayapi oleh perayap web dalam tempoh masa tertentu.

    Setiap kali anda menekan butang terbitkan, Google perlu merangkak dan mengindeks kandungan tersebut agar ia mula muncul dalam hasil carian. Memandangkan skala dan jumlah kandungan di internet, merangkak menjadi sumber berharga yang perlu dianggarkan dan dikategorikan untuk penggunaan yang paling cekap.

    Secara ringkasnya, sukar bagi Google untuk merayapi dan mengindeks setiap halaman di internet setiap hari. Jadi, Google merayapi setiap laman web mengikut bajet yang ditetapkan.

    2.6.2 Bagaimanakah Bajet Perayapan Ditetapkan untuk Laman Web?

    Bajet perayapan diberikan kepada laman web berdasarkan dua faktor — had perayapan dan permintaan perayapan.

    Had Perayakan

    Ini adalah kapasiti dan/atau kesediaan laman web untuk dirayapi.

    Bukan semua laman web dibina untuk dirayapi setiap hari. Perayapan melibatkan Googlebot yang menghantar permintaan ke pelayan laman web anda yang, jika dilakukan terlalu kerap, mungkin akan menekan kapasiti pelayan.

    Selain itu, bukan setiap penerbit mahu laman web mereka dirayapi secara berterusan.

    Permintaan Merangkak

    Permintaan perayapan ialah ukuran kekerapan sesuatu halaman tertentu mahu dirayapi semula. Halaman popular atau halaman yang dikemas kini dengan kerap perlu dirayapi dan dirayapi semula dengan lebih kerap.

    2.6.3 Mengapakah Penerbit Perlu Mengambil Berat Tentang Bajet Perayapan?

    Jika Google tidak dapat merangkak dan mengindeks kandungan anda, kandungan tersebut tidak akan dipaparkan pada hasil carian.

    Walau bagaimanapun, bajet perayapan pada amnya hanya menjadi perhatian penerbit sederhana hingga besar yang mempunyai lebih daripada 10,000 halaman di laman web mereka. Penerbit yang lebih kecil tidak perlu terlalu risau tentang bajet perayapan.

    Walau bagaimanapun, penerbit yang mempunyai 10,000 atau lebih halaman di laman web mereka perlu mengelakkan halaman perayapan Googlebot yang tidak penting. Menghabiskan bajet perayapan anda untuk kandungan yang tidak relevan atau kurang penting bermakna halaman bernilai lebih tinggi mungkin tidak akan dirayapi.

    Tambahan pula, penerbit berita perlu berhati-hati tentang bajet perayapan yang dibazirkan memandangkan perayapan adalah salah satu daripada tiga cara Google News menemui kandungan baharu tepat pada masanya. Dua lagi adalah dengan menggunakan peta laman dan Pusat Penerbit Google, yang telah kami terokai lebih lanjut dalam modul Peta Laman Google News dan Pusat Penerbit Google

    2.6.4 Pengoptimuman untuk Perayap

    Mengoptimumkan kekerapan dan kelajuan Googlebot merayapi laman web anda melibatkan pemantauan pelbagai pembolehubah. Kita mulakan dengan menyenaraikan faktor paling penting yang terlibat dalam mengoptimumkan bajet dan kekerapan merayapi.

    Pantau Perayapan Kandungan

    Dua taktik paling berguna untuk memantau cara kandungan anda dirayapi ialah menganalisis fail log dan laporan statistik perayapan Google Search Console (GSC).

    1. Analisis Fail Log

    Fail log ialah dokumen teks yang merekodkan setiap aktiviti di pelayan laman web anda. Ini termasuk semua data tentang permintaan perayapan, permintaan halaman, permintaan imej, permintaan untuk fail javascript dan sebarang sumber lain yang diperlukan untuk menjalankan laman web anda.

    Untuk tujuan SEO teknikal, analisis fail log membantu menentukan banyak maklumat berguna tentang perayapan URL, termasuk tetapi tidak terhad kepada:

    • URL yang telah dirayapi.
    • URL yang paling kerap dirayapi.
    • Mengenal pasti sama ada URL bernilai rendah atau tidak penting sedang dirayapi, sekali gus membazirkan bajet perayapan.

    Cara Melakukannya

    Analisis fail log merupakan tugasan yang memerlukan sedikit pengetahuan teknikal dengan bahagian belakang laman web. Atas sebab ini, kami mengesyorkan penggunaan perisian penganalisis fail log. Terdapat beberapa alat analisis log percuma dan berbayar yang tersedia seperti Graylog , Loggly , Elastic Stack , Screaming Frog Log Analyzer dan Nagios, antara lainnya.

    Jika anda seorang pembangun atau pentadbir sistem yang berpengalaman, anda juga boleh melakukan analisis fail log secara manual.

    Untuk melakukan ini, ikuti langkah berikut:

    1. Log masuk ke cPanel penyedia hosting anda
    1. Navigasi ke Merics dan kemudian Akses Mentah
    1. Muat turun fail log

    Sebaik sahaja anda memuat turun fail log, anda boleh menukar sambungan kepada .csv dan membukanya menggunakan Microsoft Excel atau Google Sheets. Walau bagaimanapun, seperti yang telah kami katakan, pendekatan ini memerlukan tahap kepakaran tertentu untuk memahami fail log.

    Anda juga boleh mengakses fail log menggunakan klien FTP dengan memasukkan laluan fail log. Laluan fail log biasa kelihatan seperti ini:

    Nama pelayan (contohnya, Apache) /var/log/access.log

    Walau bagaimanapun, adalah lebih mudah untuk menggunakan alat analisis log. Sebaik sahaja anda memuat naik fail log ke dalam alat tersebut, anda boleh menyusun data menggunakan beberapa penapis. Contohnya, anda akan dapat melihat URL yang paling kerap diakses oleh Googlebot.

    Anda juga akan dapat melihat sama ada Googlebot telah mengakses URL yang tidak penting atau bernilai rendah seperti URL navigasi berfaset, URL pendua, dsb. Mengenal pasti perkara ini adalah penting kerana ia membazirkan bajet perayapan anda.

    Lihat tangkapan skrin di bawah, yang diambil daripada Penganalisis Fail Log SEO Screaming Frog, untuk melihat apa yang kami maksudkan.

    Analisis Fail Log

    2. Laporan Statistik Perayapan GSC

    GSC menyediakan pemilik laman web dengan data dan pandangan yang komprehensif tentang cara Google merayapi kandungan mereka. Ini termasuk laporan terperinci tentang:

    • Fail/halaman mana yang telah dirayapi dan untuk tujuan apa.
    • Jenis Googlebot (berita, video, mudah alih, dll) yang menjalankan perayapan.
    • Jumlah permintaan perayapan, dsb.

    GSC juga menyediakan graf dan carta yang mudah difahami untuk memberikan pemilik laman web lebih banyak maklumat. Tangkapan skrin di bawah ialah rupa laporan statistik perayapan biasa tentang GSC.

    Laporan Statistik Perayapan GSC

    Sumber

    GSC juga memberitahu anda jika terdapat sebarang masalah dengan perayapan. Ia menyemak beberapa ralat dan memberikan setiap satu kod. Ralat paling biasa yang diperiksa oleh GSC termasuk:

    • Ralat pelayan [5xx]
    • Ralat pengalihan
    • URL yang dihantar disekat oleh robots.txt
    • URL yang dihantar bertanda 'noindex'
    • URL yang dihantar nampaknya soft 404
    • URL yang dihantar mengembalikan 401
    • URL yang dihantar tidak ditemui (404)
    • URL yang dihantar mengembalikan 403
    • URL yang dihantar disekat disebabkan oleh isu 4xx yang lain

    Laporan GSC juga menunjukkan berapa banyak halaman yang telah terjejas oleh setiap ralat di samping status pengesahan.

    Cara Melakukannya

    Berikut ialah cara anda boleh mengakses laporan statistik perayapan GSC untuk laman web atau halaman web anda:

    1. Untuk menggunakan GSC, anda perlu mendaftar .
    1. Seterusnya, anda perlu membuktikan bahawa anda memiliki laman web yang ingin anda tambahkan ke GSC. Ini boleh dilakukan dengan menambah apa yang Google panggil sebagai "properti". Properti ialah apa-apa sahaja yang perlu diperiksa dalam GSC. Ia boleh jadi satu halaman atau keseluruhan laman web.
    1. Untuk mengesahkan pemilikan tapak, pilih buka GSC, navigasi ke Pemilih Hartanah dan klik “tambah hartanah baharu” daripada pemilih hartanah.
    1. Anda kemudian akan melihat senarai kaedah pengesahan yang akan membolehkan anda mengesahkan pemilikan tapak/halaman tersebut.

    Ini termasuk:

    • Muat Naik Fail HTML
    • Tag HTML
    • Kod Penjejakan Google Analytics
    • Pengurus Tag Google
    • Pembekal Nama Domain
    • Akaun Tapak Google, Blogger atau Domain.
    1. Pilih kaedah pengesahan anda. Setelah hartanah anda disahkan, ia akan dipaparkan di GSC dan anda boleh melihat analitik terperinci untuk bajet dan aktiviti perayapannya.

    Optimumkan Bajet Perayapan 

    Kita kini tahu bahawa bajet rangkak merupakan sumber berharga yang penggunaannya mesti dioptimumkan untuk hasil terbaik. Berikut adalah beberapa teknik untuk melakukan ini:

    1. Betulkan Kandungan Berganda

    Kandungan pendua mungkin akan dijelajah secara berasingan, yang akan menyebabkan pembaziran bajet pelayaran. Untuk mengelakkan perkara ini daripada berlaku, sama ada gabungkan halaman pendua di laman web anda menjadi satu atau padam halaman pendua.

    2. Gunakan Robots.txt

    Robots.txt ialah fail yang mempunyai beberapa tujuan, salah satunya adalah untuk memberitahu Googlebot supaya tidak merayapi halaman atau bahagian halaman tertentu. Ini merupakan strategi penting yang boleh digunakan untuk menghalang Googlebot daripada merayapi kandungan bernilai rendah atau kandungan yang tidak perlu dirayapi.

    Berikut adalah beberapa amalan terbaik apabila menggunakan robots.txt untuk mengoptimumkan bajet perayapan:

    • Tetapkan keutamaan kepada parameter yang perlu disekat daripada merangkak mengikut susunan pilihan anda.
    • Tentukan robot, arahan dan parameter yang menyebabkan perayapan tambahan menggunakan fail log.
    • Sekat laluan biasa yang biasanya terdapat pada CMS seperti 404, admin, halaman log masuk, dll.

    Cara Melakukannya

    Mencipta dan melaksanakan fail robots.txt untuk menyekat akses Googlebot memerlukan sedikit pengetahuan pengekodan. Berikut adalah langkah-langkah yang terlibat:

    1. Fail robots.txt dicipta menggunakan editor teks seperti notepad. Fail tersebut perlu dinamakan robots.txt agar Googlebot dapat mengenalinya.
    1. Sebaik sahaja fail telah dicipta, kita menambah peraturan padanya, yang bermaksud kita menentukan satu set arahan yang memberitahu fail untuk menyekat akses kepada ejen tertentu di bawah syarat-syarat tertentu.

    Fail robots.txt yang biasa akan mempunyai elemen berikut:

    • Ejen pengguna, seperti Googlebot, yang aksesnya akan ditolak
    • Tidak membenarkan atau membenarkan entri, menyatakan fail atau direktori yang aksesnya akan dihadkan untuk ejen pengguna
    • Peta laman untuk memberitahu Google kandungan yang harus dirayapi.

    Berikut ialah rupa fail robots.txt yang ringkas.

    Gunakan Robots.txt

    Sumber 

    Kod ini bermaksud bahawa ejen pengguna — Googlebot dalam hal ini — tidak dibenarkan merayapi sebarang URL yang bermula dengan " http://www.example.com/nogooglebot/ ".

    1. Sebaik sahaja fail anda telah dicipta dan disimpan pada mesin tempatan anda, ia perlu dimuat naik ke laman web anda. Ini bergantung pada pelayan dan penyedia hosting anda. Anda perlu menghubungi penyedia anda untuk memastikan langkah yang tepat untuk ini.

    Kami cadangkan anda mendapatkan bantuan pakar jika anda tidak selesa mencipta dan memuat naik fail robots.txt sendiri.

    3. Segmen Peta Laman XML

    Bot perayapan tiba di tapak dengan peruntukan umum tentang berapa banyak halaman yang akan dirayapinya. Peta tapak XML secara berkesan mengarahkan bot untuk membaca URL yang dipilih, memastikan penggunaan bajet tersebut dengan berkesan.

    Ambil perhatian bahawa prestasi kedudukan halaman bergantung kepada beberapa faktor termasuk kualiti kandungan dan pautan dalaman/luaran. Pertimbangkan untuk memasukkan hanya halaman peringkat teratas dalam peta. Imej boleh diperuntukkan peta laman XML mereka sendiri.

    Ikuti cadangan ini untuk memastikan pelaksanaan peta laman XML yang optimum:

    • Rujuk peta laman XML daripada fail robots.txt.
    • Cipta berbilang peta laman untuk tapak yang sangat besar. Jangan tambahkan lebih daripada 50,000 URL pada satu peta laman XML.
    • Pastikan ia bersih dan hanya sertakan halaman yang boleh diindeks.
    • Pastikan peta laman XML dikemas kini.
    • Pastikan saiz fail kurang daripada 50MB.

    Untuk maklumat lanjut tentang peta laman, rujuk modul khusus kami mengenai topik ini .

    4. Laksanakan Strategi Penghubung Dalaman yang Cekap

    Pautan dalaman melaksanakan tiga fungsi penting:

    • Menyusun kandungan berdasarkan tema, yang membantu membina autoriti topikal.
    • Menyebarkan ekuiti halaman antara halaman bernilai tinggi ke halaman lain.
    • Membantu pengguna dan perayap web menavigasi laman web dengan lebih mudah.

    Oleh itu, untuk perayapan yang cekap, adalah penting untuk melaksanakan strategi pautan dalaman yang cekap. Untuk maklumat lanjut tentang pautan dalaman, rujuk modul kursus terperinci kami di sini.

    5. Naik Taraf Pengehosan

    Jika sesebuah laman web berjalan pada platform pengehosan kongsi, bajet perayapan akan dikongsi dengan laman web lain yang berjalan pada platform tersebut. Penerbit besar mungkin mendapati pengehosan bebas sebagai alternatif yang berharga.

    Sebelum menaik taraf hosting anda untuk menyelesaikan beban trafik bot, terdapat beberapa faktor yang perlu dipertimbangkan yang mungkin memberi kesan kepada beban pelayan.

    • Proses imej menggunakan rangkaian pengedaran kandungan (CDN) berasingan yang juga dioptimumkan untuk mengehos format imej generasi seterusnya seperti webp.
    • Pertimbangkan untuk mengehos CPU dan ruang cakera berdasarkan fungsi dan keperluan laman web anda.
    • Pantau aktiviti menggunakan penyelesaian seperti New Relic untuk memantau penggunaan plugin dan bot yang berlebihan.

    Untuk maklumat lanjut tentang kelebihan CDN, lihat modul pengalaman halaman .

    6. Gunakan Javascript dengan Bijaksana

    Apabila Googlebot tiba di halaman web, ia akan memaparkan semua aset pada halaman tersebut, termasuk Javascript. Walaupun HTML yang dirayapi agak mudah, Googlebot mesti memproses Javascript beberapa kali untuk dapat memaparkannya dan memahami kandungannya.

    Ini boleh menguras bajet perayapan Google untuk sesebuah laman web dengan cepat. Penyelesaiannya adalah dengan melaksanakan pemaparan Javascript di bahagian pelayan.

    Cara Melakukannya

    Menangani Javascript dalam kod sumber laman web anda memerlukan kepakaran pengekodan dan kami mengesyorkan agar anda berunding dengan pembangun web jika anda bercadang untuk membuat sebarang perubahan sedemikian. Walau bagaimanapun, berikut ialah beberapa garis panduan tentang perkara yang perlu dicari apabila cuba mengoptimumkan penggunaan Javascript.

    • Elakkan menghantar aset Javascript kepada klien untuk pemaparan supaya bot perayapan tidak menghabiskan sumber mereka dan boleh berfungsi dengan lebih cekap
    • Gunakan pemuatan malas peringkat pelayar dan bukannya berasaskan Javascript.
    • Gunakan penandaan sisi pelayan untuk analitik dan penandaan pihak ketiga, sama ada dihoskan sendiri atau menggunakan penyelesaian seperti stape.io.

    7. Pantau CWV

    CWV ialah ukuran prestasi halaman yang secara langsung mempengaruhi prestasi halaman anda dalam kedudukan carian.

    Laporan CWV GSC mengumpulkan prestasi URL di bawah tiga kategori:

    • Jenis metrik (LCP, FID dan CLS)
    • Status
    • Kumpulan URL

    CWV juga boleh memberi kesan kepada bajet perayapan anda. Contohnya, halaman yang dimuatkan perlahan boleh memakan bajet perayapan anda kerana Google mempunyai masa yang terhad untuk tugas perayapan. Jika halaman anda dimuatkan dengan pantas, Google boleh merangkak lebih banyak daripadanya dalam masa yang terhad. Begitu juga, terlalu banyak laporan status ralat boleh memperlahankan perayapan dan membazirkan bajet perayapan anda.

    Untuk pemeriksaan CWV yang lebih teliti, lihat pengalaman modul di halaman .

    8. Gunakan Crawler Pihak Ketiga

    Crawler pihak ketiga seperti Semrush , Sitechecker.pro atau Screaming Frog membolehkan pembangun web mengaudit semua URL tapak dan mengenal pasti potensi isu.

    Perayap pihak ketiga boleh digunakan untuk mengenal pasti:

    • Pautan rosak
    • Kandungan pendua
    • Tajuk halaman yang hilang

    Program-program ini menawarkan laporan statistik perayapan untuk membantu mengetengahkan masalah yang mungkin tidak dapat dikesan oleh alatan Google sendiri.

    Memperbaiki data berstruktur dan mengurangkan isu kebersihan akan memperkemas tugas Googlebot dalam merayapi dan mengindeks laman web.

    Kami mengesyorkan amalan terbaik berikut apabila menggunakan perayap pihak ketiga:

    • Tiru Googlebot, melalui tetapan perayapan carian, untuk mengelakkan disekat daripada penyedia pengehosan dan untuk mengenal pasti serta membetulkan semua isu teknikal dengan betul.
    • Nyahpepijat halaman yang hilang daripada perayapan menggunakan panduan hebat ini daripada Screaming Frog .

    9. Pantau Parameter URL

    Parameter URL — bahagian alamat web yang mengikuti "?" — digunakan pada halaman atas pelbagai sebab, termasuk penapisan, penomboran halaman dan carian.

    Walaupun ini boleh meningkatkan pengalaman pengguna, ia juga boleh menyebabkan masalah perayapan apabila kedua-dua URL asas dan URL yang mempunyai parameter mengembalikan kandungan yang sama. Contohnya ialah “http://mysite.com” dan “http://mysite.com?id=3” yang mengembalikan halaman yang sama.

    Parameter membolehkan sesebuah laman web mempunyai bilangan pautan yang hampir tidak terhad — seperti apabila pengguna boleh memilih hari, bulan dan tahun pada kalendar. Jika bot dibenarkan merayapi halaman ini, bajet perayapan akan digunakan tanpa perlu.

    Ini terutamanya boleh menjadi isu yang perlu dibimbangkan jika laman web anda menggunakan navigasi berfase atau pengecam sesi yang boleh menghasilkan berbilang halaman pendua yang, jika dirayapi, boleh menyebabkan pembaziran bajet perayapan.

    URL pendua juga boleh berlaku jika anda mempunyai versi setempat halaman web anda dalam bahasa yang berbeza dan kandungan pada halaman ini belum diterjemahkan.

    Kami mengesyorkan perkara berikut untuk menangani perkara ini:

    • Gunakan robots.txt untuk menghalang Googlebot daripada merayapi halaman pendua.
    • Gunakan<hreflang> tag untuk menentukan variasi bahasa kandungan. Tab hreflang memberitahu perayap bahawa halaman tersebut merupakan variasi serantau bagi kandungan utama, sekali gus menghalang perayap daripada mendaftarkannya sebagai pendua sekiranya ia belum diterjemahkan lagi.

    Begini caranya yang mudah<hreflang> kelihatan seperti dalam kod sumber anda:

    https://examplesite.com/news/hreflang-tags”/ >

    Ini memberitahu perayap bahawa URL yang dinyatakan ialah varian Sepanyol (Mexico) bagi URL utama dan ia tidak boleh dianggap sebagai pendua.

    2.6.5 Senang Dimiliki

    Kita telah membincangkan perkara-perkara penting dalam pengurusan bajet rabaan. Petunjuk yang disenaraikan dalam bahagian ini, walaupun tidak penting untuk pengurusan bajet rabaan yang sihat, banyak membantu dalam menambah teknik yang dibincangkan sebelum ini.

    Mengendalikan Kecemasan Merangkak

    Kecemasan perayapan berlaku apabila Googlebot membanjiri laman web anda dengan lebih banyak permintaan perayapan daripada yang dapat dikendalikannya. Adalah penting untuk mengenal pasti isu tersebut secepat mungkin, yang boleh dilakukan dengan memantau log pelayan dan statistik perayapan dengan teliti dalam Google Search Console.

    Jika lonjakan perayapan secara tiba-tiba tidak diuruskan tepat pada masanya, ia boleh menyebabkan pelayan menjadi perlahan. Kelembapan pelayan akan meningkatkan purata masa tindak balas untuk perayap dan, akibat daripada masa tindak balas yang tinggi ini, enjin carian akan mengurangkan kadar perayapan mereka secara automatik. Ini menimbulkan masalah kerana kadar perayapan yang berkurangan akan menyebabkan kehilangan keterlihatan, dengan artikel baharu tidak dirayapi serta-merta.

    Jika anda perasan perayapan berlebihan membebankan pelayan anda, berikut beberapa perkara yang boleh anda lakukan:

    1. Hadkan Kadar Perayapan

    Google mempunyai algoritma canggih yang mengawal kadar perayapan. Jadi, idealnya, seseorang tidak seharusnya mengusik kadar perayapan. Walau bagaimanapun, dalam situasi kecemasan, anda boleh log masuk ke akaun GSC anda dan menavigasi ke Tetapan Kadar Perayapan untuk hartanah anda.

    Jika anda melihat kadar perayapan di sana sebagai Dikira Sebagai Optimum, anda tidak akan dapat mengubahnya secara manual. Permintaan khas perlu difailkan dengan Google untuk mengubah kadar perayapan.

    Jika ini tidak berlaku, anda boleh mengubah kadar perayapan sendiri kepada nilai yang anda inginkan. Nilai ini akan kekal sah selama 90 hari.

    Jika anda tidak mahu mengganggu kadar perayapan dalam GSC, anda juga boleh menyekat akses ke halaman tersebut oleh Googlebot menggunakan robots.txt. Prosedur untuk melakukan ini telah dijelaskan sebelum ini.

    2. Semak Kadar Perayapan Laman

    Google boleh mengambil masa sehingga tiga hari untuk merayapi kebanyakan laman web. Satu-satunya pengecualian ialah laman berita atau laman web lain yang menerbitkan kandungan sensitif masa yang mungkin dirayapi setiap hari.

    Untuk menyemak kekerapan halaman anda dirayapi, pantau log tapak anda. Jika anda masih merasakan kandungan anda tidak dirayapi sekerap yang sepatutnya, ikuti langkah berikut:

    • Hantar peta laman berita terkini anda ke Google. Peta laman berita ialah peta laman yang dibuat khusus daripada berita Google.
    • Jika anda telah membuat sebarang perubahan pada peta laman berita anda, gunakan alat ping untuk memaklumkan Google tentang perkara yang sama. Ini boleh dilakukan dengan menghantar permintaan GET daripada baris arahan atau pelayar anda ke alamat berikut:

    https://www.google.com/ping?sitemap=FULL_URL_OF_SITEMAP

    • Gunakan<lastmod> teg dalam peta laman untuk menunjukkan bila URL yang diindeks terakhir dikemas kini atau diubah suai.

    3. Kembalikan Kod Ralat 503 atau 429

    Sila ambil perhatian: Langkah ini harus dilihat sebagai tindakan terakhir yang perlu diambil oleh sesiapa sahaja kerana ia membawa risiko tertentu. Jika Googlebot melihat ralat 503 dan 429, ia akan mula merangkak dengan lebih perlahan dan mungkin menghentikan perayapan, yang membawa kepada penurunan sementara dalam bilangan halaman yang diindeks.

    Kod ralat 503 bermaksud pelayan tergendala buat sementara waktu, manakala 429 bermaksud pengguna telah menghantar terlalu banyak permintaan dalam tempoh masa tertentu. Kod ini memberitahu Googlebot bahawa masalahnya hanyalah sementara dan ia sepatutnya kembali merangkak halaman tersebut pada masa akan datang.

    Walaupun langkah ini kelihatan kecil, ini penting kerana jika Googlebot tidak mengetahui sifat masalah yang dialami oleh halaman web, ia menganggap masalah itu bersifat jangka panjang dan mungkin menandakan halaman tersebut sebagai tidak responsif, yang boleh menjejaskan SEO.

    Penciptaan kod ralat 503 dilakukan melalui fail PHP, yang dimasukkan ke dalam kod sumber HTML sedia ada halaman anda bersama-sama dengan mesej ralat. Anda juga perlu menulis beberapa baris kod HTML tambahan yang menyatakan bila laman web tersebut dijangka akan kembali.

    Beginilah rupa kod untuk pengalihan 503:

    Kembalikan Kod Ralat 503 atau 429

    Sumber

    Melakukan pengalihan 503 atau 429 memerlukan kemahiran pengekodan HTML lanjutan dan kami cadangkan anda berunding dengan pembangun web anda sebelum mencubanya.

    2.6.6 Elakkan Perangkap Biasa Ini

    Kini kita mempunyai pemahaman yang baik tentang apa itu bajet perayapan dan cara mengoptimumkannya. Walau bagaimanapun, mengetahui apa yang tidak boleh dilakukan berkaitan dengan bajet perayapan adalah sama pentingnya.

    Berikut adalah beberapa perangkap biasa yang perlu dielakkan bagi memastikan anda memanfaatkan sepenuhnya bajet perayapan laman web anda:

    Cuba Meningkatkan Kadar Perayapan Tanpa Alasan yang Baik

    Kekerapan Google merayapi laman web anda ditentukan oleh algoritmanya, yang mengambil kira beberapa isyarat untuk mencapai frekuensi perayapan yang optimum.

    Meningkatkan kadar perayapan tidak semestinya membawa kepada kedudukan yang lebih baik dalam hasil carian. Kekerapan perayapan atau perayapan itu sendiri bukanlah faktor kedudukan.

    Menghantar Kandungan Lama Berulang Kali untuk Dirayapi 

    Google tidak semestinya lebih menyukai kandungan yang lebih segar berbanding kandungan yang lebih lama. Google menilai halaman berdasarkan kerelevanan dan kualiti kandungan tanpa mengira sama ada ia lama atau baharu. Jadi, tidak perlu terus merayapinya.

    Menggunakan Arahan Kelewatan Perayapan untuk Mengawal Googlebot

    Arahan kelewatan perayapan tidak membantu mengawal Googlebot. Jika anda ingin memperlahankan kekerapan perayapan sebagai tindak balas kepada perayapan berlebihan yang membanjiri laman web anda, rujuk arahan yang diberikan dalam bahagian di atas.

    Mempunyai Laman Web yang Lambat Loading

    Kelajuan pemuatan laman web anda boleh mempengaruhi bajet perayapan anda. Halaman pemuatan yang pantas bermakna Google boleh mengakses lebih banyak maklumat melalui bilangan sambungan yang sama.

    Untuk petua tentang pengoptimuman kelajuan pemuatan, lihat pengalaman modul di halaman .

    Hanya Menggunakan Pautan Nofollow untuk Menyekat Perayap

    Pautan nofollow mungkin masih akan menjejaskan bajet perayapan anda kerana pautan ini mungkin masih akan dirayapi. Sebaliknya, pautan yang tidak dibenarkan oleh robots.txt tidak memberi kesan pada bajet perayapan.

    Selain itu, URL alternatif dan kandungan Javascript mungkin akan dirayapi, menghabiskan bajet perayapan anda, jadi penting untuk menyekat akses kepada URL tersebut sama ada dengan mengalih keluarnya atau menggunakan robots.txt.

    2.6.7 Tindakan dan Kesimpulan

    Bajet perayapan merupakan sumber yang berharga dan penting untuk anda mengoptimumkannya. Isu perayapan dan pengindeksan boleh menjejaskan prestasi kandungan anda, terutamanya jika laman web anda mempunyai bilangan halaman yang banyak.

    Dua operasi paling asas yang terlibat dalam mengoptimumkan bajet perayapan adalah memastikan peta laman anda dikemas kini dan memantau isu pengindeksan secara berkala daripada laporan statistik perayapan dan fail log GSC.

    Adalah penting untuk mempelajari cara menggunakan amalan terbaik pengurusan perayapan semasa pelancaran ciri laman web baharu dan juga apabila ralat sekali sahaja berlaku.

    Modul Sebelumnya
    Kembali ke Bab
    Modul Seterusnya

    Aktif sekarang

    6

    Kelajuan dan Kekerapan Merangkak

    Lihat lagi

    1

    Reka Bentuk dan Susun Atur

    2

    Senibina Tapak

    3

    Pengalaman Halaman

    4

    Peta Laman Berita

    5

    Skema

    7

    Pautan ke Kandungan Tajaan dan Dihasilkan Pengguna

    8

    Pusat Penerbit Google

    9

    Bing News PubHub

    10

    Iklan, Popup dan Amalan Terbaik

    SODP logo

    State of Digital Publishing sedang mewujudkan penerbitan dan komuniti baharu untuk profesional media digital dan penerbitan, dalam media dan teknologi baharu.

    • Alat terbaik
    • SEO untuk penerbit
    • Dasar privasi
    • Dasar editorial
    • Peta Laman
    • Cari mengikut syarikat
    Facebook X-twitter Kendur Linkedin

    KEADAAN PENERBITAN DIGITAL – HAK CIPTA 2026