3
Cara Setting Robots.txt - Mungkin sobat sudah sering mendengar istilah robots.txt. Apa sih robots.txt itu? apakah perlu di setting? bagaimana kalau saya biarkan saja? mungkin masih banyak pertanyaan lain.



Konten
APA ITU ROBOTS.TXT?
APAKAH SETIAP BLOG MEMPUNYAI ROBOTS.TXT?
APA ARTI DARI KODE-KODE DI ATAS?
KENAPA LABEL TIDAK DIMASUKAN KE PENCARIAN?
BAGAIMANA CARA MENCEGAH ROBOT PADA HALAMAN TERTENTU?
DIMANA CARA EDIT ROBOTS.TXT?
SAYA TIDAK PERNAH UTAK ATIK ROBOTS.TXT, BAGAIMANA?

APA ITU ROBOTS.TXT?

Robots.txt adalah perintah bagi robot mesin pencari untuk menelusuri atau tidak menelusuri halaman pada blog kita. Boleh dikatakan robots.txt adalah filter blog kita dari mesin pencari.

APAKAH SETIAP BLOG MEMPUNYAI ROBOTS.TXT?

Ya, semua blog sudah mempunyai robots.txt yang diberikan oleh blogger. Secara default robots.txt pada blog seperti ini :
User-agent: Mediapartners-Google
Disallow: 

User-agent: *
Disallow: /search
Allow: /

Sitemap: http://namablog/feeds/posts/default?orderby=UPDATED

Untuk melihat robots.txt default, silahkan ketik dibrowser http://namablogsobat.blogspot.com/robots.txt

APA ARTI DARI KODE-KODE DI ATAS?

User-agent: Mediapartners-Google
Robot Google Adsense merayapi blog

Disallow:
Yang tidak diperbolehkan tidak ada

User-agent: *
Semua robot Search Engine / mesin pencari

Disallow: /search
Tidak diperbolehkan merayapi folder search dan setrusnya, seperti ..../search/label dan ... search/search?updated...

Allow: /
Mengizinkan semua halaman untuk dirayapi, kecuali yang tertulis pada Disallow di atas. Tanda (/) kurang lebih artinya nama blog.

Sitemap: http://namablog/feeds/posts/default?orderby=UPDATED
sitemap atau alamat feed blog kita. 

KENAPA LABEL TIDAK DIMASUKAN KE PENCARIAN?

Dengan penulisan kode default Disallow: /search, artinya perayapan untuk label seperti alamat http://namablog.com/search/label/Tutorial, nantinya tidak akan dirayapi oleh mesin pencari karena Label bukan URL yang real menuju satu halaman tertentu.

BAGAIMANA CARA MENCEGAH ROBOT PADA HALAMAN TERTENTU?

Untuk mencegah google merayapi halaman tertentu di blog sobat, katakan sobat tidak ingin halaman about me diindex oleh mesin pencari. Untuk URL about me pada blog sobat misal : http://namablogsobat.blogspot.com/p/about.html

Maka untuk robots.txt, silahkan copy kode defaut di atas, tambahakan halaman yang tidak diperbolehkan, hasilnya seperti ini :

User-agent: Mediapartners-Google
Disallow: 

User-agent: *
Disallow: /search
Disallow: /p/about.html
Allow: /

Sitemap: http://namablog/feeds/posts/default?orderby=UPDATED


DIMANA CARA EDIT ROBOTS.TXT?

Untuk menambahkan atau editing robots.txt, masuk ke Setelan > Preferensi Penelusuran, pada Robots.txt klik Editkemudian klik Ya, kemudian tulis kode robots.txt yang diinginkan > Simpan Perubahan



SAYA TIDAK PERNAH UTAK ATIK ROBOTS.TXT, BAGAIMANA?

Tidak apa-apa, blog sobat tetap akan dirayapi oleh robot-robot mesin pencari karena seperti saya sebutkan sebelumnya, setiap blog sudah mempunya robots.txt default. 
Hati2 dengan penggunaan robots.txt, apabila salah penulisan bisa jadi blog sobat diabaikan oleh mesin pencari.

Demo

Sumber : http://blog.kangismet.net/2013/10/cara-setting-robotstxt-di-blogger.html

Post a Comment Blogger

3 blogger-facebook

nice artikel gan, ane pelajari dulu

Ya gan, pelajari yang matang yah :o

Komentar yang menyertakan link aktif, iklan, atau titip link, akan dimasukan ke folder SPAM.
Untuk pertanyaan di luar topik artikel silahkan tag [OOT]
menyisipkan kode, gunakan tag <i rel="code">KODE ANDA DI SINI...</i> atau <i rel="pre">KODE ANDA DI SINI...</i>
menyisipkan gambar, gunakan tag <i rel="image">URL GAMBAR ANDA DI SINI...</i>
menyisipkan judul, gunakan tag <b rel="h3">JUDUL ANDA DI SINI...</b>
menyisipkan catatan, gunakan tag <b rel="quote">CATATAN ANDA DI SINI...</b>
menciptakan efek tebal gunakan tag <b>TEKS ANDA DI SINI...</b>
menciptakan efek huruf miring gunakan tag <i>TEKS ANDA DI SINI...</i>

Tools Konversi

 
Top