CosaAranda.COM Images
 
Hall of Shame | Konfigurasi | Bookmark
 

Meningkatkan SEO Blog Wordpress Dengan Robots.Txt

Robot Images

Pernah dengar istilah robots.txt? Menurut Wikipedia:

The robots exclusion standard, also known as the Robots Exclusion Protocol or robots.txt protocol is a convention to prevent cooperating web spiders and other web robots from accessing all or part of a website which is, otherwise, publicly viewable. Robots are often used by search engines to categorize and archive web sites, or by webmasters to proofread source code. A robots.txt file on a website will function as a request that specified robots ignore specified files or directories in their search.

Dengan kata lain, ibaratnya seorang guide, robots.txt ini berfungsi untuk mengarahkan crawler mesin pencari pada saat ia melakukan kerjanya. Dengan robots.txt, kita dapat menentukan file / direktori mana yg boleh diakses dan mana yg tidak boleh. Kita bahkan bisa mengatur, crawler mana yg boleh mengakses situs kita dana mana yg tidak boleh.

Jika Anda menggunakan platform blog Wordpress (jangan lupa ikuti polling yg ada di sidebar ya), Anda bisa memanfaatkan si robots.txt ini untuk proses SEO blog Anda dan (semoga) meningkatkan SERP-nya. Beberapa hal yg bisa kita lakukan dengan robots.txt di blog WP antara lain:

  1. Mematikan akses crawler ke direktori wp-admin dan wp-include.
    Kedua direktori tersebut berisi file2 pendukung Wordpress dan tidak ada gunanya untuk dilalui oleh crawler.
  2. Menghindari / menghilangkan supplemental result di Google yg diakibatkan oleh duplicate content.
    Beberapa fitur WP sebenarnya menghasilkan supplemental result di Google, seperti comments feed dan trackback url. Untuk menghindarinya (atau menghilangkannya jika sudah terlanjur ter-index dan tercatat sebagai supp.), kita dapat mencegah crawler untuk mengakses alamat tersebut.
  3. Menghindari / menghilangkan supplemental result di Google yg diakibatkan oleh dynamic page.
    Yg dimaksud dynamic page di sini adalah halaman yg mengandung lebih dari 1 karakter ‘?’ (tanda tanya) di URL-nya. Jika mungkin dulu Anda khilaf dan lupa mengaktifkan permalink misalnya, maka halaman2 artikel blog Anda akan penuh dengan karakter tersebut dan sayangnya, tidak akan bermakna apa2 di mesin pencari.

Untuk mulai menggunakan robots.txt, yg Anda lakukan cukup dengan membuat file dengan nama tersebut dan letakkan pada root domain / sub-domain Anda. Jika blog Anda terletak pada sub-direktori, misal: http://www.namadomain.com/blog, Anda tetap harus meletakkan robots txt tersebut pada http://www.namadomain.com.

Untuk menentukan crawler yg ingin diatur:

[code]User-agent: namacrawler[/code]

Contoh nama crawler:

  • Googlebot — crawler search engine Google
  • Googlebot-Image — crawler image search Google
  • Mediapartners-Google* — crawler Google AdSense
  • * — semua crawler diperbolehkan

Untuk mencegah akses ke direktori tertentu:

[code]Disallow: /namadirektori/[/code]

Sebaliknya, Anda juga bisa menggunakan Allow untuk memperbolehkan akses ke direktori tertentu.

Misal, untuk mencegah akses ke direktori internal Wordpress:

[code]Disallow: /wp-admin/
Disallow: /wp-includes/[/code]

Untuk mencegah akses ke comments feed dan trackback:

[code]Disallow: */feed/
Disallow: */trackback/[/code]

Kita menggunakan tanda * karena struktur URL comments feed adalah http://www.namadomain.com/blahblah-tergantung-permalink/feed/. Begitu pula halnya dengan trackback.

Untuk mencegah akses ke dynamic page:

[code]Disallow: /*?*
Disallow: /*?[/code]

Sekarang, mari kita coba padukan semuanya menjadi satu.

[code]# This rule means it applies to all user-agents
User-agent: *

# Disallow all directories and files within
Disallow: /wp-admin/
Disallow: /wp-includes/

# The Googlebot is the main search bot for google
User-agent: Googlebot

# Disallow Google from parsing indididual post feeds and trackbacks..
Disallow: */feed/
Disallow: */trackback/

# Disallow all files with ? in url
Disallow: /*?*
Disallow: /*?

# The Googlebot-Image is the image bot for google
User-agent: Googlebot-Image

# Allow Everything
Allow: /*

# This is the ad bot for google
User-agent: Mediapartners-Google*

# Allow Everything
Allow: /*[/code]

Selamat mencoba :)

Bacaan terkait:

PS:
(1) Gambar diambil dari http://www.therobotlab.com/sony-aibo-shop/images/aibo-robot.jpg

Anda dapat meletakkan link Anda di sini. Mau tahu caranya?

BookmarkAddict.com

Keberatan dengan iklan ini?
Informasi pasang iklan
#01
 
Comment by jekih (2007-03-13 10:20:26)
jekih

wow.. mantab :)
tapi koq gak di lengkapin sekalian mas? kenapa return, dsb gak ada? atau itu cukup di meta aja?

 
Comment by Cosa (2007-03-15 06:55:53)
Cosa

soalnya setauku yg essential sih yg allow/disallow itu aja. Ntar aku pelajari dulu lagi deh, kalo emang penting juga (dan pengaruh ke crawler), aku updet tulisannya :)

 
 
 
#02
 
Comment by T1ps (2007-03-13 10:59:04)
T1ps

Yippy… akhirnya si robot dibahas juga…aku sebelumnya gak begitu paham gimana ngatur si robot ini. Soalnya kadang waktu lihat lognya… dia masuk ke mana-mana… wah mengganggu privasiku nih…

Sekarang aku bisa bilang… robot dilarang masuk lebih jauh… he he :) Trims Om atas infonya

 
kazemaru

waks,kok aku masih bingung ya? aku belum berani main robot-robotan, eh robot.txt

biarlah google meng-crawl semua isi situsku,daripada salah script malah nanti jadi berabe

 
 
 
#03
 
ngeblogging

dari tadi pagi udah bolak-balik ngunjungi blognya om cosa, pingin kalo ada artikel baru bisa kasih comment pertama kali, eh kecolongan juga, masih blom bisa yang pertama.
pernah om aku pasang robot di blog ku, aku gak tahu apa dan bagaimana itu si robot. akhirnya muncul juga si robot di blognya om cosa

 
Comment by kaze_021 (2007-05-31 09:38:30)
kaze_021

saya juga dah beberapa kali mencoba mempelajari masalah robot.txt ini, baik dari petunjuk google, dr web isnaini, dandr web mas cosa ini. tapi sampe sekarang belum paham juga. mungkin yang baru di aplikasikan yang untuk menghindari SR. itu kan robot.txt juga kan :)

 
 
 
#04
 
Comment by Sugie (2007-03-13 13:19:39)
Sugie

Wah… Makin menarik aja pembahasan Om Cosa,
Saya benar-benar medapat banyak ilmu dari Om cosa.

Tiada kata yang pantas ku ucapkan selain Terimakasih sebanyak”nya atas ilmu yang telah diberikan. Semoga menjadi amal ibadah ya Om! ;-)

Lanjut terus Om…! Mantap!!! :-)

 
 
#05
 
ksetiyo

belom begitu dong nih manfaat utama bagi web kita apa, tapi mo aku coba jg ah

 
 
#06
 
Handry Teguh

Info yang sangat bagus om Cosa, terima kasih atas masukkan Anda. Crawler memang kadang harus di kontrol, contohnya akses kepada gambar-gambar kita kadang-kadang memakan bandwidth yang gede. Dan kadang-kadang kita tidak ingin dipublikasikan di search engine.

 
 
#07
 
Suwahadi

Nah loh, si robot ikut dibahas juga disini :D
Ini sangat membantu saya dalam proses ‘crawler’ yg bagiku cukup memusingkan.
Lagi2 aq harus ucapin ‘thanks’ … :)

-> Tutor lanjut terus, mas …

 
 
#08
 
Comment by radeondt (2007-03-13 18:45:45)
radeondt

wadau … ini yang aku cari … aku save dolo bosss matur nuwun z …

 
 
#09
 
gembel

Terimakasih atas artikelnya, trus mau tanya nih om, boleh ya?

kalau mau dipasang di blogspot, blogsome, atau worpress caranya gimana?
Terimakasih sebelumnya?
maaf ya pertanyaannya orang bodoh nihh.

 
Comment by Cosa (2007-03-15 06:54:20)
Cosa

gak bisa mas gembel. Robots.txt cmn bisa dipasang kalo kita punya hosting sendiri, gak bisa kalo pk blog engine yg gratisan kyk gitu :)

 
 
 
#10
 
Comment by Cosa (2007-03-14 10:54:49)
Cosa

tes komentar, abis pindah server :)

 
 
#11
 
Comment by newbie (2007-03-14 10:57:43)
newbie

mas cosa, kl di default WP kan udah dikasih tuh meta utk robotnya.

Disallow: */wp-admin
Disallow: */wp-content
Disallow: */wp-includes
Disallow: *wp-login.php

Trus yg disallow di tulisan mas cosa kok ga ada tanda bintangnya yah? emang bedanya apa mas diisi tanda * & yg nggak? sorry, newbie banget

 
Comment by Cosa (2007-03-14 11:11:02)
Cosa

kalo pernah ngerasain jaman susah maen di DOS :) karakter * fungsinya sama, yaitu menggantikan semua karakter/kata.

Contoh:
- abcdef, acf, adef, afff –> semua masuk dalam aturan a*f
- qwerty, asdfty, zxcvcty –> semua masuk dalam aturan *ty
- aqwerty, asdfgh, azxcvb –> semua masuk dalam aturan a*

berarti, untuk contoh rule yg ada di default WP:
*/wp-admin –> semua direktori/url yg berakhir /wp-admin. Bisa http://www.namadomain.com/wp-admin atau http://www.namadomain.com/subdir/wp-admin atau bahkan http://www.namadomain.com/subdir1/subdir2/subdir3/wp-admin

contoh yg aku kasih di atas kebetulan aku pk untuk blog yg WP-nya ada di root domain, jadi gak perlu dikasih * lagi. Kalo dalam 1 domain ada lebih dari satu blog WP emang sebaiknya menggunakan default yg udah dikasih itu (dng *) :)

 
Comment by newbie (2007-03-14 13:07:22)
newbie

thx mas cosa utk penjelasannya. dah mudeng skrg :)

 
 
 
 
#12
 
 
#13
 
ngkong

pernah baca article yg mirip bulan lalu
http://www.wagerank.com/2007/writing-a-good-robotstxt/

semoga bisa melengkapi…

 
Comment by Cosa (2007-03-15 06:53:11)
Cosa

thanks ngkong, udah aku tambahin di bagian “bacaan terkait” :)

 
 
 
#14
 
joomblo

mas cosa pilihan cms Joombla bisa dikoreksi jadi joomla, duplicated content joomla bikin saya juga pusing.

 
Comment by Cosa (2007-03-15 08:42:46)
Cosa

udah dikoreksi, kmrn pas bikin polling kebayang2 ama joomblo sih :D

 
 
 
#15
 
Comment by hakim (2007-03-18 15:29:11)
hakim

nice article, thanks om cosa…
:)

 
 
#16
 
Comment by AsAn (2007-03-21 22:31:12)
AsAn

makasi..:D

 
 
#17
 
Comment by AsAn (2007-03-21 22:33:55)
AsAn

bisa di cobain nih…:)

 
 
#18
 
Aristianto

Kalau mas Cosa format robotsnya pakai yang mana?

Saya lihat di webmaster tools, kalau di blok pakai robots.txt, tetap akan di crawl oleh SE tetapi tidak akan muncul di search result.

 
Comment by Cosa (2007-03-22 07:32:04)
Cosa

scr umum, hampir sama dng yg aku pk di situs ini (http://www.cosaaranda.com/robots.txt)

untuk crawl, jangan lupa, crawler Google butuh waktu untuk memproses, termasuk memproses robots.txt. Jadi scr efektif, robots.txt baru berfungsi minimal 3-4 setelah diubah/dipasang dan untuk mempengaruhi index secara keseluruhan butuh waktu 1-2 bulan.

untuk ngecek di webmaster tools, bisa liat di bagian Diagnostic - URLs Restricted by robots.txt

 
 
 
#19
 
Zaini Hafid

memang suka aneh kalo ke crawl rss feed, jadi orang yang mencari di search engin malah masuk langsung ke RSS bukan ke artikel tujuan

 
 
#20
 
Comment by glossybabe (2007-03-31 20:25:26)
glossybabe

tengkyu tengkyuu :D

 
 
#21
 
jasmine

langsung cobaa….

 
 
#22
 
zaini hafid

wah yang wp-admin nich jadi banyak suplement result.

 
 
#23
 
awsaun

Mas cosa, bener ga sitemap url kita added ke robot.txt bisa menambah2 untuk SEO?

thx

 
 
#24
 
Comment by Anggi (2007-09-04 17:30:08)
Anggi

pakai google sitemap … tambah link, dan halaman cepat di index :)

 
 
#25
 
Comment by HrXWan (2007-09-23 14:34:37)
HrXWan

wah yg artikel yg sangat membantu nih..thanks mas cosa,tapi yg mo aku tanyain gmn yah cara bikin robot?hehe..

 
 
#26
 
Comment by tozie (2007-09-26 19:39:29)
tozie

Kereeen blognya … kalo mo ningkatin peringkan di mesin pencari misalnya jika mengetik kata ‘Garut’ blog kita minimal di sepuluh besar gmn mass ?

 
 
#27
 
buyungupik

wa gk bgt ngerti WP..tp jadi tau dikit2 kirain robot.txt cm bs biin rugi aj =)

 
 
#28
 
Comment by endro (2008-02-14 17:01:30)
endro

security ya ???

 
 
#29
 
Yohanes BuLe

Wekekeke.
Ini trik udah berubah jadi bagus karena dimasukin comment.
Tapi ati2 karena bot biasanya cuman ngecek 100 karakter pertama, baru besok2nya lanjut ke karakter berikutnya.

 
 
#30
 
Yohanes BuLe

Ini sieh bagus, tapi ati2 jangan kebanyakan naro komentar di robot txt.
Kalo gw bilang mendingan di allow semua kecuali yang cgi-bin ama yang admin area.
Lebih baek gitu drpd malah botnya susah ngeceknya..

 
 
#31
 
Comment by toho (2008-03-25 19:57:43)
toho

terima kasih buat sarannya

 
 
#32
 
ncomputing - penganti pc

terimakasih….atas infonya..

 
 
#33
 
Arifin

bagus tuh mas triknya,boleh kutiru donk…!!!!

 
 
#34
 
locjan

kalau udah pake all in one seo + robot.txt tambah bagus, sama aja atau malah bertentangan nich. kok kayak jadi bayak jalan buat SEO

 
 
#35
 
rahmat

klau aku pakai wp 2.5 masih perlu diotak atik ga ya? katanya wp 2.5 udah cukup bagus

 
 

Tautan Balik Ke Artikel Ini

Name (required)
E-mail (required - never shown publicly)
URI
Your Comment (smaller size | larger size)
sorry ngacir nocomment tipi tendang sombong sinchan sial senam nyerah ngiler nggaya nangis musik males love konslet kembar gatau damn bye ayuk You may use <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong> in your comment.

Keberatan dengan iklan ini?
Informasi pasang iklan
Cosa Aranda Artikel ini ditulis oleh Cosa pada tanggal 13 March 2007 dan diletakkan pada kategori SEO, Wordpress. Saat ini sudah ada 49 pengunjung yang berkomentar. Ingin menambahkan?

Sebagian pengunjung datang ke halaman ini melalui kata kunci: robots.txt, robot.txt, meningkatkan seo, seo blog, membuat robot.txt, robots, robot txt, robots.txt wordpress, wordpress robots.txt, robots.txt , cosa aranda robot.txt, contoh robots.txt, seo for wordpress, robot, bikin robot.txt, robot.txt cosa aranda, blog wordpress, robot.txt wordpress, asdfty, membuat robots.txt,


   

Sponsor

 
 
 

Publikasi Ulang

Kopi-Paste kode berikut jika Anda ingin mempublikasikannya ulang untuk keperluan non-komersil. DILARANG memodifikasi separuh atau seluruh bagian dari kode tersebut.