Jumat, 10 Juni 2011

Cara Kerja Search Engine Menentukan Hasil Pencarian

Cara Kerja Search Engine Cara Kerja Search Engine Cara Kerja Search Engine
Sebetulnya saya sendiri penasaran bagaimana sebuah mesin pencari atau yang dikenal dengan sebutan search engine menentukan hasil pencariannya dari sekian juta data situs di dunia. Karena penasaran saya mencari informasinya sampai pada menemukan proses bagaimana cara kerja search engine tersebut.

 

Ada tiga proses yang harus dilakukan sebelum data tersebut di tampilkan oleh search engine di halaman pencarian, diantaranya :

 

Proses Crawling.
Sebuah blog yang baru saja di publikasikan akan di datangi oleh spider search engine untuk menyimpan seluruh informasi yang ada dalam blog, tidak terkecuali dengan seluruh link di blog tersebut. Isi setiap halaman blog sekaligus halaman blog dari link yang disertakan pada blog ini akan di analisa, baik dari struktur Header tag (H1 sampai H6), meta tag, title sampai pada pembacaan data berupa text yang ada di dalamnya. Sayangnya, data yang berupa gambar, spider search engine manapun masih belum dapat mengcrawlnya jika tidak disertai dengan atribut alt.
Seluruh proses crawling ini sebenarnya di atur oleh halaman robots.txt yang ada dalam blog kita. Halaman robots.txt tersebut akan memberi tahu pada spider search engine tentang mana yang boleh di crawling dan yang tidak boleh dicrawling. Beberapa halaman blog kita diharuskan tidak dapat di crawling demi keamanan blog dari para hacker dan virus serta melindungi script penting dalam blog agar tidak terbajak pihak lain seperti script cms platform blog yang kita pergunakan.
Catatan : Terkadang kerja spider ini bisa terhambat jika dalam blog kita terdapat banyak error line pada template yang digunakan. Untuk itu perlu mempertimbangkan pemilihan template blog. Pemilihan sebaiknya kita jatuhkan pada template yang telah tervalidasi atau setidaknya mengandung sedikit error line. Bila template memiliki ratusan error line, dikhawatirkan proses crawling akan gagal. Sehingga blog tidak akan pernah muncul dalam halaman pencarian search engine. Contoh search engine yang sensitive terhadap masalah validasi template blog adalah search engine bing.

Proses Index.
Semua data yang berhasil di crawl oleh spider search engine tersebut disimpan dalam sebuah database index yang disertai dengan alamat urlnya. Tujuan penyimpanan ini adalah untuk mempercepat menampilkan hasil pencarian. Data blog yang paling banyak dicari adalah yang memiliki kesempatan lebih besar untuk keluar di hasil pencarian search engine.

Proses Search
Ketika kita memasukkan query ke dalam search engine, search engine akan memeriksa database index dan memberikan daftar halaman web yang paling cocok menurut kriteria, biasanya dengan ringkasan singkat yang berisi judul, isi halaman dan alamat urlnya.

Begitulah kira - kira cara kerja search engine dalam menentukan hasil pencarian.
Semoga posting ini dapat bermanfaat...

9 komentar:

junaidi mengatakan...

bermanfaat bagi pemula seperti saya..
thnk..

dari www.zildaku.com

moenas mengatakan...

muantabbbzzz brow, ane setuju banget tuh ama yang diatas
untuk memperkecil ke eroran pada template kita lebih baik kita menggunakan template yang dibawa oleh blogger aslinya, karena menurut saya tempe2 yang kita ambil dari website lain banyak erornya, mendingan bawaan dari bloggernya selain berkurangnya ke eroran blog kita juga di peluk paman gugel (*ntu menurut saya pribadi loh) xixixi

Blogger Bodoh mengatakan...

Apakah ini termasuk cara kerja google panda 2011, soalnya saya pusing banget hadapin alogaritma google panda 2011

Rina As mengatakan...

@Blogger Bodoh : secara umum semua kerja search engine memang seperti itu.. di mulai dari :
Crawl -> Index -> Search (SERP)
Algoritma Google Panda dipakai google pada langkah terakhir yaitu untuk menentukan posisi di SERP...

D2X mengatakan...

nah yg jadi masalahnya sekarang ini mbak, berapakah maksimal error line yg masih bisa diterima oleh spiderbot pada saat mengcrawling blog kita..?!

soalnya blog ane terdapat 5 error line yg memang tidak bisa ane hapus dikarenakan error nya pada script dan image yg ane sangat butuhkan. Apakah 5 error line tersebut masih bisa diterima atau tidak oleh spiderbot..?!

Rina As mengatakan...

@D2X : saya rasa masih sebab blog saya pun juga mempunyai error line yang banyak namun hasil crawling masih baik. Kalau untuk spider bot bing, error dalam template seperti ini dapat menjadi salah satu kendala besar dalam proses pengcwalan.
Mohon maaf, pertanyaan anda saya balas baru hari ini..

zhi cun lee mengatakan...

ternyata search engin sangatlah berhati-hati dalam peroses cwarawlernya yah... :)

OBAT AMBEIEN YANG MANJUR TANPA OPERASI mengatakan...

salam kenal gan jangan lupa kunjungi juga blog ane http://obatambevenatauwasir.blogspot.com/

Obat Penyakit Raja Singa Manjur mengatakan...

bermanfaat bagi pemula seperti saya..
thnk..

Poskan Komentar