Sabtu, 16 Februari 2013

Ujian Akhir Semester Information Retrieval


1. Metode / Algoritma apa saja yang digunakan untuk melakukan IR? 
Jawab :
a. Set-theoretic models, model merepresentasikan dokumen sebagai himpunan kata atau frase. Contoh model ini ialah standard Boolean model dan extended Boolean model. 
b.    Algebratic model, model merepresentasikan dokumen dan query sebagai vektor atau matriks similarity antara vektor dokumen dan vektor query yang direpresentasikan sebagai sebuah nilai skalar. Contoh model ini ialah vector space model dan latent semantic indexing (LSI). 
c.    Probabilistic model, model memperlakukan proses pengembalian dokumen sebagai sebuah probabilistic inference. Contoh model ini ialah penerapan teorema bayes dalam model probabilistik.  

2. Bagaimana perbedaan cara kerja Precision versus Recall, berikan contohnya ? 
Jawab : 
a.   Precision (ketepatan) 
Precision ialah perbandingan jumlah dokumen relevan yang didapatkan sistem dengan jumlah seluruh dokumen yang terambil oleh sistem baik relevan maupun tidak relevan. 
Rumus 
precision = Jumlah dokumen relevan dengan query 
                    jumlah seluruh dokumen yang terambil 
b.  Recall (kelengkapan) 
Recall ialah perbandingan jumlah dokumen relevan yang didapatkan sistem dengan jumlah seluruh dokumen relevan yang ada dalam koleksi dokumen (terambil ataupun tak terambil sistem). 
Rumus 
recall = Jumlah dokumen relevan dengan query dan terambil sistem.
              jumlah seluruh dokumen relevan dalam koleksi dokumen.
Contoh : 
Jika ada seseorang mencari dokumen tentang “Information Retrieval ” pada sebuah sistem, dan jika sistem tersebut memiliki 100 buku tentang Information Retrieval  , maka kinerja terbaik adalah jika sistem tersebut berhasil menemukan 100 dokumen tentang Information Retrieval  .
Kalau sistem tersebut memberikan 100 temuan, dan di temuan tersebut ada 50 dokumen tentang “Information Retrieval  ”, maka nilai recall-nya adalah 0,5 (atau 50%) dan nilai precision-nya juga 0,5. Kalau sistem tersebut memberikan 1 dokumen saja, dan dokumen tersebut adalah tentang “Information Retrieval  ”, maka recall-nya bernilai 0,01 dan precision-nya bernilai 1. 

3.Jelaskan Algoritma Web-Crawler  yang sederhana, berikan contohnya ?
Jawab :
Web Craweler atau yang lebih dikenal dengan sebutan Web Spider atau Web robot merupakan suatu aplikasi dimana kita dapat membandingkan beberapa web yang terdapat di internet. Web Crawler bekerja secara otomatis dengan membandingkan beberapa alamat website yang sering dikunjungi dan akan secara otomatis menyimpan semua bagian file yang terdapat didalamnya dalam folder computer kita.

0 komentar:

Posting Komentar