Download Skripsi Computer Science:Implementasi Metode Term Frequency Inverse Document Frequency (TF-IDF) Pada Sistem Temu Kembali Informasi
BAB I PENDAHULUAN
1.1. Latar Belakang Semakin canggihnya teknologi di bidang komputasi dan telekomunikasi pada masa kini, membuat informasi dapat dengan mudah didapatkan oleh banyak orang. Kemudahan ini menyebabkan informasi menjadi semakin banyak dan beragam. Informasi dapat berupa dokumen, berita, surat, cerita, laporan penelitian, data keuangan, dan lain-lain. Tidak dapat dipungkiri lagi informasi telah menjadi komoditi yang paling penting dalam dunia modern masa kini.
Seiring dengan perkembangan informasi, banyak pihak menyadari bahwa masalah utama telah bergeser dari cara mengakses informasi menjadi memilih informasi yang berguna secara selektif. Usaha untuk memilih informasi ternyata lebih besar dari sekedar mendapatkan akses terhadap informasi. Pemilihan atau penemuan kembali informasi ini tidak mungkin dilakukan secara manual karena kumpulan informasi yang sangat besar dan terus bertambah besar.
Mandala (2002, hal: 1) menyatakan bahwa suatu sistem otomatis diperlukan untuk membantu pengguna dalam menemukan informasi. Sistem temu kembali informasi (information retrieval system) merupakan sistem yang digunakan untuk menemukan informasi yang relevan dengan kebutuhan dari penggunanya secara otomatis berdasarkan kesesuaian dengan query (masukan berupa ekspresi kebutuhan informasi oleh pengguna) dari suatu koleksi informasi.
Namun dari hasil temuan kembali dokumen, pengguna tidak dapat melihat peran dari query dalam proses pencarian dokumen tersebut, urutan dokumen yang di-retrieve dinilai tidak informatif berdasarkan tingkat kesesuaiannya dengan query. Oleh karena itu digunakan model ruang vektor (vector space model) sistem temu kembali informasi. Menurut Arifin (dalam Salton, 1989) ’Salah satu model sistem temu kembali informasi yang paling sederhana namun paling produktif adalah model ruang vektor. Vektor model ini merepresentasikan term yang terdapat pada dokumen dan query. Elemen vektor tersebut adalah bobot term yang menjadi dasar penilaian dalam pemeringkatan dokumen. Hal yang perlu diperhatikan dalam penemuan kembali informasi model ruang vektor ini adalah pembobotan term (term weighting). Term dapat berupa kata, frase, atau unit hasil indexing lain dalam suatu dokumen sebagai gambaran konteks dari dokumen tersebut. Karena tiap kata memiliki tingkat kepentingan yang berbeda dalam dokumen, maka diperlukan indikator yaitu term weight (bobot term) dalam proses pencocokan dan perankingan dokumen terhadap query.
Metode pembobotan yang umumnya diunggulkan dalam penelitianpenelitian untuk digunakan dalam model ruang vektor yaitu TF-IDF Term Frequency Inverse Document Frequency (Arifin, 2002). Menurut Arifin (dalam Salton, 1989) ‘Dalam perhitungan bobot term, sekalipun term frequency banyak digunakan, namun ia hanya mendukung proporsi jumlah dokumen yang dapat ditemuka n-kembali oleh proses pencarian pada sistem Information Retrieval, sedangkan proporsi jumlah dokumen yang ditemukan dan dianggap relevan untuk kebutuhan pengguna akan lebih meningkat bila vektor bobot tersebut menggunakan term yang jarang muncul pada koleksi dokumen. Tentunya term demikian akan diharapkan mampu mengelompokkan sejumlah dokumen yang memuatnya, sehingga berbeda dengan seluruh anggota koleksi dokumen lain yang tidak memilikinya. Kriteria ini dapat diakomodasi dengan menghitung invers frekuensi dokumen. Dengan digabungkannya kedua metode ini yaitu konsep frekuensi kemunculan term dalam sebuah dokumen dan inverse frekuensi dokumen yang mengandung kata tersebut, akan mampu meningkatkan proporsi jumlah dokumen yang dapat ditemukan kembali dan yang dianggap relevan secara sekaligus. Sehingga kriteria term yang paling tepat adalah term yang sering muncul dalam dokumen secara individu, namun jarang dijumpai pada dokumen lainnya.’ Menurut Defeng (dalam Robertson, 2004: 503) ’Metode TF-IDF merupakan suatu cara untuk memberikan bobot hubungan suatu kata (term) terhadap dokumen. Metode ini menggabungkan dua konsep untuk perhitungan bobot, yaitu frekuensi kemunculan sebuah kata di dalam sebuah dokumen tertentu dan inverse frekuensi dokumen yang mengandung kata tersebut. Frekuensi kemunculan kata di dalam dokumen yang diberikan menunjukkan seberapa penting kata itu di dalam dokumen tersebut. Frekuensi dokumen yang mengandung kata tersebut menunjukkan seberapa umum kata tersebut. Sehingga bobot hubungan antara sebuah kata dan sebuah dokumen akan tinggi apabila frekuensi kata tersebut tinggi di dalam dokumen dan frekuensi keseluruhan dokumen yang mengandung kata tersebut yang rendah pada kumpulan dokumen.’ 1.2. Rumusan Masalah Dari latar belakang diatas dapat dirumuskan beberapa masalah yang akan dikaji dalam skripsi ini, yaitu: 1. Bagaimana menerapkan metode pembobotan TF-IDF pada mesin pencari.
2. Bagaimana cara kerja mesin pencari dalam melakukan pembobotan dokumen dengan menggunakan metode TF-IDF.
3. Bagaimana mesin pencari dapat menghasilkan dokumen relevan yang teranking berdasarkan query masukan oleh pengguna.
1.3. Batasan Masalah Ruang lingkup dibatasi pada: 1. Hanya untuk pencarian dokumen pada personal komputer .
Contoh Skripsi Computer Science:Implementasi Metode Term Frequency Inverse Document Frequency (TF-IDF) Pada Sistem Temu Kembali Informasi
Downloads Versi PDF >>>>>>>
Klik Disini Artikel terkait skripsi diantaranya : proposal penelitian, karya tulis, contohskripsi, c0ntoh proposal, judul seminar akuntansi, proposal tentang, beasiswa disertasi, laporan ta, tugas ta, tesis akuntansi keuangan, tesis kesehatan, proposal tesis akuntansi, contoh-contoh tesis, tesis gratis, tesis contoh, contoh bab 1 tugas akhir, kumpulan tugas akhir akuntansi, proposal pengajuan tugas akhir, contoh laporan tugas akhir akuntansi, judul tugas akhir jurusan akuntansi.
0 komentar:
Posting Komentar