Download Skripsi Computer Science:Implementasi Corpus Generator Dengan Parallel Text
BAB 1 PENDAHULUAN
1.1 Latar Belakang Dengan berkembangnya Internet,
banyak informasi tersedia dalam World Wide Web yang dapat diakses di seluruh
negara. Pada saat pencarian informasi menggunakan search engine, jika query yang diberikan sebagai kata
pencarian ditulis dalam bahasa tertentu, maka hasil pencarian yang diberikan kepada
user hanya dokumen berisi informasi yang ditulis dalam bahasa tersebut. Sehingga hasil
pencarian tidak dapat memberikan hasil yang
maksimum untuk user. Berdasarkan informasi yang disediakan oleh web, maka informasi tersebut dapat menjadi bagian solusi
dari permasalahan diatas untuk mendapatkan
hasil pencarian yang maksimum baik dari query bahasa tertentu dan bahasa asing lainnya.
Informasi merupakan kumpulan data
yang akan diolah. Data dari informasi dapat menjadi data training untuk membangkitkan probabilistic translation
model yang menerjemahkan query dari satu bahasa ke bahasa
lain yang dapat digunakan untuk Cross Language
Information Retrieval (CLIR) dan Machine Translation (MT). Pada MT sering ditemukan hasil terjemahan yang tidak tepat
sehingga membuat user tidak mengerti hasil terjemahan secara keseluruhan. Hal ini juga
menjadi sebuah permasalahan yang harus segera
diatasi. Sedangkan pada CLIR, hasil pencarian hanya dokumen yang berisi informasi yang ditulis dalam query bahasa
tertentu. Sehingga diperlukan probabilistic translation model untuk mendapatkan hasil
terjemahan yang baik.
Dari penelitian [9] dan [7], sebuah
probabilistic translation model digunakan untuk menerjemahkan query dari bahasa asal ke
bahasa tujuan. Dari kedua penelitian tersebut
dapat dilihat bahwa probabilistic translation model dengan hasil terjemahan
yang baik, dibutuhkan corpus berisi
parallel text dalam jumlah besar sebagai data training.
Untuk mendapatkan hasil
terjemahan yang baik, diperlukan kaidah penerjemahan dari bahasa asal ke bahasa tujuan dan sebaliknya
yang akan digunakan dalam probabilistic translation
model.
Corpus adalah kumpulan teks yang
bisa digunakan untuk proses training dan pengembangan data [7]. Corpus berisi parallel
text yang merupakan hasil text mining yang memperoleh pola berupa pasangan teks
dari suatu bahasa terhadap bahasa lain di mana sumber yang dipakai berasal dari web.
Berdasarkan latar belakang yang
diuraikan sebelumnya, maka penulis berinisiatif untuk membuat sebuah corpus generator untuk mengumpulkan parallel text Bahasa Indonesia – Bahasa Inggris dalam jumlah besar,
guna menjawab masalah yang telah diuraikan
sebelumnya.
1.2 Manfaat dan Tujuan 1.2.1 Manfaat Penelitian Manfaat
yang diperoleh dalam penelitian ini adalah parallel text yang dihasilkan dapat digunakan sebagai data training untuk menghasilkan probabilistic translation
model yang menerjemahkan query dari satu bahasa ke bahasa lain yang disebut
sebagai CLIR dan Machine Translation.
1.2.2
Tujuan Tujuan yang hendak dicapai
dalam penelitian ini ialah membangun
sebuah corpus generator berisi parallel text dalam bahasa Indonesia – bahasa
Inggris.
1.2.3 Perumusan Masalah Dari latar belakang masalah
yang diuraikan sebelumnya, maka dapat dirumuskan bahwa masalah yang melatar belakangi skripsi ini
adalah bagaimana membangun sebuah sistem untuk menghasilkan parallel text yang berasal
dari web.
1.2.4 Batasan Masalah Batasan masalah yang menjadi
acuan dalam penelitian ini adalah: 1.
Corpus generator yang dihasilkan
adalah corpus berisi parallel text dengan sumber teks yang berasal dari web dwi bahasa.
2. Corpus yang dihasilkan adalah corpus
dwibahasa berdasarkan kata dan kalimat dan
berupa file text.
3. Metode yang digunakan untuk mendapatkan
pasangan web page adalah berdasarkan nama web page.
4. Metode yang digunakan untuk mendapatkan
parallel text adalah parallel text alignment berdasarkan kesamaan tag HTML.
5. Bahasa yang digunakan dalam pembuatan
perangkat lunak ini menggunakan bahasa
pemrograman PHP versi 5.0.
1.2.5
Sistematika Penulisan Pembahasan dalam skripsi ini secara garis besar dibagi dalam 5 (lima)
bab, adapun snan bab demi bab dalam
skripsi ini adalah sebagai berikut: BAB 1: Pendahuluan Bab ini menjelaskan
mengenai latar belakang, perumusan masalah, identifikasi masalah, tujuan, manfaat, batasan masalah, serta
sistematika penulisan.
Contoh Skripsi Computer Science:Implementasi Corpus Generator Dengan Parallel TextDownloads Versi PDF >>>>>>>Klik DisiniArtikel terkait skripsi diantaranya : Kumpulan Contoh skripsi, contoh makalah,proposal penelitian, karya tulis, contohskripsi, c0ntoh proposal, judul seminar akuntansi, proposal tentang, beasiswa disertasi, laporan ta, tugas ta, tesis akuntansi keuangan, tesis kesehatan, proposal tesis akuntansi, contoh-contoh tesis, tesis gratis, tesis contoh, contoh bab 1 tugas akhir, kumpulan tugas akhir akuntansi, proposal pengajuan tugas akhir, contoh laporan tugas akhir akuntansi, judul tugas akhir jurusan akuntansi.
0 komentar:
Posting Komentar