Minggu, 15 Februari 2015

Download Skripsi Computer Science:Implementasi Corpus Generator Dengan Parallel Text

Download Skripsi Computer Science:Implementasi Corpus Generator Dengan Parallel Text

BAB 1 PENDAHULUAN 1.1 Latar Belakang Dengan berkembangnya Internet, banyak informasi tersedia dalam World Wide Web yang dapat diakses di seluruh negara. Pada saat pencarian informasi menggunakan search engine, jika query yang diberikan sebagai kata pencarian ditulis dalam bahasa tertentu, maka hasil pencarian yang diberikan kepada user hanya dokumen berisi informasi yang ditulis dalam bahasa tersebut. Sehingga hasil pencarian tidak dapat memberikan hasil yang maksimum untuk user. Berdasarkan informasi yang disediakan oleh web, maka informasi tersebut dapat menjadi bagian solusi dari permasalahan diatas untuk mendapatkan hasil pencarian yang maksimum baik dari query bahasa tertentu dan bahasa asing lainnya. Informasi merupakan kumpulan data yang akan diolah. Data dari informasi dapat menjadi data training untuk membangkitkan probabilistic translation model yang menerjemahkan query dari satu bahasa ke bahasa lain yang dapat digunakan untuk Cross Language Information Retrieval (CLIR) dan Machine Translation (MT). Pada MT sering ditemukan hasil terjemahan yang tidak tepat sehingga membuat user tidak mengerti hasil terjemahan secara keseluruhan. Hal ini juga menjadi sebuah permasalahan yang harus segera diatasi. Sedangkan pada CLIR, hasil pencarian hanya dokumen yang berisi informasi yang ditulis dalam query bahasa tertentu. Sehingga diperlukan probabilistic translation model untuk mendapatkan hasil terjemahan yang baik. Dari penelitian [9] dan [7], sebuah probabilistic translation model digunakan untuk menerjemahkan query dari bahasa asal ke bahasa tujuan. Dari kedua penelitian tersebut dapat dilihat bahwa probabilistic translation model dengan hasil terjemahan yang baik, dibutuhkan corpus berisi parallel text dalam jumlah besar sebagai data training. Untuk mendapatkan hasil terjemahan yang baik, diperlukan kaidah penerjemahan dari bahasa asal ke bahasa tujuan dan sebaliknya yang akan digunakan dalam probabilistic translation model. Corpus adalah kumpulan teks yang bisa digunakan untuk proses training dan pengembangan data [7]. Corpus berisi parallel text yang merupakan hasil text mining yang memperoleh pola berupa pasangan teks dari suatu bahasa terhadap bahasa lain di mana sumber yang dipakai berasal dari web. Berdasarkan latar belakang yang diuraikan sebelumnya, maka penulis berinisiatif untuk membuat sebuah corpus generator untuk mengumpulkan parallel text Bahasa Indonesia – Bahasa Inggris dalam jumlah besar, guna menjawab masalah yang telah diuraikan sebelumnya. 1.2 Manfaat dan Tujuan 1.2.1 Manfaat Penelitian Manfaat yang diperoleh dalam penelitian ini adalah parallel text yang dihasilkan dapat digunakan sebagai data training untuk menghasilkan probabilistic translation model yang menerjemahkan query dari satu bahasa ke bahasa lain yang disebut sebagai CLIR dan Machine Translation. 1.2.2 Tujuan Tujuan yang hendak dicapai dalam penelitian ini ialah membangun sebuah corpus generator berisi parallel text dalam bahasa Indonesia – bahasa Inggris. 1.2.3 Perumusan Masalah Dari latar belakang masalah yang diuraikan sebelumnya, maka dapat dirumuskan bahwa masalah yang melatar belakangi skripsi ini adalah bagaimana membangun sebuah sistem untuk menghasilkan parallel text yang berasal dari web. 1.2.4 Batasan Masalah Batasan masalah yang menjadi acuan dalam penelitian ini adalah: 1. Corpus generator yang dihasilkan adalah corpus berisi parallel text dengan sumber teks yang berasal dari web dwi bahasa. 2. Corpus yang dihasilkan adalah corpus dwibahasa berdasarkan kata dan kalimat dan berupa file text. 3. Metode yang digunakan untuk mendapatkan pasangan web page adalah berdasarkan nama web page. 4. Metode yang digunakan untuk mendapatkan parallel text adalah parallel text alignment berdasarkan kesamaan tag HTML. 5. Bahasa yang digunakan dalam pembuatan perangkat lunak ini menggunakan bahasa pemrograman PHP versi 5.0. 1.2.5 Sistematika Penulisan Pembahasan dalam skripsi ini secara garis besar dibagi dalam 5 (lima) bab, adapun snan bab demi bab dalam skripsi ini adalah sebagai berikut: BAB 1: Pendahuluan Bab ini menjelaskan mengenai latar belakang, perumusan masalah, identifikasi masalah, tujuan, manfaat, batasan masalah, serta sistematika penulisan. Contoh Skripsi Computer Science:Implementasi Corpus Generator Dengan Parallel TextDownloads Versi PDF >>>>>>>Klik DisiniArtikel terkait skripsi diantaranya : Kumpulan Contoh skripsi, contoh makalah,proposal penelitian, karya tulis, contohskripsi, c0ntoh proposal, judul seminar akuntansi, proposal tentang, beasiswa disertasi, laporan ta, tugas ta, tesis akuntansi keuangan, tesis kesehatan, proposal tesis akuntansi, contoh-contoh tesis, tesis gratis, tesis contoh, contoh bab 1 tugas akhir, kumpulan tugas akhir akuntansi, proposal pengajuan tugas akhir, contoh laporan tugas akhir akuntansi, judul tugas akhir jurusan akuntansi.

Share

& Comment

0 komentar:

Posting Komentar

 

Copyright © 2015 Jual Skripsi Eceran™ is a registered trademark.

Designed by Templateism. Hosted on Blogger Platform.