Metode pendeteksian plagiarisme dibagi menjadi tiga bagian, yaitu metode perbandingan teks lengkap, metode dokumen fingerprint, dan metode kesamaan kata kunci. Metode pendeteksian plagiarisme dapat dilihat pada gambar 2.1 : (Stein, 2006)
Gambar 2.1 Metode Pendeteksi Plagiarisme
Berikut ini adalah penjelasan dari masing-masing metode dan algoritma pendeteksi plagiarisme :
1) Perbandingan Teks Lengkap.
Metode ini diterapkan dengan membandingkan semua isi dokumen. Dapat diterapkan untuk dokumen yang besar. Pendekatan ini membutuhkan waktu yang lama tetapi cukup efektif, karena kumpulan dokumen yang diperbandingkan adalah dokumen yang disimpan pada penyimpanan lokal.
Metode perbandingan teks lengkap tidak dapat diterapkan untuk kumpulan dokumen yang tidak terdapat pada dokumen lokal. Algoritma yang digunakan pada metode ini adalah algoritma Brute-Force, algoritma Edit Distance, elgoritma Boyer-Moore dan algoritma Lavenshtein Distance.
2) Dokumen Fingerprinting.
Dokumen fingerprinting merupakan metode yang digunakan untuk mendeteksi keakuratan salinan antar dokumen atau hanya sebagian teks saja. Prinsip kerja dari metode dokumen fingerprinting ini adalah dengan menggunakan teknik hashing. Teknik hashing adalah sebuah fungsi yang mengkonversi setiap string menjadi bilangan. Misalnya Rabin-Karp, Winnowing dan Manber.
3) Kesamaan Kata Kunci.
Prinsip dari metode ini adalah mengekstrak kata kunci dari dokumen dan kemudian dibandingkan dengan kata kunci pada dokumen yang lain. Pendekatan yang digunakan pada metode ini adalah teknik dot.
Sumber :
Stein, B., Meyer, S. zu Eissen. 2006. Near Similarity Search and PlagiarismAnalysis, 29th Annual Conference of the German Classification Society(GfKl), Magdeburg, ISDN 1431-8814,pp. 430 – 437.
Komentar
Posting Komentar