Peringkasan dan Support Vector Machine pada Klasifikasi Dokumen

Nelly Indriani Widiastuti
Ednawati Rainarli
Kania Evita Dewi


Klasifikasi adalah proses pengelompokkan objek yang memiliki karakteristik atau ciri yang sama ke dalam beberapa kelas. Klasifikasi dokumen secara otomatis dapat dilakukan dengan menggunakan ciri atau fitur kata yang muncul pada dokumen latih. Jumlah dokumen yang besar dan banyak mengakibatkan jumlah kata yang muncul sebagai fitur akan bertambah. Oleh karena itu, peringkasan dipilih untuk mereduksi jumlah kata yang digunakan dalam proses klasifikasi. Untuk proses klasifikasi digunakan metode Support Vector Machine (SVM) untuk multikelas. SVM dipilih karena dianggap memiliki reputasi yang baik dalam klasifikasi. Penelitian ini menguji penggunaan ringkasan sebagai seleksi fitur dalam klasifikasi dokumen. Peringkasan menggunakan kompresi 50%. Hasil yang diperoleh menunjukkan bahwa proses peringkasan tidak mempengaruhi nilai akurasi dari klasifikasi dokumen yang menggunakan SVM. Akan tetapi, penggunaan peringkasan berpengaruh pada peningkatan hasil akurasi dari metode klasifikasi Simple Logistic Classifier (SLC). Hasil pengujian metode klasifikasi menunjukkan bahwa penggunaan metode Naïve Bayes Multinomial (NBM) menghasilkan akurasi yang lebih baik dari pada metode SVM.


N. Widiastuti, E. Rainarli, and K. Dewi, “Peringkasan dan Support Vector Machine pada Klasifikasi Dokumen”, INFOTEL, vol. 9, no. 4, pp. 416-421, Nov. 2017.


