Klasifikasi Dokumen Karya Ilmiah Menggunakan Algoritma Support Vector Machine

Posted on February 12, 2024
adminweb

Klasifikasi Dokumen Karya Ilmiah Menggunakan Algoritma Support Vector Machine

Di dunia, akademik karya ilmiah menjadi salah satu bentuk publikasi yang penting. Namun, dengan jumlah karya ilmiah yang semakin banyak, pengelompokan dan klasifikasi karya ilmiah menjadi semakin sulit. Oleh karena itu, penggunaan algoritma Support Vector Machine (SVM) dapat membantu dalam mengklasifikasikan dokumen karya ilmiah.SVM adalah salah satu algoritma pembelajaran mesin yang digunakan untuk klasifikasi dan regresi. SVM bekerja dengan membangun model yang memisahkan data dengan margin yang maksimal. Dalam klasifikasi dokumen karya ilmiah, SVM dapat digunakan untuk memisahkan dokumen berdasarkan topik atau jenis karya ilmiah.

Proses klasifikasi dokumen karya ilmiah menggunakan SVM terdiri dari beberapa tahap. Pertama, dokumen yang akan diklasifikasi harus diproses terlebih dahulu. Proses ini meliputi penghapusan kata-kata yang tidak penting (stop word), stemming, dan tokenisasi. Setelah itu, dokumen akan diubah menjadi vektor dengan menggunakan metode bag-of-words.

Setelah dokumen diubah menjadi vektor, tahap selanjutnya adalah pelatihan model SVM. Proses pelatihan ini dilakukan dengan menggunakan data latih yang sudah diklasifikasikan sebelumnya. Data latih ini akan digunakan untuk membangun model SVM yang dapat digunakan untuk mengklasifikasikan dokumen yang belum diketahui kelasnya.Setelah model SVM dilatih, tahap selanjutnya adalah pengujian model. Proses pengujian ini dilakukan dengan menggunakan data uji yang belum pernah dilihat oleh model sebelumnya. Data uji ini akan digunakan untuk menguji keakuratan model SVM dalam mengklasifikasikan dokumen karya ilmiah.

Dalam pengujian model SVM, terdapat beberapa metrik evaluasi yang dapat digunakan untuk memancarkan kinerja model. Metrik evaluasi yang umum digunakan adalah akurasi, presisi, recall, dan F1-score. Akurasi mengukur seberapa baik model dalam mengklasifikasikan dokumen secara keseluruhan, sedangkan presisi dan recall mengukur seberapa baik model dalam mengklasifikasikan dokumen pada kelas tertentu.

F1-score merupakan rata-rata harmonik antara presisi dan recall.Kesimpulannya, klasifikasi dokumen karya ilmiah menggunakan algoritma Support Vector Machine dapat membantu dalam mengelompokkan dokumen berdasarkan topik atau jenis karya ilmiah. Proses klasifikasi dokumen karya ilmiah menggunakan SVM terdiri dari beberapa tahap, yaitu pemrosesan dokumen, pelatihan model SVM, dan pengujian model SVM. Metrik evaluasi umum yang digunakan dalam pengujian model SVM adalah akurasi, presisi, recall, dan F1-score.

sumber https://repositori.usu.ac.id/handle/123456789/6617

Leave a Reply Cancel reply

BUSINESS INQUIRIES ?