Rekayasa Web Klasifikasi Rocchio pada Data Tidak Terstruktur

Authors

  • Laili Wahyunita IAIN Palangka Raya

DOI:

https://doi.org/10.31504/komunika.v8i2.2016

Keywords:

data tidak terstruktur, klasifikasi, rekayasa web, rocchio

Abstract

Data tidak terstruktur merupakan domain penelitian yang menarik untuk diteliti. Banyaknya sumber data yang dapat diambil dengan mudah menjadi salah satu penyebabnya. Salah satu contoh data tidak terstruktur adalah berita online. Tahapan pre-processing diperlukan untuk menyiapkan data tidak terstruktur agar dapat diolah pada proses klasifikasi. Klasifikasi Rocchio adalah algoritma klasifikasi yang menggabungkan antara TF-IDF dan cosine similarity. Rekayasa web yang menggunakan klasifikasi occhio pada data tidak terstruktur dilakukan dengan menggunakan bahasa pemrograman PHP dan basis data MySQL. Kinerja hasil web diukur dengan menggunakan metode Black Box Testing. Pengujian dilakukan dengan menggunakan lima kriteria tes berdasarkan fungsionalitas web. Hasil pengujian menunjukkan bahwa web yang dihasilkan berfungsi sesuai dengan spesifikasi yang telah ditentukan. Adapun pengujian keakuratan klasifikasi Rocchio dilakukan dengan menggunakan perhitungan precision dan recall. Hasil perhitungan menunjukkan nilai precision sebesar 72,01%, dan recall sebesar 67,73%,.

References

Aggarwal, C.C. (Ed.). (2012). Mining text data. New York, NY: Springer.

Albitar, S., Fournier, S., & Espinasse, B. (2012). Conceptualization Effects on MEDLINE Documents Classification Using Rocchio Method. 2012 IEEE/WIC/ACM International Conferences on Web Intelligence and Intelligent Agent Technology, 462–466. https://doi.org/10.1109/WI-IAT.2012.210

Darujati, C., & Gumelar, A.B. (n.d.). PEMANFAATAN TEKNIK SUPERVISED UNTUK KLASIFIKASI TEKS BAHASA INDONESIA. 9.

Hu, X., & Liu, H. (2012). Text Analytics in Social Media. In C. C. Aggarwal & C. Zhai (Eds.), Mining Text Data (pp. 385–414). https://doi.org/10.1007/978-1-4614-3223-4_12

Joachims, T. (n.d.). A Probabilistic AnalysisToexf tthCeaRteogcocrhizioatAiolngorithm with TFIDF for. 9.

Junianto, E., & Riana, D. (n.d.). Penerapan PSO Untuk Seleksi Fitur Pada Klasifikasi Dokumen Berita Menggunakan NBC. 8.

Lumbanraja, F.R. (2013). Sistem Pencarian Data Teks dengan Menggunakan Metode Klasifikasi Rocchio(Studi Kasus:Dokumen Teks Skripsi). 8.

Malarvizhi, R., & Saraswathi, K. (2013). Web Content Mining Techniques Tools & Algorithms – A Comprehensive Study. International Journal of Computer Trends and Technology, 4(8), 6.

Manning, C., Raghavan, P., & Schuetze, H. (2009). Introduction to Information Retrieval. 581.

Mohammad, A.H., Al-Momani, O., & Alwada’n, T. (2016). Arabic Text Categorization using k-nearest neighbour, Decision Trees (C4.5) and Rocchio Classifier: A Comparative Study. 6.

Nidhi, & Gupta, V. (2012). Algorithm for Punjabi Text Classification. International Journal of Computer Applications, 37, 6.

Pinontoan, M.S., Rachmat, A., & Delima, R. (2019). Penerapan Metode Waterfall Dan Webqual 4.0 Pada Pengembangan Website Dealer Asa Mandiri Motor. Jurnal Teknik Informatika dan Sistem Informasi, 5(2). https://doi.org/10.28932/jutisi.v5i2.1729

Rocchio, J. (n.d.). The Smart Retrieval System-Experiments in Automatic Document Processing.

Wahyunita, L. (2017). Klasifikasi Penyebab Penyalahgunaan Narkoba Dari Berita Online Dengan Menggunakan Naive Bayes. Jurnal ELTIKOM, 1(1), 23–30. https://doi.org/10.31961/eltikom.v1i1.12

Widjojo, E.A., Rachmat C, A., & Santosa, R.G. (2014). Implementasi Rocchio’s Classification dalam Mengkategorikan Renungan Harian Kristen. Jurnal ULTIMATICS, 6(1), 1–8. https://doi.org/10.31937/ti.v6i1.325

Downloads

Published

2019-12-13

Issue

Section

Artikel