Rekayasa Web Klasifikasi Rocchio pada Data Tidak Terstruktur
DOI:
https://doi.org/10.31504/komunika.v8i2.2016Keywords:
data tidak terstruktur, klasifikasi, rekayasa web, rocchioAbstract
Data tidak terstruktur merupakan domain penelitian yang menarik untuk diteliti. Banyaknya sumber data yang dapat diambil dengan mudah menjadi salah satu penyebabnya. Salah satu contoh data tidak terstruktur adalah berita online. Tahapan pre-processing diperlukan untuk menyiapkan data tidak terstruktur agar dapat diolah pada proses klasifikasi. Klasifikasi Rocchio adalah algoritma klasifikasi yang menggabungkan antara TF-IDF dan cosine similarity. Rekayasa web yang menggunakan klasifikasi occhio pada data tidak terstruktur dilakukan dengan menggunakan bahasa pemrograman PHP dan basis data MySQL. Kinerja hasil web diukur dengan menggunakan metode Black Box Testing. Pengujian dilakukan dengan menggunakan lima kriteria tes berdasarkan fungsionalitas web. Hasil pengujian menunjukkan bahwa web yang dihasilkan berfungsi sesuai dengan spesifikasi yang telah ditentukan. Adapun pengujian keakuratan klasifikasi Rocchio dilakukan dengan menggunakan perhitungan precision dan recall. Hasil perhitungan menunjukkan nilai precision sebesar 72,01%, dan recall sebesar 67,73%,.
References
Aggarwal, C.C. (Ed.). (2012). Mining text data. New York, NY: Springer.
Albitar, S., Fournier, S., & Espinasse, B. (2012). Conceptualization Effects on MEDLINE Documents Classification Using Rocchio Method. 2012 IEEE/WIC/ACM International Conferences on Web Intelligence and Intelligent Agent Technology, 462–466. https://doi.org/10.1109/WI-IAT.2012.210
Darujati, C., & Gumelar, A.B. (n.d.). PEMANFAATAN TEKNIK SUPERVISED UNTUK KLASIFIKASI TEKS BAHASA INDONESIA. 9.
Hu, X., & Liu, H. (2012). Text Analytics in Social Media. In C. C. Aggarwal & C. Zhai (Eds.), Mining Text Data (pp. 385–414). https://doi.org/10.1007/978-1-4614-3223-4_12
Joachims, T. (n.d.). A Probabilistic AnalysisToexf tthCeaRteogcocrhizioatAiolngorithm with TFIDF for. 9.
Junianto, E., & Riana, D. (n.d.). Penerapan PSO Untuk Seleksi Fitur Pada Klasifikasi Dokumen Berita Menggunakan NBC. 8.
Lumbanraja, F.R. (2013). Sistem Pencarian Data Teks dengan Menggunakan Metode Klasifikasi Rocchio(Studi Kasus:Dokumen Teks Skripsi). 8.
Malarvizhi, R., & Saraswathi, K. (2013). Web Content Mining Techniques Tools & Algorithms – A Comprehensive Study. International Journal of Computer Trends and Technology, 4(8), 6.
Manning, C., Raghavan, P., & Schuetze, H. (2009). Introduction to Information Retrieval. 581.
Mohammad, A.H., Al-Momani, O., & Alwada’n, T. (2016). Arabic Text Categorization using k-nearest neighbour, Decision Trees (C4.5) and Rocchio Classifier: A Comparative Study. 6.
Nidhi, & Gupta, V. (2012). Algorithm for Punjabi Text Classification. International Journal of Computer Applications, 37, 6.
Pinontoan, M.S., Rachmat, A., & Delima, R. (2019). Penerapan Metode Waterfall Dan Webqual 4.0 Pada Pengembangan Website Dealer Asa Mandiri Motor. Jurnal Teknik Informatika dan Sistem Informasi, 5(2). https://doi.org/10.28932/jutisi.v5i2.1729
Rocchio, J. (n.d.). The Smart Retrieval System-Experiments in Automatic Document Processing.
Wahyunita, L. (2017). Klasifikasi Penyebab Penyalahgunaan Narkoba Dari Berita Online Dengan Menggunakan Naive Bayes. Jurnal ELTIKOM, 1(1), 23–30. https://doi.org/10.31961/eltikom.v1i1.12
Widjojo, E.A., Rachmat C, A., & Santosa, R.G. (2014). Implementasi Rocchio’s Classification dalam Mengkategorikan Renungan Harian Kristen. Jurnal ULTIMATICS, 6(1), 1–8. https://doi.org/10.31937/ti.v6i1.325
Downloads
Published
Issue
Section
License
Authors who publish with this journal agree to the following terms:
- Authors retain copyright and grant the journal right of first publication with the work simultaneously licensed under a Creative Commons Attribution License that allows others to share the work with an acknowledgement of the work's authorship and initial publication in this journal.
- Authors are able to enter into separate, additional contractual arrangements for the non-exclusive distribution of the journal’s published version of the work (e.g., post it to an institutional repository or publish it in a book), with an acknowledgement of its initial publication in this journal.
- Authors are permitted and encouraged to post their work online (e.g., in institutional repositories or on their website) prior to and during the submission process, as it can lead to productive exchanges, as well as earlier and greater citation of published work.