Komparasi Akurasi Algoritma Logistic Regression dan Naive Bayes pada Dataset Hepatitis

Authors

  • Muhammad Riansyah STKIP AL MAKSUM
  • Harry Pratama Fiqna STKIP AL MAKSUM
  • Syaiful Bahri STKIP AL MAKSUM

DOI:

https://doi.org/10.31539/h36jsr29

Abstract

Penelitian ini bertujuan untuk membandingkan tingkat akurasi dua algoritma klasifikasi, yaitu Logistic Regression dan Naive Bayes, dalam proses mendiagnosis penyakit hepatitis. Data penelitian diperoleh dari situs Kaggle.com yang kemudian dibagi menjadi 80% data latih dan 20% data uji. Proses evaluasi dilakukan melalui metode validasi dengan menggunakan beberapa metrik pengukuran, antara lain accuracy, classification error, precision, recall, dan F1-score. Berdasarkan hasil pengujian yang dilakukan, algoritma Logistic Regression berhasil mencapai tingkat akurasi sebesar 90,32%, sedangkan algoritma Naive Bayes hanya memperoleh akurasi sebesar 83,87%. Hasil ini menunjukkan bahwa Logistic Regression memberikan kinerja yang lebih baik dibandingkan Naive Bayes. Temuan penelitian ini diharapkan dapat menjadi referensi pemilihan algoritma klasifikasi dalam pengolahan data medis berbasis machine learning.

References

Darwis, D., Siskawati, N., & Abidin, Z. (2021). Penerapan Algoritma Naive Bayes Untuk Analisis Sentimen Review Data Twitter Bmkg Nasional. Jurnal Tekno Kompak, 15(1), 131-145.

Darwis, D., Siskawati, N., & Abidin, Z. (2021). Penerapan Algoritma Naive Bayes Untuk Analisis Sentimen Review Data Twitter Bmkg Nasional. Jurnal Tekno Kompak, 15(1), 131-145.

Gunawan, M. I., Sugiarto, D., & Mardianto, I. (2020). Peningkatan Kinerja Akurasi prediksi penyakit diabetes mellitus menggunakan metode grid Seacrh Pada algoritma logistic regression. JEPIN (Jurnal Edukasi Dan Penelitian Informatika), 6(3), 280-284.

Harlan, J. (2018). Analisa Regresi Logistik.

Kaunang, F. J. (2022). A Comparative Study on Hepatitis C Predictions Using Machine Learning Algorithms. 8ISC Proceedings: Technology.

Li, T.-H.S., Chiu, H.-J., & Kuo, P.-H. (2022). Hepatitis C Virus Detection Model by Using Random Forest, Logistic Regression and ABC Algorithm. IEEE Access.

Melinte Popescu, A. S. et al. (2023). Machine Learning Approaches for the Prediction of Hepatitis B and C Seropositivity. J Clin Med.

Menon, N. et al. (2022). The Effect of Multiple Imputation of Routine Pathology Variables on Laboratory Diagnosis of Hepatitis C Infection. arXiv preprint.

Naufal, M. F. (2021). Analisis Perbandingan Algoritma Svm, Knn, Dan Cnn untuk Klasifikasi Citra Cuaca. Jurnal Teknologi Informasi dan Ilmu Komputer, 8(2), 311-317.

Ordila, R., Wahyuni, R., Irawan, Y., & Sari, M. Y. (2020). Penerapan Data Mining Untuk Pengelompokan Data Rekam Medis Pasien Berdasarkan Jenis Penyakit Dengan Algoritma Clustering (Studi Kasus: Poli Klinik Pt. Inecda). Jurnal Ilmu Komputer, 9(2), 148-153.

Rahmansyah, A., Dewi, O., Andini, P., Ningrum, T. H. P., & Suryana, M. E. (2018). Membandingkan Pengaruh Feature Selection Terhadap Algoritma Naïve Bayes dan Support Vector Machine. In Seminar Nasional Aplikasi Teknologi Informasi (SNATi).

Zamri, D. (2022, September). Perbandingan Metode Data Mining untuk Prediksi Banjir Dengan Algoritma Naïve Bayes dan KNN: Comparison of Data Mining Methods for Predition of Floods with Naïve Bayes and KNN Algorithm. In SENTIMAS: Seminar Nasional Penelitian dan Pengabdian Masyarakat (pp. 40-48).

Downloads

Published

2025-08-11