ANALISIS PERBANDINGAN KINERJA MODEL MACHINE LEARNING DALAM PREDIKSI DIABETES STUDI KASUS DATASET KAGGLE 2022
Sari
Diabetes merupakan salah satu penyakit kronis yang ditandai oleh kadar glukosa darah yang tinggi di atas batas normal akibat gangguan produksi atau fungsi insulin. Faktor penyebab munculnya diabetes dapat melalui gaya hidup tidak sehat, obesitas, kurangnya aktivitas fisik, serta faktor genetik. Pada penelitian ini akan dilakukan pengujian terhadap dataset medis pasien diabetes yang berasal dari Kaggle, untuk menguji metode machine learning terhadap dataset dengan fitur Analisis Komponen Utama (Principal Component Analysis – PCA). Dengan dataset dan fitur ini akan digunakan empat metode, yaitu Support Vector Machine (SVM), Logistic Regression, Naïve Bayes, dan K-Nearest Neighbor. Pengujian ini akan dilakukan dengan pembagian data 70:30. Hasil penelitian ini ditujukan untuk melakukan perbandingan penggunaan metode klasifikasi data terhadap dataset awal dengan dataset yang menggunakan fitur PCA.
Teks Lengkap:
PDFReferensi
P. R. Putri, “Jurnal Pengabdian Komunitas,” vol. 03, no. 01, pp. 1–6, 2024.
F. B. S. Rizki Aqsyari D, Siti Fatimah Aminah Nikita Putri Adhila, Putri Inrian Tari and B. Murti, “Edukasi Pencegahan Diabetes Pada Lansia di RW 13 Jebres,” Pengabdi. Komunitas, vol. 02, no. 01, pp. 64–70, 2023.
K. Shah, R. Punjabi, P. Shah, and M. Rao, “Real Time Diabetes Prediction using Naïve Bayes Classifier on Big Data of Healthcare,” Int. Res. J. Eng. Technol., vol. 07, no. 05, pp. 102–107, 2020.
A. Pratama, A. C. Nurcahyo, and L. Firgia, “Penerapan Machine Learning dengan Algoritma Logistik Regresi untuk Memprediksi Diabetes,” Pros. CORISINDO 2023, pp. 116–121, 2023, [Online]. Available: https://stmikpontianak.org/ojs/index.php/corisindo/article/view/30%0Ahttps://stmikpontianak.org/ojs/index.php/corisindo/article/download/30/22
B. Charbuty and A. Abdulazeez, “Classification Based on Decision Tree Algorithm for Machine Learning,” J. Appl. Sci. Technol. Trends, vol. 2, no. 01, pp. 20–28, 2021, doi: 10.38094/jastt20165.
M. R. Belgaum et al., “Enhancing the Efficiency of Diabetes Prediction through Training and Classification using PCA and LR Model,” Ann. Emerg. Technol. Comput., vol. 7, no. 3, pp. 78–91, 2023, doi: 10.33166/AETiC.2023.03.004.
S. Xie, H. Lin, T. Ma, K. Peng, and Z. Sun, “Journal of Rock Mechanics and Geotechnical Engineering Prediction of joint roughness coef fi cient via hybrid machine learning model combined with principal components analysis,” J. Rock Mech. Geotech. Eng., no. xxxx, 2024, doi: 10.1016/j.jrmge.2024.05.059.
M. R. Hunafa and A. Hermawan, “KLIK: Kajian Ilmiah Informatika dan Komputer Perbandingan Algoritma Naïve Bayes dan K-Nearest Neighbor Pada Imbalace Class Dataset Penyakit Diabetes,” Media Online, vol. 4, no. 3, pp. 1551–1561, 2023, doi: 10.30865/klik.v4i3.1486.
J. Flamino, R. DeVito, B. K. Szymanski, and O. Lizardo, “A Machine Learning Approach to Predicting Continuous Tie Strengths,” 2021, [Online]. Available: http://arxiv.org/abs/2101.09417
A. Mujumdar and V. Vaidehi, “Diabetes Prediction using Machine Learning Algorithms,” Procedia Comput. Sci., vol. 165, pp. 292–299, 2019, doi: 10.1016/j.procs.2020.01.047.
J. Y. Le Chan et al., “Mitigating the Multicollinearity Problem and Its Machine Learning Approach: A Review,” Mathematics, vol. 10, no. 8, 2022, doi: 10.3390/math10081283.
A. Gorgoglione, A. Castro, V. Iacobellis, and A. Gioia, “A comparison of linear and non-linear machine learning techniques (PCA and SOM) for characterizing urban nutrient runoff,” Sustain., vol. 13, no. 4, pp. 1–19, 2021, doi: 10.3390/su13042054.
W. Yu, T. Liu, R. Valdez, M. Gwinn, and M. J. Khoury, “Application of support vector machine modeling for prediction of common diseases: The case of diabetes and pre-diabetes,” BMC Med. Inform. Decis. Mak., vol. 10, no. 1, 2010, doi: 10.1186/1472-6947-10-16.
T. H. Tanjung and M. Furqan, “Classification of Heart Disease Using Support Vector Machine,” Sinkron, vol. 8, no. 3, pp. 1803–1812, 2024, doi: 10.33395/sinkron.v8i3.13904.
H. Apriyani and K. Kurniati, “Perbandingan Metode Naïve Bayes Dan Support Vector Machine Dalam Klasifikasi Penyakit Diabetes Melitus,” J. Inf. Technol. Ampera, vol. 1, no. 3, pp. 133–143, 2020, doi: 10.51519/journalita.volume1.isssue3.year2020.page133-143.
Q. R. Cahyani et al., “Prediksi Risiko Penyakit Diabetes menggunakan Algoritma Regresi Logistik Diabetes Risk Prediction using Logistic Regression Algorithm Article Info ABSTRAK,” JOMLAI J. Mach. Learn. Artif. Intell., vol. 1, no. 2, pp. 2828–9099, 2022, doi: 10.55123/jomlai.v1i2.598.
D. Ariyanto, A. Sofro, A. N. Hanifah, J. B. Prihanto, D. A. Maulana, and R. W. Romadhonia, “Logistic and Probit Regression Modeling To Predict the Opportunities of Diabetes in Prospective Athletes,” BAREKENG J. Ilmu Mat. dan Terap., vol. 18, no. 3, pp. 1391–1402, 2024, doi: 10.30598/barekengvol18iss3pp1391-1402.
R. Aristawidya, I. Indahwati, E. Erfiani, A. Fitrianto, and M. A. A., “Perbandingan Analisis Regresi Logistik Biner Dan Naïve Bayes Classifier Untuk Memprediksi Faktor Resiko Diabetes,” J. Lebesgue J. Ilm. Pendidik. Mat. Mat. dan Stat., vol. 5, no. 2, pp. 782–794, 2024, doi: 10.46306/lb.v5i2.617.
A. Oktaviana, D. P. Wijaya, A. Pramuntadi, and D. Heksaputra, “Prediksi Penyakit Diabetes Melitus Tipe 2 Menggunakan Algoritma K-Nearest Neighbor (K-NN),” MALCOM Indones. J. Mach. Learn. Comput. Sci., vol. 4, no. 3, pp. 812–818, 2024, doi: 10.57152/malcom.v4i3.1268.
P. D. Rinanda, B. Delvika, S. Nurhidayarnis, N. Abror, and A. Hidayat, “Perbandingan Klasifikasi Antara Naive Bayes dan K-Nearest Neighbor Terhadap Resiko Diabetes pada Ibu Hamil,” MALCOM Indones. J. Mach. Learn. Comput. Sci., vol. 2, no. 2, pp. 68–75, 2022, doi: 10.57152/malcom.v2i2.432.
DOI: https://doi.org/10.47007/komp.v9i02.8784
Refbacks
- Saat ini tidak ada refbacks.
VISITOR COUNTER: