Perbandingan Matriks jarak pada Algoritma K-NN untuk Prediksi Penyakit Diabetes

Authors

  • Galih Hendro Martono Universitas Bumigora
  • Neny Sulistianingsih Universitas Bumigora

Keywords:

Cosine Similarity, Euclidean Distance, K-Nearest Neighbor, Manhattan Distance, Minkowski Distance, Pearson Correlation Coefficient

Abstract

Penelitian ini bertujuan untuk mengetahui kinerja berbagai metrik jarak dalam klasifikasi K-Nearest Neighbors (KNN) untuk diagnosis penyakit diabetes. Studi ini menggunakan beberapa metode penghitungan jarak seperti Euclidean Distance, Manhattan Distance, Minkowski Distance, Cosine Similarity, dan Pearson Correlation Coefficient. Data yang digunakan merupakan data pasien yang menderita penyakit diabetes. Evaluasi dilakukan dengan menggunakan evaluation measure yaitu presisi, sensitivitas, Skor F1, dan akurasi. Hasil penelitian menunjukkan bahwa pengukuran jarak dengan Manhattan Distance lebih unggul dibandingkan dengan metode pengukurannya lainnya yaitu memiliki nilai presisi 0,952, nilai sensitivitas sebesar 0,950, nilai skor F1 sebesar 0,939, dan akurasi sebesar 0,950. Di sisi lain, pengukuran jarak dengan Euclidean Distance dan Minkowski Distance secara konsisten memberikan hasil yang sama yaitu 0.932, 0.940, 0.930 dan 0.940 untuk presisi, sensitivitas, F1-Score dan akurasi berutur-turut. Berbeda dengan, metode Cosine Similarity, meskipun akurasinya tinggi yaitu sebesar 0,905 namun nilai evaluation measure yang lainnya seperti presisi, sensitivitas, dan F1-Score menunjukkan nilai yang lebih rendah yaitu 0,865, 0,905, dan 0,881 secara berurut. Sedangkan, pengukuran jarak dengan Pearson Correlation Coefficient, meskipun memiliki akurasi yang bagus yaitu 0,900 namun menunjukkan kinerja presisi, sensitivitas, dan skor F1 yang rencah yaitu 0,544, 0,517, dan 0,518 secara berurut.

Downloads

Published

2024-01-12

Issue

Section

Articles