PERBANDINGAN METODE DATA MINING MODEL KLASIFIKASI NAIVE BAYES, DECISSION TREE DAN K-NEAREST NEIGHBOUR DALAM MEMPREDIKSI KETEPATAN KELULUSAN MAHASISWA PRODI TEKNIK INFORMATIKA DI UNIVERSITAS PAMULANG

Penulis

  • Ichsan Ramdhani UNIVERSITAS PAMULANG

Kata Kunci:

Data mining, naive bayes, decission tree, algorima k-NN, PREDIKSI KETEPATAN KELULUSAN

Abstrak

Pada tahun 2019 hingga 2020 program studi teknik informatika Univesitas Pamulang telah meluluskan 1213 mahasiwa sebagai seorang sarjana komputer. Sebagian besar mahasiswa menempuh studi lebih dari waktu ideal atau mengalami “keterlambatan”. Adapun tujuan dilakukannya penelitian ini adalah memberikan perbandingan dari beberapa metode data minning (metode naive bayes, algoritma decission tree, dan algoritma k-nearest neighbour) yang diterapkan dalam memprediksi ketepatan mahasiswa dalam menyelesaikan studinya. Pada penelitian ini terjadi penghapusan menjadi 413 data. Hal ini dilakukan karena pada kelulusan semester ganjil (800 data) semua mahasiswa terlambat. Berdasarkan data yang dikumpulkan, kelompok nilai IPK mahasiswa yang paling banyak adalah yang nilai IPKnya berkisar antara 3,01 – 3,16, yaitu 120 orang mahasiswa. Sedangkan kelompok nilai IPK yang paling sedikit adalah yang nilai IPKnya berkisar antara 3,65 – 3,80 yaitu 6 orang mahasiswa. Data mining dengan menggunakan model klasifikasi naive bayes adalah cara yang paling baik karena memiliki nilai akurasi yang lebih baik daripada decission tree dan algoritma k-NN. Model yang dihasilkan oleh naive bayes cukup baik (AUC=0,726) digunakan untuk memprediksi kelulusan mahasiswa prodi teknik informatika di Universitas Pamulang. Nilai akurasinya 75,78% dalam memprediksi ketepatan waktu lulus. Atribut kelompok nilai IPK lebih berpengaruh dalam memprediksi kelulusan tepat waktu daripada atribut jenis kelamin. Berdasarkan pohon keputusan yang diperoleh dari decission tree, pada kelompok nilai IPK  3,49 - 3,64, laki laki lebih memiliki peluang untuk lulus tepat waktu dibandingkan perempuan. Sedangkan pada kelompok nilai IPK  3,65 - 3,80 mahasiwi perempuan lebih berpeluang lulus tepat waktu dibandingkan mahasiswa laki-laki.

Referensi

Divva, G.M.Z., dkk. 2021. Perbandingan Metode Klasifikasi Naive Bayes, Decision Tree dan Knearest Neighbor pada Data Log Firewall. Jakarta. SENAMIKA : e-ISBN 978-623-93343-3-8.

Gorunescu, Florin. .2011. Data Mining Concept , Model Technique. Springer - Verlag Berlin Heidelberg

Han, J. dan M. Kamber. 2006. Data Mining Concepts and Techniques Second Edition. San Francisco: Morgan Kaufmann

Kusrini dan E.T. Lutfi. 2009. Algoritma Data Mining. Edisi Pertama. Yogyakarta: Andi Offset.

Larose. 2005. Discovering Knowledge in Data. Canada: Wiley-Interscience

Suyatno. 2017. Data Mining Untuk Klasifikasi dan Klasterisasi Data. Bandung: Informatika

Tomar, D., & Agarwal, S. (2013). A survey on Data Mining approaches for Healthcare. International Journal of Bio- Science and Bio -Technology, 5 , 241-266

Widyaningsih, S. 2019. Perbandingan Metode Data Mining Untuk Prediksi Nilai dan Waktu Kelulusan Mahasiswa Prodi Teknik Informatik Dengan Algoritma C4.5, Naïve Bayes, KNN, dan SVM. Jurnal Tekno Insentif | ISSN (p): 1907-4964.

Diterbitkan

2023-01-28

Cara Mengutip

Ramdhani, I. . (2023). PERBANDINGAN METODE DATA MINING MODEL KLASIFIKASI NAIVE BAYES, DECISSION TREE DAN K-NEAREST NEIGHBOUR DALAM MEMPREDIKSI KETEPATAN KELULUSAN MAHASISWA PRODI TEKNIK INFORMATIKA DI UNIVERSITAS PAMULANG. Jurnal Ilmu Komputer, 6(1), 88-94. Diambil dari https://jurnal.pranataindonesia.ac.id/index.php/jik/article/view/156