Implementasi Data Mining dengan Teknik Smote dan Fitur Gain Ratio Untuk Klasifikasi Kelayakan Siswa Penerima PIP di Kota Jambi

Authors

  • Dea Sabrina Candra Universitas Dinamika Bangsa
  • Jasmir Jasmir Universitas Dinamika Bangsa
  • Elvi Yanti Universitas Dinamika Bangsa

DOI:

https://doi.org/10.61132/prosemnasproit.v2i2.66

Keywords:

Data Mining, Klasifikasi, SMOTE, Gain Ratio, PIP

Abstract

The Indonesia Pintar Program (PIP) is an educational assistance program for students from underprivileged families, but determining the eligibility of recipients still faces obstacles in the form of subjectivity and data imbalance. This study aims to classify the eligibility of high school students receiving PIP in Jambi City using data mining methods. The SMOTE technique was applied to overcome class imbalance, and Gain Ratio feature selection was used to determine important attributes. The dataset used consisted of 19,596 student data with a training data distribution of 70% and testing data of 30%. The classification process used the Naïve Bayes, Decision Tree (J48), and Random Forest algorithms with the Use Training Set, 5-Fold, and 10-Fold Cross Validation testing schemes. The results show that SMOTE improves model performance, but feature selection in some cases reduces accuracy. Overall, Random Forest without feature selection provides the best results with an accuracy of 93.33% and is recommended as the most effective model for objectively determining PIP recipient eligibility.

References

Amalia, A., Irma Purnamasari, A., & Ali, I. (2024). Implementasi Algoritma C4.5 Dan Naïve Bayes Dalam Pengambilan Keputusan Untuk Program Indonesia Pintar (Pip) Di Sekolah Dasar Negeri 04 Majalangu. JATI (Jurnal Mahasiswa Teknik Informatika), 8(2), 1889–1896. https://doi.org/10.36040/jati.v8i2.8311

Annisa, R., Aprizal, D., Dewi, R. K., Ayuandita, D. S., Oktaviani, A., & Azzahra, M. (2025). Perbandingan Algoritma Naïve Bayes, Decision Tree, KNN, dan Random Forest Untuk Memprediksi Data Penduduk Penerima BPJS Di Lampung Timur. Jurnal of Data Science Methods and Applications, 01(01), 35132. https://doi.org/10.30873/jodmapps.v1i1.pp42-49

Aprilyani, N., Zulfa, I., & Syahputra, H. (2022). Penerapan Algoritma Decision Tree C4.5 Untuk Model Penentuan Penerima Beasiswa Program Indonesia Pintar (Pip) Studi Kasus Sma Negeri 3 Timang Gajah. Jurnal Teknik Informatika Dan Elektro, 5(1), 96–109. https://doi.org/10.55542/jurtie.v5i1.452

Bachtiar, L., & Mahradianur, M. (2023). Analisis Data Mining Menggunakan Metode Algoritma C4.5 Menentukan Penerima Bantuan Langsung Tunai. Jurnal Informatika, 10(1), 28–36. https://doi.org/10.31294/inf.v10i1.15115

Deny Jollyta, William Ramdhan, M. Z. (2020). Konsep Data Mining Dan Penerapan. Deepublish.

Edrial, Putrama rangga, & Sujastiawan Ade. (2022). Evaluasi Kebijakan Program Indonesia Pintar (Pip) Di Sma. 3(1), 109–118.

Erlin, E., Desnelita, Y., Nasution, N., Suryati, L., & Zoromi, F. (2022). Dampak SMOTE terhadap Kinerja Random Forest Classifier berdasarkan Data Tidak seimbang. MATRIK : Jurnal Manajemen, Teknik Informatika Dan Rekayasa Komputer, 21(3), 677–690. https://doi.org/10.30812/matrik.v21i3.1726

Grandis, G. F., Arumsari, Y., & Indriati. (2021). Seleksi Fitur Gain Ratio pada Analisis Sentimen Kebijakan Pemerintah Mengenai Pembelajaran Jarak Jauh dengan K-Nearest Neighbor. Jurnal Pengembangan Teknologi Informasi Dan Ilmu Komputer, 5(8), 3507–3514.

Harahap, F., Fahrozi, W., Adawiyah, R., Siregar, E. T., & Harahap, A. Y. N. (2023). Implementasi Data Mining dalam Memprediksi Produk AC Terlaris untuk Meningkatkan Penjualan Menggunakan Metode Naive Bayes. Jurnal Unitek, 16(1), 41–51. https://doi.org/10.52072/unitek.v16i1.541

Lutfia, A., Gunawan, G., Rohman, R. S., & Gunawan, A. (2024). Penerapan Seleksi Fitur Gain Ratio Pada Prediksi Penyakit Jantung Berbasis Naïve Bayes. Jurnal Responsif : Riset Sains Dan Informatika, 6(1), 1–10. https://doi.org/10.51977/jti.v6i1.1396

Nugraha, M. A., Mazdadi, M. I., Farmadi, A., Muliadi, & Saragih, T. H. (2023). Penyeimbangan Kelas SMOTE dan Seleksi Fitur Ensemble Filter pada Support Vector Machine untuk Klasifikasi Penyakit Liver. Jurnal Teknologi Informasi Dan Ilmu Komputer, 10(6), 1273–1284. https://doi.org/10.25126/jtiik.2023107234

Pakpahan, N. S. (2021). Implementasi Data Mining Menggunakan Algoritma J48 Dalam Menentukan Pola Itemset Belanja Pembeli (Study Kasus: Swalayan Brastagi Medan). Journal of Computing and Informatics Research, 1(1), 7–13.

Pebdika, A., Herdiana, R., & Solihudin, D. (2023). Klasifikasi Menggunakan Metode Naive Bayes Untuk Menentukan Calon Penerima Pip. JATI (Jurnal Mahasiswa Teknik Informatika), 7(1), 452–458. https://doi.org/10.36040/jati.v7i1.6303

Purnama Oktavia, I., & Lestari Anggreini, N. (2024). Implementasi Algoritma Naive Bayes Dengan Metode Klasifikasi Dalam Menentukan Siswa Penerima Bantuan Program Indonesia Pintar. JATI (Jurnal Mahasiswa Teknik Informatika), 8(6), 11152–11158. https://doi.org/10.36040/jati.v8i6.11241

Putra, I. M. A. A. D., Sunarya, I. M. G., & Gunadi, I. G. A. (2024). Perbandingan Algoritma Naive Bayes Berbasis Feature Selection Gain Ratio dengan Naive Bayes Kovensional dalam Prediksi Komplikasi Hipertensi. JTIM : Jurnal Teknologi Informasi Dan Multimedia, 6(1), 37–49. https://doi.org/10.35746/jtim.v6i1.488

Rofiq, M. A., Kurniati, N., & Surya Editya, A. (2024). Klasifikasi Kelayakan Data Beasiswa PIP Pada MINU Sumokali Menggunakan Metode Decision Tree. JATISI (Jurnal Teknik Informatika Dan Sistem Informasi), 11 No 1(x), 1–5.

Sandi, S. A., Novianto, Y., & Sandi, S. A. (2023). Klasifikasi Kelayakan Keluarga Penerima Bantuan Langsung Tunai Menggunakan Gain Ratio Dan Naïve Bayes Jurnal Informatika Dan Rekayasa Komputer ( JAKAKOM ). Jurnal Informatika Dan Rekayasa Komputer (JAKAKOM), 3(April), 433–442.

Sari Oktapia Ningse, W. R., Sumarno, S., & Nasution, Z. M. (2022). C4.5 Algorithm Classification for Determining Smart Indonesia Program Recipients at MIS Al-Khoirot. JOMLAI: Journal of Machine Learning and Artificial Intelligence, 1(1), 65–76. https://doi.org/10.55123/jomlai.v1i1.165

Simanjuntak, A. Y., Simatupang, I. S. S., & Anita. (2022). Implementasi Data Mining Menggunakan Metode Naïve Bayes Classifier Untuk Data Kenaikan Pangkat Dinas. Journal of Science and Social Research, 4307(1), 85–91.

Surono, G., & Pusparini, N. N. (2020). Journal of technology information. Jurnal Of Technology Information, 5(2), 99–104.

Susanto, P. C., Arini, D. U., Yuntina, L., & Panatap, J. (2024). Konsep Penelitian Kuantitatif : Populasi , Sampel , dan Analisis Data ( Sebuah Tinjauan Pustaka ). 3(1), 1–12.

Sutoyo, E., & Fadlurrahman, M. A. (2020). Penerapan SMOTE untuk Mengatasi Imbalance Class dalam Klasifikasi Television Advertisement Performance Rating Menggunakan Artificial Neural Network. Jurnal Edukasi Dan Penelitian Informatika (JEPIN), 6(3), 379. https://doi.org/10.26418/jp.v6i3.42896

Syahriani Syam, Yokelin Tokoro, Loso Judijanto, Melki Garonga, Frans Mikael Sinaga, Najirah Umar, I Putu Susila Handika, Johar Nur Iin, Apriyanto Apriyanto, A. T. S. (2024). Data Mining : Teori dan Penerapannya dalam Berbagai Bidang (S. S. Efitra Efitra , Elok Pamela (ed.)). PT. Sonpedia Publishing Indonesia.

Tempola, F., Muhammad, M., & Khairan, A. (2018). Perbandingan Klasifikasi Antara KNN dan Naive Bayes pada Penentuan Status Gunung Berapi dengan K-Fold Cross Validation. Jurnal Teknologi Informasi Dan Ilmu Komputer, 5(5), 577–584. https://doi.org/10.25126/jtiik.201855983

Tesa Vausia Sandiva, Defit, S., & Nurcahyo, G. W. (2024). Implementasi Algoritma C4.5 Untuk Prediksi Penerima Beasiswa Program Indonesia Pintar. Jurnal KomtekInfo, 11(4), 354–362. https://doi.org/10.35134/komtekinfo.v11i4.582

Torang Siregar, Riski Ardian, Ahmad Arisman, & Iskandarsyah. (2024). Studi Kasus Sma N 1 Sinunukan : Implementasi Algoritma K-Nearest Neighbor Untuk Klasifikasi Penerima Beasiswa Program Indonesia Pintar (Pip). Jurnal Cermatika, 4(1), 9–25. https://doi.org/10.64168/cermatika.v4i1.1324

Wahab, A., Samarinda, S., Lishania, I., Goejantoro, R., & Nasution, Y. N. (2019). Perbandingan Klasifikasi Metode Naive Bayes dan Metode Decision Tree Algoritma (J48) pada Pasien Penderita Penyakit Stroke di RSUD Comparison of the Classification for Naive Bayes Method and the Decision Tree Algorithm (J48) for Stroke Patients in Abdul W. Jurnal EKSPONENSIAL, 10(2), 135–142.

Downloads

Published

2025-12-30

How to Cite

Dea Sabrina Candra, Jasmir Jasmir, & Yanti, E. (2025). Implementasi Data Mining dengan Teknik Smote dan Fitur Gain Ratio Untuk Klasifikasi Kelayakan Siswa Penerima PIP di Kota Jambi. Prosiding Seminar Nasional Ilmu Teknik, 2(2), 596–609. https://doi.org/10.61132/prosemnasproit.v2i2.66