Model Feature Selection dalam Penentuan Parameter Pengelompokan Kompetensi SDM IG

Penulis

  • Budi Susetyo Program Studi Teknik Informatika, Fakultas Teknik dan Sains, Universitas Ibn Khaldun Bogor
  • Puspa Eosina Program Studi Teknik Informatika, Fakultas Teknik dan Sains, Universitas Ibn Khaldun Bogor
  • Immas Nurhayati Program Studi Akuntansi, Fakultas Ekonomi dan Manajemen, Universitas Ibn Khaldun Bogor
  • Indupurnahayu Indupurnahayu Program Studi Manajemen, Fakultas Ekonomi dan Manajemen, Universitas Ibn Khaldun Bogor

DOI:

https://doi.org/10.32832/kreatif.v7i2.2696

Kata Kunci:

Decision tree induction, Euclidean distance, Feature subset selection, K-means, Mean intercluster dissimilarity

Abstrak

Industri geospasial memiliki prospek bisnis yang berkembang pesat di Indonesia, khususnya di sektor swasta.  Untuk mengetahui seberapa besar potensi sumberdaya manusia sesuai dengan kompetensi bidang informasi geospasial tersebut dibutuhkan survey dan analisis terkait parameter beberapa parameter kompetensi. Tujuan penelitian ini adalah mencari pengukuran parameter yang paling mempengaruhi pengelompokan kompetensi sumberdaya manusia bidang informasi geospasial.  Penelitian ini menggunakan data profil yang telah diolah menjadi 5 kategori index yaitu WEI, EFI, ENI, CFI, dan CPI.  dengan jumlah sampel 46 data. Metode yang digunakan adalah k-means clustering untuk pembentukan cluster kompetensi yang selanjutnya dibandingkan di antara 4 ,5 dan 6 cluster. Evaluasi cluster yang dipilih adalah menggunakan Mean intercluster dissimilarity dengan rumus jarak Euclidean. Dihasilkan bahwa pengelompokan paling optimal adalah 4 cluster dengan nilai intercluster terbesar, yaitu 0.45699. Fature subset selection dilakukan terhadap data yang sudah membentuk 4 cluster untuk melihat parameter yang paling berpengaruh. Untuk hal ini, digunakan metode Decision Tree Induction dengan skema Binary Tree. Diperoleh nilai Impurity terkecil pada atribut EFI, yaitu sebesar 0.6857 yang menunjukkan bahwa atribut EFI adalah parameter yang paling berpengaruh dalam menentukan label sebuah data.

Biografi Penulis

Budi Susetyo, Program Studi Teknik Informatika, Fakultas Teknik dan Sains, Universitas Ibn Khaldun Bogor

Budi Susetyo adalah Dosen pada Program Studi teknik Informatika Universitas Ibn Khaldun Bogor

Referensi

Chandrashekar, G., & Sahin, F. (2014). A survey on feature selection methods. Computers and Electrical Engineering, 40(1), 16–28. https://doi.org/10.1016/j.compeleceng.2013.11.024

Leela Sandhya Rani, Y., Sucharita, V., Bhattacharyya, D., & Kim, H. J. (2016). Performance evaluation of feature selection methods on large dimensional databases. International Journal of Database Theory and Application, 9(9), 75–82. https://doi.org/10.14257/ijdta.2016.9.9.07

Beniwal, S., & Arora, J. (2012). Classification and Feature Selection Techniques in Data Mining, 1(6), 1–6.

Shang, R., Zhang, Z., Jiao, L., Liu, C., & Li, Y. (2016). Self-representation based dual-graph regularized feature selection clustering. Neurocomputing, 171, 1242–1253. https://doi.org/10.1016/j.neucom.2015.07.068

Bennasar, M., Hicks, Y., & Setchi, R. (2015). Feature selection using Joint Mutual Information Maximisation. Expert Systems with Applications, 42(22), 8520–8532. https://doi.org/10.1016/j.eswa.2015.07.007

Kumbhar, P. (2016). A Survey on Feature Selection Techniques and Classification Algorithms for Efficient Text Classification, 5(5), 1267–1275.

Zhao, Z., Wang, L., Liu, H., & Ye, J. (2013). On similarity preserving feature selection. IEEE Transactions on Knowledge and Data Engineering, 25(3), 619–632. https://doi.org/10.1109/TKDE.2011.222

Casella, G., Fienberg, S., & Olkin, I. (2013). An Introduction to Statistical Learning. Springer Texts in Statistics. https://doi.org/10.1016/j.peva.2007.06.006

Kittler, J. "Feature Selection & Extraction”, in Handbook of Pattern Recognition and Image Processing, Tzay Y. Young, King Sun Fu Ed. Academic Press, 1986.

MAPIN. Profil SDM-IG, Masyarakat Penginderaan Jauh Indonesia. 2019.

Han, J., Kamber, M., & Pei, J. (2012). Data mining: Data mining concepts and techniques (Third). Morgan Kaufmann. https://doi.org/10.1109/ICMIRA.2013.45

Sullivan, R. (2012). Introduction to Data Mining for the Life Sciences. Journal of Chemical Information and Modeling (Vol. 53). Springer. https://doi.org/10.1017/CBO9781107415324.004

Susetyo, B., I. Nurhayati, I. Purnahayu, P. Eosina, (2017), "Model Evaluasi Kinerja SDM Geospasial Menggunakan Metode CPI dan CPD Berbasis WebGIS". Prosiding Seminar Nasional XII "Rekayasa Teknologi Industri dan Informasi 2017 Sekolah Tinggi Teknologi Nasional Yogyakarta

Unduhan

Diterbitkan

2019-11-30

Cara Mengutip

Susetyo, B., Eosina, P., Nurhayati, I., & Indupurnahayu, I. (2019). Model Feature Selection dalam Penentuan Parameter Pengelompokan Kompetensi SDM IG. Krea-TIF: Jurnal Teknik Informatika, 7(2), 80–87. https://doi.org/10.32832/kreatif.v7i2.2696

Terbitan

Bagian

Articles