Diabetes mellitus tipe-2 (T2DM) merupakan penyakit metabolisme kronis yang sering diderita oleh orang dewasa. T2DM ditandai dengan menurunnya insulin dalam tubuh. Enzim dipeptidil peptidase-4 (DPP-4) dapat mengkatalisasi penurunan hormon peptida inkretin, terutama peptide-1 seperti hormon gastric inhibitory peptide (GIP) dan glucagon-like peptide-1 (GLP-1), yang mengakibatkan penurunan sintesis insulin. Inhibitor DPP-4 adalah target obat yang menjanjikan untuk T2DM, karena dapat memblokir kerja enzim DPP-4 dengan menghambat kerja hormon GLP-1 dan GIP. Penelitian ini menggunakan data inhibitor DPP-4 yang akan diekstraksi ciri menggunakan metode Extended-Connectivity Fingerprint (ECFP) dan Functional-Class Fingerprints (FCFP). Hasil ekstraksi ciri tersebut digunakan sebagai vektor masukan untuk metode deep neural network (DNN) untuk memprediksi inhibitor DPP-4 ke dalam senyawa aktif dan tidak aktif. Selain itu, metode CatBoost diusulkan sebagai metode pemilihan fitur terhadap hasil ekstraksi ciri metode ECFP dan FCFP. Dalam penelitian ini akan membandingkan performa metode DNN dengan menggunakan pemilihan fitur metode CatBoost dan tanpa menggunakan pemilihan fitur metode CatBoost. Hasil dari penelitian ini menunjukkan bahwa metode DNN menggunakan ekstraksi ciri ECFP_6 dengan proporsi pemilihan fitur sebesar 90% memiliki nilai sensitivitas, spesifisitas, akurasi, dan MCC berturut-turut adalah 0.927,0.881,0.906, dan 0.810.
Diabetes mellitus type-2 (T2DM) is a chronic metabolic disease that often affects adults. T2DM is characterized by a decrease of insulin in the body. The dipeptidyl peptidase-4 (DPP-4) enzyme can catalyze a decrease of incretin peptide hormones, especially peptide-1, such as gastric inhibitory peptide (GIP) hormone and glucagon-like peptide-1 (GLP-1), which results in decreased insulin synthesis. DPP-4 inhibitors are a promising drug target for T2DM because they block the action of the DPP-4 enzyme by inhibiting the activity of the GLP-1 and GIP hormones. This study uses DPP-4 inhibitor data, which will be feature extracted using the Extended-Connectivity Fingerprint (ECFP) and Functional-Class Fingerprints (FCFP) methods. The results of feature extraction are used as input vectors of the deep neural network (DNN) method to predict DPP-4 inhibitors into active and inactive compounds. In addition, the CatBoost method is proposed as a feature selection method for the feature extraction results of the ECFP and FCFP methods. In this study, we will compare the performance of the DNN method using the feature selection of the CatBoost method and without using the feature selection of the CatBoost method. The results of this study indicate that the DNN method using feature extraction ECFP_6 with 90% of the feature selection having sensitivity, specificity, accuracy, and MCC values, respectively, 0.927, 0.881, 0.906, and 0.810.