Hasil Pencarian  ::  Simpan CSV :: Kembali

Hasil Pencarian

Ditemukan 132601 dokumen yang sesuai dengan query
cover
Aryo Hastungkoro Harimurti Mukarta
"Dalam melakukan klaim subrogasi, perusahaan penjaminan kredit sering mengalami kendala di mana pihak yang dijamin tidak melunasi pinjamannya sesuai kesepakatan. Hal ini membuat perusahaan penjaminan kredit mengklasifikasikan pihak terjamin yang berpotensi untuk melunasi pinjaman kreditnya, dan pihak terjamin yang tidak berpotensi untuk melunasi pinjaman kreditnya. Penelitian ini mengevaluasi prediksi potensi klaim subrogasi pada penjaminan kredit menggunakan berbagai model pembelajaran mesin berdasarkan data dunia nyata dari perusahaan penjaminan kredit besar di Indonesia. Eksperimen menggunakan Logistic Regression, sebuah metode prediksi berbasis persamaan linier, Penalized Logistic Regression, bentuk dari Logistic Regression yang koefisien-koefisiennya diberikan penalti, dan Random Forest Classifier, sebuah metode berbasis ensemble learning. Model diuji menggunakan Hold-out Validation dan data prediksi dibandingkan dengan data uji untuk false positive dan false negative. Hasil penelitian menunjukkan bahwa Random Forest Classifier memberikan hasil yang lebih baik, menunjukkan kinerja rata-rata yang lebih baik dibandingkan dengan Logistic Regression dan Penalized Logistic Regression . Temuan studi ini dapat digunakan oleh analis klaim dan subrogasi baik dari perusahaan penjaminan kredit maupun peneliti independen dalam menilai kekuatan dan kelemahan masing-masing model dan untuk menyusun aturan keputusan yang efektif secara empiris untuk mengevaluasi kebijakan subrogasi.

In making subrogation claims, credit guarantee companies often encounter problems where the guaranteed party does not pay off their loan according to the agreement. This makes credit guarantee companies classify those who have the potential to pay off their credit loans, or those that are not potential to pay off their credit loans. This study evaluates the prediction of potential subrogation claims in credit guarantees using various machine learning models based on real-world data from a large credit guarantee company in Indonesia. The experiment used Logistic Regression, a linear equation-based prediction method, Penalized Logistic Regression, a form of Logistic Regression whose coefficients are penalized, and the Random Forest Classifier, an ensemble learning-based method. The model was tested using Hold-out Validation and prediction dataset were compared to test dataset for false positives and false negatives. The results showed that the Random Forest Classifier gave better results, indicating a better average performance compared to Logistic Regression and Penalized Logistic Regression. The findings of this study can be used by claims and subrogation analysts from both credit guarantee companies and independent researchers in assessing the strengths and weaknesses of each model and to construct empirically effective decision rules for evaluating subrogation policies."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2022
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Nada Firdaus
"ABSTRAK
Kanker adalah penyebab kematian nomor dua di dunia dan diperkirakan mencapai 9,6 juta kematian pada tahun 2018, dengan kanker payudara menjadi kanker kedua yang sering terjadi setelahnya kanker paru-paru. Kanker payudara terjadi karena pertumbuhan sel abnormal yang tidak terkendali, yang dimulai di saluran yang membawa susu ke puting susu atau kelenjar pembuat susu. Pengobatan kanker payudara tergantung pada subtipe tumor, stadium, penanda genetik, usia pasien, kesehatan pasien umum, status menopause, dan mutasi pada gen kanker payudara yang diwariskan. Di akhir pengobatan pasien diberikan terapi tambahan yang bertujuan meminimalkan risiko kekambuhan. Meskipun terapi ini telah dilakukan, risiko kekambuhan tetap ada. Penanda pengganti adalah penanda yang digunakan untuk menggantikan titik akhir dari uji klinis yang biasanya digunakan mempercepat penanganan pasien. Tujuan dari penelitian ini adalah untuk mengetahui rasio hematologi pengukuran yang dapat digunakan sebagai penanda pengganti dalam kekambuhan kanker payudara sepanjang dengan titik cut-off. Pohon keputusan digunakan untuk menemukan titik batas rasio hematologi pengukuran yang mempengaruhi kekambuhan kanker payudara, dan kemudian hutan acak itu digunakan untuk mengetahui urutan variabel penting dalam klasifikasi. Hasil keduanya
metode dikuantifikasi menggunakan regresi logistik. Berdasarkan analisis, ditemukan bahwa rasio jumlah trombosit ke darah putih (titik potong 47.560) dan neutrofil terhadap rasio limfosit (titik potong 1,953) mempengaruhi kekambuhan kanker payudara.

ABSTRACT
Cancer is the number two cause of death in the world and is estimated to reach 9.6 million deaths in 2018, with breast cancer becoming the second most common cancer that follows lung cancer. Breast cancer occurs because of uncontrolled abnormal cell growth, which starts in the ducts that carry milk to the nipples or milk glands. Treatment of breast cancer depends on the tumor subtype, stage, genetic markers, patient age, general patient health, menopausal status, and mutations in inherited breast cancer genes. At the end of treatment the patient is given additional therapy aimed at minimizing the risk of recurrence. Despite this therapy, the risk of recurrence remains. A surrogate marker is a marker used to replace the endpoints of clinical trials that are usually used to speed up patient management. The aim of this study is to determine the hematological ratio measurements that can be used as surrogate markers in breast cancer recurrence along with the cut-off point. The decision tree is used to find the hematological ratio boundary point measurements that affect breast cancer recurrence, and then the random forest is used to determine the order of important variables in the classification. Both results the method is quantified using logistic regression. Based on the analysis, it was found that the ratio of platelet count to white blood (cut point 47,560) and neutrophils against lymphocyte ratio (cut point 1.953) influences breast cancer recurrence.
"
2019
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Andre Nurrohman
"ABSTRACT
Penyakit Parkinson terbagi dalam dua subtipe, yaitu Tremor Dominant (TD) dan Postural Instability/Gait Dominant (PIGD). Tiap subtipe memiliki perbedaan dalam penanganan klinis, sehingga perlu dilakukan klasifikasi subtipe penyakit Parkinson. Dalam Statistika, ada beberapa model yang membahas klasifikasi diantaranya adalah decision tree, regresi logistik, dan logit leaf model (LLM). LLM merupakan model campuran dari decision tree dan regresi logistik yang diusulkan oleh De Caigny et al. (2018). Penulisan ini membahas klasifikasi subtipe penyakit Parkinson menggunakan model klasifikasi statistika beserta penanganan masalah imbalanced data yang terjadi pada data penyakit Parkinson. Diperoleh model klasifikasi regresi logistik dengan melakukan proses SMOTE ± = 600, = 200 untuk menangani masalah imbalanced data. Model tersebut memberikan akurasi sebesar 98,83%, sensitivitas sebesar 98,41%, dan spesifisitas sebesar 99,07%.

ABSTRACT
Parkinsons Disease has two sub-types which are Tremor Dominant (TD) and Postural Instability/Gait Difficulty (PIGD). Each subtype has the difference in clinical treatment, so it is necessary to classify Parkinsons Disease subtypes. In Statistics, there are statistical models for classifying such as decision tree, logistic regression, and logit leaf model (LLM). LLM is a hybrid model from decision tree and logistic regression that proposed by (De Caigny et al., 2018). In this thesis discuss Parkinsons Disease Classification using statistical models with imbalanced data problem handling happen in Parkinson`s Disease data. For the result, logistic regression by processing SMOTE ± = 600, = 200 to handle data imbalanced problem. The model provides an accuracy of 98,83%, sensitivity of 98.41%, and specificity of 99.07%."
[, ]: 2019
S-Pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Fahri Alamsyah
"Dunia digital khususnya image processing berkembang seiring waktu berjalan dikarenakan kebutuhan masyarakat dan pentingnya keamanan sistem berbasis digital. Salah satu teknologi yang sangat mengalami kemajuan pesat adalah pengenalan wajah (face recognition) menggunakan artificial intelligence. Wajah seseorang yang sudah terdaftar di dalam database akan dikenali oleh sistem untuk keperluan validasi atau verifikasi. Di dalam penelitian ini dirancang sistem pengenalan wajah (face recognition) menggunakan algoritma machine learning dan Principal Component Analysis (PCA) sebagai pereduksi dimensi. Pengujian dilakukan dengan menggunakan beberapa metode, yakni: Support Vector Machine (SVM), Decision Tree (DT), K-Nearest Neighbour (K- NN), Logistic Regression (LR), Multi-Layer Perceptron (MLP) dan Convolutional Neural network (CNN). CNN berfokus pada layer dan tidak memerlukan reduksi dimensi, sehingga hasilnya lebih akurat. Model machine learning yang digunakan untuk classifier selain CNN adalah standar/default, sedangkan CNN menggunakan arsitektur LeNet-5, dengan dropout rate sebesar 0.25. Training dilakukan selama 60 epoch dengan loss function crosscategorical entropy, optimizer Adam, dan batch size sebesar 20. Data masukan adalah citra wajah berukuran 64 × 64 × 1 yang diperoleh dari dataset olivetti faces. Akurasi tertinggi metode PCA, SVM, maupun LR sebesar 91.25%, sementara akurasi terbaik CNN mencapai 98.75%. Selain akurasi, pemakaian confusion matrix dan classification report digunakan untuk menguji performa metode yang ada melalui evaluasi model klasifikasi.

The digital world, especially image processing, is evolving due to the needs of society and the importance of digital-based system security. One of the technologies that are rapidly progressing is face recognition using artificial intelligence. The system will recognize a person's face already registered in the database for validation or verification purposes. A face recognition system was designed using machine learning algorithms and Principal Component Analysis (PCA) as dimension reduction in this study. Testing is conducted using several methods: Support Vector Machine (SVM), Decision Tree (DT), K-Nearest Neighbour (K-NN), Logistic Regression (LR), Multi-Layer Perceptron (MLP) and Convolutional Neural network (CNN). CNN focuses on layers and does not require dimensional reduction to increase the accuracy of the result. The machine learning model used for classifiers other than CNN is standard/default settings, while CNN uses the LeNet-5 architecture, with a dropout rate of 0.25. The training was conducted for 60 epochs with loss function cross-categorical entropy, optimizer Adam, and batch size of 20. Input data is a 64 × 64 × 1 facial image obtained from the Olivetti faces database. The highest accuracy of PCA, SVM and LR methods was 91.25%, while CNN's best accuracy reached 98.75%. In addition to accuracy, the use of confusion matrix and classification report is used to test the performance of existing methods through the evaluation of classification models."
Depok: Fakultas Teknik Universitas Indonesia, 2021
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Risfania Nurdinda Sari
"COVID-19 adalah penyakit yang disebabkan oleh virus SARS-CoV-2 dan menyerang sistem pernapasan manusia. Selain menganggu kesehatan fisik, pandemi COVID-19 juga memberikan dampak psikologis, salah satunya adalah tingkat stres yang meningkat pada masyarakat. Penelitian ini bertujuan untuk mengidentifikasi faktor-faktor yang berasosiasi dengan tingkat stres pada pandemi COVID-19. Dalam mencapai tujuan tersebut, penelitian ini menggunakan metode classification tree dan regresi logistik multinomial. Sebelum melakukan proses identifikasi faktor menggunakan classification tree, dilakukan penanganan masalah imbalance data menggunakan metode SMOTE. Selanjutnya, dilakukan kuantifikasi risiko faktor-faktor yang teridentifikasi pada classification tree menggunakan analisis regresi logistik multinomial. Kinerja model diukur menggunakan nilai precision, recall, F1-Score, dan AUC. Hasil yang diperoleh adalah model classification tree dengan penanganan imbalance data menggunakan SMOTE dapat meningkatkan kinerja model dengan nilai precision 0,5980, nilai recall 0,8653, nilai F1-Score 0,7072, dan AUC 0,702. Dengan model tersebut, didapatkan faktor-faktor yang teridentifikasi berasosiasi dengan tingkat stres pada pandemi COVID-19 adalah Total_OECDInsititutions, Total_CoronaConcerns, dan Age. Peningkatan nilai Corona Concerns cenderung memberikan risiko peningkatan tingkat stres, sedangkan peningkatan nilai OECDInsititutions dan Age cenderung memberikan risiko penurunan tingkat stres.

COVID-19 is a disease caused by the SARS-CoV-2 virus that attacks the human respiratory system. In addition to disrupting physical health, the COVID-19 pandemic also has psychological impacts, one of which is an increased level of stress. This study aims to identify factors associated with the level of stress during the COVID-19 pandemic. The study employs the classification tree method and multinomial logistic regression. Prior to the factor identification process using the classification tree, the issue of imbalanced data is addressed using the SMOTE method. Subsequently, the quantification of risk factors identified in the classification tree is conducted using multinomial logistic regression analysis. The model's performance is measured using precision, recall, F1-score, and AUC values. The results obtained indicate that the classification tree model with the handling of imbalanced data using SMOTE can improve model performance, with a precision value of 0,5980, recall value of 0,8653, F1-score value of 0,7072, and AUC value of 0,702. With this model, the identified factors associated with the level of stress during the COVID-19 pandemic are Total_OECDInstitutions, Total_CoronaConcerns, and Age. An increase in Corona Concerns tends to pose a risk of increased stress levels, while an increase in OECD Institutions and Age tends to pose a risk of decreased stress levels."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2023
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Deby Novita Sari
"ABSTRAK
Sebagai metode kontrasepsi, Metode Kontrasepsi Jangka Panjang (MKJP) reversibel (seperti IUD dan Implan) mempunyai keunggulan dibandingkan short term method dan MKJP permanen. Namun, data Survei Demogrfi dan Kesehatan Indonesia (SDKI) menunjukkan penurunan penggunaan MKJP reversibel dalam jangka waktu 30 tahun (1987-2017). Penelitian ini bertujuan untuk mengetahui pengaruh persetujuan suami dan pengambilan keputusan bersama antara suami istri terhadap penggunaan MKJP reversibel istri. Data SDKI 2017 digunakan dengan unit analisis wanita berstatus kawin yang sedang menggunakan kontrasepsi modern. Dengan menggunakan regresi logistik multinomial, penelitian ini menemukan bahwa persetujuan suami berpengaruh positif terhadap penggunaan MKJP reversibel baik jika dibandingkan dengan short term method maupun MKJP permanen, meskipun pengaruh persetujuan suami terhadap peningkatan penggunaan MKJP reversibel (relatif terhadap short term method) tidak memberikan pengaruh yang signifikan. Pengambilan keputusan bersama berpengaruh positif terhadap penggunaan MKJP reversibel dibandingkan short term method. Sedangkan jika dibandingkan dengan MKJP permanen, pengambilan keputusan bersama memberikan pengaruh negatif terhadap penggunaan MKJP reversibel.

ABSTRACT
As a contraceptive, Long Acting and Reversible Contraception (LARC), such as IUDs and Implants, has many advantages compared to short term method and Long Acting and Permanent Method (LAPM). Despite these advantages, the Indonesian Demographic and Health Survey (IDHS) data shows a decrease in the use of the LARC over a period of 30 years (1987-2017). This study aims to investigate the effect of husband's approval and joint decision making between husband and wife on the wife's use of LARC. Data from IDHS 2017 is used with currently married women who are using modern contraceptive methods serves as unit analysis. Using multinomial logistic regression, this study found that husband's approval had a positive effect on the use of LARC both compared to the short term method and LAPM, although husband's approval did not have a significant effect on the use of LARC (relative to the short term method). Joint decision making has a positive effect on the use of LARC compared to the short term method. Whereas when compared with LAPM, joint decision making has a negative effect on the use of LARC."
2020
T-Pdf
UI - Tesis Membership  Universitas Indonesia Library
cover
Aldinda Albanna
"Sebuah perusahaan memerlukan sumber daya manusia yang baik agar dapat mencapai visi, misi, serta tujuan yang telah ditetapkan. Sumber daya manusia yang baik dapat dibangun dengan meningkatkan kesejahteraan dan kenyamanan pegawai sehingga produktivitas bekerja diharapkan dapat meningkat. Salah satu upaya yang dapat dilakukan adalah pemberian reward, seperti tunjangan lokasi. Bank Syariah "X" merupakan salah satu lembaga pada bidang perbankan syariah yang memberikan tunjangan lokasi kepada pegawainya. Peraturan yang ditetapkan pada Bank Syariah "X" mengenai tunjangan lokasi merupakan tunjangan yang diberikan kepada pegawai berdasarkan lokasi pegawai tersebut bekerja. Bank Syariah "X" memiliki tiga kategori tunjangan lokasi, yaitu Zona 1, Zona 2, dan Zona 3 & 4. Kebijakan ini terakhir ditetapkan pada tahun 2021. Sedangkan, pada rentang waktu hingga saat ini, terdapat perubahan kondisi, seperti keadaan lokasi outlet (cabang), pertumbuhan ekonomi, dan relokasi outlet Bank Syariah "X". Oleh karena itu, penelitian ini bertujuan untuk menganalisis faktor-faktor yang menjelaskan penentuan zonasi tunjangan lokasi memprediksi zonasi tunjangan lokasi outlet baru dari Bank Syariah "X". Zonasi tunjangan lokasi ditentukan berdasarkan faktor kemahalan, keterpencilan, dan akses lokasi. Faktor-faktor yang diduga mewakili faktor kemahalan, keterpencilan, dan akses lokasi, serta memengaruhi penentuan zonasi tunjangan lokasi adalah indeks harga konsumen (IHK), indeks pembangunan manusia (IPM), indeks kemahalan konstruksi (IKK), indeks pilar infrastruktur (IPI), jarak outlet ke puskesmas terdekat (JOP), dan jarak outlet ke sekolah dasar terdekat (JOSD). Zonasi tunjangan lokasi terdiri dari tiga kategori, yaitu Zona 1, Zona 2, dan Zona 3 & 4 yang bersifat ordinal sehingga model yang cocok adalah regresi logistik ordinal. Berdasarkan tujuan penelitian dan jenis variabel terikat, metode analisis data yang digunakan adalah regresi logistik ordinal. Penelitian ini menghasilkan faktor-faktor yang menjelaskan penentuan zonasi tunjangan lokasi adalah indeks kemahalan konstruksi (IKK), indeks pilar infrastruktur (IPI), dan jarak outlet ke puskesmas terdekat (JOP). Model regresi logistik yang dibentuk menghasilkan akurasi sebesar 70% dan balanced accuracy pada Zona 1 sebesar 81.2%, Zona 2 sebesar 70.8%, dan Zona 3 & 4 sebesar 76.7%. Hasil model regresi logistik ordinal ini dapat digunakan untuk memprediksi zonasi tunjangan lokasi outlet baru dari Bank Syariah "X". Berdasarkan kebijakan awal Bank Syariah "X", diperoleh bahwa sebanyak 80 outlet atau sebesar 35.6% outlet salah diklasifikasikan oleh model.

A company needs good human resources in order to achieve the vision, mission, and goals that have been set. Good human resources can be built by improving employee welfare and comfort so that work productivity is expected to increase. One of the efforts that can be made is the reward, such as location allowances. Bank Syariah “X” is one of the institutions in the field of Islamic banking that provides location allowances to its employees. The regulations set at Bank Syariah “X” regarding location allowances are allowances given to employees based on their replacement. Bank Syariah “X” has three categories of location allowances, namely Zone 1, Zone 2, and Zones 3 & 4. This policy was last established in 2021. Meanwhile, in the time span until now, there have been changes in conditions, such as the location of outlets (branches), economic growth, and the relocation of Bank Syariah “X” outlets. Therefore, this study aims to analyze the factors that explain the determination of location allowance zoning and predict the location allowance zoning of new outlets of Bank Syariah “X”. Location allowance zoning is determined based on the factors of costliness, remoteness, and location access. Factors that are thought to represent the factors of costliness, remoteness, and location access, and influence the determination of location allowance zoning are the consumer price index (CPI), human development index (HDI), construction cost index (CCI), infrastructure pillar index (IPI), outlet distance to the nearest health center (JOP), and outlet distance to the nearest elementary school (JOSD). The location allowance zoning consists of three categories, namely Zone 1, Zone 2, and Zone 3 & 4, which are ordinal in nature, so the suitable model is ordinal logistic regression. Based on the research objectives and the type of dependent variable, the data analysis method used is ordinal logistic regression. This research results in factors that explain the zoning determination of location allowances are the construction cost index (CCI), infrastructure pillar index (IPI), and the distance of the outlet to the nearest health center (JOP). The logistic regression model that was formed produced an accuracy of 70% and balanced accuracy in Zone 1 of 81.2%, Zone 2 of 70.8%, and Zones 3 & 4 of 76.7%. The results of this ordinal logistic regression model can be used to predict the zoning allowances for the location of new outlets of Bank Syariah “X”. Based on the initial policy of Bank Syariah "X", it's obtained that 80 outlets or 35.6% of outlets misclassified by the model. "
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2024
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Wisang Residata
"Pola konsumsi rokok merupakan tema penting di Indonesia. Penelitian ini bertujuan untuk menganalisis faktor-faktor yang mempengaruhi frekuensi merokok di Indonesia dengan menggunakan data Survei Demografi Kesehatan Indonesia (IDHS). Dalam penelitian ini, Determinan frekuensi merokok seperti Umur, Jenis Kelamin, Tingkat Pendidikan, Tingkat Kesejahteraan, Status Pernikahan dan Tempat Tinggal. diteliti untuk menentukan pengaruhnya terhadap frekuensi merokok. Berdasarkan hasil analisis regresi logistik ordinal, ditemukan bahwa individu yang termasuk dalam kategori umur remaja (15-24 tahun), berjenis kelamin laki-laki, memiliki tingkat pendidikan dan tingkat kesejahteraan yang lebih rendah, berstatus belum menikah atau cerai/hidup terpisah, serta tinggal di wilayah perkotaan cenderung akan menjadi perokok dengan frekuensi yang tinggi. Hasil ini memberikan bukti empiris yang kuat mengenai faktor-faktor risiko yang perlu menjadi perhatian utama dalam merancang strategi pencegahan untuk mengendalikan perilaku merokok di kalangan masyarakat Indonesia.

The pattern of cigarette consumption is an important theme in Indonesia. This study aims to analyze the factors influencing smoking frequency in Indonesia using data from the Indonesia Demographic and Health Survey (IDHS). In this research, determinants of smoking frequency such as Age, Gender, Education Level, Wealth Index, Marital Status, and Residence were examined to determine their impact on smoking frequency. Based on the results of ordinal logistic regression analysis, it was found that individuals who fall into the teenage age category (15-24 years), are male, have lower education and wealth levels, are unmarried or divorced/separated, and live in urban areas tend to be smokers with high frequency. These results provide strong empirical evidence regarding the risk factors that need to be a primary focus in designing prevention strategies to control smoking behavior among the Indonesian population."
Depok: Fakultas Teknik Universitas Indonesia, 2024
T-pdf
UI - Tesis Membership  Universitas Indonesia Library
cover
Nadia Hartini Kusumawijaya
"Penuaan adalah salah satu faktor utama resiko terjadinya penyakit dan kematian. Laju
penuaan individu dengan usia kronologis yang sama terbukti bervariasi. Maka dari
itu, muncul kebutuhan untuk alat pengukuran penuaan yang lebih akurat, robust, dan
dapat diandalkan dibandingkan usia kronologis, yakni usia biologis. Pada penelitian
ini, penulis membangun model menggunakan Metode Random Forest Regression (RF)
dan Metode Support Vector Regression (SVR) untuk memprediksi umur biologis pada
data pemeriksaan medis, menilai dan mengevaluasi hasil kinerjanya, serta melakukan
komparasi kinerja kedua metode. Terkait metode yang digunakan, Metode RF adalah
metode yang mengaplikasikan Teknik Ensemble Learning dengan cara menggabungkan
beberapa decision tree untuk menghasilkan prediksi. Sedangkan, Metode SVR adalah
metode yang berkerja dengan cara membangun hyperplane atau kumpulan hyperplane
dalam ruang berdimensi tinggi yang dapat digunakan untuk regresi linier atau nonlinier.
Dataset yang digunakan adalah data medis yang berasal dari Kementrian Kesehatan
Republik Indonesia. Pada dataset dilakukan data preprocessing, yakni data diproses pada
aspek missing values handling, encoding, dan outliers detection and outliers handling.
Kemudian, dilakukan feature selection menggunakan Spearman’s Rank Correlation
Coefficient. Setelah itu, dilakukan pembangunan model dengan Metode RF dan model
dengan Metode SVR secara terpisah untuk masing - masing jenis kelamin. Terakhir,
performa model dievaluasi dan dibandingkan kinerjanya menggunakan metrik evaluasi
Root Mean Square Error (RMSE), Coefficient of Determination (R2), Adjusted R2, dan
running time. Metode RF menggunakan hyperparameter terbaik {’max depth’: 15,
’n estimators’: 1150} untuk dataset pria, dan {’max depth’: 15, ’n estimators’: 1250}
untuk dataset wanita. Sedangkan, Metode SVR menggunakan hyperparameter terbaik
{’C’: 2,’epsilon’: 0,2, ’gamma’: ’scale’, ’kernel’: ’rbf’, ’tol’: 0,005} untuk dataset pria,
dan {’C’: 3, ’epsilon’: 0,2, ’gamma’: ’scale’, ’kernel’: ’rbf’, ’tol’: 0,005} untuk dataset
wanita. Metode RF memiliki kinerja yang cukup baik, dengan nilai RMSE = 7,532; R2
= 0,403; Adjusted R2 = 0,351; running time = 0,154 untuk pria dan RMSE = 6,889;
R2 = 0,340; Adjusted R2 = 0,264; running time = 0,179 untuk wanita. Selain itu, SVR
juga memiliki performa yang cenderung sama namun sedikit lebih buruk, dengan nilai
RMSE = 7,692; R2 = 0,376; Adjusted R2 = 0,321; running time = 0,035 untuk pria dan
RMSE = 6,905; R2 = 0,337; Adjusted R2 = 0,306; running time = 0,080 untuk wanita.
Berdasarkan analisis kinerja model yang dilakukan pada penelitian ini model yang
dibangun dengan Metode Random Forest Regression lebih unggul dalam memprediksi
usia biologis dibandingkan dengan Metode Support Vector Regression.

Aging is one of the main risk factors for disease and death. The aging rate of individ- uals of the same chronological age has been shown to vary. So therefore, a need arises for a more accurate, robust, and reliable aging measurement tool than chronological age, namely biological age. In this research, the author build a model using the Random For- est Regression (RF) Method and the Support Vector Regression (SVR) Method to predict biological age from patient clinical data, assess and evaluate the performance results, and compare the performance of the two models. Regarding the method used, the Random Forest Regression Method is a method that applies the Ensemble Learning Technique by combining several decision trees to produce predictions. Meanwhile, the Support Vector Regression Method is a method that works by building a hyperplane or collection of hy- perplane in high-dimensional space which can be used for linear or nonlinear regression. The dataset used is medical data originating from the Ministry of Health of the Republic of Indonesia. On the dataset, data preprocessing is carried out, namely the data is processed in the aspects of missing values handling, encoding, and outliers detection and outliers handling. Then, feature selection is carried out using Spearman’s Rank Correlation Co- efficient. After that, machine learning model using RF Method and machine learning model using SVR Method were created separately for each gender. Finally, the model performance is evaluated and its performance compared using evaluation metrics, namely Root Mean Square Error (RMSE), Coefficient of Determination (R2), and Adjusted R2, as well as running time. The RF Method used best hyperparameters {’max depth’: 15, ’n estimators’: 1150} for the male dataset, and {’max depth’: 15, ’n estimators’: 1250 } for the female dataset. Meanwhile, the SVR Method used best hyperparameters {’C’: 2, ’epsilon’: 0.2, ’gamma’: ’scale’, ’kernel’: ’rbf’, ’toll’: 0.005} for the male dataset, and {’C’: 3, ’epsilon’: 0, 2, ’gamma’: ’scale’, ’kernel’: ’rbf’, ’toll’: 0.005} for female dataset. The result is that the model built using the RF Method has quite good performance, with an RMSE value of = 7.532; R2 = 0.403; Adjusted R2 = 0.351; running time = 0.154 for men and RMSE = 6.889; R2 = 0.340; Adjusted R2 = 0.264; running time = 0.179 for women. Apart from that, SVR also has performance that tends to be the same but slightly worse, with an RMSE value of = 7,692; R2 = 0.376; Adjusted R2 = 0.321; running time = 0.035 for men and RMSE = 6.905; R2 = 0.337; Adjusted R2 = 0.306; running time = 0.080 for women. Based on the model performance analysis carried out in this research, the model built using the Random Forest Regression Method is superior in predicting biological age compared to the Support Vector Regression Method."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2024
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Muhammad Rizky Adha
"ABSTRACT
Pemodelan regresi telah diterapkan dalam perbankan ritel karena kemampuannya dalam menganalisis data kontinu maupun diskrit. Hal tersebut merupakan alat yang penting dalam penilaian risiko kredit, stress testing, serta evaluasi aset kredit. Pada tugas akhir ini, pendekatan yang digunakan adalah dengan menggunakan model regresi logistik multinomial untuk mengetahui faktor-faktor yang memengaruhi terjadinya default dan attrition pada suatu kredit. Selain itu, pada tugas akhir ini juga akan diperkenalkan pendekatan regresi spline dengan menggunakan truncated power basis untuk memodelkan fungsi hazard. Fleksibilitas dari fungsi spline memberikan kemampuan untuk memodelkan fungsi hazard yang berbentuk nonlinier dan tidak beraturan. Kemudian, dengan menggunakan regresi spline dan regresi logistik multinomial, akan diperoleh sebuah hasil dan interpretasi yang lebih baik. Terdapat beberapa kelebihan dari penggunaan kedua model tersebut. Pertama, dengan menggunakan fungsi regresi spline yang fleksibel, dapat dimodelkan fungsi hazard yang berbentuk nonlinier dan tidak beraturan. Kedua, mudah dipahami dan diterapkan, dan bentuk parametrik model regresi logistik multinomial yang sederhana dapat memudahkan dalam interpretasi model. Ketiga, memiliki kemampuan untuk prediksi. Pada akhir pembahasan, dengan menggunakan sebuah data kartu kredit akan dilakukan pengaplikasian dari model regresi logistik multinomial dan regresi spline, dilengkapi dengan penjelasan secara statistika dan akurasi prediksi.

ABSTRACT
Regression modeling has been adapted in retail banking because of its capability to analyze the continuous and discrete data. It is an important tool for credit risk scoring, stress testing and credit asset evaluation. In this thesis, the approach used is multinomial logistic regression model to gain the information regarding the factors that affect the occurrence of default and attrition. In addition, this thesis will also introduce spline regression approach using truncated power basis to model the hazard function. The flexibility of spline function allows us to model the nonlinear and irregular shapes of the hazard functions. Then, by using spline regression and multinomial logistic regression model, there will be a better result and interpretation. There are several advantages by using those both models. First, by using the flexible spline regression function, it can model nonlinear and irregular shapes of the hazard functions. Second, it is easy to understand and implement, and its simple parametric form from multinomial logistic regression model can make it easy in model interpretation. Third, the model has the ability to do prediction. Furthermore, by using a credit card dataset, we will demonstrate how to build these model, and we also provide statistical explanatory and prediction accuracy."
2018
S-Pdf
UI - Skripsi Membership  Universitas Indonesia Library
<<   1 2 3 4 5 6 7 8 9 10   >>