Hasil Pencarian  ::  Simpan CSV :: Kembali

Hasil Pencarian

Ditemukan 183389 dokumen yang sesuai dengan query
cover
Atika Hendryani
"Masalah kesehatan mental semakin menjadi perhatian utama dalam masyarakat saat ini, sehingga manajemen stres menjadi sangat penting untuk menjaga kesejahteraan. Berbagai teknologi untuk mendeteksi stres telah dikembangkan, salah satu metode yang menjanjikan adalah penggunaan imaging photoplethysmography (iPPG) yang diperoleh dari video wajah yang direkam menggunakan kamera konvensional. Penelitian ini bertujuan untuk meningkatkan akurasi klasifikasi stres dengan memanfaatkan sinyal iPPG berbasis kamera web. Dalam penelitian ini, diusulkan dua pendekatan baru pada tahap pra-pemrosesan untuk meningkatkan kualitas deteksi stres. Pendekatan pertama adalah pemilihan Region of Interest (ROI), yang berfokus pada empat area wajah: dahi, pipi kiri, pipi kanan, dan seluruh wajah. Pendekatan kedua adalah penerapan metode frame alignment untuk mengatasi artefak gerakan yang sering kali mempengaruhi kualitas sinyal. Untuk mendeteksi stres, digunakan teknik pembelajaran mesin sebagai metode klasifikasi, dengan parameter utama penanda stres berupa heart rate (HR) dan variabilitas detak jantung heart rate variability (HRV). Data yang digunakan dalam penelitian ini merupakan data primer yang diperoleh dari video wajah 80 peserta, dengan rentang usia 18 hingga 25 tahun. Tugas aritmatika digunakan sebagai pemicu stres, di mana peserta diminta menyelesaikan soal matematika. Proses pengambilan data dilakukan di laboratorium dengan kondisi pencahayaan sebesar 220 lux. Kamera web yang digunakan adalah kamera laptop dengan kecepatan 30 frame per detik (fps). Sebanyak 265 fitur yang berkaitan dengan stres berhasil diekstraksi dari video tersebut, dan data kemudian disegmentasi menggunakan validasi silang 5-fold. Untuk mengurangi noise akibat artefak gerakan, diterapkan metode frame alignment yang menunjukkan perbaikan signifikan dalam mengoreksi noise. Hasil penelitian menunjukkan adanya perbedaan signifikan dalam rata-rata HR antara kondisi stres dan non-stres. Pada parameter HRV, perubahan signifikan ditemukan pada frekuensi rendah Low-Frequency (LF), yang sering dikaitkan dengan respon stres. Beberapa algoritma pembelajaran mesin diuji untuk klasifikasi, dan memberikan hasil akurasi yang tinggi. Decision Tree memperoleh akurasi 0,955 dengan waktu proses 3,13 ms. K-Nearest Neighbors (KNN) akurasi 0,981 dengan waktu proses 2,54 ms, dan Logistic Regression mencapai akurasi 0,985 dengan waktu proses 4,181 ms. Algoritma lain seperti Naïve Bayes akurasi 0,97, waktu 2,659 ms, Support Vector Machine (SVM) akurasi 0,985, waktu 6,71 ms, Random Forest akurasi 0,958, waktu 27,07 ms, dan RBF SVM akurasi 0,985, waktu 9,637 ms juga dievaluasi. Di antara algoritma tersebut, Logistic Regression menunjukkan akurasi klasifikasi tertinggi sebesar 0,985 dengan waktu inferensi 4,181 ms, menjadikannya model yang paling efisien untuk deteksi stres. Metode deteksi stres yang dikembangkan berhasil mendeteksi stres menggunakan kamera RGB dengan mengatasi masalah artefak gerakan melalui frame alignment. Selain itu, pemilihan empat ROI wajah yang spesifik memberikan informasi stres yang lebih andal dibandingkan dengan penggunaan ROI seluruh wajah. Sistem ini merupakan langkah maju yang signifikan dalam deteksi stres non-invasif berbasis kamera web, dengan potensi aplikasi dalam manajemen kesehatan mental dan penilaian stres. Pengembangan di masa mendatang dapat mengeksplorasi peningkatan resolusi video untuk menghasilkan sinyal yang lebih presisi, serta penggabungan model pembelajaran mendalam untuk deteksi stres yang lebih akurat. Penerapan sistem ini pada kamera mobile juga dapat menjadi solusi yang lebih praktis untuk pemantauan stres secara real-time dalam kehidupan sehari-hari.

Mental health issues have increasingly become a major concern in today's society, making stress management crucial for maintaining well-being. Various technologies for stress detection have been developed, and one promising method is the use of imaging photoplethysmography (iPPG) obtained from facial videos recorded using conventional cameras. This study aims to improve the accuracy of stress classification by utilizing iPPG signals derived from webcam-based recordings. In this research, two novel approaches are proposed at the preprocessing stage to enhance stress detection quality. The first approach is the selection of Regions of Interest (ROI), focusing on four facial areas: the forehead, left cheek, right cheek, and the entire face. The second approach involves the application of frame alignment methods to address motion artifacts, which often affect signal quality. Machine learning techniques were employed as the classification method for stress detection, with key stress indicators including heart rate (HR) and heart rate variability (HRV). The data used in this study comprises primary data obtained from facial videos of 80 participants aged 18 to 25 years. Arithmetic tasks were employed as stressors, requiring participants to solve mathematical problems. Data collection was conducted in a laboratory under lighting conditions of 220 lux. The webcam used was a laptop camera operating at a speed of 30 frames per second (fps). A total of 265 stress-related features were successfully extracted from the videos, and the data was segmented using 5-fold cross-validation. To reduce noise caused by motion artifacts, a frame alignment method was applied, demonstrating significant improvement in noise correction. The results revealed significant differences in average HR between stressed and non-stressed conditions. For HRV parameters, significant changes were observed in Low-Frequency (LF) components, often associated with stress responses. Several machine learning algorithms were tested for classification, yielding high accuracy results. Decision Tree achieved an accuracy of 0.955 with a processing time of 3.13 ms, K-Nearest Neighbors (KNN) achieved 0.981 with 2.54 ms, and Logistic Regression reached 0.985 with 4.181 ms. Other algorithms such as Naïve Bayes (accuracy 0.97, time 2.659 ms), Support Vector Machine (SVM) (accuracy 0.985, time 6.71 ms), Random Forest (accuracy 0.958, time 27.07 ms), and RBF SVM (accuracy 0.985, time 9.637 ms) were also evaluated. Among these, Logistic Regression demonstrated the highest classification accuracy of 0.985 with an inference time of 4.181 ms, making it the most efficient model for stress detection. The developed stress detection method successfully detected stress using RGB cameras by addressing motion artifact issues through frame alignment. Additionally, selecting specific facial ROIs provided more reliable stress information compared to using the entire face as an ROI. This system represents a significant advancement in non-invasive webcam-based stress detection, with potential applications in mental health management and stress assessment. Future developments could explore higher video resolution to yield more precise signals and integrate deep learning models for more accurate stress detection. Implementing this system on mobile cameras could also offer a more practical solution for real-time stress monitoring in daily life."
Depok: Fakultas Teknik Universitas Indonesia, 2024
D-pdf
UI - Disertasi Membership  Universitas Indonesia Library
cover
Rizkiani Febrianti
"Estimasi parameter pada model regresi logistik pada umumnya menggunakan metode maximum likelihood dengan iterasi Newton Raphson. Pada model regresi logistik, estimasi parameter menggunakan metode maximum likelihood tidak dapat digunakan apabila ukuran sampel kecil dan proporsi kejadian sukses kecil. Permasalahan yang muncul saat ukuran sampel kecil dan proporsi sukses kecil, jika menggunakan metode maximum likelihood adalah proses iterasi yang tidak konvergen. Oleh sebab itu dalam kondisi tersebut, metode maximum likelihood tidak dapat digunakan untuk estimasi parameter.
Salah satu cara untuk mengatasi ketidakkonvergenan pada iterasi tersebut adalah menggunakan modifikasi score function. Modifikasi score function dapat digunakan untuk mendapatkan estimasi parameter model regresi logistik dengan melakukan modifikasi pada fungsi likelihood. Contoh aplikasi diberikan untuk menunjukkan bahwa kemungkinan estimasi parameter model regresi logistik dengan ukuran sampel kecil dan proporsi sukses kecil menggunakan metode maximum likelihood dengan iterasi Newton Raphson memberikan hasil yang tidak konvergen dan hal ini dapat diselesaikan dengan menggunakan modifikasi score function.

The maximum likelihood method with Newton Raphson iteration is used in general to estimate the parameter on logistic regression model. This parameter estimation using the maximum likelihood method cannot be used if the size of the sample and proportion of successful events are small. It is because the iteration process will not convergent to some point. Therefore, the maximum likelihood method cannot be used to estimate the parameter.
One of the ways to resolve this convergent problem is using the score function modification. This modification is used to obtain the parameter estimation on logistic regression model by doing some modification on the likelihood function. The example of parameter estimation, using maximum likelihood method with small size of sample and proportion of successful events, is given to show may be the iteration process is not convergent and this can be solved with modification score function.
"
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2018
S-Pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Assyifa Ulhusna
"Credit scoring adalah sebuah sistem yang digunakan kreditor seperti bank dan perusahaan asuransi untuk menentukan apakah pemohon kredit termasuk dalam grup good credit yakni grup yang kemungkinan besar akan membayar utangnya tepat waktu atau bad credit yang merupakan grup dengan kemungkinan besar tidak membayar utangnya tepat waktu. Salah satu metode yang paling sering digunakan dalam pembuatan model credit scoring adalah binary logistic regression.  Namun, seiring dengan kemajuan komputasi, banyak metode lain yang berkembang saat ini untuk dipakai dalam pembuatan model credit scoring yakni, metode gradient boosting. Pada skripsi ini dilakukan implementasi metode binary logistic regression dan gradient boosting dalam pemodelan credit scoring. Hasil yang didapatkan dengan menggunakan data 537.667 debitur dengan rincian 535.705 good credits dan 1.962 bad credits adalah pada data train penggunaan gradient boosting memberikan nilai tingkat akurasi 79,65%, uji KS 0,5389 dan AUROC/AUC 0,8393. Sementara pada data test penggunaan gradient boosting memberikan nilai tingkat akurasi 79,92%, uji KS 0,5345 dan AUROC/AUC 0,8313.  Nilai-nilai tersebut lebih tinggi dibandingkan dengan penggunaan binary logistic regression baik pada data train maupun data test. Berdasarkan nilai uji AUC, metode gradient boosting tergolong klasifikasi yang baik, sedangkan metode binary logistic regression> tergolong klasifikasi yang cukup. Hasil simulasi ini menunjukkan untuk data yang digunakan, metode gradient boosting memberikan hasil yang lebih baik dari sisi akurasi, uji KS, dan AUROC/AUC daripada binary logistic regression. Dengan kata lain, metode gradient boosting dapat meningkatkan discriminant power, yakni kemampuan untuk membandingkan target yang lebih baik dibandingkan dengan metode binary logistic regression.

Credit scoring is a system used by creditors such as banks and insurance companies to determine whether credit applicants are included in the good credit group, namely the group that is most likely to pay its debts on time or the bad credit group which is the group that is most likely to not pay its debts on time. One of the most frequently used methods in making credit scoring models is binary logistic regression. However, along with the progress of computation, many other methods are currently being developed to be used in making credit scoring models, namely, the gradient boosting method. In this thesis, we will compare the binary logistic regression and gradient boosting methods in credit scoring model. The results obtained using data from 537,667 debtors with details of 535,705 good credits and 1,962 bad credits are the train data using gradient boosting gives an accuracy rate of 79.65%, KS test 0.5389 and AUROC/AUC 0.8393. Meanwhile, the test data using gradient boosting gives an accuracy rate of 79.92%, KS test 0.5345, and AUROC/AUC 0.8313. These values ​​are higher than the use of binary logistic regression in both the train and test data. Based on the AUC test value, the gradient boosting method is a good classifier, while the binary logistic regression method is an acceptable classifier. The results of this simulation show that for the data used, the gradient boosting method gives better results in terms of accuracy, KS test, and AUROC/AUC than binary logistic regression. In other words, the gradient boosting method can increase discriminant power or the ability to compare targets better than the binary logistic regression method."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2021
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Teuku Mohamad Anshar Lotan
"ABSTRAK
Tujuan dari permasalahan filtrasi spam adalah mengidentifikasi sebuah e-mail sebagai spam atau bukan spam. Dengan berkembangnya machine learning, semakin banyak permasalahan yang dapat diselesaikan. Salah satunya adalah filtrasi spam. Filtrasi e-mail spam dapat dilakukan dengan bantuan klasifikasi biner dengan machine learning untuk pengklasifikasiannya. Dalam penelitian ini akan menggunakan regresi logistik dan perceptron untuk melakukan proses filtrasi spam. Data yang digunakan menggunakan dataset Enron Spam. Hasil dari analisis menunjukkan bahwa regresi logistik menunjukkan hasil yang lebih baik dari perceptron. Di mana akurasi regresi logistik mencapai 97,02, sedangkan tingkat akurasi perceptron adalah 95,54, tetapi waktu pelatihan perceptron hanya membutuhkan waktu 3,8 sekon, sedangkan regresi logistik membutuhkan waktu 780,94 sekon.

ABSTRACT
The goal of spam filtering is to identify an e mail as spam or not spam. With the rapid development of machine learning, more problem can be solved. One of it is spam filtration. E mail spam filtering can be done with the help of binary classifier using machine learning for the classification. This research would use logistic regression and perceptron technique to filter spam. Data taken from Enron Spam dataset. The result indicate that logistic regression show better result than perceptron. Whereas the accuracy from logistic regression could reach 97,02, while accuracy from perceptron is 95,54, meanwhile the training time for perceptron takes only 3,8 second, while logistic regression takes about 780,94 second. "
2018
S-Pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
"Calculus of thought : neuromorphic logistic regression in cognitive machines is a must-read for all scientists about a very simple computation method designed to simulate big-data neural processing. This book is inspired by the Calculus ratiocinator idea of Gottfried Leibniz, which is that machine computation should be developed to simulate human cognitive processes, thus avoiding problematic subjective bias in analytic solutions to practical and scientific problems.
The reduced error logistic regression (RELR) method is proposed as such a "Calculus of thought." This book reviews how RELR's completely automated processing may parallel important aspects of explicit and implicit learning in neural processes. It emphasizes the fact that RELR is really just a simple adjustment to already widely used logistic regression, along with RELR's new applications that go well beyond standard logistic regression in prediction and explanation. Readers will learn how RELR solves some of the most basic problems in today’s big and small data related to high dimensionality, multi-colinearity, and cognitive bias in capricious outcomes commonly involving human behavior.
"
Waltham, MA: Academic Press, 2014
e20426846
eBooks  Universitas Indonesia Library
cover
Andre Nurrohman
"ABSTRACT
Penyakit Parkinson terbagi dalam dua subtipe, yaitu Tremor Dominant (TD) dan Postural Instability/Gait Dominant (PIGD). Tiap subtipe memiliki perbedaan dalam penanganan klinis, sehingga perlu dilakukan klasifikasi subtipe penyakit Parkinson. Dalam Statistika, ada beberapa model yang membahas klasifikasi diantaranya adalah decision tree, regresi logistik, dan logit leaf model (LLM). LLM merupakan model campuran dari decision tree dan regresi logistik yang diusulkan oleh De Caigny et al. (2018). Penulisan ini membahas klasifikasi subtipe penyakit Parkinson menggunakan model klasifikasi statistika beserta penanganan masalah imbalanced data yang terjadi pada data penyakit Parkinson. Diperoleh model klasifikasi regresi logistik dengan melakukan proses SMOTE ± = 600, = 200 untuk menangani masalah imbalanced data. Model tersebut memberikan akurasi sebesar 98,83%, sensitivitas sebesar 98,41%, dan spesifisitas sebesar 99,07%.

ABSTRACT
Parkinsons Disease has two sub-types which are Tremor Dominant (TD) and Postural Instability/Gait Difficulty (PIGD). Each subtype has the difference in clinical treatment, so it is necessary to classify Parkinsons Disease subtypes. In Statistics, there are statistical models for classifying such as decision tree, logistic regression, and logit leaf model (LLM). LLM is a hybrid model from decision tree and logistic regression that proposed by (De Caigny et al., 2018). In this thesis discuss Parkinsons Disease Classification using statistical models with imbalanced data problem handling happen in Parkinson`s Disease data. For the result, logistic regression by processing SMOTE ± = 600, = 200 to handle data imbalanced problem. The model provides an accuracy of 98,83%, sensitivity of 98.41%, and specificity of 99.07%."
[, ]: 2019
S-Pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Risfania Nurdinda Sari
"COVID-19 adalah penyakit yang disebabkan oleh virus SARS-CoV-2 dan menyerang sistem pernapasan manusia. Selain menganggu kesehatan fisik, pandemi COVID-19 juga memberikan dampak psikologis, salah satunya adalah tingkat stres yang meningkat pada masyarakat. Penelitian ini bertujuan untuk mengidentifikasi faktor-faktor yang berasosiasi dengan tingkat stres pada pandemi COVID-19. Dalam mencapai tujuan tersebut, penelitian ini menggunakan metode classification tree dan regresi logistik multinomial. Sebelum melakukan proses identifikasi faktor menggunakan classification tree, dilakukan penanganan masalah imbalance data menggunakan metode SMOTE. Selanjutnya, dilakukan kuantifikasi risiko faktor-faktor yang teridentifikasi pada classification tree menggunakan analisis regresi logistik multinomial. Kinerja model diukur menggunakan nilai precision, recall, F1-Score, dan AUC. Hasil yang diperoleh adalah model classification tree dengan penanganan imbalance data menggunakan SMOTE dapat meningkatkan kinerja model dengan nilai precision 0,5980, nilai recall 0,8653, nilai F1-Score 0,7072, dan AUC 0,702. Dengan model tersebut, didapatkan faktor-faktor yang teridentifikasi berasosiasi dengan tingkat stres pada pandemi COVID-19 adalah Total_OECDInsititutions, Total_CoronaConcerns, dan Age. Peningkatan nilai Corona Concerns cenderung memberikan risiko peningkatan tingkat stres, sedangkan peningkatan nilai OECDInsititutions dan Age cenderung memberikan risiko penurunan tingkat stres.

COVID-19 is a disease caused by the SARS-CoV-2 virus that attacks the human respiratory system. In addition to disrupting physical health, the COVID-19 pandemic also has psychological impacts, one of which is an increased level of stress. This study aims to identify factors associated with the level of stress during the COVID-19 pandemic. The study employs the classification tree method and multinomial logistic regression. Prior to the factor identification process using the classification tree, the issue of imbalanced data is addressed using the SMOTE method. Subsequently, the quantification of risk factors identified in the classification tree is conducted using multinomial logistic regression analysis. The model's performance is measured using precision, recall, F1-score, and AUC values. The results obtained indicate that the classification tree model with the handling of imbalanced data using SMOTE can improve model performance, with a precision value of 0,5980, recall value of 0,8653, F1-score value of 0,7072, and AUC value of 0,702. With this model, the identified factors associated with the level of stress during the COVID-19 pandemic are Total_OECDInstitutions, Total_CoronaConcerns, and Age. An increase in Corona Concerns tends to pose a risk of increased stress levels, while an increase in OECD Institutions and Age tends to pose a risk of decreased stress levels."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2023
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Patrecia Alandia Lukman
"Model regresi logistik umum digunakan untuk memodelkan variabel respon berupa variabel kategorik dengan sejumlah variabel prediktor. Kontribusi dari variabel prediktor terhadap variabel respon dinyatakan melalui koefisien regresi (beta), sehingga beta memiliki peran yang penting dalam penggunaan model. Oleh karena itu, perlu dilakukan estimasi nilai beta. Pada skripsi ini dibahas mengenai estimasi beta menggunakan metode Bayesian. Metode Bayesian adalah metode penaksiran parameter yang memanfaatkan gabungan informasi dari data sampel dan informasi terdahulu/prior mengenai karakteristik parameter yang akan ditaksir sehingga metode Bayesian dapat mengatasi masalah jika kualitas data sampel kurang mendukung pengamatan. Prosedur penaksiran parameter tersebut meliputi spesifikasi distribusi prior, digunakan prior non-konjugat, pembentukan fungsi likelihood, dan pembentukan distribusi posterior. Lalu, metode Bayesian Logistic Regression tersebut akan digunakan dalam menganalisa data pasien kanker nasofaring (KNF) pasca radiasi, untuk menilai signifikansi dari komponen skor Zulewski dalam memprediksi ada tidaknya hipotiroid yang merupakan efek samping jangka panjang dari radiasi yang diberikan untuk KNF. Berdasarkan Markov Chain Monte Carlo dengan Gibbs Sampling, diperoleh hasil estimasi yang konvergen. Hasil yang diperoleh adalah tidak ada komponen skor Zulewski yang lebih signifikan antara satu dengan yang lainnya. Diperlukan tambahan informasi dari pengukuran selain komponen skor Zulewski untuk dapat menentukan apakah seorang pasien KNF akan mengalami hipotiroid atau tidak.

Logistic regression models are commonly used to model response variables in the form of categorical variables with a number of predictor variables. The contribution of the predictor variable to the response variable is expressed through a regression coefficient (beta) so that beta has an important role in the use of the model. Therefore, it is necessary to estimate the value of beta. This thesis will discuss the estimated beta using the Bayesian method. Bayesian Method is a parameter estimation method that utilizes a combination of information from sample data and prior information about the characteristics of the parameters to be estimated so that the Bayesian method can overcome the problem if the quality of the sample data does not support observation. The parameter estimation procedure includes the prior distribution specification, which is to use non-conjugate prior, the formation of the likelihood function, and the formation of the posterior distribution. Then, the Bayesian Logistic Regression method will be used in analyzing post-radiation nasopharyngeal cancer (NPC) patient data, to determine the significance of the Zulewski’s score component in predicting the presence or absence of hypothyroidism which is a long-term side effect of radiation given to NPC. Based on Markov Chain Monte Carlo with Gibbs Sampling, a convergent estimate is obtained. The result is that there is no component of Zulewski’s score that is more significant between one another. Additional information is needed from measurements other than the Zulewski’s score component to be able to determine whether a NPC patient will have hypothyroidism or not."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2020
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Aryo Hastungkoro Harimurti Mukarta
"Dalam melakukan klaim subrogasi, perusahaan penjaminan kredit sering mengalami kendala di mana pihak yang dijamin tidak melunasi pinjamannya sesuai kesepakatan. Hal ini membuat perusahaan penjaminan kredit mengklasifikasikan pihak terjamin yang berpotensi untuk melunasi pinjaman kreditnya, dan pihak terjamin yang tidak berpotensi untuk melunasi pinjaman kreditnya. Penelitian ini mengevaluasi prediksi potensi klaim subrogasi pada penjaminan kredit menggunakan berbagai model pembelajaran mesin berdasarkan data dunia nyata dari perusahaan penjaminan kredit besar di Indonesia. Eksperimen menggunakan Logistic Regression, sebuah metode prediksi berbasis persamaan linier, Penalized Logistic Regression, bentuk dari Logistic Regression yang koefisien-koefisiennya diberikan penalti, dan Random Forest Classifier, sebuah metode berbasis ensemble learning. Model diuji menggunakan Hold-out Validation dan data prediksi dibandingkan dengan data uji untuk false positive dan false negative. Hasil penelitian menunjukkan bahwa Random Forest Classifier memberikan hasil yang lebih baik, menunjukkan kinerja rata-rata yang lebih baik dibandingkan dengan Logistic Regression dan Penalized Logistic Regression . Temuan studi ini dapat digunakan oleh analis klaim dan subrogasi baik dari perusahaan penjaminan kredit maupun peneliti independen dalam menilai kekuatan dan kelemahan masing-masing model dan untuk menyusun aturan keputusan yang efektif secara empiris untuk mengevaluasi kebijakan subrogasi.

In making subrogation claims, credit guarantee companies often encounter problems where the guaranteed party does not pay off their loan according to the agreement. This makes credit guarantee companies classify those who have the potential to pay off their credit loans, or those that are not potential to pay off their credit loans. This study evaluates the prediction of potential subrogation claims in credit guarantees using various machine learning models based on real-world data from a large credit guarantee company in Indonesia. The experiment used Logistic Regression, a linear equation-based prediction method, Penalized Logistic Regression, a form of Logistic Regression whose coefficients are penalized, and the Random Forest Classifier, an ensemble learning-based method. The model was tested using Hold-out Validation and prediction dataset were compared to test dataset for false positives and false negatives. The results showed that the Random Forest Classifier gave better results, indicating a better average performance compared to Logistic Regression and Penalized Logistic Regression. The findings of this study can be used by claims and subrogation analysts from both credit guarantee companies and independent researchers in assessing the strengths and weaknesses of each model and to construct empirically effective decision rules for evaluating subrogation policies."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2022
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Natasha Latifatu Soliha
"AIDS merupakan fase infeksi dari virus HIV yang paling kronis yang dapat melemahkan kekebalan tubuh. AIDS disebabkan oleh virus HIV yang menyerang dan menghancurkan sel CD4 atau yang biasa disebutk dengan sel T. Pada tahun 2020, Provinsi Jawa Timur merupakan provinsi dengan jumlah infeksi HIV terbanyak dan urutan ketiga terbanyak untuk total kasus AIDS di Indonesia. Tujuan penelitian ini untuk memodelkan data tingkat proporsi kasus AIDS Provinsi Jawa Timur menggunakan Geographically Weighted Logistic Regression (GWLR) dan melihat hasil pengelompokan kabupaten/kota menggunakan analisis klaster. Variabel yang digunakan untuk penelitian ini adalah Gini Rasio, Indeks L Pengeluaran Per Kapita, Rasio Jenis Kelamin, Rasio Ketergantungan, Indeks Pembangunan Gender (IPG), dan Jumlah Pos Pelayanan KB Desa. Tingkat proporsi kasus AIDS dikategorikan menjadi 2 kategori berdasarkan cut point yang telah ditentukan, dengan kategori 0 sebagai tingkat rendah dengan proporsi kasus AIDS kurang dari 0,0006 dan kategori 1 sebagai tingkat tinggi dengan proporsi kasus AIDS lebih dari atau sama dengan 0,0006. Penaksiran parameter untuk model Geographically Weighted Logistic Regression (GWLR) menggunakan metode Maximum Likelihood Estimation (MLE) dengan fungsi pembobot kernel Fixed Gaussian dan bandwidth optimum ditentukan menggunakan Akaike’s Information Criterion corrected (AICc). Nilai Z hitung dari parameter model yang paling sesuai akan dikelompokan menggunakan analisis klaster k-means, dengan Z hitung adalah nilai estimasi parameter dibagi dengan standar error. Hasil pengelompokan menunjukkan bahwa anggota klaster 1 memiliki kecenderungan merupakan kabupaten/kota yang memiliki variabel signifikan yaitu rasio jenis kelamin dan rasio ketergantungan yang merupakan perbandingan jumlah penduduk bukan angkatan kerja dengan jumlah penduduk angkatan kerja, sementara anggota klaster 2 memiliki kecenderungan merupakan kabupaten/kota yang memiliki variabel signifikan rasio ketergantungan.

AIDS is the most chronic phase of HIV infection which can weaken the immune system. AIDS is caused by HIV which attacks and destroys CD4 cells or also known as T cells. In 2020, East Java Province is a province which has the most HIV infections and in the third place for the highest total number of AIDS cases in Indonesia. The purpose of this research is to build a model using Geographically Weighted Logistic Regression (GWLR), and to work out the grouping results of regencies/cities using K-means Clustering Analysis. The variables used in this research are Gini Ratio, L Index of Per Capita Expenditure, Gender Ratio, Dependency Ratio, Gender Development Index, and The Number of Post Pelayanan KB Desa. The proportion levels of AIDS cases are categorized into 2 categories based on cut-point which has been specified, which 0 as the category of low level with the proportion of AIDS cases is less than 0.0006 and 1 as the category of high level with the proportion of AIDS cases is more than or equal to 0.0006. Parameter estimation for Geographically Weighted Logistic Regression (GWLR) is using Maximum Likelihood Estimation (MLE) method with Fixed Gaussian as weighted kernel function and optimum bandwidth is determined using Akaike’s Information Criterion Corrected (AICc). Z-Score of the most suitable model will be grouped using K-means Clustering Analysis, with Z-score is parameter estimator divided by standard error. Grouping results indicates cluster 1 members tend to be regencies/cities that have gender ratio and dependency ratio as significant variables, meanwhile cluster 2 members tend to be regencies/cities that have only dependency ratio as significant variable. "
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2022
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
<<   1 2 3 4 5 6 7 8 9 10   >>