Hasil Pencarian  ::  Simpan CSV :: Kembali

Hasil Pencarian

Ditemukan 176741 dokumen yang sesuai dengan query
cover
Deandra Aulia Rusdah
"Prediksi klaim dan prediksi risiko asuransi dilakukan untuk mengklasifikasikan klaim dan tingkat risiko dalam industri asuransi. Dari sudut pandang pembelajaran mesin, masalah prediksi klaim merupakan klasifikasi dua kelas dan masalah prediksi risiko adalah klasifikasi multi-kelas. Untuk mengklasifikasikan klaim dan risiko, model pembelajaran mesin akan memprediksi berdasarkan data historis. Dalam data historis pemohon asuransi, akan ada kemungkinan nilai yang hilang (missing values) sehingga perlu untuk mengatasi masalah tersebut agar memberikan kinerja yang lebih baik. XGBoost adalah metode pembelajaran mesin yang banyak digunakan untuk masalah klasifikasi dan dapat menangani nilai yang hilang (missing values) tanpa dilakukan proses imputasi terlebih dahulu. Penelitian ini menganalisis kinerja metode XGBoost dalam menangani nilai-nilai yang hilang (missing values) untuk prediksi klaim dan prediksi risiko dalam asuransi dan kinerja tersebut juga dibandingkan dengan metode imputasi standard lainnya, yaitu metode mean dan k-nearest neighbors (KNN). Simulasi menunjukkan bahwa model XGBoost tanpa dilakukan proses imputasi memberikan hasil yang sebanding dengan model XGBoost dengan imputasi

Claim prediction and risk prediction of insurance is carried out to classify claims and the levels of risk in insurance industries. From the machine learning point of view, the problem of claim prediction is a two-class classification, and the problem of risk level prediction is a multi-class classification. To classify the claims and risk, a machine learning model will predict based on historical data. In the insurance applicant's historical data, there will be the possibility of missing values so that it is necessary to deal with these problems to provide better performance. XGBoost is a machine learning method that is widely used for classification problems and can handle missing values without an imputation preprocessing. This study analyzed the performance of the XGBoost model in handling missing values for claim prediction and risk prediction in insurance and the performance is also compared with other standard imputation methods, i.e the mean and k-nearest neighbors (KNN) method. The simulations show that the XGBoost model without any imputation preprocessing gives a comparable result to one of the XGBoost models with an imputation preprocessing."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2020
T-pdf
UI - Tesis Membership  Universitas Indonesia Library
cover
Rachel Aurellia Irawan
"Tantangan besar dalam mengembangkan model prediktif yang baik untuk prediksi klaim asuransi kendaraan bermotor adalah adanya missing values dalam data. Berbagai algoritma pembelajaran mesin telah diteliti untuk mengatasi masalah missing values ini. XGBoost merupakan salah satu teknik Gradient Boosting Decision Tree (GBDT) yang terbukti unggul dibandingkan metode imputasi seperti K-Nearest Neighbors (KNN) dan mean imputation. Namun, XGBoost memiliki beberapa keterbatasan, seperti waktu pemrosesan yang lebih panjang dan perlunya untuk melakukan one-hot encoding pada variabel kategorikal. Keterbatasan yang dimiliki oleh metode XGBoost dapat diatasi oleh metode LightGBM. Penelitian ini bertujuan untuk menganalisis kinerja metode XGBoost dan LightGBM dalam memprediksi klaim asuransi kendaraan bermotor pada data yang mengandung missing values. Dataset yang digunakan berasal dari klaim asuransi kendaraan bermotor perusahaan Porto Seguro yang terdiri yang memiliki missing values hingga 70%. Evaluasi kinerja dilakukan menggunakan metrik Normalized Gini score dan training time. Penelitian ini membandingkan dua pendekatan dalam menangani missing values: tanpa imputasi dan dengan imputasi mean. Hasil penelitian menunjukkan bahwa metode XGBoost tanpa imputasi missing values memberikan kinerja terbaik dengan nilai Normalized Gini tertinggi sebesar 0,2735. Namun, XGBoost tanpa imputasi membutuhkan waktu training yang lebih lama, yaitu rata-rata 15,5841 detik. Metode LightGBM tanpa imputasi juga menunjukkan kinerja yang baik dengan nilai Normalized Gini sebesar 0,2559 dan waktu training yang lebih singkat dengan rata-rata 4,0521 detik. Pada data tanpa imputasi, XGBoost secara mutlak tetap menunjukkan kinerja terbaik dengan nilai Normalized Gini tertinggi baik pada data yang tidak diimputasi maupun telah diimputasi. LightGBM, meskipun memiliki Normalized Gini yang sedikit lebih rendah, namun lebih efisien dalam waktu training dengan waktu training hampir 4 kali lebih cepat dibandingkan XGBoost. XGBoost tanpa imputasi memberikan hasil prediksi yang lebih akurat. LightGBM tanpa imputasi menunjukkan efisiensi dalam waktu training dengan sedikit penurunan dalam Normalized Gini (6,88%) dibandingkan dengan XGBoost tanpa imputasi. Disimpulkan bahwa jika prioritas utama adalah kemampuan prediktif yang lebih baik, maka XGBoost tanpa imputasi adalah pilihan yang lebih baik. Namun, jika efisiensi waktu training menjadi prioritas utama, maka LightGBM tanpa imputasi dapat menjadi alternatif yang sangat baik karena mampu melakukan proses training dengan lebih cepat secara signifikan tanpa kehilangan kemampuan prediktif (dalam konteks ini Normalized Gini) yang signifikan.

The primary challenge in developing robust predictive models for motor vehicle insurance claims lies in the presence of missing values within the dataset. Several machine learning algorithms have been explored to address this issue, with XGBoost—a gradient-boosted decision tree (GBDT) technique—demonstrating superior performance compared to traditional imputation methods such as K-Nearest Neighbors (KNN) and mean imputation. However, XGBoost is constrained by certain limitations, including longer processing times and the requirement for one-hot encoding of categorical variables. These limitations can be mitigated by employing the LightGBM method. This study aims to evaluate the performance of XGBoost and LightGBM in predicting motor vehicle insurance claims in datasets containing missing values. The dataset utilized in this research is sourced from Porto Seguro’s motor vehicle insurance claims, which contains up to 70% missing values. The model performance is assessed using two key metrics: the Normalized Gini score and training time. The study compares two approaches to handling missing values: without imputation and with mean imputation.The findings reveal that XGBoost without imputation achieves the highest predictive performance, with a Normalized Gini score of 0.2735. However, this approach also entails a longer training time, averaging 15.5841 seconds. LightGBM without imputation, while producing a slightly lower Normalized Gini score of 0.2559, demonstrates superior efficiency, with a significantly reduced training time of 4.0521 seconds on average. In scenarios without imputation, XGBoost consistently delivers the highest predictive performance, both for non-imputed and imputed data. While LightGBM exhibits a marginally lower Normalized Gini score, it offers substantial improvements in training efficiency, with training times nearly four times faster than those of XGBoost. In conclusion, XGBoost without imputation provides the most accurate predictions, making it the preferable choice when predictive performance is the primary objective. However, when the primary concern is training time efficiency, LightGBM without imputation emerges as a strong alternative, offering a significant reduction in training time with only a modest decrease (6.88%) in predictive accuracy, as measured by the Normalized Gini score, compared to XGBoost without imputation."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2024
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Teresa Yubilea Koswari
"Asuransi merupakan bentuk pengalihan risiko dengan cara mendistribusikan risiko individu menjadi risiko kolektif. Pemasukan utama perusahaan asuransi adalah dari penjualan polis asuransi. Metode penjualan yang lazim digunakan pada asuransi maupun industri finansial lainnya adalah cross-selling. Cross-selling adalah proses menawarkan produk tambahan kepada orang yang sudah menjadi pelanggan perusahaan yang bersangkutan. Sangat penting bagi perusahaan asuransi untuk memiliki kemampuan memprediksi secara akurat karakteristik calon pelanggan yang sekiranya akan tertarik membeli suatu produk yang sedang ingin dipasarkan. Untuk dapat mengetahui karakteristik pelanggan potensial berdasarkan data perusahaan yang pada umumnya berskala besar, diusulkan untuk menggunakan machine learning. Hingga saat ini, metode machine learning yang  populer digunakan untuk mengolah data tabular adalah XGBoost. Pada penelitian ini, digunakan metode XGBoost untuk memprediksi hasil cross-selling produk asuransi dan kemudian dibandingkan dengan metode berbasis pohon lainnya, yaitu Decision Tree dan Random Forest, dari segi sensitivity, specificity, dan AUC-ROC. Diperoleh bahwa XGBoost unggul pada metrik specificity dan AUC-ROC. Selanjutnya, hasil simulasi terbaik dari setiap model diinterpretasikan menggunakan feature importance berdasarkan gain agar diperoleh fitur yang menjadi faktor penting dalam memprediksi cross-selling asuransi. Dengan adanya tahap interpretasi ini, diharapkan metode yang digunakan pada penelitian ini dapat diterima dan berguna bagi industri asuransi.

Insurance is a form of risk transfer by distributing individual risks into collective risks. The main income of insurance companies is from the sale of insurance policies. The sales method commonly used in the insurance and other financial industries is cross-selling. Cross-selling is the process of offering additional products to existing customers of the company. It is very important for insurance companies to have the ability to accurately predict the characteristics of potential customers who will be interested in buying a product that is being marketed. To find out the characteristics of potential customers based on company’s data, which are generally in large scale, it is proposed to use machine learning method. Until now, the most popular machine learning method used to process tabular data is XGBoost. In this study, the XGBoost method was used to predict cross-selling results of insurance products and then compared with other tree-based models, the Decision Tree and Random Forest, in terms of sensitivity, specificity, and AUC-ROC. It was found that XGBoost excels in specificity and AUC-ROC metrics. Furthermore, the best simulation results from each model are interpreted using feature importance based on gain to obtain features that are important factors in predicting insurance cross-selling. So, with this interpretation step done, it is hoped that the method used in this study can be accepted and useful for the insurance industry.
"
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2023
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Muhammad Adli Rahmat Solihin
"Industri asuransi merupakan industri yang besar dan terus berkembang di Indonesia. Di tambah lagi, semakin banyak masyarakat Indonesia yang terlindungi oleh asuransi pada tahun 2022. Di samping itu, meningkatnya nasabah asuransi juga dapat meningkatkan risiko terjadinya fraud atau kecurangan pada setiap klaim yang dilakukan nasabah. Hal tersebut dapat menyebabkan kerugian bagi perusahaan asuransi. Maka dari itu, dibutuhkan suatu metode yang dapat menyelesaikan masalah fraud klaim asuransi. Namun, permasalahan fraud ini melibatkan data yang besar sehingga dibutuhkan metode yang dapat memproses data besar dengan cepat dan tidak membutuhkan dana yang besar. Machine learning diajukan sebagai metode untuk dapat mendeteksi fraud klaim asuransi dan telah digunakan dalam beberapa penelitian untuk penyelesaian masalah tersebut. Extreme Gradient Boosting (XGBoost) merupakan salah satu metode machine learning yang banyak digunakan, pertama kali diajukan sebagai model yang scalable sehingga dapat memproses data besar secara efisien. Namun, metode machine learning sebaiknya adalah model yang interpretable dan explainable. Dengan memiliki interpretability dan explainability, suatu model dapat digunakan dan dimengerti dengan baik sehingga sangat reliabel. Oleh karena itu, Approximating XGBoost diajukan sebagai metode yang dapat memungkinkan XGBoost yang terdiri dari banyak boosted Decision Tree dapat diekstrak menjadi satu Decision Tree saja sehingga model ini dapat diinterpretasikan secara transparan mengenai pekerjaan model tersebut dalam mendapatkan hasil yang dikeluarkan. Penelitian ini menemukan bahwa kinerja dari model Approximating XGBoost dapat mendeteksi fraud dengan AUC-ROC mencapai nilai 91,44%, pada specificity dapat mencapai 86,55%, dan pada sensitivity dapat mencapai 91,34% berdasarkan dataset yang digunakan. Artinya, model Approximating XGBoost dapat membentuk suatu model yang performanya mengaproksimasi XGBoost dan dapat model pohonnya dapat ditampilkan seperti Decision Tree.

The insurance industry is a big and growing industry in Indonesia. Moreover, more and
more Indonesians will be covered by insurance by 2022. In addition, increasing the
number of insurers can also increase the risk of fraud or fraud in any claim made by the
insurer. So from that, we need a method that can solve the problem of insurance claims
fraud. However, this problem of fraud involves big data so it requires a method that can
process big data quickly and does not require large funds. Machine learning was proposed
as a method to detect insurance claims fraud and has been used in some research to solve
such problems. Extreme Gradient Boosting (XGBoost) is one of the most widely used
machine learning methods, first proposed as a scalable model to process big data
efficiently. However, machine learning methods are preferably models that are
interpretable and explainable. By having interpretability and explainability, a model can
be used and understood well so it is highly reliable. Therefore, Approximating XGBoost
was proposed as a method that could enable XGBoost consisting of many boosted
decision trees to be extracted into a single decision tree only so that this model can be
interpreted transparently about the work of the model in obtaining the outcome issued.
This study found that the performance of the Approximating XGBoost model can detect
fraud with an AUC-ROC of 91.44%, specificity can reach 86.55%, and sensitivity can
91.34% based on the data set used. In other words, the XGBoost Approximating model
can form a model whose performance approximates XGBuost and the tree model can be
displayed like a Decision Tree.
"
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2024
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
I Gede Pajar Bahari
"Metode Machine Learning sangat bermanfaat untuk menyelesaikan berbagai masalah, terutama pada masalah big data. Salah satu masalah yang terkait dengan big data adalah prediksi klaim asuransi di industri asuransi. XGBoost adalah metode machine learning yang menggunakan pendekatan ensemble learning dengan decision tree sebagai model dasarnya. XGBoost terdiri dari beberapa hyperparameter yang nilainya perlu ditentukan sebelum proses training. Partial grid search adalah optimasi hyperparameter yang biasanya digunakan untuk XGBoost. Random search adalah optimasi hyperparameter yang menentukan nilai hyperparameter secara random. Pada penelitian ini, diterapkan dan dianalisis metode pengoptimalan lain untuk XGBoost, yaitu Bayesian search untuk prediksi pengajuan klaim asuransi (dengan klasifikasi) dan besarnya klaim asuransi yang diajukan (dengan regresi). Tujuan dari penelitian ini yaitu membandingan performa ketiga metode optimasi hyperparameter pada XGBoost: random search, partial grid search, dan Bayesian search pada klasifikasi dan regresi. Hasil simulasi menunjukkan bahwa partial grid search memberikan akurasi yang sedikit lebih baik dibandingkan dengan random search dan Bayesian search. Namun, waktu running pada Bayesian search jauh lebih cepat daripada partial grid search. Random search memiliki akurasi dan waktu komputasi yang sedikit kurang bagus dibandingkan dengan Bayesian search.

Machine Learning Method is very useful for solving various problems, especially in the big data problem. One of the problems associated with big data is the prediction of insurance claims in the insurance industry. XGBoost is a machine learning method that uses an ensemble learning approach with a decision tree as its basic model. XGBoost consists of several hyperparameters which values need to be determined before the training process. Partial grid search is a hyperparameter optimization approach which is usually used for XGBoost. Random search is a hyperparameter optimization method which determines the value of hyperparameter randomly. In this study, another optimization method for XGBoost called Bayesian search is applied and analyzed for predicting insurance claims submissions (by classification) and the size of insurance claims submitted (by regression The purpose of this study is to compare the performance of the three hyperparameter optimization methods on XGBoost: random search, partial grid search, and Bayesian search on classification and regression. The simulation results show that partial grid search gives a slightly better accuracy compared to random search and Bayesian search. However, the running time on Bayesian search is much faster than partial grid search. Random search has an accuracy and computation time that is a little less good compared to Bayesian search."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2020
T-pdf
UI - Tesis Membership  Universitas Indonesia Library
cover
Jacob Teofilus Gamaliel
"Asuransi adalah layanan yang disediakan oleh perusahaan asuransi untuk memastikan risiko kerugian finansial bagi seseorang atau kelompok yang membayar premi berdasarkan perjanjian. Terdapat berbagai macam produk asuransi, di antaranya adalah asuransi perjalanan. Asuransi perjalanan adalah produk asuransi dalam mengalihkan risiko kerugian finansial akibat kecelakaan dalam perjalanan. Perusahaan asuransi harus dapat melakukan analisis yang tepat untuk memprediksi apakah pembayar premi akan mengajukan klaim atau tidak di masa depan, untuk meminimalkan kerugian yang diderita perusahaan. Dari sudut pandang machine learning, masalah prediksi klaim adalah masalah klasifikasi. Deep Neural Networks (DNN) adalah salah satu metode machine learning terbaru untuk menyelesaikan masalah prediksi klaim. Namun, DNN tidak memberikan akurasi yang lebih baik daripada Neural Network (NN) yang merupakan model dasarnya. Dalam tulisan ini, Regularization Learning Netowrk (RLN) yang merupakan pengembangan dari DNN dengan teknik regularisasi RLNs dianalisis untuk prediksi klaim dalam asuransi perjalanan. Simulasi menunjukkan bahwa RLN meningkatkan kinerja DNN dan memberikan akurasi yang lebih baik daripada DNN tanpa regularisasi RLNs dan NN standar.

Insurance is a service provided by an insurance company to ensure the risk of financial loss for a person or group that pays a premium based on the agreement. There are various kinds of insurance products, including travel insurance. Travel insurance is insurance products in transferring the risk of financial loss due to accidents in transit. The insurance company must be able to conduct an appropriate analysis to predict whether the premium payer will file a claim or not in the future, to minimize losses suffered by the company. From a machine learning perspective, the problem of claim prediction is a classification problem. Deep neural networks (DNN) is one of the latest machine learning methods to solve claims prediction problems. However, DNN does not provide better accuracy than standard neural networks (NN). In this paper, the regularization learning network (RLN) which is an extension of DNN with a regularization layer analysed for prediction of claims in travel insurance. Our simulations show that RLN improves DNN performance and provides better accuracy than DNN and NN.
"
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2021
T-Pdf
UI - Tesis Membership  Universitas Indonesia Library
cover
M. Rasyid Rabbani
"Fraud atau kecurangan merupakan salah satu permasalahan yang masih dihadapi oleh industri asuransi dan masih memberikan kerugian yang sangat besar bagi industri ini. Biaya yang dikeluarkan pun untuk mengatasi permasalahan ini masih cukup besar, untuk itu dikembangkanlah sebuah model machine learning untuk membantu pencegahan terjadinya fraud pada asuransi. Salah satu model yang sedang sangat berkembang adalah model Imbalance-XGBoost, penelitian ini dilakukan untuk meninjau kemampuan model Imbalance-XGBoost dalam mendeteksi fraud sebagai langkah pencegahan fraud pada asuransi. Penelitian ini berhasil mendapati bahwa Imbalance-XGBoost memiliki performa yang lebih baik jika dibandingkan dengan model dasarnya yaitu XGBoost tanpa penanganan kelas tidak seimbang.

Fraud or dishonesty is one of the persistent challenges faced by the insurance industry and continues to result in significant losses for the industry. The costs incurred to address this issue are also quite substantial. Therefore, a machine learning model has been developed to assist in preventing insurance fraud. One of the models that is currently gaining traction is the Imbalance-XGBoost model. This research was conducted to assess the ability of the Imbalance-XGBoost model in detecting fraud as a preventive measure in insurance. The study found that Imbalance-XGBoost performs better compared to its base model, XGBoost, which does not handle imbalanced classes.
"
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2023
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Widya Fajar Mustika
"Penilaian tingkat klaim risiko pemohon asuransi merupakan bagian penting dalam asuransi jiwa, sehingga perlu untuk diklasifikasikan. Penentuan tingkat klaim risiko pada asuransi jiwa didasarkan pada data historis pemohon. Pengajuan untuk menjadi anggota suatu asuransi jiwa membutuhkan waktu yang tidak singkat. Namun pengaplikasian suatu model machine learning dapat membantu mengklasifikasikan calon pemohon asuransi berdasarkan tingkat risiko dengan cepat. Salah satu model machine learning yaitu Extreme Gradient Boosting (XGBoost) yang merupakan suatu model berbasis decision tree. Model ini digunakan untuk memprediksi risiko pada asuransi jiwa. Adanya missing values pada data yang digunakan diatasi dengan beberapa strategi pada proses prapengolahan data untuk meningkatkan nilai akurasi model XGBoost. Hasil penelitian ini diperoleh bahwa akurasi model XGBoost sebesar 0,60730 dengan satuan kappa yang menunjukkan bahwa model XGBoost sangat baik dan dapat diterapkan pada masalah prediksi tingkat klaim risiko pemohon asuransi jiwa. Jika dibandingkan dengan model decision tree, random forest dan Bayesian ridge, kinerja model XGoost masih tetap unggul dalam memproses missing values pada data yang digunakan.

Risk level assessment for insurance applicants is an important part of life insurance, so it needs to be classified. Determination of the level of risk claims on life insurance is based on the applicants historical data. Submission to become a member of a life insurance requires a short time. But the application of a machine learning model can help classify prospective insurance applicants based on the level of risk quickly. One machine learning model is Extreme Gradient Boosting (XGBoost) which is a decision tree based model. This model is used to predict risk in life insurance. The missing values in the data used are overcome by several strategies in the data processing process to increase the accuracy value of the XGBoost model. The results of this study show that the accuracy of the XGBoost model is 0.60730 with kappa units which indicates that the XGBoost model is very good and can be applied to the problem of predicting the level of risk claims for life insurance applicants. When compared to the decision tree, random forest and Bayesian ridge models, the performance of the XGoost model still excels in processing missing values in the data used."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2019
T54273
UI - Tesis Membership  Universitas Indonesia Library
cover
Salam Fadillah Alzah
"Penelitian ini menganalisis corporate governance yang diukur dengan jumlah dewan komisaris, presentase komisaris independen, komite audit, dan kepemilikan institusional, dengan variabel kontrol ukuran perusahaan dan leverage, dan pengaruhnya terhadap industri asuransi di Indonesia yang terdaftar di Bursa Efek Indonesia dalam periode 2008-2016. Penelitian ini adalah penelitian kuantitatif dengan 8 sampel perusahaan asuransi yang ditentukan berdasarkan metode purposive sampling. Metode yang digunakan adalah regresi linear berganda. Hasil penelitian ini menunjukkan bahwa corporate governance belum memberikan pengaruh terhadap kinerja perusahaan asuransi di Indonesia.
Hasil regresi pada ROA, jumlah dewan komisaris dan leverage berpengaruh negatif terhadap ROA, sedangkan presentase komisaris independen, komite audit, kepemilikan institusional, dan ukuran perusahaan tidak memberi pengaruh. Regresi pada Tobin'sQ, komite audit dan ukuran perusahaan yang berpengaruh negatif, sedangkan jumlah dewan komisaris, presentase komisaris independen, kepemilikan institusional, dan leverage tidak memberikan pengaruh.

This study analyzes the effect of corporate governance as measured by the number of boards of commissioners, the percentage of independent commissioners, audit committees, and institutional ownership, with firm size and leverage as control variables, on the performance of the insurance industry in Indonesia listed on the Indonesia Stock Exchange in the period 2008 2016. This research is quantitative research with 8 sample of the insurance company which determined by purposive sampling method. The method used is multiple linear regression.
The results of this study indicate that corporate governance has not affected the performance of insurance companies in Indonesia. Regression results on ROA, the number of boards of commissioners and leverage have a negative effect on ROA, while the percentage of independent commissioners, audit committee, institutional ownership, and firm size have no effect. Regressions on Tobin 39 sQ, audit committees, and firm size are negatively affected, while the number of boards of commissioners, the percentage of independent commissioners, institutional ownership, and leverage have no effect."
Depok: Universitas Indonesia, 2018
T51624
UI - Tesis Membership  Universitas Indonesia Library
cover
Gregorino Al Josan
"Cardiovascular diseases (CVD) merupakan salah satu penyebab utama kematian di dunia. WHO memperkirakan angka 17,9 juta kematian pada tahun 2021 disebabkan oleh CVD. Di Indonesia sendiri, prevalensi penyakit jantung mencapai angka 1,5% atau sekitar 2,7 juta orang pada tahun 2018. CVD mencakup berbagai macam jenis penyakit jantung. Salah satu tipe penyakit jantung tersebut adalah congestive heart failure. Congestive heart failure (CHF) adalah kondisi dimana jantung tidak dapat memompa darah yang cukup ke seluruh bagian tubuh. CHF dapat terjadi dikarenakan melemahnya kemampuan otot jantung untuk memompa darah sehingga mempengaruhi heart rate atau detak jantung manusia. Heart rate dapat direpresentasikan menggunakan sinyal yang dapat diukur menggunakan alat rekaman electrocardiogram (ECG/EKG). EKG adalah rekaman aktivitas elektrik jantung yang ditangkap melalui bagian permukaan tubuh. Heart rate variability (HRV) diketahui berkorelasi dengan berbagai penyakit jantung dan salah satunya adalah CHF. Dengan berkembangnya teknologi, terdapat beberapa penelitian mengenai implementasi artificial intelligence (AI) untuk mendeteksi keberadaan CHF menggunakan model machine learning dan HRV sebagai fitur bagi model. Pada penelitian ini, akan dibangun dan dievaluasi kinerja model XGBoost untuk mendeteksi eksistensi penyakit CHF pada short-term HRV dari rekaman EKG 5 menit. Dataset yang digunakan berasal dari empat database yang berbeda yang diambil dari situs PhysioNet, yaitu NSRDB dan NSR2DB sebagai kelas sehat dan CHFDB dan CHF2DB sebagai kelas CHF. Masing-masing database memiliki rekaman long-term EKG. Seluruh rekaman tersebut dilakukan segmentasi selama 5 menit pada 2 jam pertama rekaman. Dari hasil segmentasi rekaman 5 menit tersebut akan dihitung nilai HRV yang akan menjadi fitur bagi model XGBoost. XGBoost dilatih menggunakan kombinasi teknik Grid Search dan K-Fold Cross Validation dengan nilai 𝐾 = 10. Terdapat 4 metrik yang dijadikan objektif optimisasi Grid Search, yaitu akurasi, sensitivitas, spesifisitas, dan skor AUC. XGBoost yang dilatih dengan mengoptimasi akurasi berhasil mencapai nilai akurasi sebesar 0,954, sensitivitas sebesar 0,935, spesifisitas sebesar 0,96, dan skor AUC sebesar 0,947. XGBoost yang dilatih dengan mengoptimasi sensitivitas berhasil mencapai nilai akurasi sebesar 0,966, sensitivitas sebesar 0,977, spesifisitas sebesar 0,963, dan skor AUC sebesar 0,97. XGBoost yang dilatih dengan mengoptimasi spesifisitas berhasil mencapai nilai akurasi sebesar 0,962, sensitivitas sebesar 0,931, spesifisitas sebesar 0,971, dan skor AUC sebesar 0,951. Kemudian XGBoost yang dilatih dengan mengoptimasi skor AUC berhasil mencapai nilai akurasi sebesar 0,955, sensitivitas sebesar 0,935, spesifisitas sebesar 0,962, dan skor AUC sebesar 0,948.

Cardiovascular diseases (CVD) is one of the major causes of death in the world. WHO estimated that 17.9 million of deaths during 2021 are caused by CVD. In Indonesia alone, the prevalence of heart diseases reached 1.5% or around 2,7 million people in 2018. CVD consists of various types of heart disease. Congestive heart failure is one of them. Congestive heart failure (CHF) is a condition where the heart cannot pump enough blood for the entire body. CHF can occur due to a weakening of the heart muscle's ability to pump blood, thereby affecting the human heart rate. Heart rate can be represented using signal that can be measured using electrocardiogram (ECG/EKG) recording. EKG is a recording of the heart's electrical activity captured through the surface of the body. Heart rate variability (HRV) have been known to be correlated with various heart diseases with CHF is one of it. With the advance of technology, there have been various research regarding the implementation of artificial intelligence (AI) to detect the presence of CHF using machine learning model and HRV as features for the model. In this research, we built and evaluated the performance of XGBoost model to detect the existence of CHF on short-term HRV from 5 minutes EKG recording. The dataset came from four different databases that can be accessed from PhysioNet website. Those are NSRDB and NSR2DB datasets to represent healthy class and CHFDB and CHF2DB to represent CHF class. Each database contains long-term EKG. All records are segmented by 5 minutes on the first 2 hours of the recording. HRV metrics are calculated from those 5 minutes segments to become features for the XGBoost model. XGBoost was trained using a combination of Grid Search and K-Fold Cross Validation techniques with 𝐾 = 10. There are 4 metrics that become the objective scoring function for the Grid Search. Those are accuracy, sensitivity, specificity, and AUC score. XGBoost trained to optimize accuracy managed to achieve 0.954 accuracy, 0.935 sensitivity, 0.96 specificity, and 0.947 AUC score. XGBoost trained to optimize sensitivity managed to achieve 0.966 accuracy, 0.977 sensitivity, 0.963 specificity, and 0.97 AUC score. XGBoost trained to optimize specificity managed to achieve 0.962 accuracy, 0.931 sensitivity, 0.971 specificity, and 0.951 AUC score. Lastly, XGBoost trained to optimize AUC score managed to achieve 0.955 accuracy, 0.935 sensitivity, 0.962 specificity, and 0.948 AUC score."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2024
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
<<   1 2 3 4 5 6 7 8 9 10   >>