Hasil Pencarian  ::  Simpan CSV :: Kembali

Hasil Pencarian

Ditemukan 137730 dokumen yang sesuai dengan query
cover
Teuku Mohamad Anshar Lotan
"ABSTRAK
Tujuan dari permasalahan filtrasi spam adalah mengidentifikasi sebuah e-mail sebagai spam atau bukan spam. Dengan berkembangnya machine learning, semakin banyak permasalahan yang dapat diselesaikan. Salah satunya adalah filtrasi spam. Filtrasi e-mail spam dapat dilakukan dengan bantuan klasifikasi biner dengan machine learning untuk pengklasifikasiannya. Dalam penelitian ini akan menggunakan regresi logistik dan perceptron untuk melakukan proses filtrasi spam. Data yang digunakan menggunakan dataset Enron Spam. Hasil dari analisis menunjukkan bahwa regresi logistik menunjukkan hasil yang lebih baik dari perceptron. Di mana akurasi regresi logistik mencapai 97,02, sedangkan tingkat akurasi perceptron adalah 95,54, tetapi waktu pelatihan perceptron hanya membutuhkan waktu 3,8 sekon, sedangkan regresi logistik membutuhkan waktu 780,94 sekon.

ABSTRACT
The goal of spam filtering is to identify an e mail as spam or not spam. With the rapid development of machine learning, more problem can be solved. One of it is spam filtration. E mail spam filtering can be done with the help of binary classifier using machine learning for the classification. This research would use logistic regression and perceptron technique to filter spam. Data taken from Enron Spam dataset. The result indicate that logistic regression show better result than perceptron. Whereas the accuracy from logistic regression could reach 97,02, while accuracy from perceptron is 95,54, meanwhile the training time for perceptron takes only 3,8 second, while logistic regression takes about 780,94 second. "
2018
S-Pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Fikri Afif Musyaffa
"Spam email merupakan salah satu masalah yang sangat sering dialami dalam komunikasi digital. Penelitian ini bertujuan untuk membandingkan efektifitas dua algoritma klasifikasi Naïve Bayes dan Support Vector Machine (SVM) dalam mendeteksi email spam. Tahapan penelitian dimulai dari pengumpulan data, pemrosesan teks seperti penghapusan angka, tanda baca, dan huruf kapital, penghapusan kata-kata umum, stemming, dan transformasi teks menggunakan metode Term Frequency-Inverse Document Frequency (TF-IDF). Dataset dibagi menjadi dua bagian yaitu data latih dan data uji dengan perbandingan 80% data latih dan 20% data uji. Hyperparameter yang digunakan pada metode Naive Bayes adalah nilai alpha, sedangkan pada SVM adalah nilai C, gamma dan kernel Radial Basis Function (RBF). Evaluasi menggunakan parameter metrik akurasi, presisi, recall, dan F1 score. Hasil penelitian menunjukkan metode SVM dengan hyperparameter tuning dan teks preprocessing mendapatkan nilai akurasi 98,74% sedangkan metode naïve bayes hanya 98,35%. Sehingga dapat disimpulkan bahwa metode Support Vector Machine lebih efektif dibandingkan metode Naïve Bayes dalam mendeteksi email spam.

Spam email is one of the most frequently encountered issues in digital communication. This study aims to compare the effectiveness of two classification algorithms, Naïve Bayes and Support Vector Machine (SVM), in detecting spam emails. The research stages begin with data collection, followed by text processing such as removing numbers, punctuation, and capital letters, removing common words, stemming, and text transformation using the Term Frequency-Inverse Document Frequency (TF-IDF) method. The dataset is divided into two parts: training data and testing data, with a ratio of 80% training data and 20% testing data. The hyperparameter used for the Naïve Bayes method is the alpha value, while for SVM, the hyperparameters are the values of C, gamma, and the Radial Basis Function (RBF) kernel. Evaluation is conducted using accuracy, precision, recall, and F1 score metrics. The results show that the SVM method, with hyperparameter tuning and text processing, achieved an accuracy of 98.74%, whereas the Naïve Bayes method only achieved 98.35%. Therefore, it can be concluded that the Support Vector Machine method is more effective than the Naïve Bayes method in detecting spam emails."
Depok: Fakultas Teknik Universitas Indonesia, 2024
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Rizkiani Febrianti
"Estimasi parameter pada model regresi logistik pada umumnya menggunakan metode maximum likelihood dengan iterasi Newton Raphson. Pada model regresi logistik, estimasi parameter menggunakan metode maximum likelihood tidak dapat digunakan apabila ukuran sampel kecil dan proporsi kejadian sukses kecil. Permasalahan yang muncul saat ukuran sampel kecil dan proporsi sukses kecil, jika menggunakan metode maximum likelihood adalah proses iterasi yang tidak konvergen. Oleh sebab itu dalam kondisi tersebut, metode maximum likelihood tidak dapat digunakan untuk estimasi parameter.
Salah satu cara untuk mengatasi ketidakkonvergenan pada iterasi tersebut adalah menggunakan modifikasi score function. Modifikasi score function dapat digunakan untuk mendapatkan estimasi parameter model regresi logistik dengan melakukan modifikasi pada fungsi likelihood. Contoh aplikasi diberikan untuk menunjukkan bahwa kemungkinan estimasi parameter model regresi logistik dengan ukuran sampel kecil dan proporsi sukses kecil menggunakan metode maximum likelihood dengan iterasi Newton Raphson memberikan hasil yang tidak konvergen dan hal ini dapat diselesaikan dengan menggunakan modifikasi score function.

The maximum likelihood method with Newton Raphson iteration is used in general to estimate the parameter on logistic regression model. This parameter estimation using the maximum likelihood method cannot be used if the size of the sample and proportion of successful events are small. It is because the iteration process will not convergent to some point. Therefore, the maximum likelihood method cannot be used to estimate the parameter.
One of the ways to resolve this convergent problem is using the score function modification. This modification is used to obtain the parameter estimation on logistic regression model by doing some modification on the likelihood function. The example of parameter estimation, using maximum likelihood method with small size of sample and proportion of successful events, is given to show may be the iteration process is not convergent and this can be solved with modification score function.
"
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2018
S-Pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Muhammad Rizky Adha
"ABSTRACT
Pemodelan regresi telah diterapkan dalam perbankan ritel karena kemampuannya dalam menganalisis data kontinu maupun diskrit. Hal tersebut merupakan alat yang penting dalam penilaian risiko kredit, stress testing, serta evaluasi aset kredit. Pada tugas akhir ini, pendekatan yang digunakan adalah dengan menggunakan model regresi logistik multinomial untuk mengetahui faktor-faktor yang memengaruhi terjadinya default dan attrition pada suatu kredit. Selain itu, pada tugas akhir ini juga akan diperkenalkan pendekatan regresi spline dengan menggunakan truncated power basis untuk memodelkan fungsi hazard. Fleksibilitas dari fungsi spline memberikan kemampuan untuk memodelkan fungsi hazard yang berbentuk nonlinier dan tidak beraturan. Kemudian, dengan menggunakan regresi spline dan regresi logistik multinomial, akan diperoleh sebuah hasil dan interpretasi yang lebih baik. Terdapat beberapa kelebihan dari penggunaan kedua model tersebut. Pertama, dengan menggunakan fungsi regresi spline yang fleksibel, dapat dimodelkan fungsi hazard yang berbentuk nonlinier dan tidak beraturan. Kedua, mudah dipahami dan diterapkan, dan bentuk parametrik model regresi logistik multinomial yang sederhana dapat memudahkan dalam interpretasi model. Ketiga, memiliki kemampuan untuk prediksi. Pada akhir pembahasan, dengan menggunakan sebuah data kartu kredit akan dilakukan pengaplikasian dari model regresi logistik multinomial dan regresi spline, dilengkapi dengan penjelasan secara statistika dan akurasi prediksi.

ABSTRACT
Regression modeling has been adapted in retail banking because of its capability to analyze the continuous and discrete data. It is an important tool for credit risk scoring, stress testing and credit asset evaluation. In this thesis, the approach used is multinomial logistic regression model to gain the information regarding the factors that affect the occurrence of default and attrition. In addition, this thesis will also introduce spline regression approach using truncated power basis to model the hazard function. The flexibility of spline function allows us to model the nonlinear and irregular shapes of the hazard functions. Then, by using spline regression and multinomial logistic regression model, there will be a better result and interpretation. There are several advantages by using those both models. First, by using the flexible spline regression function, it can model nonlinear and irregular shapes of the hazard functions. Second, it is easy to understand and implement, and its simple parametric form from multinomial logistic regression model can make it easy in model interpretation. Third, the model has the ability to do prediction. Furthermore, by using a credit card dataset, we will demonstrate how to build these model, and we also provide statistical explanatory and prediction accuracy."
2018
S-Pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Gilang Rendra Hadinata
"Industri asuransi jiwa di Indonesia belakangan ini sedang mengalami tren positif, dengan mencatat kenaikan laba sebesar 148,05 pada tahun 2017, dari tahun sebelumnya. Perusahaan asuransi sampai sekarang pun masih berfokus pada pertumbuhan bisnis, namun metode yang akan diambil bukan lagi melalui marketing dan saluran agen, namun melalui metode kalkulasi yang baru untuk jumlah manfaat bagi produk-produk asuransi jiwa. Penghitungan manfaat dihasilkan dengan mempertimbangkan dua hal yang penting, yakni risiko dari pemegang polis, dan kondisi keuangan perusahaan. Penelitian ini berfokus pada klasifikasi risiko dari pemegang polis yang dilakukan dengan dua metode yakni regresi logistik dan jaringan saraf tiruan, yang menghasilkan bahwa metode jaringan saraf tiruan menghasilkan performa yang lebih baik dalam mengklasifikasikan risiko dibandingkan regresi logistik.

Life insurance businesses in Indonesia are currently developing at a significant pace. Stated by Otoritas Jasa Keuangan, life insurance businesses in Indonesia recorded 148,05 increase in their total income from December 2016, while already gaining positive results life insurance companies still aiming to extent their businesses by marketing and agency strategies, however life insurance companies currently are looking to extent their profits by formulating new models to calculate to value the policyholder. The insured value calculated by assessing risk the policyholder would face and by considering the company rsquo s financial status. This research focused on the risk classification process to assess the risk faced by the policy holder, by using logistic regression methods and neural network, and resulting a slight favor to neural network for having better results in classifying risks of policyholder."
Depok: Fakultas Teknik Universitas Indonesia, 2018
S-Pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Waras Budi Utomo
"There are much research in health sector this time. Some research have goal to asses exposure effect to outcome. Researcher often use regresssion. Regression is a convensional multivariate analysis. Conventional multivariable analyses may not always be the ideal method for estimating treatment effects in observational studies. When there are large differences in the distribution of covariates between treatment groups, adjusting for these differences with conventional multivariable techniques may not adequately balance the groups, and the remaining bias may limit valid causal inference. Adjusted use in the end of regression analysis, some of scientis believe that adjustment can be show.
Goal of this research is to compare the result of convensional multiariate analysis versus propensity score matching analysis in case study of infant immunizanon using Data ASUI-I KAP2 2003. The comparison will use the same model, that make model according logistic regression. Model which be compare is model without interaction ariabel. Modell will be analised with propensity score matching.
Result of research is there is different betwen Odds Ratio from logistic regwession analysis and Odds Ratio from propensity score matching analysis. The value OR from logistic regression is 0,9898, and the value OR from propensity score matching is 0,9656. Propensity score matching succes make matching 574 sample or 68,27%. The differen is not big bacause effect the confounder are not big. For look effect exposure ar risk factor model its better use PSM because it can reduce selection bias.if you want to analysis determinan factor model, where there are much independent vaiiabel its better use logistic regression analysis because the variabel have same position."
Depok: Fakultas Kesehatan Masyarakat Universitas Indonesia, 2007
T34533
UI - Tesis Membership  Universitas Indonesia Library
cover
"Email merupakan bentuk komunikasi bisnis yang sifatnya cepat, murah dan mudah digunakan, terutama untuk pesan-pesan yang dikirim dalam perusahaan (
internal message). Fasilitas ini sangat rentan terhadap berbagai gangguan spam, diantaranya adalah banyaknya spam pada inbox user serta dikeluhkannya beberapa email yang dikirim masuk ke dalam junk mail (keranjang sampah) yang mengakibatkan terganggunya komunikasi. Selain itu akan mengakibatkan pemborosan sumber daya jaringan serta waktu dan tenaga yang ada. Mengingat spam adalah suatu masalah dengan berbagai macam faktor, maka perlu upaya untuk mengatasi permasalahan tersebut baik dari sisi pemakai email maupun dari sisi pengelolanya, permasalahan ini dapat diatasi melalui pembenahan pada sisi manajemen email yang dapat dilakukan melalui segi teknis seperti adanya sistem filtering dan blocking.
"
621 DIRGA 12:1 (2011)
Artikel Jurnal  Universitas Indonesia Library
cover
Dimas Bayu Ichsandya
"Tanah longsor merupakan salah satu kejadian alam paling merugikan yang terjadi setiap tahun di Kabupaten Pacitan. Penelitian ini bertujuan untuk menganalisis aspek fisik yang berperan sebagai faktor penyebab tanah longsor serta membuat analisis tingkat kerawanan tanah longsor menggunakan metode regresi logistik di Kabupaten Pacitan. Digunakan 468 titik longsor hasil inventarisasi BPBD Kabupaten Pacitan, survei lapang, dan interpretasi citra satelit yang kemudian dibagi menjadi 80% sebagai basis data uji dan 20% sebagai validasi model. Analisis probabilitas kejadian tanah longsor menggunakan nilai koefisien 14 aspek fisik menghasilkan bahwa aspek fisik berupa lereng, aspek/arah hadap lereng, curah hujan, penggunaan tanah, jenis tanah, dan litologi memiliki nilai koefisien positif. Sedangkan pada aspek fisik berupa ketinggian, topographic wetness index (TWI), profile curvature, plan curvature, jarak dari patahan, jarak dari jalan, jarak dari jalan, dan normalized difference vegetation index (NDVI) yang memiliki nilai koefisien negatif. Dihasilkan lima tingkat kerawanan tanah longsor di Kabupaten Pacitan, yaitu; sangat rendah (43,219.8 Ha), rendah (32,256.9 Ha), sedang (24,133.8 Ha), tinggi (20,590.7 Ha), dan sangat tinggi (18,787.6 Ha). Tingkat kerawanan longsor sangat tinggi mendominasi wilayah bagian tengah sampai Timur Kabupaten Pacitan di Kecamatan Kebonagung, Arjosari, Tulakan, dan Pacitan dengan ciri wilayah memiliki rata-rata lereng 23.2°, tersusun atas batuan dalam Formasi Arjosari dengan jenis tanah aluvial dan penggunaan tanah semak belukar, curah hujan rata-rata 2,384.64 mm/tahun, jarak dari patahan rata-rata 693.4 m, jarak dari sungai rata-rata 499.87 m, nilai topographic wetness index (TWI) rata-rata 4.79, dan profile curvature sebesar -0.04 atau cembung. Sementara itu, tingkat kerawanan longsor sangat rendah dominan berada pada pada bagian Barat Kabupaten Pacitan di Kecamatan Donorojo, Punung, dan Pringkuku dengan ciri wilayah memiliki rata-rata lereng 11.05°, tersusun atas batuan sedimen gamping dari Formasi Wonosari dengan jenis tanah litosol dan penggunaan tanah tegalan/ladang, curah hujan rata-rata 2,042.63 mm/tahun, jarak dari patahan 3,222.57 m, jarak dari sungai rata-rata 2,216.60 m, nilai topographic wetness index (TWI) rata-rata 5.5, dan profile curvature 0.06 atau cekung. Validasi model menggunakan data uji dengan AUROC bernilai 0.876. Dihasilkan validasi tingkat kerawanan menggunakan data validasi dengan akurasi sebesar 0.781 dan presisi sebesar 0.755.

Landslides are one of the most detrimental natural events that occur every year in the Pacitan Regency. This study analyzes the physical aspects that act as factors causing landslides and the level of landslide susceptibility using the logistic regression method in Pacitan Regency. Four hundred sixty-eight landslide points were used from the BPBD inventory in Pacitan Regency, field surveys, and interpretation of satellite imagery and separated with 80% as test data and 20% as model validation. The probability analysis of landslides using 14 physical aspects coefficient results that slopes, aspects/directions towards the slopes, rainfall, land use, soil types, and lithology have positive coefficients values. Meanwhile, the physical aspects include elevation, topographic wetness index (TWI), profile curvature, plan curvature, distance from fault, distance from road, distance from road, and normalized difference vegetation index (NDVI), have negative coefficients values. Five levels of landslide susceptibility were generated in Pacitan Regency, namely, very low (43.219.8 Ha), low (32.256.9 Ha), medium (24.133.8 Ha), high (20.590.7 Ha), and very high (18.787.6 Ha). Very high level of landslide susceptibility dominates the central to the eastern part of Pacitan Regency in Kebonagung, Arjosari, Tulakan, and Pacitan Districts with regional characteristics having an average slope of 23.2°, composed of rocks in the Arjosari Formation with alluvial soil types, and shrub land use, rainfall the average rainfall is 2,384.64 mm/year, the distance from the fault is 693.4 m, the distance from the river is 499.87 m, the topographic wetness index (TWI) value is 4.79, and the curvature profile is -0.04 or convex. Meanwhile, the very low level of landslide susceptibility is dominated in the western part of Pacitan Regency in Donorojo, Punung, and Pringkuku Subdistricts, with regional characteristics having an average slope of 11.05°, composed of limestone sedimentary rocks from the Wonosari Formation with litosol soil types and dry farming land use. /field, the average rainfall is 2,042.63 mm/year, the distance from the fault is 3,222.57 m, the distance from the river is 2,216.60 m on average, the topographic wetness index (TWI) value is 5.5 on average, and the curvature profile is 0.06 or concave. Validation of the model using test data with AUROC worth 0.876. Vulnerability validation using validation data resulted in an accuracy of 0.781 and a precision of 0.755."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2021
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Fahri Alamsyah
"Dunia digital khususnya image processing berkembang seiring waktu berjalan dikarenakan kebutuhan masyarakat dan pentingnya keamanan sistem berbasis digital. Salah satu teknologi yang sangat mengalami kemajuan pesat adalah pengenalan wajah (face recognition) menggunakan artificial intelligence. Wajah seseorang yang sudah terdaftar di dalam database akan dikenali oleh sistem untuk keperluan validasi atau verifikasi. Di dalam penelitian ini dirancang sistem pengenalan wajah (face recognition) menggunakan algoritma machine learning dan Principal Component Analysis (PCA) sebagai pereduksi dimensi. Pengujian dilakukan dengan menggunakan beberapa metode, yakni: Support Vector Machine (SVM), Decision Tree (DT), K-Nearest Neighbour (K- NN), Logistic Regression (LR), Multi-Layer Perceptron (MLP) dan Convolutional Neural network (CNN). CNN berfokus pada layer dan tidak memerlukan reduksi dimensi, sehingga hasilnya lebih akurat. Model machine learning yang digunakan untuk classifier selain CNN adalah standar/default, sedangkan CNN menggunakan arsitektur LeNet-5, dengan dropout rate sebesar 0.25. Training dilakukan selama 60 epoch dengan loss function crosscategorical entropy, optimizer Adam, dan batch size sebesar 20. Data masukan adalah citra wajah berukuran 64 × 64 × 1 yang diperoleh dari dataset olivetti faces. Akurasi tertinggi metode PCA, SVM, maupun LR sebesar 91.25%, sementara akurasi terbaik CNN mencapai 98.75%. Selain akurasi, pemakaian confusion matrix dan classification report digunakan untuk menguji performa metode yang ada melalui evaluasi model klasifikasi.

The digital world, especially image processing, is evolving due to the needs of society and the importance of digital-based system security. One of the technologies that are rapidly progressing is face recognition using artificial intelligence. The system will recognize a person's face already registered in the database for validation or verification purposes. A face recognition system was designed using machine learning algorithms and Principal Component Analysis (PCA) as dimension reduction in this study. Testing is conducted using several methods: Support Vector Machine (SVM), Decision Tree (DT), K-Nearest Neighbour (K-NN), Logistic Regression (LR), Multi-Layer Perceptron (MLP) and Convolutional Neural network (CNN). CNN focuses on layers and does not require dimensional reduction to increase the accuracy of the result. The machine learning model used for classifiers other than CNN is standard/default settings, while CNN uses the LeNet-5 architecture, with a dropout rate of 0.25. The training was conducted for 60 epochs with loss function cross-categorical entropy, optimizer Adam, and batch size of 20. Input data is a 64 × 64 × 1 facial image obtained from the Olivetti faces database. The highest accuracy of PCA, SVM and LR methods was 91.25%, while CNN's best accuracy reached 98.75%. In addition to accuracy, the use of confusion matrix and classification report is used to test the performance of existing methods through the evaluation of classification models."
Depok: Fakultas Teknik Universitas Indonesia, 2021
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Andre Nurrohman
"ABSTRACT
Penyakit Parkinson terbagi dalam dua subtipe, yaitu Tremor Dominant (TD) dan Postural Instability/Gait Dominant (PIGD). Tiap subtipe memiliki perbedaan dalam penanganan klinis, sehingga perlu dilakukan klasifikasi subtipe penyakit Parkinson. Dalam Statistika, ada beberapa model yang membahas klasifikasi diantaranya adalah decision tree, regresi logistik, dan logit leaf model (LLM). LLM merupakan model campuran dari decision tree dan regresi logistik yang diusulkan oleh De Caigny et al. (2018). Penulisan ini membahas klasifikasi subtipe penyakit Parkinson menggunakan model klasifikasi statistika beserta penanganan masalah imbalanced data yang terjadi pada data penyakit Parkinson. Diperoleh model klasifikasi regresi logistik dengan melakukan proses SMOTE ± = 600, = 200 untuk menangani masalah imbalanced data. Model tersebut memberikan akurasi sebesar 98,83%, sensitivitas sebesar 98,41%, dan spesifisitas sebesar 99,07%.

ABSTRACT
Parkinsons Disease has two sub-types which are Tremor Dominant (TD) and Postural Instability/Gait Difficulty (PIGD). Each subtype has the difference in clinical treatment, so it is necessary to classify Parkinsons Disease subtypes. In Statistics, there are statistical models for classifying such as decision tree, logistic regression, and logit leaf model (LLM). LLM is a hybrid model from decision tree and logistic regression that proposed by (De Caigny et al., 2018). In this thesis discuss Parkinsons Disease Classification using statistical models with imbalanced data problem handling happen in Parkinson`s Disease data. For the result, logistic regression by processing SMOTE ± = 600, = 200 to handle data imbalanced problem. The model provides an accuracy of 98,83%, sensitivity of 98.41%, and specificity of 99.07%."
[, ]: 2019
S-Pdf
UI - Skripsi Membership  Universitas Indonesia Library
<<   1 2 3 4 5 6 7 8 9 10   >>