Abdul Azis Abdillah
"Diabetes is one of the most serious health challenges in both developed and developing countries. Early detection and accurate diagnosis of diabetes can reduce the risk of complications. In recent years, the use of machine learning in predicting disease has gradually increased. A promising classification technique in machine learning is the use of support vector machines in combination with radial basis function kernels (SVM-RBF). In this study, we used SVM-RBF to predict diabetes. The study used a Pima Indian diabetes dataset from the University of California, Irvine (UCI) Machine Learning Repository. The subjects were female and ? 21 years of age at the time of the index examination. Our experiment design used 10-fold cross-validation. Confusion matrix and ROC were used to calculate performance evaluation. Based on the experimental results, the study demonstrated that SVM-RBF shows promise in aiding diagnosis of Pima Indian diabetes disease in the early stage."
Depok: Faculty of Engineering, Universitas Indonesia, 2016
UI-IJTECH 7:5 (2016)
Abdul Azis Abdillah
Ratna Aminah

Diabetes merupakan penyakit kronis yang terjadi ketika terdapat peningkatan kadar glukosa dalam darah karena tubuh tidak dapat atau tidak cukup menghasilkan hormon insulin atau tidak dapat menggunakan insulin secara efektif. Umumnya untuk mendeteksi penyakit diabetes adalah dengan tes kadar gula darah atau hemoglobin HbA1c yang dilakukan oleh praktisi medis. Pada penelitian ini, dibangun sistem prediksi penyakit diabetes berbasis iridologi atau melalui citra mata, menggunakan machine learning. Sistem yang dikembangkan terdiri dari instrumen akuisisi citra mata dan algoritma pengolahan citra. Metode GLCM (Gray Level Co-Occurence Matrix) digunakan untuk proses ekstraksi ciri, dengan tujuan untuk mendapatkan ciri tekstur pada citra. Metode SVM (Support Vector Machine) dan kNN (k Nearest Neighbor) digunakan untuk proses klasifikasi kelas diabetes dan non-diabetes. Hasil klasifikasi kemudian dilakukan proses validasi dengan menggunakan metode k-fold cross validation. Hasil yang diperoleh menunjukkan bahwa metode kNN memiliki performa yang lebih baik dibandingkan dengan metode SVM. Performa terbaik didapatkan saat variasi kombinasi ukuran area segmentasi 30×360 dengan jarak antar tetangga 30 pixel. Tingkat akurasi yang diapatkan dari pengujian sebesar 79,6%, dengan nilai misclassification rate (MR) 20,4%, false positive rate (FPR) 20,6%, false negative rate (FNR) 20%, sensitivity 87,1%, dan specificity 70,0%.



Diabetes is a chronic disease that occurs when there is an increase in glucose levels in the blood because the body cannot produce enough of the hormone insulin or cannot use insulin effectively. Generally, to detect diabetes is by pengujian blood sugar levels or hemoglobin HbA1c carried out by medical practitioners. In this study, a diabetes prediction system based on iridology or through eye images was constructed using machine learning. The developed system consists of eye image acquisition instruments and image processing algorithms. The GLCM (Gray Level Co-Occurence Matrix) method is used for feature extraction processes, with the aim of obtaining texture characteristics in the image. The SVM (Support Vector Machine) and kNN (k Nearest Neighbor) methods are used to classify diabetic and non-diabetic classes. The classification results are then validated by using the k-fold cross validation method. The results show that kNN method has better performance compared to the SVM method. The best performance is when size of the segmentation area 30×360 pixel with the distance between neighbors 20 pixel. The results show that the accuracy from pengujian is 79.6%, misclassification rate (MR) 20.4%, false positive rate (FPR) 20.6%, false negative rate (FNR) 20.0%, sensitivity 87.1%, and specificity 70.0%.


Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2019
UI - Skripsi Membership
Adhitya Dwi Nugraha
"Ledakan batu merupakan kecelakaan destruktif yang cukup sering terjadi pada tambang bawah tanah. Seiring dengan berkembangnya teknologi, machine learning hadir sebagai alternatif solusi yang dapat dimanfaatkan dalam langkah preventif atas kasus ledakan batu. Penelitian ini menggunakan GWO-SVM dan XGBoost sebagai model machine learning dalam klasifikasi ledakan batu dan intensitasnya pada tambang bawah tanah. Grey Wolf Optimization (GWO) digunakan sebagai optimizer dari parameter SVM. Intensitas ledakan batu dibedakan atas tidak ada ledakan batu, lemah, sedang dan kuat. Dalam implementasi model, digunakan 467 kasus ledakan batu yang dikumpulkan dari berbagai sumber. Fitur yang digunakan pada penelitian ini meliputi tegangan maksimal tangensial, kekuatan tekan uniaksial, kekuatan tarik uniaksial, koefisien tegangan, koefisien kerapuhan batuan, dan indeks regangan elastis. Sebelum implementasi model dilakukan data preprocessing yang meliputi imputasi missing values, menghapus outlier, normalisasi fitur dan resampling data. Kinerja model dievaluasi berdasarkan nilai metrik accuracy, precision, recall, dan f1-score dengan memerhatikan running time dan proporsi data training berkisar dari 50% hingga 90%. Hasil penelitian menunjukkan bahwa GWO-SVM mengungguli XGBoost baik dalam klasifikasi ledakan batu dengan accuracy 98.0392%, precision 97.8495%, recall 98.2609%, dan f1-score 98.0161% serta klasifikasi intensitas ledakannya dengan accuracy 75.8242%, precision 75.1473%, recall 75.3115%, dan f1-score 75.2150%.

Rockburst is a destructive accident that frequently occurs in underground mines. With the advancement of technology, machine learning has emerged as an alternative solution that can be utilized to measures against rockbursts. This research employs GWO-SVM and XGBoost as machine learning models for the classification of rockburst and its intensity in underground mines. Grey Wolf Optimization (GWO) is used as an optimizer for SVM parameters. The intensity of a rockburst is classified into four categories: no rockburst, weak, moderate, and strong. The implementation of the model utilizes 476 cases of rockburst collected from various sources. The features used in this study include maximum tangential stress, uniaxial compressive strength, uniaxial tensile strength, stress coefficient, rock brittleness coefficient, and elastic strain index. Before implementing the model, data preprocessing is conducted, which includes imputing missing values, removing outliers, feature normalization, and data resampling. The performance of the model is evaluated based on metrics such as accuracy, precision, recall, and f1-score with various training data proportions ranging from 50% to 90%. The research results indicate that GWO-SVM outperforms XGBoost in both the classification of rockburst with 98.0392% accuracy, 97.8495% precision, 98.2609% recall, and 98.0161% f1-score as well as intensity with 75.8242% accuracy, 75.1473% precision, 75.3115% recall, and 75.2150% f1-score.
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2023
UI - Skripsi Membership
Adhimas Yudha Prawira
"Twitter merupakan salah satu media sosial yang digunakan secara massive di Indonesia. Para pengguna Twitter ini membicarakan berbagai macam hal, salah satunya terkait pencalonan presiden. Perbincangan para pengguna Twitter ini memiliki nilai sentimen baik positif maupun negatif. Dukungan masyarakat terhadap masing-masing kandidat calon presiden dapat diketahui dengan melihat sentimen masyarakat melalui perbincangan mereka di Twitter, hal ini sering disebut juga sebagai analisis sentimen. Namun, jumlah pengguna dan obrolan para pengguna Twitter yang sangat banyak mengakibatkan data yang akan diproses membutuhkan waktu yang cukup lama. Untuk melakukan proses analisis sentimen para pengguna Twitter secara cepat dan otomatis dapat digunakan bantuan mesin. Salah satu metode yang digunakan untuk melakukan proses analisis sentimen adalah Support Vector Machine (SVM). Pada dasarnya, semakin banyak data yang digunakan sebagai data training dalam pemilihan model fungsi klasifikator maka akan memberikan generalisasi akurasi analisis sentimen untuk data testing yang tinggi pula. Namun di sisi lain, semakin banyaknya data training juga akan menyebabkan besarnya dimensi ruang fitur. Hal ini membuat mesin membutuhkan waktu yang cukup lama dalam melakukan pembentukan fungsi klasifikator. Untuk menanggulangi hal ini, akan dilakukan metode optimasi fitur sehingga mesin dapat tetap membentuk fungsi klasifikator dengan akurasi yang tinggi namun dengan dimensi ruang fitur yang rendah.

Twitter is a social media that used in Indonesia massively. Twitter users talk (tweet) about various things, one of them is about presidential nomination. Twitter user conversations have a positive or negative sentiment. Community support for each presidential candidate can be determined by looking at the public sentiment through their conversations on Twitter, this is often referred to sentiment analysis. However, the number of users and tweets cause the data to be processed requires quite a long time. Machine can be used to make the process of Twitter sentiment analysis quickly and automatically. One method that used to perform the sentiment analysis process is a Support Vector Machine (SVM). Basically, the more data that used as data training in the model selection function will give a high accuracy generalization sentiment analysis on data testing. On the other hand, the increasing number of training data will also cause large dimensional feature space. This makes the machine takes a long time to perform model selection. To overcome this problem, feature optimization will be performed. Feature optimization will preserve the high accuracy of the model, but with a low dimensional feature space."
Universitas Indonesia, 2014
UI - Skripsi Membership
Nurlia Angie Darmawan
"Di dunia kesehatan, tenaga medis dituntut untuk mengatasi berbagai jenis penyakit dengan gejala yang beragam. Oleh karena itu, diperlukan suatu teknologi untuk membantu mereka menyelesaikannya dengan baik. Penelitian ini mendukung mereka dengan menggunakan machine learning sebagai pemecah masalah. Metode machine learning yang digunakan pada penelitian ini adalah metode klasifikasi. Penulis membahas tentang stroke yang merupakan salah satu penyakit dengan angka kematian tertinggi di dunia. Penelitian ini mengamati perubahan densitas pada otak penderita stroke iskemik. Stroke iskemik merupakan salah satu jenis stroke yang terjadi ketika pembuluh darah tersumbat oleh trombus atau emboli. Penelitian ini menggunakan data CT scan dari Departemen Radiologi, Rumah Sakit Cipto Mangunkusumo, Jakarta, Indonesia. Data yang berupa citra CT scan diubah menjadi data numerik dengan metode Gray Level Co-Occurrence Matrix dan Local Binary Pattern yang dibandingkan performanya pada saat melakukan proses klasifikasi. Penelitian ini menerapkan Support Vector Machines sebagai metode klasifikasi. Didapatkan hasil bahwa Support Vector Machines dengan Local Binary Pattern menghasilkan performa yang lebih baik dibandingkan Support Vector Machines dengan Gray Level Co-Occurrence Matrix.
In the health sector, the medical staffs are challenged to overcome many types of diseases with various symptoms. Therefore, a technology is needed to help them solving it well. This study is supporting them by using a machine learning as the problem solver. The machine learning method that is used in this study is classification method. The author discusses about stroke which is one of the diseases with the highest mortality rate in the world. This study observed the density changes in the brain of ischemic stroke sufferers. Ischemic stroke is one of the stroke types that occurs when the arteries are blocked by thrombus or embolism. This study used data of CT scan from Department of Radiology, Cipto Mangunkusumo Hospital, Jakarta, Indonesia. The image data of the CT scan is changed into a numerical data by using the Gray Level Co-Occurrence Matrix method and the Local Binary Pattern which is being compared when processing the classification. This study applies Support Vector Machines as the classification method. The results showed that Support Vector Machines with Local Binary Pattern has a better performance than Support Vector Machines with Gray Level Co-Occurrence Matrix."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2020
UI - Skripsi Membership
Alva Andhika Sa`Id
"Degenerasi makula atau Age-Related Macular Degeneration (AMD) adalah penyakit mata yang menyebabkan kebutaan pada bagian tengah mata yang merusak kinerja retina pada bagian makula yang berfungsi untuk mempertajam penglihatan untuk beberapa aktivitas, seperti membaca, menulis, dan mengenali wajah seseorang. Penderita AMD akan mengalami penglihatan yang buram, distorsi penglihatan, atau bahkan kehilangan penglihatannya. Dalam mendiagnosis AMD dapat digunakan oftalmoskopi, beberapa metodenya yaitu Ocular Coherence Tomography (OCT) dan fotografi fundus sudah banyak dilakukan untuk membantu diagnosis AMD. Namun, diagnosis AMD dengan mengandalkan ahli dapat berlangsung lama dan memungkinkan terjadinya error subjektivitas oleh pendiagnosis. Diagnosis awal diperlukan untuk mendeteksi adanya kemungkinan terjadinya AMD pada tahap awal yang gejalanya tidak dirasakan oleh penderita. Pendekatan diagnosis AMD salah satunya dapat dilakukan dengan pendekatan machine learning. Machine learning sudah berperan besar dalam sektor medis membantu permasalahan klasifikasi diagnosis penyakit seperti metode Support Vector Machines (SVM) dan Twin Support Vector Machines (TSVM). Salah satu cabang machine learning yang sangat baik dalam klasifikasi penyakit lewat gambar adalah deep learning. Metode yang digunakan deep learning untuk permasalahan klasifikasi data citra salah satunya adalah Convolutional Neural Network (CNN). Pada penelitian ini, akan digunakan metode Convolutional Neural Network – Twin Support Vector Machines (CNN-TSVM) untuk mengklasifikasi penyakit AMD menggunakan data citra fundus yang diperoleh dari Ocular Disease Recognition (ODIR-5K) 2019, dengan 227 data citra fundus normal dan 227 data citra fundus penyakit AMD. Evaluasi kinerja metode CNN-TSVM menggunakan teknik hold-out validation dengan membagi data latih dan data uji dengan proporsi 10% - 90% dan metrik akurasi, presisi, dan recall. Hasil kinerjanya dibandingkan dengan metode CNN dan Convolutional Neural Network – Support Vector Machines (CNN-SVM). Hasil yang diperoleh menunjukkan CNN-TSVM menggunakan kernel RBF memberikan akurasi dan recall terbaik, sementara CNN-TSVM menggunakan kernel polinomial memberikan presisi terbaik.

Age-related Macular Degeneration (AMD) is an eye disease that causes blindness in the middle of the eye that impairs retinal performance in the macula that serves to sharpen vision for some activities, such as reading, writing, and recognizing a person's face. AMD sufferers will experience blurred vision, vision distortion, or even loss of vision. In AMD diagnosed, ophthalmology can be used, several methods of ophthalmology including Ocular Coherence Tomography (OCT) and fundus photography have been widely done to help the diagnosis of AMD. However, AMD diagnosis by relying on experts can be long-lasting and allow subjective errors to occur in the diagnosis. An initial diagnosis is needed to detect the possibility of AMD occurrence at an early stage where symptoms are not felt by the sufferer. One of AMD diagnosis approach can be done with machine learning approach as one of artificial intelligence methods. Machine learning method has played a major role in the medical sector helping classification problems of disease diagnosis such as Support Vector Machines (SVM) and Twin Support Vector Machines (TSVM). One of the excellent branches of machine learning in the classification of diseases through images is deep learning. The suitable method used by deep learning for image data classification problems is convolutional neural network (CNN). In this study, Convolutional Neural Network–Twin Support Vector Machines (CNN-TSVM) method will be used to classify AMD diseases using fundus image data obtained from Ocular Disease Recognition (ODIR-5K) 2019, with 227 normal fundus image data and 227 fundus image data of AMD disease. Performance evaluation of CNN-TSVM method using hold-out validation techniques by dividing training data and testing data by a proportion of 10% - 90% and metrics of accuracy, precision, and recall. The performance results will be compared to CNN and Convolutional Neural Network – Support Vector Machines (CNN-SVM). The results showed CNN-TSVM using RBF kernel provided the best accuracy and recall, while CNN-TSVM using polynomial kernel provided the best precision."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2021
UI - Skripsi Membership
Josh Frederich
"Diagnosis otomatis kanker kulit dari lesi kulit dengan menggunakan gambar dermoskopi masih merupakan tugas yang menantang bagi kecerdasan buatan khususnya pada Artificial Neural Network dengan menggunakan deep learning. Penggunaan arsitektur yang tepat pada klasifikasi merupakan faktor penting dalam membuat diagnosis otomatis yang akurat. Meski demikian, model-model klasifikasi yang sudah terbuat tersebut masih belum dapat sempurna melakukan kategorisasi pada penyakit lesi kulit. Pada riset ini dilakukan penggantian arsitektur model klasifikasi yang digunakan dengan menggunakan arsitektur terbaru seperti EfficientNet B0 dan B1. Model EfficientNet B0 terbaik dengan menggunakan augmentasi saja memiliki akurasi, presisi, recall, dan f1-score sebesar 91%, 76%, 68%, dan 71% sedangkan EfficientNet B1 terbaik dengan menggunakan augmentasi dan class weight memiliki akurasi, presisi, recall, dan f1-score sebesar masing-masing 89%, 78%, 73%, dan 73%. Model EfficientNet B1 terbaik tersebut dapat mengungguli model state of the art yang ada dengan kenaikan recall dan f1-score sebesar 2% dan 12% dari model semi-supervised. Model juga dapat diimplementasikan dengan graphical user interface sehingga dapat digunakan oleh dokter spesialis kulit dalam pemeriksaan dermoskopi.
Automatic diagnosis of skin cancer from skin lesions using dermoscopy images is still a challenging task for artificial intelligence, especially in Artificial Neural Networks using deep learning. The use of the correct architecture in the classification is an important factor in making an accurate automatic diagnosis. However, the classification models that have been made are still not able to perfectly categorize skin lesions. In this research, a replacement of the classification model architecture used by using the latest architectures such as the EfficientNet B0 and B1 was conducted. The best EfficientNet B0 model that only used augmentation has the accuracy, precision, recall, and f1-scores of 91%, 76%, 68%, and 71% while the best EfficientNet B1 that used augmentation and class weights has the accuracy, precision, recall, and f1-score of 89%, 78%, 73%, and 73%, respectively. The best EfficientNet B1 model can outperform the existing state of the art model with an increase in recall and f1-score by 2% and 12% from the semi-supervised model, respectively. The model can also be implemented with a graphical user interface so that dermatologist can use it in dermoscopy examinations."
Depok: Fakultas Teknik Universitas Indonesia, 2021
UI - Skripsi Membership
Nofa Aulia
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2019
UI - Tesis Membership
Pohan, Nur Wulan Adhani
"Banyaknya konferensi menyulitkan peneliti memilih konferensi berkualitas. Kemungkinan peneliti tertipu dengan konferensi predator merupakan ancaman nyata yang perlu diperhatikan. Penilaian konferensi umumnya menggunakan pakar yang membutuhkan waktu dan biaya yang tinggi. Penelitian ini fokus untuk menganalisis jika h-indeks, impact factor, jumlah dokumen, dan SJR dapat menghasilkan penilaian kualitas yang sesuai dengan penilaian manual pakar dari beberapa situs penilaian konferensi serta membandingkan hasil performanya dengan penilaian jurnal. Data yang digunakan dikumpulkan dari empat sumber situs web yang mengkalkulasi kualitas konferensi luar negeri, yaitu CORE, ERA/QUALIS, AMiner, dan ScimagoJR. Data untuk penilaian jurnal didapatkan dari Guide2Research. Variabel yang digunakan untuk penilaian adalah h-indeks, jumlah dokumen, impact factor, dan SJR. Penelitian ini menggunakan metode K-Nearest Neighbor (KNN), Support Vector Machine (SVM), Naïve Bayes, dan Decision Tree (DT). KNN menghasilkan nilai akurasi tertinggi sebesar 72,22% dan f1 score senilai 63,06% menggunakan data Qualis dengan faktor h-indeks, IF, dan SJR.

The number of conferences makes it difficult for researchers to choose quality conferences. The possibility of researchers being fooled by predatory conferences is a real threat that deserves attention. Conference assessments generally use experts who require time and money to evaluate the conferences. This study focuses on analyzing whether h-index, impact factor, number of documents, and SJR can produce quality assessments in accordance with expert manual assessments from several conference assessment sites and compare the resulting performance with journal assessments. The data used were collected from four website sources that calculate the quality of overseas conferences, namely CORE, ERA/QUALIS, AMiner, and ScimagoJR. Data for journal assessments were obtained from Guide2Research. The variables used for the assessment are h-index, number of documents, impact factor, and SJR. This research used K-Nearest Neighbor (KNN), Support Vector Machine (SVM), Naïve Bayes, and Decision Tree (DT). KNN produced the highest accuracy value of 72.22% and the f1 score of 63.06% using Qualis data with the h-index, IF, and SJR factors."
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2021
UI - Tesis Membership
