Hasil Pencarian  ::  Simpan CSV :: Kembali

Hasil Pencarian

Ditemukan 71356 dokumen yang sesuai dengan query
cover
Melati Vidi Jannati
"Klasifikasi data kanker menggunakan microarray data menjadi salah satu cara untuk mendapatkan pengobatan yang lebih tepat. Kendala yang terdapat adalah karakteristik dari microarray yang memiliki fitur yang sangat banyak. Seringkali fitur tersebut tidak begitu informatif bagi pengklasifikasian sehingga perlu adanya suatu cara untuk memilih fitur-fitur yang mengandung informasi yang penting. Salah satu cara tersebut adalah dengan pemilihan fitur. Pada penelitian ini, metode pemilihan fitur yang digunakan berdasarkan clustering dengan fungsi kernel. Fitur-fitur yang sudah terpilih kemudian diklasifikasikan menggunakan metode Support Vector Machine.
Evaluasi dari klasifikasi pada penelitian ini melibatkan K-Fold Cross Validation, metode tersebut akan membagi data secara acak, tetapi merata sehingga akurasi yang didapat juga merata. Hasil akurasi tersebut dilakukan dengan berbagai uji terhadap parameter yang berkaitan seperti K partisi, nilai dan fitur-fitur yang digunakan. Pada proses klasifikasi tanpa pemilihan fitur tingkat akurasinya mencapai 89.68 dengan k partisi sebanyak 6 sementara dengan 5 fitur akurasinya menjadi 95.87 pada partisi sebanyak 10.

Classification of cancer using microarray data is one way to get a more precise treatment. The obstacle on classification data is the characteristics of microarray data that is having many features. These features are often not so informative for classification, so it needs a way to select the features that contain important information. One way is by selection feature. In this research, the method of selection features that are used based on clustering with kernel function. Features that are already selected then classified using Support Vector Machine.
Evaluation of classification in this research involves a K Fold Cross Validation, that methods split data randomly but uniformly so that it can reach all of accuracy. The results of accuracy data was done with different test against related parameters such as K partition, the value of and the features that are used. On the classification process without selection features rate of accuracy reached on 89.68 with k partition number 6 while with the 5 features obtained 95.87 on partition number 10.
"
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2016
S66852
UI - Skripsi Membership  Universitas Indonesia Library
cover
Selly Anastassia Amellia Kharis
"Kanker merupakan kelompok penyakit yang ditandai dengan pertumbuhan dan penyebaran sel-sel abnormal yang tidak terkendali. Jika penyebaran sel tersebut tidak terkendali, hal ini dapat menyebabkan kematian. Berdasarkan American Cancer Society, pendeteksian dini terhadap sel kanker dapat meningkatkan angka harapan hidup seorang pasien lebih dari 97 . Banyak penelitian yang telah meneliti mengenai klasifikasi kanker menggunakan microarray data. Microarray data terdiri dari ribuan fitur gen namun hanya memiliki puluhan atau ratusan sampel. Hal tersebut dapat menurunkan akurasi klasifikasi sehingga perlu dilakukannya pemilihan fitur sebelum proses klasifikasi.
Pada penelitian ini dilakukan dua tahap pemilihan fitur. Pertama, support vector machine recursive feature elimination SVM-RFE digunakan untuk prefilter gen. Kedua, hasil pemilihan fitur SVM-RFE diseleksi kembali dengan menggunakan artificial bee colony ABC yang merupakan algoritma optimisasi berdasarkan perilaku lebah madu. Penelitian ini menggunakan dua dataset, yaitu data kanker paru-paru Michigan dan Ontario dari Kent Ridge Biomedical Dataset.
Hasil percobaan dengan menggunakan SVM-RFE dan ABC menunjukkan nilai akurasi klasifikasi yang lebih tinggi daripada tanpa pemilihan fitur, SVM-RFE, dan ABC, yaitu 98 untuk data kanker paru-paru Michigan dengan menggunakan 100 fitur dan 97 untuk data kanker paru-paru Ontario dengan menggunakan 70 fitur.

Cancer is a group of diseases characterized by the uncontrolled growth and spread of abnormal cells. If the spread is not controlled, it can result in death. Based on American Cancer Society, early detection of cancerous cells can increase survival rates for patients by more than 97 . Many study showed new aspect of cancer classification based microarray data. Microarray data are composed of many thousands of features genes and from tens to hundreds of instances. It can decrease classification accuracy so feature selection is needed before the classification process
In this paper, we propose two stages feature selection. First, support vector machine recursive feature elimination recursive feature elimination SVM RFE is used to prefilter the genes. Second, the SVM RFE features selection result is selected again using Artificial Bee Colony ABC which is an optimization algorithm based on a particular intelligent behavior of honeybee swarms. This research conducted experiments on Ontario and Michigan Lung Cancer Data from Kent Ridge Biomedical Dataset.
Experiment results demonstrate that this approach provides a higher classification accuracy rate than without feature selection, SVM RFE, and ABC, 98 for Michigan lung cancer dataset with using 100 features and 97 for Ontario lung cancer dataset with using 70 features.
"
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2018
T49733
UI - Tesis Membership  Universitas Indonesia Library
cover
Rafiqatul Khairi
"Kanker pankreas adalah penyakit di mana sel-sel tumor ganas (kanker) berkembang di jaringan pankreas, yaitu organ di belakang perut bagian bawah dan di depan tulang belakang, yang membantu tubuh menggunakan dan menyimpan energi dari makanan dengan memproduksi hormon untuk mengontrol kadar gula darah dan enzim pencernaan untuk memecah makanan. Biasanya, kanker pankreas jarang terdeteksi pada tahap awal. Salah satu tanda seseorang mengalami kanker pankreas adalah diabetes, terutama jika itu bertepatan dengan penurunan berat badan yang cepat, penyakit kuning, atau rasa sakit di perut bagian atas yang menyebar ke punggung. Di antara berbagai jenis kanker, kanker pankreas memiliki tingkat kelangsungan hidup terendah, yaitu hanya sekitar 3-6% dari mereka yang didiagnosis yang dapat bertahan hidup selama lima tahun. Jika pasien didiagnosis tepat waktu untuk perawatan, peluang mereka untuk bertahan hidup akan meningkat. Terdapat penanda tumor yang biasa digunakan untuk mengikuti perkembangan kanker pankreas, yaitu CA 19-9 yang dapat diukur dalam darah. Orang sehat dapat memiliki sejumlah kecil CA 19-9 dalam darah mereka. Kadar CA 19-9 yang tinggi seringkali merupakan tanda kanker pankreas. Tetapi kadang-kadang, kadar tinggi dapat menunjukkan jenis kanker lain atau gangguan non-kanker tertentu, seperti sirosis dan batu empedu. Karena kadar CA 19-9 yang tinggi tidak spesifik untuk kanker pankreas, CA 19-9 tidak dapat digunakan dengan sendirinya untuk skrining atau diagnosis. Ini dapat membantu memantau perkembangan kanker dan efektivitas pengobatan kanker. Dalam studi ini, metode Kernel-based Support Vector Machine digunakan untuk mengklasifikasikan hasil tes darah CA19-9 menjadi dua bagian; data pasien yang didiagnosis dengan kanker pankreas atau pasien normal (tidak terdiagnosis kanker pankreas). Metode ini memperoleh akurasi sekitar 95%.

Pancreatic cancer is a disease in which malignant (cancerous) tumor cells develop in pancreatic tissue; organ behind the lower abdomen and in front of the spine, which helps the body use and store energy from food by producing hormones to control blood sugar levels and digestive enzymes to break down food. Usually, pancreatic cancer is rarely detected at an early stage. One sign of a person with pancreatic cancer is diabetes, especially if it coincides with rapid weight loss, jaundice, or pain in the upper abdomen that spreads to the back. Among various types of cancer, pancreatic cancer has the lowest survival rate of only about 3-6% of those diagnosed who can survive for five years. If patients are diagnosed on time for treatment, their chances of survival will increase. There is a tumor marker commonly used to follow the course of pancreatic cancer, namely CA 19-9 which can be measured in the blood. Healthy people can have small amounts of CA 19-9 in their blood. High levels of CA 19-9 are often a sign of pancreatic cancer. But sometimes, high levels can indicate other types of cancer or certain noncancerous disorders, including cirrhosis and gallstones. Because a high level of CA 19-9 is not specific for pancreatic cancer, CA 19-9 cannot be used by itself for screening or diagnosis. It can help monitor the progress of your cancer and the effectiveness of cancer treatment. In this study, the Kernel-based Support Vector Machine method is used to classify CA19-9 blood test results into two sections including data on patients diagnosed with pancreatic cancer or normal patients. This method will get an accuracy of around 95%."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2020
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Muslar Alibasya
"Kanker paru-paru merupakan jenis kanker yang dimulai dan tumbuh di dalam paru-paru. Kanker paru-paru terjadi ketika sel-sel yang melapisi bronkus dan bronkiolus tumbuh secara tidak terkendali. Hal ini dapat menyebabkan kematian jika tidak ditangani dengan cepat dan tepat. Pengklasifikasian dini merupakan salah satu solusi yang tepat untuk mengurangi jumlah kematian yang disebabkan oleh kanker paru-paru. Pendekatan machine learning dapat digunakan untuk mengklasifikasi kanker paru-paru. Dalam penelitian ini, pengklasifikasian dilakukan dengan menggunakan data microarray. Data microarray memiliki fitur yang sangat banyak. Oleh karena itu, dibutuhkan seleksi fitur agar proses klasifikasi berlangsung optimal. Pada penelitian ini, penulis mengusulkan metode Support Vector Machine-Recursive Feature Elimination (SVM-RFE) untuk metode seleksi fitur. Data microarray yang digunakan diambil dari National Center for Biotechnology Information (NCBI) yang merupakan sebuah website online database. Pada penelitian ini, penulis menggunakan SVM-RFE sebagai metode seleksi fitur untuk mengeliminasi fitur yang kurang relevan. Setelah itu pendekatan k-fold cross-validation digunakan sebagai pembagian data, dan beberapa machine learning classifier yaitu Support Vector Machine (SVM), Random Forest (RF), Decision Tree (DT), dan Extreme Gradient Boosting (XGBoost) digunakan sebagai metode klasifikasi. Dari hasil simulasi menunjukkan bahwa hasil terbaik berdasarkan nilai akurasi, precision, recall dan running time diperoleh oleh metode klasifikasi SVM dengan nilai akurasi 100%, precision 100%, recall 100% dan running time 5,42 detik.

Lung cancer is a type of cancer that begins in the lungs. Lung cancer occurs when the cells that cover the bronchi and bronchioles grow uncontrollably. This can lead to death if not treated quickly and appropriately. Early classification is one of the appropriate solution to reduce the number of deaths caused by lung cancer. Machine learning approach can be used to classify lung cancer. In this research, classification is done using microarray data which has a lot of features. Therefore, feature selection is applied such that the classification process used the optimal number of features. In this study, the researcher proposes the Support Vector Machine-Recursive Feature Elimination (SVM- RFE) method for the feature selection method. The microarray data was taken from the National Center for Biotechnology Information (NCBI), which is an online database website. In this study, the researcher used SVM-RFE as a feature selection method to eliminate irrelevant features. Afterwards, the k-fold cross-validation method and several machine learning classifiers, namely Support Vector Machine (SVM), Random Forest (RF), Decision Tree (DT), and Extreme Gradient Boosting (XGBoost) will be used as classification methods. In the final stage, the researcher will analyze the performance results of the proposed method based on the accuracy and running time of each classifier. The simulation results show that the best results based on the values of accuracy, precision, recall and running time are obtained by the SVM classification method with a value of 100% accuracy, 100% precision, 100% recall and running time of 5.42 seconds."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2021
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Nurul Maghfirah
"Kematian yang disebabkan oleh kanker diperkirakan akan terus meningkat, padahal jumlah kematian ini dapat dikurangi dengan adanya deteksi dini. Salah satunya adalah dengan klasifikasi data kanker. Data kanker yang digunakan merupakan data kanker berdimensi tinggi dengan ribuan fitur, tetapi tidak semua fitur yang ada merupakan fitur yang relevan. Oleh karena itu, perlu adanya proses seleksi fitur. Untuk meningkatkan tingkat akurasi yang dihasilkan, digunakan sebuah metode seleksi fitur yang meninjau adanya korelasi antar gen, yaitu CSVM-RFE. Pada metode tersebut, data yang ada diproyeksikan dan diubah menjadi sebuah data baru dengan ekstraksi fitur, dan kemudian dilakukan proses seleksi fitur. Penggunaan dua metode tersebut pada klasifikasi tiga data kanker yang ada terbukti menghasilkan tingkat akurasi yang tinggi, pada data kanker kolon tingkat akurasi yang didapatkan adalah sebesar 96.6, pada kanker prostat sebesar 98.9, dan pada kanker lymphoma sebesar 98,6.

The number of death caused by cancer expected to rise over two decades, whereas the number of death can be reduced by early detection. One of them is cancer classification. Cancer dataset is a high dimensional dataset that consist of thousands of features, but not all of these features are relevant. Therefore, it is necessary to remove the redundant features using feature selection. Feature selection can also improve the accuracy of classification. Many feature selection methods do not consider the correlated genes, so we need a new feature selection method that consider the correlated genes. It is CSVM RFE, in this method the existing data is projected and converted into a new data with feature extraction. These two methods are applied to the cancer datasets, and produce the accuracy of 96.6 using colon cancer dataset, 98.9 using prostate cancer dataset, and 98.6 using lymphoma cancer dataset."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2017
S69588
UI - Skripsi Membership  Universitas Indonesia Library
cover
Faisa Maulidina
"Kanker merupakan pertumbuhan sel abnormal di dalam tubuh yang tidak terkendali. Ketika kanker dimulai di paru-paru, hal ini dinamakan sebagai kanker paru-paru. Terdapat faktor-faktor tertentu yang meningkatkan risiko seseorang yang mengidap penyakit ini, yaitu dengan merokok (termasuk perokok pasif), riwayat kanker paru-paru dalam keluarga, terpapar radiasi, dan infeksi HIV. Penyakit ini dapat didiagnosis melalui image tests, diantaranya yaitu chest x-ray, CT scan, MRI scan, PET scan, dan bone scan. Meskipun diagnosa telah dilakukan dengan banyak cara, namun masih terdapat banyak kesalahan dalam mendiagnosa penyakit tersebut. Untuk mengatasi dan membantu hal tersebut, klasifikasi penyakit kanker paru-paru dapat dilakukan dengan menggunakan metode machine learning. Dataset yang akan digunakan untuk mengklasifikasikan penyakit ini berupa CT Scan yang didapatkan dari Rumah Sakit Cipto Mangunkusumo, Jakarta, Indonesia. Metode klasifikasi yang digunakan adalah Particle Swarm Optimization-Genetic Algorithm-Support Vector Machine (PSO-GA-SVM), dimana Particle Swarm Optimization-Genetic Algorithm (PSO-GA) digunakan untuk mengoptimisasi parameter pada Support Vector Machine (SVM). Untuk mengevaluasi hasil kinerja metode tersebut, akan dilihat nilai akurasi, presisi, recall, dan f1-score dan dibandingkan dengan metode SVM tanpa optimisasi. Dari hasil yang didapat, klasifikasi dengan menggunakan Particle Swarm Optimization-Genetic Algorithm-Support Vector Machine (PSO-GA-SVM) menghasilkan performa yang lebih baik jika dibandingkan dengan Support Vector Machine (SVM) tanpa optimisasi parameter.

Cancer is an uncontrolled growth of abnormal cells in the body. When cancer starts in the lungs, it is referred as lung cancer. There are certain factors that increase a person's risk of this disease, such as smoking (including passive smoker), a family history of lung cancer, exposure to radiation, and HIV infection. This disease can be diagnosed through image tests, including chest x-ray, CT scan, MRI scan, PET scan, and bone scan. Although diagnosis has been made in many ways, there are still many errors in diagnosing the disease. To overcome and help this problem, the classification of lung cancer can be done by using machine learning method. The dataset that used to classify this disease is CT Scan obtained from Cipto Mangunkusumo Hospital, Jakarta, Indonesia. The classification method that will be used is Particle Swarm Optimization-Genetic Algorithm-Support Vector Machine (PSO-GA-SVM), where Particle Swarm Optimization-Genetic Algorithm (PSO-GA) was used to optimize the parameters of the Support Vector Machine (SVM). To evaluate the results of the performance of the method, values of accuracy, precision, recall, and f1-score will be seen and it will be compared with SVM without the optimization. From the results obtained, classification using Particle Swarm Optimization-Genetic Algorithm-Support Vector Machine (PSO- GA-SVM) produces better performance compared to Support Vector Machine (SVM) without parameter optimization."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2021
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Faisa Maulidina
"Kanker merupakan pertumbuhan sel abnormal di dalam tubuh yang tidak terkendali. Ketika kanker dimulai di paru-paru, hal ini dinamakan sebagai kanker paru-paru. Terdapat faktor-faktor tertentu yang meningkatkan risiko seseorang yang mengidap penyakit ini, yaitu dengan merokok (termasuk perokok pasif), riwayat kanker paru-paru dalam keluarga, terpapar radiasi, dan infeksi HIV. Penyakit ini dapat didiagnosis melalui image tests, diantaranya yaitu chest x-ray, CT scan, MRI scan, PET scan, dan bone scan. Meskipun diagnosa telah dilakukan dengan banyak cara, namun masih terdapat banyak kesalahan dalam mendiagnosa penyakit tersebut. Untuk mengatasi dan membantu hal tersebut, klasifikasi penyakit kanker paru-paru dapat dilakukan dengan menggunakan metode machine learning. Dataset yang akan digunakan untuk mengklasifikasikan penyakit ini berupa CT Scan yang didapatkan dari Rumah Sakit Cipto Mangunkusumo, Jakarta, Indonesia. Metode klasifikasi yang digunakan adalah Particle Swarm Optimization-Genetic Algorithm-Support Vector Machine (PSO-GA-SVM), dimana Particle Swarm Optimization-Genetic Algorithm (PSO-GA) digunakan untuk mengoptimisasi parameter pada Support Vector Machine (SVM). Untuk mengevaluasi hasil kinerja metode tersebut, akan dilihat nilai akurasi, presisi, recall, dan f1-score dan dibandingkan dengan metode SVM tanpa optimisasi. Dari hasil yang didapat, klasifikasi dengan menggunakan Particle Swarm Optimization-Genetic Algorithm-Support Vector Machine (PSO-GA-SVM) menghasilkan performa yang lebih baik jika dibandingkan dengan Support Vector Machine (SVM) tanpa optimisasi parameter.

Cancer is an uncontrolled growth of abnormal cells in the body. When cancer starts in the lungs, it is referred as lung cancer. There are certain factors that increase a person's risk of this disease, such as smoking (including passive smoker), a family history of lung cancer, exposure to radiation, and HIV infection. This disease can be diagnosed through image tests, including chest x-ray, CT scan, MRI scan, PET scan, and bone scan. Although diagnosis has been made in many ways, there are still many errors in diagnosing the disease. To overcome and help this problem, the classification of lung cancer can be done by using machine learning method. The dataset that used to classify this disease is CT Scan obtained from Cipto Mangunkusumo Hospital, Jakarta, Indonesia. The classification method that will be used is Particle Swarm Optimization-Genetic Algorithm-Support Vector Machine (PSO-GA-SVM), where Particle Swarm Optimization-Genetic Algorithm (PSO-GA) was used to optimize the parameters of the Support Vector Machine (SVM). To evaluate the results of the performance of the method, values of accuracy, precision, recall, and f1-score will be seen and it will be compared with SVM without the optimization. From the results obtained, classification using Particle Swarm Optimization-Genetic Algorithm-Support Vector Machine (PSO- GA-SVM) produces better performance compared to Support Vector Machine (SVM) without parameter optimization."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2021
S-Pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Arfiani
"Stroke merupakan penyakit yang menempati urutan ketiga sebagai penyebab kematian terbesar di dunia setelah penyakit jantung dan kanker. Stroke juga menduduki posisi pertama sebagai penyakit yang dapat menyebabkan kecacatan, baik ringan maupun berat. Salah satu jenis stroke yang umum terjadi adalah infark serebri. Di Indonesia, jumlah penderita stroke, terutama infark serebri, semakin meningkat setiap tahunnya. Tidak hanya terjadi pada seseorang yang berusia lanjut, namun infark serebri juga dapat terjadi pada seseorang yang masih muda dan produktif. Oleh sebab itu, pendeteksian dini terhadap infark serebri sangatlah penting. Berbagai metode medis selalu digunakan untuk mengklasifikasi infark serebri, namun dalam penelitian ini, akan digunakan metode machine learning. Metode yang diusulkan yaitu Multiple Support Vector Machine dengan Seleksi Fitur Information Gain (MSVM-IG). MSVM-IG merupakan metode baru yang menggunakan support vector sebagai data baru untuk selanjutnya dilakukan seleksi fitur dan evaluasi performa. Data yang digunakan berupa data numerik hasil CT Scan yang diperoleh dari RSUPN dr. Cipto Mangunkusumo, Jakarta. Berdasarkan hasil uji coba, metode yang diusulkan mampu mencapai nilai akurasi sebesar 88,71%. Sehingga, metode MSVM-IG ini dapat menjadi salah satu alternatif untuk membantu praktisi medis dalam mengklasifikasi infark serebri.

Stroke is a disease that ranks third as the biggest cause of death in the world after heart disease and cancer. Stroke also occupies the first position as a disease that can cause disability, both mild and severe. One type of stroke that is common is cerebral infarction. In Indonesia, the number of stroke patients, especially cerebral infarction, is increasing every year. Not only occurs in someone who is elderly, but cerebral infarction can also occur in someone who is young and productive. Therefore, early detection of cerebral infarction is very important. Various medical methods are always used to classify cerebral infarction, but in this study, machine learning methods would be used. The proposed method is Multiple Support Vector Machine with Information Gain Feature Selection (MSVM-IG). MSVM-IG is a new method that uses support vector as a new dataset, then feature selection step and performance evaluation are performed. The data used in the form of numerical data results of CT scan obtained from RSUPN Dr. Cipto Mangunkusumo, Jakarta. Based on the results, the proposed method is able to achieve an accuracy value of 88.71%. Thus, the MSVM-IG could be an alternative to assist medical practitioners in classifying cerebral infarction."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2019
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Ayu Andya Ruvita
"Pengenalan wajah merupakan teknologi yang berkembang sangat pesat. Pengenalan wajah mampu menghasilkan beragam informasi mengenai identitas seseorang dengan cepat dan akurat. Salah satunya, mampu memberikan informasi mengenai jenis kelamin dari setiap orang yaitu sebagai pria atau wanita. Proses klasifikasi pria atau wanita ini menjadi hal yang sangat penting dalam berbagai bidang, seperti bisnis berbasis online, kontrol akses, absensi kehadiran, sistem keamanan, identifikasi individu yang tidak dikenal, dan lain-lain. Dalam penelitian ini digunakan Fisher Score sebagai metode pemilihan fitur, dan Support Vector Machine SVM sebagai metode klasifikasi untuk mengukur tingkat akurasi dan running time dari klasifikasi pria atau wanita dengan data yang digunakan berasal dari Computer Science Research Projects. Hasil akurasi dari klasifikasi SVM kernel polynomial d = 4 dengan pemilihan fitur Fisher Score mencapai tingkat akurasi tertinggi yaitu 100 pada 3000 fitur dengan data training 90 . Sedangkan hasil akurasi terbaik dari klasifikasi SVM tanpa pemilihan fitur mencapai 77.5 pada data training 80.

Face recognition is a technology that is growing very rapidly. Face recognition is able to produce various information about the identity of a person quickly and accurately. One of the utility of face recognition is the ability to provide information about the gender of each person as a male or female. The process of classifying male or female is of paramount importance in many areas, such as online based businesses, access control, attendance, security systems, identification of unknown individuals, and so on. In this study Fisher Score is used as a feature selection method, and Support Vector Machine SVM as a classification method to measure the accuracy and running time of male or female classification with data used from Computer Science Research Projects. Accuracy results from SVM polynomial kernel classification d 4 with Fisher Score feature selection reaches the highest accuracy level of 100 at 3000 features with 90 training data. While the best accuracy results from SVM classification without feature selection reached 77.5 in 80 training data."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2018
S-Pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Vinezha Panca
"ABSTRAK
Kanker merupakan salah satu penyebab kematian terbesar di seluruh dunia. Secara khusus, kanker otak adalah kanker yang terjadi pada sistem saraf pusat. Salah satu hal yang dapat dilakukan untuk penelitian kanker otak menggunakan machine learning adalah melakukan pendeteksian jenis kanker otak dengan memanfaatkan microarray data. Permasalahan tersebut merupakan masalah klasifikasi multikelas. Dengan menggunakan pendekatan one versus one, akan terbentuk sebanyak k k-1 /2 masalah dua kelas, di mana k menunjukkan jumlah kelas. Karena data kanker otak memiliki fitur yang sangat banyak, perlu dilakukan seleksi fitur. Pada penelitian ini, akan diimplementasikan metode Multiple Multiclass Support Vector Machine Recursive Feature Elimination MMSVM-RFE sebagai metode seleksi fitur, dan Twin Support Vector Machine TWSVM sebagai metode klasifikasi. Pada metode MMSVM-RFE dilakukan pelatihan SVM-RFE pada setiap masalah dua kelas, sehingga setiap masalah dua kelas memiliki pengurutan fitur masing-masing. Sebagai metode klasifikasi, TWSVM memiliki tujuan untuk mencari hyperplane masing ndash; masing kelas sedemikian sehingga data kelas satu sedekat mungkin terhadap suatu hyperplane namun sejauh mungkin dengan hyperplane lainnya. Rata-rata akurasi tertinggi pada simulasi menggunakan kernel linear pada MMSVM-RFE dan kernel linear pada TWSVM adalah 95,33 dengan menggunakan 200 fitur. Rata-rata akurasi tertinggi pada simulasi menggunakan kernel linear pada MMSVM-RFE dan kernel RBF pada TWSVM adalah 87 dengan 70 fitur. Sedangkan apabila proses validasi juga dilakukan pada seleksi fitur, rata-rata akurasi tertinggi yang diperoleh adalah 90,67 dengan menggunakan 90 fitur.

ABSTRACT
Cancer is one of main causes of death worldwide. Brain cancer is a type of cancer which occurs at central nervous system. Taking advantage from microarray data, machine learning methods can be applied to help brain cancer prediction according to its types. This problem can be referred as a multiclass classification problem. Using one versus one approach, the multiclass problem with k classes can be transformed into k k 1 2 binary class problems. The huge amount of features makes it necessary to use feature selection. In this research, Multiple Multiclass Support Vector Machine Recursive Feature Elimination MMSVM RFE method is implemented as the feature selection method, and Twin Support Vector Machine TWSVM method is implemented as the classification method. The main concept of MMSVM RFE is to train SVM RFE at each binary problem so that each binary problem will have their own arrangements of feature. As a classification method, TWSVM is trained to find two hyperplanes, each representative of its own class. The data of one class must be as near as possible from its representative hyperplane while also must be as far as possible from the other hyperplane. In the simulation which uses linear kernel on MMSVM RFE and linear kernel on TWSVM, the highest average accuracy is 95,33 , using 200 features. In the simulation which uses linear kernel on MMSVM RFE and RBF kernel on TWSVM, the highest average accuracy is 87 , using 70 features. In the case where the feature selection process is included in doing validation, the highest average accuracy is 90,67 , using 90 features."
2016
S66302
UI - Skripsi Membership  Universitas Indonesia Library
<<   1 2 3 4 5 6 7 8 9 10   >>