Hasil Pencarian  ::  Simpan CSV :: Kembali

Hasil Pencarian

Ditemukan 39815 dokumen yang sesuai dengan query
cover
Means, Gardiner C.
New York: Harper & Brothers Publishers, 1962
338.52 MEA p
Buku Teks  Universitas Indonesia Library
cover
Rezki Aulia Putri
"Sinusitis adalah peradangan pada dinding sinus, yaitu rongga kecil yang terhubung dengan rongga udara dalam tulang tengkorak. Sinus terletak di belakang dahi, di dalam struktur tulang pipi, di kedua sisi hidung, dan di belakang mata. Sinusitis disebabkan oleh peradangan pada rongga hidung, tumbuhnya polip, alergi, dan hal lainnya yang dapat terjadi pada orang dewasa, remaja, bahkan anak-anak. Untuk mengklasifikasi jenis sinusitis, penulis menggunakan Fuzzy C-Means Berbasis Kernel yang merupakan pengembangan dari Fuzzy C-Means. Fuzzy C-Means mengelompokkan data menggunakan jarak Euclidean. Namun, jika data yang akan dipisahkan adalah data non linear, maka konvergensinya akan kecil dan membutuhkan waktu yang lama. Untuk menyelesaikan masalah ini dapat digunakan Fuzzy C-Means Berbasis Kernel yang menggunakan fungsi kernel untuk menggantikan jarak Euclidean. Metode ini memetakan objek dari ruang data ke ruang fitur yang berdimensi lebih tinggi, sehingga dapat mengatasi kelemahan FCM. Data yang digunakan adalah data penyakit sinusitis yang diperoleh dari laboratorium radiolog RSUPN Cipto Mangunkusumo, Jakarta. Karena data yang digunakan adalah data non linear, maka metode yang lebih cocok digunakan adalah Fuzzy C-Means Berbasis Kernel. Dengan menggunakan software Matlab diperoleh akurasi 100% dengan waktu mendekati 0 detik untuk Fuzzy C-Means Berbasis Kernel.

Sinusitis is an inflammation of the sinus wall, a small cavity interconnected through the airways in the skull bones. It is located on the back of the forehead, inside the cheek bone structure, on both side of the nose, and behind the eyes. Sinusitis is caused by infection, growth of nasal polips, allergies, and others. This condition can effect adults, teenagers, and even children. To classify sinusitis we used Kernel Based Fuzzy C-Means, which is the development of Fuzzy C-Means (FCM). FCM algorithm groups data using Euclidean distance. However, when non linear data is separated, the convergence is innacurate and need a long running time. To overcome this problem, a Kernel Based Fuzzy C-Means that use kernel functions as a substitute for Euclidean distance. It maps objects from data space to a higher dimention feature space, so they can overcome FCM deficiencies. Data that is used is sinusitis dataset obtained from the laboratory of radiology at Cipto Mangunkusumo National General Hospital, Jakarta. Because the data used is non-linear dataset, the more suitable method is Kernel Based Fuzzy C-Means. By using the Matlab software 100% accuracy is obtained and running time is close to 0 for Kernel Based Fuzzy C-Means.
"
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2019
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Aldi Purwanto
"

Kanker merupakan salah satu penyakit dengan angka kematian tertinggi di dunia. Kanker adalah penyakit ketika sel-sel abnormal tumbuh tidak terkendali yang dapat menyerang organ tubuh yang berdampingan atau menyebar ke organ lain. Untuk mendiagnosis kanker paru-paru dapat dilakukan dengan pengambilan gambar rontgen, CT scan, dan biopsi jaringan paru. Tujuan dari penelitian ini adalah untuk memprediksi apakah pasien menderita kanker paru-paru atau tidak, dengan menggunakan data gambar CT scan mereka. Oleh sebab itu, dalam penelitian ini digunakan ekstraksi fitur dari gambar CT scan sebagai data untuk mengklasifikasi kanker paru-paru. Data yang digunakan merupakan data gambar CT scan yang didapat dari SPIE-AAPM Lung CT Challenge 2015. Gambar CT scan paru-paru dengan ukuran 512x512 sebelumnya dilakukan pre-processing 2D crop dan filtering. Dengan mengekstraksi fitur dari data gambar seperti ukuran nodul, Gray Level Co-occurrence Matriks (GLCM), dan Local Binary Pattern (LBP) dapat mengubah data gambar menjadi numerik. K-Fold Cross Validation digunakan untuk memisahkan data menjadi data training dan data testing. Fuzzy C-Means (FCM) dan Fuzzy Kernel C-Means (FKCM) diterapkan untuk pengklasifikasian. Didapatkan performa FKCM lebih baik dibandingkan FCM, dengan rata-rata akurasi 75.60%, precision 83.05%, dan specificity 87.80%. Oleh karena itu, penambahan kernel pada metode Fuzzy C-Means dapat meningkatkan performa dari metode tersebut


Cancer is one of the diseases with the highest mortality rate in the world. Cancer is a disease when abnormal cells grow out of control that can attack the body's organs side by side or spread to other organs. To diagnose lung cancer can be done by taking x-ray images, CT scans, and lung tissue biopsy. The purpose of this study is to classify whether patients have lung cancer or not using their CT scan image data. Therefore, in this study feature extraction from CT images was used as data to classify lung cancer. The data used in the form of CT scan image obtained from SPIE-AAPM Lung CT Challenge 2015. Previously, a CT scan of the lung with a size of 512x512 was pre-processed 2D crop and filtering. By extracting features from image data such as nodule size, Gray Level Co-occurrence Matrix (GLCM), and Local Binary Pattern (LBP) can convert image data to numeric. K-Fold Cross Validation is used to separate data into training data and testing data. Fuzzy C-Means (FCM) and Fuzzy C-Means (FKCM) are applied for classification. FKCM performed better than FCM, with 75.60% average accuracy, 83.05% average precision, and 87.80% average specificity. Therefore, adding a kernel to the Fuzzy C-Means method can improve the performance of the method.

"
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2020
S-Pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Muktiari
"ABSTRAK
Pendeteksian topik adalah metode praktis untuk menemukan topik pada suatu koleksi dokumen. Salah satu metodenya adalah metode berbasis clustering yang mana centroid merepresentasikan topik contohnya eigenspace ndash; based fuzzy c ndash; EFCM . Proses clustering pada metode EFCM diimplementasikan pada dimensi yang lebih kecil yaitu ruang eigen. Sehingga akurasi dari proses clustering memungkinkan berkurang. Pada tesis ini, penulis menggunakan metode kernel sehingga proses clustering tersebut dapat diimplentasikan pada dimensi yang lebih tinggi tanpa mentransformasikan data ke ruang tersebut. Simulasi penulis menunjukkan bahwa kernelisasi ini meningkatkan akurasi dari EFCM berdasarkan skor interpretability pada berita online berbahasa Indonesia.

ABSTRACT
Topic detection is practical methods to find a topic in a collection of documents. One of the methods is a clustering based method whose centroids are interpreted as topics, i.e., eigenspace based fuzzy c means EFCM . The clustering process of the EFCM method is performed in a smaller dimensional Eigenspace. Thus, the accuracy of the clustering process may be reduced. In this thesis, we use the kernel method so that the clustering process is performed in a higher dimensional space without transforming data into that space. Author simulations show that this kernelization improves the accuracies of EFCM in term of interpretability scores for Indonesian online news."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2018
T50790
UI - Tesis Membership  Universitas Indonesia Library
cover
Deo Lahara
"ABSTRAK
Pendeteksian topik topic detection adalah suatu proses yang digunakan untuk menganalisis kata-kata pada suatu koleksi data tekstual untuk menentukan topik-topik yang ada pada koleksi tersebut. Pendeteksian topik pada dokumen yang sangat besar sulit dilakukan secara manual sehingga dibutuhkan metode otomatis. Masalah pendeteksian topik secara otomatis dikenal dengan istilah topic detection and tracking TDT . Suatu metode alternatif TDT untuk masalah pendeteksian topik adalah fuzzy C-means FCM. Pada metode fuzzy C-means, umumnya pusat cluster ditentukan secara acak atau inisialisasi random. Namun, terkait dengan masalah dimensi yang tinggi pada inisialisasi random akan menyebabkan algoritma konvergen ke satu pusat. Sehingga, topik-topik yang dihasilkan antara satu dengan yang lainnya sama. Untuk itu, diperlukan metode untuk membuat inisialisasi yang dapat mengatasi masalah tersebut. Salah satu metode inisialisasi yang akan dikembangkan pada penelitian ini adalah metode Singular Value Decomposition SVD . Hasil simulasi menunjukan bahwa metode inisialisasi dapat mengatasi permasalahan fuzzy C-means pada data dimensi yang tinggi sehingga topik-topik yang dihasilkan tidak sama terhadap satu sama lain.

ABSTRAK
Topic detection is a process used to analyze words in a collection of textual data to determine the topics of the collection. Detecting topics on a very large document is hardly done manually so that automatic methods are needed. Automatic method to detect topics in textual documents is known as Topic Detection and Tracking TDT . An alternative method of TDT for topic detection problems is fuzzy C means FCM . In the FCM method, generally the cluster center is random initialization. However, related to the problem of high dimensional random initialization causes the algorithm to converge to one center, it means that all generated topics are similar. For that, a method is needed to create an initialization that resolves the problem. One of the initialization methods that will be developed in this research is Singular Value Decomposition SVD method. The simulation results show that the SVD initialization method can overcome the fuzzy C means problem in the high dimension data so that the resulting topics are not equal to each other. "
2017
S69378
UI - Skripsi Membership  Universitas Indonesia Library
cover
Yudho Prakoso
"Salah satu metode otomatis untuk analisis data tekstual adalah deteksi topik. Eigenspace-based Fuzzy C-Means EFCM adalah metode berbasis soft clustering untuk pendeteksian topik. Pertama, EFCM menggunakan dekomposisi nilai tunggal terpotong untuk mengubah data tekstual dimensi tinggi menjadi data berdimensi rendah. Selanjutnya, proses pengelompokan dilakukan dalam ruang dimensi yang lebih kecil. Namun, proses transformasi itu dapat menghilangkan beberapa fitur penting dari data tekstual. Karena itu, akurasi dapat berkurang.
Dalam penelitian ini digunakan kernel trick untuk mengatasi kelemahan tersebut sehingga proses clustering dapat dilakukan dalam ruang dimensi yang lebih tinggi. Simulasi menunjukkan bahwa pendekatan ini memberikan akurasi yang lebih baik dalam menemukan topik daripada EFCM untuk masalah mendeteksi topik di Twitter.

One of automated methods for textual data analysis is topic detection. Eigenspace based fuzzy c means EFCM is a soft clustering based method for topic detection. Firstly, EFCM use truncated singular value decomposition to transform high dimensional textual data to low dimensional data. Next, the clustering process is conducted in the smaller dimensional space. However, that transformation process may eliminate some important features from the textual data. Therefore, the accuracy may be reduced.
In this study used kernel trick to overcome that weakness so that the clustering process is performed in a higher dimensional space. Simulations show that this approach gives better accuracies in term of topic recall than EFCM for the problem of sensing trending topic in Twitter.
"
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2018
S-Pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Nedya Shandri
"Penyakit kronis adalah penyakit yang diderita dalam waktu panjang dan dapat berkembang secara cepat, salah satunya adalah penyakit kanker dan diabetes. Oleh karena itu, dengan melakukan pendeteksian dini maka perkembangan penyakit kanker dan diabetes akan menurun. Salah satu cara pendektesian dini dapat dilakukan oleh machine learning. Teknik machine learning banyak digunakan dalam berbagai bidang khususnya untuk analisa data medis.  Clustering merupakan salah satu metode dari machine learning yang bertujuan untuk mengelompokkan suatu dataset ke dalam subset berdasarkan ukuran jarak. Salah satu contoh metode clustering adalah metode Entropi Fuzzy C-Means yang dapat mengidentifikasi entropi disetiap titik data dan memilih pusat kluster terdekat dengan entropi minimum. Pada penelitian akan digunakan data kanker dan diabetes dari UCI Repository dengan menggunakan metode Entropi Fuzzy C-Means yang akan dimodifikasi dengan kernel RBF. Sebelum dilakukan klasifikasi, dilakukan pemilihan fitur menggunakan Chi-Square. Tujuan dari penelitian ini adalah untuk mendapatkan fitur-fitur yang optimal dan mengetahui hasil akurasi menggunakan untuk klasifikasi data diabetes dan kanker. Diperoleh hasil akurasi tertinggi pada klasifikasi data medis menggunakan metode Entropi Fuzzy C-Means berbasis kernel dengan pemilihan fitur Chi-Square yaitu sebesar 83.33% untuk data diabetes dan 77.77-100% untuk data kanker.

Chronic disease is a disease that occur for a long time and can develop quickly, one of them is cancer and diabetes. The early detection is very helpful to reduce the development of the disease. One of the ways to detect cancer and diabetes disease is using machine learning technic. Machine learning technic is widely use in many aspects especially in medical data analysis. Clustering is part of machine learning technic that is used to group a dataset into subset based on space size. Entropy Fuzzy C-Means is one of the methods which can identify entropy in every data and can choose the cluster center similar with minimum entropy. In this paper we will use cancer and diabetes medical data from UCI Repository using Entropy Fuzzy C-Means method which is modified by kernel RBF. Before classification, we will select the feature using Chi-Square  to get the optimal subset feature. The purpose of this study was to obtain optimal features and find out the results of accuracy using for the classification of diabetes and cancer data. The medical data classification using Entropy Fuzzy C-Means based on kernel with Chi-Square feature selection gives the 100% highest accuration result for cancer data and 83,33% for diabetes data."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2019
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Andi Wulan Lestari A.
"Dalam dekade terakhir ini, kanker menjadi pusat perhatian dunia kesehatan dikarenakan penyakit ini termasuk dalam penyebab utama kematian di seluruh dunia. Menurut statistik GLOBOCAN, International Agency for Research on Cancer IARC pada tahun 2012, terdapat 14.067.894 kasus kanker baru dengan 8.201.575 kematian akibat kanker di seluruh dunia. Oleh sebab itu, dibutuhkan tindakan pencegahan dan pengobatan yang efektif. Salah satunya dengan metode klasifikasi kanker. Metode klasifikasi kanker dapat dijadikan sebagai alat bantu tenaga medis untuk menangani kanker. Dalam tugas akhir ini diusulkan algoritma untuk mengklasifikasikan data kanker dengan menggunakan Fuzzy Possibilistic C-means FPCM dan metode baru yang menggunakan Normed Kernel Function-based Fuzzy Possibilistic C-means NKFPCM. Tujuannya untuk mendapatkan keakuratan terbaik dalam pengklasifikasian data kanker. Untuk meningkatkan keakuratan dua metode tersebut, dilakukan evaluasi kandidat fitur dengan menggunakan pemilihan fitur. Untuk pemilihan fitur digunakan metode Laplacian Score. Hasil yang diperoleh menunjukkan perbandingan keakuratan dan running time dari FPCM dan NKFPCM tanpa dan dengan dilakukan pemilihan fitur. Hasilnya, didapatkan akurasi terbaik saat dengan menggunakan metode NKFPCM dengan dilakukan pemilihan fitur, yaitu 90,91 dengan penggunaan 750 fitur untuk data kanker kandung kemih, 100 dengan penggunaan 250 fitur untuk data kanker darah leukemia , 96,67 dengan penggunaan 3.000 fitur untuk data kanker prostat, dan 100 dengan penggunaan 250 fitur untuk data kanker lambung.

Over the past decade, cancer has become the center of attention in the medical field due to its reputation as one of the main causes of death in the worldwide. According to GLOBOCAN statistics, International Agency for Research on Cancer IARC , there were 14,067,894 new cancer cases and 8,201,575 cancer related deaths occurred in 2012. Therefore, preventive actions and effective treatments are required to reduce these threats. One method of handling of cancer using cancer classification. Cancer classification method can be used as aids to handle Cancer. This research proposed an algorithm to classify cancer data using Fuzzy Possibilistic C Means FPCM and a new method, Normed Kernel Function Based Fuzzy Possibilistic C Means NKFPCM. The purpose of this research is to obtain the best accuracy in the classification of cancer data. To improve the accuracy of these two methods, the feature candidate will be evaluated using feature selection. The feature selection was conducted using Laplacian Score. The results obtained show the comparison of the accuracy and running time of FPCM and NKFPCM without and with feature selection. The results show that the best accuracy obtained when using NKFPCM with features selection, with percentage of 90.91 by using 750 features for bladder cancer data, 100 by using 250 features for blood cancer leukemia data, 96.67 by using 3,000 features for prostate cancer data, and 100 by using 250 features for gastric cancer data.
"
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2016
S66693
UI - Skripsi Membership  Universitas Indonesia Library
cover
Raden Trivan Sutrisman
"ABSTRAK
Perkembangan berita online di Indonesia saat ini sudah semakin meningkat sehingga kebutuhan dalam melakukan analisis data berita sangat diperlukan untuk mendapatkan intisari informasi yang akurat dan cepat. Topik merupakan komponen dasar yang sering digunakan untuk menganalisis data dalam bentuk teks seperti berita. Dengan menggunakan pemodelan topik, dapat dilakukan pendeteksian topik secara otomatis pada koleksi dokumen berita yang sangat besar dan sulit dilakukan secara manual oleh manusia. Salah satu pemodelan topik yang dapat digunakan adalah metode clustering menggunakan Eigenspace Based Fuzzy C-Means (EFCM). Metode EFCM pada umumnya menggunakan inisialisasi random. Pada penelitian ini akan diimplementasikan metode inisialisasi menggunakan Non-Negative Double Singular Value Decomposition (NNDSVD) dan Fuzzy C-Means++ (FCM++) sebagai alternatif metode inisialisasi pada algoritma EFCM. Hasil simulasi menggunakan inisialisasi NNDSVD dan FCM++ menunjukkan nilai akurasi yang lebih baik dalam hal tingkat interpretabilitas topik daripada metode random.

ABSTRACT
The rapid increasing of online news in Indonesia creates the need for news analysis to obtain information as fast as possible. Topics are basic components that are often used to analyze data in the textual forms, such as the news article. By using topic modeling, topics can be detected automatically on large news documents which are difficult to perform manually. One of the topic modeling that can be used is the clustering-based method, i.e., Eigenspace-based Fuzzy C-Means (EFCM). The common initialization method of EFCM is random. In this research, Non-Negative Double Singular Value Decomposition (NNDSVD) and Fuzzy C-Means++ (FCM++) will be used as initialization methods of EFCM. The simulations show that the NNDSVD and FCM++ methods gives better accuracies in term of interpretability score than the random method.
"
Depok: Universitas Indonesia, 2018
T50041
UI - Tesis Membership  Universitas Indonesia Library
cover
Christhoper Nugraha
"ABSTRAK
Deteksi topik adalah proses menganalisis kumpulan data tekstual untuk menentukan topik pengumpulan data tekstual. Salah satu metode pengelompokan yang dapat digunakan untuk deteksi topik adalah metode Fuzzy C-Means (FCM). Namun, penggunaan FCM sederhana untuk pendeteksian topik tentang big data kurang efektif, karena akan memakan waktu lama dan banyak memori. FCM sederhana juga memiliki masalah lain, ketika melakukan deteksi topik aktif data dimensi tinggi, FCM sederhana hanya akan menghasilkan satu topik. Dalam penelitian ini, suatu gabungan metode Single-Pass Fuzzy C-Means (SPFCM) dan Fuzzy C-Means Berbasis Eigenspace (EFCM) diusulkan, yaitu Single-Pass Eigenspace-Based Fuzzy C-Means (SPEFCM) metode untuk mengatasi masalah ini. Data yang digunakan untuk deteksi topik adalah
tweet yang berasal dari aplikasi Twitter. Lalu, keakuratan topik didapat menggunakan SPEFCM dan EFCM akan dibandingkan berdasarkan nilai koherensi. Itu hasil simulasi menunjukkan bahwa nilai koherensi topik yang diperoleh menggunakan SPEFCM adalah sebanding dengan EFCM. Ini menunjukkan bahwa SPEFCM adalah metode yang tepat untuk mendeteksi topik pada data besar, tanpa mengurangi kualitas topik yang dihasilkan.

ABSTRACT
Topic detection is the process of analyzing a textual data set to determine the topic of textual data collection. One of the grouping methods that can be used for topic detection is the Fuzzy C-Means (FCM) method. However, the use of simple FCM for the detection of topics about big data is less effective, because it will take a long time and a lot of memory. Simple FCM also has another problem, when detecting active topics of high dimensional data, simple FCM will only produce one topic. In this study, a combination of the Single-Pass Fuzzy C-Means (SPFCM) method and the Fuzzy C-Means Based on Eigenspace (EFCM) is proposed, namely the Single-Pass Eigenspace-Based Fuzzy C-Means (SPEFCM) method to overcome this problem. The data used for topic detection is
tweets that come from the Twitter application. Then, the accuracy of the topics obtained using SPEFCM and EFCM will be compared based on coherence values. The simulation results show that the topic coherence value obtained using SPEFCM is comparable to EFCM. This shows that SPEFCM is the right method for detecting topics in big data, without reducing the quality of the topics produced."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2019
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
<<   1 2 3 4 5 6 7 8 9 10   >>