Hasil Pencarian  ::  Simpan CSV :: Kembali

Hasil Pencarian

Ditemukan 137326 dokumen yang sesuai dengan query
cover
Sri Hartini
"Talasemia merupakan penyakit genetik dimana terjadi kelainan pada sel darah merah akibat kesalahan produksi hemoglobin. Perkawinan antara sesama pembawa gen talasemia dapat menyebabkan munculnya keturunan yang menderita talasemia mayor. Talasemia mayor merupakan jenis talasemia yang dapat menyebabkan kematian. Oleh karena itu, pendeteksian dini terhadap penyakit talasemia merupakan hal yang penting. Salah satu cara untuk melakukan pendeteksian talasemia adalah dengan menggunakan machine learning. Pada skripsi ini, algoritma KC-Means (KCM) clustering digunakan untuk memprediksi talasemia. Kemudian performa algoritma tersebut dibandingkan dengan algoritma Kernel KC-Means (KKCM) clustering, dimana fungsi kernel yang digunakan adalah kernel Gaussian Radial Basis Function (RBF) dan polinomial. Pengujian kedua algoritma tersebut dilakukan dengan menggunakan hold-out evaluation dan 5-fold cross validation. Data yang digunakan adalah data talasemia yang berasal dari Rumah Sakit Harapan Kita, Jakarta, Indonesia. Data talasemia tersebut terdiri dari 150 sampel dengan komposisi 82 sampel talasemia dan 68 sampel non-talasemia, yang tiap sampelnya memiliki 11 fitur. Berdasarkan percobaan yang dilakukan, algoritma KCM dan KKCM menghasilkan prediksi dengan akurasi, sensitivitas, presisi, spesifisitas, dan F1-Score yang sama, yaitu di atas 96 persen. Namun, waktu komputasi yang dibutuhkan oleh KKCM dapat mencapai hingga 10.25 kali lebih cepat dari waktu komputasi KCM
.
Thalassemia is a genetic disease in which there are abnormalities in red blood cells due to an error in the production of hemoglobin. Marriage between thalassemia carriers can cause the birth of a child suffering from thalassemia major. Thalassemia major is a type of thalassemia that can cause death. Therefore, early detection of thalassemia is essential. One of the techniques to detect thalassemia is to use machine learning. In this thesis, the KC-Means (KCM) clustering algorithm is used to predict thalassemia. Then the performance of the algorithm is compared with the KC-Means Kernel (KKCM) clustering algorithm, where the kernel functions used are the Gaussian Radial Base Function (RBF) and polynomial kernel. Evaluation of those algorithms is carried out using hold-out evaluation and 5-fold cross-validation. The data used is thalassemia data from Harapan Kita Hospital, Jakarta, Indonesia. The data consists of 150 samples with a composition of 82 thalassemia samples and 68 non-thalassemia samples; each has 11 features. Based on the experiments, the KCM and KKCM algorithms make predictions with the same accuracy, sensitivity, precision, specificity, and F1-Score, which is above 96 percent. However, the computing time needed by KKCM can reach up to 10.25 times faster than the KCM computing time.
"
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2020
S-Pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Sari Gita Fitri
"Kanker adalah penyakit yang disebabkan oleh ketidakteraturan perjalanan hormon yang mengakibatkan tumbuhnya daging pada jaringan tubuh yang normal atau sering dikenal sebagai tumor ganas. Kanker terjadi saat sel-sel dalam tubuh membelah diri diluar kendali. Sel-sel abnormal ini kemudian menyerang jaringan terdekat. Salah satu kanker yang paling umum terjadi adalah kanker paru-paru. Kanker paru-paru adalah kanker yang dimulai di paru-paru dan paling sering terjadi pada orang yang merokok. Paru-paru kanan memiliki 3 bagian, yang disebut dengan lobus, sedangkan paru-paru kiri memiliki 2 lobus. Kanker paru-paru merupakan penyebab utama kematian terkait kanker di seluruh dunia dengan 30%-40% terjadi di negara berkembang. Untuk memprediksi apakah seseorang menderita kanker paru-paru atau tidak dapat dilihat dari terdapatnya tumor ganas pada paru-paru yang dapat dilakukan melalui CT scan. Namun, hasil CT scan tidak cukup dalam mendeteksi atau mendiagnosis secara dini terdapatnya tumor ganas di dalam paru-paru. Untuk itu, dapat digunakan machine learning dalam mendeteksi secara dini adanya tumor ganas di dalam paru-paru. Dalam penelitian ini, penulis menggunakan Kernel K-Means based Co-clustering yang merupakan pengembangan dari K-Means based Co-clustering. K-Means mengelompokkan data menggunakan jarak Euclidean. Akan tetapi, jika data yang dipisahkan adalah data nonlinear, maka konvergensi dari data yang dipisahkan tersebut akan kecil dan membutuhkan waktu yang lama, sehingga masalah ini dapat diselesaikan dengan menggunakan fungsi kernel untuk menggantikan jarak Euclidean.Co-clustering mempartisi baris dan kolom dari suatu matriks data secara simultan, sehingga blok yang diinduksi oleh partisi adalah klaster yang baik. Metode Kernel K-Means based Co-clustering memasukkan banyak titik untuk mewakili masing-masing pusat klaster, sehingga titik-titik di dalam klaster saling berdekatan, akan tetapi jauh dari titik yang mewakili klaster lain. Data yang digunakan adalah data kanker paru-paru yang diperoleh dari laboratorium radiologi RSUPN Cipto Mangunkusumo, Jakarta. Hasil akurasi yang diperoleh untuk memprediksi penyakit kanker paru-paru dengan menggunakan metode Kernel K-Means based Co-clustering adalah 94,5%.

Cancer is a disease caused by an irregular course of hormones that results in the growth of flesh in normal body tissues or often known as malignant tumors. Cancer occurs when cells in the body divide out of control. These abnormal cells then attack nearby tissues. One of the most common cancers is lung cancer. Lung cancer is cancer that starts in the lungs and most often occurs in people who smoke. The right lung has 3 parts, which are called lobes, while the left lung has 2 lobes. Lung cancer is the leading cause of cancer-related deaths worldwide with 30%-40% occurring in developing countries. To predict whether someone has lung cancer or can not be seen from the presence of malignant tumors in the lungs that can be done through a CT scan. However, CT scan results are not enough to detect or diagnose the presence of malignant tumors early in the lungs. For this reason, machine learning can be used to detect malignant tumors early in the lungs. In this research, the writer usesKernel K-Meansbased Co-clustering which is the development of K-Means-based Co-clustering. K-Means groups data using Euclidean distances. However, if the separated data is non-linear data, the convergence will be small and take a long time, so this problem can be solved by using the kernel function to replace the Euclidean distance. Co-clustering partitioned rows and columns of a data matrix simultaneously, so the blocks induced by partitions are good clusters. Kernel K-Meansbased Co-clustering method includes many points to represent each cluster center, so that the points within the cluster are close together, but far from the points representing other clusters. The data used are lung cancer data obtained from the radiology laboratory of Cipto Mangunkusumo General Hospital, Jakarta. Accuracy results obtained to predict lung cancer by using the Kernel K-Meansbased Co-clustering method are 94.5%."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2020
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Diyah Septi Andryani
"Clustering bertujuan untuk mengklasifikasikan pola yang berbeda ke dalam kelompok yang disebut cluster. Analisis gen dengan menggunakan metode clustering dinilai lebih akurat dibandingkan analisis nukleotida menggunakan penyejajaran DNA. Hybrid clustering pada tesis ini mengkombinasikan algoritma fuzzy c-means dan algoritma divisive mampu meningkatkan keakurasian jika dibandingkan pendekatan pengelompokan partitional tradisional. Algoritma divisive akan dijalankan pada step kedua setelah hasil clustering yang diperoleh dari pengelompokan partisi fuzzy c-means.
Penentuan jumlah cluster terbaik ditentukan dari nilai Indeks Davies Bauldin yang paling minimum. Sebanyak 1252 barisan DNA HPV Human papillomavirus diperoleh dari Genbank NCBI dengan proses melakukan ekstraksi ciri DNA, selanjutnya dilakukan normalisasi. Proses ekstraksi ciri, normalisasi, dan penerapan algoritma partisi fuzzy c-means dan divisive dalam metode hybrid clustering menggunakan bantuan program open source.
Pada hasil hybrid clustering level awal diperoleh jumlah cluster optimum sebanyak 3 cluster dengan nilai Indeks Davies Bouldin paling minimum adalah 0.9715919. Pada level ke-2 clustering didapatkan cluster ke-1 terbagi atas 9 sub cluster dengan nilai IDB minimum adalah 0.8909797. Cluster ke-2 terbagi atas 2 sub cluster dengan nilai IDB minimum adalah 0.7650508. Cluster 3 terbagi atas 2 sub cluster dengan nilai IDB minimum adalah 0.9112528. Nilai IDB pada level kedua selalu lebih kecil dibanding nilai IDB pada level 1. Hal ini mengindikasikan bahwa hybrid clustering memberikan hasil yang lebih baik terhadap hasil clustering.

Clustering aims to classify the different patterns into groups called clusters. Analysis gene by using clustering method is considered more accurate than analysis of nucleotide using DNA alignment. In this thesis, hybrid clustering algorithm which combines fuzzy c means and algorithm divisive will be improve accuracy when compared to partitional clustering. Divisive algorithms will applied on second level after clustering partition using fuzzy c means.
To find the best number of clusters is determined using the minimum value of Davies Bouldin Index DBI of the cluster results. The data is 1252 sequences of HPV DNA sequences obtained from Gen Bank Database in the National Centre for Biotechnology Information NCBI at http www.ncbi.nlm.nih.gov in FASTA format. The data is converted into numerical form through feature extraction using n mers frequency.
The results on first level hybrid clustering obtained the optimum cluster divided into three clusters with the value of the minimum Davies Bouldin Index is 0.9715919. Morever, DBI values after implementing the second step of clustering are always producing smaller IDB values compare to the results of using first step clustering only. This condition indicates that the hybrid approach in this study produce better performance of the cluster results, in term its DBI values.
"
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2017
T47171
UI - Tesis Membership  Universitas Indonesia Library
cover
Muhammad Fauzan Akbar Masyhudi
"ABSTRAK
Algoritma Markov Clustering adalah algoritma pengelompokan yang banyak digunakan pada bidang bioinformatik. Operasi utama pada algoritma ini adalah operasi ekspansi. Pada operasi ekspansi dilakukan perkalian dua buah matriks. Karena data pada bidang bioinformatik umumnya berukuran sangat besar dan memiliki tingkat sparsity yang sangat tinggi, diperlukan metode untuk menghemat penggunaan memori dan mempercepat proses komputasi. Sementara itu, Graphics Processing Unit (GPU) berkembang menjadi suatu platform komputasi paralel dengan performa yang lebih baik dari pada Central Processing Unit (CPU). Pada skripsi ini data yang diproses disimpan dalam bentuk sparse matriks ELL-R dan perkalian matriks yang dilakukan menggunakan Sparse Matrix Matrix Product (SpMM) ELL-R. SpMM ELL-R dibuat dengan melakukan Sparse Matrix Vector Product (SpMV) ELL-R beberapa kali. Algoritma MCL yang dibuat menggunakan komputasi paralel dengan GPU.

ABSTRACT
Markov Clustering Algorithm is a clustering algorithm that used often in bioinformatics. The main operation of this algorithm is expand operation. The multiplication of two matrix was done in expand operation. Because data processed in bioinformatics usually have a vast amount of information and have high sparsity, a method to save memory usage and make the computating process faster is needed. Meanwhile, Graphics Processing Unit (GPU) developed into a parallel computing platform with better performance compared to Central Processing Unit (CPU). In this skripsi, processed data stored using ELL-R sparse matrix and matrix multiplication done using Sparse Matrix Matrix Product (SpMM) ELL-R. SpMM ELL-R made by doing Sparse Matrix Vector Product (SpMV) ELL-R several times. MCL Algorithm made using parallel computing with GPU."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2012
S43685
UI - Skripsi Open  Universitas Indonesia Library
cover
Erica
"Diversifikasi portofolio telah dijadikan solusi dalam memitigasi risiko dalam berinvestasi. Tujuan utama diversifikasi portofolio adalah untuk mengurangi variansi return dibandingkan dengan investasi pada satu saham tertentu. Metode Clustering, misalnya Agglomerative Clustering, digunakan untuk mengelompokkan saham-saham ke dalam masing-masing klaster yang homogen berdasarkan risiko. Klaster-klaster yang terbentuk kemudian akan digunakan sebagai acuan diversifikasi portofolio. Objek yang digunakan dalam metode clustering adalah 7 skor rasio finansial PER, EPS, PEG, DER, ROE, Current Ratio dan Profit Margin dari setiap saham. Selanjutnya, proporsi dari setiap saham pembentuk portofolio ditentukan melalui aplikasi Genetic Algorithm ke masing-masing klaster.
Pada penelitian ini, metode Genetic Algorithm dibangun berdasarkan model MVCCPO sehingga membentuk metode Genetic Algorithm Constrained. Performa dari Agglomerative Clustering Genetic Algorithm Constrained yang dievaluasi menggunakan data aktual, menghasilkan portofolio yang mampu mengalahkan return portofolio pasar dan memiliki rata-rata return yang lebih besar dibandingkan dengan portofolio yang dikonstruksi dengan metode Genetic Algorithm saja. Namun, dengan hubungan linear antara risiko dan return, adalah masuk akal bahwa portofolio dengan return yang lebih besar akan memiliki risiko yang lebih besar pula.

The purpose of portfolio diversification is to reduce the return rsquo s variance risk compared with a single stock investment or undiversified portfolio. The primary motivation of this research is to investigate the portfolio selection strategies through clustering and genetic algorithm. Clustering serves as a method to cluster assets with similar financial ratio scores the scores of EPS, PER, PEG, ROE, DER, Current Ratio and Profit Margin. By clustering method such as Agglomerative Clustering, stocks with similar risk profile are clustered together and the clusters produced can be used in diversifying portfolio. Genetic Algorithm will then be applied to each resulting cluster to obtain the optimal proportion of each stock in the portfolio.
The Genetic Algorithm used in this study is built from the MVCCPO model hence making it a Constrained Genetic Algorithm. The performance of Constrained Genetic Algorithm refined with Agglomerative Clustering in portfolio optimization, evaluated based on some actual datasets, gives a portfolio that beats the market and has bigger expected return than a portfolio constructed with only Genetic Algorithm. Due to the direct relationship of risk and return, it is logical to expect portfolio with a bigger return would have a bigger risk.
"
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2017
S-Pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Thia Sabel Permata
"Pembentukan dan perkembangbiakan sel tumor terjadi jika protein khusus yang mengatur pembelahan sel mengalami perubahan fungsi, ekspresi gen atau hilang keduanya. Salah satu protein penekan tumor yang berperan dalam pengendalian siklus sel adalah protein TP53. Pada sebagian besar perubahan genetik dalam tumor, baik delesi atau mutasi pada lebih dari 50% kanker pada manusia, ditemukan mutan TP53 yang merupakan faktor beresiko tinggi terhadap kanker. Oleh karena itu, penting untuk melakukan studi tentang pengelompokan interaksi protein-protein TP53. Interaksi protein secara umum disajikan dalam jaringan graf (graph network) dengan protein sebagai simpul dan interaksinya sebagai busur. Algoritma Markov Clustering (MCL) adalah satu metode graph clustering yang dibuat berdasarkan simulasi dari flow stokastik pada suatu graf. Dalam skripsi ini, dibahas mengenai implementasi algoritma MCL pada data interaksi protein-protein TP53 dengan menggunakan bahasa pemrograman Python. Algoritma MCL terdiri dari tiga operasi utama yaitu ekspansi, penggelembungan, dan pemotongan. Selanjutnya, dilakukan analisis hasil clustering dari simulasi algoritma MCL dengan menggunakan parameter ekspansi, penggelembungan dan faktor pengali yang berbeda-beda. Berdasarkan analisis hasil clustering yang dilakukan, algoritma MCL terbukti menghasilkan robust cluster dengan protein TP53 sebagai pusat cluster untuk setiap hasil clustering.

The formation and proliferation of tumor cells occurs if a special protein that regulates cell division changing the function, gene expression or lost both. One of the tumor suppressor protein that plays a role in controlling the cell cycle is the TP53 protein. In most of the genetic changes in the tumor, either deletions or mutations in more than 50% of human cancers, it found that mutant of TP53 is a high risk factor for cancer. Therefore, it is important to conduct studies on protein-protein interactions clustering of TP53. Protein interactions are generally presented in the graph network with proteins as nodes and interactions as edges. Markov Clustering (MCL) algorithm is a graph clustering method which is based on a simulation of stochastic flow on a graph. This minithesis discussed about the implementation of the MCL process on protein-protein interaction of TP53 data using the Python programming language. MCL algorithm consists of three main operations: expansion, inflation, and prune. Furthermore, the clustering simulation is using the different parameter of expansion, inflation and the multiplier factor. Based on the analysis of the clustering results, MCL algorithm is proven to produce robust cluster with TP53 protein as a centroid for each clustering results."
Depok: Universitas Indonesia, 2016
S62721
UI - Skripsi Membership  Universitas Indonesia Library
cover
Fahrezal Zubedi
"Pada penelitian ini mengimplementasikan algoritma Similarity Based Biclustering dengan menggunakan PAM clustering pada tiga dataset ekspresi gen microarray. Penelitian ini bertujuan untuk mengetahui ekspresi regulasi dari masing-masing bicluster yang diperoleh dan mengetahui kinerja algoritma Similarity Based Biclustering-PAM clustering berdasarkan hasil analisis kelompok kondisi. Similarity based biclustering-PAM clustering secara teoritis terdiri dari empat tahap utama yaitu: mentransformasi data, membangun matriks similaritas, proses clustering khususnya dalam tesis ini menggunakan metode partisi PAM dan mengekstrak bicluster. Algoritma similarity based biclustering-PAM clustering dapat mengetahui ekspresi regulasi dari tiap bicluster pada tiga dataset yaitu: Diabetes Melitus tipe II, Diabetes Retinopati, dan Limfoma. Akurasi yang diperoleh dari algoritma Similarity Based Biclustering untuk masing-masing dataset yaitu Diabetes Melitus tipe II sebesar 0.55, Diabetes Retinopati sebesar 0.80 dan Limfoma sebesar 0.83.

In this research implements Similarity Based Biclustering algorithm by using PAM Clustering method in three dataset of microarray gene expression. Aim of this research is to know the regulated expression of each obtained bicluster and to know the performance of Similarity Based Biclustering PAM Clustering algorithm based on the result of group condition analysis. Similarity Based Biclustering is theoretically composed of four main stages transforming data, constructing matrix similarity, clustering process, especially in this thesis using PAM partition algorithm and extracting bicluster. Similarity Based Biclustering PAM is able to know the regulatory expression of each bicluster in three datasets Diabetes Mellitus type 2, Diabetes Retinopathy, and Lymphoma. Accuracy obtained from Similarity Based Biclustering algorithm for each dataset is 0.55 in data of type 2 diabetes mellitus, 0.80 in diabetic retinopathy data and 0.83 in lymphoma data.
"
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2018
T49505
UI - Tesis Membership  Universitas Indonesia Library
cover
Frisca
"Spectral clustering adalah salah satu algoritma clustering modern yang paling terkenal. Sebagai teknik clustering yang efektif, metode spectral clustering muncul dari konsep teori graf spektral. Metode spectral clustering membutuhkan algoritma partisi. Ada beberapa metode partisi termasuk PAM, SOM, Fuzzy c-means, dan k-means. Berdasarkan penelitian yang telah dilakukan oleh Capital dan Choudhury pada 2013, ketika menggunakan Euclidian distance, k-means memberikan akurasi yang lebih baik dibandingkan dengan algoritma PAM. sehingga, makalah ini menggunakan algoritma k-means. Keuntungan utama dari spectral clustering adalah mengurangi dimensi data, terutama dalam hal ini untuk mengurangi dimensi yang besar dari data microarray.
Microarray data adalah chip berukuran kecil yang terbuat dari slide kaca yang berisi ribuan bahkan puluhan ribu jenis gen dalam fragmen DNA yang berasal dari cDNA. Aplikasi data microarray secara luas digunakan untuk mendeteksi kanker, misalnya adalah karsinoma, di mana sel-sel kanker mengekspresikan kelainan pada gen-nya. Proses spectral clustering dimulai dengan pengumpulan data microarray gen karsinoma, preprocessing, menghitung similaritas, menghitung , menghitung nilai eigen dari , membentuk matriks , dan clustering dengan menggunakan k-means. Dari hasil pengelompokan gen karsinoma pada penelitian ini diperoleh dua kelompok dengan nilai rata-rata Silhouette maksimal adalah 0.6336247. Proses clustering pada penelitian ini menggunakan program open source R.

Spectral clustering is one of the most famous modern clustering algorithms. As an effective clustering technique, spectral clustering method emerged from the concepts of spectral graph theory. Spectral clustering method needs partitioning algorithm. There are some partitioning methods including PAM, SOM, Fuzzy c means, and k means. Based on the research that has been done by Capital and Choudhury in 2013, when using Euclidian distance k means algorithm provide better accuracy than PAM algorithm. So in this paper we use k means as our partition algorithm. The major advantage of spectral clustering is in reducing data dimension, especially in this case to reduce the dimension of large microarray dataset.
Microarray data is a small sized chip made of a glass plate containing thousands and even tens of thousands kinds of genes in the DNA fragments derived from doubling cDNA. Application of microarray data is widely used to detect cancer, for the example is carcinoma, in which cancer cells express the abnormalities in his genes. The spectral clustering process is started with collecting microarray data of carcinoma genes, preprocessing, compute similarity matrix, compute , compute eigen value of , compute , clustering using k means algorithm. In this research, Carcinoma microarray data using 7457 genes. The result of partitioning using k means algorithm is two clusters clusters with maximum Silhouette value 0.6336247.
"
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2017
T47117
UI - Tesis Membership  Universitas Indonesia Library
cover
Rizky Ginanjar
"ABSTRAK
Skizofrenia telah diderita oleh lebih dari 21 juta orang di seluruh dunia. Masalah
genetik dan lingkungan menjadi salah satu faktor yang berkontribusi dalam
perkembangan penyakit ini. Beberapa penelitian menunjukkan beberapa gen yang
berhubungan dapat meningkatkan risiko penyakit ini. Gen-gen kandidat yang
diperoleh dari beberapa penelitian ternyata membentuk sebuah jaringan besar pada
interaksi tingkat proteinnya. Oleh karena itu, perlu dilakukan studi terhadap
jaringan interaksi protein dari gen kandidat. Algoritma Regularized Markov
Clustering (RMCL) adalah salah satu metode graph clustering yang merupakan
pengembangan dari algoritma Markov Clustering (MCL). Dalam skripsi ini,
dibahas mengenai implementasi algoritma RMCL pada data jaringan interaksi
protein gen-gen kandidat faktor risiko skizofrenia yang dibangun menggunakan
bahasa pemrograman R. Simulasi algoritma RMCL dilakukan dengan parameter
penggelembungan berbeda-beda. Kemudian, hasil simulasi algoritma RMCL
dibandingkan dengan hasil simulasi algoritma MCL dengan parameter yang sama.
Algoritma RMCL memberikan hasil dalam bentuk overlapping cluster, hal ini
menunjukkan keterikatan antar cluster yang terbentuk. Sehingga, berdasarkan
hasil simulasi algoritma RMCL, terdapat hubungan antar cluster protein dari
beberapa gen kandidat, salah satunya adalah hubungan gen NRG1 dan CACNG2.

ABSTRACT
Schizophrenia has been suffered by over 21 million people worldwide. Genetic
and environmental issues are one of the contributing factors in the development of
this disease. Some research suggests that several related genes may increase the
risk of this disease. Candidate genes that obtained from several research turns up a
large network of protein-protein interaction. Therefore, it is necessary to study the
protein-protein interaction network of the candidate gene. Regularized Markov
Clustering Algorithm (RMCL) is a graph clustering method which is the
development of Markov Clustering Algorithm (MCL). This minithesis discussed
about implementation of the RMCL algorithm on protein-protein interaction
networks on schizophrenia?s risk factors candidate genes data that is built using a
programming language R. RMCL algorithm simulation performed with different
inflation parameters. Then, the results of the RMCL algorithm simulation
compared with MCL algorithm simulation with the same parameters. RMCL
algorithm provides results in the form of overlapping clusters, which mean there
are relation between clusters. Thus, based on the results of RMCL algorithm
simulation, there are relation between protein clusters of several candidate genes,
one of which is the relationship of gene NRG1 and CACNG2."
2016
S63944
UI - Skripsi Membership  Universitas Indonesia Library
cover
Ghefira Nur Fatimah Widyasari
"Penyakit kardiovaskular merupakan penyebab utama kematian global, termasuk di Indonesia. Evaluasi kesehatan dini, menggunakan heart rate variability (HRV) melalui pengukuran root mean square of successive RR interval differences (RMSSD) dan percentage of successive RR intervals that differ by more than 50 𝑚𝑠 (pNN50), menjadi penting untuk merefleksikan respons relaksasi, stres, kualitas tidur, dan aktivitas fisik. Evaluasi ini sebaiknya dilakukan saat seseorang masih dalam kondisi sehat. Sejalan dengan itu, penelitian ini bertujuan mengevaluasi kesehatan pasien dengan irama jantung normal melalui metode clustering pada variabel RMSSD, pNN50, dan usia, yang diambil dari rekaman elektrokardiogram milik online database Physionet. Setiap cluster yang terbentuk dapat memberikan informasi unik, memungkinkan penentuan risiko penyakit kardiovaskular serta penanganan yang tepat. Namun, karena pola data yang digunakan tidak jelas, mengandung outlier, dan berdimensi rendah, maka dilakukan perbandingan antara metode Hierarchical clustering dan Gaussian Mixture Models (GMM) clustering yang mampu mengatasi hal tersebut. Mengingat GMM clustering yang sangat sensitif terhadap inisialisasi awal, penelitian ini menggunakan dua pendekatan inisialisasi, yaitu acak dan K-Means. Penentuan metode terbaik dilakukan dengan mempertimbangkan metrik evaluasi (efektivitas) dan waktu komputasi metode (efisiensi). Hasil penelitian menunjukkan bahwa GMM clustering dengan inisialisasi K-Means adalah metode terbaik dengan membentuk tiga cluster. Meskipun alat EKG menilai pasien dalam kondisi sehat, namun analisis clustering dapat mengungkapkan informasi penting, terutama bagi pasien yang teridentifikasi memiliki tingkat HRV yang relatif rendah.

Cardiovascular diseases are a leading cause of global mortality, including in Indonesia. Early health evaluation, utilizing heart rate variability (HRV) through root mean square of successive RR interval differences (RMSSD) and percentage of successive RR intervals that differ by more than 50 𝑚𝑠 (pNN50) measurements, is crucial to reflect responses to relaxation, stress, sleep quality, and physical activity. This evaluation is ideally conducted while an individual is still in a healthy condition. In line with that, this research aims to evaluate the health of patients with a normal sinus rhythm through clustering methods on variables like RMSSD, pNN50, and age, extracted from electrocardiogram recordings from the online Physionet database. Each cluster can provide unique information, enabling the identification of cardiovascular disease risks and appropriate interventions. However, due to unclear data patterns, the presence of outliers, and is low-dimensiona, a comparison is made between Hierarchical clustering and GMM methods, capable of addressing these issues. Given GMM clustering's sensitivity to initializations, this study employs two approaches, random and K-Means. The determination of the best method is based on considerations of evaluation metrics (effectiveness) and computational time (efficiency). Research results indicate that GMM clustering with K-Means initialization is the most effective and efficient method, forming three clusters. Despite ECG assessments indicating healthy conditions, clustering analysis can reveal crucial information, especially for patients identified with relatively low HRV levels."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2024
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
<<   1 2 3 4 5 6 7 8 9 10   >>