Hasil Pencarian  ::  Simpan CSV :: Kembali

Hasil Pencarian

Ditemukan 23521 dokumen yang sesuai dengan query
cover
Azkal Azkiya
"Coronavirus disease (COVID-19) adalah penyakit pernapasan menular yang disebabkan oleh jenis coronavirus baru. Penyakit ini sebelumnya disebut dengan 2019-nCoV atau 2019 novel coronavirus. Virus penyebab COVID-19 ini adalah SARS-CoV-2. Terdapat varian SARS-CoV-2 lain yang memiliki potensi berdampak besar bagi kesehatan masyarakat seperti Lambda dan Mu. Ada pula kelompok varian SARS-CoV-2 under monitoring yang belum diketahui dampak dan bentuk penyebarannya di tingkat masyarakat. Kappa, Iota, dan Epsilon merupakan beberapa contoh varian yang termasuk ke dalam kelompok tersebut. World Health Organization (WHO) terus melakukan pengawasan kemunculan varian SARS-CoV-2 yang baru. Varian SARS-CoV-2 yang telah diketahui penularan dan dampaknya cukup signifikan pada masyarakat hingga saat ini adalah Alpha, Beta, Delta, Gamma, dan Omicron. Penelitian ini menggunakan data dari kelima varian SARS-CoV-2 tersebut. Penelitian ini mengimplementasikan program unsupervised dari machine learning yaitu simulasi proses clustering untuk mengelompokkan varian SARS-CoV-2. Dilakukan ekstraksi fitur terhadap data sekuens protein SARS-CoV-2 menggunakan package discere dalam bahasa pemrograman Python. Melalui proses ekstraksi fitur dihasilkan 27 fitur data sekuens protein SARS-CoV-2 yang siap digunakan. Elbow method kemudian diimplementasikan terhadap data untuk mengetahui jumlah pembentukan cluster yang optimal untuk digunakan pada clustering. Berdasarkan elbow method didapatkan jumlah cluster optimal untuk simulasi clustering sebanyak  dan dilakukan juga simulasi dengan  untuk memberi kesempatan kepada seluruh varian untuk membentuk clusternya sendiri.  Metode clustering yang digunakan pada penelitian ini adalah spectral clustering. Cluster yang dihasilkan kemudian dievaluasi menggunakan metrik evaluasi silhouette score serta melihat runtime pada setiap simulasi yang dilakukan. Hasil silhouette score untuk simulasi dengan  bernilai 0,614 dan untuk simulasi dengan  yang bernilai 0,631. Durasi rata-rata runtime mencatat bahwa simulasi dengan  dengan 6,566 detik lebih baik dibanding simulasi dengan  dengan 7,529 detik. Berdasarkan hasil tersebut, spectral clustering dapat dilakukan terhadap varian SARS-CoV-2 dengan pemilihan jumlah cluster  menggunakan elbow method.

Coronavirus disease (COVID-19) is an infectious respiratory disease caused by a new type of coronavirus. This disease was previously called 2019-nCoV or 2019 novel coronavirus. The virus that causes COVID-19 is the SARS-CoV-2. There are several variants of SARS-CoV-2 that have the potential to have a major impact on public health, such as Lambda and Mu. There is also a group of variants of SARS-CoV-2 under monitoring whose impact and form of spread are unknown at the community level. Kappa, Iota, and Epsilon are some examples of variants that belong to this group. The World Health Organization (WHO) continues to monitor the emergence of a new variant of SARS-CoV-2. The variants of SARS-CoV-2 that are known to transmit and have a significant impact on society so far are Alpha, Beta, Delta, Gamma and Omicron. This study uses data from that five variants of SARS-CoV-2. This study implements an unsupervised program from machine learning, which is a simulation of the clustering process to group variants of SARS-CoV-2 . Feature extraction was carried out on the SARS-CoV-2 protein sequence data using discere package in the Python programming language. Through the feature extraction process, 27 features of the SARS-CoV-2 protein sequence data were produced which were ready for use. The elbow method is then implemented on the data to find out the optimal number of cluster formations for use in clustering. Based on the elbow method, the optimal number of clusters for the clustering simulation is  and a simulation with  is also carried out to provide an opportunity for all variants to form their own clusters. The clustering method used in this study is spectral clustering. The resulting clusters are then evaluated using the silhouette score evaluation metric and looking at the runtime in each simulation that is performed. The results of the silhouette score for the simulation with  is worth 0.614 and for the simulation with  it is worth 0.631. The average duration of the runtime noted that the simulation with  with 6.566 seconds was better than the simulation with  with 7.529 seconds. Based on these results, spectral clustering can be carried out on the SARS-CoV-2 variant by selecting the number of  clusters using the elbow method.
"
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2023
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Situmeang, Jason Nimrod Joshua
"

Penelitian ini bertujuan untuk melakukan pengelompokan varian virus SARS-CoV-2 melalui proses clustering menggunakan metode unsupervised learning. Data yang digunakan adalah sekuens protein SARS-CoV-2 yang diekstraksi fiturnya menggunakan paket Discere dalam bahasa pemrograman Python. Sebanyak 27 fitur dihasilkan dan diseleksi dengan metode seleksi fitur Least Absolute Shrinkage and Selection Operator (LASSO). Metode Elbow digunakan untuk menentukan jumlah cluster yang optimal. Dalam penelitian ini, digunakan metode clustering K-Means dan Balanced Iterative Reducing and Clustering using Hierarchies (BIRCH). Evaluasi hasil clustering dilakukan menggunakan metrik evaluasi Silhouette Score dan Davies-Bouldin Index, serta memperhatikan waktu runtime untuk setiap simulasi. Hasil evaluasi kemudian dibandingkan untuk melihat perbedaan performa antara kedua metode clustering yang digunakan, serta pengaruh seleksi fitur terhadap performa clustering. Hasil terbaik diperoleh pada simulasi dengan metode clustering BIRCH + LASSO, dengan nilai Silhouette Score 0,74186 untuk jumlah cluster k=4 dan 0,73207 untuk k=5. Nilai Davies-Bouldin Index terbaik juga diperoleh pada simulasi tersebut, yaitu 0,42697 untuk k=4 dan 0,37949 untuk k=5. Waktu runtime terbaik tercatat pada simulasi dengan metode K-Means + LASSO, yaitu 0,21551 detik untuk k=4 dan 0,17539 detik untuk k=5. Dapat disimpulkan bahwa metode BIRCH menghasilkan cluster yang lebih baik berdasarkan metrik evaluasi, namun K-Means memberikan proses clustering yang lebih cepat. Seleksi fitur dengan metode LASSO juga membantu meningkatkan performa clustering.


This study aims to perform clustering of SARS-CoV-2 virus variants using unsupervised learning methods. The data used consists of SARS-CoV-2 protein sequences whose features are extracted using the Discere package in the Python programming language. A total of 27 features are generated and selected using the Least Absolute Shrinkage and Selection Operator (LASSO) feature selection method. The Elbow method is employed to determine the optimal number of clusters for the clustering process. The clustering methods used in this research are K-Means clustering and Balanced Iterative Reducing and Clustering using Hierarchies (BIRCH). The clustering results are evaluated using the Silhouette Score and Davies-Bouldin Index metrics, while also considering the runtime for each simulation. The evaluation results are then compared to examine the performance differences between the two clustering methods and the impact of feature selection on clustering performance. The best Silhouette Score is obtained in the simulation using the BIRCH + LASSO clustering method, with a value of 0.74186 for k=4 and 0.73207 for k=5. The best Davies-Bouldin Index is also achieved in the same simulation, with values of 0.42697 for k=4 and 0.37949 for k=5. The fastest runtime is recorded in the simulation using the K-Means + LASSO method, with a time of 0.21551 seconds for k=4 and 0.17539 seconds for k=5. In conclusion, the BIRCH method yields better clustering results based on the evaluation metrics, while K-Means provides faster clustering processes. The LASSO feature selection method also aids in improving clustering performance.

"
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2022
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Devia Puspita Natalicka
"Salah satu terapi COVID-19 adalah plasma konvalesen yang disiapkan Unit Transfusi Darah dari donor yang telah sembuh dari COVID-19. Plasma konvalesen mengandung antibodi netralisasi yang menghambat interaksi antara protein S dengan reseptor ACE2 dengan persyaratan minimal titer 1:160 sehingga diperlukan sistem deteksi antibodi netralisasi seperti tes serologi berbasis ELISA kompetitif yang mudah, murah, cepat dan tidak membutuhkan BSL 3 atau 2. Uji ini membutuhkan protein rekombinan spike S1 yang dapat diekspresikan pada sistem ekspresi mamalia. Penelitian ini bertujuan untuk mendeteksi antibodi spesifik SARS-CoV-2 pada plasma konvalesen COVID-19 menggunakan protein rekombinan Spike S1.Penelitian ini menggunakan plasmid pD609 sebagai vektor ekspresi yang terdapat gen spike S1. DNA ditransfeksi secara transien ke sel CHO. Immunostaining dilakukan setelah transfeksi untuk melihat ekspresi protein rekombinan spike S1 pada sel CHO. Supernatan media sel CHO post transfeksi dianalisis dengan western blot dan ELISA untuk melihat reaktifitas terhadap serum konvalesen COVID-19. Hasil immunostaining menunjukkan plasmid pD609 S1 Spike Foldon-His dapat mengekspresikan protein rekombinan spike S1 SARS-CoV-2 pada sel CHO. Hasil Western Blot dan ELISA menunjukkan supernatan media sel kultur CHO post transfeksi reaktif terhadap serum konvalesen COVID-19. Protein rekombinan spike S1 memiliki potensi untuk dikembangkan dan digunakan dalam uji antibodi spesifik namun hasil ekspresi protein masih rendah.

One of the therapies for COVID-19 is convalescent plasma prepared by the Blood Transfusion Unit from donors who have recovered from COVID-19. Convalescent plasma contains neutralizing antibodies that inhibit the interaction between S protein and ACE2 receptors with a minimum requirement of a titer of 1:160 so that a neutalizing antibody detection system is needed such as a competitive ELISA-based serological test that is easy, inexpensive, fast, and does not require BSL 3 or 2. S1 spike recombinant protein that can be expressed in mammalian expression systems. This study aims to detect SARS-CoV-2 specific antibodies in COVID-19 convalescent plasma using recombinant Spike S1 protein. This study used the pD609 plasmid as an expression vector containing the spike S1 gene. DNA was transiently transfected into CHO cells. Immunostaining was performed after transfection to see the expression of the S1 spike recombinant protein in CHO cells. The post-transfected CHO cell media supernatans were analyzed by western blot and ELISA to see the reactivity to COVID19 convalescent serum. Immunostaining results showed that the plasmid pD609 S1 Spike Foldon-His could express the SARS-CoV-2 spike S1 recombinant protein in CHO cells. The results of Western blot and ELISA showed that the post-transfection CHO cell culture media supernatant was reactive to COVID-19 convalescent serum. S1 spike recombinant protein has the potential to be developed and used in specific antibody assays, but the results of protein expression is still low."
Jakarta: Fakultas Kedokteran Universitas Indonesia, 2022
T-pdf
UI - Tesis Membership  Universitas Indonesia Library
cover
Banjarnahor, Evander
"Berdasarkan data WHO pada pertengahan Juli 2021 lebih dari 185,2 juta orang di seluruh dunia terinfeksi virus corona atau Severe Acute Respiratory Syndrome Coronavirus 2 (SARS-CoV-2). Virus ini menyerang penapasan manusia yang dapat mengakibatkan infeksi paru-paru pada manusia dan bahkan dapat menyebabkan kematian. Tercatat bahwa lebih dari 4 juta orang di seluruh dunia meninggal akibat terinfeksi virus corona. Di Indonesia sendiri pada pertengahan Juli 2021 tercatat lebih dari 2,4 juta orang ternfeksi virus corona dan lebih dari 65,4 ribu orang meninggal akibat terinfeksi virus corona. Berdasarkan data tersebut, perlu dilakukan analisis kekerabatan virus SARS-CoV-2 untuk mengurangi penyebaran dan memberikan batasan sosial dari negara satu dengan negara lainnya. Identifikasi kekerabatan dari virus covid-19 dan penyebarannya dapat dilakukan dengan cara pembentukan pohon filogenetik dan clustering. Pada penelitian ini pohon filogenetik akan dibangun berdasarkan metode Hierarchical Clustering dengan menggunakan metode Multiple Encoding Vector dan K-Mer berdasarkan translasi DNA kodon menjadi asam amino. Jarak Euclidean akan digunakan untuk menentukan matriks jarak. Penelitian ini selanjutnya menggunakan metode K- Means Clustering untuk melihat penyebarannya, dimana nilai k ditentukan dari jumlah centroid yang dihasilkan dari metode Hierarchical Clustering. Penelitian ini mengambil sampel barisan DNA SARS-CoV-2 dari beberapa negara yang tertular. Dari hasil simulasi, nenek moyang SARS-CoV-2 berasal dari China. Hasil analisis juga menunjukkan bahwa leluhur covid-19 yang paling dekat dengan Indonesia berasal dari India, Australia dan Spanyol. Selain itu dari hasil simulasi dihasilkan bahwa barisan DNA SARS-CoV-2 terdiri dari 9 cluster dan cluster keenam adalah kelompok yang memiliki anggota paling banyak. Hasil analisis juga menunjukkan bahwa metode ini sangat opitimal dalam pengelompokan data dengan nilai 97.4%.

Based on WHO data in middle of July 2021, Coronavirus or Severe Acute Respiratory Syndrome Coronavirus 2 (SARS-CoV-2) is infecting more than 185.2 million people worldwide. The virus attacks human breathing, which can cause lung infections and can even cause death. More than 4 million people worldwide have died due to being infected with the coronavirus. In Indonesia alone, in mid-July 2021, there were more than 2.4 million people infected with the corona virus and more than 65.4 thousand people died from being infected with the corona virus. Based on those covid-19 survivor data, it is necessary to carry out a kinship analysis of the coronavirus to reduce its spreading. Identification of the kinship of the covid- 19 virus and its spread can be done by forming a phylogenetic tree and clustering. This study uses the Multiple Encoding Vector method and K-mer based on translation DNA codon to amino acid in analyzing sequences and Euclidean Distance to determine the distance matrix. This research will then use the Hierarchical Clustering method to determine the number of initial centroids and cluster, which will be used later by the K-Means Clustering method kinship in SARS-CoV-2 DNA sequence. This study took samples of DNA sequences of SARS-CoV-2 from several infected countries. From the simulation results, the ancestors of SARS-CoV-2 came from China. The results of the analysis also show that the closest ancestors of covid-19 to Indonesia came from India, Australia and Spain. In addition, the ancestors of SARS-CoV-2 came from China. The SARS- CoV-2 DNA sequence is also consisted of 9 clusters, and the sixth cluster is the group that has the most members. The results also show that this method is very optimal in a grouping of data with a value of 97.4%."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2021
T-pdf
UI - Tesis Membership  Universitas Indonesia Library
cover
Lista Kurniawati
"Pendeteksian topik merupakan masalah komputasi yang menganalisis kata-kata dari suatu data teks untuk menemukan topik yang ada di dalam teks tersebut. Pada data yang besar, pendeteksian topik lebih efektif dan efisien dilakukan dengan metode machine learning. Data teks harus diubah ke dalam bentuk representasi vektor numeriknya sebelum dimasukkan ke model machine learning. Metode representasi teks yang umum digunakan adalah TF-IDF. Namun, metode ini menghasilkan representasi data teks yang tidak memperhatikan konteksnya. BERT (Bidirectional Encoder Representation from Transformer) merupakan metode representasi teks yang memperhatikan konteks dari suatu kata dalam dokumen. Penelitian ini membandingkan kinerja model BERT dengan model TF-IDF dalam melakukan pendeteksian topik. Representasi data teks yang diperoleh kemudian dimasukkan ke model machine learning. Salah satu metode machine learning yang dapat digunakan untuk menyelesaikan masalah pendeteksian topik adalah clustering. Metode clustering yang populer digunakan adalah Fuzzy C-Means. Namun, metode Fuzzy C-Means tidak efektif pada data berdimensi tinggi. Karena data teks berita biasanya memiliki ukuran dimensi yang cukup tinggi, maka perlu dilakukan proses reduksi dimensi. Saat ini, terdapat metode clustering yang melakukan reduksi dimensi berbasis deep learning, yaitu Deep Embedded Clustering (DEC). Pada penelitan ini digunakan model DEC untuk melakukan pendeteksian topik. Eksperimen pendeteksian topik menggunakan model DEC (member) dengan metode representasi teks BERT pada data teks berita menunjukkan nilai coherence yang sedikit lebih baik dibandingkan dengan menggunakan metode representasi teks TF-IDF.

Topic detection is a computational problem that analyzes words of a textual data to find the topics in it. In large data, topic detection is more effective and efficient using machine learning methods. Textual data must be converted into its numerical vector representation before being entered into a machine learning model. The commonly used text representation method is TF-IDF. However, this method produces a representation of text data that does not consider the context. BERT (Bidirectional Encoder Representation from Transformers) is a text representation method that pays attention to the context of a word in a document. This study compares the performance of the BERT model with the TF-IDF model in detecting topics. The representation of the text data obtained is then entered into the machine learning model. One of the machine learning methods that can be used to solve topic detection problems is clustering. The popular clustering method used is Fuzzy CMeans. However, the Fuzzy C-Means method is not effective on high-dimensional data. Because news text data usually has a high dimension, it is necessary to carry out a dimension reduction process. Currently, there is a clustering method that performs deep learning-based dimension reduction, namely Deep Embedded Clustering (DEC). In this research, the DEC model is used to detect topics. The topic detection experiment using the DEC (member) model with the BERT text representation method on news text data shows a slightly better coherence value than using the TF-IDF text representation method.
"
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2022
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Raven Ginola Imanuel
"Mata merupakan salah satu dari panca indra yang digunakan untuk melihat dan menjadi aset terpenting dalam hidup manusia. Salah satu bagian terpenting dari mata ialah kelopak mata di mana terdapat sebuah kelenjar yang disebut kelenjar meibom. Kelenjar ini berada pada lapisan air mata yang berguna untuk menyekresikan komponen minyak atau lipid dan berperan penting dalam memperlambat proses evaporasi yang menyebabkan terjaganya kelembapan pada mata. Kekurangan kelenjar meibom yang dikenal sebagai Disfungsi Kelenjar Meibom (DKM) merupakan penyebab utama dari penyakit mata kering. Karena proses diagnosis yang dikerjakan oleh tenaga medis terbilang subjektif, maka penelitian ini menggunakan pendekatan deep learning untuk melakukan klasifikasi pada tingkat keparahan dari DKM. Klasifikasi dilakukan dengan membagi tingkat keparahan atau kehilangan kelenjar meibom berdasarkan hasil meiboscore-nya menjadi 4 kelas, yaitu kelas 0 untuk meiboscore ≤ 25%, kelas 1 untuk 25% < meiboscore ≤ 50%, kelas 2 untuk 50% < meiboscore ≤ 75%, dan kelas 3 untuk meiboscore  > 75%. Metode deep learning yang digunakan adalah Convolutional Neural Network (CNN) dengan arsitektur AlexNet. Data yang digunakan pada penelitian ini adalah 139 citra meibography yang bersumber dari Rumah Sakit Ciptomangunkusumo (RSCM) Departemen Kirana dari 35 pasien mata kering yang sudah mengalami augmentasi dan segmentasi, sehingga data akhir yang digunakan yaitu sebanyak 417 citra segmentasi. Pada tahap pre-processing, dilakukan perhitungan meiboscore dengan bantuan software dan membaginya ke dalam 4 kelas sesuai dengan nilai meiboscore­-nya. Citra yang sudah dilabel ini kemudian dibagi menjadi 80% data training dan 20% data testing. Dari 80% data training, diambil 10% untuk dijadikan data validation, sehingga 417 data tersebut terbagi menjadi 299 data training, 84 data testing, serta 34 data validation. Training model dilakukan menggunakan arsitekur AlexNet dengan hyperparameter berupa epoch sebanyak 100, batch size 32, dan learning rate 0,0001. Pada arsitektur ini juga diterapkan fungsi optimasi yaitu Adam (Adaptive moment estimation) dan fungsi loss categorical cross entropy. Proses modelling dilakukan sebanyak 5 kali percobaan dan memperoleh nilai rata-rata akurasi training dan validation sebesar 99,59% dan 99,41% dan nilai dari loss training dan loss validation sebesar 0,1259 dan 0,0524. Sedangkan rata-rata kinerja testing model berhasil memperoleh akurasi testing sebesar 87,38%; testing loss sebesar 0,5151; dan Area Under Curve (AUC) sebesar 0,9715.

The eye is one of the five senses used to see and is the most important asset in human life. One of the most important parts of the eye is the eyelid where there is a gland called meibomian gland. This gland is located in the tear film which is useful for secreting oil or lipid components and plays an important role in slowing down the evaporation process which leads to maintaining moisture in the eye. Meibomian gland deficiency, known as Meibomian Gland Dysfunction (MGD), is a major cause of dry eye disease. Since the diagnosis process carried out by medical personnel is subjective, this study uses a deep learning approach to classify the severity of MGD. Classification is done by dividing the severity or loss of meibomian glands based on meiboscore results into 4 classes, namely class 0 for meiboscore ≤ 25%, class 1 for 25% < meiboscore ≤ 50%, class 2 for 50% < meiboscore ≤ 75%, and class 3 for meiboscore > 75%. The deep learning method used is Convolutional Neural Network (CNN) with AlexNet architecture. The data used in this study are 139 meibography images sourced from Ciptomangunkusumo Hospital (RSCM) Kirana Department from 35 dry eye patients that have undergone augmentation and segmentation, so that the final data used is 417 segmentation images. In the pre-processing stage, meiboscore was calculated with the help of software and divided into 4 classes according to the meiboscore value. The labeled images were then divided into 80% training data and 20% testing data. From 80% of the training data, 10% is taken to be used as validation data, so that the 417 data is divided into 299 training data, 84 testing data, and 34 validation data. The training model is carried out using the AlexNet architecture with hyperparameters in the form of epochs of 100, batch size 32, and learning rate 0,0001. In this architecture, the optimization function Adam (Adaptive moment estimation) and categorical cross entropy loss function are also applied. The modeling process was carried out 5 times and obtained an average training and validation accuracy value of 99,59% and 99,41% and the value of training loss and validation loss of 0,1259 and 0,0524. While the average performance of the testing model successfully obtained a testing accuracy of 87,38%; testing loss of 0,5151; and Area Under Curve (AUC) of 0,9715.
"
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2023
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Evan Haryowidyatna
"Per 9 Februari 2023, 87% dari total populasi kendaraan pribadi di Indonesia merupakan sepeda motor. Persebaran sepeda motor terpadat di Indonesia berada di Pulau Jawa dengan persentase sebesar 60%. Tingginya populasi sepeda motor dan fakta bahwa 80% rumah tangga di Pulau Jawa sudah memiliki sepeda motor membuat pasar sepeda motor semakin mengecil. Dalam jangka panjang, kondisi ini dapat berdampak buruk bagi industri sepeda motor yang terus ingin berkembang. Penelitian ini membahas tentang pengelompokan kabupaten dan kota di Pulau Jawa berdasarkan karakteristik demografinya. Kemudian, diberikan saran keputusan yang dapat dilakukan oleh industri sepeda motor berdasarkan kelompok kabupaten dan kota yang terbentuk menggunakan teknik clustering. Hal ini bertujuan agar produsen yang bergerak di industri sepeda motor dapat memfokuskan produknya pada kelompok kabupaten dan kota yang memiliki potensi terbaik. Terdapat 12 variabel demografi yang digunakan dalam penelitian ini, dan variabel tersebut terbagi menjadi tiga kategori: kondisi ekonomi masyarakat, kondisi kehidupan masyarakat, dan kondisi demografis daerah. Metode yang digunakan dalam penelitian ini adalah metode partitional hard clustering. Sebelumnya, dilakukan pembuatan dataset melalui proses data scrapping pada situs terpercaya, dan dilanjutkan dengan proses Exploratory Data Analysis (EDA) pada dataset. Setelah dataset terbentuk, dilakukan pengelompokan dengan metode partitional hard clustering yang terdiri dari metode K-Means Clustering dan metode K-Medoids Clustering. Kemudian, dilakukan evaluasi cluster untuk menentukan metode clustering yang paling sesuai dengan menggunakan empat metrik evaluasi yaitu Indeks Silhouette, Indeks Dunn, Indeks Davies Bouldin, dan Indeks Calinski Harabasz. Didapatkan hasil bahwa metode K-Medoids Clustering dengan 5 kelompok merupakan yang terbaik untuk mengelompokkan kabupaten dan kota di Pulau Jawa. Setelah kelompok terbentuk, setiap kelompok diberikan rekomendasi keputusan yang sebaiknya diambil oleh industri sepeda motor. Terdapat 4 rekomendasi yang dapat diberikan, yaitu distribusi suku cadang, pembuatan bengkel, penjualan sepeda motor kelas menengah ke atas, dan penjualan sepeda motor kelas menengah ke bawah.

As of February 9, 2023, 87% of the total population of private vehicles in Indonesia consists of motorcycles. The densest distribution of motorcycles in Indonesia is found on the Island of Java, with a percentage of 60%. The high population of motorcycles and the fact that 80% of households in Java already have motorcycles are causing the motorcycle market to shrink. In the long run, this condition can have negative impacts on the motorcycle industry that continues to seek growth. This research focuses on the clustering of regencies and cities in Java based on their demographic characteristics. Subsequently, decision recommendations will be provided for the motorcycle industry based on the formed groups using clustering techniques. The aim is to enable manufacturers in the motorcycle industry to focus their products on regencies and cities with the best potential. There are 12 demographic variables used in this research, divided into three categories: the economic conditions of society, the living conditions of society, and the demographic conditions of the region. The method used in this research is the partitional hard clustering method. Firstly, a dataset is created through the data scraping process on trusted sites, followed by the Exploratory Data Analysis (EDA) process on the dataset. Once the dataset is formed, clustering is performed using the partitional hard clustering method, consisting of the K-Means Clustering and K-Medoids Clustering methods. Subsequently, cluster evaluation is carried out to determine the most suitable clustering method using four evaluation metrics: Silhouette Index, Dunn Index, Davies Bouldin Index, and Calinski Harabasz Index. The results show that the K-Medoids Clustering method with 5 clusters is the best for grouping regencies and cities in Java. After the groups are formed, each group is given decision recommendations that the motorcycle industry should consider. There are four recommendations: spare parts distribution, workshop establishment, sales of mid- to high-end motorcycles, and sales of mid-range motorcycles and below."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2023
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Ida Mujtahidah
"ABSTRAK
Protein memiliki peranan penting dalam mengontrol fungsi enzim, mengatur produksi dan aktivitas di dalam sel. Untuk melakukan hal ini, protein berinteraksi dengan protein-protein lainnya, DNA dan molekul-molekul lainnya. Jaringan interaksi protein-protein ini memiliki ukuran yang sangat besar. Sehingga untuk memudahkan dalam menganalisis jaringan ini diperlukan metode clustering. Pada penelitian ini, algoritma Markov clustering digabungkan dengan algoritma firefly yang disebut sebagai algoritma firefly-Markov clustering FMCL . Pada algoritma FMCL, posisi kunang-kunang akan menggantikan nilai parameter inflate. Kemudian proses clustering akan berlangsung menggunakan algoritma Markov clustering MCL . Selanjutnya posisi kunang-kunang akan terus diperbarui dan proses clustering akan terus dilakukan sampai diperoleh hasil clustering terbaik. Komputasi paralel pada algoritma FMCL menggunakan OpenMP. Setiap thread menjalankan proses pada Markov clustering menggunakan parameter inflate yang ditentukan oleh posisi kunang-kunangnya. Hasil yang diperoleh pada data jaringan interaksi protein HIV ada 4 cluster. Dari 4 cluster ini terdapat satu cluster besar yang saling terhubung dengan 6 pusat cluster lainnya yaitu NEF, GAG, GAG-POL, VPR, VIF dan VPU. Pada 3 cluster lainnya yang menjadi pusat cluster adalah TAT, REV dan ENV. Sedangkan dengan menggunakan data jaringan interaksi protein pada Human Herpesvirus tipe 4 HHV-4 diperoleh 14 cluster. Protein yang menjadi pusat cluster adalah EBNA-LP, BKRF1, BPLF1, LMP1, SUMO2, BBLF2-BBLF3, EBNA3B, BRLF1, BGLF4, BYRF1. Selain itu, juga dapat dilihat bahwa ada beberapa cluster yang hanya merupakan interaksi antara dua protein yaitu BBRF1 dengan NFKB2, EBNA3A dengan CHEK2, LMP2A dengan ITCH, dan EBNA3C dengan EP300. Speed up algoritma FMCL yang dijalankan menggunakan OpenMP pada data HIV dan HHV-4 adalah 4.73x dan 3.21x lebih cepat dibandingkan dengan algoritma FMCL yang dijalankan secara sekuensial.

ABSTRACT
Protein plays an important role in controlling enzyme function, regulating production and activity in cell. To do this function, proteins will interact with other protein, DNA and other molecules. Protein interaction network have a very large size. Then to simplify analyzing this network is required clustering method. In this study, Markov clustering algorithm combined with a firefly algorithm called firefly Markov clustering algorithm FMCL . In FMCL algorithm, firefly position will be replace the value of inflate parameter. Then clustering process will take place using Markov clustering algorithm MCL . Futhermore, the firefly position will be updated and clustering process will be continue until its get the best clustering. Parallel computing on FMCL algorithm using OpenMP. Each thread will run the process on Markov clustering by using inflate parameter specified by the position of firefly. The clustering result from protein interaction network on HIV is 4 clusters. From this cluster, there is a large cluster connected with 6 other cluster centers, they are NEF, GAG, GAG POL, VPR, VIF and VPU. In the 3 other clusters that become the center of the cluster are TAT, REV and ENV. While by using protein interaction network on HHV 4 obtained 14 clusters. The proteins that become the center of the clusters are EBNA LP, BKRF1, BPLF1, LMP1, SUMO2, BBLF2 BBLF3, EBNA3B, BRLF1, BGLF4 and BYRF1. In addition, it can be seen that there are several clusters that are just interaction between two proteins, BBRF1 with NFKB2, EBNA3A with CHECK2, LMP2A with ITCH and EBNA3C with EP300. The speed up of FMCL algorithm by using OpenMP HIV and HHV 4 data is 4.73x and 3.21x faster than the sequentially executed."
2018
T49526
UI - Tesis Membership  Universitas Indonesia Library
cover
Vira Yustia Nurazmi
"ABSTRAK
Algoritma Regularized Markov Clustering RMCL adalah suatu metode graf clustering yang merupakan pengembangan dari Markov Clustering MCL . Algoritma RMCL masih memiliki kelemahan pada parameter penggelembungan yang biasanya selalu diinputkan oleh pengguna untuk mendapatkan hasil clustering yang baik. Pada penelitian ini, RMCL digabungkan dengan algoritma Firefly untuk menganalisis jaringan interaksi protein yang disebut algoritma Firefly Regularized Markov Clustering FRMCL . Algoritma Firefly merupakan algoritma yang terinspirasi dari perilaku kunang-kunang dalam mencari koloninya. Implementasi algoritma FRMCL dilakukan pada data jaringan interaksi protein HIV-1 dan Human Herpesvirus 1. Data yang digunakan direpresentasikan ke dalam sebuah graf tak-berarah . Selanjutnya, posisi kunang-kunang pada algoritma firefly akan berperan sebagai parameter penggelembungan. Setiap firefly akan melakukan proses RMCL, sehingga diperoleh beberapa hasil RMCL dengan parameter berbeda. Setiap proses RMCL memberikan nilai global chaos, yang dipilih adalah global chaos minimum yang akan dijadikan best firefly, kemudian akan dilakukan proses perhitungan kembali. Posisi firefly baru ini selanjutnya bertindak sebagai parameter penggelembungan yang baru dan dilakukan proses FRMCL berlanjut hingga diperoleh cluster terbaik. Komputasi paralel akan digunakan saat setiap firefly menjalankan proses FRMCL dengan bahasa pemrograman OpenMP. Berdasarkan hasil simulasi yang dilakukan, diperoleh 14 cluster untuk data Human Herpesvirus 1 dan 4 cluster untuk data HIV-1. Sedangkan proses paralel yang dilakukan pada kedua data PPI tersebut diperoleh running time dan speed up yang menunjukkan komputasi paralel menggunakan 8 thread diperoleh 3,66x dan 4,51x lebih cepat dibandingkan dengan komputasi sekuensial.

ABSTRACT
Regularized Markov Clustering RMCL algorithm is a clustering graph method which is the development of Markov Clustering MCL . The RMCL algorithm still has weaknesses on inflate parameters that are usually always input by the user to get best clustering results. In this research, RMCL combined with the Firefly algorithm to analyze a protein interaction network called the Firefly Regularized Markov Clustering FRMCL algorithm. The Firefly algorithm is an algorithm that is inspired by the behavior of fireflies looking for their colonies. Implementation of the FRMCL algorithm was carried out on the data network of HIV 1 protein interactions and Human Herpesvirus 1. The data used to be represented in an undirected graph G. Then, firefly position on the firefly algorithm will act as an inflate parameter. Every firefly will perform the RMCL process, and then obtained some RMCL results with different parameters. Each RMCL process give generated from global chaos, which will be selected minimum global chaos which will be the best firefly, it will be processed back again. This new firefly position will act as a new inflate parameter and perform the FRMCL process until to produce the best clusters. Parallel computations will be used when each firefly runs the FRMCL process with the programming language using OpenMP. Based on the results of the simulation, 14 clusters are obtained for Human Herpesvirus 1 and 4 cluster data for HIV 1 data. The parallel processing performed on both PPI data is due to running time and speed shows 3,66x and 4,51x parallel computing using 8 thread which faster than sequential computing."
2018
T49488
UI - Tesis Membership  Universitas Indonesia Library
cover
Muhammad Reza Maullanna
"Kegiatan berbelanja secara daring di e-commerce meningkat seiring dengan peningkatan pengguna internet di Indonesia. Kondisi ini mengakibatkan melonjaknya kegiatan pengiriman barang. Dalam proses pengiriman barang terdapat tahap last-mile delivery. Adapun tantangan yang dihadapi pada tahap ini adalah jumlah pengiriman yang banyak dan waktu pengiriman yang panjang. Hal ini bisa mengakibatkan penambahan jumlah alat transportasi yang digunakan. Salah satu alat transportasi untuk last-mile delivery adalah truk. Penggunaan truk dalam last-mile delivery dapat menyebabkan polusi udara serta tidak dapat mengirimkan paket tepat waktu karena kemacetan lalu lintas (dalam kasus daerah perkotaan). Karena hal itu, harus dicari jalan keluar yang dapat menurunkan polusi udara serta menurunkan kasus pengiriman paket tidak tepat waktu dalam last-mile delivery. Penelitian ini menggabungkan pemakaian truk dan drone yang bermaksud untuk menurunkan kasus pengiriman paket tidak tepat waktu serta menurunkan polusi udara dengan keunggulan drone. Metode yang dipakai melibatkan implementasi Fuzzy C-Means (FCM) clustering untuk mengelompokkan data pelanggan dengan mempertimbangkan kendala jumlah drone yang tersedia serta radius terbang drone dan implementasi Algoritma Genetika untuk merancang rute pengiriman yang optimal dengan mempertimbangkan kendala Time Windows pada depot dan semua cluster. Penerapan kedua metode itu dipakai pada data 90 pelanggan. FCM bisa menurunkan 63,15% jumlah cluster, menurunkan 36,03% keseluruhan jarak tempuh rute, menurunkan 28,77% keseluruhan waktu tempuh rute, serta pengurangan 4,06% nilai fungsi objektif bila ketimbang dengan yang didapat dari clustering secara intuitif.

Online shopping activities in e-commerce are increasing along with the rise in internet users in Indonesia. This trend has led to a surge in goods delivery activities. In the delivery process, there is a crucial last-mile delivery stage. The challenges faced during this stage include a high volume of deliveries and extended delivery times, leading to the necessity of deploying additional transportation means. One commonly used transportation method for last-mile delivery is trucks. However, the utilization of trucks in last-mile delivery poses challenges such as air pollution and the inability to ensure timely package deliveries due to traffic congestion, particularly in urban areas. To address these issues, a solution must be found that not only reduces air pollution but also mitigates instances of delayed package deliveries in last-mile delivery. This research proposes a novel approach by integrating the use of trucks and drones to capitalize on the advantages offered by drones. The methodology employed incorporates the implementation of Fuzzy C-Means (FCM) clustering to categorize customer data, considering constraints related to the number of available drones and the flying radius of the drones. Additionally, a Genetic Algorithm is applied to optimize delivery routes, considering time window constraints at the depot and within all clusters. The application of these two methods was tested on a dataset comprising 90 customers. FCM demonstrated the ability to reduce the number of clusters by 63.15%, decrease the overall route travel distance by 36.03%, and minimize the overall route travel time by 28.77%. Furthermore, it led to a 4.06% reduction in the objective function values compared to intuitive clustering."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2024
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
<<   1 2 3 4 5 6 7 8 9 10   >>