Hasil Pencarian  ::  Simpan CSV :: Kembali

Hasil Pencarian

Ditemukan 4 dokumen yang sesuai dengan query
cover
Syahputri Riani
"

Salah satu teknik analisis yang dapat digunakan pada data mining dalam mengelompokkan data adalah Triclustering. Triclustering merupakan metode pengelompokan secara bersamaan pada data tiga dimensi yang terdiri dari observasi, atribut, dan konteks. Triclustering kerap digunakan pada bidang bioinformatika untuk mengelompokkan data ekspresi gen di titik waktu tertentu pada suatu kondisi eksperimen. Triclustering yang diajukan pada penelitian ini menggunakan metode Hybrid  – TRIMAX Binary Particle Swarm Optimization. Particle Swarm Optimization (PSO) adalah teknik pengelompokan yang terinspirasi oleh perilaku biologis populasi ikan atau kawanan burung yang bergerak untuk menuju sumber makanan. Setiap individu di dalam populasi disebut sebagai partikel yang didefinisikan sebagai kandidat solusi (tricluster). Istilah “Binary” mengartikan bahwa partikel yang bergerak di ruang pencarian berbentuk vektor biner (bit) yang bernilai 0 atau 1. Tahap inisiasi populasi dilakukan dengan menggunakan algoritma nodes deletion pada  – TRIMAX untuk menghasilkan populasi awal yang homogen.  Metode  – TRIMAX dapat menghasilkan tricluster dengan nilai Mean Residual Square (MSR) lebih kecil dari threshold 𝛿 sehingga dapat meningkatkan efektifitas komputasi dari metode Hybrid  – TRIMAX Binary Particle Swarm Optimization. Algoritma gabungan kemudian diimplementasikan pada data ekspresi gen tiga dimensi sel kanker pankreas PANC-1 yang diberikan obat kemoterapi ATO, JQ1, dan kombinasi keduanya pada 3 titik waktu. Diperoleh tricluster optimum dengan skenario  0,0003;  0,8;   0,2; dan tipe neighbourhood = “Gbest”. Tricluster tersebut memiliki nilai TQI sebesar 1,427E-09 dan volume tricluster sebesar 169.410. Berdasarkan tricluster optimum, diperoleh informasi mengenai kumpulan gen yang tidak merespon baik terhadap pengobatan JQ1 dan JQ1+ATO pada jangka waktu menengah dan panjang. Hasil analisis ontologi gen menunjukkan tiga aspek ontologi yang signifikan dengan p-value < 0,05, yaitu proses biologi, fungsi molekuler, dan komponen seluler. Diperoleh gen yang resisten terhadap pengobatan terlibat dalam proses biologi metabolisme sel dan pengembangan sel yang mempertahankan kehidupan sel. Pada aspek fungsi molekuler, gen berperan dalam proses pengikatan, seperti pengikatan ion, senyawa organik siklik, dan senyawa heterosiklik, serta aktivitas katalitik. Selain itu, juga ditemukan bahwa sebagian besar gen berlokasi pada sitoplasma, organel, dan nukleus dalam komponen seluler. Aspek-aspek dari ontologi gen dapat berkontribusi pada resistensi kumpulan gen dalam sel kanker PANC-1 terhadap pengobatan.


One of the analysis techniques that can be used in data mining to group data is Triclustering. Triclustering is a method of simultaneously grouping three-dimensional data consisting of observations, attributes, and context. Triclustering analysis is often used in the field of bioinformatics to group gene expression data at certain time points under experimental conditions. The triclustering analysis proposed in this study used the Hybrid  – TRIMAX Binary Particle Swarm Optimization method. Particle Swarm Optimization (PSO) is a clustering technique inspired by the biological behavior of fish populations or flocks of birds that move towards food sources. Each individual in the population is referred as particles which are defined as candidate solutions (tricluster). The term "Binary" means that the particles move in the search space in the form of binary vectors (bits) with a value of 0 or 1, the number "1" represents that an individual is present in the particle. The population initialization stage is carried out using the nodes deletion algorithm in δ-TRIMAX to produce a homogeneous initial population.  The δ-TRIMAX method can generate a tricluster with a Mean Residual Square (MSR) value smaller than the threshold 𝛿 so that it can increase the computational effectiveness of the Hybrid δ-TRIMAX Binary Particle Swarm Optimization method. The combined algorithm then implemented on three-dimensional gene expression data of PANC-1 pancreatic cancer cells given ATO, JQ1, and a combination of both chemotherapy drugs at three time points. The optimum tricluster was obtained with scenario  0,0003;  0,8;   0,2; and neighborhood type = "Gbest". The tricluster has a TQI value of 1.427E-09 and a tricluster volume of 169,410. Based on the optimum tricluster, information was obtained about the gene pools that did not respond well to JQ1 and JQ1+ATO treatment in the medium and long term. The results of gene ontology analysis showed three significant ontological aspects with p-value <0.05, namely biological processes, molecular functions, and cellular components. It was found that treatment-resistant genes are involved in the biological process of cell metabolism and cell development that maintains cell life. In the aspect of molecular function, genes play a role in binding processes, such as ion binding, cyclic organic compounds, and heterocyclic compounds, as well as catalytic activity. In addition, it was also found that most genes are located in the cytoplasm, organelles, and nucleus in cellular components. These aspects of the gene ontology may contribute to the resistance of the gene pool in PANC-1 cancer cells to treatment.

"
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2023
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Airlangga Muhammad Putrapradana
"Analisis triclustering merupakan salah satu metode data mining yang bertujuan mengelompokkan data berbentuk tiga dimensi. Triclustering kerap digunakan pada bidang bioinformatika untuk menganalisis kesamaan ekspresi gen suatu eksperimen pada titik waktu tertentu. Analisis triclustering yang dilakukan pada penelitian ini menggunakan metode gabungan Fuzzy Cuckoo Search dengan I-Trimax. Metode ini merupakan penggabungan algoritma nodes deletion pada I-Trimax dengan algoritma optimasi Fuzzy Cuckoo Search. Cuckoo Search merupakan metode optimasi yang sudah baik dalam menghasilkan himpunan tricluster yang menggunakan konsep parasitisme spesies cuckoo. Fuzzy Cuckoo Search menggunakan fungsi objektif fuzzy c-means untuk mengatasi ketidakjelasan (indiscernibility) yang biasa terjadi dalam data ekspresi gen sehingga masalah kesulitan membedakan objek karena kurangnya pengetahuan dari informasi yang tersedia dapat diatasi. Algoritma nodes deletion pada I-Trimax digunakan pada fase pembentukan populasi awal dari metode gabungan Fuzzy Cuckoo Search dengan I-Trimax. Hal ini dilakukan demi mendapatkan populasi awal yang sudah baik yaitu memiliki MSR yang minimum karena konsep dari algoritma nodes deletion yaitu dapat menghasilkan himpunan tricluster dengan Mean Square Residue (MSR) kecil yaitu di bawah threshold. Berdasarkan itu proses komputasi algoritma Fuzzy Cuckoo Searchyang dilakukan pada fase optimasi dapat berjalan dengan efektif sehingga menghasilkan himpunan tricluster yang berkualitas baik secara efisien. Analisis triclustering menggunakan metode gabungan Fuzzy Cuckoo Search dengan I-Trimax digunakan pada data ekspresi gen tiga dimensi sel kanker paru-paru fase stabil (A549) yang berkaitan dengan pemberian obat kemoterapi Motexafin Gadolinium (MGd), di mana ekspresi gen diamati pada 6 kondisi dan 3 titik waktu. Pada penelitian ini, himpunan tricluster yang memiliki kualitas terbaik berdasarkan Triclustering Quality Index (TQI) adalah himpunan tricluster yang dihasilkan dengan nilai  dan. Berdasarkan himpunan tricluster tersebut, didapatkan informasi penting mengenai kumpulan gen yang memiliki respon baik terhadap pemberian MGd tapi tidak bertahan setiap titik waktu. Hal ini dapat dijadikan acuan penelitian terkait terapi kanker menggunakan obat kemoterapi MGd yang perlu dilakukan pengembangan agar dapat tetap efektif pada seluruh titik waktu. Terdapat juga kumpulan gen yang memiliki respon cepat dan bertahan hingga jangka panjang dengan pemberian MGd dan mannitol. Gen-gen tersebut merupakan gen yang menunjukkan respon baik pemberian obat kemoterapi MGd tetapi efektivitasnya tidak terlalu maksimal karena responnya beririsan dengan subjek yang hanya diberikan mannitol. Hal ini dapat dijadikan bahan untuk penelitian lebih lanjut dalam pengembangan obat MGd supaya dapat lebih efektif.

Triclustering analysis is a data mining method that aims to group data in three dimensions. Triclustering is often used in the field of bioinformatics to analyze the similarity of gene expression under experimental conditions at a certain point in time. The triclustering analysis carried out in this study used the combined Fuzzy Cuckoo Search method with -Trimax. This method is a combination of node deletion algorithm on -Trimax with Fuzzy Cuckoo Search optimization algorithm. Cuckoo Search is a good optimization method in generating tricluster sets that use the concept of parasitism of cuckoo species. Fuzzy Cuckoo Search uses the fuzzy c-means objective function to overcome the indiscernibility that usually occurs in gene expression data so that the problem of difficulty distinguishing objects due to lack of knowledge from available information can be overcome. The nodes deletion algorithm on I-Trimax is used in the initial population formation phase from the combined Fuzzy Cuckoo Search method with I-Trimax. This is done in order to get a good initial population, which has a minimum MSR because the concept of the nodes deletion algorithm is that it can produce a tricluster set with a small Mean Square Residue (MSR), which is below the threshold. Based on that, the computational process of the Fuzzy Cuckoo Search algorithm which is carried out in the optimization phase can run effectively so as to produce a good quality tricluster set efficiently. Triclustering analysis using the combined Fuzzy Cuckoo Search method with I-Trimax was used on three-dimensional gene expression data of stable phase lung cancer cells (A549) associated with the administration of the chemotherapy drug Motexafin Gadolinium (MGd), where gene expression was observed in 6 conditions and 3 time points. In this study, the tricluster set that has the best quality based on the Triclustering Quality Index (TQI) is the resulting tricluster set with values. Based on these tricluster sets, important information was obtained regarding gene pools that responded well to MGd administration but did not persist at any point in time. This can be used as a reference for research related to cancer therapy using MGd chemotherapy drugs that need to be developed in order to remain effective at all time points. There is also a gene pool that responds quickly and persists in the long term with MGd and mannitol administration. These genes are genes that show a good response to MGd chemotherapy drugs but their effectiveness is not maximal because their responses coincide with subjects who are only given mannitol. This can be used as material for further research in the development of MGd drugs so that they can be more effective."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2022
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Muhamad Ido Raskapati
"Analisis triclustering adalah salah satu metode data mining yang memiliki tujuan mengelompokkan data berbentuk tiga dimensi. Triclustering umumnya digunakan pada bidang bioinformatika untuk menganalisis kesamaan ekspresi gen suatu eksperimen pada titik waktu tertentu. Analisis triclustering yang dilakukan pada penelitian ini menggunakan metode gabungan Fuzzy Cuckoo Search berdasarkan Gaussian Distribution dengan -Trimax. Metode ini merupakan penggabungan algoritma nodes deletion pada Trimax dengan algoritma optimasi Fuzzy Cuckoo Search. Algoritma nodes deletion pada -Trimax digunakan pada fase pembentukan populasi awal tricluster. Konsep algoritma nodes deletion yaitu dapat menghasilkan himpunan tricluster dengan Mean Square Residue (MSR) di bawah threshold dan mendekati 0. Algoritma optimasi Cuckoo Search adalah algoritma pencarian solusi tricluster, digambarkan dengan konsep parasitisme spesies burung cuckoo. Pada penelitian ini, Cuckoo Search menggunakan random walk Gaussian Distribution untuk pencarian solusi tricluster. Berdasarkan hal ini komputasi algoritma Cuckoo Search menjadi lebih efisien dan efektif dalam menghasilkan himpunan tricluster yang lebih optimal dan mempercepat waktu komputasi. Fuzzy Cuckoo Search adalah pengembangan dari Cuckoo Search yang menggunakan fungsi objektif Fuzzy C-Means untuk mengatasi ketidakjelasan (uncertainty) dalam data ekspresi gen. Analisis triclustering menggunakan metode gabungan Fuzzy Cuckoo Search berdasarkan Gaussian Distribution dengan -Trimax digunakan pada data ekspresi gen tiga dimensi sel fibroblas yang diberikan perlakuan dengan Egr-1 dan Tgf-, di mana ekspresi gen diamati pada 6 kondisi dan 2 titik waktu. Pada penelitian ini, himpunan tricluster yang memiliki kualitas terbaik berdasarkan Triclustering Quality Index adalah himpunan tricluster yang dihasilkan dengan nilai = 0,015 dan = 0,50 . Berdasarkan himpunan tricluster tersebut, didapatkan informasi penting mengenai kumpulan gen yang memiliki respon baik terhadap pemberian perlakuan dengan Egr-1, Tgf- dan bertahan setiap titik waktu. Kumpulan gen tersebut dilakukan Gene Ontology (GO) yang diuji menggunakan Fisher’s exact dengan tingkat signifikansi 0,05 dan dikoreksi dengan False Discovery Rate. Hasil GO tersebut terdiri dari 219 GO Terms Biological Process, 28 GO Terms Molecular Function, dan 52 GO Terms Cellular Component. GO Terms dari masing-masing aspek GO tersebut dapat dijadikan bahan untuk penelitian di bidang bioinformatika untuk menganalisis hubungan GO Terms terhadap penyakit Systemic Sclerosis (SSc).

Triclustering analysis is one of the data mining methods aimed at clustering threedimensional data. Triclustering is commonly used in the field of bioinformatics to analyze the similarity of gene expression in an experiment at specific time points. The triclustering analysis in this research uses a combined method of Fuzzy Cuckoo Search based on Gaussian Distribution with -Trimax. This method combines the nodes deletion algorithm of -Trimax with the optimization algorithm of Fuzzy Cuckoo Search. The nodes deletion algorithm of -Trimax is used in the initial population formation phase of the tricluster. The concept of the nodes deletion algorithm is to produce tricluster sets with Mean Square Residue (MSR) below the threshold and close to 0. The optimization algorithm of Cuckoo Search is a search algorithm for tricluster solutions, depicted with the parasitism concept of cuckoo bird species. In this research, Cuckoo Search uses random walk Gaussian Distribution for tricluster solution search. This enhances the efficiency and effectiveness of the Cuckoo Search algorithm in producing more optimal tricluster sets and accelerating the computation time. Fuzzy Cuckoo Search is an extension of Cuckoo Search that employs Fuzzy C-Means objective function to handle uncertainty in gene expression data. The triclustering analysis using the combined method of Fuzzy Cuckoo Search based on Gaussian Distribution with -Trimax is applied to the three-dimensional gene expression data of fibroblast cells treated with Egr-1 and Tgf-1, where gene expressions are observed under 6 conditions and 2 time points. In this research, the tricluster set with the best quality based on the Triclustering Quality Index (TQI) is obtained with = 0.015 and = 0.50. Based on this tricluster set, important information is derived regarding groups of genes that respond well to treatment with Egr1, Tgf, and persist at each time point. These gene groups are subjected to Gene Ontology (GO) analysis, which is tested using Fisher's exact test with a significance level of 0.05 and corrected with False Discovery Rate. The GO results consist of 219 GO Terms Biological Process, 28 GO Terms Molecular Function, and 52 GO Terms Cellular Component. The GO Terms from each aspect can be utilized for further research in the field of bioinformatics to analyze the relationship of GO Terms with Systemic Sclerosis (SSc) disease."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2023
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Rana Amalia Putri
"Triclustering merupakan teknik data mining untuk mengelompokkan data tiga dimensi (observasi – atribut – konteks). Metode triclustering mampu menemukan kelompok observasi dengan karakteristik yang mirip pada beberapa atribut dan konteks sekaligus. Analisis tricluster kerap diimplementasikan pada data ekspresi gen 3D (gen – kondisi – waktu). Pada penelitian ini dilakukan analisis tricluster dengan metode Hybrid Discrete Firefly Optimization (DFO) pada data ekspresi gen 3D. Metode ini merupakan kombinasi dari metode dan Discrete Firefly Optimization (DFO). Metode DFO merupakan metode optimasi yang terinspirasi dari perilaku firefly (kunang-kunang) yang selalu bergerak ke arah firefly lain dengan cahaya yang lebih terang. Metode DFO bertujuan untuk memperoleh tricluster terbaik dengan volume maksimum dari suatu populasi tricluster. Pada metode DFO, suatu tricluster dengan volume lebih kecil akan bergerak ke arah tricluster lain dengan volume lebih besar dengan bantuan crossover operator. Setiap iterasi pada metode DFO dilakukan sampai semua tricluster dibandingkan volumenya dengan satu sama lain sehingga tricluster dengan volume lebih kecil dapat diperbaiki posisinya dan meningkat volumenya. Kebaruan dari penelitian ini merupakan pembentukan populasi tricluster awal dilakukan dengan metode . Metode bertujuan untuk menghasilkan tricluster dengan Mean Squared Residue (MSR) minimum, yaitu di bawah threshold tertentu. Populasi tricluster dengan karakteristik demikian meringankan beban dan waktu komputasi pada metode DFO. Data yang digunakan pada analisis tricluster ini merupakan data ekspresi gen dari sel kanker payudara MCF-7 ketika disuntikkan 100 nM hormon estrogen untuk empat waktu berbeda, yaitu selama 0 jam, 3 jam, 6 jam, dan 12 jam. Masing-masing perlakuan direplikasi sebanyak tiga kali. Pada penelitian ini diperoleh bahwa simulasi yang menghasilkan tricluster akhir terbaik dengan TQI terkecil adalah simulasi dengan nilai sebesar 3E-05. Gen-gen yang termasuk ke dalam tricluster ini memiliki profil ekspresi yang mirip ketika disuntikkan 100nM estrogen untuk tiga replikasi dan empat waktu. Estrogen merupakan salah satu hormon yang mempengaruhi pertumbuhan kanker payudara. Oleh karena itu, kumpulan gen dari tricluster yang diperoleh dapat dijadikan acuan pada penelitian selanjutnya oleh ahli medis terkait pengaruh estrogen terhadap kanker payudara dan untuk menentukan target terapi gen kanker payudara.

Triclustering is a data mining technique that is used to group observations on three dimensional data which consists of observation, attribute, and context dimension. Triclustering is used to find a group of observations with high similarity on several attributes and several contexts. Triclustering analysis is often implemented on three dimensional gene expression dataset. The 3D gene expression dataset dimensions consist of gene, condition, and time. The triclustering method that is used on this research is the Hybrid Discrete Firefly Optimization (DFO). This method is a combination of and DFO. Discrete Firefly Optimization (DFO) is an optimization method that was inspired by firefly movement in the wild in which a less bright firefly always moves to the one with brighter light. In triclustering analysis, every tricluster is called a firefly. Every firefly has a fitness value which is measured by its volume and a position which is represented by a binary encoding of its elements. The DFO method is used to find the best tricluster with maximum volume from a population of triclusters. In the DFO method, a tricluster with smaller volume will move towards a tricluster with larger volume. The movement is done by updating the smaller volume tricluster position. The new position is obtained through crossover operator. Every iteration of DFO is completed once every tricluster fitness value is compared to each other. Repeating the DFO iteratively will give the end result of the best tricluster with maximum volume. The novelty of this research is the addition of method in constructing the initial tricluster population. The population created from will have MSR lower than the threshold so the computation time in the optimization step can be reduced. The Hybrid DFO method is implemented on a 3D gene expression dataset related to the MCF-7 breast cancer cell. The cell is injected with 100nM estrogen for four different times, i.e. 0, 3, 6, and 12 hours. Every experiment is repeated three times. This research finds that the simulation with the best tricluster based on the TQI score is the simulation with equals to 3E-05. The genes that are included in the tricluster are found to have exhibit similar expression when injected by 100nM for three conditions and four time periods. Estrogen is one of the hormones that can affect breast cancer growth. Therefore, the genes that are included in the tricluster can be used as a reference for medical researchers in future research related to estrogen-induced breast cancer and to assist the selection for genes target in breast cancer therapy."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2023
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library