Hasil Pencarian

Ditemukan 171306 dokumen yang sesuai dengan query

Teny Handhayani

Model integrasi data gene expression dan DNA copy number pada cluster gen kanker menggunakan intelligent kernel k means = Integration data model of gene expression and dna copy number on cluster genes of cancer using intelligent kernel k means

"Integrasi data gene expression dan DNA copy number berbasis kernel digunakan untuk menganalisis pola gen pada penyakit kanker payudara cell line. Clustering pada data integrasi dilakukan tanpa adanya informasi jumlah k cluster, teknik ini disebut fully unsupervised clustering. Pada penelitian ini, intelligent kernel K-Means dikembangkan dengan menggabungkan teknik intelligent K-Means dan kernel K-Means. Berdasarkan hasil eksperimen, nilai pada kernel RBF mempengaruhi jumlah cluster yang ditemukan. Hasil clustering dievaluasi menggunakan nilai R, global silhouette, indeks Davies-Bouldien, akurasi LS-SVM dan visualisasi. Hasil esperimen terbaik yaitu 3 cluster yang memperoleh akurasi LS-SVM sebesar 97.3% dengan standar deviasi 0.2%.

In this thesis, kernel based data integration of gene expression and DNA copy number would be utilized to analyze pattern of genes in breast cancer cell line. The cluster analysis on the integrated data will be conducted with has no prior information with regards the number of k clusters which is called fully unsupervised clustering technique. In this work, intelligent kernel K-Means is proposed by combining intelligent K-Means and kernel K-Means. From the experiments, the value of of Radial Basis Function (RBF) has important role for finding the optimal of number of cluster. The clusters those to be found will be evaluated based on global silhouette, Davies-Bouldien Index, LS-SVM accuracy and visualization. The experiment result show that three clusters are successfully to be found. Those clusters produce average accuracy of LS-SVM around 97.3 % with standard deviation 0.2 %."

Depok: Universitas Indonesia, 2013

T-Pdf

UI - Tesis Membership Universitas Indonesia Library

Edo Surya Utama

Model integrasi data teks dan gene expression untuk tujuan prediksi ikatan obat dan penyakit pada kanker menggunakan bayesian network = Integration data model of text and gene expression to prediction of drug and disease association on cancer using bayesian network

"Reposisi obat merupakan proses penting yang digunakan untuk meningkatkan proses penemuan obat, prosesnya dilakukan dengan memanfaatkan banyaknya sumber data dan tipe data seperti data dari dokumen dan data gene expression. Metode yang digunakan untuk mengolah dokumen adalah Text Mining, metode ini mengekstraksi data menjadi sebuah informasi yang berguna. Data gene expression adalah data hasil hibridisasi terhadap sekuen nukleotida dan dari keseluruhan data gene expression tersebut dipilih satu kelompok kecil gen yang merupakan gen yang aktif berkembang jika seseorang mengidap penyakit kanker. Metode pengelompokan yang diusulkan adalah metode Gene Shaving yang dapat mengidentifikasi himpunan bagian dari data gene expression dengan pola ekspresi yang koheren dan varian tinggi. Salah satu permasalahan di dalam mengolah data dengan tipe data yang berbeda adalah pengintegrasian seluruh data. Pendekatan yang diusulkan pada penelitian ini untuk integrasi data adalah Bayesian Network. Tujuan dari integrasi data adalah untuk memprediksi ikatan antara obat dan penyakit. Hasil prediksi ikatan obat dan penyakit yang didapatkan dari model integrasi data teks dan gene expression adalah 81,69%. Hasil ini meningkat dibandingkan dengan hasil prediksi ikatan obat dan penyakit dengan hanya menggunakan satu tipe data saja, di mana nilai prediksi ikatan obat dan penyakit dengan menggunakan tipe data teks adalah 70,58% dan nilai prediksi ikatan obat dan penyakit menggunakan tipe data gene expression adalah 66%.

Drug repositioning is an important process that is used to enhance the drug discovery process, the process is carried out by using the number of data sources and types of data such as data from gene expression data and documents. Text Mining is one of method to process of text, this method of data extraction into a useful information. Gene expression is the data from the hybridization of the nucleotide sequence and gene expression of the whole data set is selected a small group of genes that are active genes evolve if someone with cancer. Clustering method that proposed is Gene Shaving, that can identify subsets of genes with expression patterns are coherent and high variants. One of the problems in process of data with different data types is integration all of data. The approach proposed in this study for data integration is Bayesian Netwotk. The purpose of data integration is to predict the bond between the drug and disease. The result of drug and disease prediction bond obtained from the integration model was 81,69 %. These results increased compared with the predicted results by using one type of data, PPV`s values prediction of association drug and disease by text data type was 70,58 % whereas PPV`s values prediction of association drug and disease by gene expression data type was 66%."

Depok: Universitas Indonesia, 2015

T-Pdf

UI - Tesis Membership Universitas Indonesia Library

Ajeng Leudityara Fijri

Klasifikasi kanker payudara menggunakan kernel spherical K-means = Breast cancer clustering using kernel spherical K-means

"ABSTRACT

Kanker payudara adalah pertumbuhan sel-sel abnormal di jaringan pada payudara yang berkembang secara tidak terkendali. Perkembangan sel-sel abnormal secara tidak terkendali ini menyebabkan kanker menjadi salah satu penyakit paling mamatikan yang umumnya dialami oleh wanita di seluruh dunia. Salah satu cara untuk mengurangi berkembangnya sel kanker ini adalah dengan melakukan pendeteksian dini menggunakan machine learning. Beberapa metode machine learning berhasil melakukan klasifikasi kanker. Clustering merupakan salah satu metode dari machine learning yang bertujuan untuk mengelompokkan suatu dataset ke dalam subset berdasarkan ukuran jarak. Kernel Spherical K-Means (KSPKM) adalah salah satu metode clustering dengan mengganti hasil kali dalam yang ada pada Spherical K-Means (SPKM) dengan fungsi Kernel. Data kanker payudara yang digunakan pada penelitian ini adalah data kanker payudara Coimbra. Data kanker payudara Coimbra ini merupakan hasil dari pengambilan tes laboratorium yang dapat mendeteksi kanker payudara pada tubuh. Hasil klasifikasi data kanker payudara Coimbra dengan menggunakan metode SPKM memiliki hasil akurasi sebesar 81,82% dengan running time selama 0,16 detik, sensivicity sebesar 100%, dan specificity sebesar 65,62% sedangkan hasil akurasi dengan menggunakan KSPKM dengan Radial Basis Function (RBF) adalah 72,41% dengan running time 0,98 detik, sensivicity sebesar 61,54%, dan specificity sebesar 81,25% . Berdasarkan hasil akurasi pada 10% sampai 90% data yang digunakan, metode KSPKM menghasilkan akurasi yang lebih stabil dibandingkan hasil akurasi pada metode SPKM.

ABSTRACT

Breast cancer is the growth uncontrollably of abnormal cells in the tissue in the breast. The development of abnormal cells uncontrollably causes cancer to become one of the most deadly diseases commonly among women the worldwide. One way to reduce the development of cancer cells is by early detection using machine learning. Some machine learning methods successfully classify cancer. Clustering is one of the methods of machine learning that aims to grouping of a dataset into subsets based on distance measurement.. Kernel Spherical K-Means (KSPKM) is one of the clustering methods by replacing the inner products in the Spherical K-Means (SPKM) by Kernel functions. The breast cancer data used in this study were Coimbra breast cancer data. The Coimbra breast cancer data is the result of taking laboratory tests that can detect breast cancer in the body. The classification results for Coimbra breast cancer data using the SPKM method has highest accuracy 81,82% with running time for 0,16 seconds, sensivicity 100%, and specificity 65,62% while the highest accuracy results using KSPKM with Kernel radial basis function (RBF) are 72,41% with running time 0,98 seconds, sensivicity 61,54%, and specificity 81,25%. Based on the results of the accuracy of 10% to 90% of the training data used, the KSPKM method produces more stable accuracy than the accuracy results of SPKM method."

2018

S-Pdf

UI - Skripsi Membership Universitas Indonesia Library

Hendy Fergus Atheri Hura

Analisis Cluster Gen dari Microarray Data Ekspresi Gen Menggunakan Spectral Clustering dengan Metode Partisi Fuzzy C-Means = Gene Clusters Analysis of Microarray Data of Gene Expression by Using Spectral Clustering with Fuzzy C-Means Partitioning Method.

"ABSTRAK

Penelitian ini mengimplementasikan metode spectral clustering-Fuzzy C-Means pada tiga microarray data ekspresi gen, dengan tujuan untuk mengelompokkan gen-gen yang memiliki tingkat ekspresi yang similar. Spectral clustering secara teoritis terdiri dari tiga tahap utama yaitu: membangun matriks jarak, membentuk matriks Laplacian, dan proses partisi, khususnya dalam tesis ini menggunakan algoritma partisi Fuzzy C-Means. Oleh karena itu, implementasi dari spectral clustering-FCM lebih sederhana dan intuitif pada pelaksanaannya. Analisis cluster singkat juga akan dipaparkan untuk masing-masing microarray data yang digunakan yaitu: Carcinoma, Leukemia, dan Lymphoma. Hasil cluster yang sangat baik didapatkan, sehingga metode yang diusulkan memiliki potensi besar ke depannya dalam penelitan pada bidang medis.

ABSTRACT

This research implements the spectral clustering FCM method on three microarray gene expression data, with the aim of grouping genes with similar expression levels. Spectral clustering is theoretically composed of three main stages building distance matrix, forming Laplacian matrix, and partitioning process, especially in this thesis using Fuzzy C Means partition algorithm. Therefore, the implementation of spectral clustering FCM is simpler and more intuitive in its implementation. Brief cluster analysis will also be presented for each microarray data used Carcinoma, Leukemia, and Lymphoma. Excellent cluster results are obtained, so the proposed method has great potential for future research in the medical field. "

2017

T48274

UI - Tesis Membership Universitas Indonesia Library

Sofia Debi Puspa

Implementasi metode similarity based biclustering (SBB) pada microarray data ekspresi gen dengan menggunakan algoritma partisi k-means = Implementation of similarity based biclustering (SBB) on microarray gene expression data by using k means partition algorithm

"Penelitian ini bertujuan untuk mengimplementasikan similarity based biclustering SBB dalam memperoleh bicluster sekumpulan gen dengan ekspresi yang similar di bawah kondisi tertentu yang signifikan pada data microarray. Secara teoritis similarity based biclustering terdiri atas tiga tahap utama, yaitu: membangun matriks similaritas baris gen dan matriks similaritas kolom kondisi , mempartisi masing-masing matriks similaritas dengan hard clustering khususnya dalam penelitian ini menggunakan partisi k-means, dan ekstrak bicluster. Sebelum mengimplementasikan metode SBB, strategi seleksi gen diterapkan dan selanjutnya dilakukan normalisasi. Perolehan evaluasi indeks silhouette pada dataset diabetic nephropathy, diabetic retinopathy dan lymphoma berturut-turut pada cluster kondisi yaitu 0,8304; 0,7853 dan 0,7382, sedangkan indeks silhouette untuk cluster gen yaitu 0,5382; 0,5408 dan 0,5464. Dan dari hasil analisis cluster kondisi, akurasi dari dataset diabetic nephropathy dan diabetic retinopathy yaitu 100 , sedangkan dataset lymphoma yaitu 98 . Selanjutnya dapat diketahui regulasi proses seluler yang terjadi pada bicluster dari ketiga dataset. Hasil analisis menunjukkan bahwa gen-gen yang diperoleh dari bicluster sesuai dengan fungsi gen dan proses biologis didukung oleh GO enrichment sehingga menjadi potensi yang besar bagi praktisi medis dalam tindak lanjut suatu penyakit yang diderita oleh pasien.

This study aims to implement similarity based biclustering SBB in obtaining a bicluster a set of genes that exhibit similar levels of gene expression under certain conditions that is significant in microarray data. Theoretically, similarity based biclustering consists of three main phase constructing the row gene similarity matrix and the column condition similarity matrix, partitioning each matrix similarity with hard clustering especially in this research using k means partition, and extracting bicluster. Before implementing the SBB method, the gene selection strategy is applied and subsequently normalized. The acquisition of silhouette index evaluation in diabetic nephropathy, diabetic retinopathy, and lymphoma on cluster condition respectively is 0.8304, 0.7853 and 0.7382, while the silhouette index for the gene cluster is 0.5382, 0.5408 and 0.5464. In addition, according to the cluster condition analysis, accuracy of dataset diabetic nephropathy and diabetic retinopathy is 100 , whereas dataset lymphoma is 98 . Furthermore, it can be known cellular regulation that occurs on the bicluster of the three datasets. The results of the analysis show that the genes obtained from bicluster are relevant to the function of genes and biological processes supported by GO enrichment , therefore it becomes a great potential for medical practitioners in the follow up of a disease suffered by the patient."

Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2018

T49530

UI - Tesis Membership Universitas Indonesia Library

Teguh Saputra

Metode Triclustering delta-Trimax Melalui Pendekatan Two-Way K-Means Menggunakan Geneontology Data Ekspresi Gen = delta-Trimax Method through Two-Way K-means Approach Using Gene Ontology on Gene Expression Data

Analisis triclustering merupakan teknik yang mampu mengelompokkan data 3 dimensi secara bersamaan, sehingga dapat diperoleh sub-ruang dari data 3D yang terdiri dari subset observasi (gen), subset kondisi (kondisi) dan subset konteks (waktu). Analisis triclustering yang dilakukan pada penelitian ini yaitu metode delta-Trimax melalui pendekatan two-way K-means. Tujuan dari metode delta-Trimax yaitu menemukan tricluster yang memiliki nilai minimum dari three-dimensial mean square residual (ð3) dan volume maksimum. Pendekatan two-way K-means digunakan untuk membentuk suatu populasi awal agar dapat mengurangi beban komputasi dan membantu membentuk tricluster yang lebih baik. Metode ini akan diimplementasikan pada data ekspresi gen kultur HAE (Human Airway Epithelial) yang terinfeksi virus SARS-CoV, SARS-dORF6, SARS-BatSRBD, dan H1N1. Implementasi dilakukan dengan 9 simulasi dan diperoleh simulasi terbaik dengan nilai threshold dari perhitungan MSR sebesar 0.0435, threshold = 1.7 dan sebanyak 24 tricluster terbentuk berdasarkan penilain triclustering quality index (TQI). Dari himpunan tricluster tersebut diperoleh informasi mengenai perbandingan pola ekspresi gen pada virus SARS-CoV, SARS-dORF6, SARS-BatSRBD dengan virus influenza H1N1. Terdapat 7 tricluster yang memiliki kesamaan pola ekspresi gen di setiap kondisi dan 8 tricluster yang diduga memiliki perbedaan kondisi antara setiap variasi virus SARS- CoV dengan virus influenza H1N1. Pada tricluster lainnya juga diperoleh informasi hanya beberapa variasi Sars-CoV yang memiliki kesamaan satu sama lain dan juga kesamaan atau perbedaan dengan H1N1. Berdasarkan titik waktu diperoleh 3 tricluster tidak memberikan efek karena pola ekspresi gen tiap waktu sama dengan kondisi awal yaitu titik waktu ke-1 dan 17 tricluster diduga memberikan efek paska infeksi. Untuk menilai kualitas hasil tricluster terbentuk dalam penggambaran fungsi biologis dari kumpulan gen pada tricluster dilakukan evaluasi gene ontology (GO). GO adalah sebuah sistem untuk menggambarkan fungsi, biological process, celluler componet gen dan moleculer function dalam berbagai organisme. Dari hasil evaluasi diperoleh sebanyak 20 tricluster yang memiliki keterlibatan dan kaitan kuat dengan setiap konsep GO. Sebanyak 3 tricluster hanya memiliki keterlibatan atau kaitan pada salah satu aspek GO dan 1 tricluster yang memiliki keterlibatan pada semua aspek GO namun hanya pada aspek celuller componet yang memiliki kaitan kuat. Hal ini dapat menjadi acuan bagi peneliti bidang biologi untuk memfokuskan penelitian lebih lanjut dalam pemahaman fungsi biologis pada himpunan tricluster yang memiliki keterlibatan dan kaitan kuat.

Triclustering analysis is a technique capable of clustering three-dimensional data simultaneously, thus obtaining subspaces of the 3D data consisting of subsets of observations (genes), attribute subsets (conditions), and context subsets (time). The triclustering analysis conducted in this research utilizes the Î´-Trimax method through a two-way K-means approach. The goal of the Î´-Trimax method is to find triclusters that have minimum values of three-dimensional mean square residu MSR_3D and maximum volume. The two-way K-means approach is used to form an initial population to reduce computational burden and aid in forming better triclusters. This method will be implemented on gene expression data from HAE (Human Airway Epithelial) cultures infected with SARS-CoV, SARS-dORF6, SARS-BatSRBD, and H1N1 viruses. The implementation is carried out through 9 simulations, and the best simulation is obtained with a threshold value of Î´ calculated from MSR of 0.0435, a threshold value of Î»=1.7, resulting in 24 formed triclusters based on the triclustering quality index (TQI) assessment. From the set of triclusters, information regarding the comparison of gene expression patterns between SARS-CoV, SARS-dORF6, SARS-BatSRBD viruses and H1N1 influenza virus is obtained. There are 7 triclusters that exhibit similar gene expression patterns across all conditions, and 8 triclusters that are suspected to have condition differences between various SARS-CoV viruses and the H1N1 virus. Other triclusters also provide information where only certain SARS-CoV variations share similarities with each other or similarities or differences with H1N1. Based on the time points, 3 triclusters show no effect as their gene expression patterns remain the same as the initial condition (time point 1), while 17 triclusters are suspected to have post- infection effects. To assess the quality of the formed triclusters in terms of biological function representation of the gene sets within the triclusters, an evaluation of gene ontology (GO) is performed. GO is a system for describing the functions, biological processes, cellular components, and molecular functions of genes across various organisms. The evaluation method involves the Database for Annotation, Visualization, and Integrated Discovery (DAVID) in calculating p-values. The evaluation results reveal that 20 triclusters have strong involvement and correlation with each GO concept. Three triclusters only exhibit involvement or correlation in one specific aspect of GO, and one tricluster exhibits involvement in all GO aspects, but with a strong correlation only in the cellular component aspect. This information can serve as a reference for researchers in the field of biology to focus further research on understanding the biological functions within tricluster sets that have strong involvement and correlation.

Depok: Fakultas Matematika Dan Ilmu Pengetahuan Alam Universitas Indonesia, 2023

S-pdf

UI - Skripsi Membership Universitas Indonesia Library

Putri Triridita

Implementasi Pendekatan Two-Way K-Means Terhadap Metode δ-Trimax pada Data Ekspresi Gen Bakteri Mycrobacterium Tuberculosis H37Rv = Implementation Two-Way K-Means Approach To Trimax Method On Mycrobacterium Tuberculosis H37rv Gene Expression Data

Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2021

S-pdf

UI - Skripsi Membership Universitas Indonesia Library

Nedya Shandri

Klasifikasi data diabetes dan kanker menggunakan entropi fuzzy C-means berbasis = Diabetes and cancer data classification using entropy fuzzy C-means based on kernel with chi-square feature selection

"Penyakit kronis adalah penyakit yang diderita dalam waktu panjang dan dapat berkembang secara cepat, salah satunya adalah penyakit kanker dan diabetes. Oleh karena itu, dengan melakukan pendeteksian dini maka perkembangan penyakit kanker dan diabetes akan menurun. Salah satu cara pendektesian dini dapat dilakukan oleh machine learning. Teknik machine learning banyak digunakan dalam berbagai bidang khususnya untuk analisa data medis. Clustering merupakan salah satu metode dari machine learning yang bertujuan untuk mengelompokkan suatu dataset ke dalam subset berdasarkan ukuran jarak. Salah satu contoh metode clustering adalah metode Entropi Fuzzy C-Means yang dapat mengidentifikasi entropi disetiap titik data dan memilih pusat kluster terdekat dengan entropi minimum. Pada penelitian akan digunakan data kanker dan diabetes dari UCI Repository dengan menggunakan metode Entropi Fuzzy C-Means yang akan dimodifikasi dengan kernel RBF. Sebelum dilakukan klasifikasi, dilakukan pemilihan fitur menggunakan Chi-Square. Tujuan dari penelitian ini adalah untuk mendapatkan fitur-fitur yang optimal dan mengetahui hasil akurasi menggunakan untuk klasifikasi data diabetes dan kanker. Diperoleh hasil akurasi tertinggi pada klasifikasi data medis menggunakan metode Entropi Fuzzy C-Means berbasis kernel dengan pemilihan fitur Chi-Square yaitu sebesar 83.33% untuk data diabetes dan 77.77-100% untuk data kanker.

Chronic disease is a disease that occur for a long time and can develop quickly, one of them is cancer and diabetes. The early detection is very helpful to reduce the development of the disease. One of the ways to detect cancer and diabetes disease is using machine learning technic. Machine learning technic is widely use in many aspects especially in medical data analysis. Clustering is part of machine learning technic that is used to group a dataset into subset based on space size. Entropy Fuzzy C-Means is one of the methods which can identify entropy in every data and can choose the cluster center similar with minimum entropy. In this paper we will use cancer and diabetes medical data from UCI Repository using Entropy Fuzzy C-Means method which is modified by kernel RBF. Before classification, we will select the feature using Chi-Square to get the optimal subset feature. The purpose of this study was to obtain optimal features and find out the results of accuracy using for the classification of diabetes and cancer data. The medical data classification using Entropy Fuzzy C-Means based on kernel with Chi-Square feature selection gives the 100% highest accuration result for cancer data and 83,33% for diabetes data."

Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2019

S-pdf

UI - Skripsi Membership Universitas Indonesia Library

Frisca

Implementasi spectral clustering pada data microarray gen karsinoma menggunakan algoritma K-means = The implementation of spectral clustering on microarray data on carcinoma genes using K-means algorithm

"Spectral clustering adalah salah satu algoritma clustering modern yang paling terkenal. Sebagai teknik clustering yang efektif, metode spectral clustering muncul dari konsep teori graf spektral. Metode spectral clustering membutuhkan algoritma partisi. Ada beberapa metode partisi termasuk PAM, SOM, Fuzzy c-means, dan k-means. Berdasarkan penelitian yang telah dilakukan oleh Capital dan Choudhury pada 2013, ketika menggunakan Euclidian distance, k-means memberikan akurasi yang lebih baik dibandingkan dengan algoritma PAM. sehingga, makalah ini menggunakan algoritma k-means. Keuntungan utama dari spectral clustering adalah mengurangi dimensi data, terutama dalam hal ini untuk mengurangi dimensi yang besar dari data microarray.

Microarray data adalah chip berukuran kecil yang terbuat dari slide kaca yang berisi ribuan bahkan puluhan ribu jenis gen dalam fragmen DNA yang berasal dari cDNA. Aplikasi data microarray secara luas digunakan untuk mendeteksi kanker, misalnya adalah karsinoma, di mana sel-sel kanker mengekspresikan kelainan pada gen-nya. Proses spectral clustering dimulai dengan pengumpulan data microarray gen karsinoma, preprocessing, menghitung similaritas, menghitung , menghitung nilai eigen dari , membentuk matriks , dan clustering dengan menggunakan k-means. Dari hasil pengelompokan gen karsinoma pada penelitian ini diperoleh dua kelompok dengan nilai rata-rata Silhouette maksimal adalah 0.6336247. Proses clustering pada penelitian ini menggunakan program open source R.

Spectral clustering is one of the most famous modern clustering algorithms. As an effective clustering technique, spectral clustering method emerged from the concepts of spectral graph theory. Spectral clustering method needs partitioning algorithm. There are some partitioning methods including PAM, SOM, Fuzzy c means, and k means. Based on the research that has been done by Capital and Choudhury in 2013, when using Euclidian distance k means algorithm provide better accuracy than PAM algorithm. So in this paper we use k means as our partition algorithm. The major advantage of spectral clustering is in reducing data dimension, especially in this case to reduce the dimension of large microarray dataset.
Microarray data is a small sized chip made of a glass plate containing thousands and even tens of thousands kinds of genes in the DNA fragments derived from doubling cDNA. Application of microarray data is widely used to detect cancer, for the example is carcinoma, in which cancer cells express the abnormalities in his genes. The spectral clustering process is started with collecting microarray data of carcinoma genes, preprocessing, compute similarity matrix, compute , compute eigen value of , compute , clustering using k means algorithm. In this research, Carcinoma microarray data using 7457 genes. The result of partitioning using k means algorithm is two clusters clusters with maximum Silhouette value 0.6336247."

Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2017

T47117

UI - Tesis Membership Universitas Indonesia Library

Rinaldy Kusuma

Identifikasi copy number variation gen DOK5 pada pasien kanker kolorektal adenokarsinoma sporadik di Makassar Sulawesi Selatan : hubungannya dengan ekspresi gen DOK5 = Identification of dok5 gene copy number variation in sporadic colorectal cancer adenocarcinoma patient in Makassar South Sulawesi correlation with dok5 gene expression / Rinaldy Kusuma

"ABSTRAK

Latar Belakang: Kanker Kolorektal termasuk ke dalam lima besar kanker dengan tingkat insidensi dan mortalitas yang tinggi di Indonesia. Sebesar 20%-25% kejadian kanker kolorektal merupakan faktor keturunan melalui pewarisan mutasi gen-gen high penetrance yang berkontribusi signifikan terhadap pembentukan kanker kolorektal, sedangkan 80%-85% merupakan kanker kolorektal sporadik. Pada kanker kolorektal sporadik mutasi terjadi pada gen-gen low penetrance yang berisiko rendah terhadap pembentukan kanker kolorektal. Identifikasi mutasi pada gen-gen lain yang berpotensi memiliki kontribusi terhadap kanker kolorektal sporadik diperlukan. Prastudi sebelumnya menggunakan metode GWAS telah mengidentifikasi CNV di kromosom 7, 8, 18, dan 20 dari pasien kanker kolorektal sporadik. Penelitian ini bertujuan untuk mengidentifikasi gen dengan CNV di kromosom tersebut dan asosiasinya pada kanker kolorektal sporadik serta hubungan variasi genetik CNV terhadap tingkat ekspresi mRNA gen DOK5.

Metode: Identifikasi gen berdasarkan seleksi dari analisis data CNV dan SNP prastudi GWAS. Sebanyak 70 pasang sampel jaringan kanker kolorektal dan jaringan kolorektal sehat digunakan dalam penelitian ini dengan persetujuan komisi etik serta tujuh jenis sel lestari. Metode Real-Time PCR digunakan dalam analisis CNV gen DOK5 menggunakan DNA dari sampel jaringan maupun sampel sel lestari dan analisis ekspresi mRNA gen DOK5 dari sampel RNA sel lestari.

Hasil: Jumlah Copy Number (CN) gen DOK5 yang tinggi secara signifikan (P =0,01) terdapat pada kelompok usia ≥50 tahun (CN=1,58). Variabel CN gen DOK5 berasosiasi signifikan dengan variabel kelompok usia (P=0,028) dimana lebih dari 50% sampel ≥50 tahun memilik amplifikasi gen DOK5. Pada derajat diferensiasi histopatologi dan jenis kelamin tidak ada perbedaan dan asosiasi dengan CN gen DOK5 secara signifikan (P >0,05). CNV gen DOK5 berkorelasi positif kuat (R=0,890) secara signifikan (P=0,007) dengan tingkat ekspresi mRNA gen DOK5 di beberapa sampel sel lestari dari berbagai kanker.

Kesimpulan: Amplifikasi CNV gen DOK5 terkait dengan kanker kolorektal sporadik pada subyek berusia ≥50 tahun. CNV gen DOK5 yang teramplifikasi berpengaruh terhadap peningkatan ekspresi mRNA gen DOK5 di sel lestari.

ABSTRACT
Background: Colorectal Cancer (CRC) is among top five cancers that have high level of incidence and mortality in Indonesia. About 20%-25% of CRC were familial that inherited a mutation of high penetrance genes with high predisposing risk of CRC, while the rest of 75%-80% were sporadic CRC. Most of predisposing mutation of genes in sporadic CRC were low penetrance genes with low risk of CRC. Identification of other predisposing genes that have significant and higher risk of sporadic CRC were needed. Our previous study using GWAS has identified a significant genetic variation in the form of CNV in chromosomes 7, 8, 18, dan 20 in sporadic CRC patient. This study aimed to identify the gene with CNV in those chromosomes and its association with sporadic CRC also the effect of CNV on expression level of the gene mRNA.
Method: The gene was identified by selection using analyzed data of CNV and SNP from GWAS study. Seven type of cell lines and 70 matched paired samples of cancerous and normal tissues were used in this study with approval from ethic commission. Real-Time PCR method was used to analyze both DOK5 gene CNV from DNA sample and DOK5 gene expression from RNA sample. DNA was extracted from tissues and cell lines, while RNA extracted from cell lines.
Results: Difference of DOK5 CN was significant in age group (P=0,01) with group ≥50 years old had higher CN of DOK5 gene (CN=1,58). DOK5 CN variable was associated with age group variable (P=0,028) where more than 50% samples of age ≥50 years old showed amplification of DOK5 CN. No significant difference (P >0,05) in CNV of DOK5 gene was detected in subjects if grouped based on their histopathology or gender. In cell lines, CN of DOK5 gene showed significant (P=0,007) and strong positive correlation (R=0,890) with mRNA expression level of DOK5 gene.
Conclusion: DOK5 gene was identified from GWAS CNV data. CNV amplification of DOK5 gene was associated with sporadic colorectal cancer in subject ≥50 years old. Amplified CNV of DOK5 gene affect the increased of DOK5 mRNA expression level in cell lines."

2015

T-Pdf

UI - Tesis Membership Universitas Indonesia Library

<< 1 2 3 4 5 6 7 8 9 10 >>

Hasil Pencarian :: Simpan CSV :: Kembali

Hasil Pencarian