Hasil Pencarian  ::  Simpan CSV :: Kembali

Hasil Pencarian

Ditemukan 89350 dokumen yang sesuai dengan query
cover
Hepatika Zidny Ilmadina
"Leptomeningeal metastatis merupakan indikasi keganasan yang terjadi pada pasien leukemia. Meskipun hanya memiliki porsi 30-40% yang menyebabkan kekambuhan keganasan pada pasien leukemia, hal tersebut yang dijadikan dasar dalam menentukan pengobatan terbaik yang diberikan kepada mereka. Leptomeningeal metastasis lebih baik dideteksi dengan menggunakan Magnetic Resonance Imaging (MRI) karena sensitivitasnya yang tinggi dalam citra neuraxis. Kemampuan expert yang tinggi untuk melihat dan menganalisis sangat diperlukan dalam membaca hasil Brain MRI pasien leukemia dengan suspek leptomeningeal metastasis. Oleh karena itu, klasifikasi akan memakan waktu yang lama dan memungkinkan kesalahan pembacaan hasil. Berbagai metode telah banyak diusulkan dan dikembangkan dalam klasifikasi Brain MRI untuk mendapatkan hasil terbaik namun tantangan dalam penelitian ini adalah leptomeningeal metastasis yang karakteristiknya lebih sudah dikenali dibandingkan tumor pada otak. Oleh karena itu peneliti mengusulkan pengklasifikasian leptomeningeal metastasis dengan menggunakan metode CNN via transfer learning. Dengan berbagai skenario yang dilakukan, hasil akurasi terbaik adalah implementasi metode CNN (ResNet50) via transfer learning mencapai 82,22%.

Leptomeningeal metastasis is an indication of malignancy that occurs in leukemia patients. Although it only has a 30-40% portion, which causes recurrence of malignancy in leukemia patients, it is the basis for determining the best treatment given to them. Leptomeningeal metastases are better detected by using Magnetic Resonance Imaging (MRI) because of their high sensitivity in neuroaxis images. A high expert ability to see and analyze is needed in reading the brain MRI results of leukemia patients with suspected leptomeningeal metastasis. Therefore, the classification will take a long time and may an incorrect reading of the results. Various methods have been proposed and developed in the brain MRI classification to get the best results, but the challenge in this research is leptomeningeal metastasis, whose characteristics are more not recognizable than tumors in the brain. Therefore, we propose the classification of leptomeningeal metastasis using the CNN method via transfer learning. With various scenarios done, we obtained the best accuracy result is the implementation of the CNN (ResNet50) method via transfer learning, up to 82.22%."
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2020
T-Pdf
UI - Tesis Membership  Universitas Indonesia Library
cover
Muhammad Fakhry Firdausi
"Tanaman padi (Oryza Sativa) telah menjadi sumber pangan pokok bagi masyarakat Indonesia selama ribuan tahun. Dengan seiring bertambahnya jumlah masyarakat di Indonesia setiap tahunnya, tentunya kebutuhan akan tanaman padi semakin meningkat. Oleh karena itu, perlu adanya pemanfaatan teknologi untuk meningkatkan produksi serta mempertahankan kualitas padi untuk mempertahankan kualitas padi untuk memenu kebutuhan pangan masyarakat Indonesia. Penyakit yang umum menyerang tanaman padi di Indonesia adalah penyakit blas (blast), hawar daun (blight) dan tungro. Dalam penelitian ini, penulis menggunakan transfer learning dengan model DenseNet201 dan ResNet-50 untuk mengklasifikasi penyakit tanaman padi pada citra daun secara akurat. Data yang digunakan dalam penelitian ini diambil dari online database yang berisi 240 citra daun tanaman padi dengan 3 penyakit yang berupa penyakit blas (blast), hawar daun (blight) dan tungro. Selanjutnya, penulis menggunakan teknik preprocessing seperti resizing dan normalization serta berbagai macam teknik augmentasi seperti rotasi, zoom dan lain-lain untuk meningkatkan kinerja model dalam mengklasifikasi penyakit tanaman padi. Hasil penelitian ini menunjukkan bahwa model DenseNet201 memiliki kinerja yang jauh lebih baik dibandingkan dengan model ResNet-50 dalam mengklasifikasi penyakit tanaman padi. Evaluasi dari kinerja model dilihat dari nilai akurasi serta running time dimana model DenseNet201 memiliki akurasi testing sebesar 93,34% dan running time pada tahap training selama 74,7083 detik.

Rice (Oryza sativa) has been a staple food source for Indonesian people for thousands of years. With the increasing number of people in Indonesia every year, of course the need for rice plants is increasing. Therefore, it is necessary to use technology to increase production and maintain the quality of rice to maintain the quality of rice to meet the food needs of the Indonesian people. Diseases that commonly attack rice plants in Indonesia are blast, leaf blight and tungro disease. In this study, the authors used transfer learning with DenseNet201 and ResNet-50 models to classify rice plant diseases on leaf images accurately. The data used in this study were taken from an online database containing 240 images of rice leaves with 3 diseases, namely blast, blight and tungro. Furthermore, the authors use preprocessing techniques such as resizing and normalization as well as various kinds of augmentation techniques such as rotation, zoom and others to improve the performance of the model in classifying rice plant diseases. The results of this study indicate that the DenseNet201 model has a much better performance than the ResNet-50 model in classifying rice plant diseases. Evaluation of the model's performance is seen from the accuracy value and running time where the DenseNet201 model has a testing accuracy of 93.34% and the running time at the training stage is 74.7083 seconds."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2022
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Sitorus, Yusuf Beltsazar
"Tanaman karet merupakan salah satu komoditas utama ekspor Indonesia. Namun, dalam beberapa tahun terakhir, produksi karet di Indonesia mengalami penurunan. Hal tersebut disebabkan karena adanya penyakit gugur daun yang disebabkan oleh jamur Pestalotiopsis sp.. Berkembangnya teknologi artificial intelligence dengan pendekatan deep learning mampu melakukan pendeteksian pada penyakit ini dengan menggunakan data citra. Convolutional Neural Network (CNN) merupakan algoritma deep learning yang diterapkan pada data berbentuk visual atau citra. Pada penelitian ini, peneliti menggunakan metode Convolutional Neural Network (CNN) dengan arsitektur Residual Network 50 (ResNet-50). Pada penelitian ini juga digunakan Transfer Learning yang merupakan sebuah model yang dapat diajarkan dan disempurnakan untuk suatu kegiatan dan kemudian bisa diterapkan pada kegiatan lain. Dataset yang digunakan pada penelitian ini adalah data daun karet yang berjumlah 1629 data yang dibagi dalam 5 kelas yaitu level 0 atau sehat merupakan daun yang sehat, level 1 merupakan daun yang telah terbentuk bercak coklat yang merupakan gejala dari penyakit namun belum memiliki tanda-tanda perubahan warna, level 2 merupakan daun yang telah terbentuk banyak bercak cokelat disertai dengan adanya perubahan warna pada daun, level 3 merupakan daun yang mengalami kerusakan jaringan, perubahan warna menjadi cokelat atau kuning namun masih memiliki sedikit bagian daun yang berwarna hijau, level 4 merupakan daun yang mengalami kerusakan jaringan cukup parah, dipenuhi bercak cokelat dan telah berwarna cokelat menyeluruh. Dari hasil simulasi yang dilakukan, diperoleh hasil terbaik dengan rata-rata accuracy 96,01%, recall 95,888%, dan precision 96,184% dengan running time rata-rata running time 69,759 detik.

Rubber plants are one of Indonesia's main export commodities. However, in recent years, rubber production in Indonesia has experienced a decline. This is due to the presence of the leaf fall disease caused by the Pestalotiopsis sp. fungus. The advancement of artificial intelligence technology using deep learning approaches enables the detection of this disease using image data. The Convolutional Neural Network (CNN) is a deep learning algorithm applied to visual or image data. In this study, researchers utilized the Convolutional Neural Network (CNN) method with the Residual Network 50 (ResNet50) architecture. Transfer Learning was also employed in this research, which involves training and refining a model for one task and then applying it to another task. The dataset used in this study consists of 1629 rubber leaf samples divided into 5 classes: level 0, representing the healthy leaves; level 1, indicating leaves with brown spots, a symptom of the disease, but without major visible color changes; level 2, comprising of leaves with numerous brown spots accompanied by slight color changes; level 3, representing leaves with tissue damage, a color change from green to brown or yellow, but still retaining some green parts; and level 4, depicting leaves with severe tissue damage, extensively covered in brown spots and having turned completely brown. The simulation results showed the best outcome with an average accuracy of 96.01%, recall of 95.888%, and precision of 96.184%, with an average running time of 69.759 seconds."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2023
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Martin Hizkia Parasi
"

Perkembangan teknologi pemrosesan ucapan sangat pesat akhir-akhir ini. Namun, fokus penelitian dalam Bahasa Indonesia masih terbilang sedikit, walaupun manfaat dan benefit yang dapat diperoleh sangat banyak dari pengembangan tersebut. Hal tersebut yang melatarbelakangi dilakukan penelitian ini. Pada penelitian ini digunakan model transfer learning (Inception dan ResNet) dan CNN untuk melakukan prediksi emosi terhadap suara manusia berbahasa Indonesia. Kumpulan data yang digunakan dalam penelitian ini, diperoleh dari berbagai film dalam Bahasa Indonesia. Film-film tersebut dipotong menjadi potongan yang lebih kecil dan dilakukan dua metode ekstraksi fitur dari potongan audio tersebut. Ekstraksi fitur yang digunakan adalah Mel-Spectrogram dan MelFrequency Cepstral Coefficient (MFCC). Data yang diperoleh dari kedua ekstraksi fitur tersebut dilatih pada tiga model yang digunakan (Inception, ResNet, serta CNN). Dari percobaan yang telah dilakukan, didapatkan bahwa model ResNet memiliki performa yang lebih baik dibanding Inception dan CNN, dengan rata-rata akurasi 49%. Pelatihan model menggunakan hyperparameter dengan batch size sebesar 16 dan dropout (0,2 untuk Mel-Spectrogram dan 0,4 untuk MFCC) demi mendapatkan performa terbaik.


Speech processing technology advancement has been snowballing for these several years. Nevertheless, research in the Indonesian language can be counted to be little compared to other technology research. Because of that, this research was done. In this research, the transfer learning models, focused on Inception and ResNet, were used to do the speech emotion recognition prediction based on human speech in the Indonesian language. The dataset that is used in this research was collected manually from several films and movies in Indonesian. The films were cut into several smaller parts and were extracted using the Mel-Spectrogram and Mel-frequency Cepstrum Coefficient (MFCC) feature extraction. The data, which is consist of the picture of Mel-spectrogram and MFCC, was trained on the models followed by testing. Based on the experiments done, the ResNet model has better accuracy and performance compared to the Inception and simple CNN, with 49% of accuracy. The experiments also showed that the best hyperparameter for this type of training is 16 batch size, 0.2 dropout sizes for Mel-spectrogram feature extraction, and 0.4 dropout sizes for MFCC to get the best performance out of the model used.

"
Depok: Fakultas Teknik Universitas Indonesia, 2022
S-Pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Nur Rachmawati
"Metadata statistik memiliki peran yang sangat penting bagi masyarakat. Dengan adanya metadata statistik, kita dapat mengetahui segala informasi mengenai semua kegiatan statistik yang dilakukan. Pada penelitian ini kami akan membangun sistem Closed Domain Question Answering (CDQA) mengenai metadata statistik (CDQA-Metadata Statistik). Sistem ini dibangun dengan menggunakan metode transfer learning pada data human question dan automatic question. Penggunaan metode transfer learning digunakan karena benchmark yang besar mengenai metadata statistik belum ada sama sekali. Pada penelitian ini kami akan menggunakan arsitektur retriever(BM25)-reader(IndoBERT) berbasis transfer learning. Ada tiga eksperimen utama yang kami lakukan. Hasil eksperimen pertama kami menunjukkan bahwa pada data human question model twostage fine-tuning (human) yang merupakan model dengan metode transfer learning secara statistik sangat signifikan mengguguli model non transfer learning dengan peningkatan exact match sebesar 53 kali lipat dan f1-score sebesar 9 kali lipat. Kemudian pada data automatic question, model two-stage fine-tuning (automatic) yang merupakan model dengan metode transfer learning secara statistik signifikan mengguguli model non transfer learning dengan peningkatan 80 kali lipat untuk exact match dan 13 kali lipat untuk f1-score. Hasil eksperimen kedua kami menujukkan bahwa sistem CDQAMetadata Statistik berbasis transfer learning secara statistik signifikan lebih baik pada data automatic question dibandingkan data human question. Hal ini mungkin disebabkan pada data automatic question memiliki term-of overlap yang lebih banyak dibandingkan data human question. Lalu pada hasil eksperimen ketiga menunjukkan bahwa pada data human question, penambahan data automatic question saat fine-tuning tidak dapat meningkatkan performa CDQA-Metadata Statistik. Begitu juga pada data automatic question, penambahan data human question saat fine-tuning ternyata tidak dapat meningkatkan performa CDQA-Metadata Statistik.

Statistical metadata plays a very important role in society. With statistical metadata, we can find out all the information regarding all statistical activities carried out. In this research we will build a Closed Domain Question Answering system (CDQA) regarding statistical metadata (CDQA-Statistical Metadata). This system was built using the transfer learning method on human question and automatic question data. The use of the transfer learning method is used because large benchmarks regarding statistical metadata do not yet exist. In this research we will use a retriever (BM25)-reader (IndoBERT) architecture based on transfer learning. There were three main experiments we conducted. The results of our first experiment show that in human question data the two-stage fine-tuning (human) model, which is a model using the transfer learning method, is statistically very significantly superior to the non-transfer learning model with an increase in exact match of 53 times and f1-score of 9 times. Then in the automatic question data, the two-stage fine-tuning (automatic) model, which is a model using the transfer learning method, statistically significantly outperforms the non-transfer learning model with an increase of 80 times for exact match and 13 times for f1-score. The results of our second experiment show that CDQA-Metadata Statistik system based on transfer learning significantly as statistics get better performance in automatic question data than in human question data. This is because automatic question data have more term-of overlap than human question data. Then the results of the third experiment show that for human question data, the addition of the automatic question data during fine-tuning cannot improve the performance of CDQA-Metadata Statistics. Likewise for automatic question data, the addition of a human question data during fine-tuning apparently did not improve the performance of CDQA-Metadata Statistics."
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2024
T-pdf
UI - Tesis Membership  Universitas Indonesia Library
cover
Ahmad Rafiul Mahdi
"Pandemi COVID-19 yang semakin mengkhawatirkan telah membatasi masyarakat dalam melakukan kontak fisik dengan benda-benda pada fasilitas umum. Berbagai sarana interaksi yang membutuhkan kontak fisik telah digantikan dengan alternatif yang mendukung interaksi secara contactless. Elevator merupakan salah satu fasilitas umum yang paling sering digunakan masyarakat, maka perlunya alternatif dari penggunaan tombol pada elevator untuk mengurangi kemungkinan tersebarnya virus. Perkembangan teknologi computer vision telah menghasilkan banyak implementasi yang bermanfaat, salah satu implementasi tersebut adalah pendeteksian objek. Pada penelitian ini, dilakukan perancangan dan implementasi dari deep learning untuk menghasilkan model pengenalan gestur tangan secara real-time yang ditujukan untuk diterapkan sebagai sarana interaksi dengan elevator. Metode transfer learning digunakan karena dapat menghasilkan model yang akurat tanpa perlu menggunakan dataset yang besar. Perancangan model dilakukan menggunakan Tensorflow Object Detection API dan SSD MobileNetV2 sebagai pre-trained model yang telah dilatih dengan dataset Microsoft COCO. Model yang telah dilatih dengan jumlah training steps sebesar 11000 menggunakan Dataset A pada nilai threshold 0.7 dapat mendeteksi 8 gestur tangan dengan nilai akurasi mencapai 90% berdasarkan uji coba real-time yang dilakukan.

The increasingly worrying COVID-19 pandemic has limited people from making physical contact with objects in public facilities. Various means of interaction that require physical contact have been replaced with alternatives that support contactless interaction. Elevators are one of the public facilities that are most often used by the public, so there is a need for alternatives to using buttons on elevators to reduce the possibility of spreading the virus. The development of computer vision technology has resulted in many useful implementations, one of which is object detection. In this research, the design and implementation of deep learning and artificial neural network is carried out to produce a real-time hand gesture recognition model that is intended to be applied as a means of interaction with elevators. The transfer learning method is used because it can produce accurate models without the need to use large datasets. The model design is carried out using the Tensorflow Object Detection API and SSD MobileNetV2 as a pre-trained model that has been trained with the Microsoft COCO dataset. The model that has been trained with the number of training steps of 11000 using the Dataset A at a threshold value of 0.7 can detect 8 hand gestures with an accuracy reaching up to 90% based on real-time trials carried out."
Depok: Fakultas Teknik Universitas Indonesia, 2021
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Naufal Hilmizen
"Pada awal pandemi COVID-19, keputusan medis pada pasien ditentukan oleh dokter berdasarkan banyak tes medis (misalnya, tes reaksi berantai polimerase, tes suhu, CTScan atau X-ray). Metode transfer learning telah digunakan dalam beberapa penelitian dan berfokus hanya pada satu biomarker (misalnya, hanya CT-Scan atau X-Ray saja) untuk mendiagnosis pneumonia. Dalam studi terbaru, modalitas tunggal memiliki keakuratan klasifikasi sendiri dan setiap biomarker yang berbeda dapat memberikan informasi pelengkap untuk mendiagnosis COVID-19 pneumonia. Tujuan pada penelitian ini adalah membangun model multimodal yaitu dengan menggabungkan dua masukan (input) menjadi satu keluaran (output) pada tahapan pembuatan model. Dua model transfer learning yang berbeda telah digunakan pada masing-masing masukan dengan dataset open-source 2849 gambar CT-Scan dan 2849 gambar X-ray untuk mengklasifikasikan gambar CT-Scan dan gambar X-ray menjadi dua kelas: normal dan COVID-19 pneumonia. Model transfer learning yang digunakan adalah model DenseNet121, model MobileNet, model Xception, model InceptionV3, model ResNet50 dan model VGG16 untuk proses ekstraksi fitur. Alhasil, akurasi klasifikasi terbaik didapatkan sebesar 99,87% saat penggabungan jaringan ResNet50 dan VGG16. Kemudian, akurasi klasifikasi terbaik didapatkan sebesar 98,00% saat menggunakan modalitas tunggal model ResNet50 dengan data CT-Scan dan akurasi klasifikasi sebesar 98,93% untuk model VGG16 dengan data X-Ray. Metode penggabungan multimodal learning menunjukkan akurasi klasifikasi yang lebih baik dibandingkan dengan metode yang menggunakan hanya satu modalitas saja.

Due to COVID-19 Pandemic, medical decisions on patients were made by doctors based on many medical tests (e.g., polymerase chain reaction test, temperature test, CT-Scan or X-ray). Transfer learning methods have been used in several studies and focus on only one biomarker (eg, CT-Scan or X-Ray only) for diagnosing pneumonia. In recent studies, a single modality has its own classification accuracy and each different biomarker can provide complementary information for diagnosing COVID-19 pneumonia. The purpose of this research is to build a multimodal model by combining two inputs (inputs) into one output (output) at the modeling stage. Two different transfer learning models were used at each input with an open-source dataset of 2849 CT-Scan images and 2849 X-ray images to classify CT-Scan images and X-ray images into two classes: normal and COVID-19 pneumonia. . The transfer learning model used is the DenseNet121 model, the MobileNet model, the Xception model, the InceptionV3 model, the ResNet50 model and the VGG16 model for the feature extraction process. As a result, the best classification accuracy was obtained at 99.87% when merging the ResNet50 and VGG16 networks. Then, the best classification accuracy was obtained at 98.00% when using a single modality ResNet50 model with CT-Scan data and a classification accuracy of 98.93% for the VGG16 model with X-Ray data. The multimodal learning combination method shows better classification accuracy than the method that uses only one modality."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2021
T-pdf
UI - Tesis Membership  Universitas Indonesia Library
cover
Nadya Novalina
"COVID-19 adalah penyakit infeksi menular yang disebabkan oleh virus SARS-CoV-2 dan dapat menyebabkan gangguan pada sistem pernapasan. Pencitraan X-Ray dapat menjadi alternatif dalam mendeteksi COVID-19 karena mampu menggambarkan kondisi paru-paru pasien. Deep learning dapat digunakan untuk menganalisis pola pada citra medis secara otomatis. Untuk itu, digunakan Convolutional Neural Network dengan teknik transfer learning menggunakan arsitektur Xception, EfficientNetB3, dan ensemble dari kedua model secara paralel untuk deteksi COVID-19 dan tingkat keparahannya dari citra X-Ray dada secara otomatis. Klasifikasi COVID-19 dilakukan untuk empat jenis kelas, yaitu: positif COVID-19, normal, pneumonia bakteri dan pneumonia virus. Pada klasifikasi COVID-19, ketiga model classifier yang diusulkan mencapai akurasi keseluruhan untuk semua kelas sebesar 94,44% untuk classifier Xception, 95,28% untuk classifier EfficientNetB3, dan 94,44% untuk classifier paralel. Nilai akurasi tersebut lebih tinggi dari nilai akurasi classifier lain. Klasifikasi tingkat keparahan COVID-19 dilakukan untuk tiga jenis kelas yaitu: ringan, sedang, dan parah. Pada klasifikasi tingkat keparahan COVID-19, ketiga model classifier yang diusulkan mencapai akurasi keseluruhan untuk semua kelas sebesar 70,00% untuk classifier Xception, 67,50% untuk classifier EfficientNetB3 dan paralel. Nilai akurasi tersebut lebih tinggi dari nilai akurasi classifier lain. Secara keseluruhan, ketiga classifier yang diusulkan dapat direkomendasikan sebagai alat yang dapat membantu ahli radiologi dan praktisi klinis dalam diagnosis dan tindak lanjut kasus COVID-19.

COVID-19 is a contagious infectious disease caused by the SARS-CoV-2 virus and can cause disorders of the respiratory system. X-Ray imaging can be an alternative in detecting COVID-19 because it is able to describe the condition of the patient's lungs. Deep learning can be used to analyze patterns in medical images automatically. For this reason, Convolutional Neural Network is used with transfer learning techniques using Xception, EfficientNetB3 architecture, and an ensemble of both models in parallel for the detection of COVID-19 and its severity level from Chest X-Ray images automatically. The classification of COVID-19 is carried out for four types of classes, namely: positive COVID-19, normal, bacterial pneumonia, and viral pneumonia. In the COVID-19 classification, the three proposed classifier models achieve overall accuracy for all classes of 94.44% for the Xception classifier, 95.28% for the EfficientNetB3 classifier, and 94.44% for the parallel classifier. The accuracy value is higher than the other classifier accuracy values. The classification of the severity level of COVID-19 is carried out for three types of classes, namely: mild, moderate, and severe. In the classification of the severity level of COVID-19, the three proposed classifier models achieve overall accuracy for all classes of 70.00% for the Xception classifier, 67.50% for the EfficientNetB3 classifier and parallel. The accuracy value is higher than the other classifier accuracy values. Overall, the three proposed classifiers can be recommended as tools that can assist radiologists and clinical practitioners in the diagnosis and follow-up of COVID-19 cases."
Depok: Fakultas Teknik Universitas Indonesia, 2021
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Sugiri
"Sebagian besar studi terbaru dalam abstractive summarization melakukan pendekatan dengan melakukan fine-tuning pretrained language generation model (PLGM). PLGM yang digunakan biasanya merupakan versi monolingual, yang hanya memiliki informasi bahasa yang sesuai dengan dataset yang digunakan. Penelitian ini menggunakan PLGM berbasis multilingual, yang menghasilkan kinerja yang cukup kompetitif jika dibandingkan dengan solusi state-of-the-art yang ada. Dengan menggunakan PLGM berbasis multilingual manfaat yang dihasilkan akan berdampak lebih luas sebanyak informasi bahasa yang dimiliki oleh PLGM terkait. Teknik CTRLSum, yaitu penambahan keyphrase di awal source document, terbukti dapat membuat PLGM menghasilkan summary sesuai dengan keyphrase yang disertakan. Penelitian ini menggunakan teknik mCTRLSum, yaitu teknik CTRLSum dengan menggunakan multilingual PLGM. Untuk mendapatkan keyphrase, selain dengan menggunakan teknik keyphrase extraction (KPE) yang memilih kata yang ada di source document, juga digunakan teknik keyphrase generation (KPG) yaitu teknik pembangkitan suatu set kata/frasa berdasarkan suatu source document dataset berbahasa Inggris, tidak hanya dilatih menggunakan oracle keyphrase sebagai pseudo-target dari dataset summarization, model KPG juga dilatih menggunakan dataset khusus permasalahan KPG dengan domain dan bahasa yang sama. Dengan teknik mCTRLSum yang memanfaatkan oracle keyphrase,  penelitian ini mendeklarasikan batas atas solusi permasalahan abstractive summarization pada dataset Liputan6, dan XLSum berbahasa Inggris, Indonesia, Spanyol, dan Perancis dengan peningkatan terbesar pada dataset Liputan6 sebanyak 22.54 skor ROUGE-1, 18.36 skor ROUGE-2, 15.81 skor ROUGE-L, dan 7.16 skor BERTScore, dan rata-rata 9.36 skor ROUGE-1, 6.47 skor ROUGE-2, 6.68 skor ROUGE-L dan 3.14 BERTScore pada dataset XLSum yang digunakan pada penelitian ini.

Most of the recent studies in abstractive summarization approach by fine-tuning the pre-trained language generation model (PLGM). PLGM used is usually a monolingual version, which only has language information that corresponds to the dataset used. This study uses amultilingual-basedd PLGM, which results in quite competitive performance, compared to existing state-of-the-art solutions. Using a PLGM based on the multilingual benefits generated, it will have a wider impact as much as the language information base owned by the related PLGM. The CTRLSum technique, which is the addition of a keyphrase at the beginning of the source document, is proven to be able to make PLGM produce a summary according to the included keyphrase. This study uses the mCTRLsum technique, namely the CTRLsum technique using multilingual PLGM. To get thekey phrasee, in addition to using the keyphrase extraction (KPE) technique, the words in the source document, keyphrase generation (KPG) techniques are also used, namely the technique of generating a set of words/phrases based on a source document. On the English dataset, not only using the oracle keyphrase as the pseudo-target of the dataset summariza buttion, the KPG model also uses the dataset specifically for KPG problems with the same domain and language. With the mCTRLsum technique that utilizes the oracle keyphrase, this study declares the upper bound of the solution to the abstractive summarization problem in the Liputan6 and XLSum in English, Indonesian, Spanish, and French datasets with the highest increase in Liputan6 dataset of 22.54 ROUGE-1 score, 18.36 ROUGE-2 score, 15.81 ROUGE-L score, and 7.16 BERTScore, and in average of 9.36 ROUGE-1 score, 6.47 ROUGE-2 score, 6.68 ROUGE-L score, and 3.14 BERTScore on XLSum dataset used in this research."
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2022
T-pdf
UI - Tesis Membership  Universitas Indonesia Library
cover
Amanda Nydia Augustizhafira
"Analisis sentimen merupakan bagian dari data mining text mining , yaitu proses memahami, mengekstrak, dan mengolah data tekstual secara otomatis untuk mendapatkan informasi. Pada penelitian ini, analisis sentimen diterapkan pada salah satu media sosial, yaitu Twitter. Analisis sentimen tergolong sebagai masalah klasifikasi yang dapat diselesaikan menggunakan salah satu metode machine learning, yaitu Neural Network. Pada machine learning, data dibagi menjadi data pelatihan dan data pengujian yang berasal dari domain yang sama.
Permasalahan utama pada penelitian ini adalah data pelatihan dan data pengujian berasal dari dua domain yang berbeda, sehingga perlu diterapkan pembelajaran lain selain machine learning. Masalah tersebut dapat diselesaikan dengan menggunakan transfer learning. Transfer learning merupakan suatu pembelajaran model yang dibangun oleh suatu data pelatihan dari suatu domain dan diuji oleh suatu data pengujian dari domain yang berbeda dari domain data pelatihan. Simulasi dalam penelitian ini menghasilkan suatu akurasi transfer learning dengan metode Neural Network yang nantinya akan diuji dengan fitur n-gram bi-gram dan tri-gram serta satu metode seleksi fitur, yaitu Extra-Trees Classifier.
Dalam penelitian ini, nilai akurasi transfer learning tertinggi didapat saat hidden layer berjumlah satu. Sebagian besar nilai akurasi tertinggi didapat saat penggunaan 250 neuron pada hidden layer. Fungsi aktivasi ReLU dan tanh menghasilkan nilai akurasi yang lebih tinggi dibandingkan fungsi aktivasi logistic sigmoid. Penggunakan metode seleksi fitur dapat meningkatkan kinerja transfer learning sehingga nilai akurasinya lebih tinggi dibandingkan simulasi tanpa penggunaan metode seleksi fitur.

Sentiment analysis is a part of data mining text mining , which is the process of understanding, extracting, and processing textual data automatically to obtain information. In this research, sentiment analysis is applied to one social media called Twitter. Sentiment analysis is categorized as a classification problem that can be solved using one of machine learning methods, namely Neural Network. In machine learning, data is divided into training data and test data from the same domain.
The main problem in this research is training data and test data come from two different domains, so it is necessary to apply other learning beside machine learning. The problem can be solved by using transfer learning. Transfer learning is a model learning constructed by a training data from a domain and tested by a test data from a different domain from the training data domain. The simulation in this research resulted in an accuracy of learning transfer with Neural Network method which will be tested using n grams bi grams and tri grams and one feature selection method called Extra Trees Classifier.
In this research, the highest value of transfer learning accuracy is obtained when one hidden layer is used. Most of the highest accuracy values are obtained from the use of 250 neurons on the hidden layer. The activation function of ReLU and tanh yield a higher accuracy value than the logical activation function sigmoid . The use of feature selection method can improve the transfer learning performance so that the accuracy value is higher than simulation without the use of feature selection method.
"
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2018
S-Pdf
UI - Skripsi Membership  Universitas Indonesia Library
<<   1 2 3 4 5 6 7 8 9 10   >>