Hasil Pencarian

Ditemukan 86747 dokumen yang sesuai dengan query

Harnindyto Wicaksana

Benchmarking analisis sentimen teks berbahasa Indonesia = Benchmarking sentiment analysis in Indonesian language

"Penelitian analisis sentimen sudah banyak dikaji untuk berbagai bahasa, termasuk bahasa Indonesia. Namun sayangnya, belum terdapat penelitian benchmarking analisis sentimen untuk teks berbahasa Indonesia. Hal ini menyebabkan kesulitan bagi para peneliti untuk mendapatkan informasi mengenai metode klasifikasi dengan performa terbaik pada saat ini. Dengan adanya permasalahan tersebut, penelitian ini dilakukan dengan tujuan membantu memberikan arahan untuk penelitian sentimen analisis dalam bahasa Indonesia. Untuk dapat memberikan arahan, penelitian ini berusaha untuk membandingkan pendekatan klasifikasi sentimen rule-based, machine learning dan deep learning serta teknik ekstraksi fitur untuk mendapatkan skenario analisis sentimen terbaik. Berdasarkan hasil eksperimen penelitian, ditunjukkan bahwa klasifikasi terbaik dicapai oleh deep learning, disusul dengan metode klasifikasi machine learning dan rule-based. Pencapaian nilai terbaik pada klasifikasi menggunakan deep learning diperoleh menggunakan model BERT. Untuk klasifikasi menggunakan machine learning, didapatkan bahwa nilai F1-Score terbaik diperoleh saat digunakan metode klasifikasi Logistic Regression dengan teknik ekstraksi fitur kombinasi unigram dengan leksikon kombinasi. Sedangkan untuk klasifikasi rule-based nilai F1-Score tertinggi didapatkan menggunakan metode klasifikasi adjektiva.

Currently, there have been many kinds of research done on sentiment analysis. However, there are no papers on sentiment analysis benchmarks for the Indonesian language. Due to the absence of such research, it became difficult for researchers to get information about classifiers with the best performance. Because of this problem, this research is conducted so it would be easier for researchers to get information and direction on doing Indonesian sentiment analysis. In this paper, we held an experiment comparing sentiment classification using rule-based, machine learning, and deep learning and comparing feature extraction techniques to achieve the best sentiment analysis scenario. Based on our experiments in this research, prediction using deep learning classification gave the best result compared to machine learning and rule-based classification. Using deep learning classification, the BERT model is used to get the best result. The best F1-Score for machine learning classification is obtained using a Logistic Regression classifier alongside a combination of unigram and combined lexicon feature extraction. Meanwhile, the best F1-Score for the rule-based classification is obtained using the Adjective classification method."

Depok: Fakultas Ilmu Komputer Universitas Indonesia;, 2021

S-pdf

UI - Skripsi Membership Universitas Indonesia Library

Setyawan Pratama

Benchmarking Analisis Sentimen Teks Berbahasa Indonesia = Benchmarking Sentiment Analysis in Indonesian Language

Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2021

S-pdf

UI - Skripsi Membership Universitas Indonesia Library

Fathia Amira Nuramalia

Analisis Kinerja Bidirectional Long Short-Term Memory pada Analisis Sentimen Twitter Berbahasa Indonesia = Performance Analysis of Bidirectional Long Short-Term Memory on Twitter Sentiment Analysis in Indonesian Language

"Twitter adalah platform media sosial microblogging yang memungkinkan komunikasi dua arah untuk mengutarakan opini dan komentar. Komentar-komentar yang beragam ini dapat memperlihatkan sentimen-sentimen masyarakat apabila dilakukan analisis sentimen. Analisis sentimen adalah studi yang menganalisis opini orang terhadap suatu produk, organisasi, individu, atau jasa tertentu. Machine learning merupakan metode yang dapat mempermudah proses klasifikasi sentimen. Penelitian ini dilakukan pada cuitan berbahasa Indonesia terkait Kampus Merdeka yang diambil dari Twitter menggunakan package tweepy sebanyak 1.651 cuitan terhitung dari tanggal 5 Maret 2022 hingga 13 Maret 2022. Model machine learning yang digunakan pada penelitian ini adalah Bidirectional Long Short-Term Memory (BiLSTM), dengan dua model hybrid LSTM-based, yaitu CNN-LSTM dan LSTM-CNN sebagai pembanding. Kinerja model diukur dengan metrik kinerja accuracy, precision, recall, dan F1-score. Implementasi dilakukan pada data yang telah dilakukan oversampling untuk mendapatkan hasil yang optimal. Penelitian menunjukkan bahwa model BiLSTM memiliki kinerja yang lebih unggul dibandingkan dengan dua model pembanding lainnya pada seluruh metrik dengan besar metrik, yaitu: accuracy dan recall sebesar 79,577%; precision sebesar 73,097%; dan F1-score sebesar 75,634%.

Twitter is a microblogging social media platform that allows two-way communication to express opinion and comments. These various comments can show us sentiment of the public when we perform a sentiment analysis. Sentiment analysis is a study that analyze the opinion of people towards a specific product, organization, individual, or service. Machine learning is a method that will help perform sentiment classification easier. This study performs analysis on 1.651 data tweets about Kampus Merdeka taken from Twitter using a package called tweepy since March 5th 2022 until March 13th 2022. The machine learning model used in this study is Bidirectional Long Short-Term Memory (BiLSTM), with two LSTM-based hybrid model, CNN-LSTM and LSTM-CNN as comparison models. Model performance is measured by performance metrics accuracy, precision, recall, and F1-score. Implementation was done on data that has been going through oversampling to achieve the best result. The study shows that BiLSTM performs better than the other two comparison models for all the metrics with the percentage of the each metric being: 79.577% for accuracy and recall; 73,097% for precision; and 75,634% for F1-score."

Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2022

S-pdf

UI - Skripsi Membership Universitas Indonesia Library

Tulus Setiawan

Studi Komparasi Kinerja Analisis Sentimen Bahasa Indonesia Berbasis Large Language Model BERT dan GPT = Comparative Study of Sentiment Analysis Performance of Indonesian Language Based on Large Language Model BERT and GPT

"Indonesia merupakan salah satu negara yang sempat terimbas COVID-19. Hal itu berdampak pada sektor pariwisata, khususnya industri perhotelan di Indonesia. Meskipun begitu, sekarang sektor pariwisata di Indonesia mulai pulih kembali, khususnya untuk industri perhotelan. Badan Pusat Statistik (BPS) mencatat bahwa pada tahun 2023, tingkat penghunian kamar (TPK) hotel bintang bahkan mengalami kenaikan dibandingkan dengan tahun 2022, kenaikan hotel bintang mencapai 51,12%. Dengan meningkatnya permintaan terhadap tingkat hunian hotel, ulasan yang diberikan oleh pelanggan terhadap hotel menjadi hal yang penting untuk dianalisis. Salah satu jenis analisis yang dapat dilakukan terhadap ulasan-ulasan tersebut adalah analisis sentimen untuk mengklasifikasi sentimen yang terkandung dalam ulasan ke dalam kelompok-kelompok sentimen tertentu. Walaupun model-model deep learning seperti Convolutional Neural Network (CNN), Long Short-Term Memory (LSTM), dan Gated Recurrent Unit (GRU) atau bahkan model hybrid dan fully-connected layer neural network dengan representasi Bidirectional Encoder Representations from Transformers (BERT) terbukti menghasilkan kinerja yang baik dalam melakukan analisis sentimen, tetapi beberapa masalah yang umumnya dihadapi adalah fleksibilitas, efisiensi waktu, dan sumber daya yang dibutuhkan dalam penggunaannya. Oleh sebab itu, metode GPT berbasis prompt dapat menjadi salah satu solusi untuk permasalahan tersebut. Dengan menggunakan GPT berbasis prompt, pengguna dapat langsung memanfaatkan pengetahuan dan pemahaman bahasa yang telah diperoleh model GPT selama proses pelatihan pada korpus teks yang sangat besar. Hal ini memungkinkan model untuk menghasilkan prediksi sentimen yang akurat tanpa perlu melalui proses pelatihan yang panjang dan kompleks. Penelitian ini menganalisis dan membandingkan kinerja Large Language Model BERT dan GPT sebagai metode untuk analisis sentimen berbahasa Indonesia. Hasil Penelitian menunjukkan bahwa rata-rata kinerja model GPT secara keseluruhan lebih unggul dibandingkan model BERT dengan fully-connected layer neural network (BERT-NN) untuk dataset tiket.com, PegiPegi, dan Traveloka. Secara spesifik, model GPT dengan pendekatan zero-shot memiliki rata-rata kinerja yang paling unggul dibandingkan dengan pendekatan one-shot dan few-shot. Untuk rata-rata kinerja terhadap ketiga dataset tersebut, GPT dengan pendekatan zero-shot memberikan peningkatan sebesar 1,28%, 1,45%, dan 6,2% untuk metrik akurasi, F1-score, dan sensitivity secara berurutan terhadap kinerja BERT-NN. Hasil ini menunjukkan potensi metode GPT berbasis prompt sebagai alternatif yang efisien dan fleksibel secara penggunaan untuk analisis sentimen pada ulasan hotel berbahasa Indonesia.

Indonesia was one of the countries affected by COVID-19. This impacted the tourism sector, particularly the hotel industry in Indonesia. However, the tourism sector in Indonesia is now beginning to recover, especially for the hotel industry. The Central Statistics Agency (BPS) recorded that in 2023, the occupancy rate of star-rated hotels even increased compared to 2022, with the increase reaching 51.12%. With the rising demand for hotel occupancy rates, customer reviews of hotels have become important to analyze. One type of analysis that can be performed on these reviews is sentiment analysis to classify the sentiments contained in the reviews into specific sentiment groups. Although deep learning models such as Convolutional Neural Network (CNN), Long Short-Term Memory (LSTM), and Gated Recurrent Unit (GRU), or even hybrid models and fully-connected layer neural networks with Bidirectional Encoder Representations from Transformers (BERT) representation have been proven to produce good performance in sentiment analysis, some common problems faced are flexibility, time efficiency, and resources required for their use. Therefore, prompt-based GPT methods can be a solution to these problems. By using prompt-based GPT, users can directly leverage the knowledge and language understanding that the GPT model has acquired during training on a vast text corpus. This allows the model to generate accurate sentiment predictions without going through a long and complex training process. This study analyzes and compares the performance of BERT and GPT Large Language Models as methods for Indonesian language sentiment analysis. The results show that the average overall performance of the GPT model is superior to the BERTmodel with a fully-connected layer neural network (BERT-NN) for datasets from tiket.com, PegiPegi, and Traveloka. Specifically, the GPT model with a zero-shot approach has the most superior average performance compared to the one-shot and few-shot approaches. For the average performance across these three datasets, GPT with a zero-shot approach provides improvements of 1.28%, 1.45%, and 6.2% for accuracy, F1-score, and sensitivity metrics, respectively, compared to BERT-NN performance. These results demonstrate the potential of prompt-based GPT methods as an efficient and flexible alternative for sentiment analysis on Indonesian language hotel reviews."

Depok: Fakultas Matematika Dan Ilmu Pengetahuan Alam Universitas Indonesia, 2024

S-pdf

UI - Skripsi Membership Universitas Indonesia Library

Rezki Hadiansah

Analisis Kinerja Long-short Term Memory -Convolutional Neural Network (LSTM-CNN) pada Permasalahan Lifelong Learning Analisis Sentimen Berbahasa Indonesia = Analysis of Performance Long Short Term Memory - Convolutional Neural Network for Lifelong Learning on the Problems of Sentiment Analysis in Indonesian

"Pesatnya perkembangan teknologi saat ini menjadi salah satu faktor berkembangnya media sosial. Pengguna media sosial khususnya di Indonesia sudah tidak diragukan lagi jumlahnya. Dari tingginya tingkat penggunaan media sosial, penelitian terkait data pada media sosial kerap dilakukan. Penelitian yang populer dilakukan adalah analisis sentimen. Analisis sentimen adalah kegiatan untuk mengklasifikasikan sentimen data tekstual ke dalam kelas positif atau negatif. Metode yang kerap digunakan adalah metode berbasis machine learning yaitu Convolutional Neural Network (CNN) dan Long-short Term Memory (LSTM). Metode CNN sudah terbukti baik digunakan untuk data tekstual. Adapun model gabungan yaitu LSTM-CNN yang sudah terbukti memberikan hasil lebih baik dibanding model CNN. Selanjutnya akan dilakukan analisis sentimen menggunakan model LSTM-CNN. Namun, metode berbasis machine learning hanya efektif digunakan pada satu domain saja. Berdasarkan hal tersebut, dikembangkanlah lifelong learning. Lifelong learning adalah metode dalam machine learning yang menerapkan pembelajaran berkelanjutan terhadap lebih dari satu domain. Lifelong learning pada machine learning meniru bagaimana manusia mempelajari sesuatu berdasarkan apa yang sudah dipelajari selanjutnya. Pada skripsi ini, akan dilakukan penelitian model LSTM-CNN untuk permasalahan lifelong learning analisis sentimen terhadap lima data berbahasa Indonesia. Lima data set tersebut akan digunakan sebagai data pembelajaran secara berkelanjutan terhadap suatu model LSTM-CNN. Evaluasi model akan dilakukan pada setiap proses pembelajaran yang dilakukan. Hasil yang diperoleh adalah perkembangan akurasi pada setiap proses pembelajaran terhadap suatu data set.

The rapid development of technology is currently one of the factors in the development of social media. There are no doubt about the number of social media users, especially in Indonesia. From the high level of use of social media, research related to data on social media is often done. Popular research is sentiment analysis. Sentiment analysis is an activity to classify textual data sentiments into positive or negative classes. The method often used is machine learning-based methods, namely Convolutional Neural Network (CNN) and Long-short Term Memory (LSTM). The CNN method has been proven good for textual data. The combined model is LSTM-CNN which has been proven to provide better results than the CNN model. Then sentiment analysis will be performed using the LSTM-CNN model. However, machine learning based methods are only effective in one domain. Based on this, lifelong learning was developed. Lifelong learning is a method in machine learning that applies continuous learning to more than one domain. Lifelong learning in machine learning mimics how humans learn something based on what has been learned next. In this thesis, LSTM-CNN model research will be conducted for the problem of lifelong learning sentiment analysis of five Indonesian-language data. The five data sets will be used as continuous learning data on an LSTM-CNN model. Evaluation of the model will be carried out in each learning process that is carried out. The results obtained are the development of accuracy in each learning process of a data set."

Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2020

S-pdf

UI - Skripsi Membership Universitas Indonesia Library

Suci Fitriyani

Model Gabungan fastText-CNN-BiLSTM untuk Analisis Sentimen pada Data Opini Berbahasa Indonesia = Hybrid Model fastText-CNN-BiLSTM for Sentiment Analysis on Indonesian Opinion Data

"Analisis sentimen merupakan studi komputasi untuk menganalisis opini seseorang terhadap suatu entitas yang diekspresikan dalam sebuah teks. Tersedia cukup banyak model machine learning terutama deep learning yang dapat digunakan untuk melakukan analisis sentimen seperti Convolutional Neural Network (CNN) dan Bidirectional Long Short-Term Memory (BiLSTM). Pada dasarnya, model deep learning tidak dapat memproses langsung sebuah data dalam bentuk teks sehingga diperlukan metode untuk mentransformasi teks menjadi tensor numerik seperti word embedding. Pada penelitian ini, diajukan model gabungan CNN-BiLSTM dengan word embedding fastText untuk melakukan analisis sentimen. Model tersebut dilatih menggunakan data tweet berbahasa Indonesia tentang opini masyarakat mengenai rencana subsidi pembelian kendaraan listrik di Indonesia. Data tersebut diklasifikasikan menjadi sentimen positif, negatif, dan netral dan ditemukan bahwa komposisi dari ketiga sentimen tersebut tidaklah seimbang (imbalanced dataset) dimana kelas positif memiliki lebih sedikit data dibanding kelaskelas lainnya. Untuk mengatasi masalah tersebut, digunakan metode resampling SMOTE agar jumlah data pada kelas positif dapat mengimbangi kelas lainnya. Model fastTextCNN-BiLSTM diukur performanya dengan melihat nilai akurasi, precision, recall, dan f1-score. Dari hasil penelitian didapat bahwa model gabungan CNN-BiLSTM memberikan nilai akurasi, precision, recall, dan f1-score yang paling baik dibanding model CNN dan BiLSTM saja. Model-model yang menggunakan word embedding fastText juga memberikan performa yang lebih baik dibanding model tanpa fastText (menggunakan word embedding standar). Secara keseluruhan, model gabungan fastTextCNN-BiLSTM ditemukan memiliki performa yang lebih baik dibandingkan dengan model-model lainnya.

Sentiment analysis is a computational study to analyze person’s opinion about an entity expressed in text. There are several machine learning models, especially deep learning models that can be used for sentiment analysis, such as Convolutional Neural Network (CNN) and Bidirectional Long Short-Term Memory (BiLSTM). Essentially, deep learning models cannot directly process textual data and they need a method to transform text into numerical tensors such as word embedding. In this research, a hybrid model CNN-BiLSTM with fastText word embedding is proposed for sentiment analysis. The model is trained using Indonesian tweets data regarding public opinions on the plan for subsidizing the purchase of electric vehicles in Indonesia. The data is classified into positive, negative, and neutral sentiments, and it is found that the composition of these sentiments is imbalanced, with the positive class having fewer data compared to the other classes. To address this issue, the SMOTE resampling method is used to balance the data in the positive class with the other classes. The performance of the fastText-CNNBiLSTM model is measured by accuracy, precision, recall, and f1-score. The research results show that the hybrid model CNN-BiLSTM achieves the highest accuracy, precision, recall, and f1-score compared to the single models CNN and BiLSTM. Models with fastText word embedding also outperform models without fastText (with standard word embedding). Overall, the hybrid model fastText-CNN-BiLSTM is found to outperform other models in terms of performance."

Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2023

S-pdf

UI - Skripsi Membership Universitas Indonesia Library

Muhammad Zuhri Bayhaqi

Pengembangan Sistem Analisis Sentimen Tentang Opini Pilpres Indonesia 2024 Pada Media Sosial Twitter Berbahasa Indonesia Menggunakan Algoritma Naïve Bayes = Development of a Sentiment Analysis System Regarding Opinions in the 2024 Indonesian Presidential Election on Twitter Social Media in Indonesian Using the Naïve Bayes Algorithm

"Analisis sentimen terhadap opini publik di Twitter dapat memberikan wawasan yang berharga dalam memahami dukungan dan pemikiran masyarakat terkait calon presiden dan isu-isu terkait Pilpres 2024. Penelitian ini bertujuan untuk mengembangkan sistem analisis sentimen terhadap opini publik tentang Pilpres Indonesia 2024 yang tersebar di media sosial Twitter dalam bahasa Indonesia. Algoritma yang digunakan dalam pengembangan sistem tersebut adalah NaÃ¯ve Bayes, sebuah algoritma klasifikasi yang telah terbukti efektif dalam analisis sentimen. Data yang digunakan dalam penelitian ini adalah kumpulan tweet atau cuitan yang diperoleh dari Twitter dengan menggunakan teknik web scraping. Persentasi Akurasi pada uji coba setiap skenario yang dilakukan mendapatkan hasil terbaik dengan nilai 81,18% untuk Skenario 1, 72,58% untuk Skenario 2, 65,05% untuk Skenario 3, dan 80,11% untuk Skenario 4. Hasil evaluasi model sistem yang dikembangkan terhadap klasifikasi sebenarnya menunjukkan bahwa analisis sentimen menggunakan algoritma NaÃ¯ve Bayes dapat memberikan hasil yang baik tentang sentimen opini publik terkait Pilpres Indonesia 2024 di media sosial Twitter. Pengembangan sistem yang dikerjakan memberikan hasil model yang dapat melakukan analisis sentimen secara mandiri dengan akurasi yang tinggi terhadap opini publik terkait Pilpres Indonesia 2024 dengan nilai rata-rata 81,18%. Hasil analisis sentimen ini dapat membantu pihak-pihak terkait, termasuk calon presiden dan tim kampanye mereka, untuk memahami sejauh mana opini publik mendukung atau menentang mereka.

Sentiment analysis of public opinion on Twitter can provide valuable insight in understanding public support and thoughts regarding presidential candidates and issues related to the 2024 presidential election. This research aims to develop a sentiment analysis system for public opinion about the 2024 Indonesian Presidential Election shared on Twitter social media. in Indonesian. The algorithm used in developing the system is NaÃ¯ve Bayes, a classification algorithm that has been proven effective in sentiment analysis. The data used in this research is a collection of tweets obtained from Twitter using web scraping techniques. The percentage of accuracy in testing each scenario carried out obtained the best results with a value of 81.18% for Scenario 1, 72.58% for Scenario 2, 65.05% for Scenario 3, and 80.11% for Scenario 4. Model evaluation results system developed for classification actually shows that sentiment analysis using the NaÃ¯ve Bayes algorithm can provide good results regarding public opinion sentiment regarding the 2024 Indonesian Presidential Election on Twitter social media. The system development carried out provides model results that can carry out sentiment analysis independently with high accuracy regarding public opinion regarding the 2024 Indonesian Presidential Election. The results of this sentiment analysis can help related parties, including presidential candidates and their campaign teams, to understand the extent of opinion. they. society supports or opposes them."

Depok: Fakultas Teknik Universitas Indonesia, 2024

S-pdf

UI - Skripsi Membership Universitas Indonesia Library

Riko Wijayanto

Analisis Sentimen Berbasis Aspek pada Teks Ulasan Pengguna di Google Play Store = Aspect Based Sentiment Analysis of User`s Review on Google Play Store

"Perkembangan teknologi informasi dan komunikasi (TIK) yang pesat menuntut inovasi dalam pengembangan aplikasi juga berkembang cepat. Aplikasi Tokopedia Seller merupakan salah satu aplikasi utama milik PT Tokopedia yang diperuntukkan bagi penjual dalam melakukan kegiatan operasional penjualan produk. Aplikasi yang baru diluncurkan di Android ini tergolong aplikasi perintis dan memerlukan banyak masukan dari pengguna, salah satunya dari Google Play Store. Akan tetapi, banyaknya ulasan yang masuk dan beragamnya opini, mengakibatkan proses analisis sentimen dan aspek ulasan menjadi lambat dan banyak terlewat. Oleh karena itu, perlu dilakukan suatu penelitian yang mengusulkan sistem otomatis untuk melakukan analisis sentimen berbasis aspek. Tujuan dari usulan sistem otomatis ini adalah untuk memudahkan proses analisis ulasan pengguna. Adapun data ulasan yang digunakan sebagai masukan eksperimen bersumber dari Google Play Store sejumlah 6.221 data berlabel dari Juli – September 2021. Penelitian ini menunjukkan bahwa algoritma Support Vector Machine (SVM) yang dipadukan dengan SMOTE menghasilkan performa yang paling baik dibandingkan dengan CNN dan Logistic Regression dengan accuracy 54%, precision 48%, dan recall 52% untuk mengklasifikan sentimen. Selaras dengan analisis sentimen, SVM dengan SMOTE juga menghasilkan performa yang lebih baik dengan accuracy 40%, precision 41%, dan recall 40%. Kondisi data ulasan yang cenderung singkat yakni kurang dari 10 kata, mengakibatkan performa klasifikasi kurang optimal.

The rapid development of information and communication technology (ICT) requires innovation in the field of application development. The Tokopedia Seller application is one of the main applications owned by PT Tokopedia which develops for sellers in carrying out product sales operational activities. It was just launched on Android, and it is classified as a pioneering application and requires a lot of input from users, one of which is from the Google Play Store. However, due to a lot of reviews came in, it makes the process of sentiment analysis and aspect review being slow and many being missed. Therefore, it is necessary to conduct a study that proposes a automatic system to perform aspect-based sentiment analysis. The purpose of this automated system proposal is to simplify the process of analyzing user reviews. The review of the data used as experimental input sourced from the Google Play Store with a total of 6,221 data labeled from July – September 2021. This study shows that the Support Vector Machine (SVM) algorithm combined with SMOTE produces the best performance compared to CNN and Logistic Regression with 54% accuracy, 48% precision, and 52% recall for classifying sentiments. In line with sentiment analysis, SVM with SMOTE also produces better performance with 40% accuracy, 41% precision, and 40% recall. The condition of the short review data is less than 10 words, resulting in a less than optimal classification performance."

Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2022

TA-pdf

UI - Tugas Akhir Universitas Indonesia Library

Steven Nathaniel Trosno

Pengembangan Sistem Analisis Sentimen Masyarakat Menggunakan Model IndoBERT Untuk Pemilihan Calon Presiden Indonesia 2024 Melalui Media Sosial X = Development of a Public Sentiment Analysis System Using the IndoBERT Model for the 2024 Indonesian Presidential Candidate Election via Social Media X

"Pemilihan umum presiden merupakan momen krusial dalam demokrasi, di mana opini publik memainkan peran penting dalam menentukan hasil. Dalam era digital, media sosial menjadi platform utama bagi masyarakat untuk menyampaikan pandangan dan opini mereka. Penelitian ini bertujuan untuk menganalisis sentimen masyarakat terhadap pemilihan bakal calon presiden Indonesia 2024, yaitu Ganjar, Prabowo, dan Anies melalui media sosial X menggunakan model IndoBERT. Data dikumpulkan dari media sosial X melalui teknik crawling untuk memastikan relevansi data. Model IndoBERT diterapkan untuk melakukan analisis sentimen terhadap data teks yang diklasifikasikan ke dalam kategori positif, negatif, dan netral. Hasil menunjukkan bahwa model dengan hyperparameter terbaik (learning rate 5e-6 dan data splitting 0.2) mencapai akurasi 94.66% dalam mengklasifikasikan sentimen, dengan nilai precision, recall, dan f1-score yang konsisten. Meskipun demikian, terdapat kecenderungan bahwa model memprediksi kurang atau memprediksi berlebih jumlah data pada semua kandidat. Analisis dari precision-recall curve menunjukkan bahwa ketidakseimbangan data memiliki pengaruh terhadap performa model, namun model dengan hyperparameter terbaik tetap mencapai nilai AUC 0.92 terhadap ketidakseimbangan data tersebut. Analisis sentimen ini memberikan wawasan penting bagi partai politik dalam menentukan strategi kampanye dan mengidentifikasi kandidat yang paling disukai oleh masyarakat dalam pemilihan umum presiden 2024.

The presidential election is a crucial moment in democracy, where public opinion plays a vital role in determining the outcome. In the digital era, social media has become a primary platform for people to express their views and opinions. This research aims to analyze public sentiment towards the 2024 Indonesian presidential candidates—Ganjar, Prabowo, and Anies—through social media platform X using the IndoBERT model. Data was collected from social media X through crawling techniques to ensure data relevance. The IndoBERT model was applied to perform sentiment analysis on the text data, classifying it into positive, negative, and neutral categories. The results show that the model with the best hyperparameters (learning rate of 5e-6 and data splitting of 0.2) achieved 94.66% accuracy in sentiment classification, with consistent precision, recall, and f1-score values. However, there is a tendency for the model to underpredict or overpredict the amount of data for all candidates. Analysis of the precision-recall curve indicates that data imbalance affects the model's performance, but the model with the best hyperparameters remains achieved AUC 0.92, indicating robustness against this imbalance. This sentiment analysis provides important insights for political parties in determining campaign strategies and identifying the most favored candidates by the public in the 2024 presidential election."

Depok: Fakultas Teknik Universitas Indonesia, 2024

S-pdf

UI - Skripsi Membership Universitas Indonesia Library

Maranatha Florensia Wijaya

Analisis kinerja modifikasi model gabungan long short-term memory dan convolutional neural network untuk analisis sentimen berbahasa Indonesia = Performance analysis of modified combined long short-term memory and convolutional neural network model on sentiment analysis in Indonesian language

"Analisis sentimen merupakan bidang studi yang menganalisis pendapat seseorang terhadap suatu entitas untuk mencari polaritas sentimennya. Potensi manfaat yang besar didukung dengan ketersediaan data teks beropini yang melimpah di internet memicu dikembangkannya model yang mampu melakukan analisis sentimen secara otomatis dan seakurat mungkin. Dua diantaranya adalah Long Short-Term Memory (LSTM) dan Convolutional Neural Network (CNN) yang merupakan arsitektur deep learning. LSTM digunakan karena dapat menangkap aliran informasi pada kalimat, sedangkan CNN digunakan karena kemampuannya dalam mengekstrak fitur penting dari tiap penggalan kalimat atau region. Kedua model ini dapat digabungkan menjadi model gabungan LSTM-CNN yang telah terbukti mampu meningkatkan akurasi model. Penelitian ini kemudian akan mengajukan modifikasi pada model gabungan LSTM-CNN dengan mengganti LSTM menjadi Bidirectional LSTM (BiLSTM) dan CNN menjadi CNN Multi Region Size CNNMRS sehingga terbentuk tiga model modifikasi yaitu BiLSTM-CNN, LSTM-CNNMRS, dan BiLSTM-CNNMRS. Implementasi model, baik untuk model gabungan LSTM-CNN standar maupun model modifikasi, dilakukan pada data tweets berbahasa Indonesia. Hasilnya, didapatkan kesimpulan bahwa penggunaan BiLSTM untuk menggantikan LSTM pada model gabungan LSTM CNN tidak meningkatkan akurasi dari model. Hal berbeda didapatkan dari penggunaan CNNMRS untuk menggantikan CNN yang memberikan peningkatan akurasi pada model."

Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2020

S-pdf

UI - Skripsi Membership Universitas Indonesia Library

<< 1 2 3 4 5 6 7 8 9 10 >>

Hasil Pencarian :: Simpan CSV :: Kembali

Hasil Pencarian