Pemerintah Indonesia mengeluarkan kebijakan untuk melakukan pemindahan ibu kota negara (IKN) dari Jakarta ke Kalimantan di tahun 2019. Hal tersebut menuai respons dari masyarakat, ada kelompok yang setuju dan ada yang tidak setuju. Opini dari masyarakat tentang pemindahan ibu kota banyak beredar melalu sosial media khususnya Twitter. Pemindahan ibu kota butuh proses panjang dan direncanakan dimulai di tahun 2024. Sampai saat ini sudah banyak kebijakan turunan dari pemerintah agar proses pemindahan ibu kota negara tetap berlangsung. Begitu juga dengan opini masyarakat di Twitter bermunculan menanggapi kebijakan tersebut. Sudah hampir 4 tahun sejak ditetapkan, sudah cukup banyak juga opini dari masyarakat tentang pemindahan IKN. Maka dari itu penelitian ini bertujuan untuk mengetahui sentimen masyarakat tentang pemindahan ibu kota negara beserta topik-topik yang menjadi perbincangannya. Penelitian ini dilakukan dengan cara mengumpulkan data dari Twitter sejak 2019 sampai 2022 tentang pemindahan ibu kota negara. Data yang dikumpulkan akan melewati serangkaian data preprosesing yang kemudian diklasifikasikan ke dalam sentimen positif, netral, dan negatif. Pemodelan sentimen dilakukan menggunakan lima model klasifikasi untuk mencari keakuratan terbaik, yaitu Naïve Bayes (NB), Support Vector Machine (SVM), Logistic Regression (LR), Decision Tree (DT), dan Random Forest (RF). Masing-masing algoritma dijalankan dua kali dari 2 sampel yang tanpa melewati balancing, dan satunya lagi menggunakan oversampling. Pemodelan topik dilakukan menggunakan Latent Dirichlet Allocation (LDA). Kedua pemodelan ini digunakan untuk memvisualisasikan sentimen dan topik-topiknya ke dalam visualisasi time series. Pemodelan sentimen terbaik yang dihasilkan adalah RF dari sampel oversampling dengan nilai akurasi 82%. Pemodelan tersebut menghasilkan distribusi sentimen dengan sentimen positif mendominasi sebanyak 46.5%, sentimen netral sebanyak 31.6%, dan sentimen negatif sebanyak 21.9%. Hasil visualisasi time series menunjukkan bahwa sentimen positif tidak selalu mendominasi, namun hanya pada tahun 2022. Pemodelan topik menghasilkan 15 topik untuk sentimen positif, 11 topik untuk sentimen netral, dan 8 topik untuk sentimen negatif. Visualisasi topik time series memperlihatkan bahwa beberapa topik mendominasi perbincangan di Twitter, namun hanya pada bulan-bulan tertentu. Visualisasi time series dapat memberikan gambaran yang lebih komprehensif pada penelitian analisis sentimen dan pemodelan topik.
Indonesian government issued a policy to move the national capital or ibu kota negara (IKN) from Jakarta to Kalimantan in 2019. This drew pros and cons from the public, there were groups who agreed and there were those who disagreed. Opinions from the public regarding the relocation of the capital city are widely circulated through social media, especially Twitter. Moving the capital city requires a long process and is planned to begin in 2024. Until now, there have been many derivative policies from the government so that the process of moving the national capital continues. Likewise, public opinion has sprung up ont Twitter in response to this policy. It's been almost 4 years since it was established, so there's been quite a lot of opinion from the public about the transfer of the IKN. Therefore this study aims to determine public sentimen about the relocation of the national capital along with the topics of discussion. This research is conducted by collecting data from Twitter from 2019 to 2022 regarding the relocation of the national capital. The data collected will go through a series of pre-processing data which are then classified into positive, neutral and negative sentimens. Sentimen modeling is carried out using five classification models to find the best accuracy, namely Naïve Bayes (NB), Support Vector Machine (SVM), Logistic Regression (LR), Decision Tree (DT), and Random Forest (RF). Each algorithm is run twice from 2 samples without going through balancing, and the other uses oversampling. Topic modeling is done using Latent Dirichlet Allocation (LDA). These two models are used to visualize sentimen and topics into a time series visualization. The best sentimen modeling produced is RF from oversampling samples with an accuracy value of 82%. This modeling produces a sentimen distribution with positive sentimen dominating by 46.5%, neutral sentimen by 31.6%, and negative sentimen by 21.9%. The results of the time series visualization show that positive sentimen does not always dominate, but only in 2022. The topic modeling produces 15 topics for positive sentimen, 11 topics for neutral sentimen, and 8 topics for negative sentimen. The time series topic visualization shows that several topics dominate the conversation on Twitter, but only in certain months. Time series visualization can provide a more comprehensive picture of sentimen analysis research and topic modeling.