Popularitas K-pop tidak hanya di negaranya sendiri, namun juga di luar negeri. Beberapa penelitian tentang karakter musik telah dilakukan untuk melihat bagaimana karakter lagu-lagu populer, namun belum ada yang membahas mengenai K-pop. Karakter musik dapat diketahui dengan menggunakan pendekatan music mining, seperti dengan Random Forest yang dianggap sebagai metode klasifikasi paling akurat dibandingkan dengan metode lainnya. Oleh karena itu, penelitian ini bertujuan untuk menemukan karakter lagu-lagu K-pop populer dengan memanfaatkan hasil ekstraksi fitur audio dan ekstraksi lirik lagu sebagai input untuk membangun model klasifikasi Random Forest. Lagu-lagu K-pop yang dikumpulkan sebanyak 195 lagu dari daftar putar “K-Pop ON! (온)” dibagi menjadi 117 data untuk training dan 68 data untuk testing. Fitur audio yang diekstraksi dalam penelitian ini terdiri dari danceability, energy, loudness, mode, acoustic, instrumental, liveness, dan valence. Selain itu, lirik diekstraksi dan dikelompokkan menjadi 8 kelompok topik yang juga dijadikan sebagai input model. Model yang dihasilkan menunjukkan bahwa karakter lagu-lagu K-pop populer cenderung membawakan perasaan bahagia dan energi yang tinggi, cocok untuk digunakan menari, serta membahas mengenai interaksi antar individu atau tindakan seseorang. Evaluasi model menunjukkan akurasi model yang cukup baik dengan nilai accuracy sebesar 61,53% dan ketepatan model yang cukup baik dengan nilai precision 63,82%, serta sensitivitas model yang cukup baik dengan nilai recall 69,76%. Fitur yang paling banyak berkontribusi dalam model adalah valence, sedangkan fitur yang paling sedikit berkontribusi adalah topic 3.
The popularity of K-pop is not only happening in its own country, but also abroad. Some research on music character has been done to see how the character of popular songs is, but no one has studied K-pop’s character. Music character can be known by using music mining approaches, such as Random Forest which is considered the most accurate classification method compared to other methods. Therefore, this research aims to find the character of popular K-pop songs by utilizing the results of audio feature extraction and song lyrics extraction as input to build a Random Forest classification model. The 195 K-pop songs collected from the “K-Pop ON! (온)” playlist are divided, where 117 data for training and 68 data for testing. The audio features extracted in this study consist of danceability, energy, loudness, mode, acoustic, instrumental, liveness, and valence. In addition, the lyrics are extracted and clustered into 8 topic groups which were also used as model input. The resulting model shows that the characters of popular K-pop songs tend to bring feelings of happiness and high energy, are suitable for dancing, and describe the interaction between individuals or actions of a person. The model’s evaluation shows that the model’s accuracy is quite good with an accuracy value of 61.53%, the model’s precision is quite good with a precision value of 63.82%, and the model’s sensitivity is quite good with a recall value of 69.76%. The most contributing feature in the model is valence, while the least contributing feature is topic 3.