Di Indonesia, gangguan mental merupakan kontributor beban penyakit terendah, tetapi menjadi penyebab kecacatan utama jika dibandingkan dengan penyakit kardiovaskuler, neoplasma, maternal dan neonatal, juga infeksi pernafasan dan TB. Di media sosial, banyak pengguna melakukan diskusi dan membagikan konten edukatif mengenai kesehatan mental. Pengguna yang merupakan penderita gangguan mental juga banyak yang melakukan self reported diagnoses. Penelitian ini menggunakan data yang berasal dari Twitter yang akan digunakan untuk membangun model klasifikasi, analisis faktor apa yang menyebabkan sebuah tweet dapat diklasifikasikan sebagai tweet yang merefleksikan gangguan mental, dan menganalisis tweet yang merefleksikan gangguan mental. Model klasifikasi yang dibangun adalah model relevansi untuk menentukan relevansi dari suatu tweet dan model kategori untuk mengkategorikan tweet yang relevan ke dalam empat kategori, yaitu selfdiagnosed, terindikasi, penderita, dan penyintas. Model relevansi terbaik adalah model yang dibangun menggunakan Random Forest dan CountVectorizer unigram dengan hasil evaluasi yang didapatkan, yaitu akurasi 89,93%, precission 90,56%, recall 89,92%, dan f1-score 90%, sedangkan model kategori terbaik adalah model yang dibangun menggunakan Logistic Regression, TfidfVectorizer bigram, dan SMOTE dengan hasil evaluasi yang didapatkan adalah akurasi 83,62%, precission 83,22%, recall 83,61%, dan f1-score 81,98%. Faktor yang membuat sebuah tweet dapat diklasifikasikan sebagai tweet yang merefleksikan gangguan mental adalah fitur yang dimiliki oleh tweet karena setiap tweet memiliki karakteristik fiturnya masing-masing. Implikasi teoritis dari penelitian ini adalah penelitian ini dapat digunakan sebagai referensi untuk melakukan penelitian yang terkait analitika media sosial, terutama penelitian yang memiliki tema tentang kesehatan mental, sedangkan implikasi praktikal adalah hasil penelitian ini dapat dimanfaatkan sebagai data sekunder pada sistem informasi mengenai kesehatan mental yang dikembangkan oleh organisasi terkait dan dapat dimanfaatkan sebagai referensi tambahan dalam menangani masalah kesehatan mental di Indonesia.
In Indonesia, mental disorders are the lowest contributor to the burden of disease but are the main cause of disability when compared to cardiovascular, neoplasm, maternal and neonatal, also respiratory infections, and TB. On social media, many users have a lot of discussions and share educational content about mental health. Users with mental disorders also doing self-reported diagnoses. This study uses data from Twitter which will be used to build a classification model, analyze factors cause a tweet classified as a tweet that reflects mental disorders, and analyze tweets that reflect mental disorders. The classification models are relevance models to determine the relevance of a tweet and category models to categorize relevant tweets into four categories, there are self-diagnosed, indicated, sufferers, and survivors. The best relevance model is the model built using Random Forest and CountVectorizer unigram with the evaluation results are 89.93% accuracy, 90.56% precision, 89.92% recall, and 90% f1-score. While the best category model is the model built using Logistic Regression, TfidfVectorizer bigram, and SMOTE with the evaluation results are 83.62% accuracy, 83.22% precision, 83.61% recall, and 81.98% f1-score. The factor that makes a tweet can be classified as a tweet that reflects mental disorders is the feature of the tweet because each tweet has its characteristics feature. The theoretical implication is this research can be used as a reference for conducting research related to social media analytics, especially research with theme on mental health, while the practical implication is the results of this study can be used as a secondary data for developed mental health information system and can be used as an additional reference in dealing with mental health problems in Indonesia by related organizations.