Indonesia merupakan salah satu negara terbesar didunia dan rawan terhadap bencana alam. Dalam penanggulangan bencana alam dibutuhkan informasi mengenai jenis bencana alam, tingkat bahaya, dan lokasi terjadinya bencana alam agar dapat ditanggulangi dengan cepat. Sosial media merupakan salah satu sumber informasi kejadian bencana alam yang dapat membantu masyarakat untuk bertindak, karena dianggap informasi yang realtime dan banyak. Walaupun terdapat beberapa sistem pemantauan bencana alam, namun informasi yang diterima oleh pengguna atau masyarakat masih tidak lengkap / kurang lengkap, contohnya pada sistem yang dikembangkan oleh BNPB, Petabencana.id dan GDASC. Sistem tersebut belum menampilkan keseluruhan tipe bencana alam dan tingkat lokasi yang lebih detail. Penelitian ini berfokus memanfaatkan data media sosial Twitter untuk digunakan dalam mendeteksi bencana alam di Indonesia dengan realtime dan lebih detail. Jenis analisa yang digunakan pada penelitian ini adalah klasikasi yang mengategorikan ke dalam relevan/tidak relevan, jenis bencana alam, dan tingkat bahaya bencana alam. Algoritma klasifikasi yang digunakan pada penelitian ini adalah Naïve Bayes, Decision Tree, Support Vector Machiness (SVM). Metode ekstraksi fitur digunakan pada penelitian ini dengan memanfaatkan fitur Bag Of Words (BOW) dan Term Frequency - Inverse Document Frequency (TF-IDF). Teknik ekstraksi informasi lokasi yang digunakan pada penelitian ini adalah metode Named Entity Recognition (NER) pada sebuah data teks. Selanjutnya lokasi akan dikonversi menggunakan metode geocoding ke dalam koordinat latitude dan longitude untuk pembuatan peta spasial. Sehingga didapatkan sistem yang mampu mendeteksi bencana alam di Indonesia secara realtime dan detail
Indonesia is one of the largest countries in the world and is prone to natural disasters. In dealing with natural disasters, information is needed on the types of natural disasters, the level of danger, and the location of the natural disasters so that they can be handled quickly. Social media is a source of information on natural disasters that can help people to act, because it is considered real-time and a lot of information. Although there are several natural disaster monitoring sistems, the information received by users or the community is still incomplete / incomplete, for example in the sistems developed by BNPB, Petabencana.id and GDASC. The sistem does not yet display all types of natural disasters and at a more detailed location level. This research focuses on utilizing Twitter social media data to be used in realtime and more detailed detection of natural disasters in Indonesia. The type of analysis used in this study is a classification categorizing it into relevant / irrelevant, types of natural disasters, and level of natural disaster hazards. The classification algorithm used in this study is Naïve Bayes, Decision Tree, Support Vector Machiness (SVM). The feature extraction method is used in this study by utilizing the Bag Of Words (BOW) and Term Frequency - Inverse Document Frequency (TF-IDF) features. The location information extraction technique used in this study is the Named Entity Recognition (NER) method on a text data. Furthermore, the location will be converted using the geocoding method into latitude and longitude coordinates for making spatial maps. So that we get a system that is able to detect natural disasters in Indonesia in real time and in detail