Hasil Pencarian  ::  Simpan CSV :: Kembali

Hasil Pencarian

Ditemukan 173436 dokumen yang sesuai dengan query
cover
Glorya Khoirunnissa
"Kategori email dapat diklasifikasikan dengan menggunakan pemrosesan bahasa alami (natural language processing) dan machine learning untuk mempelajari pola kata pada email. Model yang digunakan adalah support vector machine, multinomial naïve bayes, dan random forest dan digunakan teknik oversampling berupa random oversampling, synthetic minority over-sampling (SMOTE), dan adaptive synthetic sampling (ADASYN) untuk menyeimbangkan distribusi kelas dan meningkatkan performa pada model. Hasil yang diperoleh bahwa teknik ADASYN menghasilkan performa terbaik dalam klasifikasi email yang divalidasi dengan k-fold cross-validation (k=7) dibandingkan dua teknik lainnya. Rata-rata akurasi mencapai 97.87% pada support vector machine, sedangkan multinomial naive bayes 77.97% , dan random forest 95.94% dengan menggunakan teknik ADASYN.

Email categories can be classified using natural language processing (NLP) and machine learning to learn word patterns in emails. The models used are support vector machine, multinomial naïve Bayes, and random forest. Oversampling techniques such as random oversampling, synthetic minority over-sampling (SMOTE), and adaptive synthetic sampling (ADASYN) are employed to balance the class distribution and improve model performance. The results show that the ADASYN technique achieves the best performance in email classification validated with k-fold cross-validation (k=7) compared to the other two techniques. The average accuracy reaches 97.87% for support vector machine, 77.97% for multinomial naïve Bayes, and 95.94% for random forest when using the ADASYN technique."
Depok: Fakultas Teknik Universitas Indonesia, 2023
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Fikri Afif Musyaffa
"Spam email merupakan salah satu masalah yang sangat sering dialami dalam komunikasi digital. Penelitian ini bertujuan untuk membandingkan efektifitas dua algoritma klasifikasi Naïve Bayes dan Support Vector Machine (SVM) dalam mendeteksi email spam. Tahapan penelitian dimulai dari pengumpulan data, pemrosesan teks seperti penghapusan angka, tanda baca, dan huruf kapital, penghapusan kata-kata umum, stemming, dan transformasi teks menggunakan metode Term Frequency-Inverse Document Frequency (TF-IDF). Dataset dibagi menjadi dua bagian yaitu data latih dan data uji dengan perbandingan 80% data latih dan 20% data uji. Hyperparameter yang digunakan pada metode Naive Bayes adalah nilai alpha, sedangkan pada SVM adalah nilai C, gamma dan kernel Radial Basis Function (RBF). Evaluasi menggunakan parameter metrik akurasi, presisi, recall, dan F1 score. Hasil penelitian menunjukkan metode SVM dengan hyperparameter tuning dan teks preprocessing mendapatkan nilai akurasi 98,74% sedangkan metode naïve bayes hanya 98,35%. Sehingga dapat disimpulkan bahwa metode Support Vector Machine lebih efektif dibandingkan metode Naïve Bayes dalam mendeteksi email spam.

Spam email is one of the most frequently encountered issues in digital communication. This study aims to compare the effectiveness of two classification algorithms, Naïve Bayes and Support Vector Machine (SVM), in detecting spam emails. The research stages begin with data collection, followed by text processing such as removing numbers, punctuation, and capital letters, removing common words, stemming, and text transformation using the Term Frequency-Inverse Document Frequency (TF-IDF) method. The dataset is divided into two parts: training data and testing data, with a ratio of 80% training data and 20% testing data. The hyperparameter used for the Naïve Bayes method is the alpha value, while for SVM, the hyperparameters are the values of C, gamma, and the Radial Basis Function (RBF) kernel. Evaluation is conducted using accuracy, precision, recall, and F1 score metrics. The results show that the SVM method, with hyperparameter tuning and text processing, achieved an accuracy of 98.74%, whereas the Naïve Bayes method only achieved 98.35%. Therefore, it can be concluded that the Support Vector Machine method is more effective than the Naïve Bayes method in detecting spam emails."
Depok: Fakultas Teknik Universitas Indonesia, 2024
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
"Email merupakan bentuk komunikasi bisnis yang sifatnya cepat, murah dan mudah digunakan, terutama untuk pesan-pesan yang dikirim dalam perusahaan (
internal message). Fasilitas ini sangat rentan terhadap berbagai gangguan spam, diantaranya adalah banyaknya spam pada inbox user serta dikeluhkannya beberapa email yang dikirim masuk ke dalam junk mail (keranjang sampah) yang mengakibatkan terganggunya komunikasi. Selain itu akan mengakibatkan pemborosan sumber daya jaringan serta waktu dan tenaga yang ada. Mengingat spam adalah suatu masalah dengan berbagai macam faktor, maka perlu upaya untuk mengatasi permasalahan tersebut baik dari sisi pemakai email maupun dari sisi pengelolanya, permasalahan ini dapat diatasi melalui pembenahan pada sisi manajemen email yang dapat dilakukan melalui segi teknis seperti adanya sistem filtering dan blocking.
"
621 DIRGA 12:1 (2011)
Artikel Jurnal  Universitas Indonesia Library
cover
Ajeng Dwi Asti
"Ujaran kebencian dapat menyebabkan terjadinya konflik dan pembantaian di masyarakat sehingga harus segera ditangani. Indonesia memiliki lebih dari 700 bahasa daerah dengan karakteristik masing-masing. Ujaran kebencian yang ada di Indonesia juga pernah dilakukan menggunakan bahasa daerah. Media sosial Twitter paling sering digunakan dalam menyebarkan ujaran kebencian. Identifikasi target, kategori, serta level ujaran kebencian dapat membantu Polri dan Kemenkominfo dalam menentukan prioritas penanganan ujaran kebencian sehingga dapat meminimalisir dampaknya. Penelitian ini melakukan identifikasi ujaran kasar dan ujaran kebencian beserta target, kategori, dan level ujaran kebencian pada data Twitter berbahasa daerah menggunakan algoritma classical machine learning dan deep learning. Penelitian ini menggunakan data lima bahasa daerah di Indonesia dengan penutur terbanyak yaitu Jawa, Sunda, Madura, Minang, dan Musi. Pada data Bahasa Jawa performa terbaik diperoleh menggunakan algoritma Support Vector Machine (SVM) dengan transformasi data Classifier Chains (CC) serta kombinasi fitur word unigram, bigram, dan trigram dengan F1-score 70,43%. Algoritma SVM dengan transformasi data CC serta kombinasi fitur word unigram dan bigram memberikan performa terbaik pada data Bahasa Sunda dan Madura dengan masing-masing F1-score 68,79% dan 78,81%. Sementara itu, pada data Bahasa Minang dan Musi hasil terbaik diperoleh menggunakan algoritma SVM dengan transformasi data CC serta fitur word unigram dengan F1-score 83,57% dan 80,72%. Penelitian ini diharapkan dapat digunakan sebagai masukan bagi Polri dan Kemenkominfo dalam pembangunan sistem identifikasi ujaran kasar, ujaran kebencian serta target, kategori, dan level ujaran kebencian pada media sosial.

Hate speech can lead to conflict and massacres in society so it must be dealt immediately. Indonesia has more than 700 regional languages with their own characteristics. Hate speech in Indonesia has also been carried out using regional languages. Twitter is the most frequently used social media to spread hate speech. Identification of targets, categories, and levels of hate speech can help the National Police and the Ministry of Communication and Information to determine priorities for handling hate speech to minimize its impact. This study identifies abusive speech and hate speech along with the target, category, and level of hate speech on regional language Twitter data using classical machine learning and deep learning algorithms. This study uses data from five regional languages in Indonesia with the most speakers, namely Javanese, Sundanese, Madurese, Minang, and Musi. In Java language data, the best performance is obtained using the Support Vector Machine (SVM) algorithm with Classifier Chains (CC) data transformation and a combination of unigram, bigram, and trigram word features with an F1-score of 70.43%. The SVM algorithm with CC data transformation and the combination of unigram and bigram word features provides the best performance on Sundanese and Madurese data with F1-scores of 68.79% and 78.81%, respectively. Meanwhile, in Minang and Musi language data, the best results were obtained using the SVM algorithm with CC data transformation and word unigram features with F1-scores of 83.57% and 80.72%, respectively. This research is expected to be used as input for the National Police and the Ministry of Communication and Information in developing a system for identifying harsh speech, hate speech and the target, category, and level of hate speech on social media."
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2022
T-pdf
UI - Tesis Membership  Universitas Indonesia Library
cover
Teuku Mohamad Anshar Lotan
"ABSTRAK
Tujuan dari permasalahan filtrasi spam adalah mengidentifikasi sebuah e-mail sebagai spam atau bukan spam. Dengan berkembangnya machine learning, semakin banyak permasalahan yang dapat diselesaikan. Salah satunya adalah filtrasi spam. Filtrasi e-mail spam dapat dilakukan dengan bantuan klasifikasi biner dengan machine learning untuk pengklasifikasiannya. Dalam penelitian ini akan menggunakan regresi logistik dan perceptron untuk melakukan proses filtrasi spam. Data yang digunakan menggunakan dataset Enron Spam. Hasil dari analisis menunjukkan bahwa regresi logistik menunjukkan hasil yang lebih baik dari perceptron. Di mana akurasi regresi logistik mencapai 97,02, sedangkan tingkat akurasi perceptron adalah 95,54, tetapi waktu pelatihan perceptron hanya membutuhkan waktu 3,8 sekon, sedangkan regresi logistik membutuhkan waktu 780,94 sekon.

ABSTRACT
The goal of spam filtering is to identify an e mail as spam or not spam. With the rapid development of machine learning, more problem can be solved. One of it is spam filtration. E mail spam filtering can be done with the help of binary classifier using machine learning for the classification. This research would use logistic regression and perceptron technique to filter spam. Data taken from Enron Spam dataset. The result indicate that logistic regression show better result than perceptron. Whereas the accuracy from logistic regression could reach 97,02, while accuracy from perceptron is 95,54, meanwhile the training time for perceptron takes only 3,8 second, while logistic regression takes about 780,94 second. "
2018
S-Pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Henry Prayoga
"Penelitian ini menganalisis akurasi peramalan permintaan produk barang konsumsi cepat (FMCG) menggunakan model Machine Learning, yaitu LSTM (Long Short-Term Memory) dan SARIMAX (Seasonal AutoRegressive Integrated Moving Average with eXogenous regressors), dengan data sekunder dari April 2021 hingga April 2024 yang terdiri dari 36 observasi bulanan. Variabel dependen adalah total penjualan, sementara variabel eksogen mencakup pengeluaran per kapita, adopsi produk, proporsi penjualan dari promosi, jumlah toko yang menjual produk, dan pangsa pasar produk. Hasil menunjukkan model LSTM memiliki akurasi lebih tinggi dalam memprediksi nilai penjualan dibandingkan SARIMAX, dengan nilai Mean Absolute Percentage Error (MAPE) yang lebih rendah pada sebagian besar sampel. Analisis korelasi mengungkapkan variabel jumlah toko yang menjual produk dan adopsi produk berpengaruh signifikan terhadap nilai penjualan dalam model LSTM, sedangkan SARIMAX unggul dalam menangkap pola musiman namun memiliki MAPE lebih tinggi. Penelitian ini menyarankan penggunaan model LSTM untuk data time series yang kompleks dan tidak stasioner, sementara SARIMAX lebih cocok untuk data dengan komponen musiman yang kuat. Pemilihan model harus mempertimbangkan karakteristik data dan tujuan analisis.

This study analyzes the forecasting accuracy of fast-moving consumer goods (FMCG) demand using Machine Learning models, namely LSTM (Long Short-Term Memory) and SARIMAX (Seasonal AutoRegressive Integrated Moving Average with eXogenous regressors), utilizing secondary data from April 2021 to April 2024 with a total of 36 monthly observations. The dependent variable is sales value, while the exogenous variables include spend per buyer, product penetration, promo % of value, the number of stores selling, and market share. The results indicate that the LSTM model has higher accuracy in predicting sales value compared to the SARIMAX model, with a lower Mean Absolute Percentage Error (MAPE) for most samples. Correlation analysis reveals that the variables number of stores selling and product penetration significantly influence sales value in the LSTM model, whereas SARIMAX excels in capturing seasonal patterns but has a higher MAPE. This study recommends using the LSTM model for complex and non-stationary time series data, while SARIMAX is more suitable for data with strong seasonal components. Model selection should consider the characteristics of the data and the objectives of the analysis."
Depok: Fakultas Teknik Universitas Indonesia, 2024
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Yovan Yudhistira Widyananto
"Keamanan privasi data dan informasi dalam internet sering menjadi topik pembahasan dari waktu ke waktu, hal ini dikarenakan metode penyerangan siber selalu berevolusi menyesuaikan dengan struktur keamanan yang ada, menjadikan bidang keamanan siber menjadi bagaikan kompetisi untuk selalu lebih dahulu dari lawannya. Salah satu contoh implementasi keamanan siber merupakan Intrusion Detection System, dikenal juga dengan IDS. IDS dapat membantu menjaga sebuah jaringan dengan mendeteksi jika ada tanda-tanda penyerangan, namun dengan ini saja tidak cukup untuk memaksimalkan keamanan sebuah jaringan. Dari dasar IDS ini, sebuah proyek mencoba mengembangkan konsepnya dan membuat struktur besar, dan berhasil diciptakan proyek Mata Elang. Struktur Mata Elang dapat menjadi perantara antara internet dengan jaringan yang dilindunginya, dan ketika terjadi serangan, aktivitas tersebut akan dideteksi, ditahan, dan diproses oleh Mata Elang. Sistem deteksi Mata Elang bergantung kepada framework Snort. Sayangnya, Snort tidak memiliki kemampuan untuk beradaptasi di luar dari konfigurasi yang telah diberikan kepadanya. Dalam penelitian ini, penulis akan mengimplementasikan Machine Learning untuk meningkatkan keamanan yang diberikan pada proyek Mata Elang, spesifiknya pada sensornya yang menggunakan Snort. Setelah segala proses perancangan, pembuatan, dan pengujian telah dilakukan, hasil akhir yang didapatkan dari sistem Machine Learning merupakan sistem prediksi yang memuaskan untuk memprediksi kategori serangan bahkan dengan dukungan data yang lemah, namun kemampuan dari aturan Snort yang dihasilkan masih belum diuji dengan matang.

The talk about the security of private data and information will continue to be a relevant topic because of the nature of the concept. Cyberattacks have always been adapting according to the technology and structure that exists at the time, and so cybersecurity will continue to be a competition for gaining the advantage against their contrarian. One of the prime examples in cybersecurity implementation is Intrustion Detection Systems, also known as the shortened term, IDS. IDS can help guard a network by detecting different kinds of anomalies or attacks, although this alone wouldn’t be enough to maximize the level of proper security necessary for a whole network. Under the basic concept of IDS, a project attempts to develop an IDS and create a larger structure. The project was successfully implemented and now titled as Mata Elang. Mata Elang’s structure is an intermediary between an internet connection and the network it is connected to, and when an attack happens, those activities will be detected, interrupted, and then processed by Mata Elang. Mata Elang’s detection system completely relies on the framework Snort. Unfortunately, Snort does not have the capabilities to adapt outside the configurations that has been given to it. In this research, the writer will implement Machine Learning to further increase the security provided by Mata Elang, specifically on the sensors that uses Snort. After every step of the planning, making, and testing has been done the final result of the product was a Machine Learning system that has a satisfactory performance in categorizing the attacks, even with a weak supporting data, however the performance of the snort rules generated by it has not been tested thoroughly.
"
Depok: Fakultas Teknik Universitas Indonesia, 2023
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Muhammad Fajar Milleano Mufianto
"Penggunaan email dalam berkomunikasi dan melakukan transaksi tidak dapat dihindari di era ini. Email memegang peranan penting dalam perkembangan Internet sekarang. Karena pentingnya email, maka semakin banyak pula penjahat yang berusaha mengeksploitasi email untuk kepentingan pribadi. Salah satu bentuk eksploitasi tersebut adalah pengiriman email yang tidak diinginkan (spam email). Email spam yang masuk ke kotak email pengguna dapat menimbulkan bahaya dan kerugian terhadap pengguna tersebut. Untuk mengatasinya diperlukan sebuah mekanisme penyaringan email spam sehingga tidak membahayakan pengguna. Melalui aplikasi, email akan dipilah dan apabila dikategorikan sebagai email spam, maka akan diisolasi ke tempat khusus. Aplikasi yang dipilih adalah aplikasi yang bersifat open source, sehingga mudah untuk dicapai dan digunakan oleh banyak orang seperti Apache SpamAssassin dan Rspamd. Tujuan dari Skripsi ini adalah untuk melihat seberapa efektif aplikasi penyaring spam berbasis open source untuk mengklasifikasikan dan mencegah masuknya email spam ke kotak masuk pengguna.

The use of email in communicating and making transactions is unavoidable in this era. Email plays an important role in the development of the Internet today. Due to the importance of email, more and more criminals are trying to exploit email for personal gain. One form of exploitation is sending unsolicited email (spam email). Spam email that enter a user's mailbox can cause harm and loss to the user. To overcome this, a spam email filtering mechanism is needed so that it does not endanger users. Through the application, the email will be sorted and if it is categorized as spam, it will be isolated to a special place. The chosen application is an application that is open source, so it is easy to reach and use by many people such as Apache SpamAssassin and Rspamd. The purpose of this Thesis is to see how effective an open source based spam filter application is in classifying and preventing spam emails from entering users' inboxes."
Depok: Fakultas Teknik Universitas Indonesia, 2021
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Rebala, Gopinath
"Just like electricity, Machine Learning will revolutionize our life in many ways-some of which are not even conceivable today. This book provides a thorough conceptual understanding of Machine Learning techniques and algorithms. Many of the mathematical concepts are explained in an intuitive manner. The book starts with an overview of machine learning and the underlying Mathematical and Statistical concepts before moving onto machine learning topics. It gradually builds up the depth, covering many of the present day machine learning algorithms, ending in Deep Learning and Reinforcement Learning algorithms. The book also covers some of the popular Machine Learning applications. The material in this book is agnostic to any specific programming language or hardware so that readers can try these concepts on whichever platforms they are already familiar with."
Switzerland: Springer Nature, 2019
e20506268
eBooks  Universitas Indonesia Library
cover
Helmi Qosim
"ABSTRAK
Synthesis loop merupakan salah satu sistem kritis di pabrik amoniak. Oleh karena itu, ada urgensi untuk menjaga reliability dan availability pada sistem ini. Sebagian besar peristiwa shutdown di pabrik amoniak terjadi tiba-tiba setelah alarm tercapai. Jadi, perlu ada sistem deteksi dini untuk memastikan masalah anomali ditangkap oleh operator sebelum menyentuh set point alarm. Implementasi algoritma machine learning dalam membuat model deteksi potensi kegagalan telah digunakan di berbagai industri dan objek sebagai penelitian. Algoritma yang digunakan adalah classifier dasar dan ensemble untuk membandingkan algoritma mana yang menghasilkan hasil klasifikasi terbaik. Penelitian ini dapat memberikan ide dan perspektif baru ke dalam industri pabrik amoniak untuk mencegah terjadinya shutdown yang tidak terjadwal dengan memanfaatkan data menggunakan algoritma machine learning.

ABSTRACT
Synthesis loop is one of the critical systems in ammonia plant. Therefore, there is urgency for maintaining the reliability and availability of this system. Most of the shutdown events occur suddenly after the alarm is reached. So, there needs to be an early detection system to ensure anomaly problem captured by the operator before
touching the alarm settings. The implementation of machine learning algorithms in making fault detection models has been used in various industries and objects. The algorithm used is the basic and ensemble classifier to compare which algorithms generate the best classification results. This research can provide a new idea and perspective into ammonia plant industry to prevent unscheduled shutdown by utilizing
data using machine learning algorithm."
Depok: Fakultas Teknik Universitas Indonesia , 2020
T-Pdf
UI - Tesis Membership  Universitas Indonesia Library
<<   1 2 3 4 5 6 7 8 9 10   >>