Hasil Pencarian

Ditemukan 4 dokumen yang sesuai dengan query

Akmal

Pembelajaran tanpa pengawasan optimal untuk mendeteksi DDoS pada jaringan komputer = Optimal unsupervised learning for DDoS detection on a computer network

"Dalam perkembangan teknologi saat ini, perlindungan jaringan komputer sangat diperlukan, maka kita membutuhkan sebuah sistem untuk melindunginya jaringan dari serangan, salah satu serangan paling sering di jaringan Komputer adalah DDoS. Proteksi DDoS ini dapat dilakukan dengan cara: menggunakan Supervised Learning atau Unsupervised Learning. Diawasi Pembelajaran adalah suatu metode dimana sistem diberi label data sehingga mampu mengklasifikasikan data uji yang diberikan, dan pembelajaran tanpa pengawasan maka jika data tidak berlabel diberikan, maka sistem harus klasifikasi tanpa bantuan label, keuntungan dari sistem tanpa label apakah sistem mampu mengidentifikasi serangan yang tidak sistem pembelajaran yang aktif. Sistem untuk mendeteksi ini membutuhkan efisiensi

agar dapat merespon dengan cepat terhadap serangan yang dilakukan.

Maka dimungkinkan untuk membuat suatu sistem yang dapat menghilangkan data tersebut tidak ada kemampuan serangan, sistem ini dapat dikonfigurasi dengan menggunakan LSTM. Studi ini mencoba keefektifan Sistem pembelajaran tanpa pengawasan melalui implementasi sistem penghapusan data, eksperimen pada sistem kepunahan data untuk menentukan arsitektur terbaik, dan melakukan modifikasi pada sistem pembelajaran tanpa pengawasan. Hasil penelitian ini menunjukkan efek sistem data terhadap sistem deteksi DDoS dan

potensi keuntungan dan kerugian dari penerapan sistem dilakukan pada kemampuan deteksi sistem DDoS

In today's technological developments, computer network protection
indispensable, then we need a system to protect it network from attacks, one of the most frequent attacks on the network Computers are DDoS. This DDoS protection can be done by: using Supervised Learning or Unsupervised Learning. Supervised Learning is a method in which the system is labeled data so that able to classify the test data given, and unsupervised learning then if unlabeled data is given, then the system must labelless classification, the advantages of the labelless system whether the system is able to identify attacks that are not active learning system. The system to detect this requires efficiency in order to be able to respond quickly to attacks carried out.Then it is possible to create a system that can eliminate data no attack capability, this system can be configured with using LSTM. This study tested the effectiveness Unsupervised learning system through system implementation data deletion, experiment on extinction system data to determine the best architecture, and make modifications to unsupervised learning system. The results of this study indicate the effect of data system against DDoS detection system and potential advantages and disadvantages of implementing the system performed on the DDoS detection capability. system"

Depok: Fakultas Teknik Universitas Indonesia, 2019

S-pdf

UI - Skripsi Membership Universitas Indonesia Library

Ashari Nurhidayat

Ekstraksi topik utama harian dari portal berita Indonesia online menggunakan Singular Value Decompositon = Daily main topic extraction from Indonesia news online portals using Singular Value Decompositon

"Ekstraksi topik adalah kegiatan untuk mendapatkan topik dalam kumpulan dokumen berita. Ekstraksi topik memiliki peran yang penting untuk mendapatkan maksud dari keseluruhan dokumen teks tersebut. Metode yang umum digunakan dalam machine learning untuk pencarian topik utama adalah unsupervised learning, dimana topik diekstraksi dari kumpulan dokumen tanpa bergantung pada label dokumen. Salah satu metode yang dapat digunakan untuk mengekstraksi topik dari kumpulan dokumen berita yaitu latent semantic analysis (LSA). LSA mengaplikasikan teknik singular value decomposition (SVD) untuk mendapatkan hubungan kata dengan topik dalam kumpulan dokumen berita. Pada skripsi ini, dibahas mengenai implementasi metode LSA pada kumpulan dokumen dari portal berita online berbahasa Indonesia. Selanjutnya, keluaran metode LSA dibandingkan dengan hasil ekstraksi topik secara manual untuk menunjukkan keberhasilan metode LSA.

Topic extraction is an activity to get a topic from text document collection. Topic extraction is very important in order to find out the meaning of those whole text document. The general method used in machine learning for finding the main topic is unsupervised learning, where a topic is extracted from the document collection without depending on document labels. One of Methods which can be used for extracting a topic from text document collection is latent semantic analysis (LSA). Furthermore, LSA using LSA to show a relation between words and topic in their organizer document collection. In this skripsi, the implementation of LSA method in documents collection from Indonesian online news portal discussed. Furthermore, LSA method output compared with manual extraction to demonstrate the success of LSA."

Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2012

S42092

UI - Skripsi Open Universitas Indonesia Library

Alvin Subakti

Analisis kinerja BERT sebagai metode representasi teks untuk Text Clustering = Performance analysis of BERT as a text representation method for Text Clustering

"Text clustering adalah teknik pengelompokan teks sehingga teks di dalam kelompok yang sama memiliki tingkat similaritas yang lebih tinggi satu sama lain dibandingkan dengan teks pada kelompok yang berbeda. Proses pengelompokkan teks secara manual membutuhkan waktu dan sumber daya yang banyak sehingga digunakan machine learning untuk melakukan pengelompokan secara otomatis. Representasi dari teks perlu diekstraksi sebelum dimasukkan ke dalam model machine learning. Metode yang umumnya digunakan untuk mengekstraksi representasi data teks adalah TFIDF. Namun, metode TFIDF memiliki kekurangan yaitu tidak memperhatikan posisi dan konteks penggunaan kata. Model BERT adalah model yang dapat menghasilkan representasi kata yang bergantung pada posisi dan konteks penggunaan suatu kata dalam kalimat. Penelitian ini menganalisis kinerja model BERT sebagai metode representasi data teks dengan membandingkan model BERT dengan TFIDF. Selain itu, penelitian ini juga mengimplementasikan dan membandingkan kinerja metode ekstraksi dan normalisasi fitur yang berbeda pada representasi teks yang dihasilkan model BERT. Metode ekstraksi fitur yang digunakan adalah max dan mean pooling. Sementara itu, metode normalisasi fitur yang digunakan adalah identity, layer, standard, dan min-max normalization. Representasi teks yang diperoleh dimasukkan ke dalam 4 algoritma clustering berbeda, yaitu k-means clustering, eigenspace-based fuzzy c-means, deep embedded clustering, dan improved deep embedded clustering. Kinerja representasi teks dievaluasi dengan menggunakan metrik clustering accuracy, normalized mutual information, dan adjusted rand index. Hasil simulasi menunjukkan representasi data teks yang dihasilkan model BERT mampu mengungguli representasi yang dihasilkan TFIDF pada 28 dari 36 metrik. Selain itu, implementasi ekstraksi dan normalisasi fitur yang berbeda pada model BERT memberikan kinerja yang berbeda-beda dan perlu disesuaikan dengan algoritma yang digunakan.

Text clustering is a task of grouping a set of texts in a way such that text in the same group will be more similar toward each other than to those from different group. The process of grouping text manually requires significant amount of time and labor. Therefore, automation utilizing machine learning is necessary. Text representation needs to be extracted to become the input for machine learning models. The common method used to represent textual data is TFIDF. However, TFIDF cannot consider the position and context of a word in a sentence. BERT model has the capability to produce text representation that incorporate position and context of a word in a sentence. This research analyzed the performance of BERT model as a text representation method by comparing it with TFIDF. Moreover, various feature extraction and normalization methods are also applied in text representation from BERT model. Feature extraction methods used are max and mean pooling. On the other hand, feature normalization methods used are identity, layer, standard, and min-max normalization. Text representation obtained become an input for 4 clustering algorithms, k-means clustering, eigenspace-based fuzzy c-means, deep embedded clustering, and improved deep embedded clustering. Performance of text representations in text clustering are evaluated utilizing clustering accuracy, normalized mutual information, and adjusted rand index. Simulation results showed that text representation obtained from BERT model outperforms representation from TFIDF in 28 out of 36 metrics. Furthermore, different feature extraction and normalization produced varied performances. The usage of these feature extraction and normalization must be altered depending on the text clustering algorithm used."

Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2021

S-pdf

UI - Skripsi Membership Universitas Indonesia Library

Hendrico Kristiawan

Klasifikasi Domain Spesialisasi Dokter pada Data Teks Forum Tanya Jawab Kesehatan = Classification of Doctor Specialization Domain in Health Question and Answer Forum Text Data

"Pertanyaan konsultasi pada sebuah forum daring perlu dijawab oleh dokter spesialis yang tepat agar jawaban yang diberikan akurat dan bermanfaat bagi pengguna yang bertanya. Terkait hal tersebut, penelitian ini membahas tentang pengembangan model yang dapat secara otomatis mengarahkan sebuah pertanyaan konsultasi kesehatan ke dokter dengan spesialisasi yang sesuai. Lebih jauh lagi, model yang dibangun merupakan model klasifikasi multi-label karena sebuah pertanyaan dapat terasosiasi dengan lebih dari satu spesialisasi. Penelitian ini dimulai dengan mengevaluasi keefektifan metode pemetaan berbasis aturan dalam memprediksi data yang dianotasi oleh pakar, dan diperoleh hasil yang menunjukkan tingkat keberhasilan yang cukup. Selanjutnya, dikembangkan sebuah model machine learning yang melakukan klasifikasi domain spesialis dokter. Pelatihan model dilakukan dengan berbagai metode, termasuk supervised, unsupervised, serta semi-supervised learning. Model terbaik ditemukan melalui metode domain adaptive pre-training dengan IndoBERT-large sebagai model acuan dan melibatkan unsupervised learning. Selain itu, model supervised learning juga digunakan dengan menggunakan model konvensional, dan hasilnya digunakan untuk analisis kontribusi dari fitur-fitur yang digunakan dalam klasifikasi. Terakhir, penelitian ini mengevaluasi kembali anotasi yang dilakukan oleh manusia dengan menggunakan kata kunci sebagai pendekatan untuk mengurangi kesalahan dalam dataset. Dengan pendekatan ini, berhasil ditemukan beberapa kesalahan anotasi pada dataset yang dianotasi oleh manusia.

The consultation questions on an online forum need to be answered by the appropriate specialist doctors to provide accurate and beneficial answers to the users asking the questions. In relation to this, this study discusses the development of a model that can automatically direct a health consultation question to a doctor with the corresponding specialization. Furthermore, the constructed model is a multi-label classification model because a question can be associated with more than one specialization. There are several issues addressed in this work. This research begins by evaluating the effectiveness of rule-based mapping methods in predicting data annotated by experts, and the results show a satisfactory level of success. Furthermore, a multi-label classification model is developed to classify the specialist domains of doctors. The model training is performed using various methods, including supervised learning, unsupervised learning, and semi-supervised learning. The best model is found through domain adaptive pre-training using IndoBERT-large as the reference model and involving unsupervised learning. Additionally, the supervised learning model is also used with a conventional model, and the results are used to analyze the contribution of the features used in the classification. Lastly, this research re-evaluates the annotations made by humans using keyword-based approaches to reduce errors in the dataset. With this approach, several annotation errors were successfully identified in the dataset annotated by humans."

Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2023

S-pdf

UI - Skripsi Membership Universitas Indonesia Library

Hasil Pencarian :: Simpan CSV :: Kembali

Hasil Pencarian