Hasil Pencarian

Ditemukan 123669 dokumen yang sesuai dengan query

Adimas Putra Pratama Hendrata

Analisis Penerapan Algoritma Sequence Processing untuk Memprediksi Kegagalan pada Mesin = Analysis of Sequence Processing Algorithm Implementation for Predicting Machine Faults

"Masuknya industri 4.0 di Indonesia membuat mesin dapat terintegrasi dengan komputer melalui perangkat IoT sehingga membuat proses produksi lebih efisien. Salah satu upaya untuk mempertahankan hal tersebut adalah dengan melakukan maintenance menggunakan metode predictive maintenance. Kegagalan mesin dalam predictive maintenance dapat diprediksi menggunakan machine learning. Metode sequence processing adalah algoritma machine learning yang cocok digunakan dalam predictive maintenance berbasis timeseries. Penelitian ini mencoba berbagai macam cara penerapan sequence processing untuk memprediksi kegagalan pada mesin. LSTM merupakan metode sequence processing yang populer digunakan untuk predictive maintenance. Terdapat tiga cara penerapan model LSTM yang diuji pada penelitian ini, yaitu model klasifikasi, regresi, dan regresi menggunakan sequence to sequence Ketiga model tersebut akan diuji menggunakan data yang didapat dari database terbuka. Setiap model akan dievaluasi dan dikomparasi untuk mengetahui model yang terbaik. Penelitian ini menunjukkan bahwa model klasifikasi memiliki kinerja yang buruk karena mengalami overfitting. Sementara itu, model regresi sequence to sequence memiliki kinerja yang paling baik, yaitu dengan nilai f-1 score mencapai 57.45%.

The implementation of Industry 4.0 in Indonesia enables machines to be integrated with computers through IoT devices, resulting in more efficient production processes. One of the efforts to maintain this is by performing maintenance using predictive maintenance methods. Machine learning can be used to predict machine failures in predictive maintenance. Sequence processing is a suitable machine learning algorithm for predictive maintenance based on timeseries data. This research explores various ways to apply sequence processing for predicting machine failures. LSTM is a popular sequence processing method used in predictive maintenance. Three approaches for implementing LSTM models were tested in this study: classification, regression, and sequence to sequence regression. These models were tested using data obtained from an open database. Each model was evaluated and compared to determine the best-performing model. The research findings indicate that the classification model performed poorly due to overfitting. On the other hand, the sequence to sequence regression model achieved the best performance, with an f-1 score of 57.45%."

Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2023

S-pdf

UI - Skripsi Membership Universitas Indonesia Library

Gianinna Ardaneswari

Penerapan komputasi paralel berbasis cuda gpu pada algoritma smith waterman untuk penelusuran basis data sekuens = Implementation of cuda gpu based parallel computing on smith waterman algorithm to sequence database searches

"Dalam bioinformatika penelusuran basis data sekuens digunakan untuk mencari kemiripan antara sebuah sekuens dengan sekuens lainnya pada suatu basis data sekuens Salah satu algoritma untuk menghitung skor kemiripan yang optimal adalah algoritma Smith Waterman yang menggunakan pemrograman dinamik Algoritma ini memiliki kompleksitas waktu kuadratik yaitu O n2 sehingga untuk data yang berukuran besar membutuhkan waktu komputasi yang lama Komputasi paralel diperlukan dalam penelusuran basis data sekuens ini agar waktu yang dibutuhkan lebih cepat dan memiliki kinerja yang baik Dalam skripsi ini akan dibahas implementasi paralel untuk algoritma Smith Waterman menggunakan bahasa pemrograman CUDA C pada GPU dengan NVCC compiler pada Linux Selanjutnya dilakukan analisis kinerja untuk beberapa model paralelisasi tersebut yaitu Inter task Parallelization Intra task Parallelization dan gabungan keduanya Berdasarkan hasil simulasi yang dilakukan paralelisasi dengan gabungan kedua model menghasilkan kinerja yang lebih baik dari model lainnya Paralelisasi dengan model gabungan menghasilkan rata rata speed up sebesar 313x dan rata rata efisiensi sebesar 0 93

In bioinformatics sequence database searches are applied to find the similarity between a sequence with other sequences in a sequence database One of the algorithms to compute the optimal similarity score is Smith Waterman algorithm that uses dynamic programming This algorithm has a quadratic time complexity O n2 which requires a long computation time for large sized data In this occasion parallel computing is essential to solve this sequence database searches in order to reduce the running time and to increase the performance In this mini thesis we discuss the parallel implementation of Smith Waterman algorithm using CUDA C programming language with NVCC compiler on Linux Furthermore we run the performance analysis using three parallelization models including Inter task Parallelization Intra task Parallelization and a combination of both models Based on the simulation results a combination of both models has better performance than the others In addition parallelization using combination of both models achieves an average speed up of 313x and an average efficiency with a factor of 0 93"

Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2013

S52395

UI - Skripsi Membership Universitas Indonesia Library

Dian Rismawati

Analisis penerapan algoritma support vector machine pada sistem deteksi plagiarisme berbasis latent semantic analysis = Analysis of support vector machine algorithm implementation in plagiarism detection system based on latent semantic analysis

"Departemen Teknik Elektro Universitas Indonesia telah mengembangkan suatu sistem berbasis Latent Semantic Analysis (LSA) untuk mendeteksi plagiarisme pada karya tulis berbahasa Indonesia dan Inggris. Data keluaran sistem deteksi plagiarisme berbasis LSA adalah nilai frobenius norm, slice, dan pad. Pada skripsi ini akan menjelaskan serta memberikan analisis pada pengembangan sistem deteksi plagiarisme yang telah ada yaitu dengan menerapkan algoritma Support Vector Machine (SVM).

Support Vector Machine (SVM) adalah suatu Learning Algoritm yang bertujuan untuk menemukan suatu hipotesis berupa bidang pemisah (hyperplan) terbaik dari sekumpulan data yang dapat dipisahkan secara linear maupun tidak linear. SVM akan memisahkan data hasil keluaran sistem deteksi plagiat bebasis LSA menjadi dua kelas yaitu "plagiat" dan "tidak plagiat" dengan menggunakan 2 metode yaitu kombinasi data input dan kombinasi data output dengan metode AND. Beberapa modifikasi terhadap imput program dilakukan diantaranya memvariasikan parameter-parameter pembelajaran dan memvariasikan data hasil keluaran program deteksi plagiarisme berbasis LSA.

Hasil dari analisis serta pengujian yang telah dilakukan yaitu jika menggunakan parameter serta kombinasi data yang tepat, SVM mampu untuk meningkatkan akurasi sistem dari sistem yang menggunakan metode Learning Vector Quantization (LVQ) pada penelitian sebelumnya hingga menghasilkan akurasi sebesar 63,15% hal ini dilihat jika mempertimbangkan keseimbangan terhadap aspek presisi dan relevansi program sedangkan jika dilihat melalui presentase jumlah data yang berhasil diklasifikasikan dengan tepat, SVM mampu menghasilkan akurasi sebesar 97,04%.

Department of Electrical Engineering, University of Indonesia has developed a system based on Latent Semantic Analysis (LSA) to detect plagiarism between two paper written in different languages, which are Indonesian and English. The output data of plagiarism detection system are frobenius norm, slice, and pad. This thesis will explain and provide analysis of the development of plagiarism detection system that already exist by applying Support Vector Machine (SVM) algorithm.
Support Vector Machine (SVM) is a Learning Algorithm that aims to find a best hypothetical form called hyperplan to separated a set of data that can be separated linearly and nonlinearly. SVM will separate output data of plagiarism detection system into two classes, "plagiat" class and "tidak plagiat" class by using two methods: combination of input data method and output data combined with AND method. Some modifications to input program are made, such as variating the parameters of learning and variating the output data of plagiarism detection program.
The results of analysis and test that has been done are: if the system use correct parameters and correct combinations of the data, SVM is able to improve accuracy of the system from the last research that using Learning Vector Quantization (LVQ). The accuracy of SVM is 63,15% if considering the balance of precision and relevance of the program, while when viewed through a percentage of the amount of data that appropriately classified, the accuracy of SVM is 97.04%."

Depok: Fakultas Teknik Universitas Indonesia, 2016

S65023

UI - Skripsi Membership Universitas Indonesia Library

Khoirul Umam

Penerapan TWO-level hybrid clustering menggunakan algoritma K-means dan algoritma diana pada barisan DNA human papillomavirus (HPV) = The implementation of two level hybrid clustering using k means algorithm and diana algorithm on DNA sequence of human papillomavirus (HPV)

"DNA adalah salah satu pembawa informasi genetik pada makhluk hidup. Sequencing dan clustering barisan DNA telah menjadi pekerjaan utama dan rutin dalam dunia biologi molekuler, khususnya dalam bidang terapan bioinformatika. Secara umum metode clustering dapat dibedakan menjadi dua, yaitu hirarki clustering dan partisi clustering. Penelitian ini menggabungkan dua metode clustering yaitu K-Means partisi clustering pada Level 1 dan DIANA hirarki clustering pada Level 2, oleh karena itu disebut Two-Level Hybrid Clustering. Proses awal dimulai dengan mengumpulkan barisan DNA HPV yang diperoleh dari NCBI National Centre for Biotechnology Information, Ekstraksi Ciri, dan Normalisasi. Kemudian melakukan proses clustering menggunakan algoritma K-Means pada Level 1 dan algoritma DIANA pada Level 2. Untuk menghitung jarak genetik antar barisan DNA HPV digunakan persamaan Euclidian Distance. Dan validitas klaster yang digunakan untuk menentukan banyaknya klaster yang optimum adalah Indeks Davies-Bouldin IDB. Hasil penerapan Two-Level Hybrid Clustering pada 1252 barisan DNA HPV adalah data dikelompokan menjadi 4 klaster dengan nilai IDB yaitu 0.859154564. Semua perhitungan dan proses clustering menggunakan software R.

DNA is one of the carrier of genetic information in living organisms. Sequencing and clustering DNA sequences has become the key and routine activitis in the molecular biology, in particular on bioinformatics applications. There are two type of clustering, hierarchical clustering and partitioning clustering. In this paper, we combine two type clustering proccesses including K Means partitioning clustering on Level 1 and DIANA hierarchical clustering on Level 2, therefore it called Two Level Hybrid clustering. The beginning of process is started with collecting DNA sequences of HPV from NCBI National Centre for Biotechnology Information, Characteristics Extraction, and Normalization. The next step is clustering by implementation K Means algorithm on Level 1 and DIANA algorithm on Level 2. To calculate the genetic distance we use Euclidian Distance. Moreover, in validating cluster results in order to get optimum number of clusters, we use Davies Bouldin Index DBI. The result of implementation of Two Level Hybrid Clustering on 1252 sequences of HPV is the data clustered into 4 clusters with minimal IDB value is 0.859154564. All calculating and clustering process in this paper using software R."

Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2017

T47109

UI - Tesis Membership Universitas Indonesia Library

Khoironi

Penerapan Algoritma Metaheuristik Electromagnetism-like Mechanism (EM) untuk masalah penjadwalan mesin tunggal = Implementation of an electromagnetism-like mechanism (EM) algorithm for single machine scheduling problem

"ABSTRAK

Masalah penjadwalan adalah salah satu masalah klasik optimasi kombinatorial yang ada di berbagai segi seperti sistem manufaktur fleksibel, perencanaan produksi,

industri penerbangan, dll. Baru-baru ini, beberapa algoritma yang efektif untuk

optimasi global dan memecahkan masalah penjadwalan proyek telah diterapkan.

Meta-heuristik adalah sistem cerdas, proses iteratif/perulangan yang menekankan

pada proses pencarian dan dapat diterapkan terhadap masalah optimasi, seperti

masalah mesin tunggal. Algoritma Elektromagnetisme-Like Mechanism (EM)

berbasis populasi meta-heuristik yang telah diusulkan untuk memecahkan masalah

yang berkelanjutan secara efektif. Pendekatan baru ini mencoba untuk mencapai efek

konvergensi dan keragaman ketika iteratif diterapkan untuk memecahkan masalah.

Algoritma ini diuji secara komputasi dan hasil perhitungan menunjukkan bahwa

algoritma ini melakukan lebih baik daripada aturan penjadwalan sederhana, seperti

metode penjadwalan EDD (Earliest Due Date), SPT (Shortest Processing Time) dan

LPT (Largest Processing Time).

Abstract

Scheduling problem are one of the classical combinatorial optimisation

problems which exist in many diverse areas such as flexiblemanufacturing systems, production planning, air lane industry, etc. Recently, several effective algorithms for global optimization and solving the resource-constrained project scheduling problem

have been proposed. A Meta-heuristics is an intelligent, iterative process that guides a search and can be applied towards optimization problem, such as the single machine problem. An Electromagnetism-like Mechanism (EM) Algorithm is a populationbased meta-heuristic which has been proposed to solve continuous problems effectively. This new approach attempts to achieve the convergence and diversity

effects when it is iteratively applied to solve the problem. This algorithm is tested on the computational results show that this algorithm performs better than the simple scheduling rules, such as EDD (Earliest Due Date) scheduling method, SPT (Shortest

Processing Time) and LPT (Largest Processing Time) scheduling method."

2011

T28805

UI - Tesis Open Universitas Indonesia Library

Devin Winardi

Text Sequence Classification untuk Memprediksi Intent dalam Chatbot = Text Sequence Classification to Predict Intent in Chatbot

"Skripsi ini membahas tentang implementasi text sequence classification menggu- nakan data pesan pengguna asli dari perusahaan e-commerce Indonesia, untuk meningkatkan performa chatbot perusahaan dalam memprediksi intent. Problem yang menjadi fokus dalam skripsi ini adalah bagaimana cara untuk menggunakan konteks-konteks yang ada pada pesan pengguna di awal sesi untuk memprediksi intent dari pesan pengguna yang ada di akhir sesi. Skripsi ini bekerja sama dengan salah satu perusahaan ecommerce di Indonesia dan menggunakan data dari percaka- pan antara pengguna dan chatbot yang dimiliki perusahaan. Setelah eksplorasi data dilakukan, ditemukan bahwa terdapat ketidakseimbangan pada data sehingga di- gunakan focal loss agar model dapat memprediksi dengan baik intent-intent yang memiliki data sedikit. Selain itu, data juga diaugmentasi, yakni pesan-pesan peng- guna dalam sesi percakapan yang sama digabungkan agar konteks pada pesan per- tama dapat digunakan untuk memprediksi intent pada pesan selanjutnya. Penelitian ini juga bereksperimen dengan model LSTM dan Bi-LSTM, serta menggunakan attention layer untuk memilih data yang lebih penting daripada yang lain. Hasil penelitian menunjukkan bahwa model yang diajukan pada akhir penelitian berhasil menyaingi model perusahaan yang sebelumnya. Selain itu, penulis juga melakukan analisis kesalahan dan menemukan bahwa model memiliki performa yang rendah ketika memprediksi beberapa intent, hal ini disebabkan oleh adanya kesamaan kan- dungan kata pada intent-intent tersebut, sehingga model mengalami kesulitan mem- bedakan intent-intent tersebut.

This thesis talks about the implementation of text sequence classification on real user message data of an e-commerce company in Indonesia. It aims in improving the company’s chatbot performance in predicting intents. The problem that is the main focus of this thesis is how to use the contexts in the user’s message at the beginning of the session to predict the intent of the user’s message at the end of the session. This thesis collaborates with an e-commerce company in Indonesia and uses data from conversations between users and the company’s chatbot. After exploring the data, it was found that there is an imbalance in the data so that focal loss is used so that the model can predict well the intents that have little data. In addition, the data is also augmented, where user messages in the same conversation session are combined so that the context of the first message can be used to predict the intent of the next message. This work also includes experiments on the use of LSTM and Bi-LSTM models, and used the attention layer to select data that are more important than others. The experiment result shows that the proposed model is successful in competing with the company’s past model. In addition, the author also conducted an error analysis where it was found that the model has low performance when predicting a number of particular intents, this is due to the similarity of the wording of the intents and because of that, the model has difficulty in distinguishing the intents."

Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2021

S-pdf

UI - Skripsi Membership Universitas Indonesia Library

Miftahul Haq

Implementasi algoritma fungsi chaos dengan coding barisan dna dan elliptic curve diffie-hellman pada kriptografi citra digital = Implementation of chaotic function with dna sequence coding and elliptic curve diffie hellman algorithm on digital image cryptography

"Citra digital merupakan salah satu media penyimpanan informasi yang sering digunakan saat ini sehingga dibutuhkan suatu skema yang dapat menjaga keamanan informasi pada citra digital. Oleh karena itu, dirancang algoritma enkripsi citra digital berbasis chaos dengan coding DNA dan elliptic curve Diffie-Hellman. Hasil yang diperoleh dari elliptic curve Diffie-Hellman akan digunakan untuk membuat kunci-kunci pada coding barisan DNA. Nilai-nilai piksel pada citra digital diubah menggunakan coding DNA, penjumlahan DNA, dan penjumlahan dengan keystream yang didapat dari fungsi chaos logistik. Selain itu, lokasi piksel diubah menggunakan circular shifting dengan kunci yang didapat dari elliptic curve Diffie-Hellman dan interlave antar channel. Hasilnya didapat algoritma pada skripsi ini memiliki keamanan yang baik dalam menjaga kerahasiaan informasi citra digital.

Digital image is one of the information storage tool that used frequently now, so a scheme is needed to protect its security. In consequence, encryption algorithm of digital image that based on chaos with DNA coding and elliptic curve Diffie Hellman is designed. The result from elliptic curve Diffie Hellman will used to create keys in DNA coding. Pixel values in digital image are changed using DNA coding, DNA addition, and addition using keystream that obtained from chaos logistic map. Furthermore, pixel location is changed using circular shifting with key that obtained from elliptic curve Diffie Hellman and interleave. In the result, algorithm have a good security to protect digital image. "

Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2018

S-Pdf

UI - Skripsi Membership Universitas Indonesia Library

Nagisa Eremia Anju

Algoritma Pengolahan Sinyal Photoplethysmography (PPG) Berbasis Ekstraksi Fitur dan Machine Learning untuk Sistem Pengukuran Tekanan Darah Noninvasif = Photoplethysmography (PPG) Signal Processing Algorithm Based on Feature Extraction and Machine Learning for Noninvasive Blood Pressure Measurement System

"Tenaga kerja kesehatan pada masa pandemi bekerja sebagai garda terdepan yang memiliki resiko tertinggi tertular virus corona. Sampai pada hari ini, perawatan dan pemeriksaan kondisi vital pasien COVID-19 masih banyak dilakukan dengan kontak langsung minimal sebanyak empat kali dalam sehari. Hal ini berisiko meningkatkan penyebaran virus hingga menurunkan jumlah tenaga kerja kesehatan. Sampai pada saat ini, hampir seluruh rumah sakit masih menggunakan sphygmomanometer tradisional dengan cuff yang membutuhkan bantuan tenaga medis ataupun tanpa bantuan, namun pengukuran dilakukan secara invasif. Oleh karena itu, dibutuhkan suatu alat yang dapat memonitor kondisi vital pasien tanpa kontak langsung terutama dalam mengukur tekanan darah dan bersifat noninvasif. Penelitian ini bertujuan untuk membuat suatu algoritma pengolahan sinyal plethysmography berbasis ekstraksi fitur dan machine learning untuk prediksi tekanan darah. Dengan menggunakan sensor MAX30102 dan ESP32, sinyal PPG yang didapat dari jari akan dilakukan pre-processing dengan menenerapkan baseline fitting, kemudian deteksi puncak, hingga empat fitur utama sinyal PPG, yaitu systolic peak, diastolic peak, dicrotic notch, dan foot dapat diekstrak. Data ekstraksi fitur sinyal PPG secara real-time ini digabungkan menjadi satu dataset dan dimasukkan ke dalam machine learning untuk diprediksi nilai tekanan darahnya. Evaluasi hasil prediksi tekanan darah menunjukkan nilai Mean Absolute Error yang kecil, yaitu 1,56/2,35 yang masih diterima oleh standar ISO 81060-2:2013 sehingga dapat dijadikan fundamental untuk sistem pengukuran tekanan darah noninvasif.

Health workers during the pandemic act as the frontliner who have the highest risk of contracting the coronavirus. Most of the treatment and examination of the vital condition of COVID-19 patients is carried out with direct contact at least four times a day. This increases the risk of virus spreading, moreover reducing the number of health workers. To date, almost all hospitals still require medical assistance to measure blood pressure using the traditional cuff sphygmomanometer or without assistance however, the measurements are carried out invasively. Therefore, a device that can monitor the patient's vital condition without direct contact, especially in measuring blood pressure and non-invasive is needed. This thesis aims to develop a plethysmography signal processing algorithm based on feature extraction and machine learning for blood pressure prediction. By using the MAX30102 and ESP32 sensors, the PPG signal obtained from the finger will be preprocessed by applying a baseline fitting and peak detection, thus the four main features of the PPG signal, namely systolic peak, diastolic peak, dicrotic notch, and foot can be extracted. This real-time PPG signal feature extraction data is then combined into a single dataset and by using machine learning, blood pressure values are predicted. Evaluation of the blood pressure predictions shows a small Mean Absolute Error value, 1.56/2.35 which meets the ISO 81060-2:2013 standard. Hence, the results demonstrate the applicability of the proposed algorithm in predicting blood pressure and can be developed as a noninvasive real-time blood pressure measurement system in the future."

Depok: Fakultas Teknik Universitas Indonesia, 2022

S-pdf

UI - Skripsi Membership Universitas Indonesia Library

Sri Hartini

Perbandingan Implementasi Algoritma KC-Means Clustering dan Kernel KC-Means Clustering untuk Memprediksi Penyakit Talasemia = The Comparison Between the Implementation of KC-Means Clustering and Kernel KC-Means Clustering Algorithm in Predicting Thalassemia Disease

"Talasemia merupakan penyakit genetik dimana terjadi kelainan pada sel darah merah akibat kesalahan produksi hemoglobin. Perkawinan antara sesama pembawa gen talasemia dapat menyebabkan munculnya keturunan yang menderita talasemia mayor. Talasemia mayor merupakan jenis talasemia yang dapat menyebabkan kematian. Oleh karena itu, pendeteksian dini terhadap penyakit talasemia merupakan hal yang penting. Salah satu cara untuk melakukan pendeteksian talasemia adalah dengan menggunakan machine learning. Pada skripsi ini, algoritma KC-Means (KCM) clustering digunakan untuk memprediksi talasemia. Kemudian performa algoritma tersebut dibandingkan dengan algoritma Kernel KC-Means (KKCM) clustering, dimana fungsi kernel yang digunakan adalah kernel Gaussian Radial Basis Function (RBF) dan polinomial. Pengujian kedua algoritma tersebut dilakukan dengan menggunakan hold-out evaluation dan 5-fold cross validation. Data yang digunakan adalah data talasemia yang berasal dari Rumah Sakit Harapan Kita, Jakarta, Indonesia. Data talasemia tersebut terdiri dari 150 sampel dengan komposisi 82 sampel talasemia dan 68 sampel non-talasemia, yang tiap sampelnya memiliki 11 fitur. Berdasarkan percobaan yang dilakukan, algoritma KCM dan KKCM menghasilkan prediksi dengan akurasi, sensitivitas, presisi, spesifisitas, dan F1-Score yang sama, yaitu di atas 96 persen. Namun, waktu komputasi yang dibutuhkan oleh KKCM dapat mencapai hingga 10.25 kali lebih cepat dari waktu komputasi KCM

.
Thalassemia is a genetic disease in which there are abnormalities in red blood cells due to an error in the production of hemoglobin. Marriage between thalassemia carriers can cause the birth of a child suffering from thalassemia major. Thalassemia major is a type of thalassemia that can cause death. Therefore, early detection of thalassemia is essential. One of the techniques to detect thalassemia is to use machine learning. In this thesis, the KC-Means (KCM) clustering algorithm is used to predict thalassemia. Then the performance of the algorithm is compared with the KC-Means Kernel (KKCM) clustering algorithm, where the kernel functions used are the Gaussian Radial Base Function (RBF) and polynomial kernel. Evaluation of those algorithms is carried out using hold-out evaluation and 5-fold cross-validation. The data used is thalassemia data from Harapan Kita Hospital, Jakarta, Indonesia. The data consists of 150 samples with a composition of 82 thalassemia samples and 68 non-thalassemia samples; each has 11 features. Based on the experiments, the KCM and KKCM algorithms make predictions with the same accuracy, sensitivity, precision, specificity, and F1-Score, which is above 96 percent. However, the computing time needed by KKCM can reach up to 10.25 times faster than the KCM computing time."

Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2020

S-Pdf

UI - Skripsi Membership Universitas Indonesia Library

Hanandi Rahmad Syahputra

Penerapan Discriminant Analysis dan Support Vector Machine dalam Memprediksi Tren Pergerakan Harga Saham di Bursa Efek Indonesia = The Implementation of Discriminant Analysis and Support Vector Machine in Predicting The Trend of Stock Price Movements on the Indonesia Stock Exchange.

"Memprediksi pergerakan harga saham merupakan tugas yang sangat menantang karena karakteristik pasar saham yang kompleks, tidak linier, dan penuh ketidakpastian. Namun berdasarkan pada teori efficient market hypothesis dan tingkat efisiensinya, memprediksi pergerakan harga saham merupakan tugas yang masih memungkinkan untuk dicapai. Banyak pendekatan telah diterapkan untuk memprediksi pergerakan harga saham mulai dari pendekatan statistik linier sederhana seperti discriminant analysis (DA) hingga pendekatan machine learning yang kompleks seperti support vector machine (SVM). Baik DA dan SVM adalah pendekatan yang dapat digunakan untuk melakukan klasifikasi seperti memprediksi tren harga saham dari beberapa kelas. Dalam penelitian ini, tren pergerakan harga saham diklasifikasikan ke dalam dua kelas, yaitu "highly possible to go up" dan "highly possible to go down or be neutral" di mana pemisahan kelasnya didasarkan pada variabel berupa data teknikal, fundamental, keuangan, dan koefisien beta dari saham di Bursa Efek Indonesia (BEI). Dengan menggunakan variabel-variabel ini, sejumlah model prediksi dengan periode prediksi atau fungsi tertentu dilatih dan kemudian digunakan untuk memprediksi tren pergerakan harga saham di BEI. Periode prediksi yang digunakan dalam penelitian ini berkisar dari 1 bulan hingga 9 bulan. Metode stepwise linear regression (SLR) dan sequential forward selection (SFS) diterapkan sebagai metode feature selection guna memilih variabel yang paling relevan sehingga kinerja setiap model prediksi dapat dioptimalkan. Pada penelitian ini, jumlah fitur, nilai signifikansi maksimum dari F-to-enter, fungsi kernel, dan metode parameter selection divariasikan sehingga dihasilkan 12 model prediksi DA dan 30 model prediksi SVM. Dengan menerapkan beberapa proses evaluasi, maka model prediksi dengan tingkat akurasi dan efektifitas yang paling baik dapat dipilih. Dari seluruh 12 model prediksi DA yang dirancang, terdapat 3 model prediksi yang dinilai layak untuk diterapkan. Sedangkan dari seluruh 30 model prediksi SVM yang dirancang, terdapat 11 model prediksi yang dinilai layak untuk diterapkan. Kemudian dari 14 model prediksi yang dinilai layak tersebut, 4 model prediksi terbaik untuk periode prediksi 3, 5, 7, dan 9 bulan serta 1 model prediksi terbaik dengan fungsi untuk mengklasifikasi major trend selama 9 bulan telah berhasil dipilih. Kelima model tersebut merupakan model prediksi SVM sehingga dapat disimpulkan bahwa SVM mengungguli DA dalam memprediksi tren pergerakan harga saham di Bursa Efek Indonesia.

Predicting the movement of stock prices is a very challenging task because the characteristics of the stock market are complex, non-linear, and full of uncertainty. However, based on the efficient market hypothesis theory and its level of efficiency, predicting stock price movements is a task that is still possible to achieve. Many approaches have been applied for predicting the movement of stock prices ranging from simple linear statistical approaches such as discriminant analysis (DA) to complex machine learning approaches such as support vector machines (SVM). Both DA and SVM are approaches that can be used to perform classifications such as predicting stock price trends from several classes. In this study, the trends of stock price movements are classified into two classes, namely "highly possible to go up" and "highly possible to go down or be neutral" in which the class separation is based on variables in the form of technical, fundamental, financial, and beta coefficient data of stocks on the Indonesia Stock Exchange (IDX). By using these variables, a number of prediction models with specific prediction periods or functions are trained and then used to predict the trends of stock price movements on the IDX. The prediction periods used in this study range from 1 month to 9 months. The stepwise linear regression (SLR) and sequential forward selection (SFS) methods are applied as the feature selection methods to select the most relevant variables so that the performance of each prediction model can be optimized. In this study, the number of features, the maximum significance value of the F-to-enter, kernel function, and parameter selection method are varied to produce 12 DA prediction models and 30 SVM prediction models. By applying several evaluation processes, the prediction model with the best level of accuracy and effectiveness can be chosen. From all 12 DA prediction models designed, there are 3 prediction models that are considered feasible to be applied. While from all 30 SVM prediction models designed, there are 11 prediction models that are considered feasible to be applied. Then, out of these 14 prediction models that are considered feasible, 4 best prediction models for the prediction periods of 3, 5, 7, and 9 months and 1 best prediction model with the function to classify the major trend for 9 months have been successfully selected. These five prediction models are SVM prediction models so that it can be concluded that SVM outperforms DA in predicting the trends of stock price movements on the Indonesia Stock Exchange."

Depok: Fakultas Ekonomi dan Bisnis Universitas Indonesia, 2020

T-pdf

UI - Tesis Membership Universitas Indonesia Library

<< 1 2 3 4 5 6 7 8 9 10 >>

Hasil Pencarian :: Simpan CSV :: Kembali

Hasil Pencarian