Pada zaman modern ini, implementasi chatbot digunakan untuk menyimpan data yang dikumpulkan melalui sistem tanya jawab, yang dapat diterapkan dalam program Python. Data yang akan digunakan dalam program ini adalah Cornell Movie Dialog Corpus yang merupakan dataset yang berisi korpus ini berisi kumpulan percakapan fiksi kaya metadata yang besar yang diekstraksi dari skrip film Penerapan chatbot dalam program Python, dapat menggunakan berbagai macam model, secara spesifik pada program ini akan diterapkan model LSTM, dan model BiLSTM. Penerapan chatbot dalam program Python, dapat menggunakan berbagai macam model, secara spesifik pada program ini akan diterapkan model LSTM, dan model BiLSTM. Hasil output dari program chatbot dengan penerapan model LSTM, dan BiLSTM adalah berupa akurasi, serta kumpulan data yang sesuai dengan informasi yang pengguna masukkan dalam input kotak dialog chatbot. Pemilihan model yang dapat diterapkan berdasarkan karakteristik data dapat mempengaruhi kinerja program, dengan tujuan program agar dapat menentukan tinggi atau rendahnya tingkat akurasi yang akan dihasilkan dari hasil yang diperoleh melalui sebuah program, yang dapat dijadikan faktor utama dalam menentukan model yang dipilih. Berdasarkan pertimbangan yang menjadi syarat pemilihan model dari sebuah program, pada akhirnya dipilih model LSTM, dan BiLSTM sebagai model yang akan diterapkan ke dalam program. Selain pemilihan model, berikutnya adalah menentukan metode yang digunakan dalam program, pada program ini dipilih metode greedy sebagai bentuk implementasi model LSTM dan model BiLSTM, dengan tujuan ketika dalam menjalankan program, waktu pengolahan data dapat lebih cepat, dan meningkatkan akurasi pada model yang dipilih pada program. Selain itu, atribut pendukung seperti seq2seq model, menjadi faktor penentu dalam sebuah program yang dapat berfungsi untuk memverifikasi pengolahan data apakah sesuai dengan kriteria yang dapat dijadikan sebagai pedoman dalam pengolahan data. Dalam penerapan komponen-komponen tersebut ke dalam program, seq2seq model dapat memproses kalimat input yang kemudian akan dilakukan pengolahan data tersebut menggunakan model dan struktur lain yang ada pada program, sehingga pada akhirnya dapat menghasilkan kalimat output yang berbagai macam, sebagai respon atas kalimat input yang dihasilkan dari program chatbot. Selain itu diperlukan metode evaluasi program yang dapat digunakan untuk memverifikasi apakah hasil output program sesuai dengan data yang diharapkan oleh pengguna. Berdasarkan penerapan model LSTM, dan model BiLSTM ke dalam chatbot, dapat disimpulkan bahwa dengan semua hasil uji program yang terdiri dari beragam pasangan parameter yang berbeda, maka dinyatakan Pasangan Parameter 1 (size_layer 512, num_layers 2, embedded_size 256, learning_rate 0.001, batch_size 32, epoch 20) yang berasal dari File 6 merupakan BiLSTM Chatbot dengan nilai avg accuracy 0.995217 yang menggunakan model BiLSTM menjadi pasangan parameter terbaik.
Meskipun teknologi telah mempengaruhi hampir semua aspek industri finansial, penelitian yang terfokus pada penggunaan teknologi pemrosesan teks dan analisis sentimen dalam konteks prediksi harga saham masih belum banyak dilakukan. Manfaat dan potensi dari penelitian semacam ini memiliki pengaruh yang tinggi, terutama karena analisis sentimen telah menjadi komponen yang penting dalam memprediksi tren pasar saham. Dalam penelitian ini, penulis mengusulkan penerapan metode feature engineering dalam memprediksi harga saham dengan memanfaatkan hasil analisis sentimen menggunakan FinBERT, lalu hasilnya akan dijadikan fitur oleh model BiLSTM. FinBERT adalah model berbasis BERT yang telah dilatih khusus untuk memproses dan menginterpretasi teks keuangan, sementara BiLSTM adalah arsitektur jaringan saraf berulang yang mampu mengatasi masalah yang ada pada jaringan saraf berulang standar seperti vanishing gradient dan efektif dalam mengolah data sekuensial. Penelitian ini menggabungkan kedua teknik ini untuk menciptakan model yang mampu memprediksi pergerakan harga saham berdasarkan analisis sentimen berita keuangan dengan nilai rata-rata MSE yang lebih rendah. Feature engineering digunakan dalam penelitian ini untuk mengekstrak dan mengolah informasi yang relevan dari dataset oleh model FinBERT untuk digunakan pada model BiLSTM. Dengan menggunakan metode feature engineering, ditemukan bahwa model BiLSTM yang menggunakan fitur sentimen analisis memiliki performa tertinggi dengan memiliki rata-rata nilai MSE terkecil dalam memprediksi tujuh saham yang memiliki karakteristik berbeda dengan nilai 3.43, nilai tersebut merupakan rata-rata terkecil dibandingkan tiga model lain dalam penelitian ini seperti LSTM dengan nilai MSE 4.04, Random Forest dengan nilai MSE 9.77, dan SVM dengan nilai MSE 12.56. Selanjutnya, proses optimisasi model BiLSTM menggunakan Optuna ditemukan nilai hyperparameter terbaik dalam menghadapi tujuh jenis saham yang berbeda, sehingga model mampu memprediksi lebih akurat dengan penurunan rata-rata nilai MSE hingga 40.55%. Sebagai bentuk validasi akhir pada penelitian ini telah dilakukan uji fold untuk mendapatkan model yang tidak overfitting dan memiliki rata-rata nilai MSE terkecil dengan variasi nilai hyperparameter batch size. Ditemukan batch size 16 merupakan ukuran paling optimal untuk tipe data NVDA,XOM dan TSLA dengan rata-rata MSE terkecil 0.64, 0.35, 0.05 sedangkan batch size 24 merupakan ukuran paling optimal untuk tipe data saham AAPL, AMZN, GOOG dan GOOGL dengan rata-rata MSE terkecil 0.028, 0.02, 0.03, 0.04, dan 0.03. Dalam menggunakan fitur sentimen analisis berhasil membuktikan menurunkan nilai MSE pada masing-masing jenis saham hingga rata-rata penurunan nilai MSE mencapai 33.10% dari semua jenis variasi data saham tanpa menggunakan fitur sentimen.