Studi Komparatif Model Unsupervised Outlier Detection dengan Pembuatan Data Sintetis Realistis: Studi Kasus Data Finansial Tidak Berlabel = Comparative Study of Unsupervised Outlier Detection Models with Realistic Synthetic Data Generation: A Case Study of Unlabeled Financial Data

Rendya Yuschak, author

Studi Komparatif Model Unsupervised Outlier Detection dengan Pembuatan Data Sintetis Realistis: Studi Kasus Data Finansial Tidak Berlabel = Comparative Study of Unsupervised Outlier Detection Models with Realistic Synthetic Data Generation: A Case Study of Unlabeled Financial Data

Rendya Yuschak; Fariz Darari, supervisor; Denny, supervisor; Kurniawati Azizah, examiner; Arawinda Dinakaramani, examiner (Fakultas Ilmu Komputer Universitas Indonesia, 2024)

Abstrak

Dalam era digital saat ini, banyaknya data finansial yang melimpah dan tidak berlabel menimbulkan tantangan dalam pemilihan teknik pendeteksian outlier (outlier detection) yang optimal. Penelitian ini bertujuan untuk menangani tantangan tersebut dengan membandingkan model unsupervised outlier detection pada data sintetis yang dirancang untuk meniru karakteristik data finansial nyata. Sebagai studi kasus, penelitian ini menggunakan data Laporan Harta Keuangan Penyelenggara Negara (LHKPN) tahun 2022. Proses penelitian mencakup pengumpulan data, pemrosesan, pembuatan data sintetis, pengujian sepuluh algoritma outlier detection, dan penerapan model terbaik pada data LHKPN tahun 2022. Dari proses ini, model Median Absolute Deviation (MAD) dengan threshold 7.8 teridentifikasi sebagai yang paling efektif pada data sintetis yang meniru data LHKPN. Penelitian ini juga menemukan hyperparameter terbaik untuk model lain dan melakukan analisis skor outlier pada data nyata. Hasilnya memberikan wawasan baru dan menunjukkan potensi investigasi lanjutan dalam outlier detection pada data finansial tidak berlabel, dengan pendekatan yang menyeluruh mulai dari analisis distribusi data hingga pengujian model pada data sintetis dan asli.

In the current digital era, the abundance of unlabeled financial data poses challenges in selecting optimal outlier detection techniques. This research aims to address these challenges by comparing unsupervised outlier detection models on synthetic data, designed to mimic real financial data characteristics. Using 2022 data from the Laporan Harta Keuangan Penyelenggara Negara (LHKPN) as a case study, the research process includes data collection, processing, creating synthetic data, testing 10 outlier detection algorithms, and applying the most effective model, identified as Median Absolute Deviation (MAD) with a threshold of 7.8, on synthetic data based on LHKPN data. The study also finds the best hyperparameters for other models and conducts real data outlier score analysis, providing new insights and demonstrating further investigation potential in outlier detection for unlabeled financial data.

File Digital: 1

Shelf

S-Rendya Yuschak.pdf :: Unduh

LOGIN required

Kata Kunci

financial data

unsupervised outlier detection

unlabeled data

synthetic data

Metadata

Jenis Koleksi :	UI - Skripsi Membership
No. Panggil :	S-pdf
Entri utama-Nama orang :	Rendya Yuschak, author


Entri tambahan-Nama orang :	Fariz Darari, supervisor Denny, supervisor Kurniawati Azizah, examiner Arawinda Dinakaramani, examiner
Entri tambahan-Nama badan :	Universitas Indonesia. Fakultas Ilmu Komputer

Program Studi :	Ilmu Komputer
Subjek :	Least absolute deviations (Statistics)
Penerbitan :	Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2024

Bahasa :	ind
Sumber Pengatalogan :	LibUI ind rda
Tipe Konten :	text
Tipe Media :	computer
Tipe Carrier :	online resource
Deskripsi Fisik :	xv, 77 pages : illustration + appendix
Naskah Ringkas :
Lembaga Pemilik :	Universitas Indonesia
Lokasi :	Perpustakaan UI

Ketersediaan
Ulasan
Sampul

No. Panggil	No. Barkod	Ketersediaan
S-pdf	14-25-05203127	TERSEDIA

Ulasan:

Tidak ada ulasan pada koleksi ini: 9999920553369

UI - Skripsi Membership :: Kembali

UI - Skripsi Membership :: Kembali

Studi Komparatif Model Unsupervised Outlier Detection dengan Pembuatan Data Sintetis Realistis: Studi Kasus Data Finansial Tidak Berlabel = Comparative Study of Unsupervised Outlier Detection Models with Realistic Synthetic Data Generation: A Case Study of Unlabeled Financial Data

Abstrak

File Digital: 1

LOGIN required

Kata Kunci

Metadata