Penyakit kardiovaskular merupakan penyebab utama kematian global, termasuk di Indonesia. Evaluasi kesehatan dini, menggunakan
heart rate variability (HRV) melalui pengukuran
root mean square of successive RR interval differences (RMSSD) dan
percentage of successive RR intervals that differ by more than 50 ðð (pNN50), menjadi penting untuk merefleksikan respons relaksasi, stres, kualitas tidur, dan aktivitas fisik. Evaluasi ini sebaiknya dilakukan saat seseorang masih dalam kondisi sehat. Sejalan dengan itu, penelitian ini bertujuan mengevaluasi kesehatan pasien dengan irama jantung normal melalui metode
clustering pada variabel RMSSD, pNN50, dan usia, yang diambil dari rekaman elektrokardiogram milik
online database Physionet. Setiap
cluster yang terbentuk dapat memberikan informasi unik, memungkinkan penentuan risiko penyakit kardiovaskular serta penanganan yang tepat. Namun, karena pola data yang digunakan tidak jelas, mengandung
outlier, dan berdimensi rendah, maka dilakukan perbandingan antara metode
Hierarchical clustering dan
Gaussian Mixture Models (GMM)
clustering yang mampu mengatasi hal tersebut. Mengingat GMM
clustering yang sangat sensitif terhadap inisialisasi awal, penelitian ini menggunakan dua pendekatan inisialisasi, yaitu acak dan
K-Means. Penentuan metode terbaik dilakukan dengan mempertimbangkan metrik evaluasi (efektivitas) dan waktu komputasi metode (efisiensi). Hasil penelitian menunjukkan bahwa GMM
clustering dengan inisialisasi
K-Means adalah metode terbaik dengan membentuk tiga
cluster. Meskipun alat EKG menilai pasien dalam kondisi sehat, namun analisis
clustering dapat mengungkapkan informasi penting, terutama bagi pasien yang teridentifikasi memiliki tingkat HRV yang relatif rendah.
Cardiovascular diseases are a leading cause of global mortality, including in Indonesia. Early health evaluation, utilizing heart rate variability (HRV) through root mean square of successive RR interval differences (RMSSD) and percentage of successive RR intervals that differ by more than 50 ðð (pNN50) measurements, is crucial to reflect responses to relaxation, stress, sleep quality, and physical activity. This evaluation is ideally conducted while an individual is still in a healthy condition. In line with that, this research aims to evaluate the health of patients with a normal sinus rhythm through clustering methods on variables like RMSSD, pNN50, and age, extracted from electrocardiogram recordings from the online Physionet database. Each cluster can provide unique information, enabling the identification of cardiovascular disease risks and appropriate interventions. However, due to unclear data patterns, the presence of outliers, and is low-dimensiona, a comparison is made between Hierarchical clustering and GMM methods, capable of addressing these issues. Given GMM clustering's sensitivity to initializations, this study employs two approaches, random and K-Means. The determination of the best method is based on considerations of evaluation metrics (effectiveness) and computational time (efficiency). Research results indicate that GMM clustering with K-Means initialization is the most effective and efficient method, forming three clusters. Despite ECG assessments indicating healthy conditions, clustering analysis can reveal crucial information, especially for patients identified with relatively low HRV levels.