Durasi yang lama dan prediksi dosis distribusi yang kurang optimal sering menjadi permasalahan utama dalam treatment planning kanker paru-paru secara manual. Model machine learning berbasis Gradient-Boosted Trees dapat dimanfaatkan untuk mempercepat proses dan menstandarisasi distribusi dosis treatment planning. Penelitian ini memanfaatkan 60 set data treatment planning kanker paru-paru yang diamati dan dikumpulkan oleh MRCCC Siloam Hospitals Semanggi yang dijadikan sebagai set data klinis. Set data yang telah diperoleh dibagi ke dalam 2 kelompok yaitu, 42 set data sebagai data training model machine learning dan 18 set data sebagai data testing model machine learning. Dalam penelitian ini, proses treatment planning memprediksi distribusi dosis yang telah dinormalisasi untuk organ PTV dan OAR. Organ PTV memiliki fitur dosis D2, D50, dan D98. Sementara itu, OAR terdiri atas paru-paru kanan, paru-paru kiri, jantung, dan sumsum tulang belakang. Setiap OAR memiliki fitur dosis yang terdiri atas dosis rata-rata (Dmean) dan dosis maksimum (Dmax). Data prediksi treatment planning menggunakan machine learning kemudian dibandingkan dengan data treatment planning klinis. Perbandingan hasil treatment planning tersebut ditampilkan menggunakan diagram boxplot nilai dosis distribusi PTV dan OAR yang telah dinormalisasi. Kemampuan Gradient-Boosted Trees dalam memprediksi dosis distribusi untuk PTV dan OAR dilihat dari nilai kesalahan mutlak rata-rata terhadap data klinis. Prediksi dosis distribusi PTV memiliki nilai kesalahan mutlak rata-rata sebesar 0,015 (D2), 0,017 (D50), dan 0,022 (D98). Setiap OAR memiliki nilai kesalahan mutlak rata-rata untuk masing-masing fitur dosis rata-rata dan maksimumnya, yaitu sebesar 0,153 (Dmean) dan 0,254 (Dmax) untuk paru-paru kanan, 0,167 (Dmean) dan 0,294 (Dmax) untuk paru-paru kiri, 0,1 (Dmean) dan 0,252 (Dmax) untuk jantung, serta 0,044 (Dmean) dan 0,136 (Dmax) untuk sumsum tulang belakang. Oleh karena itu, prediksi model Gradient-Boosted Trees bekerja lebih baik untuk PTV karena memiliki nilai kesalahan mutlak rata-rata yang lebih kecil dibandingkan dengan OAR.
Timeconsuming duration and suboptimal distribution dose prediction become the frequently-happened problems during the manual treatment planning for lung cancer. Gradient-Boosting model can be used for easing treatment planning’s process and standardising its distribution dose. This research uses 60 clinical datasets of lung cancer’s treatment planning that has been collected and processed by Semanggi Siloam Hospitals’ MRCCC. Those datasets are divided into two groups, the training data with 42 datasets and the testing data with 18 datasets. In this research, treatment planning predicts the distribution doses that have been normalised for each PTV’s and OARs’ features. The PTV dose features consist of D2, D50 and D98. Meanwhile, OARs consist of right lung, left lung, heart and spinal cord. Each OAR has mean dose (Dmean) and maximum dose (Dmax) as its dose features. The comparison is shown using boxplot diagrams with normalised dose as its value. The results of the treatment planning prediction using Gradient-Boosting model are then compared to the clinical data. The ability of the Gradient-Boosting model in predicting the distribution dose is calculated based on every Mean Absolute Error (MAE) of the PTV’s and OARs’ dose features. The PTV has 0,015 (D2), 0,017 (D50) and 0,022 (D98) as its MAEs. The OARs’ MAEs consist of 0,153 (Dmean) and 0,254 (Dmax) for right lung, 0,167 (Dmean) and 0,294 (Dmax) for left lung, 0,1 (Dmean) and 0,252 (Dmax) for heart, also 0,044 (Dmean) and 0,136 (Dmax) for spinal cord. In conclusion, Gradient-Boosting model works better for predicting PTV’s distribution dose than the OARs since MAEs for PTV dose features are much smaller compared to the OAR.