Hasil Pencarian  ::  Simpan CSV :: Kembali

Hasil Pencarian

Ditemukan 117626 dokumen yang sesuai dengan query
cover
Fajar Restu Illahi
"Metode well-logging merupakan salah satu metode yang digunakan oleh geofisikawan dalam mendelineasi zona prospek hidrokarbon yang meliputi informasi lapisan dan zona penyebaran hidrokarbon. Akan tetapi dalam data well-logging acapkali nilai well-logging hilang atau tidak lengkap pada interval kedalaman tertentu akibat masalah operasional dalam proses pengeboran. Sehingga untuk mengatasi hal ini diperlukan suatu pendekatan yang dapat dilakukan dengan cepat dan tepat dengan menggunakan metode data mining. Berdasarkan komponen log yang lengkap, nilai log yang hilang dapat diprediksi dengan salah satu algoritma, yaitu regresi random forest. Algoritma ini bekerja dengan cara membuat ensemble pohon keputusan yang dimodelkan dan dilatih dengan parameter yang disesuaikan dan dikombinasikan dengan antarmuka pengguna grafis. Pengombinasian antarmuka grafis dilakukan dalam mempermudah pengguna dalam mengoperasikan dan menginterpretasikan hasil prediksi. Adapun log yang diprediksi merupakan log gamma ray (GR), log bulk density (RHOB), log neutron (NPHI), log sonic (DT), dan log deep resistivity (ILD) pada wilayah kerja Cekungan Sengkang dengan divariasikan prediksi antara per formasi dan blind well. Hasil prediksi yang dihasilkan regresi random forest dalam metode data mining menunjukkan hasil yang akurat untuk log porositas (densitas, sonic, dan neutron) dengan rentang akurasi dari 89% hingga 94%. Sedangkan untuk log lainnya seperti log gamma ray dan resistivitas diperlukan penyusunan parameter dan data latih kembali.

Well-logging method is one of the methods used by geophysicists in delineating the hydrocarbon prospect zone which includes information about layer and distribution zone of hydrocarbons. However, in well-logging data, some values ​​are often missing or incomplete at certain depth intervals due to operational problems in the drilling process. To overcome this we need an approach that can be done quickly and precisely by data mining methods. Based on the complete log component, the missing log value can be predicted using one of the algorithms, namely random forest regression. This algorithm works by creating an ensemble of modeled and trained decision trees with adjusted parameters and combined with a graphical user interface. The combination of a graphical interface is done to make it easier for users to operate and interpret the predicted results. The predicted logs are gamma ray log (GR), bulk density log (RHOB), neutron log (NPHI), sonic log (DT), and deep resistivity log (ILD) in the Sengkang Basin area with varied predictions between formation and blind well. Prediction results generated by random forest regression in the data mining method show accurate results for porosity logs with an accuracy range from 89% to 94%. Meanwhile, for other logs such as gamma ray and resistivity logs, it is necessary to compile parameters and data train."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2021
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Yogi Kurnia
"Tingginya jumlah peserta seleksi beasiswa yang tidak lulus, menyebabkan tidak efisiennya penyelenggaraan kegiatan seleksi beasiswa di LPDP. Berdasarkan data hasil seleksi beasiswa, terlihat bahwa persentase kelulusan peserta sangat rendah tiap tahunnya. Pada tahun 2013 proporsi yang tidak lulus seleksi sebesar 54%, sedangkan pada tahun 2014 dan tahun 2015 meningkat menjadi 85% dan 71%. Secara keseluruhan, terdapat 74% pendaftar beasiswa LPDP yang tidak lulus seleksi beasiswa dari tahun 2013 hingga tahun 2015. Hal ini menyebabkan tingginya biaya yang dikeluarkan untuk pelaksanaan seleksi. Jika LPDP bisa memprediksi peluang kelulusan peserta, maka biaya tersebut bisa dikurangi. Teknik klasifikasi pada data mining merupakan teknik yang tepat untuk permasalahan ini.
Metodologi yang digunakan dalam penelitian ini adalah knowledge discovery in databases (KDD). Metodologi ini terdiri dari 5 (lima) langkah, yaitu selection, preprocessing, transformation, data mining, dan interpretation / evaluation. Dataset bersumber dari data formulir pendaftaran beasiswa dan hasil wawancara. Proses pemodelan menggunakan software Rapid Miner dan algoritma decision tree. Model yang dihasilkan dievaluasi menggunakan k-fold cross validation. Hasil penelitian ini yaitu LPDP dapat memprediksi peluang kelulusan peserta seleksi.

The high number of participants who did not pass the scholarship selection, leading to inefficient operation of the selection of scholarship in the LPDP. Based on data from scholarship selection results, it appears that a very low percentage of graduation of each year. In 2013 the proportion who were not selected by 54%, whereas in 2014 and 2015 increased to 85% and 71%. Overall, there is a 74% LPDP scholarship applicants who did not pass the selection of scholarship from 2013 to 2015. This led to high costs incurred for the implementation of the selection. If LPDP can predict the chances of graduation participants, the cost can be reduced. Classification techniques in data mining is a technique that is appropriate for this problem.
The methodology used in this study is a knowledge discovery in databases (KDD). This methodology consists of five (5) steps, namely selection, preprocessing, transformation, data mining, and interpretation / evaluation. Dataset data sourced from the scholarship application form and interview. Process modeling using software Rapid Miner and decision tree algorithm. The resulting model was evaluated using the k-fold cross validation. Results of this study are LPDP can predict the chances of graduation of the selection.
"
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2016
TA-Pdf
UI - Tugas Akhir  Universitas Indonesia Library
cover
Dilla Fadlillah Salma
"Kepemilikan dan penggunaan kendaraan mobil memiliki berbagai risiko negatif, seperti terjadinya kecelakaan. Untuk mengurangi beban risiko tersebut, perusahaan menjual produk asuransi mobil. Asuransi mobil merupakan salah satu produk perusahaan asuransi kendaraan yang bertujuan sebagai upaya perlindungan pemilik kendaraan mobil dari kerugian finansial yang terjadi pada kendaraan yang diasuransikannya. Untuk menawarkan produk asuransi, beberapa perusahaan menggunakan teknik penjualan dengan cara cold calling. Teknik penjualan tersebut akan lebih efektif menjual produk asuransi jika terlebih dahulu data nasabah calon pembeli asuransi diprediksi atau diklasifikasi ke dalam kelas membeli atau tidak membeli.
Pada skripsi ini, dilakukan klasfikasi dengan metode Support Vector Machine (SVM), Random Forest (RF),dan Logistic Regression (LR) dengan implementasi metode seleksi fitur One Dimensional Naïve Bayes Classifier (1-DBC). Data yang diperoleh berjumlah 4000 data dengan total 18 fitur. Diperoleh hasil bahwa akurasi SVM lebih tinggi dibandingkan dengan kedua metode lainnya. Selain itu, mplementasi metode seleksi fitur telah berhasil meningkatkan akurasi dari metode Random Forest, dan Logistic Regression. Dengan implementasi 1-DBC, ketiga metode klasifikasi memperoleh hasil akurasi tertinggi pada penggunaan 15 fitur.

Ownership and use of car vehicles have a variety of negative risks, such as accidents. To reduce the risk burden, the company sells car insurance products. Car insurance is one of the products of a vehicle insurance company that aims to protect vehicle owners from financial losses that occur on their insured vehicles. To offer insurance products, some companies use sales techniques using cold calling. The sales technique will be more effective in selling insurance products if first the prospective customer buyer data is predicted or classified into the class of buying or not buying.
In this paper, classification is done using the method of Support Vector Machine (SVM), Random Forest (RF), and Logistic Regression (LR) by implementing the One Dimensional NaA-ve Bayes Classifier (1-DBC) feature selection method. The data obtained amounted to 4000 data with a total of 18 features. The results were obtained that the accuracy of SVM was higher compared to the other two methods. In addition, the implementation of the feature selection method has succeeded in increasing the accuracy of the Random Forest, and Logistic Regression. With the implementation of 1-DBC, the three classification methods obtained the highest accuracy results with the use of 15 features.
"
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2018
S-Pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Aziz Setia Aji
"ABSTRAK
Badan Meteorologi Klimatologi dan Geofisika (BMKG) memiliki tugas pengamatan terhadap magnet bumi yang tersebar di Indonesia. Sensor magnetik bumi BMKG menghasilkan output data real-time. Penelitian ini berfokus pada model predictive maintenance pada sensor magnetik bumi berdasarkan output data sensor. Output data yang dihasilkan adalah dalam bentuk format delimited-space sehingga mudah untuk diproses. Komponen magnetik yang digunakan dalam penelitian ini adalah data komponen total magnet bumi (F) dari sensor. Pemrosesan data menggunakan bahasa pemograman python dan algoritma yang digunakan adalah metode random forest regression dengan membandingkan perbedaan nilai yang dihasilkan dengan data Indoesian Geomagnetic Maps for Epoch 2015.0 untuk kemudian dibuatkan model prediksi terhadap waktu. Proses tersebut digunakan untuk mengetahui apakah data yang dihasilkan masih dalam toleransi atau tidak. Tahapan dalam penelitian ini mulai dari pengumpulan data, pre-processing data, pembuatan model, hingga pengujian model dan validasi terhadap model. Penelitian ini menghasilkan estimasi waktu pemeliharan sebesar 14 hari pada data baseline nilai F dan sebesar 3 hari pada data delta F (ΔF).

ABSTRACT
The Meteorological, Climatological, and Geophysical Agency (BMKG) has the task of observing the earth magnets spread across Indonesia. Earth magnetic sensor of BMKG delivers real-time data output. The study focuses on the predictive maintenance model on the earth's magnetic sensor based on sensor data output. The resulting data output is in the form of delimited-space format so it is easy to process. The magnetic component used in this study is data on the earth's total magnetic component (F) from the sensor. Data processing uses python programming language and the algorithm used is a random forest regression method by comparing the value difference generated with the Indoesian Geomagnetic Maps for Epoch 2015.0 data for later created predictive models against time. The process is used to determine whether the resulting data is still in tolerance or not. The stages in this study range from data collection, pre-processing data, create model, model testing, and model validation. The study resulted in a 14-day maintenance time estimate of the baseline data F-value and 3-day in the delta F (ΔF) data."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2020
T-Pdf
UI - Tesis Membership  Universitas Indonesia Library
cover
Geraldine Immanuel Tangyong
"Clustering merupakan salah satu metode pengolahan data yang bekerja dengan mengelompokkan objek-objek yang memiliki kemiripan ke dalam beberapa kelompok. Salah satu metode dari clustering adalah metode Ordering Points to Identify the Clustering Structure (OPTICS) yang adalah metode turunan dari metode Density Based Spatial Clustering of Application with Noise (DBSCAN). DBSCAN memiliki dua parameter, yaitu epsilon dan MinPts. Parameter ini mengakibatkan DBSCAN kurang bisa beradaptasi terhadap variasi densitas data. Karena itu, OPTICS hadir untuk mengatasi masalah tersebut dengan parameter core distance dan reachability distance. Tujuan dari penelitian ini adalah mengkaji metode OPTICS dan menerapkannya pada data sintetis dengan missing value serta pada data real, dengan data yang digunakan adalah data Socio-Economic dengan 167 observasi. Dari hasil pengkajian diketahui bahwa jika suatu data memiliki proporsi missing value lebih dari 15%, maka nilai akurasi dianggap tidak baik. Selanjutnya, dilakukan penerapan terhadap data Socio-Economic dan diperoleh 3 cluster. Cluster 1 memiliki jumlah anggota terbanyak dan cenderung memiliki skor terendah pada banyak variabel dibanding cluster lainnya dan dapat dilihat bahwa anggota dari cluster 1 banyak terdiri dari negara-negara berkembang. Cluster 2 cenderung memiliki skor tertinggi dan negara-negara di cluster 2 merupakan negara-negara maju. Cluster 3 banyak berisi negara campuran, baik negara berkembang maupun negara maju.

Clustering is a data processing technique that works by grouping objects that have similarities into different groups. One method of clustering is the Ordering Points to Identify the Clustering Structure (OPTICS) method, a derivative method of the Density Based Spatial Clustering of Application with Noise (DBSCAN) method. DBSCAN has two kinds of parameters, epsilon and MinPts. These parameters cause DBSCAN to not be able to adapt fully to arbitrary data forms. Therefore, OPTICS is here to solve this problem with the parameters of core distance and reachability distance. The purpose of this study is to examine the OPTICS method and apply it to synthetic with missing value and real data, using the Socio-Economic data with 167 observations. We can conclude that if a data has a missing value proportion of more than 15%, then the accuracy value is considered not good. Furthermore, the Socio-Economic data was applied and obtained 3 clusters. Cluster 1 has the largest number of members and have the lowest scores on many variables, which consists mostly of developing countries. Cluster 2 tends to have the highest score whereas most coming from developed countries. Cluster 3 contains many mixed countries, both developing and developed countries."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2022
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Elis
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 1999
S25642
UI - Skripsi Membership  Universitas Indonesia Library
cover
Agus Suryanto
"Penilaian kesesuaian atas standar dan regulasi dilakukan oleh Lembaga Penilaian Kesesuaian (LPK)/Conformity Assessment Body (CAB). Kegiatan penilaian kesesuaian pada barang, jasa, sistem, atau proses dilakukan melalui Pengujian (Testing), Inspeksi (Inspection) dan / atau Sertifikasi (Certification) (TIC). LPK juga dikenal sebagai perusahaan jasa survei. Perusahaan jasa survei di Indonesia memiliki banyak layanan dengan pelanggan yang tersebar di seluruh Indonesia. Banyaknya pelanggan membuat data transaksi menjadi besar yang perlu dilakukan segmentasi untuk menentukan strategi penjualan dan pemasaran.
Berdasarkan penelitian sebelumnya, belum banyak penelitian yang ditemukan yang menjadikan perusahaan jasa sebagai objek segmentasi, khususnya perusahaan jasa survei. Penelitian ini melakukan segmentasi pelanggan perusahaan jasa survei menggunakan Recency, Frequency, & Monetary Value (RFM), dan K-Means Clustering.
Penelitian ini mengolah 181.724 data transaksi perusahaan jasa. Berdasarkan RFM, pelanggan dapat dibagi menjadi 3 segmen yaitu 646 pelanggan Key Account dengan porsi pendapatan 70,73%, 10.037 pelanggan Regular Account dengan porsi pendapatan 29,06%, dan 3.720 pelanggan Retail dengan porsi pendapatan 0,21%. Berdasarkan K-Means, pelanggan dapat dibagi menjadi 21 klaster. Jumlah klaster, disesuaikan dengan banyaknya Kategori dalam Klasifikasi Baku Lapangan Usaha Indonesia (KBLI).
Berdasarkan penelitian ini, K-Means tidak hanya dapat digunakan untuk segmentasi pelanggan barang yang diproduksi, tetapi juga dapat digunakan untuk segmentasi pelanggan perusahaan jasa survei, dan hasil segmentasi dapat digunakan sebagai referensi untuk membuat paket jasa, dan membuat strategi penjualan dan pemasaran.

The conformity assessment of standard and regulation is conducted by Conformity Assessment Body (CAB). The conformity assessment activities that applied to goods, services, systems, or processes are carried out through testing, inspection and / or certification (TIC). CAB is also known as a survey service company. Survey service companies in Indonesia have a lot of services with many customers spread nationwide. The large number of customers make large transaction data that needs to be segmented to determine sales and marketing strategies.
Based on the previous research, not many studies have been found that take service companies as object of segmentation, especially survey service companies. This study is segmenting customers of survey service companies using Recency, Frequency, & Monetary Value (RFM), and K-Means Clustering.
This study processed 181,724 transaction data of a service company. Based on RFM, customers can be divided into 3 segments that are 646 Key Account customers with 70.73% revenue portion, 10,037 Regular Account customers with 29.06% revenue portion, and 3,720 Retail customers with a revenue portion of 0.21%. Based on K-Means, customers can be divided into 21 clusters. The number of cluster, is suit to number of Category in Indonesian Standard of Industrial Classification (ISIC).
According to this study, K-Means clustering not only can be used to segment customers of product manufactured, but also can be used to segment customers of survey service company, and the result of segmentation can be used as references for making service package (service bundling), and for making sales and marketing strategy.
"
Depok: Fakultas Teknik Universitas Indonesia, 2021
T-Pdf
UI - Tesis Membership  Universitas Indonesia Library
cover
Gertrudis Ratna
"Loyalitas pelanggan memiliki peranan yang besar bagi perusahaan untuk meningkatkan pasar bisnisnya karena pelanggan yang loyal memberikan dampak yang positif berupa peningkatan profit dan daya saing perusahaan, pujian yang positif pada produk, dan sebagai entry barrier terhadap para pesaing. Oleh karena itu, maskapai nasional sebagai bagian dari industri penerbangan yang terus meningkat ini perlu melakukan analisis mengenai loyalitas pelanggannya. Penelitian ini bertujuan untuk mengetahui karakteristik pelanggan dari salah satu maskapai swasta di Indonesia yang mempengaruhi tingkat loyalitasnya dengan metode data mining, dimana algoritma yang digunakan adalah C5.0. Hasil yang didapatkan pada penelitian ini berupa model pohon keputusan.yang berisikan klasifikasi pelanggan Lion Air berdasarkan tingkat loyalitasnya.

Customer loyalty has a important role for company in increasing its business market because loyal customers gives positive impacts, such as increasing company's profit and competence skill, positive complement about its product, and applicable to be used as an entry barrier within the competitors. In due to that condition, national airline, as one of the airline industry's components that improve in recent years, needs to do analysis research concerned on its own customer loyalty. This research aims to discover the customers' characteristic from an airline in Indonesia that influences their loyality level by using data mining, while the used algorithm is C5.0. A result obtained in this study is a decision tree model that contains a classification of Lion Air's customers based on their loyalty level. "
Depok: Fakultas Teknik Universitas Indonesia, 2011
S904
UI - Skripsi Open  Universitas Indonesia Library
cover
Yogi Kurnia
"Algoritma data mining membutuhkan sumber data yang berkualitas untuk mendapatkan hasil yang optimal. Kualitas sumber data dapat ditingkatkan kualitasnya dengan menggunakan teknik preprosessing data yang tepat. Kemampuan dalam menampilkan output dari proses data mining yang mudah dimengerti sangat penting untuk mendapatkan pengetahuan. Penelitian ini bertujuan untuk mengembangkan aplikasi yang bisa menjawab kebutuhan dari algoritma data mining. Hasil dari penelitian ini adalah aplikasi yang dapat melakukan keseluruhan proses baik preprocessing data dalam hal pemilihan data dan pengolahan data awal, penyediaan metadata, sampai dengan analisis data menggunakan algoritma data mining. Sehingga, analisis jumlah data yang besar dapat dilakukan dengan efisien dan efektif, tetapi hasil prediksi yang didapatkan tetap optimal.

Data mining algorithms require high quality data sources to obtain optimal results. Quality of data sources can be enhanced by using appropriate data preprocessing techniques. Ability to display easily understood output of the data mining process is essential to gain knowledge. This study aims to develop applications that can address the needs of data mining algorithms. The results of this study is an application that can do the whole steps from data preprocessing until data analysis using data mining algorithms. Data processing itself includes data and preliminary data processing and provision of metadata.. So, analyzing large amount of data can be done in efficient and effective fashion without disregarding necessary need of optimal prediction result."
Depok: Universitas Indonesia, 2012
S43461
UI - Skripsi Open  Universitas Indonesia Library
cover
Muhammad Nursaktiadhi Didiet
"Fraud adalah bentuk ketidaknormalan pola penggunaan layanan telekomunikasi yang menyebabkan kerugian pada operator [1]. Dengan berkembangnya layanan telekomunikasi, fraud pun berkembang ke arah layanan data dari yang tadinya layanan tradisional seperti suara, SMS, roaming internasional.
Penelitian ini mengambil studi kasus di PT XYZ dimana selama ini, metode penanganan fraud dilakukan dengan berbasis teknologi. Metode ini memiliki kelemahan yaitu tidak bisa mendeteksi semua kasus fraud dan waktu yang diperlukan semakin lama. Oleh karena itu, perlu dikembangkan suatu prosedur penanggulangan fraud yang lebih efektif dan efisien. Penanganan fraud perlu dilakukan secara menyeluruh dengan melibatkan data dari bagian marketing dan keuangan sebagai bagian dari rantai nilai penciptaan produk layanan data. Dalam pengolahan data yang berukuran sangat besar, digunakan metode data mining menggunakan perangkat lunak Rapidminer.
Dengan metode data mining dan definisi fraud baru, didapat data bahwa sebesar 45,5 % pelanggan paket data termasuk kategori fraud. Dari data tersebut dapat diusulkan suatu strategi layanan data baru yang lebih terkendali dengan membatasi penggunaan data pelanggan paket. Sedangkan untuk pelanggan harian, dideteksi jumlah pelanggan fraud sebesar 119% dibandingkan dengan metode lama. Dengan demikian terbukti bahwa metode baru ini mampu meningkatkan kinerja pengendalian fraud pada layanan data di operator seluler.

Fraud is an abnormality behavior of telecommunication service that cause loss to operator [1]. With the growing of telecommunication service, fraud also occur on data service compare to previous traditional service such as voice, SMS or international roaming.
This research takes case study at PT XYZ which already implement data service fraud management. This method has weakness on its ability to detect all fraud case and detection time. Therefore, need to develop more effective and efficient fraud management method. Fraud management need to involve data from marketing and finance function as part of value chain on product creation to get holistic approach. This research using data mining approach using free software Rapidminer to process big data.
Data mining method and new fraud definition resulted 45,5 % subscriber included on fraud category. That data suggested a new data service strategy that more controllable by limiting usage of package subscriber. For daily subscriber, detected that fraud subscriber is 119% compare with old method. It is proven that new method can improve performance of fraud control at data service on celluler operator.
"
Depok: Fakultas Teknik Universitas Indonesia, 2013
T35793
UI - Tesis Membership  Universitas Indonesia Library
<<   1 2 3 4 5 6 7 8 9 10   >>