Hasil Pencarian

Ditemukan 5 dokumen yang sesuai dengan query

T.M. Rikza Abdy

Analisa kinerja algoritma Generalized Latent Semantic Analysis (GLSA) dengan proses stemming menggunakan persamaan kata pada sistem penilaian esai otomatis Simple-O = Performance analysis of Generalized Latent Semantic Analysis (GLSA) with stemming process using word similiarity on automatic essay grader Simple-O

"Stemming merupakan salah satu bagian penting dalam proses penilaian esai secara otomatis. Stemming merupakan proses transformasi suatu kata-kata tertentu menjadi kata dasarnya. Salah satu algoritma stemming yang ada adalah dengan menggunakan persamaan kata, dimana semua kata yang berimbuhan dan istilah yang berbeda untuk satu kata bermakna sama dapat disetarakan bobotnya. Untuk itu proses stemming menggunakan persamaan kata ini akan diimplementasikan pada sistem penilai esai otomatis Simple-O berbasis Generalized Latent Semantic Analysis (GLSA) yang bertujuan untuk meningkatkan ketepatan penilaiannya agar semakin mendekati hasil penilaian oleh manusia.

Dari 98 kali pengujian, kinerja GLSA menggunakan proses stemming memberikan hasil yang lebih baik dengan tingkat ketepatan sebanyak 72 kali atau sekitar 73,4% lebih unggul dibandingkan GLSA tanpa proses stemming yang hanya unggul sebanyak 20 kali dari 98 kali percobaan atau dengan presentase sekitar 20,4%. Hal ini menunjukkan bahwa implementasi proses stemming pada Simple-O berbasis GLSA menghasilkan hasil yang lebih baik daripada GLSA tanpa proses stemming.

Stemming is one of the important processes on automatic essay grading. Stemming is a process to transform a word into its root word in order to make essay grader becoming more accurate. One of stemming algorithm that have developed is using word similiarity, where in this algorithm all the prefixed word or the other words that have a similar meaning have an equal weight. This algorithm is implemented on an automatic essay graderbased on Generalized Latent Semantic Analysis (GLSA) called Simple-O in order to match the grade from human raters.
The experiment result shows that from 98 samples GLSA algorithm with the stemming process outperform GLSA without stemming 72 times with the percentage about 73,4%, on the other hand GLSA without stemming only give the better result 20 times with the percentage of 20,4%. This experiments result shows that GLSA based Simple-O using stemming algorithm gives better result than GLSA without stemming process."

Depok: Fakultas Teknik Universitas Indonesia, 2013

S47509

UI - Skripsi Membership Universitas Indonesia Library

Marsel Widjaja

Implementation of porter's modified stemming algorithm in an Indonesian word error detection plugin application

"Stemming is a process of finding a root of a word with some omission stages of prefixes and suffixes. Stemming for each language varies depending on the morphology of the language. Stemming widely been used as a complementary stage in many activities relating to word or phrase. With so many stemming utilizations, many algorithms are made to do the stemming process. In this study, the authors would like to learn the Porter’s stemming algorithm, to develop, improve and implement this algorithm into a word error detector plugin application. In the test results shown that the modified Porter stemming algorithm gives more accurate results in the analysis than the original Porter stemming algorithm with an average difference of about 3 percent precision."

Depok: Faculty of Engineering, Universitas Indonesia, 2015

UI-IJTECH 6:2 (2015)

Artikel Jurnal Universitas Indonesia Library

Pengklasifikasian artikel berita berbahasa Indonesia secara otomatis menggunakan naive bayes classifier

"Seiring derasnya arus informasi berita elektronik, timbul kebutuhan untuk mengatur informasi tersebut sehingga pengguna dapat mengaksesnya dengan lebih mudah. Akan tetapi jika pengelompokan berita dilakukan secara manual, maka akan memakan waktu yang lama dan mahal. Klasifikasi dokumen secara otomatis sekiranya diperlukan untuk mengurangi biaya dan mempercepat pengaturan informasi. Salah satu metode yang dapat digunakan dalam pengklasifikasian yaitu Naïve Bayes Classifier. Fokus penelitian ini adalah meneliti karakteristik Naïve Bayes Classifier untuk memperoleh kinerja yang optimal dalam proses klasifikasi. Cara yang diterapkan pada penelitian ini yaitu dengan mengujicobakan metode tersebut dengan 3 perlakuan yaitu membandingkan kinerja sistem terhadap stemming maupun non stemming, berbagai proporsi dokumen pembelajaran dan jumlah kategori dalam klasifikasi. Tahapan penelitian dilakukan mulai dari studi pustaka, menerapkan metode Naïve Bayes Classifier dalam pengklasifikasian berita berbahasa Indonesia, melakukan uji coba dan analisa mengenai karakteristik metode ini serta menarik kesimpulan dari hasil analisa. Penelitian dilakukan terhadap 1351 dokumen berita berbahasa Indonesia dari situs www.suarapembaruan.com yang diambil pada bulan Januari 2004 sampai dengan bulan November 2004.

Hasil penelitian menunjukan bahwa Naive Bayes Classifier merupakan metode yang memiliki tingkat akurasi yang tinggi. Kinerja akan lebih baik jika metode ini diterapkan dengan stemming dibanding tanpa stemming walaupun selisih kinerja keduanya tidak terpaut jauh yaitu sekitar 3,87%. Selain itu, hasil penelitian juga menunjukan bahwa kinerja metode ini dipengaruhi oleh jumlah dokumen pembelajaran. Semakin banyak dokumen pembelajaran yang digunakan, maka akan semakin tinggi tingkat keakuratan metode ini. Hal ini terbukti dari uji coba kombinasi stemming dengan proporsi dokumen pembelajaran 90% yang mampu mencapai kinerja tertinggi selama penelitian yaitu recall sebesar 93,5%, precision 94,125% dan F-measure 93,81%. Hal menarik yang terjadi adalah akurasi masih tetap relatif tinggi walaupun dokumen pembelajaran secara ekstrim dikurangi menjadi 10%. Hal ini ditunjukan dengan recall sebesar 89,82%, precision 90,36% dan F-measure 90,1%.

Pada penelitian ini juga mengamati apakah Naïve Bayes Classifier merupakan metode klasifikasi yang stabil. Hal ini diteliti dengan membandingkan kinerja sistem terhadap banyaknya jumlah kategori dalam klasifikasi. Hasilnya ternyata jumlah kategori tidak mempengaruhi kinerja metode ini. NBC merupakan metode yang stabil jika dilihat dari segi kuantitas kategori."

Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2006

S-Pdf

UI - Skripsi Membership Universitas Indonesia Library

Ria Yuliana

Analisis pengidentifikasian kata - kata yang muncul berulang menggunakan algoritma cosine similarity pada sistem penilaian esai otomatis simple o = Analysis identifying repetition of a word using cosine similarity in automated essay grading system simple o / Ria Yuliana

"Pada skripsi ini akan membahas mengenai pengimplementasi pendeteksian pengulangan kata menggunakan Cosine Similarity, sedangkan untuk melihat makna antar kalimat akan dilakukan pembobotan kalimat yang sebelumnya di lakukan proses parsing, stemming, stopword dan melakukan pemisahan antar kalimat. Metode stemming yang akan digunakan adalah metode stemming Arifin-Setiono, proses stemming digunakan untuk mencari kata dasar dari setiap kata pada jawaban dan kemudian dibandingkan dengan kata yang ada pada database. Jika antar kalimat masing-masing dibandingkan dan memiliki nilai cosine similarity lebih dari 0.5 maka sistem tambahan akan menghapus satu kalimat tersebut. Waktu proses antara sistem SIMPLE-O murni lebih cepat jika dibandingkan dengan SIMPLE-O dengan pendeteksian kata yang berulang antar kalimat dengan selisih waktu 0.22 detik. Korelasi nilai antara SIMPLE-O+Cosine dengan Human Raters adalah yaitu sebesar 0.38 untuk soal nomor satu dan untuk soal nomor dua memiliki nilai korelasi yang bernilai negatif 0.08 , untuk soal tiga 0.13, untuk soal empat 0.65 dan 0.022 untuk soal nomor lima.

In this paper will discuss the use of word repetition detection implement Cosine Similarity, while to see the meaning of the sentence will be weighted between sentences previously performed process of parsing , stemming , stopword and separation between sentences . Stemming method to be used is a method of stemming Arifin - Setiono , stemming process used to find root of each word in student answer , and then compared with of the word database . If the inter- sentence and has been compared and have value of cosine similarity more than 0.5 , the additional features on the system will remove a sentence . The time between system processes SIMPLE - O more fast when compared with SIMPLE-O with additional features on the system that will repetitive detection word sentence with a time difference between 0.22 seconds. The correlation value of the Human Raters with the SIMPLE-O + Cosine is 0.383 for the first question, -0.08 for the second question, 0.13 for the third question, 0.65 for the fourth question and 0.02 for the fifth question."

Depok: Fakultas Teknik Universitas Indonesia, 2015

S60130

UI - Skripsi Membership Universitas Indonesia Library

Heninggar Septiantri

Perbandingan metode latent semantic analysis dan vector space model untuk sistem penilai jawaban esai otomatis bahasa Indonesia

"Penelitian mengenai sistem penilai jawaban esai sudah pernah dilakukan dengan metode Latent Semantic Analysis (LSA). Salah satu keterbatasan yang dialami adalah keterbatasan dokumen training untuk mengoptimalkan hasil LSA. Dengan keterbatasan tersebut penggunaan Vector Space Model (VSM) dapat dipertimbangkan. Penelitian ini membandingkan LSA dan VSM untuk menilai jawabanbentuk esai serta meneliti pengaruh pemotongan imbuhan dan perluasan kunci jawaban terhadap efektifitas sistem. Uji coba dilakukan dengan 13 soal esai dengan 42 peserta ujian. Secara keseluruhan, rata-rata korelasi nilai VSM-manusia lebih tinggi dari LSA-manusia.

Research in automated essay scoring system has been done using Latent Semantic Analysis (LSA) method. One of the limitations is the lack of training documents to optimize LSA results. Regarding such limitation, the use of Vector Space Model (VSM) can be considered. This research aims to compare LSA and VSM to score essay answer and to investigate the effect of stemming and query expansion toward the effectiveness of the system. Experiments are done with 13 problems with 42 test participants. Overall results show that average correlation of score between VSM-human is higher than LSA-human."

Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2009

S-Pdf

UI - Skripsi Open Universitas Indonesia Library

Hasil Pencarian :: Simpan CSV :: Kembali

Hasil Pencarian