Hasil Pencarian

Ditemukan 67416 dokumen yang sesuai dengan query

Onny Amanda Putri

Suntingan teks setan yahudi ajeng ajengan kaliyan jim hawara dalam naskah nagari siluman = Text editing of setan yahudi ajeng ajengan kaliyan jim hawara in nagari siluman s manuscript

"Skripsi ini menyajikan deskripsi dan suntingan teks Setan Yahudi Ajeng ajeng kaliyan Jim Hawara dalam Naskah Nagari Siluman koleksi PNRI bernomor AS 51 yang ditulis oleh Pawiradirya. Metode penelitian filologi yang digunakan adalah metode edisi naskah tunggal. Suntingan teks dilakukan dengan menerapkan metode edisi kritis atau edisi standar dilengkapi dengan ringkasan cerita dan pedoman alih aksara. Teks berbentuk prosa ini menggunakan bahasa Jawa dan aksara Jawa. Teks ini menceritakan tentang perebutan kekuasaan antara Jin Hawara beserta keturunannya dengan Setan Yahudi beserta keturunannya.

The research present a description and critical text of Setan Yahudi Ajeng ajengan kaliyan Jim Hawara in Nagari Siluma's manuscipt AS 51 which is PNRI collection written by Pawiradirya. The philological method uses the single text edition. The critical text method of philological study use standard critical edition. The study comes with story summary and transliteration guidelines. The prose shaped text uses Java rsquo s language and Java script. This text tells about the war of power struggle between Jewish demon and Hawara genie."

Depok: Fakultas Ilmu Pengetahuan Budaya Universitas Indonesia, 2014

S-Pdf

UI - Skripsi Membership Universitas Indonesia Library

Onny Amanda Putri Widodo

Suntingan teks setan Yahudi ajeng-ajengan kaliyan jim hawara dalam naskah Nagari Siluman = Suntingan teks setan Yahudi ajeng-ajengan kaliyan jim hawara dalam naskah Nagari Siluman

Depok: Fakultas Ilmu Pengetahuan Budaya Universitas Indonesia, 2015

S66783

UI - Skripsi Membership Universitas Indonesia Library

Alvin Subakti

Analisis kinerja BERT sebagai metode representasi teks untuk text clustering = Performance analysis of BERT as a text representation method for text clustering.

"Text clustering adalah teknik pengelompokan teks sehingga teks di dalam kelompok yang sama memiliki tingkat similaritas yang lebih tinggi satu sama lain dibandingkan dengan teks pada kelompok yang berbeda. Proses pengelompokkan teks secara manual membutuhkan waktu dan sumber daya yang banyak sehingga digunakan machine learning untuk melakukan pengelompokan secara otomatis. Representasi dari teks perlu diekstraksi sebelum dimasukkan ke dalam model machine learning. Metode yang umumnya digunakan untuk mengekstraksi representasi data teks adalah TFIDF. Namun, metode TFIDF memiliki kekurangan yaitu tidak memperhatikan posisi dan konteks penggunaan kata. Model BERT adalah model yang dapat menghasilkan representasi kata yang bergantung pada posisi dan konteks penggunaan suatu kata dalam kalimat. Penelitian ini menganalisis kinerja model BERT sebagai metode representasi data teks dengan membandingkan model BERT dengan TFIDF. Selain itu, penelitian ini juga mengimplementasikan dan membandingkan kinerja metode ekstraksi dan normalisasi fitur yang berbeda pada representasi teks yang dihasilkan model BERT. Metode ekstraksi fitur yang digunakan adalah max dan mean pooling. Sementara itu, metode normalisasi fitur yang digunakan adalah identity, layer, standard, dan min-max normalization. Representasi teks yang diperoleh dimasukkan ke dalam 4 algoritma clustering berbeda, yaitu k-means clustering, eigenspace-based fuzzy c-means, deep embedded clustering, dan improved deep embedded clustering. Kinerja representasi teks dievaluasi dengan menggunakan metrik clustering accuracy, normalized mutual information, dan adjusted rand index. Hasil simulasi menunjukkan representasi data teks yang dihasilkan model BERT mampu mengungguli representasi yang dihasilkan TFIDF pada 28 dari 36 metrik. Selain itu, implementasi ekstraksi dan normalisasi fitur yang berbeda pada model BERT memberikan kinerja yang berbeda-beda dan perlu disesuaikan dengan algoritma yang digunakan.

Text clustering is a task of grouping a set of texts in a way such that text in the same group will be more similar toward each other than to those from different group. The process of grouping text manually requires significant amount of time and labor. Therefore, automation utilizing machine learning is necessary. Text representation needs to be extracted to become the input for machine learning models. The common method used to represent textual data is TFIDF. However, TFIDF cannot consider the position and context of a word in a sentence. BERT model has the capability to produce text representation that incorporate position and context of a word in a sentence. This research analyzed the performance of BERT model as a text representation method by comparing it with TFIDF. Moreover, various feature extraction and normalization methods are also applied in text representation from BERT model. Feature extraction methods used are max and mean pooling. On the other hand, feature normalization methods used are identity, layer, standard, and min-max normalization. Text representation obtained become an input for 4 clustering algorithms, k-means clustering, eigenspace-based fuzzy c-means, deep embedded clustering, and improved deep embedded clustering. Performance of text representations in text clustering are evaluated utilizing clustering accuracy, normalized mutual information, and adjusted rand index. Simulation results showed that text representation obtained from BERT model outperforms representation from TFIDF in 28 out of 36 metrics. Furthermore, different feature extraction and normalization produced varied performances. The usage of these feature extraction and normalization must be altered depending on the text clustering algorithm used."

Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2021

S-pdf

UI - Skripsi Membership Universitas Indonesia Library

Martin Novela

Pemrosesan teks menjadi suara menggunakan model tacotron2 berdasarkan sataset rekaman podcast dan talk show berbahasa Indonesia = Text-to-speech processing using the tacotron2 model based on a recorded dataset of Indonesian podcast and talk show

"Salah satu faktor keberhasilan suatu model pembelajaran dalam machine learning atau deep learning adalah dataset yang digunakan. Pemilihan dataset yang digunakan untuk pelatihan suatu model sangat penting dalam pemrosesan yang dilakukan. Beberapa model deep learning seperti sistem pemrosesan text-to-speech pada model Tacotron2 sangat bergantung dengan dataset yang dipilih. Hal tersebut dikarenakan dalam pelatihan yang dilakukan untuk pembentukan suatu model pada bahasa tertentu harus menggunakan bahasa tersebut agar kualitas dari suara sintesis yang dihasilkan dapat mendekati pelafalan yang seharusnya untuk bahasa yang ditentukan. Pada penelitian ini dilakukan pelatihan yang bertujuan untuk pembentukan model Tacotron2 pada Bahasa Indonesia, sehingga untuk mendapatkan hasil yang lebih baik, maka digunakan dataset berbahasa Indonesia dari rekaman podcast dan talk show. Pada penelitian ini dilakukan dua skenario untuk mendapatkan hasil yang paling optimal. Skenario pertama adalah melakukan pelatihan pada model Tacotron2 menggunakan dataset berbahasa Indonesia yang terdiri dari banyak pembicara. Skenario kedua adalah melakukan pelatihan pada model Tacotron2 menggunakan dataset berbahasa Indonesia yang terdiri dari satu pembicara. Dalam pemrosesan pelatihan untuk pembentukan model Tacotron2 pada Bahasa Indonesia dilakukan dengan menggunakan pre-trained dan hyperparameter berdasarkan penelitian sebelumnya (Shen, et al., 2018). Hasil dari setiap skenario dievaluasi menggunakan Mean Opinion Score (MOS). Kuesioner disebarkan kepada 25 responden untuk menilai kualitas dari suara yang terbentuk berdasarkan kriteria penilaian pada MOS. Suara yang dibentuk oleh model Tacotron2 pada skenario pertama menghasilkan nilai MOS sebesar 4.01. Sedangkan suara yang dibentuk oleh model Tacotron2 pada skenario kedua menghasilkan nilai MOS sebesar 3.78. Hal tersebut menunjukkan bahwa penggunaan dataset berbahasa Indonesia dari rekaman podcast dan talk show dalam pembentukan model Tacotron2 untuk Bahasa Indonesia menghasilkan kualitas yang cukup baik.

One of the success factors of a learning model in machine learning or deep learning is the dataset used. The selection of the dataset used for training a model is very important. Some deep learning models such as the text-to-speech processing system in Tacotron2 are highly dependent on the selected dataset. This is because the training for forming a model in a particular language must use the same language so that the quality of the synthetic sound produced can resemble the proper pronunciation and prosody. In this study, training is aimed to form Tacotron2 model in Bahasa Indonesia. So, to get better results, a dataset in Bahasa Indonesia from recorded podcasts and talk shows are developed. Based on the dataset, two scenarios of training were conducted to obtain the most optimal results. The first scenario is to conduct training on the Tacotron2 model using the dataset consisting of many speakers. The second scenario is to conduct training on the Tacotron2 model the dataset consisting of only one speaker. Both scenarios employed the Tacotron2 model and the hyperparameters used in previous work (Shen, et al., 2018).
The results of each scenario are evaluated using the Mean Opinion Score (MOS). Questionnaires are distributed to 25 respondents to assess the quality of the sound formed based on the MOS assessment criteria. The sound formed by the Tacotron2 model in the first scenario produces an MOS value of 4,012. While the sound formed by the Tacotron2 model in the second scenario produces an MOS value of 3.78. This shows that the use of Indonesian language dataset from recorded podcasts and talk shows in the formation of the Tacotron2 model for Bahasa Indonesia produces a good quality."

Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2021

T-pdf

UI - Tesis Membership Universitas Indonesia Library

Petr Sojka, editor

Text, speech and dialogue : 15th international conference, TSD 2012, Brno, Czech Republic, September 3-7, 2012 : proceedings

"This book constitutes the refereed proceedings of the 15th International Conference on Text, Speech and Dialogue, TSD 2012, held in Brno, Czech Republic, in September 2012. The 82 papers presented together with 2 invited talks were carefully reviewed and selected from 173 submissions. The papers are organized in topical sections on corpora and language resources, speech recognition, tagging, classification and parsing of text and speech, speech and spoken language generation, semantic processing of text and speech, integrating applications of text and speech processing, machine translation, automatic dialogue systems, multimodal techniques and modeling."

Berlin: Springer-Verlag, 2012

e20409426

eBooks Universitas Indonesia Library

Siahaan, Edison Pardengganan

Segmentasi dokumen teks berbahasa Indonesia menggunakan metode text tiling

"Penelitian yang dilakukan pada tesis ini dimotivasi oleh adanya kebutuhan untuk dapat melakukan pengelolaan informasi pada dokumen suara khususnya berita berbahasa Indonesia. Informasi pada dokumen suara berita berbahasa Indonesia dapat diubah menjadi informasi berbentuk dokumen teks, dengan menggunakan perangkat lunak Automatic Speech Recognition (ASR). Pada penelitian ini perangkat ASR yang digunakan adalah perangkat ASR Sphinx 4.

Penggunaan perangkat Sphinx 4 ini didasari telah dilakukannya penelitian tentang transkripsi dokumen suara berbahasa Indonesia menggunakan perangkat ini. Hasil keluaran dari ASR berupa dokumen teks yang tidak memiliki batasan akhir dan tidak tersegmentasi secara jelas, tentu menyulitkan dalam pengolahan data teks tersebut. Dalam kerangka itu, maka penelitian yang dilakukan pada tesis ini ditujukan untuk mengetahui metode yang efektif dalam melakukan segmentasi hasil transkripsi berita suara berbahasa Indonesia. Metode yang akan diuji pada penelitian ini adalah metode TextTiling berbasis perbandingan blok dengan pembobotan TF-IDF-Mutual Information, TF-IDFMutual Information-Word Similarity, TF-IDF-Word Frequency, TF-IDF, Latent Semantic Analysis dan metode TextTiling berbasis Vocabulary Introduction. Segmentasi dilakukan untuk berita teks dan dokumen teks hasil transkripsi berita suara yang telahdikatagorikan menjadi 5 topik yaitu topik politik, sosial budaya, ekonomi, hukum dan olah raga. Hasil pengujian terhadap masing-masing teknik pembobotan menunjukkan bahwa metode segmentasi TextTiling dengan teknik pembobotan TF-IDF-Word Frequency merupakan metode segmentasi yang paling baik untuk dipakai dalam melakukan segmentasi hasil transkripsi dari perangkat pengenal suara (Automatic Speech Recognition). Pada penelitian ini telah dibuktikan bahwa teknik pembobotan TF-IDF-Word Frequency memiliki ketepatan segmentasi lebih tinggi baik pada dokumen teks hasil transkripsi (81,4%) ataupun pada dokumen berita teks (73,3%). Metode segmentasi yang dilakukan pada penelitian ini dapat terus dikembangkan menggunakan teknik-teknik lain dalam menunjang proses segmentasi hasil transkripsi berita berberbahasa Indonesia, seperti mempergunakan metode-metode optimalisasi dalam memperoleh urutan batas segmen yang optimal."

Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2009

T-804

UI - Tesis Membership Universitas Indonesia Library

Bobby Achirul Awal Nazief

Peran teknologi informasi dalam penyelenggaraan pemilu 1999

Jakarta: UI-Press, 1999

PGB 0540

UI - Pidato Universitas Indonesia Library

Lilik Hendrajaya

Tridharma, wawasan teknologi, dan dinamika masyarakat dalam reformasi diri perguruan tinggi : kumpulan pidato, sambutan, dan tulisan Rektor ITB tahun 1997 / Lilik Hendrajaya

Bandung: ITB Press, 1998

303.483 LIL t

Buku Teks SO Universitas Indonesia Library

Epvy Zuchairis Tara

Suntingan teks dan terjemahan bab pasarean bathangan = Bab pasarean bathangan text editing and translation

"ABSTRAK

Skripsi ini menyajikan suntingan teks dan terjemahan dalam Naskah Bab Pasarean Bathangan koleksi FSUI dengan nomor naskah A. 38.04 yang ditulis oleh Raden Tanaya. Metode penelitian filologi yang digunakan adalah metode edisi naskah tunggal. Suntingan teks dilakukan dengan menerapkan edisi kritis atau edisi standar, dilengkapi

dengan ringkasan cerita dan pedoman alih aksara. Terjemahan dilakukan dengan menerapkan metode terjemahan secara harfiah. Teks berbentuk prosa ini menggunakan

bahasa Jawa dan aksara Jawa. Teks ini menceritakan tentang penemuan mayat di daerah Bathangan, Surakarta yang diberi nama Kiyai Bathang yang diduga mayat tersebut

adalah Raden Pabelan, putra dari Kiyai Tumenggung Mayang pada jaman karaton Pajang.

ABSTRACT

This thesis presents text editing and translation and manuscript of Bab Pasarean Bathangan (Bathangan grave). This manuscript was written by Raden Tanaya and collected by Faculty of Humanities, University Indonesia with number A 38.04. The researcher used philology method, especially single text editing. The text editing was done by implementing critical edition, summary and translation writing guidance as well. The translation used literal method. The text tells the story about the discovery of a corpse found in Bathangan, Surakarta, Central Java and it was written in Javanese tribe. The corpse was well-known as Kiyai Bathang. Kiyai Bathang was expended to be Raden Pabelan, the son of Kiyai Tumenggung Mayang of Pajang Kingdom"

2015

S-Pdf

UI - Skripsi Membership Universitas Indonesia Library

Lugton, Robert C.

American topics: a reading-vocabulary text for speakers of English as a second language / Robert C. Lugton

Englewood Cliff, New Jersey: Prentice-Hall, 1978

428.24 LUG a

Buku Teks SO Universitas Indonesia Library

<< 1 2 3 4 5 6 7 8 9 10 >>

Hasil Pencarian :: Simpan CSV :: Kembali

Hasil Pencarian