Hasil Pencarian

Ditemukan 23874 dokumen yang sesuai dengan query

Tucker, Allen B.

Text processing: algorithms, languanges, and applications

New York: Academic Press, 1979

410 TUC t

Buku Teks SO Universitas Indonesia Library

Computational linguistics and intelligent text processing : 13th international conference, CICLing 2012, New Delhi, India, March 11-17, 2012 : proceedings, part I

"This two-volume set, consisting of LNCS 7181 and LNCS 7182, constitutes the thoroughly refereed proceedings of the 13th International Conference on Computer Linguistics and Intelligent Processing, held in New Delhi, India, in March 2012. The total of 92 full papers were carefully reviewed and selected for inclusion in the proceedings. The contents have been ordered according to the following topical sections, NLP system architecture, lexical resources, morphology and syntax, word sense disambiguation and named entity recognition, semantics and discourse, sentiment analysis, opinion mining, and emotions, natural language generation, machine translation and multilingualism; text categorization and clustering, information extraction and text mining, information retrieval and question answering, document summarization, and applications."

Berlin: Springer-Verlag, 2012

e20410524

eBooks Universitas Indonesia Library

Computational linguistics and intelligent text processing : 13th international conference, CICLing 2012, New Delhi, India, March 11-17, 2012 : proceedings, part II

Berlin: Springer-Verlag, 2012

e20410525

eBooks Universitas Indonesia Library

Knowledge dictionary for information extraction on the Arabic text data = Knowledge dictionary untuk ekstraksi informasi pada data teks Arab

"Ekstraksi informasi merupakan sebuah tahap awal dari proses analisis data tekstual. Ekstraksi informasi diperlukan untuk mendapatkan informasi dari data tekstual sehingga dapat digunakan untuk proses analisis seperti misalnya klasifikasi dan kategorisasi. Data tekstual

sangat dipengaruhi oleh bahasa, jika sebuah data tekstual berbahasa Arab maka karakter yang digunakan adalah karakter arab.

Knowledge dictionary merupakan sebuah kamus yang dapat digunakan untuk mengekstraksi informasi dari data tekstual. Informasi yang diekstraksi menggunakan knowledge dictionary adalah konsep.

Knowledge dictionary biasanya dibangun secara manual oleh seorang pakar yang tentunya membutuhkan waktu yang lama dan spesifik untuk

setiap masalah. Pada penelitian ini diusulkan sebuah metode untuk membangun knowledge dictionary secara otomatis. Pembentukan

knowledge dictionary dilakukan dengan cara mengelompokkan kalimat yang memiliki konsep yang sama, dengan asumsi kalimat yang memiliki konsep yang sama akan memiliki nilai simi laritas yang tinggi. Konsep yang telah diekstraksi dapat digunakan sebagai fitur untuk proses komputasi berikutnya misalnya klasifikasi ataupun kategorisasi.

Dataset yang digunakan dalam penelitian ini adalah dataset teks Arab. Hasil ekstraksi diuji dengan menggunakan mesin klasifikasi

decision tree dan didapatkan nilai presisi tertinggi 71,0% dan nilai recall tertinggi 75,0%.

Abstract

Information extraction is an early stage of a process of textual data analysis. Information extraction is required to get information from textual data that can be used for process analysis, such as classification and categorization. A textual data is strongly influenced by the language. Arabic is gaining a significant attention in

many studies because Arabic language is very different from others, and in contrast to other languages, tools and research on the Arabic language is still lacking. The information extracted using the knowledge

dictionary is a concept of expression. A knowledge dictionary is usually constructed manually by an expert and this would take a long time and is specific to a problem only. This paper proposed a method for automatically building a knowledge dictionary. Dictionary knowledge is formed by classifying sentences having the same concept, assuming that they will have a high similarity value. The concept that has been extracted can be used as features for subsequent computational process such as classification or categorization. Dataset used in this paper was the Arabic text dataset. Extraction result was tested by using a decision tree classification engine and the highest precision value obtained was 71.0% while the highest recall value was 75.0%. "

[Direktorat Riset dan Pengabdian Masyarakat Universitas Indonesia, Institut Teknologi Sepuluh Nopember. Fakultas Teknologi Informasi], 2012

pdf

Artikel Jurnal Universitas Indonesia Library

Carles Octavianus

Aplikasi Bidirectional Encoder Representations from Transformers untuk Pemeringkatan Teks Bahasa Indonesia = Bidirectional Encoder Representations from Transformers Application for Text Ranking in Indonesian

"Peningkatan jumlah data teks digital membuat manusia membutuhkan mekanisme untuk mengembalikan teks yang efektif dan efisien. Salah satu mekanisme untuk mengembalikan teks adalah dengan pemeringkatan teks. Tujuan dari pemeringkatan teks adalah menghasilkan daftar teks yang terurut berdasarkan relevansinya dalam menanggapi permintaan kueri pengguna. Pada penelitian ini, penulis menggunakan Bidirectional Encoder Representations from Transformers (BERT) untuk membangun model pemeringkatan teks berbahasa Indonesia. Terdapat 2 cara penggunaan BERT untuk pemeringkatan teks, yaitu BERT untuk klasifikasi relevansi dan BERT untuk menghasilkan representasi vektor dari teks. Pada penelitian ini, 2 cara penggunaan BERT tersebut terbagi menjadi 4 model, yaitu BERTCAT, BERTDOT, BERTDOTHardnegs, BERTDOTKD. Penggunaan BERT memberikan peningkatan kualitas pemeringkatan teks bila dibandingkan dengan model baseline BM25. Peningkatan kualitas pemeringkatan teks tersebut dapat dilihat dari nilai metrik recriprocal rank (RR), recall (R), dan normalized discounted cumulative gain (nDCG).

The increase in the amount of digital text data has led humans to require mechanisms for effectively and efficiently retrieving text. One mechanism for text retrieval is text ranking. The goal of text ranking is to generate a list of texts sorted based on their relevance in response to user query requests. In this study, the author uses Bidirectional Encoder Representations from Transformers (BERT) to build a text ranking model for the Indonesian language. There are 2 ways to use BERT for text ranking, namely BERT for relevance classification and BERT for generating vector representations of text. In this study, these 2 ways of using BERT are divided into 4 models, namely BERTCAT, BERTDOT, BERTDOTHardnegs, BERTDOTKD. The use of BERT improves the quality of text ranking compared to the baseline BM25 model. The improvement in the quality of text ranking can be seen from the values of the reciprocal rank (RR), recall (R), and normalized discounted cumulative gain (nDCG) metrics."

Depok: Fakultas Matematika Dan Ilmu Pengetahuan Alam Universitas Indonesia, 2024

S-pdf

UI - Skripsi Membership Universitas Indonesia Library

Cimiano, Philipp

Ontology learning and population from text: algorithms, evaluation and applications

New York: Springer, 2006

006.331 CIM o

Buku Teks SO Universitas Indonesia Library

Rahman, Mawdudur

Accounting information systems : principles, applications, and future directions / Mawdudur Rahman, Maurice Halladay.

Englewood, Cliffs, N.J. : Prentice-Hall, 1998

Buku Teks Universitas Indonesia Library

Knowledge-based systems and legal applications/edited by T.J.M. Bench-Capon

London: San Diego Academic Press , 1991

343.099 KNO

Buku Teks Universitas Indonesia Library

Nur Awaludin

Geographical information systems with arcgis 9.x: principles, techniques, applications, and management

Yogyakarta: Andi Yogyakarta, 2010

910.285 NUR g

Buku Teks SO Universitas Indonesia Library

Muthia Szami Naffisah

Penggunaan text mining pada analisis sentimen masyarakat terhadap perubahan harga bahan pokok melalui twitter = Application of text mining in analyzing sentiment of staple foods price changes in twitter

"Peningkatan data digital mendorong peningkatan kebutuhan teknik penggalian informasi. Media sosial merupakan salah satu penghasil data digital dalam jumlah besar, berupa aspirasi masyarakat mengenai apa yang terjadi di sekitar mereka. Maka dari itu, penelitian ini menganalisis respon masyarakat melalui akun twitter mengenai harga bahan pokok dan mengklasifikasikan respon tersebut menjadi dua kelompok; respon positif dan negatif. Penelitian ini menggunakan metode text mining, sedangkan asosiasi jenis bahan pokok dengan sentimen respon diukur menggunakan uji Chi Square dan Prosedur Marascuillo. Hasil penelitian menunjukkan bahwa Harga Susu, Harga Telur dan Harga Bawang Merah berasosiasi paling signifikan terhadap munculnya sentimen negatif dibandingkan komoditas lain.

The increase number of digital data pushes the needs of techniques in mining the information. Social media creates a large pool of data consisting of people’s aspiration on what happen around them. Therefore, this research analyzes people’s responses through their twitter account on staple food prices and classify them into sentiment classes; positive and negative. Research is done using text mining and the association between types of staple foods and sentiments is analyzed using Chi Square Test and Marascuillo Procedure. The result reveals Milk price, Egg Price and Red Onion price associate with negative sentiment tweets most significantly than others."

Depok: Fakultas Teknik Universitas Indonesia, 2014

S56032

UI - Skripsi Membership Universitas Indonesia Library

<< 1 2 3 4 5 6 7 8 9 10 >>

Hasil Pencarian :: Simpan CSV :: Kembali

Hasil Pencarian