Hasil Pencarian  ::  Simpan CSV :: Kembali

Hasil Pencarian

Ditemukan 135340 dokumen yang sesuai dengan query
cover
Wishnu Hardi
"Kedutaan Besar Australia di Jakarta menyimpan beragam dokumen rilis media. Menganalisis koleksi dokumen yang berpola khusus dan vital sangatlah penting untuk menghasilkan wawasan baru dan pengetahuan tentang kelompok topik penting dari dokumen. K-Means digunakan sebagai metode pengelompokan data non-hirarkis objek data menjadi klaster. Metode ini bekerja dengan meminimalkan variasi data di dalam klaster dan memaksimalkan variasi data di antara klaster. Dari dokumen yang dikeluarkan antara 2006 dan 2016, 839 dokumen diperiksa untuk menentukan frekuensi jangka dan untuk menghasilkan klaster. Evaluasi dilakukan dengan menunjuk seorang ahli untuk memvalidasi hasil klaster. Hasil penelitian menunjukkan bahwa ada 57 istilah bermakna yang dikelompokkan menjadi 3 kelompok. “Hubungan orang-orang”, “kerja sama ekonomi”, dan “pembangunan manusia” dipilih untuk mewakili topik rilis media Kedutaan Besar Australia Jakarta dari tahun 2006 hingga 2016. Penelitian ini menyimpulkan bahwa text mining dapat digunakan untuk mengelompokkan topik dokumen. Ini memberikan proses pengelompokan yang lebih sistematis karena analisis teks dilakukan melalui sejumlah tahapan dengan parameter yang ditetapkan secara khusus."
Jakarta: Pusat Jasa Perpustakaan dan Informasi, 2019
020 VIS 21:1 (2019)
Artikel Jurnal  Universitas Indonesia Library
cover
Mulyandra Pratama
"Sistem Ekstraksi Informasi yang sebelumnya telah dibuat menggunakan aturan untuk dapat melakukan standarisasi dokumen Undang-Undang ke dalam format XML. Karena aturan yang digunakan bersatu dengan sistem itu sendiri, maka sistem menjadi kurang adaptif. Oleh karena itu, modularisasi aturan yang dilakukan pada penelitian ini diharapkan mampu membuat sistem menjadi lebih adaptif. Adaptivitas sistem akan diuji dengan melakukan adaptasi ke jenis dokumen legal yang lain, yaitu Peraturan Pemerintah (PP). Hasil adaptasi SEI ke dokumen PP diujicobakan pada 201 dokumen PP dan 41 dokumen PP perubahan. Hasilnya menunjukkan kinerja sistem dalam melakukan standarisasi dokumen PP ke dalam format XML sebesar 99.47% dan dokumen PP perubahan sebesar 97.98%.

The previous Information Extraction System used rules to standardize Indonesian Act document into XML format. Because these rules still merged inside the system?s body, it caused problem in its adaptability. Because of that, this research trying to modularize these rules in order to increase system?s adaptability. System?s adaptability then will be tested by adapting the system to other type of Indonesian legal document, which is Government Regulation document. Adaptation result will be tested using 201 Government Regulation documents and 41 Replacement of the Government Regulation documents. The results show that the system?s accuracy to standardize Government Regulation documents is 99.47% and for Replacement of the Government Regulation documents is 97.98%."
Fakultas Ilmu Komputer Universitas Indonesia, 2009
S-Pdf
UI - Skripsi Open  Universitas Indonesia Library
cover
Siti Ainun Rachmawati
"Perkembangan teknologi informasi secara signifikan telah mengubah sistem ekonomi konvensional menjadi sistem ekonomi digital. Sistem digital ini memungkinkan dunia usaha melakukan suatu transaksi dengan menggunakan media elektronik yang lebih menawarkan kemudahan, kecepatan dan efisiensi. Masalah yang mengemuka dan diatur dalam UU ITE adalah hal yang berkaitan dengan masalah kekuatan dalam sistem pembuktian dari Informasi, Dokumen, dan Tanda Tangan Elektronik Dalam Penelitian ini dari sudut jenisnya yakni secara yuridis normatif, yaitu penelitian yang menekankan pada penggunaan data sekunder atau berupa norma hukum tertulis. Metode pengolahan data dilakukan secara kualitatif, sehingga menghasilkan data yang bersifat analistis deskriptif.
Dengan disahkannya UU ITE, alat bukti elektronik telah diakui dan diterima sebagai alat bukti yang sah. Alat bukti elektronik ini dipandang sebagai perluasan dari alat bukti yang telah ada dalam hukum acara di Indonesia. Pada prakteknya saat ini nilai pembuktian alat bukti elektronik hanya sebagai alat bukti permulaan, tidak dapat berdiri sendiri dalam mencukupi batas minimal pembuktian, karenanya harus dibantu dengan alat bukti yang lain, salah satunya dengan keterangan saksi ahli, yang termasuk ke dalam Persangkaan Hakim dengan demikian sifat kekuatan pembuktiannya adalah bebas (vrij bewijskracht). Kelak dengan penyempurnaan UU ITE melalui Peraturan Pemerintahnya, alat bukti elektronik berupa dokumen elektronik yang telah di autentikasi oleh lembaga yang berwenang dapat disamakan sebagai alat bukti otentik dengan nilai pembuktian sempurna.

The development of information technology has significantly changed the conventional economic system into the digital economy. This digital system allows the business to do a transaction using electronic media more offers convenience, speed and efficiency. Issues raised and regulated in the Act ITE is related to the problem of power in the system of proof of Information, Documents, and Electronic Signatures In this study from the juridical point of its kind that is normative, that is research that emphasizes the use of secondary data or a form of legal norms written. Data processing method was qualitative, resulting analytical data are descriptive.
With the enactment of Law ITE, electronic evidence has been recognized and accepted as valid evidence. Electronic evidence is viewed as an extension of the existing evidence in a judicial procedure in Indonesia. In practice the current evidentiary value of electronic evidence as evidence only the beginning, unable to stand alone in a sufficient threshold of evidence, thus should be supported by other evidence, one of them with expert witness testimony, which belong to the presupposition Judge thus the nature strength of proof is free (vrij bewijskracht). Later, with improvements UU ITE through its Government Regulation, electronic evidence in the form of an electronic document that has been authenticated by the competent institutions can be compared as authentic evidence to prove the value of perfect
"
Depok: Fakultas Hukum Universitas Indonesia, 2011
T28381
UI - Tesis Open  Universitas Indonesia Library
cover
Vidya Intani Athfalina
"Laporan magang ini bertujuan untuk mengevaluasi persiapan dokumen dalam rangka persidangan banding pajak yang dilakukan oleh PT OH. Adapun salah satu proses yang dimaksud adalah proses pengajuan banding Pajak Penghasilan Badan dan PPN pada PT SLI dengan fokus pada bagian pembuatan Surat Bantahan hingga persiapan dokumen persidangan pada Pengadilan Pajak. PT SLI merupakan perusahaan yang bergerak di bidang kontraktor pengeboran lepas pantai. Berdasarkan evaluasi yang dilakukan, PT OH telah melaksanakan pendampingan proses banding sesuai ketentuan peraturan perundang-undangan yang berlaku dengan baik.

This internship report aims to evaluate the process of preparation of documents in the context of a tax appeal hearing conducted by PT OH. One of the processes referred to, is the process of filing an appeal for Corporate Income Tax and VAT at PT SLI with a focus on the making of Rebuttal Letter to the preparation of court documents at the Tax Court. PT SLI is a company engaged in the field of the offshore drilling contractors. Based on evaluation conducted, PT OH has already implemented assistance to the appeal process in accordance with the applicable laws and regulations."
Depok: Fakultas Ekonomi dan Bisnis Universitas Indonesia, 2020
TA-pdf
UI - Tugas Akhir  Universitas Indonesia Library
cover
Budi Karisma
"Putusan perdata nomor 918/PDT.G/2016/PN.Jkt.Sel yang menolak gugatan dari penggugat yang dalam gugatannya menyatakan bahwa Badan Reserse Kriminal Kepolisian Negara Republik Indonesia (Bareskrim Polri) tidak memiliki kewenangan dalam melakukan pemblokiran Rekening Efek sebagaimana dimaksud dalam Pasal 59 ayat (3) Undang-Undang Nomor 8 Tahun 1995 tentang Pasar Modal (UUPM). Tujuan dari penelitian ini adalah untuk mengetahui dan menganalisa keabsahan pemblokiran yang dilakukan oleh PT Kustodian Sentral Efek Indonesia (KSEI) yang dijalankan berdasarkan instruksi dari Bareskrim Polri, serta untuk mengkaji bahwa putusan perkara nomor 918/PDT.G/2016/PN.Jkt.Sel yang tidak membatalkan pemblokiran yang dilakukan oleh KSEI apakah termasuk dalam hukum progresif. Penelitian akan dilakukan dengan menggunakan metode yuridis normatif. Hasil dari penelitian menunjukan bahwa Bareskrim Polri sebagai satuan tingkat Kepolisian yang berada di atas Kepolisian Daerah memiliki wewenang untuk melakukan pemblokiran dilihat dari kedudukannya. Tindakan hakim dalam menolak gugatan dapat dimasukkan sebagai putusan hukum progresif, karena putusan yang diberikan hakim tersebut masuk ke dalam aliran progresif.

The Verdict Number 918/PDT.G/2016/PN.Jkt.Sel which rejects the lawsuit from a related party who in his lawsuit states that the Criminal Investigation Agency of the Indonesian National Police (Bareskrim Polri) does not have authority to block Securities Accounts as referred to in Article 59 paragraph (3) of Law Number 8 Year of 1995 concerning Capital Markets (UUPM). The purpose of this study is to find out and analyze the validity of the blocking carried out by PT Kustodian Sentral Efek Indonesia, which was carried out based on instructions from the Bareskrim Polri, and to examine whether the decision in the case number 918/PDT .G/2016/PN.Jkt.Sel that does not cancel the blocking carried out by PT Kustodian Sentral Efek Indonesia, which was carried out based on instructions from the Bareskrim Polri as a progressive legal step. The results of the study show that the Bareskrim Polri, as a Police level unit which is above the Regional Police has the authority to carry out blocking in terms of its position. The judge's action in rejecting the lawsuit can be included as a progressive legal decision, because the decision given by the judge is included in the progressive stream."
Jakarta: Fakultas Hukum Universitas Indonesia, 2022
T-pdf
UI - Tesis Membership  Universitas Indonesia Library
cover
Juznia Andriani
"Penelitian ini bertujuan untuk mengetahui: (1), Alasan responden (mahasiswa pascasarjana bidang pertanian) melakukan kegiatan menyitir dokumen, (2). Kriteria apa yang diterapkan pada dokumen, sehingga dokumen itu disitir sebagai bahan sitiran. (3), Karakteristik dokumen yang disitir untuk penulisan tesis atau disertasi. Jumlah responden sebanyak 5 (lima) orang mahasiswa pascasarjana dari program bidang studi : biologi, penyuluhan, peternakan, perikanan dan agronomi. Wawancara dilakukan melalui percakapan dan tanya jawab dengan responden. Wawancara dilakukan secara mendalam, baik lisan maupun terekam. Data dokumen untuk wawancara berasal dari semua bahan sitiran yang dipakai oleh responden.
Berbagai alasan yang dikemukakan oleh responden dalam menyitir dokumen cukup beragam Sebagai alasan utama ialah untuk mengidentifikasi metode dan peralatan yang digunakan, menginformasikan kegiatan penelitian yang sudah dilakukan dan sebagai bahan untuk latar belakang. Sedangkan sebagai alasan pendukung ialah untuk : memperkuat sebuah temuan, menerangkan konsep atau ide, menerangkan suatu definisi, teori atau istilah, menunjukkan terdapat karya lain yang bertentangan dan sebagai bahan pembanding. Alasan tersebut merupakan motivasi profesional yang berkaitan dengan isi dokumen.
Responden menerapkan topik sebagai kriteria utama dalam memilih dokumen yang digunakan sebagai sitiran. Dokumen yang dipilih berdasarkan kriteria topik tersebut mempunyai nilai : epistemik, fungsional, sosial dan kondisional. Faktor-faktor seperti: kebaharuan, kemutahiran, klasik dan disiplin ilmu merupakan kriteria yang akan muncul bersama dengan kesesuaian topik penelitian. Kriteria lain yang ikut berpengaruh ialah: pengarang, nama jurnal, penerbit dan rekomendasi dari kolega. Kriteria diluar dokumen yang ikut berpengaruh ialah : kemudahan untuk mendapatkan dokumen, bahasa dan waktu. Faktor diluar dokumen tersebut tidak menjadi masalah bagi responden. Dalam satu dokumen dapat memuat beberapa kriteria yang menjadi pertimbangan responden.
Jenis dokumen yang disitir responden sangat bervariasi, meliputi : abstrak, jurnal, buku, tinjauan, laporan penelitian, surat kabar, makalah seminar, majalah semi ilmiah, tesis dan disertasi. Selain itu terdapat juga responden yang mengambil bahan sitiran dari terbitan pemerintah dan panduan praktek. Sebagian besar dokumen yang digunakan oleh responden adalah berupa : jurnal, buku, prosiding dan tesis.
Responden banyak menggunakan artikel yang berbahasa Inggris dan responden tidak mengalami kesulitan dalam bahasa. Berdasarkan tahun terbitnya, bahan sitiran yang berupa jurnal, banyak memakai terbitan tahun 1990-an ke atas. Hal ini menunjukkan bahwa mereka menggunakan informasi yang relatif baru dalam penulisan karya ilmiahnya. Dokumen dengan tahun lama yang disitir menunjukkan bahwa informasi yang dimuatnya masih relevan untuk dipakai sekarang.
Responden belum menggunakan dokumen dari hasil penelusuran di Internet untuk bahan sitirannya. Alasan yang diberikan oleh responden cukup beragam, yaitu : masih ragu akan validitasnya, tidak sesuai dengan topik yang diinginkannya dan kebanyakan hanya berupa abstrak, sehingga masih membutuhkan waktu untuk mencari dokumen lengkapnya.

Reasons and Criteria on Citing of Documents : Study of Postgraduate Students at Bogor Agriculture InstituteThe objectives of this research are to identify : (t). the reasons of the post graduate students in citing document, (2). the criteria they apply in citing documents (3)characteristics of citing document used in their thesis and disertations. The respondents involved in this study are postgraduate students from biology, extention, husbandry, fisheries and agronomy study program.This study is qualitative. Oral interview was carried out to gather data. The data for the interview were obtained from all citing documents used by the respondents.
There are many reasons why respondents cited the document. The main reasons are ; identifying methodology and equipment, describing related research and providing background reading. Other reasons are : supporting result research, describing. concept or ideas,describing definition or theory and for material for comparative study. These reasons are categorized profesional motivation which are related with document content.
Respondents applied topicality as the main criterion on citing documents. These documents have epistemic, functional, social and conditional values. Factors such as novelty, recency, classic and subject area are criteria which will arise together with research topic suitability. The other criterion which influence the respondents to cite are author, journal title and college recommendation. External factors which also influence them in citing document are essays to access documents, language and time. These factors do not cause any problems for the respondents. One document may include several criteria which be comp their consideration.
Respondents cited various documents such as abstracts, journals, books, review literature, research report, newspapers, seminar articles, semi scientific publications, thesis and disertations. Respondents also cited government publications and manual instructions. However the document mostly cited by respondents are journals, books, proceedings and thesis.
Most respondents cited English documents and do not have any dificulty regarding the language. According to the year publication, journals which are cited material were mostly published in 1990 on words. These showed that the respondent use relatively current information on writing thesis or disertations. On the other hand, the respondent who used the old published document thought that the information was still relevant to be cited,
The respondents have not applied document from Internet for their citation yet. The reasons given by the respondents are various, such as the doubtness about validity of information, inappropriatness of the desired topic, and time consuming on obtaining full document because only abstracts were available in the Internet."
2001
T133
UI - Tesis Membership  Universitas Indonesia Library
cover
Aulia Nur Fadhilah
"Indonesia merupakan negara hukum yang mengadopsi asas Fictie Hukum. Asas tersebut memandang setiap orang tahu hukum tanpa pengecualian. Penyediaan akses yang mudah terhadap produk hukum merupakan konsekuensi dari hal tersebut. Meski telah tersedia beberapa layanan daring pencarian hukum, baik oleh pemerintah maupun swasta, layanan tersebut belum mampu menangkap relasi intradokumen dan antardokumen dengan baik. Dalam meningkatkan sistem pencarian hukum, terdapat knowledge graph (KG) bernama LexID yang menghadirkan representasi peraturan perundang-undangan Indonesia dalam sebuah graf. KG tersebut dikonstruksi dengan pendekatan rule-based. Namun, pendekatan rule-based tidak mudah beradaptasi dengan perubahan dalam format atau konten dokumen dan memerlukan pemeliharaan berkelanjutan. Penelitian ini mengusulkan pendekatan lain dalam konstruksi LexID. Proses konstruksi LexID dilakukan menggunakan pre-trained large language model (LLM) berupa CodeGemma parameter 7B, Code Llama parameter 7B, dan Phi-3 parameter 7B. Jenis prompt yang digunakan, yaitu prompt kode dan teks dengan variasi 1-shot dan 2-shot, sehingga total terdapat dua belas skenario percobaan. Hasil konstruksi KG kemudian dievaluasi terhadap KG LexID dan diukur menggunakan metrik precision, recall, dan skor F1. Dari hasil konstruksi, didapatkan skor F1 hasil dari prompt teks 1-shot: CodeGemma 0.405, CodeLlama 0.452, dan Phi 0.362; skor F1 hasil dari prompt kode 1-shot: CodeGemma 0.645, CodeLlama 0.567, dan Phi 0.526; skor F1 hasil dari prompt teks 2-shot: CodeGemma 0.572, CodeLlama 0.502, dan Phi 0.386; skor F1 hasil dari prompt kode 2-shot: CodeGemma 0.687, CodeLlama 0.583, dan Phi 0.539.

Indonesia operates under a legal system that adopts the principle of Legal Fiction, which posits that every individual is presumed to be aware of the law without exception. Consequently, providing easy access to legal documents is imperative. Despite the availability of several online legal search services offered by both government and private entities, these services have yet to effectively capture intra-document and inter-document relationships. To enhance the legal search system, a knowledge graph (KG) named LexID has been developed to represent Indonesian legislation in a graph format. This KG has traditionally been constructed using a rule-based approach. However, this approach struggles to adapt to changes in document format or content and necessitates continuous maintenance. This study proposes an alternative approach for the construction of LexID utilizing pre-trained large language models (LLMs), specifically CodeGemma with 7 billion parameters, Code Llama with 7 billion parameters, and Phi-3 with 7 billion parameters. The study employs both code and text prompts, with variations of 1-shot and 2-shot, resulting in a total of twelve experimental scenarios. The constructed KG is then evaluated against the existing LexID KG, using precision, recall, and F1 score metrics. The results of the construction indicate the following F1 scores: for 1-shot text prompts, CodeGemma achieved 0.405, Code Llama 0.452, and Phi 0.362; for 1-shot code prompts, CodeGemma achieved 0.645, Code Llama 0.567, and Phi 0.526; for 2-shot text prompts, CodeGemma achieved 0.572, Code Llama 0.502, and Phi 0.386; and for 2-shot code prompts, CodeGemma achieved 0.687, Code Llama 0.583, and Phi 0.539."
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2024
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Muhammad Halif
"Indonesia merupakan negara hukum yang mengadopsi asas Fictie Hukum. Asas tersebut memandang setiap orang tahu hukum tanpa pengecualian. Penyediaan akses yang mudah terhadap produk hukum merupakan konsekuensi dari hal tersebut. Meski telah tersedia beberapa layanan daring pencarian hukum, baik oleh pemerintah maupun swasta, layanan tersebut belum mampu menangkap relasi intradokumen dan antardokumen dengan baik. Dalam meningkatkan sistem pencarian hukum, terdapat knowledge graph (KG) bernama LexID yang menghadirkan representasi peraturan perundang-undangan Indonesia dalam sebuah graf. KG tersebut dikonstruksi dengan pendekatan rule-based. Namun, pendekatan rule-based tidak mudah beradaptasi dengan perubahan dalam format atau konten dokumen dan memerlukan pemeliharaan berkelanjutan. Penelitian ini mengusulkan pendekatan lain dalam konstruksi LexID. Proses konstruksi LexID dilakukan menggunakan pre-trained large language model (LLM) berupa CodeGemma parameter 7B, Code Llama parameter 7B, dan Phi-3 parameter 7B. Jenis prompt yang digunakan, yaitu prompt kode dan teks dengan variasi 1-shot dan 2-shot, sehingga total terdapat dua belas skenario percobaan. Hasil konstruksi KG kemudian dievaluasi terhadap KG LexID dan diukur menggunakan metrik precision, recall, dan skor F1. Dari hasil konstruksi, didapatkan skor F1 hasil dari prompt teks 1-shot: CodeGemma 0.405, CodeLlama 0.452, dan Phi 0.362; skor F1 hasil dari prompt kode 1-shot: CodeGemma 0.645, CodeLlama 0.567, dan Phi 0.526; skor F1 hasil dari prompt teks 2-shot: CodeGemma 0.572, CodeLlama 0.502, dan Phi 0.386; skor F1 hasil dari prompt kode 2-shot: CodeGemma 0.687, CodeLlama 0.583, dan Phi 0.539.

Indonesia operates under a legal system that adopts the principle of Legal Fiction, which posits that every individual is presumed to be aware of the law without exception. Consequently, providing easy access to legal documents is imperative. Despite the availability of several online legal search services offered by both government and private entities, these services have yet to effectively capture intra-document and inter-document relationships. To enhance the legal search system, a knowledge graph (KG) named LexID has been developed to represent Indonesian legislation in a graph format. This KG has traditionally been constructed using a rule-based approach. However, this approach struggles to adapt to changes in document format or content and necessitates continuous maintenance. This study proposes an alternative approach for the construction of LexID utilizing pre-trained large language models (LLMs), specifically CodeGemma with 7 billion parameters, Code Llama with 7 billion parameters, and Phi-3 with 7 billion parameters. The study employs both code and text prompts, with variations of 1-shot and 2-shot, resulting in a total of twelve experimental scenarios. The constructed KG is then evaluated against the existing LexID KG, using precision, recall, and F1 score metrics. The results of the construction indicate the following F1 scores: for 1-shot text prompts, CodeGemma achieved 0.405, Code Llama 0.452, and Phi 0.362; for 1-shot code prompts, CodeGemma achieved 0.645, Code Llama 0.567, and Phi 0.526; for 2-shot text prompts, CodeGemma achieved 0.572, Code Llama 0.502, and Phi 0.386; and for 2-shot code prompts, CodeGemma achieved 0.687, Code Llama 0.583, and Phi 0.539."
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2024
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Muhammad Haddad
"Indonesia merupakan negara hukum yang mengadopsi asas Fictie Hukum. Asas tersebut memandang setiap orang tahu hukum tanpa pengecualian. Penyediaan akses yang mudah terhadap produk hukum merupakan konsekuensi dari hal tersebut. Meski telah tersedia beberapa layanan daring pencarian hukum, baik oleh pemerintah maupun swasta, layanan tersebut belum mampu menangkap relasi intradokumen dan antardokumen dengan baik. Dalam meningkatkan sistem pencarian hukum, terdapat knowledge graph (KG) bernama LexID yang menghadirkan representasi peraturan perundang-undangan Indonesia dalam sebuah graf. KG tersebut dikonstruksi dengan pendekatan rule-based. Namun, pendekatan rule-based tidak mudah beradaptasi dengan perubahan dalam format atau konten dokumen dan memerlukan pemeliharaan berkelanjutan. Penelitian ini mengusulkan pendekatan lain dalam konstruksi LexID. Proses konstruksi LexID dilakukan menggunakan pre-trained large language model (LLM) berupa CodeGemma parameter 7B, Code Llama parameter 7B, dan Phi-3 parameter 7B. Jenis prompt yang digunakan, yaitu prompt kode dan teks dengan variasi 1-shot dan 2-shot, sehingga total terdapat dua belas skenario percobaan. Hasil konstruksi KG kemudian dievaluasi terhadap KG LexID dan diukur menggunakan metrik precision, recall, dan skor F1. Dari hasil konstruksi, didapatkan skor F1 hasil dari prompt teks 1-shot: CodeGemma 0.405, CodeLlama 0.452, dan Phi 0.362; skor F1 hasil dari prompt kode 1-shot: CodeGemma 0.645, CodeLlama 0.567, dan Phi 0.526; skor F1 hasil dari prompt teks 2-shot: CodeGemma 0.572, CodeLlama 0.502, dan Phi 0.386; skor F1 hasil dari prompt kode 2-shot: CodeGemma 0.687, CodeLlama 0.583, dan Phi 0.539.

Indonesia operates under a legal system that adopts the principle of Legal Fiction, which posits that every individual is presumed to be aware of the law without exception. Consequently, providing easy access to legal documents is imperative. Despite the availability of several online legal search services offered by both government and private entities, these services have yet to effectively capture intra-document and inter-document relationships. To enhance the legal search system, a knowledge graph (KG) named LexID has been developed to represent Indonesian legislation in a graph format. This KG has traditionally been constructed using a rule-based approach. However, this approach struggles to adapt to changes in document format or content and necessitates continuous maintenance. This study proposes an alternative approach for the construction of LexID utilizing pre-trained large language models (LLMs), specifically CodeGemma with 7 billion parameters, Code Llama with 7 billion parameters, and Phi-3 with 7 billion parameters. The study employs both code and text prompts, with variations of 1-shot and 2-shot, resulting in a total of twelve experimental scenarios. The constructed KG is then evaluated against the existing LexID KG, using precision, recall, and F1 score metrics. The results of the construction indicate the following F1 scores: for 1-shot text prompts, CodeGemma achieved 0.405, Code Llama 0.452, and Phi 0.362; for 1-shot code prompts, CodeGemma achieved 0.645, Code Llama 0.567, and Phi 0.526; for 2-shot text prompts, CodeGemma achieved 0.572, Code Llama 0.502, and Phi 0.386; and for 2-shot code prompts, CodeGemma achieved 0.687, Code Llama 0.583, and Phi 0.539."
Depok: Fakultas Ilmu Komputer Universitas Indonesia, 2024
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Muhammad Haddad
"Indonesia merupakan negara hukum yang mengadopsi asas Fictie Hukum. Asas tersebut memandang setiap orang tahu hukum tanpa pengecualian. Penyediaan akses yang mudah terhadap produk hukum merupakan konsekuensi dari hal tersebut. Meski telah tersedia beberapa layanan daring pencarian hukum, baik oleh pemerintah maupun swasta, layanan tersebut belum mampu menangkap relasi intradokumen dan antardokumen dengan baik. Dalam meningkatkan sistem pencarian hukum, terdapat knowledge graph (KG) bernama LexID yang menghadirkan representasi peraturan perundang-undangan Indonesia dalam sebuah graf. KG tersebut dikonstruksi dengan pendekatan rule-based. Namun, pendekatan rule-based tidak mudah beradaptasi dengan perubahan dalam format atau konten dokumen dan memerlukan pemeliharaan berkelanjutan. Penelitian ini mengusulkan pendekatan lain dalam konstruksi LexID. Proses konstruksi LexID dilakukan menggunakan pre-trained large language model (LLM) berupa CodeGemma parameter 7B, Code Llama parameter 7B, dan Phi-3 parameter 7B. Jenis prompt yang digunakan, yaitu prompt kode dan teks dengan variasi 1-shot dan 2-shot, sehingga total terdapat dua belas skenario percobaan. Hasil konstruksi KG kemudian dievaluasi terhadap KG LexID dan diukur menggunakan metrik precision, recall, dan skor F1. Dari hasil konstruksi, didapatkan skor F1 hasil dari prompt teks 1-shot: CodeGemma 0.405, CodeLlama 0.452, dan Phi 0.362; skor F1 hasil dari prompt kode 1-shot: CodeGemma 0.645, CodeLlama 0.567, dan Phi 0.526; skor F1 hasil dari prompt teks 2-shot: CodeGemma 0.572, CodeLlama 0.502, dan Phi 0.386; skor F1 hasil dari prompt kode 2-shot: CodeGemma 0.687, CodeLlama 0.583, dan Phi 0.539.

Indonesia operates under a legal system that adopts the principle of Legal Fiction, which posits that every individual is presumed to be aware of the law without exception. Consequently, providing easy access to legal documents is imperative. Despite the availability of several online legal search services offered by both government and private entities, these services have yet to effectively capture intra-document and inter-document relationships. To enhance the legal search system, a knowledge graph (KG) named LexID has been developed to represent Indonesian legislation in a graph format. This KG has traditionally been constructed using a rule-based approach. However, this approach struggles to adapt to changes in document format or content and necessitates continuous maintenance. This study proposes an alternative approach for the construction of LexID utilizing pre-trained large language models (LLMs), specifically CodeGemma with 7 billion parameters, Code Llama with 7 billion parameters, and Phi-3 with 7 billion parameters. The study employs both code and text prompts, with variations of 1-shot and 2-shot, resulting in a total of twelve experimental scenarios. The constructed KG is then evaluated against the existing LexID KG, using precision, recall, and F1 score metrics. The results of the construction indicate the following F1 scores: for 1-shot text prompts, CodeGemma achieved 0.405, Code Llama 0.452, and Phi 0.362; for 1-shot code prompts, CodeGemma achieved 0.645, Code Llama 0.567, and Phi 0.526; for 2-shot text prompts, CodeGemma achieved 0.572, Code Llama 0.502, and Phi 0.386; and for 2-shot code prompts, CodeGemma achieved 0.687, Code Llama 0.583, and Phi 0.539."
Fakultas Ilmu Komputer Universitas Indonesia, 2024
S-pdf
Unggah3  Universitas Indonesia Library
<<   1 2 3 4 5 6 7 8 9 10   >>