Hasil Pencarian  ::  Simpan CSV :: Kembali

Hasil Pencarian

Ditemukan 65 dokumen yang sesuai dengan query
cover
"Reinforcement learning encompasses both a science of adaptive behavior of rational beings in uncertain environments and a computational methodology for finding optimal behaviors for challenging problems in control, optimization and adaptive behavior of intelligent agents. As a field, reinforcement learning has progressed tremendously in the past decade.
The main goal of this book is to present an up-to-date series of survey articles on the main contemporary sub-fields of reinforcement learning. This includes surveys on partially observable environments, hierarchical task decompositions, relational knowledge representation and predictive state representations. Furthermore, topics such as transfer, evolutionary methods and continuous spaces in reinforcement learning are surveyed. In addition, several chapters review reinforcement learning methods in robotics, in games, and in computational neuroscience. "
Berlin: [, Springer], 2012
e20398760
eBooks  Universitas Indonesia Library
cover
Devi Raissa Rahmawati
"Konsekuensi yang tegas dan konsisten dari orang tua merupakan hal yang penting dalam pengasuhan seorang anak, terutama di masa prasekolah. Tesis dengan desain penelitian single-case ini menggunakan modifikasi perilaku dengan metode differential reinforcement with response cost. Metode ini bertujuan melihat keefektifan dari perubahan konsekuensi untuk mengurangi frekuensi perilaku disruptive. Partisipan penelitian adalah anak perempuan berusia 4 tahun 4 bulan dan didiagnosis mengalami oppositional defiant disorder (ODD). Penelitian ini dilakukan dalam sembilan sesi. Hasil dari penelitian menunjukkan differential reinforcement with response cost efektif menurunkan frekuensi perilaku disruptive. Hal ini terlihat dari observasi, wawancara, dan pengukuran child behavior checklist (CBCL).

One of the important principles for parenting a child is clear and consistence consequences, especially on preschool age. This single case design study used behavior modification with differential reinforcement with response cost method. This method aimed to examine the effectiveness of modification consequences to reduce frequencies of disruptive behavior. Participant of this research is a four-year-four-month girl and diagnosed of having oppositional defiant disorder (ODD). This research was conducted for total nine sessions. The result indicated differential reinforcement with response cost effective to reduce frequencies of disruptive behavior. This result has been seen from observation, interview, and CBCL measurement as well."
Depok: Fakultas Psikologi Universitas Indonesia, 2013
T32692
UI - Tesis Membership  Universitas Indonesia Library
cover
"This book constitutes revised and selected papers of the 9th European Workshop on Reinforcement Learning, EWRL 2011, which took place in Athens, Greece in September 2011. The papers presented were carefully reviewed and selected from 40 submissions. The papers are organized in topical sections online reinforcement learning, learning and exploring MDPs, function approximation methods for reinforcement learning, macro-actions in reinforcement learning, policy search and bounds, multi-task and transfer reinforcement learning, multi-agent reinforcement learning, apprenticeship and inverse reinforcement learning and real-world reinforcement learning."
Berlin: Springer-Verlag, 2012
e20409054
eBooks  Universitas Indonesia Library
cover
Achsan Madnur
"Instansi X adalah salah satu lembaga pemerintahan yang memiliki masalah kehadiran. Faktor kehadiran dinilai sangat penting dalam performance kerja, khususnya di Instansi X karena berkaitan dengan tercapainya tujuan organisasi ini yaitu sebagai pusat pemberian pendidikan dan pelatihan. Apabila banyak pegawai mengalami masalah kehadiran maka pekerjaan mereka menjadi terhambat dan pelaksanaan pendidikan dan pelatihan menjadi terhambat. Ada beberapa faktor penyebab terjadinya masalah ini antara lain faktor sistem, budaya kerja, personal, dan sebagainya. Faktor personal juga terdiri dari berbagai penyebab, di antaranya faktor motivasi, trait yang tidak bertanggung jawab, ekspektansi terhadap pekerjaan, dan sebagainya. Untuk itu diperlukan suatu cara untuk mengatasi masalah kehadiran tersebut, khususnya yang disebabkan oleh faktor personal yaitu dengan mengaplikasikan teori belajar dan reinforcemen untuk membentuk perilaku kehadiran yang diinginkan.
Metode dalam teori belajar adalah modeling dan shapping. Modelling yaitu proses pembentukan perilaku dengan Cara mengobservasi perilaku model, biasanya model adalah orang yang dikagumi dan menarik untuk individu sedangkan Shapping yaitu proses membentuk perilaku dalam hal memberi reward secara sistematis pada saat munculnya sedikit demi sedikit perilaku yang diharapkan. Metode shopping yang digunakan berupa pemberian reinforcemen yang sesuai jadwal dan jumlah tertentu, yaitu Fixed Interval Schedule, Variable Interval Schedule, Fixed Ratio Schedule, dan Variable Ratio Schedule. Selain pemberian reinforcement.
Berdasarkan analisa, didapatkan bahwa pencegahan dalam masalah kehadiran sebaiknya dilakukan komprehensif dengan mencakup perbaikan sistem kompensasi, sistem kerja, budaya organisasi, dan birokrasi sehingga pembentukan perilaku kehadiran akan lebih efektif."
Depok: Fakultas Psikologi Universitas Indonesia, 2005
T18751
UI - Tesis Membership  Universitas Indonesia Library
cover
Sri Tudjono
"This paper elaborates on the theoretical background, necessity, and techniques for enhancing the flexural capacity of a T-section member under combined bending and shear. The paper is based on a continuing research program seeking solutions to the design disparities arising from the introduction of new seismic codes and revised earthquake mapping prior to the tsunami and major earthquakes that occurred in South East Asia more than a decade ago. The research considered the application of external reinforcement using fiber-reinforced polymer (FRP) sheets, creating confinement in the shear area, and improving the tensile strength zone. The test results suggested that the methods sufficiently increased the load-carrying capacity to meet the new provisions, but they also showed that the optimum load-carrying capacity was not reached due to debonding of the FRP sheets in the tensile zone. The work was expanded to search for a surface treatment method that could shift the failure mode from debonding to FRP rupture by performing direct shear tests on treated FRP-to-concrete bond surfaces. Using the best surface treatment method, a failed member was straightened, retrofitted, and re-reinforced in terms of both shear and tension. The experimental results showed that the load-carrying capacity of the flexural member not only increased significantly, but the surface treatment methods also overcame the interface debonding problem. This research provides a method for upgrading the flexural capacity of T-section members designed prior to the tsunami and earthquakes of 2004, and it offers a solution for cracked section repair and restoration."
Depok: Faculty of Engineering, Universitas Indonesia, 2018
UI-IJTECH 9:1 (2018)
Artikel Jurnal  Universitas Indonesia Library
cover
Rahmani Patana
"Kebiasaan belajar adalah teknik yang menetap pada diri siswa pada waktu menerima pelajaran, mcmbaca buku, mengeujakan tugas, dan mengatur waktu untuk menyelesaikan kegiatan (Djaali, 2008). Kebiasaan belajar di ruma11 yang efelctifditandai dengan: melakukan kegiatan belajar secara teratur, mempersiapkan semua kcperluan bclajar sebelum keesokan harinya berangkat ke sekolah, dan terbiam belajar hingga benar-benar memahami materi yang dipelajari (Liang Gie, 1995).
Program ini bertujuan mengubah kebiasaan belzgiar di rumah yang tidak teramr menjadi teratur melalui moditikasi perilalcu yang menerapkan prinsip-prinsip posilive reinforcement. Suhyek dalam penelitian ini bernama P, ia adalah seorang murid kelas 1 SD yang ‘berusia 6 tahum 8 bulan.
Setelah dilakukan intcrvensi, P dapat belajar secara temmr, sehingga bisa disimpulkan bahwa positive reinjbrcemenf efektif untuk membentuk kebiasaan belajar. Untuk penelitian selanjutnya disarankan agar materi yang dipelajari hendaknya fokus pada satu mata pelajaran, dibuat program untuk menumbuhkan motivasi intemal, tingkatkan pnoporsi belqjar selain mengerjakan PR, libatkzm kedua kakak P dalam kegiatan belajar, dan lakukanjbllow agp.

Study habit is a technique which is attained in a student by the time he gets study materials, reading books, does school works and manages his time in order to iinish his work (Djaali, 2008). Effective study habit at home is marked by: studying regularly, preparing everything which is needed before going to school the next day, and being used to study for understanding the study topic (Liang Gie, 1995).
The aim ofthis program is to modify unregular study habit at home into regular study habit by behavior modification wh ich uses the principal of positive reinforcement. Subject in this research is P, a first grader who is 6 years 8 months old.
After intervention, P succeeded in studying regularly, so it can be concluded that positive reinforcement is effective in shaping study habit. For tirture research the suggestions are the learning material studied should focus on only one sujea, an additional program should be designed to develop intemal motivation, time for leaming new materiats should be increased besides doing homework, the program should be implemented on both P’s sibling, and follow up is needed.
"
Depok: Fakultas Psikologi Universitas Indonesia, 2008
T34080
UI - Tesis Open  Universitas Indonesia Library
cover
Fitra Ifana Fasli
"Tugas akhir ini membahas mengenaj penerapan modiiikasi perilaku dengan metode positive reinforcement dalam melatih ketrampilan minum menggunakan sedotan pada anak dengan gangguan keterbelakangan mental berat. Tujuan dari intcrvcnsi ini adalah rneningkatkan iickuensi minum mcnggunakan sedotan. Penerapan modifikasi perilaku yang bcrhasil diiakukan sebanyak delapan sesi dalam waktu delapan had. Hasil penelitian menunjukkan bahwa metode positive reinfzrcement cukup efektif dalam melatih perilaku minum menggunakan sedotan pada anak dengan gangguan keterbelakaugan mental berat.

This final exam discusses the implementation of behavior moditication, especially positive reinforcement method in training straw-drinking skill for children with severe mental retardation. The objective of this intervention was to increase the frequency of sucking in straw-drinking. The intervention of behavior modification was implemented in eight sessions during eight days. This research showed that the positive reinforcement method was effective in training straw-drinking skill for children with severe mental retardation."
Depok: Fakultas Psikologi Universitas Indonesia, 2009
T34089
UI - Tesis Open  Universitas Indonesia Library
cover
Dandung Sektian
"Pengendalian ketinggian atau biasa disebut Level Controller adalah hal yang penting di berbagai bidang industri, termasuk industri kimia, industri minyak bumi, industri pupuk, industri otomatif dan lain-lainnya. Pada penelitian ini, dirancang sebuah pengendali non-konvesional menggunakan Reinforcement Learning dengan Twin Delayed Deep Deterministic Polic Gradient (TD3). Agent ini diterapkan pada sebuah miniature plant yang berisi air sebagai fluidanya. Miniature plant ini disusun dengan berbagai komponen yaitu flow transmitter, level transmitter, ball-valve, control valve, PLC, dan pompa air. Kontroler agent TD3 dirancang menggunakan SIMULINK Matlab di computer. Data laju aliran dan ketinggian air diambil melalui flow transmitter dan level transmitter yang dikoneksikan dengan OPC sebagai penghubung antara Matlab ke SIMULINK. Penerapan agent TD3 pada sistem pengendalian ketinggian air digunakan pada dua kondisi yaitu secara riil plant dan simulasi. Dari penelitian ini didapatkan, bahwa kontroler agent TD3 dapat mengendalikan sistem dengan baik. overshoot yang didapatkan kecil yaitu 0,57 secara simulasi dan 0,97 secara riil plant.

In this study, the level controller is the most important in many industry fields, such as chemical industry, petroleum industry, automotive industry, etc., a non-conventional controller using Reinforcement Learning with Twin Delayed Deep Deterministic Policy Gradient (TD3) agent was designed. This agent was implemented in water contain the miniature plant. This miniature plant consists of many components: flow transmitter, level transmitter, ball-valve, control valve, PLC, and water pump. Agent controller was designed using SIMULINK Matlab on a computer, which obtained flow rate and height information comes from flow transmitter and level transmitter connected to OPC that link between Matlab to SIMULINK. Implementation of TD3 to control water level system used two conditions, in real plant and simulation. In this study, we obtain that the TD3 agent controller can control the designs with a slight overshoot value, namely 0,57 in the simulation and 0,97 in the real plant."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2021
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Faathir Chikal Asyuraa
"Permasalahan Multi-Armed Bandit adalah permasalahan dalam reinforcement learning yang berfokus pada rancangan eksperimen, diberikan sebuah himpunan opsi yang disebut arms yang dapat dipilih berkali-kali, bagaimana cara menyeimbangkan antara mengeksplorasi arm yang ada untuk mengumpulkan informasi atau mengeksploitasi arm yang terlihat terbaik untuk memaksimalkan keuntungan. Oleh karena itu, Multi-Armed Bandit menjadi alternatif yang lebih dinamis dari percobaan acak. Contoh dari aplikasi Multi-Armed Bandit adalah menentukan artwork film yang harus ditunjukkan untuk menarik pengunjung untuk menonton film tersebut. Distribusi Bernoulli dengan parameter θ dipilih untuk memodelkan respons dari pengunjung setelah melihat artwork film. Kondisi tidak stasioner pada θ dapat diimplementasikan untuk mengakomodasi periode keunggulan berbeda dalam artwork film. Kondisi tidak stasioner pada studi ini dimodelkan melalui piecewise-stationary, yaitu θ dapat berubah nilai, namun tetap konstan di setiap periode yang didefinisikan. Pada penelitian ini, digunakan beberapa policy seperti Epsilon Greedy, SoftMax, Upper Confidence Bounds, Thompson Sampling, Sliding Window Upper Confidence Bounds, Discounted Upper Confidence Bounds, dan juga Discounted Thompson Sampling, untuk menangani permasalahan Multi-Armed Bandit dengan Piecewise-Stationary Bernoulli Arms. Simulasi dilakukan pada kondisi yang berbeda-beda untuk menguji performa policy tersebut dalam berbagai kondisi yang ada. Berdasarkan simulasi tersebut, Discounted Thompson Sampling policy menunjukkan performa yang sangat baik dalam menangani kondisi stasioner maupun piecewise-stationary.

The Multi-Armed Bandit problem is a problem in reinforcement learning that focuses on how to design an experiment, given a set of options called arms that could be tried many times, how to balance between exploring the available arms to gather information or exploiting the seemingly best arm to maximize profit. Because of this, Multi-Armed Bandit has gained its popularity as a more dynamic approach to a randomized trial. An example of Multi-Armed Bandit is in determining recommending a film artwork to show to a visitor. Bernoulli distribution with parameter θ is chosen to model the respons of the visitor whether they watch the film or not. Non-stationary condition on θ can be implemented to accommodate various trends in film artworks, the non-stationary condition in this study is modeled through Piecewise-Stationary. In this study, several policies are used, such as Epsilon Greedy, SoftMax, Upper Confidence Bounds, Thompson Sampling, Sliding Window Upper Confidence Bounds, Discounted Upper Confidence Bounds, and Discounted Thompson Sampling, in handling Multi-Armed Bandit with Piecewise-Stationary Bernoulli Arms. Multiple simulations have been done to empirically evaluate the performance of the policies. Based on the simulation, Discounted Thompson Sampling policy shows a remarkable performance in tackling stationary and piecewise-stationary condition."
Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2020
S-Pdf
UI - Skripsi Membership  Universitas Indonesia Library
cover
Annisa Khoirul Mumtaza
"Sistem coupled tank merupakan salah contoh penerapan sistem kontrol level industri yang memiliki karakteristik yang kompleks dengan non linieritas yang tinggi. Pemilihan metode pengendalian yang tepat perlu dilakukan untuk dapat diterapkan dalam sistem coupled tank agar dapat memberikan kinerja dengan presisi tinggi. Sejak awal kemunculannya, Reinforcement Learning (RL) telah menarik minat dan perhatian yang besar dari para peneliti dalam beberapa tahun terakhir. Akan tetapi teknologi ini masih belum banyak diterapkan secara praktis dalam kontrol proses industri. Pada penelitian ini, akan dibuat sebuah sistem pengendalian level pada sistem coupled tank dengan menggunakan Reinforcement Learning dengan menggunakan algoritma Twin Delayed Deep Deterministic Policy Gradient (TD3). Reinforcement Learning memiliki fungsi reward yang dirancang dengan sempurna yang diperlukan untuk proses training agent dan fungsi reward tersebut perlu diuji terlebih dahulu melalui trial and error. Performa hasil pengendalian ketinggian air pada sistem coupled tank dengan algoritma TD3 mampu menghasilkan pengendalian yang memiliki keunggulan pada rise time, settling time, dan peak time yang cepat serta nilai steady state eror sangat kecil dan mendekati 0%.

The coupled tank system is an example of the application of an industrial level control system that has complex characteristics with high non-linearity. It is necessary to select an appropriate control method to be applied in coupled tank systems in order to provide high-precision performance. Since its inception, Reinforcement Learning (RL) has attracted great interest and attention from researchers in recent years. However, this technology is still not widely applied practically in industrial process control. In this research, a level control system in a coupled tank system will be made using Reinforcement Learning using the Twin Delayed Deep Deterministic Policy Gradient (TD3) algorithm. Reinforcement Learning has a perfectly designed reward function that is required for the agent training process and the reward function needs to be tested first through trial and error. The performance of the results of controlling the water level in the coupled tank system with the TD3 algorithm is able to produce controls that have advantages in rise time, settling time, and peak time which are fast and the steady state error value is very small and close to 0%."
Depok: Fakultas Matematika Dan Ilmu Pengetahuan Alam Universitas Indonesia, 2023
S-pdf
UI - Skripsi Membership  Universitas Indonesia Library
<<   1 2 3 4 5 6 7   >>