Hasil Pencarian

Ditemukan 29 dokumen yang sesuai dengan query

Reinforcement learning: state-of-the-art

" Reinforcement learning encompasses both a science of adaptive behavior of rational beings in uncertain environments and a computational methodology for finding optimal behaviors for challenging problems in control, optimization and adaptive behavior of intelligent agents. As a field, reinforcement learning has progressed tremendously in the past decade. The main goal of this book is to present an up-to-date series of survey articles on the main contemporary sub-fields of reinforcement learning. This includes surveys on partially observable ... "

Berlin: [, Springer], 2012

e20398760

eBooks Universitas Indonesia Library

Recent advances in reinforcement learning : 9th European workshop, EWRL 2011, Athens, Greece, September 9-11, 2011 : revised selected papers

" This book constitutes revised and selected papers of the 9th European Workshop on Reinforcement Learning, EWRL 2011, which took place in Athens, Greece in September 2011. The papers presented were carefully reviewed and selected from 40 submissions. The papers are organized in topical sections online reinforcement learning, learning and exploring MDPs, function approximation methods for reinforcement learning, macro-actions in reinforcement learning, policy search and bounds, multi-task and transfer reinforcement learning, multi-agent reinforcement learning, apprenticeship and ... "

Berlin: Springer-Verlag, 2012

e20409054

eBooks Universitas Indonesia Library

Dandung Sektian

Rancang bangun sistem pengendalian ketinggian air berbasis PLC dan reinforcement learning dengan agent twin delayed deep deterministic policy gradient (TD3) = Design of water level control system based on PLC and reinforcement learning with twin delayed deep deterministic policy gradient (TD3)

" Pengendalian ketinggian atau biasa disebut Level Controller adalah hal yang penting di berbagai bidang industri, termasuk industri kimia, industri minyak bumi, industri pupuk, industri otomatif dan lain-lainnya. Pada penelitian ini, dirancang sebuah pengendali non-konvesional menggunakan Reinforcement Learning dengan Twin Delayed Deep Deterministic Polic Gradient (TD3). Agent ini diterapkan pada sebuah miniature plant yang berisi air sebagai fluidanya. Miniature plant ini disusun dengan berbagai komponen yaitu flow transmitter, level transmitter, ball-valve, control valve, PLC, dan pompa ... "

Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2021

S-pdf

UI - Skripsi Membership Universitas Indonesia Library

Faathir Chikal Asyuraa

Permasalahan Multi-Armed Bandit dengan Piecewise-Stationary Bernoulli Arms = Multi-Armed Bandit Problem with Piecewise-Stationary Bernoulli Arms

" Permasalahan Multi-Armed Bandit adalah permasalahan dalam reinforcement learning yang berfokus pada rancangan eksperimen, diberikan sebuah himpunan opsi yang disebut arms yang dapat dipilih berkali-kali, bagaimana cara menyeimbangkan antara mengeksplorasi arm yang ada untuk mengumpulkan informasi atau mengeksploitasi arm yang terlihat terbaik untuk memaksimalkan keuntungan. Oleh karena itu, Multi-Armed Bandit menjadi alternatif yang lebih dinamis dari percobaan acak. Contoh dari aplikasi Multi-Armed Bandit adalah menentukan artwork film yang harus ditunjukkan untuk menarik pengunjung untuk menonton film ... "

Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2020

S-Pdf

UI - Skripsi Membership Universitas Indonesia Library

Annisa Khoirul Mumtaza

Implementasi Reinforcement Learning dengan Menggunakan Algoritma Twin Delayed Deep Deterministic Policy Gradient (TD3) untuk Pengendalian Ketinggian Air pada Sistem Coupled Tank = Implementation of Reinforcement Learning Using Twin Delayed Deep Deterministic Policy Gradient (TD3) Algorithm for Water Level Control in Coupled Tank System

" Sistem coupled tank merupakan salah contoh penerapan sistem kontrol level industri yang memiliki karakteristik yang kompleks dengan non linieritas yang tinggi. Pemilihan metode pengendalian yang tepat perlu dilakukan untuk dapat diterapkan dalam sistem coupled tank agar dapat memberikan kinerja dengan presisi tinggi. Sejak awal kemunculannya, Reinforcement Learning (RL) telah menarik minat dan perhatian yang besar dari para peneliti dalam beberapa tahun terakhir. Akan tetapi teknologi ini masih belum banyak diterapkan secara praktis dalam kontrol proses ... "

Depok: Fakultas Matematika Dan Ilmu Pengetahuan Alam Universitas Indonesia, 2023

S-pdf

UI - Skripsi Membership Universitas Indonesia Library

Annisa Khoirul Mumtaza

Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2023

S-pdf

UI - Skripsi Membership Universitas Indonesia Library

Fathan Akbar Rahmani

Simulasi Pengendalian Temperatur dan Kelembaban pada Sistem HVAC Menggunakan Reinforcement Learning dengan Algoritma Proximal Optimization (PPO) = Simulation of Temperature and Humidity Control in HVAC System Using Reinforcement Learning with Proximal Policy Optimization (PPO) Algorithm

" Penelitian dilakukan dalam bentuk simulasi sistem pengendalian temperatur dan kelembaban relatif pada central air-conditioner pabrik tekstil. Pengendalian menggunakan Reinforcement Learning (RL) dengan algoritma Proximal Policy Optimization (PPO). RL dirancang dan diambil datanya menggunakan software RL Designer ToolBox di MATLAB. Dilakukan training pada agent PPO untuk mengendalikan sistem dengan range pengendalian temperatur 18 o C – 25 o C dan kelembaban relatif 55% - 85%. Hasil training agent diukur dan dibandingkan performanya terhadap PI controller menggunakan ... "

Depok: Fakultas Matematika dan Ilmu Pengetahuan Alam Universitas Indonesia, 2023

S-pdf

UI - Skripsi Membership Universitas Indonesia Library

Alexander

Menguji Dampak Variasi Hyperparameter Pada Penerapan Multi Agent Deep reinforcement Learning untuk Mengoptimasi Konsumsi Daya Sistem Penggerak Kereta = Examining The Impact of Hyperparameter Variance in the Im- plementation of Multi Agent Deep Reinforcement Learning for Optimizing the Energy Consumption of Train Driving System

" Penggunaan energi secara efisien merupakan hal yang penting untuk mengatasi peningkatan permintaan terhadap energi pada masa kini. Penelitian ini bertujuan untuk mengoptimasi penggunaan energi terutama pada kereta dengan menerapkan algoritma Deep Deterministic Policy Gradient secara Multi Agent. Algoritma ini telah terbukti pada literatur akan kemampuannya dalam menangani permasalahan dengan aksi yang besifat kontinuu. Akan tetapi DDPG terkenal sensitif terhadap variasi \textit{hyperparameter} dan sumber daya komputasi yang besar untuk menemukan strategi optimal. Penelitian ini bertujuan untuk ... "

Depok: Fakultas Teknik Universitas Indonesia, 2023

S-pdf

UI - Skripsi Membership Universitas Indonesia Library

Muhammad Ziyad Ain Nur Rafif

Rancang Bangun Sistem Coupled-Tank untuk Pengendalian Ketinggian Air Berbasis Programmable Logic Controller dan Reinforcement Learning dengan Algoritma Twin-Delayed Deep Deterministic Policy Gradient = Design of a Coupled-Tank System for Water Level Control based on Programmable Logic Controller and Reinforcement Learning with Twin-Delayed Deep Deterministic Policy Gradient Algorithm

" Sistem coupled-tank merupakan konfigurasi yang digunakan pada industri dalam hal pengendalian ketinggian air, biasanya dengan metode pengendalian proportional, integral, derivative (PID). Namun, metode lain seperti reinforcement learning (RL) juga bisa diterapkan. Metode RL dapat dikombinasikan dengan programmable logic controller (PLC) yang sering digunakan dalam proses industri. PLC mengontrol ketinggian air dengan membaca data dari water level transmitter dan mengatur bukaan control valve berdasarkan algoritma RL yang sudah dilatih untuk mencapai kontrol optimal. Algoritma RL yang ... "

Depok: Fakultas Matematika Dan Ilmu Pengetahuan Alam Universitas Indonesia, 2024

S-pdf

UI - Skripsi Membership Universitas Indonesia Library

Budhitama Subagdja

Dynamic and incremental exploration strategy in fusion adaptive resonance theory for online reinforcement learning./

" One of the fundamental challenges in reinforcement learning is to setup a proper balance between ex-ploration and exploitation to obtain the maximum cummulative reward in the long run. Most proto-cols for exploration bound the overall values to a convergent level of performance. If new knowledge is inserted or the environment is suddenly changed, the issue becomes more intricate as the explo-ration must compromise the pre-existing knowledge. This paper presents a type of multi-channel adaptive resonance ... "

Nanyang Technological University, Joint NTU-UBC Research Centre of Excellence in Active Living for the Elderly, 2016

PDF

Artikel Jurnal Universitas Indonesia Library

<< 1 2 3 >>

Hasil Pencarian :: Simpan CSV :: Kembali

Hasil Pencarian