Reinforcement Learning ( 201931042_muhammad agung nugroho)

 

Pada Reinforcement Learning terdapat 4 sub-element, yaitu :

  1. Policy.

Policy adalah cara suatu agent untuk berperilaku pada sebuah situasi. Dengan kata lain elemen ini adalah pemetaan aksi yang akan diambil oleh sang agent, lalu diimplementasikan pada suatu situasi.

2. Reward Function.

Elemen ini didefinisikan sebagai goal/tujuan yang ingin dicapai sebuah agent. Dalam proses ini agent akan memaksimalkan reward dari aksi yang sudah dilakukan. Reward Function akan menjadi acuan agent mengenai mana yang baik dan yang buruk.

3. Value Function.

Jika Reward Function mendefinisikan hasil yang terbaik saat itu juga, pada Value Function ini agent akan mempertimbangkan hasil yang terbaik untuk jangka panjang. Atau dalam kata lain, nilai sebuah keadaan (state) adalah jumlah total reward yang bisa dikumpulkan agen hingga masa berikutnya, dimulai dari keadaan (state) tersebut. Reward didapatkan langsung dari lingkungan (environment), sedangkan Value harus diestimasi secara menerus dari hasil pengamatan si agent.

4. Environment Model

Pada elemen ini, agent akan memprediksi keadaan dan reward selanjuntnya. Elemen ini digunakan untuk perencanaan atau dalam kata lain, agent akan memutuskan aksi dengan mempertimbangkan kemungkinan situasi di masa yang akan datang.

Interaksi Agent dengan Environment


Ilustrasi : Reinforcement Learning

Agent adalah istilah untuk Pembelajar (Learner) dan Pengambil Keputusan (Decision Maker). Agent memilih aksi dan lingkungan merespon kepada aksi tersebut dan memberikan keadaan (state) baru kepada agent. Lingkungan (environment) pun akan menghasilkan reward yang akan dimaksimalkan setiap saat oleh si agent. Gambar diatas adalah ilustrasi dari Reinforcement Learning.

Komentar

Postingan populer dari blog ini

Perceptron

Artificial Intelligence