Reinforcement Learning ( 201931042_muhammad agung nugroho)
Pada Reinforcement Learning terdapat 4 sub-element, yaitu :
- Policy.
Policy adalah cara suatu agent untuk berperilaku pada sebuah situasi. Dengan kata lain elemen ini adalah pemetaan aksi yang akan diambil oleh sang agent, lalu diimplementasikan pada suatu situasi.
2. Reward Function.
Elemen ini didefinisikan sebagai goal/tujuan yang ingin dicapai sebuah agent. Dalam proses ini agent akan memaksimalkan reward dari aksi yang sudah dilakukan. Reward Function akan menjadi acuan agent mengenai mana yang baik dan yang buruk.
3. Value Function.
Jika Reward Function mendefinisikan hasil yang terbaik saat itu juga, pada Value Function ini agent akan mempertimbangkan hasil yang terbaik untuk jangka panjang. Atau dalam kata lain, nilai sebuah keadaan (state) adalah jumlah total reward yang bisa dikumpulkan agen hingga masa berikutnya, dimulai dari keadaan (state) tersebut. Reward didapatkan langsung dari lingkungan (environment), sedangkan Value harus diestimasi secara menerus dari hasil pengamatan si agent.
4. Environment Model
Pada elemen ini, agent akan memprediksi keadaan dan reward selanjuntnya. Elemen ini digunakan untuk perencanaan atau dalam kata lain, agent akan memutuskan aksi dengan mempertimbangkan kemungkinan situasi di masa yang akan datang.
Interaksi Agent dengan Environment
Agent adalah istilah untuk Pembelajar (Learner) dan Pengambil Keputusan (Decision Maker). Agent memilih aksi dan lingkungan merespon kepada aksi tersebut dan memberikan keadaan (state) baru kepada agent. Lingkungan (environment) pun akan menghasilkan reward yang akan dimaksimalkan setiap saat oleh si agent. Gambar diatas adalah ilustrasi dari Reinforcement Learning.
Komentar
Posting Komentar