๋ณธ ๊ฒ์๊ธ์ ๊ฐํํ์ต์ ํ ์ข ๋ฅ ์ค ํ๋์ธ Distributional Reinforcement Learning ์ค Deepmind์์ ๋ฐํํ ๋ช๊ฐ์ง ์๊ณ ๋ฆฌ์ฆ์ ์ค๋ช ํ ์์ ์ ๋๋ค.
์๊ณ ๋ฆฌ์ฆ์ ๊ฒฝ์ฐ ๋ณธ ํด๋ ๋ด๋ถ์ Distributional_RL_code ํด๋ ๋ด๋ถ์ ํฌํจ๋์ด ์์ต๋๋ค.
์ต๊ณ ์ AI๊ด๋ จ ์ฐ๊ตฌ ๊ธฐ๊ด ์ค ํ๋์ธ Deepmind๊ฐ ์ต๊ทผ distributional RL์ ๋ํ ๋ช ๊ฐ์ง ๋ ผ๋ฌธ๋ค์ ๋ฐํํ์์ผ๋ฉฐ ํด๋น ๊ธฐ์ ๋ค์ ๊ณ์ ๋ฐ์ ์์ผ ๋ค์ํ๊ฒ ์ ์ฉ ์ค์ ์์ต๋๋ค. ๋ณธ ๋ธ๋ก๊ทธ์์ ๋ฆฌ๋ทฐํ ๋ ผ๋ฌธ๋ค์ ๋ค์๊ณผ ๊ฐ์ต๋๋ค.
- A Distributional Perspective on Reinforcement Learning (C51)
- Distributional Reinforcement Learning with Quantile Regression (QR-DQN)
- Implicit Quantile Networks for Distributional Reinforcement Learning (IQN)
๊ฐ ์๊ณ ๋ฆฌ์ฆ๋ค์ ๋ํ ์ค๋ช ์ ๋ค์์ ๋งํฌ๋ค์ ๋ฐ๋ผ๊ฐ์๋ฉด ๋ฉ๋๋ค