Nagi-ovo
追蹤
Breezing
127
粉絲
14
追蹤中
贊助
主页
封存
作品集
日寄
Policy Gradient
最新
熱門
最多留言
Policy Gradient 入门学习
本文是对学习 Andrej Karpathy 的 Deep RL Bootcamp 及其博客的记录,博客链接:Deep Reinforcement Learning: Pong from Pixels RL 的进展并不主要由新奇惊人的想法推动: 2012 年的…
RL
6 分鐘
1 個月前
此部落格數據所有權由區塊鏈加密技術和智能合約保障僅歸創作者所有。
區塊鏈編號
#61009
擁有者
0x6380302480224d53ec4c2c318d1c7be2c55a7582
交易雜湊值
創作 0xe99aa0c3...eadd5b56dd
最後更新 0xbbb1065e...27e4251516
IPFS 位址
ipfs://QmRexkzoZYFjNXZjiV7uLfCX8Tvby8JkfSscUbggSL4vd4