”RL“ 的搜索结果

     强化学习(Reinforcement Learning, RL),又称再励学习、评价学习或增强学习,是机器学习的范式和方法论之一,用于描述和解决智能体(agent)在与环境的交互过程中通过学习策略以达成回报最大化或实现特定目标的...

offline_safe_rl

标签:   Python

     离线Safe RL 将数据集放在/ datasets中。 utils.py中的get_dataset函数将加载Safety-Gym数据集。

     torch_rl 强化网络和人工神经网络的强化学习算法。目前已实施具有后见之明的深度确定性政策梯度重播重播具有后见之明的随机政策梯度有偏见的事后政策梯度GPU上的近端策略优化协方差矩阵适应进化策略进行中... 分布式...

match3_env:RL_env

标签:   Python

     match3_env入门正在安装git clone https://github.com/hans1996/match3_env.gitcd match3_envpip install -e .例子有关详细信息,请参见random_step_example.ipynb

10  
9  
8  
7  
6  
5  
4  
3  
2  
1