RL - 程序员宅基地

keras-rl：Keras的深度强化学习

标签： machine-learning theano reinforcement-learning tensorflow keras neural-networks MachinelearningPython

keras-rl在Python中实现了一些最先进的深度强化学习算法，并与深度学习库无缝集成。此外， keras-rl可与一起使用。这意味着评估和使用不同算法很容易。当然，您可以根据自己的需要扩展keras-rl 。您可以使用...

RL:一组RL实验。目前包括

标签： reinforcement-learning policy-gradient ranking-algorithm Python

RLDQN 著名DQN算法的简单复制。运行乒乓示例： python python/Pong/Pong_main pong_exampleMDP排名：在[使用Markov决策过程进行等级增强学习]中复制MDP等级算法。魏旭兰兰郭程SIGIR'17，2017] 相关论文：[适应...

realworldrl_suite:真实世界的RL基准套件

标签： Python

现实世界强化学习（RWRL）挑战框架论文确定并描述了一组九个挑战，这些挑战当前阻止了强化学习（RL）代理在现实世界的应用程序和产品上使用。它还描述了一个评估框架和一组环境，可以评估RL算法对现实系统的潜在...

DeepRL:一些深度RL算法的实现

标签： reinforcement-learning deep-reinforcement-learning pytorch dqn ddpg actor-critic td3 Python

DeepRL 一些深度RL算法的实现要求 python <= 3.6 火炬== 1.0 火炬视觉张量流== 1.15.2 张量板健身房相关论文

rl_graph_generation

标签： Python

cd rl-baselines pip install -e . 安装定制的分子健身环境： cd gym-molecule pip install -e. 代码说明有4个重要文件： run_molecule.py是运行程序的主要代码。您可以在那里调整各种超参数。分子环境代码...

嵌入式系统/ARM技术中的瑞萨电子推出全新RL78族MCU

标签：嵌入式系统/ARM技术中的瑞萨电子推出全新RL78族MCU 嵌入式系统/ARM技术

瑞萨电子（中国）宣布在大中国区推出超低功耗的新型RL78族微控制器（MCU）。RL78族融合了R8C和78K（78K0，78K0R）两族产品的优势特性，实现了更低的功耗、更优的性能和更高的集成度，并可提供强大的移植路径。新产品...

tf-env:用纯TensorFlow编写的RL环境

标签： Python

tf-env 在纯TensorFlow图中实现的RL环境。乒乓球环境乒乓球环境是一种概念证明。它是TensorFlow中Pong电子游戏的重新实现。可训练性脚本在Pong环境上训练代理。在像样的GPU上，只需不到10分钟即可熟练掌握游戏。...

safe-rl-shielding

标签： Python

virtualenv shielded-learningsource shielded-learning/bin/activate 克隆此存储库： git clone https://github.com/safe-rl/safe-rl-shielding.git 安装依赖项： pip3 install -r requirements.txt env目录中的每...

tf2rl：TensorFlow2强化学习

标签： reinforcement-learning tensorflow deep-reinforcement-learning imitation-learning inverse-reinforcement-learning tensorflow2 TensorflowPython

TF2RL TF2RL是一个深度强化学习库，它使用TensorFlow 2.x实现了各种深度强化学习算法。演算法支持以下算法：算法分立行动持续动作支持类别， ✓ ✓ 免模型按策略RL （包括，，，，） ✓ -- 免...

CSR发布的GRACE RL06球谐系数产品的二次加工格网数据

标签：文档资料

数据已经进行了以下的处理： 1.替换了一阶项、C20； 2.进行了300 KM高斯滤波和P4M6去相关滤波； 3.发布为格网数据格式，分辨率为1°×1°；

CSR_GRACE_GRACE-FO_RL06_Mascons_all-corrections_v02.nc

标签： c++

nc文件

rl78(user manual software).pdf

标签：瑞萨嵌入式单片机

瑞萨RL78族单片机软件用户手册，此手册主要查阅对象为嵌入式单片机软件和硬件研发人员。此手册可帮助研发人员更好的进行瑞萨单片机内容的开发。

1N6373RL4G的技术参数

标签： 1N6373RL4G的技术参数其它

产品型号:1N6373RL4GJEDEC(电子器件工程联合会)型号:1N6373RL4G雪崩电压VBR(V):6峰值反向工作电压VRWM(V):5最大反向漏电流IR(uA):300最大反向浪涌电流IRSM(A):160最大反向电压(钳位电压)VRSM(V):9.400封装/温度(℃):...

Pytorch-RL-Agents:我们用Pytorch实现的一些RL算法

标签： Python

pytorch-RL-代理商SuReLI使用Pytorch实现的一些RL算法。演算法DDPG：在呈现的深度确定性策略梯度。 DQN：深度Q网络在呈现SAC：“软演员评论”中出现的“TD3：双延迟深度确定性策略梯度要求火炬健身房（可选）...

RL 电路正弦响应：RL 电路正弦响应-matlab开发

标签： matlab

该 App 显示了串联 RL 电路对 t=0 时刻突然施加的正弦输入电压的稳态响应。所有参数都可以通过滑块进行调整。

ft232rl-driver新驱动

标签： ft232rl

ft232rl-driver新驱动

post--understanding-rl-vision:了解RL视觉蒸馏文章

标签： HTML

了解RL愿景提要文章。查看。使用npm run dev运行监视服务器，将其托管在。使用npm run build将文章编译为public/index.html 。有关更多信息，请参见Distill。

openai-rl:不同RL算法的基准

标签： Python

openai-rl 不同RL算法的基准

RL78G12硬件篇.pdf

标签：瑞萨 RL78G12硬件篇

RL78G12硬件篇中文

rl78-ida-proc:瑞萨电子IDA RL78处理器模块

标签： C++

瑞萨电子IDA RL78处理器模块基于R01US0015EJ0220，Rev.2.20，2014年11月20日已知的问题仅与S2核心的代码一起使用。交换机惯用语言支持未完全实现。

瑞萨RL78 Hardware CRC functions

标签：综合资源

Many applications need to check the integrity of a code image or data communication stream by using a CRC ... Most RL78 MCUs have a built-in Hardware CRC function that can be used for this purpose