”RL“ 的搜索结果

     现实世界强化学习(RWRL)挑战框架 论文确定并描述了一组九个挑战,这些挑战当前阻止了强化学习(RL)代理在现实世界的应用程序和产品上使用。它还描述了一个评估框架和一组环境,可以评估RL算法对现实系统的潜在...

rl_graph_generation

标签:   Python

      cd rl-baselines pip install -e . 安装定制的分子健身环境: cd gym-molecule pip install -e. 代码说明 有4个重要文件: run_molecule.py是运行程序的主要代码。 您可以在那里调整各种超参数。 分子环境代码...

     tf-env 在纯TensorFlow图中实现的RL环境。乒乓球环境乒乓球环境是一种概念证明。 它是TensorFlow中Pong电子游戏的重新实现。可训练性脚本在Pong环境上训练代理。 在像样的GPU上,只需不到10分钟即可熟练掌握游戏。...

safe-rl-shielding

标签:   Python

      virtualenv shielded-learningsource shielded-learning/bin/activate 克隆此存储库: git clone https://github.com/safe-rl/safe-rl-shielding.git 安装依赖项: pip3 install -r requirements.txt env目录中的每...

     产品型号:1N6373RL4GJEDEC(电子器件工程联合会)型号:1N6373RL4G雪崩电压VBR(V):6峰值反向工作电压VRWM(V):5最大反向漏电流IR(uA):300最大反向浪涌电流IRSM(A):160最大反向电压(钳位电压)VRSM(V):9.400封装/温度(℃):...

     pytorch-RL-代理商SuReLI使用Pytorch实现的一些RL算法。演算法DDPG:在呈现的深度确定性策略梯度。 DQN:深度Q网络在呈现SAC:“软演员评论”中出现的“TD3: 双延迟深度确定性策略梯度要求火炬健身房(可选)...

     Many applications need to check the integrity of a code image or data communication stream by using a CRC ... Most RL78 MCUs have a built-in Hardware CRC function that can be used for this purpose

     最小RL 用最少的代码行实现基本的RL算法! (基于PyTorch) 每种算法都在一个文件中完成。 每个文件的长度最多为100〜150行代码。 即使没有GPU,也可以在30秒内训练每种算法。 Env固定为“ CartPole-v1”。 您可以只...

     产品型号:2N5551RL1G类型:NPN集电极-发射集最小雪崩电压Vceo(V):160集电极最大电流Ic(max)(mA):600直流电流增益hFE最小值(dB):80直流电流增益hFE最大值(dB):250最小电流增益带宽乘积Ft(MHz):100封装/温度(℃):TO92/...

     FT232RL USB 分线器 这是 FTDI 流行的 USB 到 UART IC 的基本分线板。 VCCIO 可通过板载开关在 VCC 和 3.3V 之间进行选择。存储库内容/Hardware - 所有 Eagle 设计文件(.brd、.sch) /Production - 测试台文件和...

10  
9  
8  
7  
6  
5  
4  
3  
2  
1