本文最后更新于:6 天前
环境介绍
我们使用的仿真环境为OpenAI 的gym(https://github.com/openai/gym)。
选用gym平台的原因:
- 首先gym是OpenAI开发的通用强化学习算法测试平台,背后有大神 Pieter Abbeel、Sergey Levine 等人率领的强大团队的支持。
- 其次,学会了gym的基本应用,可以自己学习使用OpenAI的其他开源强化学习软件,如universe、roboschool 和baselines等。
- 再次,gym本身集成了很多仿真环境,如经典控制中的⻋摆环境,小⻋爬山环境、雅达利游戏、棋盘环境等。
利用这些写好的环境,可以学习强化学习算法的基本原理。另外gym是用Python语言写的,可以和深度学习的开源软件如TensorFlow等无缝衔接。
环境配置脚本
详见 gym_installer.sh,下载地址:gym_installer.sh
记录一个依赖库
mujoco-py
正常安装失败,非正常安装方式$ git clone -b 1.50.1.0 https://github.com/openai/mujoco-py.git $ cd mujoco-py $ pip install -e .
环境测试
如图,看到一个小车的倒立摆系统说明环境配置成功了。
本博客所有文章除特别声明外,均采用 CC BY-SA 3.0协议 。转载请注明出处!