本文最后更新于:6 天前

环境介绍

我们使用的仿真环境为OpenAI 的gym(https://github.com/openai/gym)。

选用gym平台的原因:

  • 首先gym是OpenAI开发的通用强化学习算法测试平台,背后有大神 Pieter Abbeel、Sergey Levine 等人率领的强大团队的支持。
  • 其次,学会了gym的基本应用,可以自己学习使用OpenAI的其他开源强化学习软件,如universe、roboschool 和baselines等。
  • 再次,gym本身集成了很多仿真环境,如经典控制中的⻋摆环境,小⻋爬山环境、雅达利游戏、棋盘环境等。

利用这些写好的环境,可以学习强化学习算法的基本原理。另外gym是用Python语言写的,可以和深度学习的开源软件如TensorFlow等无缝衔接。

环境配置脚本

详见 gym_installer.sh,下载地址:gym_installer.sh

  • 记录一个依赖库mujoco-py正常安装失败,非正常安装方式

    $ git clone -b 1.50.1.0  https://github.com/openai/mujoco-py.git
    $ cd mujoco-py
    $ pip install -e .

环境测试

image-20200611100313212

如图,看到一个小车的倒立摆系统说明环境配置成功了。