雙足步行者

../../../_images/bipedal_walker.gif

此環境是 Box2D 環境的一部分,其中包含有關該環境的一般資訊。

動作空間

Box(-1.0, 1.0, (4,), float32)

觀測空間

Box([-3.1415927 -5. -5. -5. -3.1415927 -5. -3.1415927 -5. -0. -3.1415927 -5. -3.1415927 -5. -0. -1. -1. -1. -1. -1. -1. -1. -1. -1. -1. ], [3.1415927 5. 5. 5. 3.1415927 5. 3.1415927 5. 5. 3.1415927 5. 3.1415927 5. 5. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. ], (24,), float32)

匯入

gymnasium.make("BipedalWalker-v3")

描述

這是一個簡單的4關節步行機器人環境。有兩種版本:

  • 普通版:地形略有不平。

  • 硬核版:包含梯子、樹樁、陷阱。

要解決普通版,你需要在1600個時間步內獲得300分。要解決硬核版,你需要在2000個時間步內獲得300分。

提供了啟發式方法用於測試。獲取演示以供學習也很有用。要執行啟發式方法:

python gymnasium/envs/box2d/bipedal_walker.py

動作空間

動作是四個關節(髖部和膝部)的電機速度值,範圍為 [-1, 1]。

觀測空間

狀態包括船體角度速度、角速度、水平速度、垂直速度、關節位置和關節角速度、腿部與地面接觸情況,以及10個雷射雷達測距儀測量值。狀態向量中不包含座標。

獎勵

向前移動會獲得獎勵,最高可達遠端的300+分。如果機器人跌倒,會獲得-100分。施加電機扭矩會消耗少量分數。更優的智慧體會獲得更高的分數。

起始狀態

步行者從地形的左端開始站立,船體水平,雙腿處於相同位置,膝部略微彎曲。

回合終止

如果船體接觸地面,或者步行者超出地形長度的右端,則回合將終止。

引數

要使用 *硬核* 環境,你需要指定 hardcore=True

>>> import gymnasium as gym
>>> env = gym.make("BipedalWalker-v3", hardcore=True, render_mode="rgb_array")
>>> env
<TimeLimit<OrderEnforcing<PassiveEnvChecker<BipedalWalker<BipedalWalker-v3>>>>>

版本歷史

  • v3: 返回最近的雷射雷達軌跡而不是最遠的;更快的影片錄製

  • v2: 計算能量消耗

  • v1: 腿部現在報告與地面接觸;電機具有更高的扭矩和速度;地面摩擦力更高;雷射雷達渲染更平穩。

  • v0: 初始版本

鳴謝

由 Oleg Klimov 建立