雙足步行者¶
此環境是 Box2D 環境的一部分,其中包含有關該環境的一般資訊。
動作空間 |
|
觀測空間 |
|
匯入 |
|
描述¶
這是一個簡單的4關節步行機器人環境。有兩種版本:
普通版:地形略有不平。
硬核版:包含梯子、樹樁、陷阱。
要解決普通版,你需要在1600個時間步內獲得300分。要解決硬核版,你需要在2000個時間步內獲得300分。
提供了啟發式方法用於測試。獲取演示以供學習也很有用。要執行啟發式方法:
python gymnasium/envs/box2d/bipedal_walker.py
動作空間¶
動作是四個關節(髖部和膝部)的電機速度值,範圍為 [-1, 1]。
觀測空間¶
狀態包括船體角度速度、角速度、水平速度、垂直速度、關節位置和關節角速度、腿部與地面接觸情況,以及10個雷射雷達測距儀測量值。狀態向量中不包含座標。
獎勵¶
向前移動會獲得獎勵,最高可達遠端的300+分。如果機器人跌倒,會獲得-100分。施加電機扭矩會消耗少量分數。更優的智慧體會獲得更高的分數。
起始狀態¶
步行者從地形的左端開始站立,船體水平,雙腿處於相同位置,膝部略微彎曲。
回合終止¶
如果船體接觸地面,或者步行者超出地形長度的右端,則回合將終止。
引數¶
要使用 *硬核* 環境,你需要指定 hardcore=True
>>> import gymnasium as gym
>>> env = gym.make("BipedalWalker-v3", hardcore=True, render_mode="rgb_array")
>>> env
<TimeLimit<OrderEnforcing<PassiveEnvChecker<BipedalWalker<BipedalWalker-v3>>>>>
版本歷史¶
v3: 返回最近的雷射雷達軌跡而不是最遠的;更快的影片錄製
v2: 計算能量消耗
v1: 腿部現在報告與地面接觸;電機具有更高的扭矩和速度;地面摩擦力更高;雷射雷達渲染更平穩。
v0: 初始版本
鳴謝¶
由 Oleg Klimov 建立