淺色徽標 深色徽標 Gymnasium 文件
Farama 基金會徽標 Farama 基金會
Contents - Gymnasium 文件 Menu - Gymnasium 文件 Expand - Gymnasium 文件 Light mode - Gymnasium 文件 Dark mode - Gymnasium 文件 Auto light/dark mode - Gymnasium 文件
淺色徽標 深色徽標 Gymnasium 文件

簡介

  • 基本用法
  • 訓練智慧體
  • 建立自定義環境
  • 記錄智慧體
  • 加速訓練
  • 與 Gym 的相容性
  • 遷移指南 - v0.21 到 v1.0.0

API

  • 環境
  • 建立與註冊
  • 空間
    • 基礎空間
    • 複合空間
    • 空間工具
  • 封裝器
    • 封裝器列表
    • 其他封裝器
    • 動作封裝器
    • 觀察封裝器
    • 獎勵封裝器
  • 向量化
    • 封裝器
    • 異步向量環境
    • 同步向量環境
    • 實用函式
  • 實用函式
  • 函式式環境

環境

  • 經典控制
    • 雜技機器人
    • 倒立擺
    • 連續山地車
    • 山地車
    • 擺
  • Box2D
    • 雙足行走機器人
    • 賽車
    • 月球著陸器
  • 文字玩具
    • 21點
    • 計程車
    • 懸崖行走
    • 冰湖
  • MuJoCo
    • 螞蟻
    • 半獵豹
    • 跳躍者
    • 人形機器人
    • 人形機器人站立
    • 雙倒立擺
    • 倒立擺
    • 推杆
    • 抓取器
    • 游泳者
    • 2D 行走機器人
  • 雅達利
  • 外部環境

教程

  • Gymnasium 基礎
    • 建立您自己的自定義環境
    • 處理時間限制
    • 實現自定義封裝器
    • 載入自定義四足機器人環境
  • 訓練智慧體
    • 使用表格 Q 學習解決 21 點
    • 使用表格 Q 學習解決冰湖問題
    • 使用 REINFORCE 訓練 MuJoCo
    • 使用向量環境加速 A2C 訓練
  • 第三方教程

開發

  • GitHub
  • 論文
  • Gymnasium 釋出說明
  • Gym 釋出說明
  • 貢獻文件
返回頂部
編輯本頁

訓練智慧體¶

Gymnasium 最常見的應用是訓練強化學習(RL)智慧體。因此,這些教程旨在展示不同環境的各種示例實現。

使用表格 Q 學習解決 21 點

使用表格 Q 學習解決 21 點

使用表格 Q 學習解決冰湖問題

使用表格 Q 學習解決冰湖問題

使用 REINFORCE 訓練 MuJoCo

使用 REINFORCE 訓練 MuJoCo

使用向量環境加速 A2C 訓練

使用向量環境加速 A2C 訓練
下一頁
使用表格 Q 學習解決 21 點
上一頁
載入自定義四足機器人環境
版權所有 © 2025 Farama 基金會