訓練智慧體¶ Gymnasium 最常見的應用是訓練強化學習(RL)智慧體。因此,這些教程旨在展示不同環境的各種示例實現。 使用表格 Q 學習解決 21 點 使用表格 Q 學習解決 21 點 使用表格 Q 學習解決冰湖問題 使用表格 Q 學習解決冰湖問題 使用 REINFORCE 訓練 MuJoCo 使用 REINFORCE 訓練 MuJoCo 使用向量環境加速 A2C 訓練 使用向量環境加速 A2C 訓練