封裝器列表¶
Gymnasium 提供了以下列出的許多常用封裝器。有關特定封裝器的更多資訊,請參閱封裝器型別頁面
名稱 |
描述 |
|---|---|
封裝基於任何 Array API 相容框架(例如 |
|
實現 Atari 環境的常用預處理技術(不包括幀堆疊)。 |
|
當達到終止或截斷狀態時,被封裝的環境會自動重置。 |
|
將傳遞給 |
|
將環境的獎勵剪下到上限和下限之間。 |
|
對從環境中返回的觀測值新增延遲。 |
|
將觀測陣列的資料型別修改為指定的資料型別。 |
|
透過一組鍵或索引過濾 Dict 或 Tuple 觀測空間。 |
|
扁平化環境的觀測空間以及來自 |
|
以滾動方式堆疊最後 |
|
將由 |
|
允許支援“rgb_array”渲染的環境進行類人渲染。 |
|
封裝一個基於 Jax 的環境,使其可以與 NumPy 陣列互動。 |
|
封裝一個基於 Jax 的環境,使其可以與 PyTorch 張量互動。 |
|
跳過第 N 幀(觀測)並返回最後兩個觀測之間的最大值。 |
|
將觀測值歸一化,使其以均值為中心,具有單位方差。 |
|
歸一化即時獎勵,使其指數移動平均值具有固定方差。 |
|
封裝一個基於 NumPy 的環境,使其可以與 PyTorch 張量互動。 |
|
如果在 |
|
一個被動環境檢查器封裝器,圍繞 |
|
此封裝器將跟蹤累積獎勵和劇集長度。 |
|
使用環境的渲染功能錄製環境劇集的影片。 |
|
收集環境的渲染幀,使得 |
|
將渲染的觀測值包含在環境的觀測值中。 |
|
將環境的 |
|
將環境的 |
|
將基於陣列的觀測值重塑為指定的形狀。 |
|
使用 OpenCV 將影像觀測值調整為指定的形狀。 |
|
增加動作在同一 |
|
用劇集內的時間步數擴充觀測值。 |
|
透過在超過最大時間步數時截斷環境來限制環境的步數。 |
|
在將修改後的值傳遞給環境 |
|
對從環境的 |
|
對從環境的 |
僅限向量封裝器¶
名稱 |
描述 |
|---|---|
將向量化環境的資訊從 |
|
為向量環境向量化單智慧體轉換動作封裝器。 |
|
為向量環境向量化單智慧體轉換觀測封裝器。 |
|
為向量環境向量化單智慧體轉換獎勵封裝器。 |