smolvla_epi101_2cam

English

SmolVLA finetuned on SO101 pick and place with 2 cameras (101 episodes).

Training

  • Base model: lerobot/smolvla_base
  • Dataset: naochanman/so101_pick_fixed_2cam_100ep
  • Steps: 20000
  • Batch size: 8
  • Image augmentation: enabled
  • rename_map applied to swap camera labels

Note

Dataset so101_pick_fixed_2cam_100ep has camera labels (top/wrist) swapped. Training used rename_map to correct this, so inference should use correct camera assignments:

  • top = top camera
  • wrist = wrist camera

日本語

SO101 ピック&プレースタスクを2カメラ(top + wrist)で学習した SmolVLA モデル(101エピソード)。

トレーニング設定

  • ベースモデル: lerobot/smolvla_base
  • データセット: naochanman/so101_pick_fixed_2cam_100ep
  • ステップ数: 20000
  • バッチサイズ: 8
  • 画像オーグメンテーション: 有効
  • rename_map でカメララベルをスワップして学習

注意事項

データセット so101_pick_fixed_2cam_100ep はカメララベル(top/wrist)が逆に記録されています。 トレーニング時に rename_map で修正済みのため、推論時は正しいカメラ割り当てで使用してください:

  • top = 上方カメラ
  • wrist = 手首カメラ
Downloads last month
55
Inference Providers NEW
This model isn't deployed by any Inference Provider. 🙋 Ask for provider support