smolvla_epi101_2cam
English
SmolVLA finetuned on SO101 pick and place with 2 cameras (101 episodes).
Training
- Base model:
lerobot/smolvla_base - Dataset:
naochanman/so101_pick_fixed_2cam_100ep - Steps: 20000
- Batch size: 8
- Image augmentation: enabled
rename_mapapplied to swap camera labels
Note
Dataset so101_pick_fixed_2cam_100ep has camera labels (top/wrist) swapped.
Training used rename_map to correct this, so inference should use correct camera assignments:
top= top camerawrist= wrist camera
日本語
SO101 ピック&プレースタスクを2カメラ(top + wrist)で学習した SmolVLA モデル(101エピソード)。
トレーニング設定
- ベースモデル:
lerobot/smolvla_base - データセット:
naochanman/so101_pick_fixed_2cam_100ep - ステップ数: 20000
- バッチサイズ: 8
- 画像オーグメンテーション: 有効
rename_mapでカメララベルをスワップして学習
注意事項
データセット so101_pick_fixed_2cam_100ep はカメララベル(top/wrist)が逆に記録されています。
トレーニング時に rename_map で修正済みのため、推論時は正しいカメラ割り当てで使用してください:
top= 上方カメラwrist= 手首カメラ
- Downloads last month
- 55
Inference Providers NEW
This model isn't deployed by any Inference Provider. 🙋 Ask for provider support