smolvla_epi101_2cam

English

SmolVLA finetuned on SO101 pick and place with 2 cameras (101 episodes).

Training

Base model: lerobot/smolvla_base
Dataset: naochanman/so101_pick_fixed_2cam_100ep
Steps: 20000
Batch size: 8
Image augmentation: enabled
rename_map applied to swap camera labels

Note

Dataset so101_pick_fixed_2cam_100ep has camera labels (top/wrist) swapped. Training used rename_map to correct this, so inference should use correct camera assignments:

top = top camera
wrist = wrist camera

日本語

SO101 ピック＆プレースタスクを2カメラ（top + wrist）で学習した SmolVLA モデル（101エピソード）。

トレーニング設定

ベースモデル: lerobot/smolvla_base
データセット: naochanman/so101_pick_fixed_2cam_100ep
ステップ数: 20000
バッチサイズ: 8
画像オーグメンテーション: 有効
rename_map でカメララベルをスワップして学習

注意事項

データセット so101_pick_fixed_2cam_100ep はカメララベル（top/wrist）が逆に記録されています。トレーニング時に rename_map で修正済みのため、推論時は正しいカメラ割り当てで使用してください:

top = 上方カメラ
wrist = 手首カメラ

Downloads last month: 55

Inference Providers NEW

This model isn't deployed by any Inference Provider. 🙋 Ask for provider support