决策模块¶

进行中 负责人： 任松（决策/感知全链路）· 谭文韬（仿真部署）

模块目标¶

系统的"大脑"，接收视觉感知结果与语言指令，输出机械臂动作序列。

对外承诺： 输出符合 ActionSequence 接口规范，并在 LIBERO 基准上建立可复现的成功率基线。

输入输出

消费方	数据	说明
执行模块	`ActionSequence`	动作步骤序列，含速度和力控参数

D-02：真机数据采集策略

方案 A：先用 Isaac Sim 合成数据微调 OpenVLA，再迁移真机。
方案 B：先用真机遥操作采集少量真实数据，直接微调。
两种方案的数据成本和迁移效果需要评估。

P1-05：LIBERO 基线尚不稳定

libero_spatial 评测结果存在随机性，尚未建立可复现的基线成功率。
改进方向： 固定随机种子，记录每次评测的完整配置，产出基线报告。