跳转至

决策模块

进行中负责人: 任松(决策/感知全链路)· 谭文韬(仿真部署)


模块目标

系统的"大脑",接收视觉感知结果与语言指令,输出机械臂动作序列。

对外承诺: 输出符合 ActionSequence 接口规范,并在 LIBERO 基准上建立可复现的成功率基线。


上下游接口

来源 数据 说明
感知模块 GraspTarget 夹取点坐标 + 方向
NLP 模块 InstrumentCommand 标准化器械名 + 置信度
Isaac Sim / 真实相机 RGB 图像帧 VLA 视觉输入
消费方 数据 说明
执行模块 ActionSequence 动作步骤序列,含速度和力控参数

当前状态

子功能 状态 说明
OpenVLA 环境配置 完成 RTX 4090 48GB 单卡运行
LIBERO 链路跑通 完成 libero_spatial 10 任务可评测
稳定基线建立 进行中 排查稳定性 bug,建立可复现结果
Isaac Sim 联调 待完成 等第二级仿真环境就绪
真实机械臂迁移 待完成 等 Isaac Sim 验证通过

待决策问题

D-02:真机数据采集策略

方案 A:先用 Isaac Sim 合成数据微调 OpenVLA,再迁移真机。
方案 B:先用真机遥操作采集少量真实数据,直接微调。
两种方案的数据成本和迁移效果需要评估。


已知瓶颈

P1-05:LIBERO 基线尚不稳定

libero_spatial 评测结果存在随机性,尚未建立可复现的基线成功率。
改进方向: 固定随机种子,记录每次评测的完整配置,产出基线报告。


本周行动

  • 任松:固定评测配置(随机种子、episode 数、任务列表),跑出基线报告
  • 任松:整理 OpenVLA 安装文档,保证团队可复现
  • 谭文韬:推进 Isaac Sim 与 OpenVLA 的接口对接方案设计

技术子页