NLP 模块¶

进行中 负责人： 陈端端

模块目标¶

从语音指令或文本中准确识别医疗器械名称，输出标准化结果，支撑器械递交流程触发。

对外承诺： 输出符合 InstrumentCommand 接口规范，识别置信度 ≥ 0.85。

输入输出

来源	数据	说明
麦克风 / ASR	原始文本字符串	语音转写结果
手动输入	文本字符串	GUI 输入，用于调试

消费方	数据	说明
决策模块	`InstrumentCommand`	标准化器械名 + 置信度

完整字段定义见模块接口定义。

D-03：ASR 方案选型

本地部署 Whisper streaming（低延迟，需 GPU）vs 云端 ASR（低配置要求，网络依赖）。
手术室无线网络稳定性存疑，倾向本地方案但需确认计算资源是否充足。
目标：语音指令 → 识别结果 ≤ 1s。

P1-03：ASR 延迟约 5 秒

当前语音识别延迟约 5 秒（现场测试问题 #9），手术场景中无法接受。
改进方向： 引入流式 ASR，边听边识别，目标 ≤ 1s 响应。