福建120急救语音脱敏引擎 — 研究简报
业务隐私挑战
项目重点中国急救医疗中心每天处理大量 120 呼叫音频。该数据对调度质控与培训非常重要,但也包含可识别个人信息与语音生物特征,存在被重新识别风险。本研究简报为 FJ120(福建120急救中心)资助研究编制,以 VoicePrivacy 基准作为技术参考,用于准备评估与部署规划。
证据等级 基准结果 示意数据 部署估算
来源
研究说明
本仪表板指标依据 VoicePrivacy 已发布材料与相关研究,并结合中国急救医疗场景进行解释。PII 分布用于说明。EER/WER/UAR 会随方言、通话环境、模型与部署架构而变化。
最佳 EER(定向攻击者)
22–34%
VPC 2024 B5 基线(50% = 随机)
人工审核速度
3–5x RT
每小时音频对应审核工时
ASR WER(匿名化后)
4–5%
VPC 2024 B5(越低越好)
情感 UAR(原始)
~64%
IEMOCAP 四类 SER 基线
PII 实体分布
面向中国院前急救 120 通话的敏感实体示意分布,参考高密度城市调度场景建模。实际比例会随城市流程、病例结构与调度模式变化。
处理能力
用于调度质控与培训回放的吞吐量对比:人工审核(3–5 倍实时)与 GPU 辅助流水线(约 0.1 倍实时)。