跳转到主要内容

福建120急救语音脱敏引擎 — 研究简报

业务隐私挑战

项目重点

中国急救医疗中心每天处理大量 120 呼叫音频。该数据对调度质控与培训非常重要,但也包含可识别个人信息语音生物特征,存在被重新识别风险。本研究简报为 FJ120(福建120急救中心)资助研究编制,以 VoicePrivacy 基准作为技术参考,用于准备评估与部署规划。

证据等级 基准结果 示意数据 部署估算
来源
最佳 EER(定向攻击者)
22–34%
VPC 2024 B5 基线(50% = 随机)
人工审核速度
3–5x RT
每小时音频对应审核工时
ASR WER(匿名化后)
4–5%
VPC 2024 B5(越低越好)
情感 UAR(原始)
~64%
IEMOCAP 四类 SER 基线

PII 实体分布

面向中国院前急救 120 通话的敏感实体示意分布,参考高密度城市调度场景建模。实际比例会随城市流程、病例结构与调度模式变化。

处理能力

用于调度质控与培训回放的吞吐量对比:人工审核(3–5 倍实时)与 GPU 辅助流水线(约 0.1 倍实时)。

简报章节

来源:FJ120(福建120急救中心)资助研究背景、VoicePrivacy Challenge 2024、个人信息保护法(PIPL)、数据安全法(DSL)、网络安全法(CSL)。