跳转到主要内容

风险与效用

风险与效用矩阵

在 120 场景中,隐私与效用不能孤立优化。效用可分为两层:语义效用(能否从转录文本恢复“说了什么”)和副语言效用(能否在回放音频中感知紧急程度、压力与情绪)。更强匿名化可提升来电者保护,但也要尽量保留这两类效用,支撑培训、追溯与服务改进。除声学身份外,文本风格也可能泄露身份,需要联合治理。

证据等级 基准结果 部署估算
来源

方法定位(定向攻击者)

气泡大小近似部署成熟度。横纵轴为基准映射后的隐私与效用代理指标,结合急救调度场景解读;其中效用轴更强调回放音频可用性。蜂鸣可保留转录语义,但在回放音频效用上仍会偏低。

攻击者模型(参考)

VPC 2024 定义了三种攻击者模型。首届 VoicePrivacy 攻击者挑战赛(ICASSP 2025) 进一步证实,针对性攻击系统可显著降低去标识语音的 EER。

攻击者知识水平B5 EER最佳系统
黑盒观察者不了解匿名化流水线~46%>48%
通用攻击者了解方法类别,使用现成模型~35%>42%
定向攻击者在匿名化目标域数据上重训练22–34%>40%

来源:VPC 2024 结果与 ICASSP 2025。B5 = VQ-BN 基线。Best = T10-2 系统。EER 50% = 随机猜测。

中国监管框架(2025 更新)

语音数据属于敏感个人信息。2025 年新标准进一步明确了医疗与生物特征数据的处理要求。

  • 网络数据安全管理条例(2025.1) 2025 年 1 月 1 日生效。条例强制要求对“重要数据”进行严格分级。由于规模与敏感性,大规模 120 呼叫语音可能被纳入重要数据范畴。
  • GB/T 45574-2025(2025.11) 即将实施的《敏感个人信息处理安全要求》国家标准,为医疗生物特征数据的加密、去标识化与权限控制设定了具体技术底线。
  • 医疗数据治理要求 急救呼叫涉及健康与身份信息。系统应落实分级授权、最小访问、留存策略与事件追踪能力,支撑医疗与调度流程。
  • 网络安全法(CSL) 网络安全法框架要求运营主体履行网络与数据安全责任。平台架构应支持安全运行、监测预警与应急处置。
  • 地方/机构配套规则 公立医疗与急救机构常有地方性或行业性细则。部署策略应支持按地区与机构要求叠加合规规则。

简报章节

来源:FJ120(福建120急救中心)资助研究背景、VoicePrivacy Challenge 2024、个人信息保护法(PIPL)、数据安全法(DSL)、网络安全法(CSL)。