21世纪经济报道记者 尤为 广州报道
编者按:已然来临的数字时代,数据是核心驱动要素。围绕数据的开发利用,一场新的生产与认知革命正在展开。想要了解这个时代,必须要先认识数据。南方财经全媒体·21世纪经济报道策划了数据要素市场系列报道,以期为行业和社会公众提供理解数据的敲门砖。
在监管趋严的背景下,隐私计算备受关注,被视为打开数据大规模流通、融合和交易“大门”的钥匙。作为近年来才被提出来的新技术,隐私计算目前仍处于高速发展和不断完善的阶段。
中国中文信息学会大数据安全与隐私计算专委会主任委员、研究员李凤华是国际上率先提出隐私计算(Privacy Computing)的学者,他在接受21世纪经济报道记者专访时表示,当前,国内个别机构、少数企业为了蹭“隐私计算”热度,将密码学领域学者提出的同态加密、安全多方计算等技术纳入隐私计算范畴,误导大家认为所谓的隐私计算技术存在对算力要求过高等问题,同时隐藏了这些技术只适用于局部场景的隐私保护缺陷,并没有普适性地、全生命周期地保护好隐私数据。
隐私计算是面向隐私信息全生命周期保护的计算理论和方法
21世纪:你如何定义隐私计算?
李凤华:我于2015年在国际上首次提出隐私计算(Privacy Computing),并在国内外首次正式发表于《通信学报》(2016年第4期)上,给出的隐私计算(Privacy Computing)定义是:面向隐私信息全生命周期保护的计算理论和方法,是隐私信息的所有权、管理权和使用权分离时隐私度量、隐私泄露代价、隐私保护与隐私分析复杂性的可计算模型与公理化系统。
具体是指在处理视频、音频、图像、图形、文字、数值、泛在网络行为信息流等信息时,对所涉及的隐私信息进行描述、度量、评价和融合等操作,形成一套符号化、公式化且具有量化评价标准的隐私计算理论、算法及应用技术,涵盖了全生命周期过程的所有计算操作,支持多系统融合的隐私信息保护。
隐私计算涵盖了信息搜集者、发布者和使用者在信息产生、感知、发布、传播、存储、处理、使用、销毁等全生命周期过程的所有计算操作,并包含支持海量用户、高并发、高效能隐私保护的系统设计理论与架构。
我还想强调一点,同态加密、安全多方计算等密码学领域学者提出的技术并不属于隐私计算。这些技术只适用于局部场景的隐私保护,并没有普适性地、全生命周期地保护好隐私数据;同时还误导大家,引发了所谓的隐私计算技术对算力要求过高等问题。
21世纪:数据的可复制性和可共享性等特征降低了持有方交易数据的意愿,隐私计算是否可化解该难题?
李凤华:数据的可复制性和共享性是数据交易的本质要素,数据的共享性是通过数据可用性体现出来的。也就是说购买方的数据可用性是数据交易价值的体现。而目前对数据交易的购买方后续是否按照约定去使用数据缺少技术层面的控制机制。
因此,如何在满足数据可用性的前提下保护用户隐私,即共享时如何平衡隐私保护和信息损失是隐私保护的重要挑战,隐私计算的计算框架能够有效地解决该问题。
21世纪:隐私计算具体在数据交易的哪些环节发挥作用?
李凤华:数据交易的主要环节包括数据的确权、定价、交易、清算审计等。隐私计算架构的主要环节包括隐私信息抽取、场景描述、脱敏和销毁等操作、保护方案选择、保护效果评估、侵权取证与溯源等。
数据交易环节与隐私计算环节的对应关系为:数据确权对应于隐私信息抽取;数据定价对应于场景描述、保护方案选择、保护效果评估等;数据交易对应于场景描述、脱敏和销毁操作、保护方案选择、侵权取证与溯源等;清算审计对应于场景描述、侵权取证与溯源等。
我还想强调的是,数据的一次交易不是全生命周期,数据的多次交易或者多个数据交易所之间的联动交易才是数据的全生命周期。因此,隐私计算的全生命周期保护理论与方法在数据交易中将发挥不可替代的重要作用。
有效的隐私保护是每个人从数据交易中获益的前提条件
21世纪:个人是否可以从数据交易中获益?
李凤华:在隐私得到充分保护的前提下,数据交易将更加有力地促进服务商提高现有服务的质量和效率,拓展新的业务模式。比如银行可以利用更多的用户数据提供精准的征信分析从而简化贷款流程,导航服务可以提供更为准确的实时交通路况从而规划更快的路线,这些都可以改进服务体验,增加服务商的客户数。服务商还可以从数据交易中获得其他增值收益,从而促进服务商为用户提供更多、更好、更廉价乃至免费的信息服务,从而使得所有人间接受益。
但是,如果隐私保护得不好,数据所有者会不愿意共享自身数据,缺少隐私数据将会抑制服务商业务的创新和发展,消费者享受优质、免费服务的机会也会减少。
当然,有效的隐私保护是我们每个人可以从数据交易中获益的前提条件,可实现个人与企业的双赢;否则,所有人的利益都将受损,形成个人与企业双输的局面。
21世纪:个人担心在数据交易中被泄露隐私,怎么看待这种担忧?
李凤华:数据交易的本质是数据所有权和使用权在不断的变更,数据频繁的流通会因保管不善、越权滥用、脱敏防护不够等因素导致泄露隐私。从这个角度来讲,个人担心在数据交易中被泄露隐私是很正常的,其实质是担心数据使用者越权滥用,这要依靠数据安全法、个人信息保护法的监管作为最后一道防线。
另外,隐私计算的核心目标是在减少隐私泄露风险的同时,最大限度地提升数据可用性。隐私计算的延伸控制技术能解决跨系统交换过程中数据的受控使用、迭代按需脱敏等问题,延伸控制解决得好,可以促进数据所有者愿意将其数据分享给更多的用户共享利用,分享的数量多,就能发挥更大的数据价值,还可以降低数据使用方获取数据的成本。
当然,技术和违规使用是一种攻防博弈,不采用有效技术去处理隐私数据或者违规使用隐私数据的个别企业总会存在,这需要通过网信部门的依法监管来解决。总之,我们不能因噎废食。
21世纪:强监管会退去吗?到那时隐私计算还会有发展前景吗?
李凤华:新技术的不断应用促进了网络泛在智慧互联,新的服务模式的不断涌现促进了信息广泛共享,这些推动了隐私数据的使用不断拓展,数据现已成为重要生产要素,数据价值也愈加凸显。因此,因利益冲突,隐私数据泄露的隐患永远不会消失,隐私数据共享和泄露之间的矛盾是永恒存在的,这与是否有监管无关。
隐私计算作为个人信息泛在受控共享的核心基础理论,必然会越来越成熟、越来越丰富,各类新技术、新应用的发展也将不断促进隐私计算技术的螺旋式演进。
21世纪:作为还比较新颖的技术,隐私计算还存在哪些需要完善的地方?
李凤华: 隐私计算未来需要从六个方面完善和发展:一是要研究隐私计算的基础理论,包括隐私计算模型、安全保障模型、隐私计算的数学基础等;二是隐私智能感知与动态度量,包括包含文本、图片、视频等多模态数据的隐私信息抽取与感知、适应不同场景的隐私动态度量、隐私度量的量化指标等;三是隐私保护算法,包括隐私脱敏的基本操作算法、隐私保护算法框架、隐私保护算法的保护能力量化指标等;四是隐私保护效果评估,包括效果评估指标、效果评估自动化、基于大数据隐私挖掘的隐私保护效果评估等;五是隐私侵权行为判定与溯源,包括侵权行为判定方法、隐私信息流转全过程的审计和存证机制、隐私信息流转的延伸控制机制、隐私侵权行为的追踪溯源等;六是隐私信息的完备删除,包括隐私信息传播过程中多副本的完备发现、删除指令的通知与确认,删除效果评估等。