引言
2016年11月7日数字隐私与个人品牌的构建,由中国保密协会隐私保护专业委员会主办数字隐私与个人品牌的构建,中国人民大学承办的“2016(首届)中国隐私保护学术会议”,在中国人民大学艺术学院音乐厅成功召开。本次会议是国内隐私保护领域的一次最重要的盛会,会议由中国人民大学孟小峰教授、信息工程研究所信息安全国家重点实验室林东岱主任担任大会主席,来自国内外的两百余人参加本次会议。
会议共邀请到佐治亚理工大学Ling Liu教授,中国人民大学孟小峰教授,阿里巴巴集团安全部技术杜跃进副总裁,中国信息通信研究院技术与标准研究所何宝宏副所长,中国科学院软件研究所丁丽萍研究员,西安交通大学桂小林教授,复旦大学周水庚教授,中国电科三十所安红章高级工程师,贵州大学彭长根教授和东南大学倪巍伟教授十位专家学者参加会议,并就大数据下的新的隐私问题、隐私模型、隐私保护技术、隐私问题的挑战等几个议题展开讨论。
隐私问题与挑战
大数据研究的前提是数据开放与共享。然而在现实情况中,大量数据处于闲置、孤岛状态,因为数据的开放和共享可能会导致隐私的泄露,很多数据拥有者或者管理者不敢或不愿开放、共享数据,导致工业界有数据、缺技术,而学术界有技术、缺数据。在这样的背景下,隐私保护被提出,其是大数据应用成功的关键。通过隐私保护技术,寻求一些使用数据的方法,既不妨碍第三方从带有敏感信息的数据集中获取信息,同时又避免隐私资料的泄露。
下面分别从各个专家学者的角度,介绍大数据下的隐私问题和挑战。
“
数据隐私的演化:概念和方法
(Ling Liu,美国佐治亚理工)
大数据时代给隐私保护技术带来极大的挑战,Ling Liu教授就大数据下的数据开放和隐私保护问题做了详细的报告。现如今,各式各样的网络媒体为数据的收集提供了便捷,然而这些数据中却蕴含了大量的个人信息,如购物模式、家庭住址、医疗信息和社交信息等。直接对这些蕴含敏感信息的数据进行分析无可避免会产生社会歧视等问题。
针对隐私保护问题,已经提出了诸如加密、访问控制九游下载、匿名化、变换和差分隐私等方法。大数据带来更加便捷的服务,然而其与数据隐私却存在着矛盾的关系。随着技术的发展,为了获取个性化的服务,或是为了发展创新,常常以牺牲隐私为代价。那么,对于其中的矛盾关系真的如此不可调和吗?Ling Liu教授提出,在大数据的背景下,我们应该着眼于探索以可用性为导向的隐私保护方法。此外,数据隐私应该包括个人和组织对数据收集、使用和分析,甚至是交易的控制权。
“
大数据治理中的隐私保护
(孟小峰·中国人民大学)
在大数据应用背景下,孟小峰教授对大数据隐私保护问题进行重新定位与思考,并试图从数据管理的角度探讨主动隐私管理技术,为大数据隐私技术提供新思路和理论依据。报告围绕以下四个方面展开讨论:
隐私问题:大数据时代的隐私源于数据融合、数据分析、数据过度收集等造成的,这与传统的隐私泄露问题有本质的不同。大数据隐私管理要服务于数据治理的需要,其本质是要保证数据的正确使用和交易。
隐私模型:在此问题背景下报告提出将隐私重新分类为显式隐私(用户自身公开的匿名的敏感信息)和隐式隐私(由第三方所搜集的用户自身并不了解的敏感信息)。有其隐私构成要素的不同提出P(U,C,A,D)模型,由此定义了A-U隐私、A-C隐私、C-U隐私、C-C隐私、U-C隐私等。
隐私技术:基于新的隐私模型,在大数据时代,报告指出隐私技术应变被动保护(Protection)为主动保护(Prevention),为此提出了Privacy-Trinity架构,包括隐私风险监测与评估、主动保护、问责技术。其中,风险监测与评估达到事前预警的目的,主动保护提供事中整体防御措施,问责技术提供事后溯源和追踪。三者三位一体,形成一个完整的主动防御体系。
隐私悖论:报告的最后提出隐私问题永远是一个开放的问题,当下所构筑的网络空间在Privacy(隐私性)、Share(共享性)、Connection(关联性)三者之间形成某种悖论。人们一方面要开放共享,互联互通,一方面又要隐私权。到底是在共享互联诱惑下“消灭”隐私权,还是在隐私前提下限制共享互联的“盛宴”,还需拭目以待。
“
浅淡DT时代的数据安全与隐私保护问题
(杜跃进·阿里巴巴)
DT时代下,因为有了数据,人们的消费、出行和生活等工作模式都随着大量的数据发生了变化。阿里巴巴集团安全部技术杜跃进副总裁从企业的视角谈了对数据安全的看法。
数据改变了人们的生产生活模式,而人们对数据安全的担心也日益增加。阿里巴巴是一家数据公司,拥有极其丰富的数据和复杂的业务场景,需要花大量精力来保证数据的安全。数据安全包含了许多内容,包括企业秘密(知识产权、原始代码)、用户个人数据等。目前中国的地下数据产业的产值达到了1000多亿人民币,已经远远超过发展了十多年的数据安全产业,所以在企业里数据安全的工作很大一部分在于与地下产业链进行对抗。
从组织架构,机制体制,技术手段和人员能力四个角度,将以上设想归纳为数据安全成熟度模型,旨在对其数字隐私与个人品牌的构建他组织或者机构制定一些政策提供指导意义,提高整个行业的数据安全水平。
“
隐私边界与数据流通信任体系构建
(何宝宏·中国信息通信研究院技术与标准研究所)
数据流通是大数据产业的重要环节,需求迫切,但中国规范的数据交易行业近年来才刚刚起步。因为缺乏有效机制,所以急需出台数据流通的合规性标准,建立审计监督制度,降低数据流通的成本。
基于此,何宝宏所长指出了隐私保护的三个关键问题。首先是匿名化问题,强调了匿名化过程不能可逆。其次,指出了长期困扰着数据流通行业从业人员和监管人员的困惑:是否需要对所有信息设定相同的隐私保护边界?基于此提出的新思路是:将数据区分为基础数据和增值数据,二者对应不同权属。第三是知情同意原则,其是个人信息权的核心,已经成为我国个人信息保护的一项重要原则。
关于数据流通信任体系的构建,其需满足以下三个要求:事前对用户关心问题作出真实承诺;事中有第三方评估监督和信息公开九游下载;事后有规范的风险损失赔偿机制。基于此,数据流通行业目前亟待统一规范的内容包括:数据的应用范围,授权的要求和流程,能够交易的数据类型和要求,交易方法,定价指导等。
“
互联网中的数字取证与隐私保护
(丁丽萍·中科院软件所)
电子取证是科学地运用提取和证明方法,对于从电子数据源提取的电子证据进行保护、收集、验证、鉴定、分析、解释、存档和出示,以有助于进一步的犯罪事件重构或者帮助识别某些与计划操作无关的非授权性活动。网络取证是电子取证的主要组成部分,其证据主要来源有通信数据流、链路设备、安全防御设备、服务器端的数据等,可以被分为Web取证、云计算取证和社交网络取证等三种典型范型。
在隐私方面,因在认定敏感信息、优先级以及信息度量的不同,对隐私的定义有很多种。欧美和香港对个人隐私的保护,从上个世纪70年代开始规范,从各个不同的层面对个人隐私进行了保护。和欧美等西方国家相比,我国在这方面的立法比较滞后,只是在民法、合同法、侵权责任法等法律中有一些零散的规定,没有一部完善的隐私保护法,目前在个人隐私保护上急需一个完善的法律体系、合理的制度设计和技术保障。
“
空间大数据发布与共享中的隐私保护
(桂小林·西安交通大学)
在移动互联网环境中,用户只需通过随身携带的移动终端即可“随时随地”的享受互联网提供的各种软件、存储、计算和位置服务。这些服务层出不穷,包括微信、博客、地图、应用商店、社交网站、移动搜索、位置服务和云盘存储等。但在已经实现的移动互联网服务站,安全和隐私问题一直令人担忧,并已经成为阻碍移动互联网普及和推广的主要因素。
基于位置的服务LBS已成为移动互联网服务的重要组成部分,然而九游平台,随着位置服务和智能设备的普及,产生了大量的空间数据,且空间数据规模呈爆炸式增长,如果将这些数据直接外包,空间数据将面临巨大的隐私安全挑战。
基于此,桂小林教授指出,针对位置服务中的用户位置和轨迹保护需要,深入开展位置服务安全与隐私保护关键问题和方法研究是必须的。通过关键技术研究,实现移动终端隐私保护和服务平台安全访问的一体化,完成一个可信的移动互联网位置服务原型系统,支持在隐私保护基础上,能够统计和分析某个时间、某个范围内的用户分布规律或统计特性,为政府、企业和研究人员提供道路规划、商业配置等方面的决策支持。
“
大数据查询处理的隐私保护
(周水庚·复旦大学)
查询处理隐私保护是大数据隐私保护的核心。大数据的价值是通过使用来实现,使用数据也就是访问数据。在查询处理隐私保护中,根据角色将数据相关者划分为数据拥有者、数据使用者和数据服务提供者。不同角色对隐私的需求不同,数据拥有者需要数据隐私和存储隐私,数据使用者需要查询隐私,数据服务提供商需要数据隐私和查询隐私。数据查询处理隐私保护所要解决的就是在支持高效、准确的查询处理的同时,保护数据隐私、查询隐私和存储隐私。
隐私保护是大数据应用的关键,而查询处理的隐私保护是大数据隐私保护的重要环节。查询处理隐私保护主要面临三方面的技术挑战:高效安全的算法、复杂查询的处理及同时保护数据、查询和存储隐私。结合现有数据管理技术、密码与信息安全技术,仍然可以找到有效的解决方案。
“
区块链隐私保护技术探讨
(安红章·中国电科三十所)
区块链技术,是指通过去中心化和去信任的方式集体维护一个单向增长可靠账本(数据库)的技术方案,通过分布式共识和密码学手段确保数据库的可信性。其中,分布式共识账本是区块链技术的价值核心。对于公共账本这一个属性,虽然对区块链来说是一个好处,但是同时存在隐私问题,因为这样就有可能泄露隐私,因此,隐私保护在区块链的领域受到重视,尤其是数字货币的领域。
就数字货币而言,比特币可以保护隐私,因为其需要用户通过多个地址配合私钥进行交易。基于这个后面就派生出了许多的货币,最近的一个就是Z-CASH,它安全性最高的一种数字货币。对于数字货币方面的隐私保护,包括四个方面:多个身份地址进行伪装;将身份在一定的范围内混淆;将身份和支付行为两方面的混淆;对交易信息进行隐藏。就监管而言,这对于在中国发展的区块链来说是非常重要的一方面。其主要分为两个方面,一个是审计的问题,第二个的话就是国家操作特权。
“
理性隐私计算探讨
(彭长根·贵州大学)
由于需要在隐私保护与可用性之间做好权衡,传统表达权衡的模型为博弈模型。基于此,彭长根教授提出对博弈模型进行风险评估。在构建博弈模型时,考虑隐私保护与分析利用的权衡,安全性与效率的权衡以及隐私获取与攻击成本的权衡。
理性隐私计算的关键问题则包括以下三个方面:首先是隐私度量,尝试模仿香农通信模型对隐私进行度量,同时考虑更复杂的度量计算:概率模型、隐私信源模型、定义隐私函数、隐私信息熵模型等;其次是博弈模型,将博弈模型引入理性隐私计算问题,博弈模型的均衡状态即为或用性与隐私保护之间的平衡;第三个则是机制设计,根据参与者的隐私偏好,定义理性参与者类型和可选行动策略。于是,理性隐私计算的内容体系可以概括为以下四个方面:理性隐私公平交换计算、理性隐私保密合作计算、理性隐私访问控制模型和理性隐私风险评估及控制模型。
“
位置隐私保护中偏好调控技术
(倪巍伟·东南大学)
近年来,位置服务中的隐私保护问题得到了研究者的持续关注,特别是近邻查询中位置隐私保护问题更是得到了广泛的研究。保护位置隐私查询是隐私保护位置服务研究的重要内容。
基于此,倪巍伟教授提出了隐私偏好(privacy preferences)的概念,用隐私偏好表示保护位置隐私近邻查询中,不同场景下,查询者对其位置保护强度、查询效率与查询准确性的个性化调控要求。例如,查询中位置保护强度、查询效率与准确性的关注次序;是否接受牺牲准确性换取查询效率提升;牺牲效率换取查询准确性或位置保护强度提升;希望获得的位置隐私保护强度的等级等。现有多数研究在隐私模型构建、高强度隐私保护机制等方面已取得显著成果,但从已有的模型和位置隐私保护机制对隐私偏好的支持方面考虑,主要存在如下问题:位置隐私模型偏好描述能力不足,位置隐私保护机制对隐私偏好支持能力不足。
总结及未来展望
大数据在当前IT业发展十分迅速,具有广阔的发展前景,但同时其所面临的隐私挑战和风险也是空前的,需要隐私保护研究者共同探求管理之道。本次隐私保护学术会议就大数据下的隐私保护问题和挑战进行探索和总结,为后续学者进行科学研究奠定了基础。当然,大数据隐私问题不仅仅是技术方面的问题,它还涉及到法律法规、监督模式、宗教等诸多方面。因此,仅从技术层面探索大数据隐私问题还是不够的,需要学术界、企业界以及政府相关部门共同努力才能实现。