四、面向传播控制的隐私保护方法
社交网络动态信息传播特征使得大多数已有的社交网络隐私保护技术无法有效控制信息传播效果,这给网络空间治理带来了巨大挑战。因此,有部分研究者从动态信息传播控制的角度来研究适用的隐私保护方法。Ranjbar等人提出了myCommunity的模型。该模型通过划分用户可信好友集的最大子集合来控制信息传播,只有被划分在该子集合内的好友才能访问中心用户的信息,从而尽可能降低信息被恶意用户获取的概率。Carminati等人也提出了类似的想法,通过考虑多路径的信息传播,来度量用户的隐私信息泄漏的风险。因此,从用户信息分享角度出发,通过分析用户朋友圈的信息传播态势,制定相应的访问控制策略来调控用户朋友圈对个人隐私数据的访问权限,将能够实现个性化的隐私保护策略机制。
“朋友圈”一词最早出现在微信的应用中,但是这一概念很早就在在线社交网络中普及了。它是指用户的所有好友所形成的集合。在本文中,“朋友圈”是指在一个给定标准下,用户的好友列表中具有相似属性好友所形成的社交圈(social circle)。因此,针对不同的标准,划分好友列表的方式大不相同。该类方法的总体思路是首先对用户的社交圈进行聚类划分(考虑传播因素),并将聚类结果定义为传播角色,然后选中适当的动态信息传播模型对这些角色的传播能力进行量化,最后根据用户的个人隐私保护需求,制定弹性的访问控制策略以实现管控。这三个关键环节的技术原理如下所述。
(一)朋友圈划分(角色挖掘)
朋友圈划分的角色应具有一定的代表性,这些角色不仅具备相似的属性特征和拓扑关系,还具有相似的信息传播能力或倾向。因此角色挖掘算法需要考虑社交网络节点的属性特征、拓扑结构以及传播特性。目前大多数角色挖掘算法很难实现上述要求,因此,本文提出了一种新型的角色挖掘算法RMPM,后续具体描述。
(二)角色传播能力量化
为了度量角色的传播能力,首先需要根据社交网络的实际环境,选定一种面向社交网络的信息传播模型。为了适应普遍的社交网络应用环境,一般可以采用独立级联模型。然后,依次将每个角色所代表的好友节点作为种子集,计算在这些激活种子集后信息传播的范围,并将每个角色rolei的传播范围Infi进行归一化处理,作为对应角色的传播能力值。假设当Ego Network中所有节点被同时激活时,计算得到的传播范围为Infupper,那么rolei对应的传播能力RPCi为:
(三)制定基于角色的访问控制策略
从动态传播的角度衡量用户的隐私意识,将其转化为用户对共享信息的传播范围期望度δ,δ∈[0,1]。δ越小,表明用户希望自己发布的信息在社交网络中传播范围越小。那么将δ作为信息传播范围的归一化约束值,在满足信息传播范围不超过用户隐私意识δ限定情况下,选择最优的角色赋予相应的访问权限,便能实现用户信息共享隐私意识需求。
基于上述基本原理,我们提出了一种基于朋友圈的社交网络信息分享策略机制。假定社交网络中每位用户对自己的个人数据的分享传播具有一定程度的隐私保护意识,该机制将从动态传播角度衡量用户的该种隐私保护意识需求,并基于RBAC访问控制模型,实现所提出的社交网络用户信息传播管理的框架RBAC-PIPM。RBAC-PIPM能够自动化地生成能够适当约束传播的访问控制策略,帮助用户在隐私意识的约束下可控地分享信息传播范围。RBAC-PIPM的部署实现流程如图2所示。
图2 基于角色的信息传播管理访问控制框架
该模型框架具备两个核心要点:①挖掘得到合适的角色集,并权衡其粒度以及适用性。②设计合理的授权机制以生成基于约束信息传播的访问控制策略。它基于用户好友的属性、结构、传播特性等信息,采用RMPM算法进行角色挖掘得到合适的角色集,并在指定的传播模型下度量这些角色的传播能力作为控制要素,进而在用户隐私意识需求的约束下,制定最优的访问控制策略。因此可以将RBAC-PIPM的部署实现流程分为以下四个阶段:
(1)根据选定的中心用户v,将其Ego NetworkGv=(Vv,Ev ),以及所有好友节点(u∈Vv)的相关数据(Edgeu,Attru,Egou)作为已知条件输入到框架中。
(2)采用本文提出的RMWP角色挖掘算法,对Ego NetworkGv进行划分,得到相应的角色集Social Role Set。
(3)选定适合当前社交网络环境的信息传播模型,计算所有角色的传播能力Role Propagation Capability。
(4)采用访问控制策略授权管理方法MAPM,将角色的传播能力作为控制因素,基于权限最大化原则对相应角色实现自动化的权限分配,得到基于RBAC的访问控制策略。
其中,传播角色和权限最大化原则两个关键定义如下。
传播角色:传播角色代表着这样的一组用户,他们不仅具备相似的属性特征和拓扑关系,还具有相似的信息传播能力或倾向。因此为了实现RBAC模型的角色挖掘以及权限分配,Ego NetworkGv中的每一个节点u,需要已知以下三点信息:
(1)边连接关系集合:Edgeu={edgeuw=0or1|w≠u,w,u∈Vv};
(2)属性特征集合:Attru={attrui|i∈[1,K]};
(3)邻接节点集合:Egou={w|w≠v,w∈Vu},其中Vu是节点对应的Ego NetworkGu中的节点集合。
权限最大化原则:对于中心用户发布的信息m,在满足用户隐私意识需求的情况下,理应让更多合适的好友节点拥有访问信息m的权限。
为了实现基于朋友圈的角色挖掘,我们提出了一种新的角色挖掘算法RMPM(Role Mining for Propagation Management)。该算法考虑了节点的属性特征、拓扑结构以及传播特性,因为具备相似拓扑结构、属性特征的好友节点聚合而成的角色更能代表它们之间的共性,而节点传播特性会影响对应角色传播能力。综上所述,RMPM算法设计采取了以下3个基本假设:①两个节点相互连接时,属于同一个角色的概率越大;②两个节点的属性特征相似度越高,属于同一个角色的概率越大;③两个节点的邻接节点集的重合率越高,它们的传播特性越相似,属于同一个角色的概率越大。
在基于朋友圈的信息分享策略机制中还包含所提出的一种访问控制策略授权管理方法MAPM。该方法基于权限最大化原则,设计合适的授权机制以生成适当约束传播的访问控制策略。权限最大化原则要求在满足用户的隐私意识需求的前提下,尽可能地让用户更多合适的好友拥有访问权限。因此,本文提出了一种角色评分方案,依据角色的典型属性空间(RTAS)与中心用户的属性空间(UAS)之间的加权相似度来为每个角色rolei进行评分,记为Scorei。
因此,依据权限最大化原则和角色评分规则,可将访问控制策略的授权管理问题形式化为一个最优化目标求解问题:
针对某一类信息m,使得信息m与的实际传播范围不超过用户的隐私意识约束下,让尽可能多的具有较高评分角色被授予相应的权限。该最优化目标问题是一种组合优化问题,属于NP-Complete问题,解空间为2n(n表示角色总数)。该问题不一定存在最优解,只能通过寻找近似解的方法来求解,具体解法在此不做详细介绍。
实验评估采用了SNAP提供的Facebook数据集。该数据集是用Facebook中App进行相关用户调查研究收集的,包含了用户的节点属性特征、拓扑结构以及Ego Network等。通过该数据集构建出的网络共有4 039个节点以及88 234条边,并包含了用户的Facebook“圈子”(或“朋友列表”)组成。本文在整个实验中选取了其中一个节点作为中心用户v,并得到其Ego Network(包含66个好友节点)。实验选取了朋友圈划分算法SC-Cluster、社区划分算法CESNA与本文框架中的RMPM算法进行了比较,如图3所示。
图3 实际传播范围和授权人数比例
图3中结果显示,对于用户发布的不同消息,用户共享信息的实际传播范围在相应访问控制策略约束下均没有超出阈值,证实了RBAC-PIPM的可行性。而且在几乎所有不同的用户隐私意识程度下(除δm=0.3),RMPM对应的授权人数比例高于SC Cluster和CESNA,更加符合权限最大化原则。因此,采用SC Cluster算法的最终效果比RMWP算法差很多,表明了考虑到节点传播特性的RMWP算法更适合于RBAC-PIPM应用。与此同时,CESNA算法虽然不如RMWP稳定,但总体效果较为相近,说明了该框架具有较好的适用性,能够在实际应用部署时可以根据需求选择不同的角色挖掘算法。实验结果表明,基于朋友圈的社交网络信息分享策略机制能够基于用户隐私保护意识对社交网络共享信息的传播范围进行有效控制,并且RMPM算法在角色划分粒度和基于用户隐私意识的共享信息传播管理方面具有良好的适用性。