CN112632328A - 一种vlog隐私泄漏度量评估方法、系统、介质及应用 - Google Patents

一种vlog隐私泄漏度量评估方法、系统、介质及应用 Download PDF

Info

Publication number
CN112632328A
CN112632328A CN202011419067.0A CN202011419067A CN112632328A CN 112632328 A CN112632328 A CN 112632328A CN 202011419067 A CN202011419067 A CN 202011419067A CN 112632328 A CN112632328 A CN 112632328A
Authority
CN
China
Prior art keywords
privacy
vlog
leakage
information
creator
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011419067.0A
Other languages
English (en)
Other versions
CN112632328B (zh
Inventor
裴庆祺
宋西斐
尹洁
冯杰
马立川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Xidian University
Original Assignee
Xidian University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Xidian University filed Critical Xidian University
Priority to CN202011419067.0A priority Critical patent/CN112632328B/zh
Publication of CN112632328A publication Critical patent/CN112632328A/zh
Application granted granted Critical
Publication of CN112632328B publication Critical patent/CN112632328B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/62Protecting access to data via a platform, e.g. using keys or access control rules
    • G06F21/6218Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
    • G06F21/6245Protecting personal data, e.g. for financial or medical purposes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/75Clustering; Classification

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Bioethics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Databases & Information Systems (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Computer Security & Cryptography (AREA)
  • Computer Hardware Design (AREA)
  • Multimedia (AREA)
  • Data Mining & Analysis (AREA)
  • Storage Device Security (AREA)

Abstract

本发明属于信息安全技术领域,公开了一种vlog隐私泄漏度量评估方法、系统、介质及应用,按照创作者个性化需求设置不同隐私属性的敏感度;检测创作者新旧两组vlog中涉及泄漏隐私属性的具体语义信息,计算分析vlog发布前后隐私属性泄漏的概率和隐私信息泄漏值;给出创作者隐私泄漏评估报告。本发明能够使创作者明确,在发布新制作的vlog后,隐私属性的具体泄漏情况;设置了隐私属性的敏感度,对创作者隐私泄漏进行评估时,越不敏感的隐私属性,评估值越小,满足了创作者的个性化需求;引入评估分析报告,帮助创作者快速定位高敏感度隐私属性泄露情况,方便创作者对vlog视频进行修改或重新剪辑,可以减轻创作者部分工作量。

Description

一种vlog隐私泄漏度量评估方法、系统、介质及应用
技术领域
本发明属于信息安全技术领域,尤其涉及一种vlog隐私泄漏度量评估方法、系统、介质及应用。
背景技术
目前,伴随着移动智能终端的普及、新媒体的快速发展、社交平台短视频的风靡,当下的年轻一代越来越喜欢使用简易拍摄设配,用自编自导的方式将自己的生活点滴记录下来,分享在新媒体平台上,作为个性化的生活日记,这种记录方式被称为vlog。vlog是video blog的缩写,是一种新形式的网络日志,指创作者以自己为主角纪录、拍摄的一种集字幕、图像、音频和特效于一体的视频日记,能个性化的表达创作者的日常生活。记录日常生活是vlog的产品特性,创作者在进行拍摄时,将周围的景色和身边的朋友剪进作品中,这无形中就暴露了自己的地理位置,现实社交的朋友圈,日常的行为习惯等。这些信息在网络上经过放大后,创作者的人身安全就存在了隐患。虽然,各视频平台对创作者的视频早就建立了较为完备的审查机制,但大都是基于平台方本身的诉求建立而成的。受限于审核压力,视频平台方通常视频平台会对视频内容是否侵权以及是否符合规范进行审查,而不关心用户是否无意泄漏了自身的的隐私信息。此外,这些视频平台往往会构建一种弱关系社交。这种弱关系社区像是一个公开的舞台,用户可以肆无忌惮地展示自己,而不用担心被周遭的亲友熟知,这无疑大大增加了隐私泄漏的风险系数。
通过上述分析,现有技术存在的问题及缺陷为:
(1)vlog记录生活的产品特性天然会导致创作者泄漏部分隐私,这些隐私信息在网络上放大后,创作者的人身安全存在隐患。
(2)视频平台方受限于审核能力和自身诉求,更重视频内容是否构成侵权,是否合乎规范,而不关心创作者是否泄漏了隐私,这是问题的关键所在。
解决以上问题及缺陷的难度为:
针对视频创作者的隐私需求,设计一种检测视频隐私信息泄漏的方法较为困难;为减小视频平台方的审核压力,设计一套自动检测视频隐私泄漏并给评估报告的系统或应用较为困难。
解决以上问题及缺陷的意义为:
可以针对视频创作者个性化的隐私需求,实现隐私信息泄漏的准确评估;自动检测并给出评估报告的系统或应用,使得平台方在充分关注保护视频创作者隐私的情况下,而不会过分的增加原先审核机构的压力,实现了创作者隐私的良性保护。
发明内容
针对现有技术存在的问题,本发明提供了一种vlog隐私泄漏度量评估方法、系统、介质及应用。
本发明是这样实现的,一种vlog隐私泄漏度量评估方法,所述vlog隐私泄漏度量评估方法如下,具体包括三个步骤:
步骤一、按照创作者个性化需求设置不同隐私属性的敏感度;
步骤二、检测创作者新旧两组vlog中涉及泄漏隐私属性的具体语义信息,计算分析vlog发布前后隐私属性泄漏的概率和隐私信息泄漏值;
步骤三、给出创作者隐私泄漏评估报告。
步骤一中,所述创作者的隐私属性可以是唯一标识符,也可以是准标识符,本方法不做数量上的的限制、具体可以包括姓名、身份证号、人脸信息、家庭住址等信息,由于不同类型的创作者对不同隐私属性的敏感度是不同的,比如经常本人上镜的视频创作者对人脸信息的泄漏就不太敏感,而从不上镜的视频创作者显然对人脸信息较为敏感,为实现广大创作者不同的隐私诉求,步骤一是有必要的;
步骤一中,所述创作者使用[0,1]之间的浮点数(包括0和1,共11级别)对不同的隐私属性进行评价,所述创作者可以通过输入数字或滑动刻度的方式为不同的隐私属性设置敏感度级别。
步骤二中、所述检测方法是为了提取视频中涉及创作者隐私属性的语义事件,便于分析隐私属性的泄漏情况,对视频进行高效语义检测的具体流程包括:
第一步,对vlog的结构进行分析,切割提取出关键场景、镜头和帧;
第二步,对关键帧内的对象或行为进行识别,对关键帧进行标注;
第三步,对vlog的文本或字幕进行聚类分析,获得字幕信息标注;
第四步,在时域空间下,结合关键帧标注和字幕标注,提炼成视频语义信息;
第五步,根据目标系统提供的隐私信息将语义信息进行聚类。
步骤二中,所述检测方法需要对两组vlog进行检测,已发布的vlog组成旧vlog组,新制作未发布的vlog组成新vlog组。
步骤二中,所述分析方法是为了分析出每一个检测得到的语义事件对隐私属性的影响,具体方法是:使用集合与概率的方法来描述语义事件对隐私属性的泄漏情况,对同一隐私属性对应的事件进行关联分析,从恶意攻击者的角度,最大程度的挖掘创作者的隐私信息;
步骤二中,所述计算方法是为了计算出每一个隐私属性泄漏的信息值,具体方法是:使用概率和信息熵的方法对vlog视频的泄漏隐私信息进行描述,并通过分析vlog发布前后信息量的变化来准确描述创作者发布vlog后的隐私泄漏值。
步骤三中,根据步骤二得到的单纯的数值评估并不能清楚地让用户明白隐私数据的具体泄漏情况,应为创作者提供意义明确的评估报告,具体方法是:根据步骤二得到隐私泄漏值,结合隐私属性对应的视频语义信息和关键视频画面,给创作者一个评估分析报告。
本发明的另一目的在于提供一种计算机设备,所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行如下步骤:
按照创作者个性化需求设置不同隐私属性的敏感度;
检测创作者新旧两组vlog中涉及泄漏隐私属性的具体语义信息,计算分析vlog发布前后隐私属性泄漏的概率和隐私信息泄漏值;
给出创作者隐私泄漏评估报告。
本发明的另一目的在于提供一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行如下步骤:
按照创作者个性化需求设置不同隐私属性的敏感度;
检测创作者新旧两组vlog中涉及泄漏隐私属性的具体语义信息,计算分析vlog发布前后隐私属性泄漏的概率和隐私信息泄漏值;
给出创作者隐私泄漏评估报告。
本发明的另一目的在于提供一种新媒体信息数据处理终端,所述新媒体信息数据处理终端用于实现所述的vlog隐私泄漏度量评估方法。
本发明的另一目的在于提供一种实施所述vlog隐私泄漏度量评估方法的vlog隐私泄漏度量评估系统,所述vlog隐私泄漏度量评估系统包括:
敏感度设置模块,用于创作者设置隐私属性的敏感度;
视频检测模块,用于检测创作者vlog中涉及隐私属性的视频语义事件;
计算分析模块,用于分析每一个语义事件对隐私属性的具体影响,以及计算隐私属性对应的事件集合较创作者之前发布vlog的隐私信息泄漏值;
隐私评估模块,用于生成创作者个性化的隐私信息泄漏评估报告。
结合上述的所有技术方案,本发明所具备的优点及积极效果为:本发明视频检测装置预先使用视频镜头边界检测技术对vlog进行切割,不仅有利于场景识别还可以消除部分冗余信息;视频检测装置通过引入时域空间的概念,弥补了传统单帧图像信息不足的问题,通过融合视频的场景标注和字幕标注,提炼出更高维度语义信息。视频检测装置将检测得到的视频语义事件与创作者的隐私属性关联聚类,便于后面步骤的计算分析;计算分析装置利用预先定义好的方法对泄漏隐私属性的视频语义信息进行评估;对于可直接识别出个体信息的隐私属性,如身份证号,护照号等,若发生泄漏事件,则隐私属性泄漏概率为1;对于无法直接识别出个体信息的隐私泄漏事件,则对应的隐私属性泄漏概率被量化为0到1之间;计算分析装置根据创作者预先设定好的敏感度参数,计算出vlog发布后每一种敏感元素对应的隐私泄漏值,满足创作者个性化需求;隐私评估装置不单独给出具体的隐私泄漏值,结合视频语义信息给创作者一个清晰明了的评估分析报告。
目前视频平台对视频的审核方法通常有两种,即人工审核与机器审核,表1为本发明与这两种方法之间的对比。
表1三种方法的对比
人工审核 机器审核 隐私审核
审查内容 细致全面 宽泛全面 细致单一
响应速度 较慢 一般 较快
成本 较高 较低 较低
如表1所述,人工审核方式审查内容细致全面,针对版权问题、宗教问题、色情问题等都有不同的审核员进行审查,因此人工审核方式响应速度较为缓慢,成本高昂;机器审核方式亦可针对不同问题进行审查,但人工智能技术仍在发展,故筛选结果较为宽泛,响应速度一般,成本较低;本发明提出的是视频隐私检测方法,与前两者对比显然审核角度较为单一,但也因此响应时间较快,成本较低。
本发明提出的方案不对隐私属性的类型有要求,隐私属性可以是唯一标识符,也可以是准标识符,并且对数目不做限制,它们都可以采用同一套隐私泄漏量化方法。本发明提出的方案以vlog为主进行分析,是因为vlog创作者泄漏隐私风险的概率较高,对于其他的短视频或长视频平台,本发明仍可实现对创作者隐私属性泄漏情况的评估。
本发明提出的方案对视频语义检测分析过程存在依赖性,只有实现了视频语义信息的检测,才能基于此计算隐私属性泄漏的具体情况。本发明检测了vlog中泄漏隐私信息的语义信息事件,依据对语义事件的分析结果,使用简单的计算获取vlog泄漏的隐私信息,隐私信息泄漏值越高,表明vlog中较先前发布的视频泄漏的隐私信息越多,越需要创作者进行调整和修改。
本发明提出的vlog视频隐私泄漏度量评估方法,满足了创作者的个性化需求,对应创作者不敏感的隐私属性,也会在隐私泄漏评估中表现出来,越不敏感,评估值越小。本发明创作者在发布vlog时会收到采用本方法或设备的系统发出的提醒,该提醒为报告形式,详细地说明了可能发生的隐私信息泄漏情况,从未能让创作者们采取相关措施以避免隐私泄漏而带来的负面影响。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例中所需要使用的附图做简单的介绍,显而易见地,下面所描述的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的vlog隐私泄漏度量评估方法流程图。
图2是本发明实施例提供的vlog隐私泄漏度量评估系统的结构示意图;
图2中:1、敏感度设置模块;2、视频检测模块;3、计算分析模块;4、隐私评估模块。
图3是本发明实施例提供的视频检测装置工作过程的流程图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
针对现有技术存在的问题,本发明提供了一种vlog隐私泄漏度量评估方法、系统、介质及应用,下面结合附图对本发明作详细的描述。
如图1所示,本发明提供的vlog隐私泄漏度量评估方法包括以下步骤:
S101:创作者按照个性化需求设置不同隐私属性的敏感度;
S102:检测创作者新旧两组vlog中涉及泄漏隐私属性的具体语义信息,计算分析vlog发布前后隐私属性泄漏的概率和隐私泄漏值;
S103:给出创作者隐私泄漏评估报告。
本发明提供的vlog隐私泄漏度量评估方法业内的普通技术人员还可以采用其他的步骤实施,图1的本发明提供的vlog隐私泄漏度量评估方法仅仅是一个具体实施例而已。
如图2所示,本发明提供的vlog隐私泄漏度量评估系统包括:
敏感度设置模块1,用于创作者设置隐私属性的敏感度;
视频检测模块2,用于检测创作者vlog中涉及隐私属性的视频语义事件;
计算分析模块3,用于分析每一个语义事件对隐私属性的具体影响,以及计算隐私属性对应的事件集合较创作者之前发布vlog的隐私信息泄漏值;
隐私评估模块4,用于生成创作者个性化的隐私信息泄漏评估报告。
在本发明的实施例中:敏感度设置装置1,用于创作者设置隐私属性的敏感度;在实施例中,目标系统可根据不同的业务需求对敏感度设置装置1中隐私属性进行补充或删减;创作者可以通过输入数字或滑动刻度的方式为不同的隐私属性设置敏感度级别,敏感度级别具体划分为0-1共11级。
在本发明的实施例中:视频检测装置2,用于检测创作者vlog中涉及隐私属性的视频语义事件;在实施例中,视频检测装置2的具体工作流程图如图3所示:视频检测装置2首先对输入的vlog视频进行结构分析,使用视频镜头边界检测技术对vlog进行切割,切割提取出关键的场景、镜头和帧;随后,视频检测装置2会对vlog的关键帧和字幕文本进行检测分析,获得关键帧和字幕文本的标注信息;在时域空间下,融合vlog的关键帧和字幕标注信息,提炼出更高维度语义信息;最后将语义信息与隐私属性相关联,进行聚类分析,输送到下一装置。
在本发明的实施例中:计算分析装置3,用于分析每一个语义事件对隐私属性的具体影响,以及计算隐私属性对应的事件集合较创作者之前发布vlog的隐私信息泄漏值;计算分析装置3能利用概率和信息论的方法对泄漏隐私属性的视频语义信息进行分析评估;其中,对于可直接识别出个体信息的隐私属性,如身份证号,护照号等,若发生泄漏事件,则隐私属性泄漏概率为1;对于无法直接识别出个体信息的隐私泄漏事件,则对应的隐私属性泄漏概率被量化为0到1之间;随后,计算分析装置3可根据概率分析的结果计算出隐私信息泄漏值;结合创作者的敏感度参数设置,输出满足创作者个性化需求的隐私泄漏评估。
在本发明的实施例中:隐私评估装置4,用于生成创作者个性化的隐私信息泄漏评估报告;隐私评估装置4,除了给出计算分析装置3计算的具体的隐私泄漏值外,还结合获得的视频语义信息给创作者一个清晰明了的评估分析。
下面结合附图对本发明的技术方案作进一步的描述。
在本发明实施例中,vlog的隐私泄漏量化的整体流程如图1所示。本实施例提供了一种度量vlog视频隐私泄漏的方法,具体包括以下步骤:
步骤一,按照创作者个性化需求设置不同隐私属性的敏感度;
在本发明实施例中,创作者可以使用装置1进行隐私属性的敏感度设置,敏感度的参数范围设置在[0,1],创作者使用0到1之间的浮点数(包括0和1)进行敏感度评价。
以用户A为例,选择姓名、身份证号、人脸信息、家庭住址、手机号码、银行卡号作为隐私属性进行说明,平台系统可根据实际需求增删隐私属性。
用户A关于前述隐私属性敏感度设置的具体参数如表2所示。
表2用户A的敏感度设置情况
Figure BDA0002821445520000091
步骤二,检测创作者新旧两组vlog中涉及泄漏隐私属性的具体语义信息,计算分析vlog发布前后隐私属性泄漏的概率和隐私泄漏值;
在本发明实施中,创作者可以使用视频检测装置2对创作的vlog进行隐私检测。
用户A将制作完毕的vlog作为装置2的输入,装置2对输入的vlog进行检测,分析视频的语义信息,并根据隐私属性对语义信息进行筛选分类,输入可能泄漏各隐私属性的语义事件集合,具体的步骤如下:
第一步,根据隐私属性,设定与之关联的关键词信息,着重利用关键词信息进行视频语义检测;
例如,对“姓名”进行检测时,就需要将姓氏、人称代词等设置为关键信息,便于在字幕中进行检索;对身份证号、手机号、银行卡等信息进行检测时,就要特别关注字幕以及画面中的数字信息;对“住址”进行检测时,除了需要关注字幕中的地名,还要对视频中关键的建筑、风景画面进行结合分析。
第二步,将视频语义信息按照与隐私属性的对应关系组成集合;
以用户A为例,其创作的vlog中涉及隐私属性的视频语义信息集合可以为:
假设用户A是一个数码类vlog视频制作者,使用集合C代表创作者之前创作的vlog涉及隐私属性的视频语义信息集合,则有:
Figure BDA0002821445520000092
Cface={{若干拍摄创作者的截图,其中图片语义标注均为创作者帐号名}};
Caddress={{创作者在小米之家拍摄介绍新款手机},{创作者在工作室拍摄介绍三星手机},{创作者在苹果手机直营店介绍新品手机}};
假设用户A新制作了一期vlog,在新vlog中,用户A采用第一人称的镜头拍摄,并且不小心拍摄到店铺柜台名片和部分身份证的镜头,使用集合
Figure BDA0002821445520000103
表示新vlog发布后所有涉及隐私属性的视频语义信息集合,则有:
Figure BDA0002821445520000101
新vlog中没有标注用户A的创作者账号名,本期vlog用户A没有泄漏人脸信息,但结合之前发布的vlog,则有:
Figure BDA0002821445520000104
Caddress={{创作者在小米之家拍摄介绍新款手机},{创作者在工作室拍摄介绍三星手机},{创作在苹果手机直营店介绍新品手机},{创作者在华为体验店体验新品手机,店铺号码为0571-28008877}};
在本发明实施例中,目标系统使用装置3来分析各隐私属性对应的事件集合,确定每一个语义事件元素对创作者隐私属性的影响,并计算出vlog发布后创作者隐私的泄漏情况。
以用户A为例,具体的分析计算分布步骤如下:
第三步,分析新vlog发布前隐私属性的泄漏概率p;
基于前述,用户A的姓名、身份证号、手机号码、银行卡号包含的语义信息均为空集。对于姓名而言,我国有十四亿人口,以数量级进行粗略计算可知,此时姓名用户A的泄漏的概率为十亿分之一;类似的,用户A的身份证号泄漏的概率也可以粗略地视为十亿分之一;对于手机号码而言:我国手机号码为11位,但前两位有固定的字段,如13、15、17、18等,如此计算下来,共有数十亿种可能,故用户A电话号码泄漏的概率也可以粗略地视为十亿分之一;对于银行卡号而言,2020年银行卡累计发卡量达85亿以上,故用户A银行卡号泄漏的概率可以粗略地视为八十亿分之一即:
Figure BDA0002821445520000102
基于前述,用户A的人脸信息对应的语义事件集合包括多张用户A的照片,显然用户A的人脸信息已经泄漏,故:
pface=1;
基于前述,用户A的位置信息的语义信息集合包含三个元素:
根据元素{创作者在小米之家拍摄介绍新款手机}推理,截至vlog的发布日期(假设具体为2020年11月20日),小米之家已在全国两百个多市区内开设,便于计算按200计算,则该元素导致用户A泄漏住址的概率为
Figure BDA0002821445520000111
根据元素{创作者在工作室拍摄介绍三星手机}推理,无法得知用户A的家庭住址信息;
根据元素{创作者在苹果手机直营店介绍新品手机}推理,易知苹果直营店所在市区有上海市、昆明市、北京市、成都市、天津市、济南市、青岛市、广州市、深圳市、南宁市、南京市、无锡市、苏州市、郑州市、宁波市、杭州市、厦门市、福州市、大连市、沈阳市、重庆市共21个市区,这里假设用户A考虑离住址近的零售店,由此便可推断该元素导致用户A住址泄漏的概率为
Figure BDA0002821445520000112
结合三个元素的分析结果,易知苹果直营店所在市区都有小米之家,故用户A的住址信息空间为上述21个城市的集合,其泄漏的概率为:
Figure BDA0002821445520000113
第四步,分析新vlog发布后隐私属性的泄漏概率
Figure BDA0002821445520000116
基于前述,用户A的姓名已经泄漏,故:
Figure BDA0002821445520000114
基于前述,用户A的人脸信息、身份证号、银行卡号对应的集合均没有改变,故这些隐私属性泄漏的概率为:
Figure BDA0002821445520000115
基于前述,用户A的电话号码在vlog发布后增加了新的号码0571-28008877,经查询,该号码为华为智能生活馆的联系方式,与用户A的电话号码无关,故用户A的电话号码泄漏的概率仍为:
Figure BDA0002821445520000121
基于前述,用户A的住址信息在vlog发布后增加新的元素,{创作者在华为体验店体验新品手机,店铺号码为0571-28008877},易知该体验店为杭州黄龙万科华为智能生活馆,故用户A住址信息泄漏的概率为:
Figure BDA0002821445520000122
第五步,计算新vlog发布后隐私信息泄漏值。
基于前述,已经知道每一个隐私属性在新发布vlog后泄漏的概率,使用vlog发布前后隐私属性信息量的变化作为隐私信息泄漏值。符号xi对应的概率为p(xi),则定义隐私属性的信息量为:
I=-log10p(xi);
由此可知,在vlog发布前,用户A隐私属性的信息量为Ibefore,其中矩阵的列与隐私属性相对应:
Ibefore=[9 9 0 1.32 9 9.90];
发布vlog后,用户A隐私属性的信息量为Iafter
Iafter=[0 9 0 0 9 9.90];
基于前述,用户A在发布vlog后隐私信息泄漏情况为S:
S=[9 0 0 1.32 0 0];
每个创作者对不同的隐私属性有不同的敏感度,按照其设置的敏感度参数,即可生成满足创作者需求的隐私泄漏评估,用户A的敏感度参数设置矩阵W=[0.8 1 0 0.3 0.90.6],则有:
SUserA=W*S
=[0.8 1 0 0.3 0.9 0.6]*[9 0 0 1.32 0 0]
=[7.2 0 0 0.40 0 0]
步骤三,给出创作者隐私泄漏评估报告。
隐私评估装置4应结合视频语义信息给出说明报告,以便用户查看,具体如下:
隐私信息泄漏情况如表2所示,具体分析如下:
Figure BDA0002821445520000131
①姓名:检测到vlog关键帧——部分身份证(给出图片),较上次完全泄漏;
②身份证号:未检测到相关信息,较上次没有泄漏;
③人脸信息:用户不关心,未检测到人脸信息,较上次没有泄漏;
④家庭住址:检测到vlog关键帧——店铺柜台名片,推测用户居住在杭州市,较上次泄漏严重;
⑤手机号码:未检测到相关信息,较上次没有泄漏;
⑥银行卡号:未检测到相关信息,较上次没有泄漏。
本发明的示例性实施方法的至少一些方面可以由一个或多个计算机或其他设备用计算机可执行指令(例如一个或多个程序模块)来实现,这些计算机可执行指令可以存储在计算机可读媒介上。本领域的技术人员可以认识到,程序模块的功能可以根据需要在各个实施方式中合并或分开。另外,前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质;前述程序模块可以在固件或硬件等效物中作为整体或部分实现,例如集成电路、现场可编程逻辑门阵列(FPGA)等。
应当注意,本发明的实施方式可以通过硬件、软件或者软件和硬件的结合来实现。硬件部分可以利用专用逻辑来实现;软件部分可以存储在存储器中,由适当的指令执行系统,例如微处理器或者专用设计硬件来执行。本领域的普通技术人员可以理解上述的设备和方法可以使用计算机可执行指令和/或包含在处理器控制代码中来实现,例如在诸如磁盘、CD或DVD-ROM的载体介质、诸如只读存储器(固件)的可编程的存储器或者诸如光学或电子信号载体的数据载体上提供了这样的代码。本发明的设备及其模块可以由诸如超大规模集成电路或门阵列、诸如逻辑芯片、晶体管等的半导体、或者诸如现场可编程门阵列、可编程逻辑设备等的可编程硬件设备的硬件电路实现,也可以用由各种类型的处理器执行的软件实现,也可以由上述硬件电路和软件的结合例如固件来实现。
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,都应涵盖在本发明的保护范围之内。

Claims (10)

1.一种vlog隐私泄漏度量评估方法,其特征在于,所述vlog隐私泄漏度量评估方法包括:
步骤一、按照创作者个性化需求设置不同隐私属性的敏感度;
步骤二、检测创作者新旧两组vlog中涉及泄漏隐私属性的具体语义信息,计算分析vlog发布前后隐私属性泄漏的概率和隐私信息泄漏值;
步骤三、给出创作者隐私泄漏评估报告。
2.如权利要求1所述的vlog隐私泄漏度量评估方法,其特征在于,所述创作者的隐私属性可以是唯一标识符,也可以是准标识符,不做数量上的的限制、具体可以包括姓名、身份证号、人脸信息、家庭住址信息。
3.如权利要求1所述的vlog隐私泄漏度量评估方法,其特征在于,所述创作者使用[0,1]之间的浮点数(包括0和1,共11级别)对不同的隐私属性进行评价,所述创作者可以通过输入数字或滑动刻度的方式为不同的隐私属性设置敏感度级别。
4.如权利要求1所述的vlog隐私泄漏度量评估方法,其特征在于,所述检测方法需要对两组vlog进行检测,已发布的vlog组成旧vlog组,新制作未发布的vlog组成新vlog组,对视频进行高效语义检测的具体流程包括:
第一步,对vlog的结构进行分析,切割提取出关键场景、镜头和帧;
第二步,对关键帧内的对象或行为进行识别,对关键帧进行标注;
第三步,对vlog的文本或字幕进行聚类分析,获得字幕信息标注;
第四步,在时域空间下,结合关键帧标注和字幕标注,提炼成视频语义信息;
第五步,根据目标系统提供的隐私信息将语义信息进行聚类。
5.如权利要求1所述的vlog隐私泄漏度量评估方法,其特征在于,所述分析方法使用集合与概率的方法来描述语义事件对隐私属性的泄漏情况,对同一隐私属性对应的事件进行关联分析,从恶意攻击者的角度,最大程度的挖掘创作者的隐私信息;所述计算方法使用概率和信息熵的方法对vlog视频的泄漏隐私信息进行描述,并通过分析vlog发布前后信息量的变化来准确描述创作者发布vlog后的隐私泄漏值。
6.如权利要求1所述的vlog隐私泄漏度量评估方法,其特征在于,所述评估方法根据步骤二得到隐私泄漏值,结合隐私属性对应的视频语义信息和关键视频画面,给创作者一个评估分析报告。
7.一种计算机设备,其特征在于,所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行如下步骤:
按照创作者个性化需求设置不同隐私属性的敏感度;
检测创作者新旧两组vlog中涉及泄漏隐私属性的具体语义信息,计算分析vlog发布前后隐私属性泄漏的概率和隐私信息泄漏值;
给出创作者隐私泄漏评估报告。
8.一种计算机可读存储介质,存储有计算机程序,所述计算机程序被处理器执行时,使得所述处理器执行如下步骤:
按照创作者个性化需求设置不同隐私属性的敏感度;
检测创作者新旧两组vlog中涉及泄漏隐私属性的具体语义信息,计算分析vlog发布前后隐私属性泄漏的概率和隐私信息泄漏值;
给出创作者隐私泄漏评估报告。
9.一种新媒体信息数据处理终端,其特征在于,所述新媒体信息数据处理终端用于实现权利要求1~6任意一项所述的vlog隐私泄漏度量评估方法。
10.一种实施权利要求1~6任意一项所述vlog隐私泄漏度量评估方法的vlog隐私泄漏度量评估系统,其特征在于,所述vlog隐私泄漏度量评估系统包括:
敏感度设置模块,用于创作者设置隐私属性的敏感度;
视频检测模块,用于检测创作者vlog中涉及隐私属性的视频语义事件;
计算分析模块,用于分析每一个语义事件对隐私属性的具体影响,以及计算隐私属性对应的事件集合较创作者之前发布vlog的隐私信息泄漏值;
隐私评估模块,用于生成创作者个性化的隐私信息泄漏评估报告。
CN202011419067.0A 2020-12-07 2020-12-07 一种vlog隐私泄漏度量评估方法、系统、介质及应用 Active CN112632328B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011419067.0A CN112632328B (zh) 2020-12-07 2020-12-07 一种vlog隐私泄漏度量评估方法、系统、介质及应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011419067.0A CN112632328B (zh) 2020-12-07 2020-12-07 一种vlog隐私泄漏度量评估方法、系统、介质及应用

Publications (2)

Publication Number Publication Date
CN112632328A true CN112632328A (zh) 2021-04-09
CN112632328B CN112632328B (zh) 2022-12-02

Family

ID=75308891

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011419067.0A Active CN112632328B (zh) 2020-12-07 2020-12-07 一种vlog隐私泄漏度量评估方法、系统、介质及应用

Country Status (1)

Country Link
CN (1) CN112632328B (zh)

Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009127771A1 (en) * 2008-04-16 2009-10-22 Nokia Corporation Privacy management of data
US20160112451A1 (en) * 2014-10-21 2016-04-21 Proofpoint, Inc. Systems and methods for application security analysis
CN109145603A (zh) * 2018-07-09 2019-01-04 四川大学 一种基于信息流的Android隐私泄露行为检测方法和技术
CN109492435A (zh) * 2019-01-10 2019-03-19 贵州财经大学 基于数据开放共享的隐私泄露风险评估方法、装置及系统
CN110175327A (zh) * 2019-05-11 2019-08-27 复旦大学 一种基于隐私信息检测的数据隐私性量化评估方法
CN110210244A (zh) * 2019-05-10 2019-09-06 中国科学院计算技术研究所 检测社交媒体用户隐私泄露的方法和系统
CN110225308A (zh) * 2019-06-18 2019-09-10 中国科学技术大学 一种对家庭视频安防系统的隐私保护方法
CN110298176A (zh) * 2018-10-25 2019-10-01 贵州财经大学 智能终端App权限隐私风险监测与评估系统及方法
CN110378146A (zh) * 2019-07-08 2019-10-25 云南财经大学 云服务环境下基于模糊理论的医疗大数据隐私保护方法
CN110414222A (zh) * 2019-06-18 2019-11-05 北京邮电大学 一种基于组件关联的应用隐私泄露问题检测方法和装置
CN110955912A (zh) * 2019-10-29 2020-04-03 平安科技(深圳)有限公司 基于图像识别的隐私保护方法、装置、设备及其存储介质
CN110992957A (zh) * 2019-11-15 2020-04-10 东华大学 基于隐私保护的语音数据处理方法
CN111860434A (zh) * 2020-07-31 2020-10-30 贵州大学 机器人视觉隐私行为识别与保护方法

Patent Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009127771A1 (en) * 2008-04-16 2009-10-22 Nokia Corporation Privacy management of data
US20160112451A1 (en) * 2014-10-21 2016-04-21 Proofpoint, Inc. Systems and methods for application security analysis
CN109145603A (zh) * 2018-07-09 2019-01-04 四川大学 一种基于信息流的Android隐私泄露行为检测方法和技术
CN110298176A (zh) * 2018-10-25 2019-10-01 贵州财经大学 智能终端App权限隐私风险监测与评估系统及方法
CN109492435A (zh) * 2019-01-10 2019-03-19 贵州财经大学 基于数据开放共享的隐私泄露风险评估方法、装置及系统
CN110210244A (zh) * 2019-05-10 2019-09-06 中国科学院计算技术研究所 检测社交媒体用户隐私泄露的方法和系统
CN110175327A (zh) * 2019-05-11 2019-08-27 复旦大学 一种基于隐私信息检测的数据隐私性量化评估方法
CN110225308A (zh) * 2019-06-18 2019-09-10 中国科学技术大学 一种对家庭视频安防系统的隐私保护方法
CN110414222A (zh) * 2019-06-18 2019-11-05 北京邮电大学 一种基于组件关联的应用隐私泄露问题检测方法和装置
CN110378146A (zh) * 2019-07-08 2019-10-25 云南财经大学 云服务环境下基于模糊理论的医疗大数据隐私保护方法
CN110955912A (zh) * 2019-10-29 2020-04-03 平安科技(深圳)有限公司 基于图像识别的隐私保护方法、装置、设备及其存储介质
CN110992957A (zh) * 2019-11-15 2020-04-10 东华大学 基于隐私保护的语音数据处理方法
CN111860434A (zh) * 2020-07-31 2020-10-30 贵州大学 机器人视觉隐私行为识别与保护方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
SAMET TONYALI: "Secure Data Obfuscation Scheme to Enable Privacy-Preserving State Estimation in Smart Grid AMI Networks", 《IEEE INTERNET OF THINGS JOURNAL》 *
俞艺涵: "互联网环境下隐私安全风险评估体系构建", 《海军工程大学学报》 *
王毛妮等: "基于图论与互信息量的差分隐私度量模型", 《计算机科学》 *

Also Published As

Publication number Publication date
CN112632328B (zh) 2022-12-02

Similar Documents

Publication Publication Date Title
Zannettou et al. On the origins of memes by means of fringe web communities
US9892278B2 (en) Focused personal identifying information redaction
CN111737499B (zh) 基于自然语言处理的数据搜索方法及相关设备
US10769196B2 (en) Method and apparatus for displaying electronic photo, and mobile device
CN108804299A (zh) 应用程序异常处理方法及装置
CN110232104B (zh) 一种数据显示方法、装置、存储介质及计算机设备
CN107895122B (zh) 一种专用敏感信息主动防御方法、装置及系统
JP5374758B2 (ja) コメント配信システム、コメント配信システムの動作方法、プログラム
CN110109888B (zh) 一种文件处理方法及装置
Shapira et al. Content-based data leakage detection using extended fingerprinting
CN108459845A (zh) 一种监控标签属性的埋点方法及装置
CN106301979B (zh) 检测异常渠道的方法和系统
CN110209925A (zh) 应用推送方法、装置、计算机设备和存储介质
CN112989167B (zh) 搬运账号的识别方法、装置、设备及计算机可读存储介质
CN107229529A (zh) 页面内容版权信息管理方法、装置、计算设备及存储介质
CN109492401B (zh) 一种内容载体风险检测方法、装置、设备及介质
CN110765261A (zh) 潜在专利纠纷的监控方法、装置、服务器和存储介质
CN105808602B (zh) 一种垃圾信息的检测方法及装置
CN112632328B (zh) 一种vlog隐私泄漏度量评估方法、系统、介质及应用
Li et al. Vandalism detection in OpenStreetMap via user embeddings
CN111813964B (zh) 基于生态环境的数据处理方法及相关设备
Al-Nabki et al. Short text classification approach to identify child sexual exploitation material
CN112733523B (zh) 文档发送方法、装置、设备及存储介质
CN111383032B (zh) 一种房源信息的真实性检测方法和装置
US11055491B2 (en) Geographic location specific models for information extraction and knowledge discovery

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant