CN107798249A - 行为模式数据的发布方法及终端设备 - Google Patents
行为模式数据的发布方法及终端设备 Download PDFInfo
- Publication number
- CN107798249A CN107798249A CN201710605631.XA CN201710605631A CN107798249A CN 107798249 A CN107798249 A CN 107798249A CN 201710605631 A CN201710605631 A CN 201710605631A CN 107798249 A CN107798249 A CN 107798249A
- Authority
- CN
- China
- Prior art keywords
- mrow
- uproar
- user
- data
- behavior pattern
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/62—Protecting access to data via a platform, e.g. using keys or access control rules
- G06F21/6218—Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
- G06F21/6245—Protecting personal data, e.g. for financial or medical purposes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/62—Protecting access to data via a platform, e.g. using keys or access control rules
- G06F21/6218—Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
- G06F21/6227—Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database where protection concerns the structure of data, e.g. records, types, queries
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Bioethics (AREA)
- General Health & Medical Sciences (AREA)
- Computer Hardware Design (AREA)
- Databases & Information Systems (AREA)
- Computer Security & Cryptography (AREA)
- Software Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Medical Informatics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供了一种行为模式数据的发布方法及终端设备,适用于数据处理领域,该方法包括:获取多个用户发布的社交媒体数据;建立所述社交媒体数据对应的行为模式分布函数;将预设的所述随机噪声函数与所述行为模式分布函数进行整合,得到加噪行为模式分布函数;将行为模式数据查询参数输入所述加噪行为模式分布函数,以得到加噪行为模式数据;发布所述加噪行为模式数据。本发明通过将随机噪声函数整合于行为模式分布函数,使得基于加噪行为模式分布函数所发布的行为模式数据都是带有噪声的,因而加强了用户的隐私安全。同时,加噪行为模式数据依然保留了原有行为模式数据的参考价值,故保证了科研人员能够基于加噪行为模式数据进行有效的分析挖掘。
Description
技术领域
本发明属于数据处理领域,尤其涉及一种行为模式数据的发布方法及终端设备。
背景技术
社交媒体的发展使得用户的个人隐私越来越容易被他人获取。具体地,由于社交媒体数据不仅包含了用户发布的有效信息,还包含了用户与用户之间的相互关系,因此,对于攻击者来说,其可以通过挖掘用户发布的有效信息以及用户间的相互关系,匹配出用户在社会网络中的身份,进而能够全方位地获取用户的隐私信息。然而,如果把这些社交媒体数据提供给合适的科研人员,其却能通过数据挖掘分析方法,挖掘出对社会进步具有推动价值的信息。
现有技术中,为了保护用户的隐私安全,通常需要对社交媒体数据所对应的用户行为模式数据进行加密处理。这种方式下,科研人员难以基于加密数据来分析用户的行为模式。因此,保护社交媒体数据所集中的个人隐私和对社交媒体数据加以分析利用来推动社会进步,二者之间存在着互斥的关系。现有技术中,无法在保护用户隐私安全的同时,发布有挖掘价值的行为模式数据。
发明内容
有鉴于此,本发明实施例提供了一种行为模式数据的发布方法及终端设备,以解决现有技术中,无法在保护用户隐私安全的同时,发布有挖掘价值的行为模式数据的问题。
本发明实施例的第一方面提供了一种行为模式数据的发布方法,包括:
获取多个用户发布的社交媒体数据;
建立所述社交媒体数据对应的行为模式分布函数;
将预设的所述随机噪声函数与所述行为模式分布函数进行整合,得到加噪行为模式分布函数;
将行为模式数据查询参数输入所述加噪行为模式分布函数,以得到加噪行为模式数据;
发布所述加噪行为模式数据。
本发明实施例的第二方面提供了一种行为模式数据的发布装置,包括:
获取单元,用于获取多个用户发布的社交媒体数据;
建立单元,用于建立所述社交媒体数据对应的行为模式分布函数;
加噪单元,用于将预设的所述随机噪声函数与所述行为模式分布函数进行整合,得到加噪行为模式分布函数;
输入单元,用于将行为模式数据查询参数输入所述加噪行为模式分布函数,以得到加噪行为模式数据;
发布单元,用于发布所述加噪行为模式数据。
本发明实施例的第三方面提供了一种终端设备,所述终端设备包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如下步骤:
获取多个用户发布的社交媒体数据;
建立所述社交媒体数据对应的行为模式分布函数;
将预设的所述随机噪声函数与所述行为模式分布函数进行整合,得到加噪行为模式分布函数;
将行为模式数据查询参数输入所述加噪行为模式分布函数,以得到加噪行为模式数据;
发布所述加噪行为模式数据。
本发明实施例的第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如下步骤:
获取多个用户发布的社交媒体数据;
建立所述社交媒体数据对应的行为模式分布函数;
将预设的所述随机噪声函数与所述行为模式分布函数进行整合,得到加噪行为模式分布函数;
将行为模式数据查询参数输入所述加噪行为模式分布函数,以得到加噪行为模式数据;
发布所述加噪行为模式数据。
本发明实施例中,通过建立社交媒体数据对应的行为模式分布函数,能够将互不关联的行为模式数据进行归纳;通过将随机噪声函数整合于行为模式分布函数,使得基于加噪行为模式分布函数所发布的行为模式数据都是带有噪声的,因此,即使攻击者窃取到已发布的加噪行为模式数据,其仍然无法将加噪行为模式数据准确匹配到各个用户,因而加强了用户的个人隐私安全。同时,加噪后的行为模式数据依然保留了原有行为模式数据的参考价值,故保证了科研人员能够基于加噪行为模式数据进行有效的分析挖掘。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的行为模式数据的发布方法的实现流程图;
图2是本发明实施例提供的行为模式数据的发布方法S102的具体实现流程图;
图3是本发明实施例提供的行为模式数据的发布方法S104的具体实现流程图;
图4是本发明实施例提供的行为模式数据的发布装置的结构框图;
图5是本发明实施例提供的终端设备的结构示意图。
具体实施方式
以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本发明实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本发明。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本发明的描述。
为了说明本发明所述的技术方案,下面通过具体实施例来进行说明。
图1示出了本发明实施例提供的行为模式数据的发布方法的实现流程,详述如下:
S101:获取多个用户发布的社交媒体数据。
本发明实施例中,用户在论坛、博客、微博、聊天室或朋友圈等社交平台中所发布的一切数据为社交媒体数据。由于社交平台在接收到用户所发布的上述社交媒体数据时,会将这些社交媒体数据进行收集并存储,因而可通过调用预先设置的平台对接接口,读取各社交平台所存储的社交媒体数据。
对于同一用户而言,其往往拥有多个社交平台的社交账号,且社交账号也经常会使用相同的注册邮箱,因此,将注册邮箱相同的各个社交账号所发布的社交媒体数据进行归纳及统计,以汇总得到各个真实用户所对应的社交媒体数据。
S102:建立所述社交媒体数据对应的行为模式分布函数。
对每一用户在各个社交平台所发布的社交媒体数据进行分析处理,以确定用户的行为模式分布。行为模式分布表示,各种类别的社交媒体数据的发布概率。上述类别例如可以是体育、音乐、食物、旅游等。
为了归纳出多个用户的社交媒体数据之间的行为模式分布的总体状况,对用户的行为模式分布进行建模。具体地,先遍历出用户的各个行为模式分布,再通过现有的行为模式建模算法来对其进行处理,从而生成可用于描述多个用户行为模式的行为模式分布函数。
作为本发明的一个实施例,如图2所示,上述S102具体包括:
S201:将所述多个用户划分为多个用户集。
本发明实施例中,每一用户具有相应的一个用户标签。用户标签用于标识不同的用户。用户标签例如可以是用户的社交账号、用户名等。
若上述S101中所获得的社交媒体数据为N(N大于零且N为整数)个用户所发布的社交媒体数据,则N个用户构成一个用户集。在用户集中记录有用户标签。
获取该用户集的各个子集,则该子集即为将多个用户进行划分后所得到的用户集,即,每个子集同样为包含一个或多个用户标签的用户集。
例如,若获取得到8个用户发布的社交媒体数据,且这8个用户的用户标签分别为“Tom”、“Susan”、“Sue”、“Jack”、“Bob”、“John”、“Zoe”以及“Lily”,则这8个用户所构成的一个用户集为{Tom;Susan;Sue;Jack;Bob;John;Zoe;Lily}。该用户集的子集例如是{Tom;Susan;Sue}以及{Jack;Bob;John}等。
S202:对每一所述用户集对应的所述社交媒体数据进行解析处理,得到所述用户集的行为模式数据。
对于其中的一个用户集而言,该用户集所对应的社交媒体数据为用户集中各个用户所发布的社交媒体数据。因此,由于不同用户集中的用户标签不同,故不同用户集所对应的社交媒体数据也不同。
对每一用户集所对应的社交媒体数据进行处理,可确定该用户集中各个用户的行为模式数据。行为模式数据表示用户所发布的社交媒体数据中各种类别词语的出现频率以及权重等。
S203:将每一所述用户集的行为模式数据输入预设的行为模式分布模型。
作为本发明的一个实施例,上述行为模式分布模型为:
其中,所述x为用户集,所述y为包含社交媒体数据中的各个词语的集合,所述fj(x,y)为用户的第j个特征在所述y中所占的比重,λj,y为用户的第j个特征所对应的属性参数,所述Z(x)为正规化因子,F为用户集x的特征总数。
本发明实施例中,对用户集x中每一用户所发布的社交媒体数据进行分词处理,以筛选出每一用户对应的多个词语。社交媒体数据中往往包含有不具备实际语义的词语,这些词语不具备数据挖掘参考价值,故在筛选出的多个词语中,去除停用词,得到每一用户所对应的关键词。将每一用户对应的各个关键词所构成的第一向量称为该用户的信息状态空间,且信息状态空间中的各个元素互不相同。例如,用户Tom所对应的信息状态空间为[apple,London,Messi,football,rain]。
对于每一用户的信息状态空间中的每一关键词,获取该关键词在该用户所对应的社交媒体数据中的出现频率。将各个关键词所对应的出现频率共同输出为第二向量[a1,a2,a3,a4…,an]。其中,n为用户的信息状态空间中的元素总数。
本发明实施例中,通过线性判别式分析(Linear Discriminant Analysis)算法来获取用户集所对应的各个特征,所述特征用于表示关键词的类别。其中,每个特征具有预设的一个词库,且每个特征对应一个属性参数λ。
判断用户所对应的信息状态空间中的各个关键词是否存在于词库。若用户所对应的信息状态空间中的一个或多个关键词存在于词库,则获取所述一个或多个关键词在第二向量中所分别对应的各个元素值。将各个元素值进行相加得到和值后,将该和值与词库所对应的特征的属性参数λ的乘积输出为用户的一个行为特征分布值。
例如,若f1为其中的一个代表“sports”的特征,且该特征所对应的词库为[football,Messi,Ronaldo,manchester],属性参数为λ1,则对于用户Tom所对应的信息状态空间[apple,London,Messi,football,rain]来说,该信息状态空间中的“Messi”及“football”均存在于词库。假设该信息状态空间所对应的第二向量为[a1,a2,a3,a4…,an],则获取“Messi”及“football”在第二向量中所分别对应的元素值,即a3和a4。最终可得,用户Tom在“sports”特征上所对应的行为特征分布值为(a3+a4)λ1。
以此类推,计算出用户集中各个用户的行为特征分布值后,代入上述行为模式分布模型,可得到一个关于属性参数λ变化的行为模式分布模型。
进一步地,上述行为模式分布模型中的正规化因子Z(x)所对应的取值为
S204:最大化所述行为模式分布模型的熵,以确定所述行为模式分布模型中的属性参数。
本发明实施例中,基于最大熵原理来确定出行为模式分布模型中的各个属性参数,其中,每一属性参数与一个特征对应。由于最大熵原理是本领域的常用技术手段,因而不再一一赘述。
作为本发明的一个实施示例,S204可基于以下原理实现:多次调整行为模式分布模型中的各个属性参数;在每一次调整后,计算当前行为模式分布模型的熵并记录此时的属性参数;在计算得到的各个熵中,确定出最大的一个熵值,对该熵值所对应的属性参数进行选取。
S205:将所述属性参数确定后的所述行为模式分布模型输出为所述社交媒体数据对应的行为模式分布函数。
在属性参数λj,y确定后,每一特征所对应的属性参数则为常数值,因此,将常数值重新代上上述式子(1),可得到用户集x以及集合y为变量的行为模式分布函数。
本发明实施例中,通过预设的行为模式分布模型对各个用户集所对应的行为模式数据进行拟合,能够生成属性参数确定后的行为模式分布函数。由于在行为模式分布模型中加入了正规化因子,故避免了行为模式数据过拟合的情况发生,提高了行为模式分布函数的准确性,保证了后续加噪处理后所得到的行为模式数据能够体现整体的行为属性分布,维持了数据的挖掘价值。
S103:将预设的所述随机噪声函数与所述行为模式分布函数进行整合,得到加噪行为模式分布函数。
将随机噪声函数Q(x)与行为模式分布函数F(x)进行相加整合后,得到的加噪行为模式分布函数A(x)如下:
A(x)=F(x)+Q(x)
其中,x表示上述用户集。
本发明实施例中,预设的随机噪声函数可以为基于拉普拉斯(Laplace)机制或指数机制等机制的函数。
作为本发明的一个实施例,预设的随机噪声函数服从尺度参数为的拉普拉斯分布,此时,随机噪声函数可表示为其中,所述Δf为所述行为模式分布函数的全局敏感度,所述ε为预设的隐私保护预算参数。
本发明实施例中,隐私保护预算参数ε用来控制行为模式分布函数在两个邻近的用户集上获得相同输出的概率比值,其体现了行为模式分布函数所能够提供的隐私保护水平。隐私保护预算参数ε的值越小,表示隐私保护水平越高,当ε=0时,保护水平达到最高,此时对于任意两个邻近的用户集,行为模式分布函数将输出两个概率分布完全相同的结果。但这些结果不能反映任何关于数据集的有用信息,因此,为了达到输出结果的安全性与可用性的平衡,预设的隐私保护预算参数ε的取值为0.1。
具体地,当预设的随机噪声函数为基于拉普拉斯机制的函数时,先计算用户集x的全局敏感度Δf,再结合预设的隐私保护预算参数ε来确定出符合拉普拉斯分布的随机噪声函数。
用户集x的全局敏感度Δf通过以下公式计算得出:
其中,F(x)为上述行为模式分布函数。||F(x)-F(x′)||是F(x)与F(x′)之间的一阶范数距离。F(x)与F(x′)为邻近数据集,即F(x)与F(x′)所分别对应的集合元素总数的差值最大值为1。
本发明实施例中,通过对行为模式分布函数添加随机噪声函数,保护了行为模式数据中潜在的用户隐私信息,当攻击者需要查询行为模式数据时,由于加噪过程对于攻击者而言是不可见的,因而实现了即便攻击者已经掌握了任一加噪行为模式数据,该攻击者仍然无法推测出用户的原始行为模式数据,由此能够从数据源头彻底切除隐私信息泄露的可能性。
S104:将行为模式数据查询参数输入所述加噪行为模式分布函数,以得到加噪行为模式数据。
本发明实施例中,可自动生成行为模式查询参数,也可从查询者所发出的数据查询请求中获取。
例如,可遍历出社交媒体数据所对应的各个用户集以及用户集中所出现的各个特征,则其中的每一个用户集及其对应的任意一个特征均为数据查询请求中可能出现的行为模式查询参数。因此,可读取其中的一个用户集及特征,将该用户集及特征作为行为模式数据查询参数,输入加噪行为模式分布函数A(x)=F(x)+Q(x)中。
基于加噪行为模式分布函数中的各个属性参数以及获取到的行为模式数据查询参数,可直接计算出行为模式数据查询参数所对应的加噪行为模式数据。
作为本发明的一个实施例,图3示出了本发明实施例提供的行为模式数据的发布方法S104的具体实现流程,详述如下;
S301:获取携带有行为模式数据查询参数的数据查询请求,所述行为模式数据查询参数包括用户集以及特征。
S302:生成所述特征对应的随机参数。
S303:将所述随机参数以及所述行为模式数据查询参数输入所述加噪行为模式分布函数,以得到加噪行为模式数据。
由于用户集及特征已确定,故通过行为模式分布函数F(x)可计算出用户的行为模式数据。对于用户集中的每一特征,生成随机参数a,将该随机参数a输入随机噪声函数,则基于上述用户集x的全局敏感度Δf以及预设的隐私保护预算参数ε,可计算出随机噪声值。将随机噪声值以及用户行为模式数据进行相加处理后,得到加噪行为模式数据。
S105:发布所述加噪行为模式数据。
加噪行为模式数据的发布过程即为在满足隐私保护的条件下,将加噪行为模式数据分享至外界任一用户的过程,包括对查询者发出的行为模式数据查询请求进行响应的过程以及将所有加噪行为模式数据主动发布于预设的数据分享平台等。
本发明实施例中,通过建立社交媒体数据对应的行为模式分布函数,能够将互不关联的行为模式数据进行归纳;通过将随机噪声函数整合于行为模式分布函数,使得基于加噪行为模式分布函数所发布的行为模式数据都是带有噪声的,因此,即使攻击者窃取到已发布的加噪行为模式数据,其仍然无法将加噪行为模式数据准确匹配到各个用户,因而加强了用户的个人隐私安全。同时,加噪后的行为模式数据依然保留了原有行为模式数据的参考价值,故保证了科研人员能够基于加噪行为模式数据进行有效的分析挖掘。
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
对应于上文实施例所述的行为模式数据的发布方法,图4示出了本发明实施例提供的行为模式数据的发布装置的结构框图,为了便于说明,仅示出了与本发明实施例相关的部分。
参照图4,该装置包括:
获取单元41,用于获取多个用户发布的社交媒体数据。
建立单元42,用于建立所述社交媒体数据对应的行为模式分布函数。
加噪单元43,用于将预设的所述随机噪声函数与所述行为模式分布函数进行整合,得到加噪行为模式分布函数。
输入单元44,用于将行为模式数据查询参数输入所述加噪行为模式分布函数,以得到加噪行为模式数据。
发布单元45,用于发布所述加噪行为模式数据。
可选地,所述建立单元42包括:
划分子单元,用于将所述多个用户划分为多个用户集。
解析子单元,用于对每一所述用户集对应的所述社交媒体数据进行解析处理,得到所述用户集的行为模式数据。
第一输入子单元,用于将每一所述用户集的行为模式数据输入预设的行为模式分布模型。
确定子单元,用于最大化所述行为模式分布模型的熵,以确定所述行为模式分布模型中的属性参数。
输出子单元,用于将所述属性参数确定后的所述行为模式分布模型输出为所述社交媒体数据对应的行为模式分布函数。
可选地,所述行为模式分布模型为:
其中,所述x为用户集,所述y为包含社交媒体数据中的各个词语的集合,所述fj(x,y)为用户的第j个特征在所述y中所占的比重,λj,y为用户的第j个特征所对应的属性参数,所述Z(x)为正规化因子。
可选地,所述输入单元44包括:
获取子单元,用于获取携带有行为模式数据查询参数的数据查询请求,所述行为模式数据查询参数包括用户集以及特征。
生成子单元,用于生成所述特征对应的随机参数。
第二输入子单元,用于将所述随机参数以及所述行为模式数据查询参数输入所述加噪行为模式分布函数,以得到加噪行为模式数据。
可选地,所述预设的所述随机噪声函数服从尺度参数为的拉普拉斯分布。
其中,所述Δf为所述行为模式分布函数的全局敏感度,所述ε为预设的隐私保护预算参数。
本发明实施例中,通过建立社交媒体数据对应的行为模式分布函数,能够将互不关联的行为模式数据进行归纳;通过将随机噪声函数整合于行为模式分布函数,使得基于加噪行为模式分布函数所发布的行为模式数据都是带有噪声的,因此,即使攻击者窃取到已发布的加噪行为模式数据,其仍然无法将加噪行为模式数据准确匹配到各个用户,因而加强了用户的个人隐私安全。同时,加噪后的行为模式数据依然保留了原有行为模式数据的参考价值,故保证了科研人员能够基于加噪行为模式数据进行有效的分析挖掘。
图5是本发明一实施例提供的终端设备的结构示意图。如图5所示,该实施例的终端设备5包括:处理器50、存储器51以及存储在所述存储器51中并可在所述处理器50上运行的计算机程序52,例如行为模式数据的发布程序。所述处理器50执行所述计算机程序52时实现上述各个如行为模式数据的发布方法实施例中的步骤,例如图1所示的步骤101至105。或者,所述处理器50执行所述计算机程序52时实现上述各装置实施例中各模块/单元的功能,例如图4所示单元41至45的功能。
示例性的,所述计算机程序52可以被分割成一个或多个单元,所述一个或者多个单元被存储在所述存储器51中,并由所述处理器50执行,以完成本发明。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序52在所述终端设备5中的执行过程。例如,所述计算机程序52可以被分割成获取单元、建立单元、加噪单元、输入单元以及发布单元,各单元具体功能如下:
获取单元用于获取多个用户发布的社交媒体数据。
建立单元用于建立所述社交媒体数据对应的行为模式分布函数。
加噪单元用于将预设的所述随机噪声函数与所述行为模式分布函数进行整合,得到加噪行为模式分布函数。
输入单元用于将行为模式数据查询参数输入所述加噪行为模式分布函数,以得到加噪行为模式数据。
发布单元用于发布所述加噪行为模式数据。
所述终端设备5可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述终端设备可包括,但不仅限于,处理器50、存储器51。本领域技术人员可以理解,图5仅仅是终端设备5的示例,并不构成对终端设备5的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述终端设备还可以包括输入输出设备、网络接入设备、总线等。
所称处理器50可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
所述存储器51可以是所述终端设备5的内部存储单元,例如终端设备5的硬盘或内存。所述存储器51也可以是所述终端设备5的外部存储设备,例如所述终端设备5上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,所述存储器51还可以既包括所述终端设备5的内部存储单元也包括外部存储设备。所述存储器51用于存储所述计算机程序以及所述终端设备所需的其他程序和数据。所述存储器51还可以用于暂时地存储已经输出或者将要输出的数据。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。上述系统中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
在本发明所提供的实施例中,应该理解到,所揭露的装置/终端设备和方法,可以通过其它的方式实现。例如,以上所描述的装置/终端设备实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
以上所述实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。
Claims (10)
1.一种行为模式数据的发布方法,其特征在于,包括:
获取多个用户发布的社交媒体数据;
建立所述社交媒体数据对应的行为模式分布函数;
将预设的所述随机噪声函数与所述行为模式分布函数进行整合,得到加噪行为模式分布函数;
将行为模式数据查询参数输入所述加噪行为模式分布函数,以得到加噪行为模式数据;
发布所述加噪行为模式数据。
2.如权利要求1所述的行为模式数据的发布方法,其特征在于,所述建立所述社交媒体数据对应的行为模式分布函数,包括:
将所述多个用户划分为多个用户集;
对每一所述用户集对应的所述社交媒体数据进行解析处理,得到所述用户集的行为模式数据;
将每一所述用户集的行为模式数据输入预设的行为模式分布模型;
最大化所述行为模式分布模型的熵,以确定所述行为模式分布模型中的属性参数;
将所述属性参数确定后的所述行为模式分布模型输出为所述社交媒体数据对应的行为模式分布函数。
3.如权利要求2所述的行为模式数据的发布方法,其特征在于,所述行为模式分布模型为:
<mrow>
<msub>
<mi>p</mi>
<mi>&Lambda;</mi>
</msub>
<mrow>
<mo>(</mo>
<mi>y</mi>
<mo>|</mo>
<mi>x</mi>
<mo>)</mo>
</mrow>
<mo>=</mo>
<mfrac>
<mn>1</mn>
<mrow>
<mi>Z</mi>
<mrow>
<mo>(</mo>
<mi>x</mi>
<mo>)</mo>
</mrow>
</mrow>
</mfrac>
<msup>
<mi>e</mi>
<mrow>
<msubsup>
<mo>&Sigma;</mo>
<mrow>
<mi>j</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mi>F</mi>
</msubsup>
<mrow>
<mo>(</mo>
<msub>
<mi>f</mi>
<mi>j</mi>
</msub>
<mo>(</mo>
<mrow>
<mi>x</mi>
<mo>,</mo>
<mi>y</mi>
</mrow>
<mo>)</mo>
<msub>
<mi>&lambda;</mi>
<mrow>
<mi>j</mi>
<mo>,</mo>
<mi>y</mi>
</mrow>
</msub>
<mo>)</mo>
</mrow>
</mrow>
</msup>
</mrow>
其中,所述x为用户集,所述y为包含社交媒体数据中的各个词语的集合,所述fj(x,y)为用户的第j个特征在所述y中所占的比重,λj,y为用户的第j个特征所对应的属性参数,所述Z(x)为正规化因子。
4.如权利要求2或3所述的行为模式数据的发布方法,其特征在于,所述将行为模式数据查询参数输入所述加噪行为模式分布函数,以得到加噪行为模式数据,包括:
获取携带有行为模式数据查询参数的数据查询请求,所述行为模式数据查询参数包括用户集以及特征;
生成所述特征对应的随机参数;
将所述随机参数以及所述行为模式数据查询参数输入所述加噪行为模式分布函数,以得到加噪行为模式数据。
5.如权利要求1所述的行为模式数据的发布方法,其特征在于,所述预设的所述随机噪声函数服从尺度参数为的拉普拉斯分布;
其中,所述Δf为所述行为模式分布函数的全局敏感度,所述ε为预设的隐私保护预算参数。
6.一种终端设备,其特征在于,所述终端设备包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如下步骤:
获取多个用户发布的社交媒体数据;
建立所述社交媒体数据对应的行为模式分布函数;
将预设的所述随机噪声函数与所述行为模式分布函数进行整合,得到加噪行为模式分布函数;
将行为模式数据查询参数输入所述加噪行为模式分布函数,以得到加噪行为模式数据;
发布所述加噪行为模式数据。
7.如权利要求6所述的终端设备,其特征在于,所述建立所述社交媒体数据对应的行为模式分布函数的步骤,具体包括:
将所述多个用户划分为多个用户集;
对每一所述用户集对应的所述社交媒体数据进行解析处理,得到所述用户集的行为模式数据;
将每一所述用户集的行为模式数据输入预设的行为模式分布模型;
最大化所述行为模式分布模型的熵,以确定所述行为模式分布模型中的属性参数;
将所述属性参数确定后的所述行为模式分布模型输出为所述社交媒体数据对应的行为模式分布函数。
8.如权利要求7所述的终端设备,其特征在于,所述行为模式分布模型为:
<mrow>
<msub>
<mi>p</mi>
<mi>&Lambda;</mi>
</msub>
<mrow>
<mo>(</mo>
<mi>y</mi>
<mo>|</mo>
<mi>x</mi>
<mo>)</mo>
</mrow>
<mo>=</mo>
<mfrac>
<mn>1</mn>
<mrow>
<mi>Z</mi>
<mrow>
<mo>(</mo>
<mi>x</mi>
<mo>)</mo>
</mrow>
</mrow>
</mfrac>
<msup>
<mi>e</mi>
<mrow>
<msubsup>
<mo>&Sigma;</mo>
<mrow>
<mi>j</mi>
<mo>=</mo>
<mn>1</mn>
</mrow>
<mi>F</mi>
</msubsup>
<mrow>
<mo>(</mo>
<msub>
<mi>f</mi>
<mi>j</mi>
</msub>
<mo>(</mo>
<mrow>
<mi>x</mi>
<mo>,</mo>
<mi>y</mi>
</mrow>
<mo>)</mo>
<msub>
<mi>&lambda;</mi>
<mrow>
<mi>j</mi>
<mo>,</mo>
<mi>y</mi>
</mrow>
</msub>
<mo>)</mo>
</mrow>
</mrow>
</msup>
</mrow>
其中,所述x为用户集,所述y为包含社交媒体数据中的各个词语的集合,所述fj(x,y)为用户的第j个特征在所述y中所占的比重,λj,y为用户的第j个特征所对应的属性参数,所述Z(x)为正规化因子。
9.如权利要求7或8所述的终端设备,其特征在于,所述将行为模式数据查询参数输入所述加噪行为模式分布函数,以得到加噪行为模式数据的步骤,具体包括:
获取携带有行为模式数据查询参数的数据查询请求,所述行为模式数据查询参数包括用户集以及特征;
生成所述特征对应的随机参数;
将所述随机参数以及所述行为模式数据查询参数输入所述加噪行为模式分布函数,以得到加噪行为模式数据。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至5任一项所述方法的步骤。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710605631.XA CN107798249B (zh) | 2017-07-24 | 2017-07-24 | 行为模式数据的发布方法及终端设备 |
PCT/CN2018/083551 WO2019019711A1 (zh) | 2017-07-24 | 2018-04-18 | 行为模式数据的发布方法、装置、终端设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710605631.XA CN107798249B (zh) | 2017-07-24 | 2017-07-24 | 行为模式数据的发布方法及终端设备 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107798249A true CN107798249A (zh) | 2018-03-13 |
CN107798249B CN107798249B (zh) | 2020-02-21 |
Family
ID=61530306
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710605631.XA Active CN107798249B (zh) | 2017-07-24 | 2017-07-24 | 行为模式数据的发布方法及终端设备 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN107798249B (zh) |
WO (1) | WO2019019711A1 (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019019711A1 (zh) * | 2017-07-24 | 2019-01-31 | 平安科技(深圳)有限公司 | 行为模式数据的发布方法、装置、终端设备及介质 |
CN109784006A (zh) * | 2019-01-04 | 2019-05-21 | 平安科技(深圳)有限公司 | 水印嵌入和提取方法及终端设备 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102549614A (zh) * | 2009-10-07 | 2012-07-04 | 微软公司 | 用于维护用户简档的隐私的隐私库 |
CN104050267A (zh) * | 2014-06-23 | 2014-09-17 | 中国科学院软件研究所 | 基于关联规则满足用户隐私保护的个性化推荐方法及系统 |
CN105608446A (zh) * | 2016-02-02 | 2016-05-25 | 北京大学深圳研究生院 | 一种视频流异常事件的检测方法及装置 |
Family Cites Families (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102377804A (zh) * | 2010-08-19 | 2012-03-14 | 王轶彤 | 基于地理位置的交互式信息服务系统及方法 |
CN104361123B (zh) * | 2014-12-03 | 2017-11-03 | 中国科学技术大学 | 一种个人行为数据匿名化方法及系统 |
CN104809408B (zh) * | 2015-05-08 | 2017-11-28 | 中国科学技术大学 | 一种基于差分隐私的直方图发布方法 |
WO2017062601A1 (en) * | 2015-10-09 | 2017-04-13 | Interdigital Technology Corporation | Multi-level dynamic privacy management in an internet of things environment with multiple personalized service providers |
CN106209457B (zh) * | 2016-07-14 | 2019-03-12 | 北京工业大学 | 应对智能家居环境中旁路攻击的隐私保护方法及系统 |
CN107798249B (zh) * | 2017-07-24 | 2020-02-21 | 平安科技(深圳)有限公司 | 行为模式数据的发布方法及终端设备 |
-
2017
- 2017-07-24 CN CN201710605631.XA patent/CN107798249B/zh active Active
-
2018
- 2018-04-18 WO PCT/CN2018/083551 patent/WO2019019711A1/zh active Application Filing
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102549614A (zh) * | 2009-10-07 | 2012-07-04 | 微软公司 | 用于维护用户简档的隐私的隐私库 |
CN104050267A (zh) * | 2014-06-23 | 2014-09-17 | 中国科学院软件研究所 | 基于关联规则满足用户隐私保护的个性化推荐方法及系统 |
CN105608446A (zh) * | 2016-02-02 | 2016-05-25 | 北京大学深圳研究生院 | 一种视频流异常事件的检测方法及装置 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2019019711A1 (zh) * | 2017-07-24 | 2019-01-31 | 平安科技(深圳)有限公司 | 行为模式数据的发布方法、装置、终端设备及介质 |
CN109784006A (zh) * | 2019-01-04 | 2019-05-21 | 平安科技(深圳)有限公司 | 水印嵌入和提取方法及终端设备 |
Also Published As
Publication number | Publication date |
---|---|
WO2019019711A1 (zh) | 2019-01-31 |
CN107798249B (zh) | 2020-02-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Duan et al. | Modeling data, information and knowledge for security protection of hybrid IoT and edge resources | |
Zeng et al. | An IoT and Blockchain‐based approach for the smart water management system in agriculture | |
CN108898476A (zh) | 一种贷款客户信用评分方法和装置 | |
CN103733190B (zh) | 用于保护网络数据的隐私性的方法和装置 | |
CN113254804B (zh) | 一种基于用户属性和行为特征的社会关系推荐方法及系统 | |
Luo et al. | Bibliometric analysis of the blockchain scientific evolution: 2014–2020 | |
CN109087138A (zh) | 数据处理方法及系统、计算机系统和可读存储介质 | |
CN107346315A (zh) | 对象数据关联索引系统及该系统的构建与应用方法 | |
CN109241357A (zh) | 链式结构模型及其构建方法、系统和终端设备 | |
Kagan et al. | Probabilistic Search for Tracking Targets: Theory and Modern Application | |
Mo et al. | An interval efficiency measurement in DEA when considering undesirable outputs | |
CN110610098A (zh) | 数据集生成方法及装置 | |
Hussain et al. | Federated learning: A survey of a new approach to machine learning | |
CN107798249A (zh) | 行为模式数据的发布方法及终端设备 | |
Taric et al. | A survey on privacy preserving data mining techniques | |
CN105447117B (zh) | 一种用户聚类的方法和装置 | |
Lee et al. | The identification of new service opportunities: a case-based morphological analysis | |
Wu et al. | Deep learning-based data privacy protection in software-defined industrial networking | |
CN112287111A (zh) | 一种文本处理方法和相关装置 | |
Kaur Chahal et al. | An efficient Hadoop‐based brain tumor detection framework using big data analytic | |
Hashemi et al. | Multi-objective Optimization for Computer Security and Privacy. | |
CN113553446B (zh) | 一种基于异构图解构的金融反欺诈方法及装置 | |
Jee et al. | Potential of patent image data as technology intelligence source | |
Bhattacharya et al. | Fuzzy data mining: a literature survey and classification framework | |
Zhu et al. | A multidimensional extension–based method for resource performance matching in cloud manufacturing |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |