CN111931233B - 基于区块链和本地化差分隐私保护的信息推荐方法及系统 - Google Patents

基于区块链和本地化差分隐私保护的信息推荐方法及系统 Download PDF

Info

Publication number
CN111931233B
CN111931233B CN202010806166.8A CN202010806166A CN111931233B CN 111931233 B CN111931233 B CN 111931233B CN 202010806166 A CN202010806166 A CN 202010806166A CN 111931233 B CN111931233 B CN 111931233B
Authority
CN
China
Prior art keywords
target
data
user
block chain
blockchain
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010806166.8A
Other languages
English (en)
Other versions
CN111931233A (zh
Inventor
刘洋
林良杰
王轩
徐睿峰
蒋琳
廖清
夏文
漆舒汉
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Graduate School Harbin Institute of Technology
Original Assignee
Shenzhen Graduate School Harbin Institute of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Graduate School Harbin Institute of Technology filed Critical Shenzhen Graduate School Harbin Institute of Technology
Priority to CN202010806166.8A priority Critical patent/CN111931233B/zh
Publication of CN111931233A publication Critical patent/CN111931233A/zh
Application granted granted Critical
Publication of CN111931233B publication Critical patent/CN111931233B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/62Protecting access to data via a platform, e.g. using keys or access control rules
    • G06F21/6218Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
    • G06F21/6245Protecting personal data, e.g. for financial or medical purposes
    • G06F21/6254Protecting personal data, e.g. for financial or medical purposes by anonymising data, e.g. decorrelating personal data from the owner's identification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2465Query processing support for facilitating data mining operations in structured databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/27Replication, distribution or synchronisation of data between databases or within a distributed database system; Distributed database system architectures therefor

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Bioethics (AREA)
  • Data Mining & Analysis (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • Computer Hardware Design (AREA)
  • Computer Security & Cryptography (AREA)
  • Medical Informatics (AREA)
  • Fuzzy Systems (AREA)
  • Mathematical Physics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请实施例公开了一种基于区块链和本地化差分隐私保护的信息推荐方法及系统,用于在进行信息推荐的同时保证用户数据的安全性和确保用户隐私信息不被泄露。本申请实施例方法包括:对区块链用户的用户数据进行聚类分析,以及对该区块链用户的预处理数据进行本地化差分隐私处理而得到模糊化数据,并由星际文件系统对该模糊化数据进行哈希计算而得到哈希值,在得到区块链用户的桶号以及哈希值之后,可以基于该桶号及哈希值,根据推荐算法向目标区块链用户进行信息推荐。本申请实施例中,免除了中心服务器的参与,避免中心服务器被攻击而导致用户信息泄露,同时本地化差分隐私处理也保证了用户数据的隐秘性,增强了数据的安全性,降低隐私泄露的风险。

Description

基于区块链和本地化差分隐私保护的信息推荐方法及系统
技术领域
本申请实施例涉及数据处理领域,具体涉及一种基于区块链和本地化差分隐私保护的信息推荐方法及系统。
背景技术
在如今信息化的时代,信息过载成为普遍现象,为了解决这一问题,推荐系统应运而生。它致力于通过数据挖掘和人工智能技术将用户和项目之间进行特征关联,进而可为用户提供符合其兴趣爱好的个性化推荐。但是推荐系统在数据挖掘的过程中需要收集海量的用户信息,这种行为会增加用户隐私泄露的风险,从而使用户对推荐系统好感度降低,最终影响到公司或者企业的利益。
收集目标用户的个人数据,并将目标用户的个人数据传输至中心服务器进行计算以获取推荐结果的方式是目前主流的推荐手段。但是,由于中心服务器的存在,使得数据的安全性无法保证,中心服务器还容易受到诸如单点故障和DDOS攻击等网络攻击。
为此,亟需一种既能够准确地根据用户的兴趣爱好进行个性化推荐、又可以很好地保护用户隐私信息的推荐系统和推荐方法,以提升用户对推荐结果的好感度,提高推荐者的收益。
发明内容
本申请实施例提供了一种基于区块链和本地化差分隐私保护的信息推荐方法及系统,用于在进行信息推荐的同时保证用户数据的安全性和确保用户隐私信息不被泄露。
本申请实施例第一方面提供了一种基于区块链和本地化差分隐私保护的信息推荐方法,包括:
从区块链的目标区块中获取用于聚类分析的第一函数,并根据所述第一函数对区块链用户的用户数据进行聚类分析,得到所述区块链用户的桶号;
从所述目标区块中获取用于本地化差分隐私处理的目标哈希函数,并根据所述目标哈希函数对所述区块链用户的预处理数据进行本地化差分隐私处理,得到所述预处理数据对应的模糊化数据,所述预处理数据为所述区块链用户对用户数据进行预处理而得到的数据;
向星际文件系统上传所述模糊化数据,并接收所述星际文件系统根据设定的哈希算法对所述模糊化数据进行计算而生成的哈希值;
将所述区块链用户的桶号、所述模糊化数据对应的哈希值上传至所述区块链中;
基于所述区块链用户的桶号以及所述模糊化数据对应的哈希值,根据推荐算法向目标区块链用户推荐目标信息。
本申请实施例第二方面提供了一种基于区块链和本地化差分隐私保护的推荐系统,包括:
获取单元,用于从区块链的目标区块中获取用于聚类分析的第一函数;
聚类分析单元,用于并根据所述第一函数对区块链用户的用户数据进行聚类分析,得到所述区块链用户的桶号;
所述获取单元还用于从所述目标区块中获取用于本地化差分隐私处理的目标哈希函数;
处理单元,用于根据所述目标哈希函数对所述区块链用户的预处理数据进行本地化差分隐私处理,得到所述预处理数据对应的模糊化数据,所述预处理数据为所述区块链用户对用户数据进行预处理而得到的数据;
收发单元,用于向星际文件系统上传所述模糊化数据,并接收所述星际文件系统根据设定的哈希算法对所述模糊化数据进行计算而生成的哈希值;
所述收发单元还用于将所述区块链用户的桶号、所述模糊化数据对应的哈希值上传至所述区块链中;
推荐单元,用于基于所述区块链用户的桶号以及所述模糊化数据对应的哈希值,根据推荐算法向目标区块链用户推荐目标信息。
本申请实施例第三方面提供了一种基于区块链和本地化差分隐私保护的推荐系统,包括:
处理器、存储器、总线、输入输出设备;
所述处理器与所述存储器、输入输出设备相连;
所述总线分别连接所述处理器、存储器以及输入输出设备;
所述输入输出设备用于从区块链的目标区块中获取用于聚类分析的第一函数;
所述处理器用于根据所述第一函数对区块链用户的用户数据进行聚类分析,得到所述区块链用户的桶号;
所述输入输出设备还用于从所述目标区块中获取用于本地化差分隐私处理的目标哈希函数;
所述处理器还用于根据所述目标哈希函数对所述区块链用户的预处理数据进行本地化差分隐私处理,得到所述预处理数据对应的模糊化数据,所述预处理数据为所述区块链用户对用户数据进行预处理而得到的数据;
所述输入输出设备还用于向星际文件系统上传所述模糊化数据,并接收所述星际文件系统根据设定的哈希算法对所述模糊化数据进行计算而生成的哈希值,将所述区块链用户的桶号、所述模糊化数据对应的哈希值上传至所述区块链中;
所述处理器还用于基于所述区块链用户的桶号以及所述模糊化数据对应的哈希值,根据推荐算法向目标区块链用户推荐目标信息。
本申请实施例第四方面提供了一种计算机存储介质,计算机存储介质中存储有指令,该指令在计算机上执行时,使得计算机执行前述第一方面的方法。
从以上技术方案可以看出,本申请实施例具有以下优点:
本申请实施例中,对区块链用户的用户数据进行聚类分析,以及对该区块链用户的预处理数据进行本地化差分隐私处理而得到模糊化数据,并由星际文件系统对该模糊化数据进行哈希计算而得到哈希值,在得到区块链用户的桶号以及哈希值之后,可以基于该桶号及哈希值,根据推荐算法向目标区块链用户进行信息推荐。由于本申请实施例的信息推荐过程是由用户终端的应用程序执行的,即用户本地端进行信息推荐,因此,免除了中心服务器的参与,避免中心服务器被攻击而导致用户信息泄露。对用户的预处理数据进行了本地化差分隐私处理,这也保证了用户数据的隐秘性,避免用户数据流出本地,增强了数据的安全性,降低隐私泄露的风险。
附图说明
图1为本申请实施例中基于区块链和本地化差分隐私保护的信息推荐方法一个流程示意图;
图2为本申请实施例中基于区块链和本地化差分隐私保护的信息推荐方法另一流程示意图;
图3为本申请实施例中基于区块链和本地化差分隐私保护的推荐系统一个结构示意图;
图4为本申请实施例中基于区块链和本地化差分隐私保护的推荐系统另一结构示意图。
具体实施方式
本申请实施例提供了一种基于区块链和本地化差分隐私保护的信息推荐方法及系统,用于在进行信息推荐的同时保证用户数据的安全性和确保用户隐私信息不被泄露。
请参阅图1,本申请实施例中基于区块链和本地化差分隐私保护的信息推荐方法一个实施例包括:
101、从区块链的目标区块中获取用于聚类分析的第一函数,并根据第一函数对区块链用户的用户数据进行聚类分析,得到区块链用户的桶号;
本实施例的信息推荐方法可应用于推荐系统,具体可以应用在信息推荐者需要向用户推荐其感兴趣的信息的场景中。其中,信息推荐者可以是企业、公司或者其他需要向大众推荐信息的个体或者单位,例如可以是需要进行广告宣传的商家、提供视频播放业务的企业等等。因此,信息推荐者一般可以通过应用程序或者APP等软件向用户的终端推荐相关的信息,则用户可以通过终端了解到该信息推荐者所推荐的信息。
推荐系统可以通过安装在用户终端上的应用程序执行本实施例的方法。在进行信息推荐时,用户终端上的应用程序需要预先收集用户的用户数据,该用户数据包括了用户在终端上的任意操作行为数据,例如用户点击观看某部电影、浏览某个网店等操作行为数据。为便于用户数据的收集,本实施例的信息推荐方法可以布局在区块链网络上,则用户群体作为区块链网络的多个节点,当某个用户需要信息推荐时,该用户终端的应用程序可以很方便地从区块链网络中收集用户群体的用户数据,从而节约通信成本。本实施例中,区块链中的用户可以称为区块链用户。
用户本地的应用程序在获取到用户自身的用户数据之后,该本地的应用程序可以对用户数据进行分析处理。具体的,可以对用户数据进行聚类分析,聚类分析所使用到的第一函数可以预先由信息推荐者上传至区块链的目标区块中,因此,可以从该目标区块获取到用于聚类分析的第一函数,并根据该第一函数对用户数据进行聚类分析。在完成聚类分析之后,可以得到区块链用户的桶号。
其中,用于聚类分析的第一函数可以是局部敏感哈希(locality sensitivehashing,LSH)函数,具体的,该LSH函数可以是基于Min-hash的二进制局部敏感哈希函数,因此,在获取到用户数据之后,可以对该用户数据进行基于Min-hash的二进制局部敏感哈希函数的聚类计算,从而得到该用户数据对应的区块链用户的桶号,可以大大增加聚类计算的效率。
102、从目标区块中获取用于本地化差分隐私处理的目标哈希函数,并根据目标哈希函数对区块链用户的预处理数据进行本地化差分隐私处理,得到预处理数据对应的模糊化数据;
本实施例中,区块链用户可以对用户数据进行预处理,预处理可以是区块链用户对用户数据的评价、收藏、转发等任意操作。例如,区块链用户可以对看过的某部电影进行评分、收藏某个网店或者转发某个视频等等,以上操作均为预处理过程。在完成预处理之后,可以得到预处理数据,即预处理操作的结果,如电影评分结果、所收藏的网店或者所转发的视频等等。
由于预处理数据可以看出用户的个人喜好,例如用户对某部电影评分高,表示用户喜欢该电影,因此,预处理数据会在一定程度上涉及用户的个人隐私信息,需要对该预处理数据进行隐私保护。本实施例中,可以对预处理数据进行本地化差分隐私处理,其中,用于本地化差分隐私处理的目标哈希函数预先由信息推荐者上传至区块链的目标区块中,从而可以从该目标区块中获取到目标哈希函数,并根据目标哈希函数对区块链用户的预处理数据进行本地化差分隐私处理。由于对预处理数据进行了隐私保护,因此,本地化差分隐私处理之后的数据可以不容易被识别和获取,可以将该处理后的数据称为模糊化数据。
103、向星际文件系统上传模糊化数据,并接收星际文件系统根据设定的哈希算法对模糊化数据进行计算而生成的哈希值;
在得到本地化差分隐私处理的模糊化数据之后,向星际文件系统(interplanetary file system,IPFS)上传该模糊化数据,星际文件系统可以根据设定的哈希算法对该模糊化数据进行计算,在计算之后可以生成该模糊化数据对应的哈希值。之后,应用程序接收星际文件系统发送的该哈希值。
在实际应用中,星际文件系统在设计时本身已内置了SHA-256哈希算法,SHA-256哈希算法根据模糊化数据的内容进行寻址,因此,星际文件系统可以根据SHA-256哈希算法对模糊化数据进行哈希计算,从而得到该模糊化数据对应的哈希值。
本实施例中,由于区块链与星际文件系统IPFS的存在,使得区块链的目标区块中的第一函数和目标哈希函数可以在区块链中进行共享,从而用户终端上的应用程序可以对用户自身的数据进行离线处理,并且离线处理的成本可以忽略不计,大大降低了数据收集的通信成本。
104、将区块链用户的桶号、模糊化数据对应的哈希值上传至区块链中;
在得到区块链用户的桶号以及模糊化数据对应的哈希值之后,将该桶号及哈希值上传至区块链中,从而应用程序可以从区块链中获取到需要进行信息推荐的用户的桶号以及哈希值。
105、基于区块链用户的桶号以及模糊化数据对应的哈希值,根据推荐算法向目标区块链用户推荐目标信息;
当应用程序需要向目标区块链用户推荐该用户感兴趣的信息时,应用程序可以从区块链下载该目标区块链用户的桶号及该用户的模糊化数据对应的哈希值,并基于该桶号及哈希值,根据推荐算法向该目标区块链用户推荐目标信息,从而实现对用户的信息推荐。
本实施例中,对区块链用户的用户数据进行聚类分析,以及对该区块链用户的预处理数据进行本地化差分隐私处理而得到模糊化数据,并由星际文件系统对该模糊化数据进行哈希计算而得到哈希值,在得到区块链用户的桶号以及哈希值之后,可以基于该桶号及哈希值,根据推荐算法向目标区块链用户进行信息推荐。由于本实施例的信息推荐过程是由用户终端的应用程序执行的,即用户本地端进行信息推荐,因此,免除了中心服务器的参与,避免中心服务器被攻击而导致用户信息泄露。对用户的预处理数据进行了本地化差分隐私处理,这也保证了用户数据的隐秘性,避免用户数据流出本地,增强了数据的安全性,降低隐私泄露的风险。
下面将在前述图1所示实施例的基础上,进一步详细地描述本申请实施例。请参阅图2,本申请实施例中基于区块链和本地化差分隐私保护的信息推荐方法另一实施例包括:
201、从区块链的目标区块中获取用于聚类分析的第一函数,并根据第一函数对区块链用户的用户数据进行聚类分析,得到区块链用户的桶号;
本实施例中,用于存放第一函数和目标哈希函数的目标区块可以是区块链的创世区块,使用区块链的创世区块的有益效果是,相比于区块链的其他区块,应用程序可以更容易地从创世区块中获取第一函数和目标哈希函数,有利于进行数据处理。
因此,第一函数和目标哈希函数可以预先上传至创世区块中,在进行数据处理时可以从该创世区块中获取第一函数和目标哈希函数。
本实施例中,可以预先将哈希函数集合上传至创世区块,当要进行本地化差分隐私处理时,可以从该哈希函数集合中选取目标哈希函数,以进行本地化差分隐私处理。
202、从目标区块中获取用于本地化差分隐私处理的目标哈希函数,并根据目标哈希函数对区块链用户的预处理数据进行本地化差分隐私处理,得到预处理数据对应的模糊化数据;
203、向星际文件系统上传模糊化数据,并接收星际文件系统根据设定的哈希算法对模糊化数据进行计算而生成的哈希值;
步骤202至203所执行的操作与前述图1所示实施例中的步骤102至103所执行的操作类似,此处不再赘述。
204、将区块链用户的桶号、模糊化数据对应的哈希值上传至区块链中;
本实施例中,为便于识别上传至区块链的桶号及哈希值所对应的用户及上传时间,可以将区块链用户的桶号、模糊化数据对应的哈希值以及该区块链用户的用户名、当前时间戳一同上传至区块链中,从而可以根据其中的用户名确定上传者的身份,即确定数据是由哪个用户上传的,还可以根据当前时间戳确定数据的上传时间,即确定哪些数据是最近上传的、哪些数据是很久以前上传的,确定哪些是新数据、哪些是旧数据。
205、基于区块链用户的桶号以及模糊化数据对应的哈希值,根据推荐算法向目标区块链用户推荐目标信息;
本实施例中,根据推荐算法向目标区块链用户推荐目标信息的方法有多种,例如,用户终端本地的应用程序对用户数据进行分析(该用户数据体现了用户的兴趣爱好),分析得到用户的喜好,再根据该用户的喜好向用户推荐相应的信息。
例如,用户数据为该用户观看过电影A、B,其中电影A为科幻类型的电影,电影B为喜剧类型的电影,则可以大致得出该用户对科幻类型及喜剧类型的电影感兴趣。之后,应用程序可以在本地的电影清单中查找科幻类型及喜剧类型的电影,生成上述两种类型电影的目标信息,并将其推荐给用户。其中,电影清单可以由应用程序的开发者提供,即开发者将电影清单上传至星际文件系统中,由星际文件系统对该电影清单进行哈希得到对应的哈希值,开发者获取到该哈希值之后上传至区块链的任意区块中,则应用程序可以从区块链下载到该哈希值,并根据该哈希值向星际文件系统请求该哈希值对应的数据(即电影清单)。若有新电影需要添加到电影清单,则开发者可以将新电影清单上传至星际文件系统,再将返回的哈希值上传至区块链中,由本地应用程序从区块链中获取IPFS哈希值,从而获取新的电影清单。
上述方法仅仅在目标区块链用户的用户数据的基础上进行的推荐,除此之外,还可以基于用户群体的用户数据进行推荐。具体的,由于每一个区块链用户均上传了自身的桶号以及自身的模糊化数据对应的哈希值,因此,应用程序从区块链中获取多个区块链用户的桶号以及模糊化数据对应的哈希值,其中,每个区块链用户的桶号与哈希值相对应。之后,在多个区块链用户的桶号和哈希值中,确定与目标区块链用户的桶号相同的目标桶号,并获取该目标桶号对应的目标哈希值,目标桶号与目标哈希值均对应于同类区块链用户。
其中,同类区块链用户是指与目标区块链用户的兴趣爱好相类似的用户。由于每个区块链用户的用户数据在进行聚类分析时所使用的是第一函数,即进行聚类分析所使用的函数是相同的,因此,若用户之间的兴趣爱好相同,例如均观看过某部电影,或者在网购时均收藏或者购买了某件商品,则此时的用户数据是相同或者相类似的,则进行聚类分析之后,得到的桶号也是相同的,因此,可以认为桶号相同的用户即为兴趣爱好相同的用户,该兴趣爱好相同的用户可以称为同类区块链用户。
可以理解的是,由于与目标区块链用户的兴趣爱好相类似的用户可能有一个或者多个,因此,该同类区块链用户可以指单个的用户,也可以指用户群体,本实施例对同类区块链用户的数量不作限定。
在根据桶号相同确定了同类区块链用户之后,可以向星际文件系统获取该同类区块链用户的目标哈希值对应的目标模糊化数据。由于该目标模糊化数据同样是根据哈希函数进行本地化差分隐私处理之后得到的,因此,可以根据该目标模糊化数据在本地化差分隐私处理的阶段中所使用的哈希函数对该目标模糊化数据进行恢复,从而得到该同类区块链用户的目标数据,该同类区块链用户的目标数据表示了该同类区块链用户的喜好,如目标数据表示了该同类区块链用户对某部电影的评分较高、对某部电影的观看次数较多或者购买了某件商品等信息。
由于本实施例采用了本地化差分隐私处理,因此,恢复之后得到的目标数据与本地化差分隐私处理之前的预处理数据存在一定的区别,从而有利于用户个人信息的保护。之后,可以基于该同类区块链用户的目标数据,根据推荐算法向目标区块链用户推荐目标信息。
例如,多个同类区块链用户的目标数据表示了电影A的总观看次数为135次,电影B的总观看次数为105次,电影C的总观看次数为40次,则根据该目标数据,可以得出电影A是比较受欢迎的,因此,应用程序生成该电影A的目标信息,并向目标区块链用户推荐该目标信息。
本实施例中,根据用户群体进行目标信息的推荐,是以多个用户的数据为基础,相比于仅针对单个用户的数据,可以获得更加全面的数据,因此,在进行信息推荐时可以生成内容更加丰富的目标信息,更能命中用户的兴趣点,推荐精度更高。
其中,根据推荐算法向目标区块链用户推荐目标信息的方式除了以上提及的方式之外,还可以是,根据TOP-N算法对目标数据进行计算,对目标数据的频数进行排序,选取在预设范围内的统计结果对应的目标数据生成目标信息,并向目标区块链用户推荐该目标信息,其中,目标数据为目标模糊化数据的频数统计结果。
例如,多个同类区块链用户对观看过的电影进行评分,则每个同类区块链用户的评分结果即为预处理数据,在经过本地化差分隐私处理之后,得到该多个同类区块链的目标模糊化数据,该目标模糊化数据恢复之后得到目标数据。本实施例中,对目标模糊化数据进行恢复是对其进行频数统计,因此,目标数据也就是频数统计结果,此时目标数据已经与该预处理数据存在较大的区别,但是对于群体用户的目标数据,可以保持原来群体用户的预处理数据的大致趋势。
之后,根据TOP-N算法对目标数据进行计算,对目标数据的频数进行排序,选取在预设范围内的统计结果对应的目标数据生成目标信息,并向目标区块链用户推荐该目标信息,即按照顺序对多项目标数据进行排序,将排名靠前的N个目标数据作为目标信息。其中,N的具体数值可以人为地设定,由于从大到小排序之后的前N个目标数据可以表明用户群体的喜好趋势,可以认为该目标数据对应的信息即为用户所感兴趣的信息。
本实施例可以在保证用户隐私不受侵犯的前提下,为其提供一定精度的推荐计算,并且给予用户充分的自主选择权,使用户能够在隐私保护性能和推荐精度之间进行权衡。此外,由于区块链具有不可篡改的特性,使本实施例的方法实现安全可验证的存储,保证了数据的真实性,并且具有稳定性、健壮性以及可扩展性,这是传统推荐系统架构所不具备的。
上面对本申请实施例中的信息推荐方法进行了描述,下面对本申请实施例中的推荐系统进行描述,请参阅图3,本申请实施例中基于区块链和本地化差分隐私保护的推荐系统一个实施例包括:
获取单元301,用于从区块链的目标区块中获取用于聚类分析的第一函数;
聚类分析单元302,用于并根据第一函数对区块链用户的用户数据进行聚类分析,得到区块链用户的桶号;
获取单元301还用于从目标区块中获取用于本地化差分隐私处理的目标哈希函数;
处理单元303,用于根据目标哈希函数对区块链用户的预处理数据进行本地化差分隐私处理,得到预处理数据对应的模糊化数据,预处理数据为区块链用户对用户数据进行预处理而得到的数据;
收发单元304,用于向星际文件系统上传模糊化数据,并接收星际文件系统根据设定的哈希算法对模糊化数据进行计算而生成的哈希值;
收发单元304还用于将区块链用户的桶号、模糊化数据对应的哈希值上传至区块链中;
推荐单元305,用于基于区块链用户的桶号以及模糊化数据对应的哈希值,根据推荐算法向目标区块链用户推荐目标信息。
本实施例一种优选的实施方式中,推荐单元305具体用于从区块链中获取多个区块链用户的桶号以及模糊化数据对应的哈希值,其中,每个区块链用户的桶号与哈希值相对应,在多个区块链用户的桶号和哈希值中,确定与目标区块链用户的桶号相同的目标桶号,并获取目标桶号对应的目标哈希值,目标桶号与目标哈希值对应于同类区块链用户,向星际文件系统获取目标哈希值对应的目标模糊化数据,根据目标模糊化数据在本地化差分隐私处理的阶段中所使用的哈希函数,对目标模糊化数据进行恢复,得到同类区块链用户的目标数据,基于同类区块链用户的目标数据,根据推荐算法向目标区块链用户推荐目标信息。
本实施例另一优选的实施方式中,推荐单元305具体用于根据TOP-N算法对目标数据进行计算,对目标数据的频数进行排序,选取在预设范围内的统计结果对应的目标数据生成目标信息,并向目标区块链用户推荐目标信息,目标数据为目标模糊化数据的频数统计结果。
本实施例另一优选的实施方式中,获取单元301具体用于从区块链的创世区块中获取第一函数,第一函数预先上传至创世区块中;
获取单元301具体用于从创世区块中获取目标哈希函数,目标哈希函数预先上传至创世区块中。
本实施例另一优选的实施方式中,获取单元301具体用于从创世区块中的哈希函数集合中获取目标哈希函数,哈希函数集合预先上传至创世区块中。
本实施例另一优选的实施方式中,收发单元304具体用于将区块链用户的桶号、模糊化数据对应的哈希值以及区块链用户的用户名、当前时间戳上传至区块链中。
本实施例中,推荐系统中各单元所执行的操作与前述图1至2所示实施例中描述的类似,此处不再赘述。
本实施例中,聚类分析单元302对区块链用户的用户数据进行聚类分析,以及处理单元303对该区块链用户的预处理数据进行本地化差分隐私处理而得到模糊化数据,并由星际文件系统对该模糊化数据进行哈希计算而得到哈希值,在得到区块链用户的桶号以及哈希值之后,推荐单元305可以基于该桶号及哈希值,根据推荐算法向目标区块链用户进行信息推荐。由于本申请实施例的信息推荐过程是由用户终端的应用程序执行的,即用户本地端进行信息推荐,因此,免除了中心服务器的参与,避免中心服务器被攻击而导致用户信息泄露。对用户的预处理数据进行了本地化差分隐私处理,这也保证了用户数据的隐秘性,避免用户数据流出本地,增强了数据的安全性,降低隐私泄露的风险。
下面对本申请实施例中的推荐系统进行描述,请参阅图4,本申请实施例中基于区块链和本地化差分隐私保护的推荐系统一个实施例包括:
该推荐系统400可以包括一个或一个以上中央处理器(central processingunits,CPU)401和存储器405,该存储器405中存储有一个或一个以上的应用程序或数据。
其中,存储器405可以是易失性存储或持久存储。存储在存储器405的程序可以包括一个或一个以上模块,每个模块可以包括对推荐系统中的一系列指令操作。更进一步地,中央处理器401可以设置为与存储器405通信,在推荐系统400上执行存储器405中的一系列指令操作。
推荐系统400还可以包括一个或一个以上电源402,一个或一个以上有线或无线网络接口403,一个或一个以上输入输出接口404,和/或,一个或一个以上操作系统,例如Windows ServerTM,Mac OS XTM,UnixTM,LinuxTM,FreeBSDTM等。
该中央处理器401可以执行前述图1至图2所示实施例中推荐系统所执行的操作,具体此处不再赘述。
本申请实施例还提供了一种计算机存储介质,其中一个实施例包括:该计算机存储介质中存储有指令,该指令在计算机上执行时,使得该计算机执行前述图1至图2所示实施例中推荐系统所执行的操作。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统,装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,read-onlymemory)、随机存取存储器(RAM,random access memory)、磁碟或者光盘等各种可以存储程序代码的介质。

Claims (8)

1.一种基于区块链和本地化差分隐私保护的信息推荐方法,其特征在于,包括:
从区块链的目标区块中获取用于聚类分析的第一函数,并根据所述第一函数对区块链用户的用户数据进行聚类分析,得到所述区块链用户的桶号,所述桶号用于表示用户的兴趣爱好;
从所述目标区块中获取用于本地化差分隐私处理的目标哈希函数,并根据所述目标哈希函数对所述区块链用户的预处理数据进行本地化差分隐私处理,得到所述预处理数据对应的模糊化数据,所述预处理数据为所述区块链用户对用户数据进行预处理而得到的数据;
向星际文件系统上传所述模糊化数据,并接收所述星际文件系统根据设定的哈希算法对所述模糊化数据进行计算而生成的哈希值;
将所述区块链用户的桶号、所述模糊化数据对应的哈希值上传至所述区块链中;
基于所述区块链用户的桶号以及所述模糊化数据对应的哈希值,根据推荐算法向目标区块链用户推荐目标信息;
其中,所述基于所述区块链用户对应的桶号以及所述模糊化数据对应的哈希值,根据推荐算法向目标区块链用户推荐目标信息,包括:
从所述区块链中获取多个所述区块链用户的桶号以及模糊化数据对应的哈希值,其中,每个所述区块链用户的桶号与哈希值相对应;
在多个所述区块链用户的桶号和哈希值中,确定与所述目标区块链用户的桶号相同的目标桶号,并获取所述目标桶号对应的目标哈希值,所述目标桶号与所述目标哈希值对应于同类区块链用户;
向所述星际文件系统获取所述目标哈希值对应的目标模糊化数据;
根据所述目标模糊化数据在所述本地化差分隐私处理的阶段中所使用的哈希函数,对所述目标模糊化数据进行恢复,得到所述同类区块链用户的目标数据;
基于所述同类区块链用户的目标数据,根据所述推荐算法向所述目标区块链用户推荐所述目标信息。
2.根据权利要求1所述的信息推荐方法,其特征在于,所述基于所述同类区块链用户的目标数据,根据所述推荐算法向所述目标区块链用户推荐所述目标信息,包括:
根据TOP-N算法对所述目标数据进行计算,对目标数据的频数进行排序,选取在预设范围内的统计结果对应的目标数据生成目标信息,并向所述目标区块链用户推荐所述目标信息,所述目标数据为所述目标模糊化数据的频数统计结果。
3.根据权利要求1所述的信息推荐方法,其特征在于,所述从区块链的目标区块中获取用于聚类分析的第一函数,包括:
从所述区块链的创世区块中获取所述第一函数,所述第一函数预先上传至所述创世区块中;
所述从所述目标区块中获取用于本地化差分隐私处理的目标哈希函数,包括:
从所述创世区块中获取所述目标哈希函数,所述目标哈希函数预先上传至所述创世区块中。
4.根据权利要求3所述的信息推荐方法,其特征在于,所述从所述创世区块中获取所述目标哈希函数,包括:
从所述创世区块中的哈希函数集合中获取所述目标哈希函数,所述哈希函数集合预先上传至所述创世区块中。
5.根据权利要求1所述的信息推荐方法,其特征在于,所述将所述区块链用户的桶号、所述模糊化数据对应的哈希值上传至所述区块链中,包括
将所述区块链用户的桶号、所述模糊化数据对应的哈希值以及所述区块链用户的用户名、当前时间戳上传至所述区块链中。
6.一种基于区块链和本地化差分隐私保护的推荐系统,其特征在于,包括:
获取单元,用于从区块链的目标区块中获取用于聚类分析的第一函数;
聚类分析单元,用于并根据所述第一函数对区块链用户的用户数据进行聚类分析,得到所述区块链用户的桶号,所述桶号用于表示用户的兴趣爱好;
所述获取单元还用于从所述目标区块中获取用于本地化差分隐私处理的目标哈希函数;
处理单元,用于根据所述目标哈希函数对所述区块链用户的预处理数据进行本地化差分隐私处理,得到所述预处理数据对应的模糊化数据,所述预处理数据为所述区块链用户对用户数据进行预处理而得到的数据;
收发单元,用于向星际文件系统上传所述模糊化数据,并接收所述星际文件系统根据设定的哈希算法对所述模糊化数据进行计算而生成的哈希值;
所述收发单元还用于将所述区块链用户的桶号、所述模糊化数据对应的哈希值上传至所述区块链中;
推荐单元,用于基于所述区块链用户的桶号以及所述模糊化数据对应的哈希值,根据推荐算法向目标区块链用户推荐目标信息;
其中,所述推荐单元具体用于从所述区块链中获取多个所述区块链用户的桶号以及模糊化数据对应的哈希值,其中,每个所述区块链用户的桶号与哈希值相对应,在多个所述区块链用户的桶号和哈希值中,确定与所述目标区块链用户的桶号相同的目标桶号,并获取所述目标桶号对应的目标哈希值,所述目标桶号与所述目标哈希值对应于同类区块链用户,向所述星际文件系统获取所述目标哈希值对应的目标模糊化数据,根据所述目标模糊化数据在所述本地化差分隐私处理的阶段中所使用的哈希函数,对所述目标模糊化数据进行恢复,得到所述同类区块链用户的目标数据,基于所述同类区块链用户的目标数据,根据所述推荐算法向所述目标区块链用户推荐所述目标信息。
7.一种基于区块链和本地化差分隐私保护的推荐系统,其特征在于,包括:
处理器、存储器、总线、输入输出设备;
所述处理器与所述存储器、输入输出设备相连;
所述总线分别连接所述处理器、存储器以及输入输出设备;
所述输入输出设备用于从区块链的目标区块中获取用于聚类分析的第一函数;
所述处理器用于根据所述第一函数对区块链用户的用户数据进行聚类分析,得到所述区块链用户的桶号,所述桶号用于表示用户的兴趣爱好;
所述输入输出设备还用于从所述目标区块中获取用于本地化差分隐私处理的目标哈希函数;
所述处理器还用于根据所述目标哈希函数对所述区块链用户的预处理数据进行本地化差分隐私处理,得到所述预处理数据对应的模糊化数据,所述预处理数据为所述区块链用户对用户数据进行预处理而得到的数据;
所述输入输出设备还用于向星际文件系统上传所述模糊化数据,并接收所述星际文件系统根据设定的哈希算法对所述模糊化数据进行计算而生成的哈希值,将所述区块链用户的桶号、所述模糊化数据对应的哈希值上传至所述区块链中;
所述处理器还用于基于所述区块链用户的桶号以及所述模糊化数据对应的哈希值,根据推荐算法向目标区块链用户推荐目标信息;
其中,所述处理器具体用于从所述区块链中获取多个所述区块链用户的桶号以及模糊化数据对应的哈希值,其中,每个所述区块链用户的桶号与哈希值相对应;在多个所述区块链用户的桶号和哈希值中,确定与所述目标区块链用户的桶号相同的目标桶号,并获取所述目标桶号对应的目标哈希值,所述目标桶号与所述目标哈希值对应于同类区块链用户;向所述星际文件系统获取所述目标哈希值对应的目标模糊化数据;根据所述目标模糊化数据在所述本地化差分隐私处理的阶段中所使用的哈希函数,对所述目标模糊化数据进行恢复,得到所述同类区块链用户的目标数据;基于所述同类区块链用户的目标数据,根据所述推荐算法向所述目标区块链用户推荐所述目标信息。
8.一种计算机存储介质,其特征在于,所述计算机存储介质中存储有指令,所述指令在计算机上执行时,使得所述计算机执行如权利要求1至5中任一项所述的方法。
CN202010806166.8A 2020-08-12 2020-08-12 基于区块链和本地化差分隐私保护的信息推荐方法及系统 Active CN111931233B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010806166.8A CN111931233B (zh) 2020-08-12 2020-08-12 基于区块链和本地化差分隐私保护的信息推荐方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010806166.8A CN111931233B (zh) 2020-08-12 2020-08-12 基于区块链和本地化差分隐私保护的信息推荐方法及系统

Publications (2)

Publication Number Publication Date
CN111931233A CN111931233A (zh) 2020-11-13
CN111931233B true CN111931233B (zh) 2022-11-15

Family

ID=73310463

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010806166.8A Active CN111931233B (zh) 2020-08-12 2020-08-12 基于区块链和本地化差分隐私保护的信息推荐方法及系统

Country Status (1)

Country Link
CN (1) CN111931233B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117370673B (zh) * 2023-12-08 2024-02-06 中电科大数据研究院有限公司 算法推荐服务的数据管理方法及装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110147996A (zh) * 2019-05-21 2019-08-20 中央财经大学 一种基于区块链的数据交易本地化差分隐私保护方法及装置
CN110933093A (zh) * 2019-12-04 2020-03-27 广西民族大学 一种基于差分隐私保护技术的区块链数据共享平台及方法
CN110968644A (zh) * 2019-11-29 2020-04-07 腾讯科技(深圳)有限公司 一种数据处理方法以及设备
CN111506924A (zh) * 2020-06-08 2020-08-07 Oppo广东移动通信有限公司 一种差分隐私保护方法、装置及计算机可读存储介质

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11386295B2 (en) * 2018-08-03 2022-07-12 Cerebri AI Inc. Privacy and proprietary-information preserving collaborative multi-party machine learning

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110147996A (zh) * 2019-05-21 2019-08-20 中央财经大学 一种基于区块链的数据交易本地化差分隐私保护方法及装置
CN110968644A (zh) * 2019-11-29 2020-04-07 腾讯科技(深圳)有限公司 一种数据处理方法以及设备
CN110933093A (zh) * 2019-12-04 2020-03-27 广西民族大学 一种基于差分隐私保护技术的区块链数据共享平台及方法
CN111506924A (zh) * 2020-06-08 2020-08-07 Oppo广东移动通信有限公司 一种差分隐私保护方法、装置及计算机可读存储介质

Non-Patent Citations (9)

* Cited by examiner, † Cited by third party
Title
Blockchain-Enabled Contextual Online Learning__under Local Differential Privacy for Coronary Heart__Disease Diagnosis in Mobile Edge Computing;Xin Liu等;《IEEE Journal of Biomedical and Health Informatics》;20200621;正文第1-11页 *
Differential Privacy in Blockchain Technology:A Futuristic Approach;Muneeb Ul Hassan等;《http://arxiv.org/abs/1910.04316v3》;20200418;正文第1-27页 *
Differential Privacy-Based Blockchain for Industrial Internet of Things;Keke Gai等;《IEEE TRANSACTIONS ON INDUSTRIAL INFORMATICS》;20191231;正文第1-11页 *
DP2G_(sister):差分隐私社交网络图发布模型;殷轶平等;《信息技术与网络安全》;20180610;第第37卷卷(第06期);第11-17页 *
基于区块链的物联网节点位置隐私保护模型;佘维等;《应用科学学报》;20200130;第第38卷卷(第01期);第139-151页 *
基于差分隐私的社交网络隐私保护;黄茜茜等;《信息技术与网络安全》;20180610;第第37卷卷(第06期);第36-40页 *
大数据环境下的多维敏感度最佳k值匿名框架;南楠等;《计算机应用与软件》;20200612;第第37卷卷(第06期);第297-302页 *
差分隐私保护的学习资源学习热度推荐;刘梦君等;《现代教育技术》;20190515;第第29卷卷(第05期);第99-105页 *
考虑隐私保护的智能推荐研究论述;公晓璐;《智库时代》;20200323(第12期);第242-243 *

Also Published As

Publication number Publication date
CN111931233A (zh) 2020-11-13

Similar Documents

Publication Publication Date Title
Huang et al. Data poisoning attacks to deep learning based recommender systems
CN110020122B (zh) 一种视频推荐方法、系统及计算机可读存储介质
US20110307551A1 (en) Sharing of User Preferences
EP3008681A2 (en) Contextual mobile application advertisements
CN104053023B (zh) 一种确定视频相似度的方法及装置
JP2015513133A (ja) キャラクター・ヒストグラムを用いるスパム検出のシステムおよび方法
CN111400546B (zh) 一种视频召回方法、视频推荐方法及装置
WO2013044769A1 (zh) 基于消息内容的信息推荐方法和系统
WO2016165414A1 (zh) 一种推送信息的方法和装置
Li et al. PhishBox: An approach for phishing validation and detection
CN112351088A (zh) 一种cdn缓存方法、装置、计算机设备及存储介质
US10678946B2 (en) Method and apparatus for detecting label data leakage channel
CN111931233B (zh) 基于区块链和本地化差分隐私保护的信息推荐方法及系统
EP2725538B1 (en) Privacy protected dynamic clustering of end users
EP2827277A1 (en) Privacy protection in personalisation services
US8171020B1 (en) Spam detection for user-generated multimedia items based on appearance in popular queries
Jeziorowski et al. Towards image-based dark vendor profiling: an analysis of image metadata and image hashing in dark web marketplaces
Bai et al. Application behavior identification in DNS tunnels based on spatial-temporal information
US8356076B1 (en) Apparatus and method for performing spam detection and filtering using an image history table
CN111918136B (zh) 一种兴趣的分析方法及装置、存储介质、电子设备
CN113761271A (zh) 用于视频推荐的方法及装置、带显示屏的冰箱
CN109543094B (zh) 一种基于矩阵分解的隐私保护内容推荐方法
Breitinger et al. DFRWS EU 10-year review and future directions in Digital Forensic Research
CN114385922A (zh) 一种基于布隆滤波器的图书馆系统知识推荐方法
CN111290713B (zh) 一种数据存储方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant