CN107609419A - 一种数字图书馆用户的浏览偏好隐私保护方法及系统 - Google Patents
一种数字图书馆用户的浏览偏好隐私保护方法及系统 Download PDFInfo
- Publication number
- CN107609419A CN107609419A CN201710815027.XA CN201710815027A CN107609419A CN 107609419 A CN107609419 A CN 107609419A CN 201710815027 A CN201710815027 A CN 201710815027A CN 107609419 A CN107609419 A CN 107609419A
- Authority
- CN
- China
- Prior art keywords
- books
- request
- browse
- user
- pseudo
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种数字图书馆用户的浏览偏好隐私保护方法及系统。所述方法包括以下步骤:(1)获取用户提交的图书浏览请求,根据用户历史图书浏览请求序列、历史图书浏览伪请求序列集、以及图书分类层次树,构造一组与用户提交的图书浏览请求相似的图书浏览伪请求,并提交给数字图书馆服务器端;(2)获取服务器端返回的请求结果,过滤其中图书浏览伪请求的对应请求结果,得到用户提交的图书浏览请求的对应请求结果并反馈给用户。所述系统包括图书浏览请求提交模块、以及请求结果筛选模块。本发明能在不损害数字图书馆服务的实用性、准确性和高效性的前提下,确保用户图书浏览偏好隐私在不可信数字图书馆服务器端的安全性。
Description
技术领域
本发明属于隐私保护技术领域,更具体地,涉及一种数字图书馆用户的浏览偏好隐私保护方法及系统。
背景技术
随着云计算等技术的迅速发展,数字图书馆已成为人们日常生活的重要组成部分。然而,在给用户带来便利同时,数字图书馆服务器也记录了大量的用户个人信息,引发了数字图书馆用户对隐私安全的担忧。虽然制定用户隐私权相关的法律法规能在一定程度上保护用户隐私,但是并不能根本上解决用户隐私安全问题,数字图书馆的用户隐私安全问题更多地需要采用隐私保护技术加以解决。数字图书馆的用户隐私主要表现为两个方面:(1)资料隐私,包括身份标识隐私(如身份证)和背景资料隐私(如职业);(2)行为隐私,即使用图书馆服务时(如图书浏览、图书检索等),用户行为(即用户服务请求)背后所蕴含的用户兴趣偏好隐私(如图书浏览行为蕴含着用户偏好的图书类别)。资料隐私安全问题可通过数据加密较好地解决。然而,加密并不适用于用户行为隐私,因为图书馆服务需要服务器支持,加密会使得服务器因无法“读懂”用户请求,而使得服务变得不可用。为此,如何有效地保护数字图书馆用户的行为偏好隐私,已成为一个至关重要的问题。
数字图书馆用户行为形式多样,例如浏览行为、检索行为等。其中,图书浏览行为是指用户发送浏览服务请求(URL请求),以获取浏览关于图书的基本信息介绍(响应页面),是数字图书馆用户最基本行为之一。针对不可信网络环境下的用户隐私安全问题,目前已给出了许多有效的方法,包括:隐私加密、掩盖变换和匿名
(1)隐私加密是指通过加密变换,使得用户行为对服务器端不可见,以达到隐私保护的目的。该类技术不仅要求额外硬件和复杂算法的支持,且要求改变服务器端的服务算法,从而引起整个平台架构的改变,降低了方法在数字图书馆中的可用性。
(2)敏感数据掩盖技术是指通过伪造数据或者使用一般化数据来掩盖涉及用户敏感偏好的行为数据。例如,针对个性网页搜索等应用场景,研究者提出了一些具体的变换掩盖技术。由于改写了用户行为数据,该类方法对服务的准确性会造成一定负面影响,即其隐私保护需以牺牲服务质量为代价,难以满足数字图书馆的应用需求。
(3)匿名化技术是用户隐私保护中广泛使用的一种技术,它通过隐藏或伪装用户身份标识,允许用户以不暴露身份的方式使用系统。通过匿名化技术收集的用户数据往往难以保证质量。更重要地是,数字图书馆一般要求用户必须实名登录后才能使用各项图书馆服务,所以,匿名化隐私保护技术难以有效地应用于数字图书馆。
综上所述,已有用户行为隐私保护技术并不是针对数字图书馆提出,它们在实用性、准确性、安全性等方面仍无法满足数字图书馆的实际应用需求。理想的数字图书馆行为偏好隐私方法应满足以下要求:确保用户行为隐私安全性;确保服务结果准确性(即对比引入隐私方法前后,用户最终服务结果应一致);不损害数字图书馆信息服务实用性(即不改变服务器端的服务算法,不需要额外硬件支持,也不会对用户服务的执行效率构成显著影响)。
发明内容
针对现有技术的以上缺陷或改进需求,本发明提供了一种数字图书馆用户的浏览偏好隐私保护方法及系统,其目的在于在不影响服务器可用性的前提下,通过构建图书浏览伪请求,与用户请求混淆,由此解决现有技术用户浏览隐私暴露或者影响服务器性能导致体验不佳的技术问题。
为实现上述目的,按照本发明的一个方面,提供了一种数字图书馆用户的浏览偏好隐私保护方法,包括以下步骤:
(1)图书浏览请求提交:获取用户提交的图书浏览请求,根据用户历史图书浏览请求序列、历史图书浏览伪请求序列集、以及图书分类层次树,构造一组与用户提交的图书浏览请求相似的图书浏览伪请求,并提交给数字图书馆服务器端;
(2)请求结果筛选:获取服务器端返回的请求结果,过滤其中图书浏览伪请求的对应请求结果,得到用户提交的图书浏览请求的对应请求结果并反馈给用户。
优选地,所述数字图书馆用户的浏览偏好隐私保护方法,其所述图书浏览伪请求序列集为多个与所述用户历史图书浏览请求序列长度相同的历史图书浏览伪请求序列的集合。
优选地,所述数字图书馆用户的浏览偏好隐私保护方法,其所述图书浏览伪请求与用户提交的图书浏览请求相似,具体指:
所述图书浏览伪请求与用户提交的图书浏览请求的频度特征相似且类别频度相似。
优选地,所述数字图书馆用户的浏览偏好隐私保护方法,其所述构造一组与用户提交的图书浏览请求相似的图书浏览伪请求,具体为:
对于历史图书浏览伪请求序列集中的每一序列:
(1-1)构造一组候选图书浏览伪请求,使得其中每一候选图书浏览伪请求与用户提交的图书浏览请求的频度特征相似;
(1-2)对于步骤(1-1)中获取的候选图书浏览伪请求中剔除其与用户提交的图书浏览请求的类别频度不相似的候选图书浏览伪请求,获得与用户提交的图书浏览请求的频度特征相似且类别频度相似的候选图书浏览伪请求;
(1-3)在步骤(1-2)中获得的与用户提交的图书浏览请求的频度特征相似且类别频度相似的候选图书浏览伪请求中,随机选择一个伪请求,作为关联所述历史图书浏览伪请求序列的图书浏览伪请求。
优选地,所述数字图书馆用户的浏览偏好隐私保护方法,其所述图书浏览伪请求与用户提交的图书浏览请求的频度特征相似,即:
所述图书浏览伪请求关于其对应的历史图书浏览伪请求序列与用户提交的图书浏览请求关于用户历史图书浏览请求序列的频度特征相似性超过预设频度特征相似性阈值;
或者所述图书浏览伪请求关于其对应的历史图书浏览伪请求序列与用户提交的图书浏览请求关于用户历史图书浏览请求序列的频度特征值差异小于预设频度特征差异阈值;
所述图书浏览伪请求与用户提交的图书浏览请求的类别频度相似,即:
所述图书浏览伪请求关于其对应的历史图书浏览伪请求序列与用户提交的图书浏览请求关于用户历史图书浏览请求序列的类别频度相似性超过预设类别频度相似性阈值;
或者所述图书浏览伪请求关于其对应的历史图书浏览伪请求序列与用户提交的图书浏览请求关于用户历史图书浏览请求序列的类别频度特征差异小于预设类别频度差异阈值。
按照本发明的另一方面,提供了一种数字图书馆用户的浏览偏好隐私保护系统,包括图书浏览请求提交模块、以及请求结果筛选模块;
所述图书浏览请求提交模块,用于获取用户提交的图书浏览请求,并根据内置的用户历史图书浏览请求序列、历史图书浏览伪请求序列集、以及图书分类层次树数据构造一组与用户提交的图书浏览请求相似的图书浏览伪请求,并提交给数字图书馆服务器端;
所述请求结果筛选,用于获取服务器端返回的请求结果,过滤其中图书浏览伪请求的对应请求结果,得到用户提交的图书浏览请求的对应请求结果并反馈给用户。
优选地,所述数字图书馆用户的浏览偏好隐私保护系统,其所述图书浏览伪请求序列集为多个与所述用户历史图书浏览请求序列长度相同的历史图书浏览伪请求序列的集合。
优选地,所述数字图书馆用户的浏览偏好隐私保护系统,其所述图书浏览伪请求与用户提交的图书浏览请求相似,具体指:
所述图书浏览伪请求与用户提交的图书浏览请求的频度特征相似且类别频度相似。
优选地,所述数字图书馆用户的浏览偏好隐私保护系统,其所述图书浏览请求提交模块,包括:频度特征筛选子模块、类别频度筛选子模块、以及随机选择子模块;
所述频度特征筛选子模块,用于构造一组候选图书浏览伪请求,使得其中每一候选图书浏览伪请求与用户提交的图书浏览请求的频度特征相似,并将所述候选图书浏览伪请求提交给类别频度筛选子模块;
所述类别频度筛选子模块,用于接收所述频度特征筛选子模块提交的所述候选图书浏览伪请求,并剔除其中与用户提交的图书浏览请求的类别频度不相似的候选图书浏览伪请求,将获得的候选图书浏览伪请求提交给随机选择子模块;
所述随机选择子模块,用于接收所述频度筛选子模块提交的所述类别频度筛选子模块提交的候选图书浏览伪请求中随机选择一个伪请求,作为关联所述历史图书浏览伪请求序列的图书浏览伪请求。
优选地,所述数字图书馆用户的浏览偏好隐私保护系统,其所述图书浏览伪请求与用户提交的图书浏览请求的频度特征相似,即:
所述图书浏览伪请求关于其对应的历史图书浏览伪请求序列与用户提交的图书浏览请求关于用户历史图书浏览请求序列的频度特征相似性超过预设频度特征相似性阈值;
或者所述图书浏览伪请求关于其对应的历史图书浏览伪请求序列与用户提交的图书浏览请求关于用户历史图书浏览请求序列的频度特征值差异小于预设频度特征差异阈值;
所述图书浏览伪请求与用户提交的图书浏览请求的类别频度相似,即:
所述图书浏览伪请求关于其对应的历史图书浏览伪请求序列与用户提交的图书浏览请求关于用户历史图书浏览请求序列的类别频度相似性超过预设类别频度相似性阈值;
或者所述图书浏览伪请求关于其对应的历史图书浏览伪请求序列与用户提交的图书浏览请求关于用户历史图书浏览请求序列的类别频度特征差异小于预设类别频度差异阈值。
总体而言,通过本发明所构思的以上技术方案与现有技术相比,能够取得下列有益效果。
本发明能在不损害数字图书馆服务的实用性、准确性和高效性的前提下,确保用户图书浏览偏好隐私在不可信数字图书馆服务器端的安全性。
本发明提供的数字图书馆用户的浏览偏好隐私保护方法能有效地降低用户敏感偏好的暴露程度,且攻击者难以从它所构造的图书浏览伪请求序列中区分出用户提交的图书浏览请求序列。
附图说明
图1是本发明提供的数字图书馆用户的浏览偏好隐私保护系统的结构示意图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。此外,下面所描述的本发明各个实施方式中所涉及到的技术特征只要彼此之间未构成冲突就可以相互组合。
本文将以数字图书馆用户的图书浏览偏好隐私为研究对象,构建用户图书浏览偏好隐私保护模型和算法,以期在保证图书服务可用性的前提下,确保用户图书浏览隐私在不可信数字图书馆服务器端的安全性。
本发明提供的数字图书馆用户的浏览偏好隐私保护方法,包括以下步骤:
(1)图书浏览请求提交:获取用户提交的图书浏览请求,根据用户历史图书浏览请求序列、历史图书浏览伪请求序列集、以及图书分类层次树,构造一组与用户提交的图书浏览请求相似的图书浏览伪请求,并提交给数字图书馆服务器端;所述图书浏览伪请求序列集为多个与所述用户历史图书浏览请求序列长度相同的历史图书浏览伪请求序列的集合。
所述图书浏览伪请求与用户提交的图书浏览请求相似,具体指:
所述图书浏览伪请求与用户提交的图书浏览请求的频度特征相似且类别频度相似。
所述构造一组与用户提交的图书浏览请求相似的图书浏览伪请求,具体为:
对于历史图书浏览伪请求序列集中的每一序列:
(1-1)构造一组候选图书浏览伪请求,使得其中每一候选图书浏览伪请求与用户提交的图书浏览请求的频度特征相似;
(1-2)对于步骤(1-1)中获取的候选图书浏览伪请求中剔除其与用户提交的图书浏览请求的类别频度不相似的候选图书浏览伪请求,获得与用户提交的图书浏览请求的频度特征相似且类别频度相似的候选图书浏览伪请求;
(1-3)在步骤(1-2)中获得的与用户提交的图书浏览请求的频度特征相似且类别频度相似的候选图书浏览伪请求中,随机选择一个伪请求,作为关联所述历史图书浏览伪请求序列的图书浏览伪请求。
由上可知,历史图书浏览伪请求序列集,可获得一组与用户提交的图书浏览请求相似的图书浏览伪请求,所述一组图书浏览伪请求其中每一个分别与历史图书浏览伪请求序列中的序列相关联。
所述图书浏览伪请求与用户提交的图书浏览请求的频度特征相似,即所述图书浏览伪请求关于其对应的历史图书浏览伪请求序列与用户提交的图书浏览请求关于用户历史图书浏览请求序列的频度特征相似性超过预设频度特征相似性阈值;或者所述图书浏览伪请求关于其对应的历史图书浏览伪请求序列与用户提交的图书浏览请求关于用户历史图书浏览请求序列的频度特征值差异小于预设频度特征差异阈值。
所述图书浏览伪请求关于其对应的历史图书浏览伪请求序列与用户提交的图书浏览请求关于用户历史图书浏览请求序列的频度特征相似性,即历史图书浏览伪请求序列的频度特征向量与用户图书浏览请求序列的频度特征向量相似性,记作按照如下方法计算:
其中,为用户提交的图书浏览请求与用户历史图书浏览请求序列构成的图书浏览请求序列,为其频度向量;为所述图书浏览伪请求与其对应的历史图书浏览伪请求序列构成的图书浏览请求序列,为其频度向量;对于任意给定一个图书浏览请求序列频度向量为:
其中,为图书浏览请求bk关于图书浏览请求序列的频度特征值,即图书图书浏览请求bk图书浏览请求序列中的出现频度,按照如下方法计算:
所述图书浏览伪请求关于其对应的历史图书浏览伪请求序列与用户提交的图书浏览请求关于用户历史图书浏览请求序列的频度特征值差异小于预设频度特征差异阈值,即满足:
其中,d1为频度特征差异阈值,为所述图书浏览伪请求b关于其对应的历史图书浏览伪请求序列的频度特征值,为用户提交的图书浏览请求关于的频度特征值。
所述图书浏览伪请求与用户提交的图书浏览请求的类别频度相似,即所述图书浏览伪请求关于其对应的历史图书浏览伪请求序列与用户提交的图书浏览请求关于用户历史图书浏览请求序列的类别频度相似性超过预设类别频度相似性阈值;或者所述图书浏览伪请求关于其对应的历史图书浏览伪请求序列与用户提交的图书浏览请求关于用户历史图书浏览请求序列的类别频度特征差异小于预设类别频度差异阈值。
所述图书浏览伪请求关于其对应的历史图书浏览伪请求序列与用户提交的图书浏览请求关于用户历史图书浏览请求序列的类别频度相似性,即历史图书浏览伪请求序列的类别频度特征向量与用户图书浏览请求序列的类别频度特征向量相似性,按照如下方法计算:
其中,为用户提交的图书浏览请求与用户历史图书浏览请求序列构成的图书浏览请求序列,为其关于图书层次r的类别频度向量;为所述图书浏览伪请求与其对应的历史图书浏览伪请求序列构成的图书浏览请求序列,为其关于图书层次r的类别频度向量;任意给定图书浏览请求序列记图书浏览请求层次为r(1≤r≤r*)的类别为其关于层次为r的类别频度向量为:
其中为图书类别关于图书浏览请求序列Bk的出现频度,即图书类别在图书浏览请求序列Bk中出现的频度,按照如下方法计算:
所述图书浏览伪请求关于其对应的历史图书浏览伪请求序列与用户提交的图书浏览请求关于用户历史图书浏览请求序列的类别频度特征差异小于预设类别频度差异阈值,即满足:
其中,d2为类别频度差异阈值,FrA(ar,Bt)为图书类别ar关于所述图书浏览伪请求b关于其对应的历史图书浏览伪请求序列的出现频度,为图书类别关于用户历史图书浏览请求序列B0的出现频度,计算方法同上。
(2)请求结果筛选:获取服务器端返回的请求结果,过滤其中图书浏览伪请求的对应请求结果,得到用户提交的图书浏览请求的对应请求结果并反馈给用户。
可以看出,在算法中,图书分类层次树是一个非常重要的数据结构。图书分类层次树具有以下特征:一、叶子节点表示图书;二、非叶子节点表示图书类别;三、每本图书包含于某个图书类别;四、每个图书类别又包含于某个父类别(根类别除外)。图书分类层次树可借助于国家发布的图书分类办法预先构造。因此图书分类层次树是预先存在的。图书分类层次树的非叶子节点(图书类别)以及部分叶子节点(图书)将被预先加载到内存中,以提高算法的执行效率。对于图书分类树的叶子节点信息,可以通过网络爬虫预先获取(或者预先向数字图书馆服务器索取)。当面对小型数字图书馆时(图书量在百万级别),我们可以预先在内存中存储所有的叶子节点信息(即存储整个图书分类树)。当面对的是大型数字图书馆时(图书量超过千万级别),我们将难以预先在内存中存储所有的叶子节点信息。此时,我们采用以下策略进行处理:首先,对各个最低层次的图书类别,随机挑选它所包含的部分图书,并加载到内存中(而不是加载所有图书),以降低内存空间开销;然后,间隔一定时间,自动为各个图书类别随机新一批图书,以替换内存中的图书信息。
本发明提供的数字图书馆用户的浏览偏好隐私保护系统,如图1所示,包括:图书浏览请求提交模块、以及请求结果筛选模块;
所述图书浏览请求提交模块,用于获取用户提交的图书浏览请求,并根据内置的用户历史图书浏览请求序列、历史图书浏览伪请求序列集、以及图书分类层次树数据构造一组与用户提交的图书浏览请求相似的图书浏览伪请求,并提交给数字图书馆服务器端;所述图书浏览伪请求序列集为多个与所述用户历史图书浏览请求序列长度相同的历史图书浏览伪请求序列的集合。
所述图书浏览请求提交模块,包括:频度特征筛选子模块、类别频度筛选子模块、以及随机选择子模块;
所述频度特征筛选子模块,用于构造一组候选图书浏览伪请求,使得其中每一候选图书浏览伪请求与用户提交的图书浏览请求的频度特征相似,并将所述候选图书浏览伪请求提交给类别频度筛选子模块;
所述类别频度筛选子模块,用于接收所述频度特征筛选子模块提交的所述候选图书浏览伪请求,并剔除其中与用户提交的图书浏览请求的类别频度不相似的候选图书浏览伪请求,将获得的候选图书浏览伪请求提交给随机选择子模块;
所述随机选择子模块,用于接收所述频度筛选子模块提交的所述类别频度筛选子模块提交的候选图书浏览伪请求中随机选择一个伪请求,作为关联所述历史图书浏览伪请求序列的图书浏览伪请求。
所述请求结果筛选,用于获取服务器端返回的请求结果,过滤其中图书浏览伪请求的对应请求结果,得到用户提交的图书浏览请求的对应请求结果并反馈给用户。
以下为实施例:
实验数据集构造。实验数据主要采集自于当当网。首先,手动获取当当网的电子图书分类结构(一般是四层)。然后,编写爬虫程序自动打开各个最高层次的图书目录,获取相关图书信息(包括图书名称和网址,这里我们只获取各图书目录下排名最前50本图书的信息)。最终,形成了一个完整的图书分类层次树,一共包括20751图书目录(非叶子节点)和198410图书(叶子节点)。
图书浏览序列。实验中,用户图书浏览序列是根据图书空间随机构造的,其中,每个用户图书浏览序列所关联的最高层次图书目录的数量是一个实验参数,可动态调整(对于用户图书序列所关联的其它层次的图书目录,可根据图书目录层次树计算得到)。此外,用户敏感图书类别我们只从层次级别为3的图书目录中选取,其数量也是一个可调整的实验参数。
数字图书馆用户的浏览偏好隐私保护方法,包括以下步骤:
(1)图书浏览请求提交:获取用户提交的图书浏览请求,根据用户历史图书浏览请求序列、历史图书浏览伪请求序列集、以及图书分类层次树,构造一组与用户提交的图书浏览请求相似的图书浏览伪请求,并提交给数字图书馆服务器端;所述图书浏览伪请求序列集为多个与所述用户历史图书浏览请求序列长度相同的历史图书浏览伪请求序列的集合。
具体算法如下:
算法1:为用户图书浏览记录伪造一组图书浏览记录
输入:
(1)历史用户图书浏览序列
(2)历史伪造图书浏览序列
(3)当前用户图书浏览记录
输出:一组伪造图书浏览记录分别关联
1.设置
2.FOREACH
3.基于阈值参数,将变量d1和d2设置为较小的随机值;
4.REPEAT
5.设置
//获取一组图书频度特征相似的伪图书浏览记录候选者
6.FOREACHr∈{1,2,…,r*}DO
7.IF设置
//剔除集合中类别频度特征不相似的伪记录候选者,其中,
//表示图书级别为r的类别,ar表示图书b级别为r的类别
8.设置d1←d1·2;设置d2←d2·2;
9.WHILE
10.从集合中随机挑选作为关联伪图书浏览序列的一个新记录;
11.设置
RETURN
(2)请求结果筛选:获取服务器端返回的请求结果,过滤其中图书浏览伪请求的对应请求结果,得到用户提交的图书浏览请求的对应请求结果并反馈给用户。
在无法获知用户背景资料信息的情况下,攻击者此时只能根据先验知识(即用户图书浏览序列会表现出富有规律的特征分布)来猜测用户真实图书浏览请求。然而,我们方法所构造的伪请求与用户真实请求拥有几乎完全一致的特征分布,使得攻击者难以根据特征分析识别出用户图书浏览序列。
此外,攻击者还可能获得了隐私算法的副本。因此,可逐个输入来自同一个图书浏览服务请求组中的各个请求bk,然后观测算法能否输出其余的请求。如果成功,则表明bk是用户真实请求。然而,这样的尝试并不会成功,因为在我们方法中,伪请求选取自一个较大的候选者集合(见算法1的步骤10),使得相同输入会导致不同输出。
综上所述,虽然攻击者掌握着丰富的背景知识,但还是难以根据服务端所记录的图书浏览历史序列,分析出用户图书浏览偏好隐私,即我们的方法能有效地确保用户图书浏览偏好隐私的安全性。
本领域的技术人员容易理解,以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种数字图书馆用户的浏览偏好隐私保护方法,其特征在于,包括以下步骤:
(1)图书浏览请求提交:获取用户提交的图书浏览请求,根据用户历史图书浏览请求序列、历史图书浏览伪请求序列集、以及图书分类层次树,构造一组与用户提交的图书浏览请求相似的图书浏览伪请求,并提交给数字图书馆服务器端;
(2)请求结果筛选:获取服务器端返回的请求结果,过滤其中图书浏览伪请求的对应请求结果,得到用户提交的图书浏览请求的对应请求结果并反馈给用户。
2.如权利要求1所述的数字图书馆用户的浏览偏好隐私保护方法,其特征在于,所述图书浏览伪请求序列集为多个与所述用户历史图书浏览请求序列长度相同的历史图书浏览伪请求序列的集合。
3.如权利要求2所述的数字图书馆用户的浏览偏好隐私保护方法,其特征在于,所述图书浏览伪请求与用户提交的图书浏览请求相似,具体指:
所述图书浏览伪请求与用户提交的图书浏览请求的频度特征相似且类别频度相似。
4.如权利要求2所述的数字图书馆用户的浏览偏好隐私保护方法,其特征在于,所述构造一组与用户提交的图书浏览请求相似的图书浏览伪请求,具体为:
对于历史图书浏览伪请求序列集中的每一序列:
(1-1)构造一组候选图书浏览伪请求,使得其中每一候选图书浏览伪请求与用户提交的图书浏览请求的频度特征相似;
(1-2)对于步骤(1-1)中获取的候选图书浏览伪请求中剔除其与用户提交的图书浏览请求的类别频度不相似的候选图书浏览伪请求,获得与用户提交的图书浏览请求的频度特征相似且类别频度相似的候选图书浏览伪请求;
(1-3)在步骤(1-2)中获得的与用户提交的图书浏览请求的频度特征相似且类别频度相似的候选图书浏览伪请求中,随机选择一个伪请求,作为关联所述历史图书浏览伪请求序列的图书浏览伪请求。
5.如权利要求3或4所述的数字图书馆用户的浏览偏好隐私保护方法,其特征在于,所述图书浏览伪请求与用户提交的图书浏览请求的频度特征相似,即:
所述图书浏览伪请求关于其对应的历史图书浏览伪请求序列与用户提交的图书浏览请求关于用户历史图书浏览请求序列的频度特征相似性超过预设频度特征相似性阈值;
或者所述图书浏览伪请求关于其对应的历史图书浏览伪请求序列与用户提交的图书浏览请求关于用户历史图书浏览请求序列的频度特征值差异小于预设频度特征差异阈值;
所述图书浏览伪请求与用户提交的图书浏览请求的类别频度相似,即:
所述图书浏览伪请求关于其对应的历史图书浏览伪请求序列与用户提交的图书浏览请求关于用户历史图书浏览请求序列的类别频度相似性超过预设类别频度相似性阈值;
或者所述图书浏览伪请求关于其对应的历史图书浏览伪请求序列与用户提交的图书浏览请求关于用户历史图书浏览请求序列的类别频度特征差异小于预设类别频度差异阈值。
6.一种数字图书馆用户的浏览偏好隐私保护系统,其特征在于,包括图书浏览请求提交模块、以及请求结果筛选模块;
所述图书浏览请求提交模块,用于获取用户提交的图书浏览请求,并根据内置的用户历史图书浏览请求序列、历史图书浏览伪请求序列集、以及图书分类层次树数据构造一组与用户提交的图书浏览请求相似的图书浏览伪请求,并提交给数字图书馆服务器端;
所述请求结果筛选,用于获取服务器端返回的请求结果,过滤其中图书浏览伪请求的对应请求结果,得到用户提交的图书浏览请求的对应请求结果并反馈给用户。
7.如权利要求6所述的数字图书馆用户的浏览偏好隐私保护系统,其特征在于,所述图书浏览伪请求序列集为多个与所述用户历史图书浏览请求序列长度相同的历史图书浏览伪请求序列的集合。
8.如权利要求7所述的数字图书馆用户的浏览偏好隐私保护系统,其特征在于,所述图书浏览伪请求与用户提交的图书浏览请求相似,具体指:
所述图书浏览伪请求与用户提交的图书浏览请求的频度特征相似且类别频度相似。
9.如权利要求7所述的数字图书馆用户的浏览偏好隐私保护系统,其特征在于,所述图书浏览请求提交模块,包括:频度特征筛选子模块、类别频度筛选子模块、以及随机选择子模块;
所述频度特征筛选子模块,用于构造一组候选图书浏览伪请求,使得其中每一候选图书浏览伪请求与用户提交的图书浏览请求的频度特征相似,并将所述候选图书浏览伪请求提交给类别频度筛选子模块;
所述类别频度筛选子模块,用于接收所述频度特征筛选子模块提交的所述候选图书浏览伪请求,并剔除其中与用户提交的图书浏览请求的类别频度不相似的候选图书浏览伪请求,将获得的候选图书浏览伪请求提交给随机选择子模块;
所述随机选择子模块,用于接收所述频度筛选子模块提交的所述类别频度筛选子模块提交的候选图书浏览伪请求中随机选择一个伪请求,作为关联所述历史图书浏览伪请求序列的图书浏览伪请求。
10.如权利要求8或9所述的数字图书馆用户的浏览偏好隐私保护系统,其特征在于,所述图书浏览伪请求与用户提交的图书浏览请求的频度特征相似,即:
所述图书浏览伪请求关于其对应的历史图书浏览伪请求序列与用户提交的图书浏览请求关于用户历史图书浏览请求序列的频度特征相似性超过预设频度特征相似性阈值;
或者所述图书浏览伪请求关于其对应的历史图书浏览伪请求序列与用户提交的图书浏览请求关于用户历史图书浏览请求序列的频度特征值差异小于预设频度特征差异阈值;
所述图书浏览伪请求与用户提交的图书浏览请求的类别频度相似,即:
所述图书浏览伪请求关于其对应的历史图书浏览伪请求序列与用户提交的图书浏览请求关于用户历史图书浏览请求序列的类别频度相似性超过预设类别频度相似性阈值;
或者所述图书浏览伪请求关于其对应的历史图书浏览伪请求序列与用户提交的图书浏览请求关于用户历史图书浏览请求序列的类别频度特征差异小于预设类别频度差异阈值。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710815027.XA CN107609419B (zh) | 2017-09-12 | 2017-09-12 | 一种数字图书馆用户的浏览偏好隐私保护方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710815027.XA CN107609419B (zh) | 2017-09-12 | 2017-09-12 | 一种数字图书馆用户的浏览偏好隐私保护方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107609419A true CN107609419A (zh) | 2018-01-19 |
CN107609419B CN107609419B (zh) | 2018-11-13 |
Family
ID=61063008
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710815027.XA Active CN107609419B (zh) | 2017-09-12 | 2017-09-12 | 一种数字图书馆用户的浏览偏好隐私保护方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107609419B (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108664808A (zh) * | 2018-04-27 | 2018-10-16 | 温州大学瓯江学院 | 一种面向图书搜索服务的用户敏感主题保护方法及系统 |
CN109359480A (zh) * | 2018-10-08 | 2019-02-19 | 温州大学瓯江学院 | 一种面向数字图书馆的用户隐私保护方法及系统 |
CN112765670A (zh) * | 2021-02-03 | 2021-05-07 | 浙江机电职业技术学院 | 一种基于标识替换的用户信息服务隐私保护方法及系统 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7636714B1 (en) * | 2005-03-31 | 2009-12-22 | Google Inc. | Determining query term synonyms within query context |
CN101814119A (zh) * | 2010-02-13 | 2010-08-25 | 武汉理工大学 | 具有隐私保护的用户模型构建方法 |
CN104184742A (zh) * | 2014-09-09 | 2014-12-03 | 西安电子科技大学 | 基于位置服务隐私保护的个性化双重隐身方法 |
CN104462285A (zh) * | 2014-11-28 | 2015-03-25 | 广东工业大学 | 一种移动服务查询系统的隐私保护方法 |
CN106254314A (zh) * | 2016-07-19 | 2016-12-21 | 温州大学瓯江学院 | 一种位置查询服务信息保护方法及系统 |
US20170091288A1 (en) * | 2015-09-30 | 2017-03-30 | International Business Machines Corporation | Determining a query answer selection |
-
2017
- 2017-09-12 CN CN201710815027.XA patent/CN107609419B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7636714B1 (en) * | 2005-03-31 | 2009-12-22 | Google Inc. | Determining query term synonyms within query context |
CN101814119A (zh) * | 2010-02-13 | 2010-08-25 | 武汉理工大学 | 具有隐私保护的用户模型构建方法 |
CN104184742A (zh) * | 2014-09-09 | 2014-12-03 | 西安电子科技大学 | 基于位置服务隐私保护的个性化双重隐身方法 |
CN104462285A (zh) * | 2014-11-28 | 2015-03-25 | 广东工业大学 | 一种移动服务查询系统的隐私保护方法 |
US20170091288A1 (en) * | 2015-09-30 | 2017-03-30 | International Business Machines Corporation | Determining a query answer selection |
CN106254314A (zh) * | 2016-07-19 | 2016-12-21 | 温州大学瓯江学院 | 一种位置查询服务信息保护方法及系统 |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108664808A (zh) * | 2018-04-27 | 2018-10-16 | 温州大学瓯江学院 | 一种面向图书搜索服务的用户敏感主题保护方法及系统 |
CN108664808B (zh) * | 2018-04-27 | 2019-04-26 | 温州大学瓯江学院 | 一种面向图书搜索服务的用户敏感主题保护方法及系统 |
CN109359480A (zh) * | 2018-10-08 | 2019-02-19 | 温州大学瓯江学院 | 一种面向数字图书馆的用户隐私保护方法及系统 |
CN109359480B (zh) * | 2018-10-08 | 2019-10-08 | 温州大学瓯江学院 | 一种面向数字图书馆的用户隐私保护方法及系统 |
CN112765670A (zh) * | 2021-02-03 | 2021-05-07 | 浙江机电职业技术学院 | 一种基于标识替换的用户信息服务隐私保护方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN107609419B (zh) | 2018-11-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11874874B2 (en) | Method and system for identifying and discovering relationships between disparate datasets from multiple sources | |
JP6408081B2 (ja) | オンライン・ソーシャル・ネットワーク上の検索結果をブレンドすること | |
Chen | Information visualization: Beyond the horizon | |
Adamic et al. | Friends and neighbors on the web | |
JP5989940B1 (ja) | オンライン・ソーシャル・ネットワークにおける検索クエリに対する近似的プライバシ | |
CN105210061B (zh) | 加标签的搜索结果维护 | |
US20090187537A1 (en) | Social network searching with breadcrumbs | |
Lu et al. | Privacy information security classification for internet of things based on internet data | |
JP2014532924A (ja) | ソーシャルネットワークの特徴を有する名前および他の探索クエリーの関連性 | |
TW201030543A (en) | System and method for autohyperlinking and navigation in URL based context queries | |
CN110019647A (zh) | 一种关键词搜索方法、装置和搜索引擎 | |
CN107609419B (zh) | 一种数字图书馆用户的浏览偏好隐私保护方法及系统 | |
CN105761154B (zh) | 一种社会化推荐方法及装置 | |
JP2016527624A (ja) | フレキシブルなイメージ・レイアウト | |
CN103678350B (zh) | 社交网络搜索结果展示方法及装置 | |
CN111476469A (zh) | 一种拓客方法、终端设备及存储介质 | |
US20090265314A1 (en) | Secure file searching | |
CN105229639A (zh) | 短词散列 | |
Yook et al. | The effects of Hallyu (Korean wave) on Korean transnationals in the US | |
CN110110218B (zh) | 一种身份关联方法及终端 | |
CN105264526B (zh) | 基于垂直的查询选择化 | |
CN106776910A (zh) | 一种搜索结果的显示方法及装置 | |
US8949327B2 (en) | Method and device to provide trusted recommendations of websites | |
CN108664808B (zh) | 一种面向图书搜索服务的用户敏感主题保护方法及系统 | |
CN111882381B (zh) | 一种基于协同记忆网络的旅游推荐方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |