CN111814188A - 一种云数字图书馆读者的借阅隐私保护方法、系统及应用 - Google Patents

一种云数字图书馆读者的借阅隐私保护方法、系统及应用 Download PDF

Info

Publication number
CN111814188A
CN111814188A CN202010708544.9A CN202010708544A CN111814188A CN 111814188 A CN111814188 A CN 111814188A CN 202010708544 A CN202010708544 A CN 202010708544A CN 111814188 A CN111814188 A CN 111814188A
Authority
CN
China
Prior art keywords
reader
query
borrowing
mark information
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010708544.9A
Other languages
English (en)
Inventor
吴宗大
谢坚
卢成浪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
University of Shaoxing
Original Assignee
University of Shaoxing
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by University of Shaoxing filed Critical University of Shaoxing
Priority to CN202010708544.9A priority Critical patent/CN111814188A/zh
Publication of CN111814188A publication Critical patent/CN111814188A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/62Protecting access to data via a platform, e.g. using keys or access control rules
    • G06F21/6218Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
    • G06F21/6245Protecting personal data, e.g. for financial or medical purposes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/60Protecting data
    • G06F21/602Providing cryptographic facilities or services
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1097Protocols in which an application is distributed across nodes in the network for distributed storage of data in networks, e.g. transport arrangements for network file system [NFS], storage area networks [SAN] or network attached storage [NAS]

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • Bioethics (AREA)
  • Computer Hardware Design (AREA)
  • Computer Security & Cryptography (AREA)
  • Software Systems (AREA)
  • Signal Processing (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Data Mining & Analysis (AREA)
  • Medical Informatics (AREA)
  • Storage Device Security (AREA)

Abstract

本发明公开了一种云数字图书馆读者的借阅隐私保护方法、系统及应用。方法包括步骤:(1)获取特征数据;(2)将步骤(1)获取的所述读者身份标记信息a的特征数据、以及包含所述读者身份标记信息a的加密数据存储到用于记录借阅信息的借阅记录表中;(3)查询转换;(4)解密查询。所述系统包括用于提供数字图书馆借阅服务的云服务器端和用于提供查询服务的可信客户端。本发明提供的云数字图书馆读者的图书借阅保护方法、系统及应用,在不损害数字图书馆图书借阅服务可用性的基本前提下,确保读者图书借阅隐私在数字图书馆不可信云服务器端的安全性。

Description

一种云数字图书馆读者的借阅隐私保护方法、系统及应用
技术领域
本发明属于互联网领域,更具体地,涉及一种云数字图书馆读者的借阅隐私保护方法、系统及应用
背景技术
数字图书馆是以因特网为基础,各类图书文献知识数字化,各类知识信息服务和知识信息管理计算机虚拟化的图书馆。然而,为读者提供知识信息服务的过程中,数字图书馆必然会采集读者身份特征、兴趣爱好、社会关系、借阅记录等隐私数据。随着云计算等新兴网络技术在数字图书馆中的广泛应用,数字图书馆服务器正变得越来越“不可信”,从而对读者隐私数据安全构成了严重威胁。众所周知,读者隐私权系图书馆的基本价值,必须对其加以有效保护。因而,读者隐私安全问题已成为限制数字图书馆在云计算等新兴网络环境下进一步发展应用的重要障碍。数字图书馆能提供的知识信息服务日趋多样,而图书借阅服务系图书馆最为基础和常见的知识服务。在图书借阅服务中,针对每次读者图书借阅行为或图书归还行为,数字图书馆都会为其生成一条借阅记录(即借阅凭证,标记何人何时借阅或归还何书),并将其存储到后台数据库的读者借阅记录表中。图书借阅记录蕴含大量读者兴趣偏好信息(如读者偏好的图书类别、阅读习惯等,称作读者借阅隐私)。结合领域背景知识,攻击者可进一步分析出读者可能的职业背景、家庭背景、性格取向等高度敏感信息。
社会科学领域学者更多地从法律角度研究数字图书馆的读者隐私权问题。然而,法律并不能根本上解决该问题。自然科学领域学者则尝试从技术角度研究该问题,典型方法有身份认证、访问控制、匿名化、数据加密等。(1)用户认证包括用户身份标识和识别,是最常见的数据库安全技术之一。在该方法中,由系统提供某种方式让用户标识身份。每次用户要求进入系统时,由系统对用户进行身份核对,只有通过身份鉴定的用户才能获得系统使用权。(2)访问控制通过用户权限定义和授权检查,确保只有拥有合法权限的用户才能访问数据库中的授权数据,而未被授权的用户则无法访问数据。访问控制又可分为:自主访问控制和强制访问控制。用户认证和访问控制均可以有效地阻止非法用户对系统未授权数据的非法访问,似乎可以较好地解决数字图书馆的读者资料隐私安全问题。然而,这两类技术手段的有效性均建立在系统服务器端高度可信的基础上,即它们只针对系统的外部非法用户,无法阻止不可信系统服务器端内部管理员(或攻克服务器的攻击者)访问系统中的隐私数据,因而无法有效应用于保护数字图书馆的读者隐私(因云服务器端是不可信的)。(3)匿名化是一种广泛使用的用户隐私保护技术,它通过隐藏(或不收集)用户的敏感身份信息,允许用户以不暴露身份的方式使用系统。由于处理简单,它可以较容易地应用到各类信息管理系统。匿名化最大优点是不会对信息服务的准确性和高效性造成影响,具有良好的实际可用性。然而,数字图书馆一般要求读者必须实名登录后才能使用系统的各项图书馆信息服务,所以,基于匿名化难以有效地应用于数字图书馆。(4)数据加密技术通过对存放在数据库中的用户数据进行严格加密,使得密文数据即使不幸泄露也难以破译,从而确保隐私数据在不可信系统服务器端的安全性。然而,在数字图书馆中存在大量定义在读者隐私数据上的数据库查询操作(如获取某位读者在某段时间内对某图书的所有借阅记录)。一旦使用数据加密算法对云端数据库中的读者隐私数据进行严格加密,则数字图书馆中原有的定义在隐私数据上的数据库查询操作将无法在密文数据上正确执行,从而导致整个数字图书馆平台变得“不可用”。因此,对数据加密方法而言,如何实现对密文数据安全高效的查询是个巨大挑战。综上,云数字图书馆读者借阅隐私安全问题无法直接运用现有的信息安全技术手段加以有效解决,仍有待进一步深入研究。
发明内容
针对现有技术的以上缺陷或改进需求,本发明提供了一种云数字图书馆读者的借阅隐私保护方法、系统及应用,其目的在于提供一种兼容现有运数字图书馆的读者借阅隐私保护方法,保护读者借阅隐私的前提下实现借阅记录表的加密查询,由此解决现有技术借阅隐私安全得不到有效保护的技术问题。
为实现上述目的,按照本发明的一个方面,提供了一种云数字图书馆读者的借阅隐私保护方法,其包括以下步骤:
(1)获取特征数据:将具有顺序特征的读者身份标记信息a通过顺序映射方法和随机映射方法映射为顺序特征数据和随机特征数据,并将顺序特征数据和随机特征数据组合为其特征数据a*,从而将所述读者身份标记信息a映射为特征数据a*存储在记录表的字段A0 *中;
(2)将步骤(1)获取的所述读者身份标记信息a的特征数据、以及包含所述读者身份标记信息a的加密数据存储到用于记录借阅信息的借阅记录表中,对应字段分别为A0 *、B0;优选包含所述读者身份标记信息a的加密数据为包括所述读者身份标记信息a和借阅时间信息的联合加密密文;所述加密密文可采用加密算法完成;
(3)查询转换:获取定义在存储所述读者身份标记信息a的字段A0上的查询σ,转换为定义在存储所述记录表的所述读者身份标记信息a的特征数据a*的字段A0 *上的查询σ*,执行获得加密查询结果,并将所述加密查询结果返回给可信客户端;
(4)解密查询:所述可信客户端对将步骤(3)获得的加密查询结果关联的包含所述读者身份标记信息a的加密数据解密,并对所述读者身份标记信息a执行步骤(3)获取的定义在所述读者身份标记信息a上的查询,获得定义在所述读者身份标记信息a上查询的查询结果。
优选地,所述云数字图书馆读者的借阅隐私保护方法,其所述顺序特征映射方法为:(1-1)将读者身份标记信息a映射为顺序特征数据F0(a),使得:
当有ai≤aj时,必有F0(ai)≤F0(aj);或:
当有ai≤aj时,必有F0(ai)≥F0(aj)。
优选地,所述云数字图书馆读者的借阅隐私保护方法,其所述顺序映射方法包括以下步骤:
(1-1-1)将所述读者身份标记信息a的值域
Figure BDA0002595630880000041
按照预设的划分规则划分为m个子域,记作:
Figure BDA0002595630880000042
优选m小于等于UNlCODE字符数,使其同时满足以下条件:
A1、所述读者身份标记信息a的值域
Figure BDA0002595630880000043
的任一子域
Figure BDA0002595630880000044
(k=1,2,...,m)均不为空集,即:
Figure BDA0002595630880000045
A2、任意两个所述读者身份标记信息a的值域
Figure BDA0002595630880000046
的子域不重叠,即:
Figure BDA0002595630880000047
其中k,j=1,2,...,m且k≠j;
A3、所有所述读者身份标记信息a的值域
Figure BDA0002595630880000048
的子域的并集,即:
Figure BDA0002595630880000049
Figure BDA00025956308800000410
其中k=1,2,...,m。
(1-1-2)为步骤(1-1-1)中获取的所述读者身份标记信息a的值域
Figure BDA00025956308800000411
的每个子域分配具有顺序特征的标识符,优选为整数标识k,记作:
Figure BDA00025956308800000412
使得任一读者身份标记信息a被映射为一具有顺序特征的标识符,即顺序特征数据,例如:
Figure BDA00025956308800000413
当m小于等于UNICODE字符数时,可采用一个UNICODE字符来表示k,故所述读者身份标记信息a被映射为一个具有顺序特征的UNICODE字符。
优选地,所述云数字图书馆读者的借阅隐私保护方法,其所述随机特征映射方法为:(1-2)将用户的身份标记信息a根据随机映射规则映射为特定长度的字符串,所述随机映射规则在设定时随机制定并对所有的读者身份标记信息a应用相同的随机映射规则进行映射。
优选地,所述云数字图书馆读者的借阅隐私保护方法,其步骤(1-2)所述随机特征映射包括以下步骤:
(1-2-1)将所述读者身份标记信息a按照预定的划分规则划分为n个子段,记作:A1,A2,...,An,使其同时满足以下条件:
B1、任意所述读者身份标记信息a的子段长度不为零;
B2、任意两个所述读者身份标记信息a的子段不重叠;
B3、所有所述读者身份标记信息a的子段长度之和等于所述读者身份标记信息a的长度;
(1-2-2)对于步骤(1-2-1)中获取的各个所述读者身份标记信息a的子段Al,l=1,2,...,n的值域
Figure BDA0002595630880000051
划分为ml个子域,记作:
Figure BDA0002595630880000052
使其同时满足以下条件:
C1、所述子段Al值域
Figure BDA0002595630880000053
的任一子域
Figure BDA0002595630880000054
(kl=1,2,...,ml)均不为空集,即:
Figure BDA0002595630880000055
C2、任意两个所述子段Al值域
Figure BDA0002595630880000056
的子域不重叠,即:
Figure BDA0002595630880000057
其中kl,jl=1,2,...,ml且kl≠jl
C3、所有所述读者身份标记信息a的值域
Figure BDA0002595630880000058
的子域的并集,即:
Figure BDA0002595630880000059
Figure BDA00025956308800000510
其中kl=1,2,...,ml
(1-2-3)为步骤(1-2-2)中获取的子段Al值域
Figure BDA00025956308800000511
的子域
Figure BDA00025956308800000512
分配唯一标识符
Figure BDA00025956308800000513
对于子段Al,其标识符为设定时随机制定的特定长度的字符串,即对于子段Al的任意具体值al均可被映射函数Fl(al)映射为特定长度的标识符:
Figure BDA00025956308800000514
其中
Figure BDA00025956308800000515
为包含al的子域,l=1,2,...,n,且有:
Figure BDA00025956308800000516
kl,jl=1,2,...,ml且kl≠jl
其中,
Figure BDA00025956308800000517
分别为
Figure BDA00025956308800000518
的长度。
(1-2-4)将步骤(1-2-3)按照设定时随机制定的顺序组合为特定长度的字符串作为随机特征数据,所述特定长度的字符串,其长度为步骤(1-2-3)中各子段Al值域的子域
Figure BDA0002595630880000061
的标识符的长度之和,即:
Figure BDA0002595630880000062
其中,
Figure BDA0002595630880000063
为子段Al值域的子域
Figure BDA0002595630880000064
的标识符的长度,l=1,2,...,n,
Figure BDA0002595630880000065
为所述特定长度的字符串的长度,即随机特征数据的长度。
优选地,所述云数字图书馆读者的借阅隐私保护方法,其步骤(1)包括:(1-3)将(1-1)中获取的顺序特征数据和(1-2)中获取的随机特征数据组合为特征数据;优选所述顺序特征数据与所述随机特征数据依次拼接为字符串获得所述特征数据。
优选地,所述云数字图书馆读者的借阅隐私保护方法,其所述读者身份标记信息a的特征数据的长度与所述读者身份标记信息a的长度相同;更优选所述顺序特征数据为UNICODE字符且所述随机特征数据的长度为所述读者身份标记信息a的长度减1。
优选地,所述云数字图书馆读者的借阅隐私保护方法,其步骤(3)当所述定义在所述读者身份标记信息a上的查询为精确查询时,记作:
Figure BDA0002595630880000066
其中A0为存储所述读者身份标记信息a的字段,a0为原始查询条件,将其转换为定义在存储所述记录表的所述用所述读者身份标记信息a的特征数据a*的字段A0 *上的选择查询σ*,其转换查询条件a0 *按照步骤(1)中的获取所述特征数据的映射方法将原始查询条件a0进行映射获得,记作:
Figure BDA0002595630880000067
当所述定义在所述读者身份标记信息a上的查询为模糊查询时,记作:
Figure BDA0002595630880000068
其中A0为存储所述读者身份标记信息a的字段,a0为原始查询条件,优选字符串a0从左靠右完整地覆盖了读者编号的r个子段,“%”代表匹配任意长度字符串,将其转换为定义在存储所述记录表的所述用所述读者身份标记信息a的特征数据a*的字段A0 *上的模糊查询σ*,其转换查询条件a0 *为将所有包含a0和特定数量通配字符的字符串按照步骤(1)中获取的随机映射方法映射为含有通配字符的长度与随机特征数据相同的字符串,优选为:a0 *=F1(a1)F1(a2)...Fr(ar)%,记作:
Figure BDA0002595630880000071
其中,-为顺序特征长度的通配字符串。
当所述定义在所述读者身份标记信息a上的查询为范围查询时,记作:
Figure BDA0002595630880000072
其中A0为存储所述读者身份标记信息a的字段,a0为原始查询条件将其转换为定义在存储所述记录表的所述用所述读者身份标记信息a的特征数据a*的字段A0 *上的模糊查询σ*,其转换查询条件a0 *按照步骤(1)中顺序映射方法映射将原始查询条件a0进行映射获得,具体为:
当有ai≤aj,必有F0(ai)≤F0(aj)时,
Figure BDA0002595630880000073
当有ai≤aj,必有F0(ai)≥F0(aj)时,
Figure BDA0002595630880000074
按照本发明的另一个方面,提供了一种云数字图书馆读者的借阅隐私保护系统,其包括用于提供数字图书馆借阅服务的云服务器端和用于提供查询服务的可信客户端;
所述云服务器端,存储有记录表,所述记录表包括用于存储借阅记录的借阅记录表,所述借阅记录表包括用于存储具有顺序特征的读者身份标记信息a的特征数据a*的字段A0 *、以及用于存储包含所述读者身份标记信息a的加密数据的字段B0;优选包含所述读者身份标记信息a的加密数据为包括所述读者身份标记信息a和借阅时间信息的联合加密密文;所述加密密文可采用加密算法完成。所述具有顺序特征的读者身份标记信息a的特征数据a*按照如下方法获取:
将具有顺序特征的读者身份标记信息a通过顺序映射方法和随机映射方法映射为顺序特征数据和随机特征数据,并将顺序特征数据和随机特征数据组合为其特征数据a*
所述可信客户端,用于获取定义在存储所述读者身份标记信息a的字段A0上的查询σ,转换为定义在存储所述记录表的所述读者身份标记信息a的特征数据a*的字段A0 *上的查询σ*提交给云服务器端,并用于获取云服务器端执行查询σ*获得的加密查询结果,加密查询结果关联的包含所述读者身份标记信息a的加密数据解密,以及用于对解密后的所述读者身份标记信息a执行所述定义在存储所述读者身份标记信息a的字段A0上的查询σ,获得查询结果;
优选还包括图书借阅客户端,用于包含读者身份标记信息a的原始图书借阅记录进行通过顺序映射方法和随机映射方法映射为顺序特征数据和随机特征数据,并将顺序特征数据和随机特征数据组合为其特征数据a*,以及用于将所述读者身份标记信息a采用加密算法生成包含所述读者身份标记信息a的加密数据,并将原始借阅记录中的读者身份标记信息a删除、整合其特征数据a*和包含所述读者身份标记信息a的加密数据生成借阅记录,提交到云服务器端存储于所述借阅记录表中。
按照本发明的另一个方面,同了一种云数字图书馆读者的借阅数据库等值连接方法,其特征在于,应用本发明提供的系统,包括以下步骤:
S1、在所述系统的云服务器端建立包含用于存储按照本发明提供的云数字图书馆读者的借阅隐私保护方法的步骤(1)获取的读者身份标记信息a特征数据a*字段A0 *的借阅记录表;所述借阅记录表还包括用于存储按照本发明提供的云数字图书馆读者的借阅隐私保护方法的步骤(2)获取的包含所述读者身份标记信息a的加密数据的字段B0
S2、所述系统的可信客户端对于将读者信息表和借阅记录表中按读者身份标记信息a进行的等值连接操作
Figure BDA0002595630880000081
1(R),σ2(U)),其中R为明文借阅记录表,R.A0为明文借阅记录表中用于存储包含所述读者身份标记信息a的字段,σ1(R)为对明文借阅记录表执行的查询;U为读者资料表,U.A0为读者资料表中用于存储述读者身份标记信息a的字段,σ2(U)为对读者资料表进行的查询操作;
将对明文借阅记录表执行的查询σ1(R),按照本发明提供的云数字图书馆读者的借阅隐私保护方法的步骤(3)的查询转换方法转换为对云服务器端存储的步骤S1获取的借阅记录表的查询操作
Figure BDA0002595630880000091
按照本发明提供的云数字图书馆读者的借阅隐私保护方法的步骤(4)将查询结果发送给可信客户端解密后与对客户端存储的读者资料表进行的查询σ2(U)的查询结果或对云服务器端存储的读者资料表U*进行的查询σ2(U*)的查询结果进行等值连接,其中对云服务器端存储的读者资料表U*进行的查询σ2(U*)的查询等价于对客户端存储的读者资料表进行的查询σ2(U);记作:
Figure BDA0002595630880000092
其中,γ为包含所述读者身份标记信息a的加密数据的字段B0的客户端解密操作;或
将对明文借阅记录表执行的查询σ1(R),按照本发明提供的云数字图书馆读者的借阅隐私保护方法的步骤(3)的查询转换方法转换为对云服务器端存储的步骤S1获取的借阅记录表的查询
Figure BDA0002595630880000093
对云服务器端存储的读者资料表增加用于存储按照本发明提供的云数字图书馆读者的借阅隐私保护方法的步骤(1)生成的所述读者身份标记信息a的特征数据a*的字段U.A0 *,并将定义在读者资料表U中用于存储所述读者身份标记信息a的字段U.A0上的查询σ2(U),按照本发明提供的云数字图书馆读者的借阅隐私保护方法的步骤(3)的查询转换方法转换为定义在云服务器端存储的读者资料表中用于存储按照步骤(1)生成的所述读者身份标记信息a的特征数据a*的字段U.A0 *上的查询
Figure BDA0002595630880000094
并将查询
Figure BDA0002595630880000095
和查询
Figure BDA0002595630880000096
执行的加密查询结果返回给客户端,客户端对查询
Figure BDA0002595630880000097
的加密查询结果按照本发明提供的云数字图书馆读者的借阅隐私保护方法的步骤(4)解密后与查询
Figure BDA0002595630880000101
的加密查询结果执行原始查询σ1(R)和σ2(U)并进行等值连接,记作:
Figure BDA0002595630880000102
其中,γ为包含所述读者身份标记信息a的加密数据的字段B0的客户端解密操作,π为数据表投影运算。
总体而言,通过本发明所构思的以上技术方案与现有技术相比,能够取得下列有益效果:
本发明提供的云数字图书馆读者的图书借阅保护方法、系统及应用,在不损害数字图书馆图书借阅服务可用性的基本前提下,确保读者图书借阅隐私在数字图书馆不可信云服务器端的安全性。
其在可信客户端将每条图书借阅记录中的用于标记读者身份信息的字段严格加密后,再提交给不可信云服务器端数据库存储,使得云服务器端攻击者难以获知每条图书借阅记录对应的读者,从而保护读者借阅隐私。
为了确保数字图书馆平台中定义在图书借阅记录上的各类数据库查询的有效性和高效性,从而确保数字图书馆的可用性,在以上系统中,提供了加密查询方法:其为图书借阅记录中读者编号字段附加额外特征数据,它携带读者编号数据的部分范围特征和蕴含特征,使得定义在读者编号字段上的各类数据库查询可转换为定义在特征数据上的新查询,从而使得大部分查询过程可在云服务器端进行,而无需解密密文数据,极大地提高数据查询效率,从而确保整个方案的实际可用性。具体地,本文研究贡献包括三个方面。
本发明基于云数字图书馆现有架构,重新设计了读者借阅隐私保护系统模型。在模型中,读者隐私保护方法运行在可信客户端,作为数字图书馆云服务器端和用户界面间的一层中间件,对外部读者的完全透明。优选方案设计了读者借阅记录中用于标记读者身份信息的特征数据生成方案。方案所生成的特征数据不仅具有良好的安全性,攻击者无法根据特征数据推测出读者编号,且具有良好的有效性,能反映读者编号的部分范围特征和蕴含特征,使得大部分数据查询过程可在云服务器端进行。优选方案设计了查询转换方案和查询协作方案。它能将定义在读者借阅记录上的各类数据库查询操作转换成定义在云服务器端特征数据上的新查询,并通过客户端和云服务器端之间的相互协作,能在确保数据查询准确性的同时,有效改善数据查询的执行效率。理论分析和实验评估验证了本文方法的有效性。
附图说明
图1是本发明提供的云数字图书馆读者的节约隐私保护系统结构示意图;
图2是本发明实施例提供的云数字图书馆存储的记录表关系模型;
图3是本发明实施例提供的特征数据映射示意图;
图4是本发明实施例提供的云数字图书馆读者的借阅隐私保护方法高效性评估结果图,其中图4(a)为模糊查询评估,图4(b)为范围查询评估,图4(c)为云端连接评估,图4(d)为客户端连接评估。
在所有附图中,相同的附图标记用来表示相同的元件或结构,其中:
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。此外,下面所描述的本发明各个实施方式中所涉及到的技术特征只要彼此之间未构成冲突就可以相互组合。
本发明提供的云数字图书馆读者的借阅隐私保护方法,包括以下步骤:
(1)获取特征数据:将具有顺序特征的读者身份标记信息a通过顺序映射方法和随机映射方法映射为顺序特征数据和随机特征数据,并将顺序特征数据和随机特征数据组合为其特征数据a*,从而将所述读者身份标记信息a映射为特征数据a*存储在记录表(例如借阅记录表R)的字段A0 *中;
所述读者身份标记信息a用于标记用户身份的信息字段,例如按照特定顺序编码规则编码的读者编号或身份证号;
(1-1)所述顺序特征映射方法为:将读者身份标记信息a映射为顺序特征数据F0(a),使得:
当有ai≤aj时,必有F0(ai)≤F0(aj);或:
当有ai≤aj时,必有F0(ai)≥F0(aj)。
优选所述顺序映射方法包括以下步骤:
(1-1-1)将所述读者身份标记信息a的值域
Figure BDA0002595630880000121
按照预设的划分规则划分为m个子域,记作:
Figure BDA0002595630880000122
优选m小于等于UNlCODE字符数,使其同时满足以下条件:
A1、所述读者身份标记信息a的值域
Figure BDA0002595630880000123
的任一子域
Figure BDA0002595630880000124
(k=1,2,...,m)均不为空集,即:
Figure BDA0002595630880000125
A2、任意两个所述读者身份标记信息a的值域
Figure BDA0002595630880000126
的子域不重叠,即:
Figure BDA0002595630880000127
其中k,j=1,2,...,m且k≠j;
A3、所有所述读者身份标记信息a的值域
Figure BDA0002595630880000128
的子域的并集,即:
Figure BDA0002595630880000129
Figure BDA00025956308800001210
其中k=1,2,...,m。
(1-1-2)为步骤(1-1-1)中获取的所述读者身份标记信息a的值域
Figure BDA00025956308800001211
的每个子域分配具有顺序特征的标识符,优选为整数标识k,记作:
Figure BDA00025956308800001212
使得任一读者身份标记信息a被映射为一具有顺序特征的标识符,即顺序特征数据,例如:
Figure BDA00025956308800001213
当m小于等于UNICODE字符数时,可采用一个UNICODE字符来表示k,故所述读者身份标记信息a被映射为一个具有顺序特征的UNICODE字符。
(1-2)所述随机特征映射方法为:将用户的身份标记信息a根据随机映射规则映射为特定长度的字符串,所述随机映射规则在设定时随机制定并对所有的读者身份标记信息a应用相同的随机映射规则进行映射;优选所述随机特征映射包括以下步骤:
(1-2-1)将所述读者身份标记信息a按照预定的划分规则划分为n个子段,记作:A1,A2,...,An,使其同时满足以下条件:
B1、任意所述读者身份标记信息a的子段长度不为零;
B2、任意两个所述读者身份标记信息a的子段不重叠;
B3、所有所述读者身份标记信息a的子段长度之和等于所述读者身份标记信息a的长度;
(1-2-2)对于步骤(1-2-1)中获取的各个所述读者身份标记信息a的子段Al,l=1,2,...,n的值域
Figure BDA0002595630880000131
划分为ml个子域,记作:
Figure BDA0002595630880000132
使其同时满足以下条件:
C1、所述子段Al值域
Figure BDA0002595630880000133
的任一子域
Figure BDA0002595630880000134
(kl=1,2,...,ml)均不为空集,即:
Figure BDA0002595630880000135
C2、任意两个所述子段Al值域
Figure BDA0002595630880000136
的子域不重叠,即:
Figure BDA0002595630880000137
其中kl,jl=1,2,...,ml且kl≠jl
C3、所有所述读者身份标记信息a的值域
Figure BDA0002595630880000138
的子域的并集,即:
Figure BDA0002595630880000139
Figure BDA00025956308800001310
其中kl=1,2,...,ml
(1-2-3)为步骤(1-2-2)中获取的子段Al值域
Figure BDA00025956308800001311
的子域
Figure BDA00025956308800001312
分配唯一标识符
Figure BDA00025956308800001313
对于子段Al,其标识符为设定时随机制定的特定长度的字符串,即对于子段Al的任意具体值al均可被映射函数Fl(al)映射为特定长度的标识符:
Figure BDA00025956308800001314
其中
Figure BDA00025956308800001315
为包含al的子域,l=1,2,...,n,且有:
Figure BDA00025956308800001316
kl,jl=1,2,...,ml且kl≠jl
其中,
Figure BDA0002595630880000141
分别为
Figure BDA0002595630880000142
的长度。
(1-2-4)将步骤(1-2-3)按照设定时随机制定的顺序组合为特定长度的字符串作为随机特征数据,所述特定长度的字符串,其长度为步骤(1-2-3)中各子段Al值域的子域
Figure BDA0002595630880000143
的标识符的长度之和,即:
Figure BDA0002595630880000144
其中,
Figure BDA0002595630880000145
为子段Al值域的子域
Figure BDA0002595630880000146
的标识符的长度,l=1,2,...,n,
Figure BDA0002595630880000147
为所述特定长度的字符串的长度,即随机特征数据的长度。
(1-3)将(1-1)中获取的顺序特征数据和(1-2)中获取的随机特征数据组合为特征数据;优选所述顺序特征数据与所述随机特征数据依次拼接为字符串获得所述特征数据;优选方案,所述读者身份标记信息a的特征数据的长度与所述读者身份标记信息a的长度相同;更优选所述顺序特征数据为UNICODE字符且所述随机特征数据的长度为所述读者身份标记信息a的长度减1。例如,对于给定的具有顺序特征的读者身份标记信息a映射为特征数据a*=F(a),使得:F(a)=F0(a)F1(a1)F2(a2)...Fn(an)。
(2)将步骤(1)获取的所述读者身份标记信息a的特征数据、以及包含所述读者身份标记信息a的加密数据存储到用于记录借阅信息的借阅记录表中,对应字段分别为A0 *、B0;优选包含所述读者身份标记信息a的加密数据为包括所述读者身份标记信息a和借阅时间信息的联合加密密文;所述加密密文可采用加密算法完成(如DES算法);所述借阅记录表还包括所述读者身份标记信息a和借阅时间的联合加密密文,打破密文和明文间“一对一”联系,从而更好确保数据安全性;
(3)查询转换:获取定义在存储所述读者身份标记信息a的字段A0上的查询σ,转换为定义在存储所述记录表的所述读者身份标记信息a的特征数据a*的字段A0 *上的查询σ*,执行获得加密查询结果,并将所述加密查询结果返回给可信客户端;
当所述定义在所述读者身份标记信息a上的查询为精确查询时,记作:
Figure BDA0002595630880000151
其中A0为存储所述读者身份标记信息a的字段,a0为原始查询条件,将其转换为定义在存储所述记录表的所述用所述读者身份标记信息a的特征数据a*的字段A0 *上的选择查询σ*,其转换查询条件a0 *按照步骤(1)中的获取所述特征数据的映射方法将原始查询条件a0进行映射获得,记作:
Figure BDA0002595630880000152
当所述定义在所述读者身份标记信息a上的查询为模糊查询时,记作:
Figure BDA0002595630880000153
其中A0为存储所述读者身份标记信息a的字段,a0为原始查询条件,优选字符串a0从左靠右完整地覆盖了读者编号的r个子段,“%”代表匹配任意长度字符串,将其转换为定义在存储所述记录表的所述用所述读者身份标记信息a的特征数据a*的字段A0 *上的模糊查询σ*,其转换查询条件a0 *为将所有包含a0和特定数量通配字符的字符串按照步骤(1)中获取的随机映射方法映射为含有通配字符的长度与随机特征数据相同的字符串,优选为:a0 *=F1(a1)F1(a2)...Fr(ar)%,记作:
Figure BDA0002595630880000154
其中,-为顺序特征长度的通配字符串。
当所述定义在所述读者身份标记信息a上的查询为范围查询时,记作:
Figure BDA0002595630880000155
其中A0为存储所述读者身份标记信息a的字段,a0为原始查询条件将其转换为定义在存储所述记录表的所述用所述读者身份标记信息a的特征数据a*的字段A0 *上的模糊查询σ*,其转换查询条件a0 *按照步骤(1)中顺序映射方法映射将原始查询条件a0进行映射获得,具体为:
当有ai≤aj,必有F0(ai)≤F0(aj)时,
Figure BDA0002595630880000156
当有ai≤aj,必有F0(ai)≥F0(aj)时,
Figure BDA0002595630880000157
(4)解密查询:所述可信客户端对将步骤(3)获得的加密查询结果关联的包含所述读者身份标记信息a的加密数据解密,并对所述读者身份标记信息a执行步骤(3)获取的定义在所述读者身份标记信息a上的查询σ,获得定义在所述读者身份标记信息a上查询的查询结果。
本发明提供的云数字图书馆读者的借阅隐私保护系统,如图1所示,包括用于提供数字图书馆借阅服务的云服务器端和用于提供查询服务的可信客户端;
所述云服务器端,存储有记录表,所述记录表包括用于存储借阅记录的借阅记录表,所述借阅记录表包括用于存储具有顺序特征的读者身份标记信息a的特征数据a*的字段A0 *、以及用于存储包含所述读者身份标记信息a的加密数据的字段B0;优选包含所述读者身份标记信息a的加密数据为包括所述读者身份标记信息a和借阅时间信息的联合加密密文;所述加密密文可采用加密算法完成。所述具有顺序特征的读者身份标记信息a的特征数据a*按照如下方法获取:
将具有顺序特征的读者身份标记信息a通过顺序映射方法和随机映射方法映射为顺序特征数据和随机特征数据,并将顺序特征数据和随机特征数据组合为其特征数据a*
所述可信客户端,用于获取定义在存储所述读者身份标记信息a的字段A0上的查询σ,转换为定义在存储所述记录表的所述读者身份标记信息a的特征数据a*的字段A0 *上的查询σ*提交给云服务器端,并用于获取云服务器端执行查询σ*获得的加密查询结果,加密查询结果关联的包含所述读者身份标记信息a的加密数据解密,以及用于对解密后的所述读者身份标记信息a执行所述定义在存储所述读者身份标记信息a的字段A0上的查询σ,获得查询结果;
优选还包括图书借阅客户端,用于包含读者身份标记信息a的原始图书借阅记录进行通过顺序映射方法和随机映射方法映射为顺序特征数据和随机特征数据,并将顺序特征数据和随机特征数据组合为其特征数据a*,以及用于将所述读者身份标记信息a采用加密算法生成包含所述读者身份标记信息a的加密数据,并将原始借阅记录中的读者身份标记信息a删除、整合其特征数据a*和包含所述读者身份标记信息a的加密数据生成借阅记录,提交到云服务器端存储于所述借阅记录表中。
采用本发明提供的方法及系统,可按照如下方法实现云数字图书馆读者的借阅数据库等值连接:
S1、在所述系统的云服务器端建立包含用于存储按照步骤(1)获取的读者身份标记信息a特征数据a*字段A0 *的借阅记录表;所述借阅记录表还包括用于存储按照步骤(2)获取的包含所述读者身份标记信息a的加密数据的字段B0
S2、所述系统的可信客户端对于将读者信息表和借阅记录表中按读者身份标记信息a进行的等值连接操作
Figure BDA0002595630880000171
1(R),σ2(U)),其中R为明文借阅记录表,R.A0为明文借阅记录表中用于存储包含所述读者身份标记信息a的字段,σ1(R)为对明文借阅记录表执行的查询;U为读者资料表,U.A0为读者资料表中用于存储述读者身份标记信息a的字段,σ2(U)为对读者资料表进行的查询操作;
将对明文借阅记录表执行的查询σ1(R),按照步骤(3)的查询转换方法转换为对云服务器端存储的步骤S1获取的借阅记录表的查询操作
Figure BDA0002595630880000172
将查询结果发送给可信客户端解密后与对客户端存储的读者资料表进行的查询σ2(U)的查询结果或对云服务器端存储的读者资料表U*进行的查询σ2(U*)的查询结果进行等值连接,其中对云服务器端存储的读者资料表U*进行的查询σ2(U*)的查询等价于对客户端存储的读者资料表进行的查询σ2(U);记作:
Figure BDA0002595630880000173
其中,γ为包含所述读者身份标记信息a的加密数据的字段B0的客户端解密操作;或
将对明文借阅记录表执行的查询σ1(R),按照步骤(3)的查询转换方法转换为对云服务器端存储的步骤S1获取的借阅记录表的查询
Figure BDA0002595630880000181
对云服务器端存储的读者资料表增加用于存储按照步骤(1)生成的所述读者身份标记信息a的特征数据a*的字段U.A0 *,并将定义在读者资料表U中用于存储所述读者身份标记信息a的字段U.A0上的查询σ2(U),按照步骤(3)的查询转换方法转换为定义在云服务器端存储的读者资料表中用于存储按照步骤(1)生成的所述读者身份标记信息a的特征数据a*的字段U.A0 *上的查询
Figure BDA0002595630880000182
并将查询
Figure BDA0002595630880000183
和查询
Figure BDA0002595630880000184
执行的加密查询结果返回给客户端,客户端对查询
Figure BDA0002595630880000185
的加密查询结果解密后与查询
Figure BDA0002595630880000186
的加密查询结果执行原始查询σ1(R)和σ2(U)并进行等值连接,记作:
Figure BDA0002595630880000187
其中,γ为包含所述读者身份标记信息a的加密数据的字段B0的客户端解密操作,π为数据表投影运算。以下为实施例:
数字图书馆云服务器端数据库包括:借阅记录表、读者资料表和图书资料表
用于存储图书借阅信息的借阅记录表,包括以下字段:
记录编号;
读者特征A0 *,用于存储标记借阅读者的读者身份标记信息a的特征数据a*
读者密文B0,用于存储包含所述读者身份标记信息a的加密数据,本实施例为所述读者身份标记信息a和借阅时间的联合采用DES算法加密的密文数据
图书编号,用于存储被借阅的图书标记信息;
借阅时间,用于存储借阅发生时间的标记信息;
借阅标记,用于存储借阅或归还的标记信息;
用于存储读者基本信息的读者资料表,包括以下字段:
读者编号,用于存储标记借阅读者的读者身份标记信息a;
读者姓名;
读者类型;
用于存储图书基本信息的图书资料表,包括以下字段:
图书编号,用于存储被借阅的图书标记信息;
图书名称;
图书分类。
其关系模型如图2所示。
所述节约记录表的读者特征A0 *值按照以下方法获取:
(1)获取特征数据:将具有顺序特征的读者身份标记信息a通过顺序映射方法和随机映射方法映射为顺序特征数据和随机特征数据,并将顺序特征数据和随机特征数据组合为其特征数据a*,从而将所述读者身份标记信息a映射为特征数据a*存储在记录表(例如借阅记录表R)的字段A0 *中;
以读者编号“2019lN013”为例,顺序特征映射方法如图3所示:
将读者编号的值域划分为m个子域,记作:
Figure BDA0002595630880000191
m等于UNlCODE字符数使其同时满足以下条件:
A1、所述读者身份标记信息a的值域
Figure BDA0002595630880000192
的任一子域
Figure BDA0002595630880000193
(k=1,2,...,m)均不为空集,即:
Figure BDA0002595630880000194
A2、任意两个所述读者身份标记信息a的值域
Figure BDA0002595630880000195
的子域不重叠,即:
Figure BDA0002595630880000196
其中k,j=1,2,...,m且k≠j;
A3、所有所述读者身份标记信息a的值域
Figure BDA0002595630880000197
的子域的并集,即:
Figure BDA0002595630880000198
Figure BDA0002595630880000201
其中k=1,2,...,m。
(1-1-2)为步骤(1-1-1)中获取的所述读者身份标记信息a的值域
Figure BDA0002595630880000202
的每个子域分配具有顺序特征的标识符,优选为整数标识k,记作:
Figure BDA0002595630880000203
使得任一读者身份标记信息a被映射为一具有顺序特征的标识符,即顺序特征数据,例如:
Figure BDA0002595630880000204
采用一个UNICODE字符来表示k,故“2019IN013”被映射为UNICODE字符“7”。
随机特征映射方法如图3所示:将用户的身份标记信息a根据随机映射规则映射为特定长度的字符串,所述随机映射规则在设定时随机制定并对所有的读者身份标记信息a应用相同的随机映射规则进行映射;具体方法如下:
(1-2-1)将读者编号a划分为5个子段,记作:A1,A2,...,A5,其中A1为第1至4位,为注册年;A2为第5至6位,位单位编号;A3为第7位;A4为第8位,A5为第9位。
(1-2-2)对于步骤(1-2-1)中获取的各个所述读者身份标记信息a的子段Al,l=1,2,...,5的各个子段的值域进行划分
(1-2-3)为步骤(1-2-2)中获取的子段Al值域
Figure BDA0002595630880000205
的子域
Figure BDA0002595630880000206
分配唯一标识符并分配随机标识符如图3所示,子段A1的标识符为长度为3的字符串,子段A2的标识符为长度为2的字符串,子段A3至A5皆采用一个字符标识
(1-2-4)将子段Al的标识符按照子段的顺序依次组合得到随机特征数据,故“2019IN013”的随机特征数据为:“PBC52BAB”。
(1-3)将(1-1)中获取的顺序特征数据和(1-2)中获取的随机特征数据组合为特征数据,故“2019IN013”映射为特征数据“7PBC52BAB”,存储到可看出特征数据与读者编号拥有相同的长度,因而,它可以直接存储到读者特征A0 *,替换读者特征编号字段。
(2)将步骤(1)获取的读者编号的特征数据、以及包含所述读者身份标记信息a的加密数据存储到用于记录借阅信息的借阅记录表中,对应字段分别为A0 *、B0;包含读者编号的加密数据为读者编号和借阅时间信息的联合加密密文;所述加密密文采用DES加密算法完成。
(3)查询转换:获取定义在存储读者编号的字段A0上的查询σ,转换为定义在存储所述记录表的读者编号的特征数据a*的字段A0 *上的查询σ*,执行获得加密查询结果,并将所述加密查询结果返回给可信客户端;
当所述定义在读者编号上的查询为精确查询时,记作:
Figure BDA0002595630880000211
其中A0为存储读者编号的字段,a0为原始查询条件,将其转换为定义在存储所述记录表的所述用读者编号的特征数据a*的字段A0 *上的选择查询σ*,其转换查询条件a0 *按照步骤(1)中的获取所述特征数据的映射方法将原始查询条件a0进行映射获得,记作:
Figure BDA0002595630880000212
当所述定义在读者编号上的查询为模糊查询时,记作:
Figure BDA0002595630880000213
其中A0为存储读者编号的字段,a0为原始查询条件,优选字符串a0从左靠右完整地覆盖了读者编号的r个子段,“%”代表匹配任意长度字符串,将其转换为定义在存储所述记录表的所述用读者编号的特征数据a*的字段A0 *上的模糊查询σ*,其转换查询条件a0 *为将所有包含a0和特定数量通配字符的字符串按照步骤(1)中获取的随机映射方法映射为含有通配字符的长度与随机特征数据相同的字符串,优选为:a0 *=F1(a1)F1(a2)...Fr(ar)%,记作:
Figure BDA0002595630880000214
其中,-为顺序特征长度的通配字符串。
当所述定义在读者编号上的查询为范围查询时,记作:
Figure BDA0002595630880000215
其中A0为存储读者编号的字段,a0为原始查询条件将其转换为定义在存储所述记录表的所述用读者编号的特征数据a*的字段A0 *上的模糊查询σ*,其转换查询条件a0 *按照步骤(1)中顺序映射方法映射将原始查询条件a0进行映射获得,具体为:
当有ai≤aj,必有F0(ai)≤F0(aj)时,
Figure BDA0002595630880000221
具体操作例子如下表1:
表1选择操作云服务器端客户端交互示意
Figure BDA0002595630880000222
对于以上数据厍中,采用客户端等值连接操作如下:
对于将读者信息表和借阅记录表中按读者身份标记信息a进行的等值连接操作
Figure BDA0002595630880000223
1(R),σ2(U)),其中R为明文借阅记录表,R.A0为明文借阅记录表中用于存储包含所述读者身份标记信息a的字段,σ1(R)为对明文借阅记录表执行的查询;U为读者资料表,U.A0为读者资料表中用于存储述读者身份标记信息a的字段,σ2(U)为对读者资料表进行的查询操作;
将对明文借阅记录表执行的查询σ1(R),按照步骤(3)的查询转换方法转换为对云服务器端存储的步骤S1获取的借阅记录表的查询操作
Figure BDA0002595630880000224
将查询结果发送给可信客户端解密后与对客户端存储的读者资料表进行的查询σ2(U)的查询结果或对云服务器端存储的读者资料表U*进行的查询σ2(U*)的查询结果进行等值连接,其中对云服务器端存储的读者资料表U*进行的查询σ2(U*)的查询等价于对客户端存储的读者资料表进行的查询σ2(U);记作:
Figure BDA0002595630880000231
其中,γ为包含所述读者身份标记信息a的加密数据的字段B0的客户端解密操作;具体操作例子如下表2:
表2客户端连接操作交互示意
Figure BDA0002595630880000232
对于以上数据库中,采用云服务器端等值连接操作如下:
将对明文借阅记录表执行的查询σ1(R),按照步骤(3)的查询转换方法转换为对云服务器端存储的步骤S1获取的借阅记录表的查询
Figure BDA0002595630880000233
对云服务器端存储的读者资料表增加用于存储按照步骤(1)生成的所述读者身份标记信息a的特征数据a*的字段U.A0 *,并将定义在读者资料表U中用于存储所述读者身份标记信息a的字段U.A0上的查询σ2(U),按照步骤(3)的查询转换方法转换为定义在云服务器端存储的读者资料表中用于存储按照步骤(1)生成的所述读者身份标记信息a的特征数据a*的字段U.A0 *上的查询
Figure BDA0002595630880000241
并将查询
Figure BDA0002595630880000242
和查询
Figure BDA0002595630880000243
执行的加密查询结果返回给客户端,客户端对查询
Figure BDA0002595630880000244
的加密查询结果解密后与查询
Figure BDA0002595630880000245
的加密查询结果执行原始查询σ1(R)和σ2(U)并进行等值连接;具体操作例子如下表3:
表2云服务器端连接操作交互示意
Figure BDA0002595630880000246
表1以查询编号为“2019IN013”读者的所有图书借阅记录信息为例,描述了用户、客户端和云服务器端三者间的相互协作过程,以及数据库查询语句的改写变化过程。类似地,表2和表3以查询读者对图书名称为“饮食”所有借阅记录信息为例,描述了基于云服务器端的等值连接过程和基于客户端的等值连接过程。从这些表可以看出,步骤6是查询效率的关键,即云服务器端返回的中间结果集越接近于步骤9返回给用户的最终结果集,则整个数据查询过程的效率就越高,反之则越低。而云服务器端返回的中间结果集规模(或者说云服务器端过滤掉的非目标记录数量)取决所构造的特征映射函数。
实验运行在图2所述的数据库模式上,其中:读者资料表和图书资料表均包含随机生成的十万条记录;借阅记录表包含在读者资料表和图书资料表基础上随机生成的一百万条记录。实验在两台电脑上进行,一台作为云服务器,另一台作为客户端。从图1的数据查询过程,结合表1至表3的数据协作过程,可看出:特征数据的查询高效性依赖于步骤6返回给客户端的中间结果集规模(即云服务器端对非目标数据的过滤效果)。据此,我们可引入高效性度量如下。让N表示全体借阅记录的数量,N′1表示步骤6云服务器端查询返回给客户端的中间记录的数量,N′2表示步骤9客户端查询返回给用户的最终记录数量。那么,特征数据查询高效性可通过云服务器端查询对非目标记录的过滤效果进行度量,即FR=(N-N′1)/(N-N′2),也可通过云服务器端查询结果中包含目标记录的比率进行度量,即FE=N′2/N′1
表4借阅记录相关查询样例
Figure BDA0002595630880000251
实验主要分四组:模糊选择查询、范围选择查询、云服务器端等值连接查询和客户端等值连接查询(这里不考虑等值选择查询,因为它可看作特殊的模糊选择查询)。实验采用的数据查询语句如表4所示(第三组和第四组实验使用相同的等值连接查询)。实验结果如图4所示,其中:横坐标表示每条特征数据所对应的可能明文数量(其设定值通过调整特征构造过程各个步骤的相关参数获得);纵坐标表示特征数据查询高效性度量(注意:各个子图的纵坐标设定互不相同);每个数据点等于20次实验的平均值。(1)从图4a可看出:服务器通过执行云服务器端查询返回给客户端的中间记录集中包含大量的非目标记录(即FE比率值低于2%),并且随着蕴含特征对应明文数量的增加,FE比率值还进一步降低;然而,云服务器端查询对非目标记录的过滤效果极佳(FR值超过99.9%,即服务器通过执行云服务器端查询可过掉99.9%以上的非目标记录),从而极大改善了模糊选择查询的实际执行效率。这里,FE指标表现差,而FR指标表现好,主要原因是模糊查询的实际目标记录集规模极小(通常就十余条记录)。(2)从图4b可看出:相比于模糊查询,基于范围特征构建的云服务器端范围查询不仅拥有极佳的FR值,还拥有极佳的FE值(极大改善了范围选择查询的实际执行效率)。这里,FE指标表现好,主要原因是范围糊查询的实际目标记录集规模极大(平均约占全体图书借阅记录集的一半),使得云服务器端返回的非目标记录在中间结果中的比率极小(小于99.9%)。(3)从图4c和图4d可看出:相比于客户端连接查询,云服务器端连接查询通过让等值连接的部分操作可在云服务器端数据库上执行,有效减少返回客户端的数据规模,因而拥有良好的FR值和FE值(均大于99%)。然而,根据前文分析可知,基于客户端的连接查询具有更好的可用性和安全性。综上所述(尤其是FR指标),借助于特征数据,按照前文查询转换方法映射得到的新查询能在云服务器端过滤掉绝大部分的非目标数据,从而提高读者编号相关查询的执行效率,确保了数据查询高效性。
本领域的技术人员容易理解,以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种云数字图书馆读者的借阅隐私保护方法,其特征在于,包括以下步骤:
(1)获取特征数据:将具有顺序特征的读者身份标记信息a通过顺序映射方法和随机映射方法映射为顺序特征数据和随机特征数据,并将顺序特征数据和随机特征数据组合为其特征数据a*,从而将所述读者身份标记信息a映射为特征数据a*存储在记录表的字段A0 *中;
(2)将步骤(1)获取的所述读者身份标记信息a的特征数据、以及包含所述读者身份标记信息a的加密数据存储到用于记录借阅信息的借阅记录表中,对应字段分别为A0 *、B0;优选包含所述读者身份标记信息a的加密数据为包括所述读者身份标记信息a和借阅时间信息的联合加密密文;所述加密密文可采用加密算法完成;
(3)查询转换:获取定义在存储所述读者身份标记信息a的字段A0上的查询σ,转换为定义在存储所述记录表的所述读者身份标记信息a的特征数据a*的字段A0 *上的查询σ*,执行获得加密查询结果,并将所述加密查询结果返回给可信客户端;
(4)解密查询:所述可信客户端对将步骤(3)获得的加密查询结果关联的包含所述读者身份标记信息a的加密数据解密,并对所述读者身份标记信息a执行步骤(3)获取的定义在所述读者身份标记信息a上的查询,获得定义在所述读者身份标记信息a上查询的查询结果。
2.如权利要求1所述的云数字图书馆读者的借阅隐私保护方法,其特征在于,所述顺序特征映射方法为:(1-1)将读者身份标记信息a映射为顺序特征数据F0(a),使得:
当有ai≤aj时,必有F0(ai)≤F0(aj);或:
当有ai≤aj时,必有F0(ai)≥F0(aj)。
3.如权利要求2所述的云数字图书馆读者的借阅隐私保护方法,其特征在于,所述顺序映射方法包括以下步骤:
(1-1-1)将所述读者身份标记信息a的值域
Figure FDA0002595630870000021
按照预设的划分规则划分为m个子域,记作:
Figure FDA0002595630870000022
优选m小于等于UNICODE字符数,使其同时满足以下条件:
A1、所述读者身份标记信息a的值域
Figure FDA0002595630870000023
的任一子域
Figure FDA0002595630870000024
均不为空集,即:
Figure FDA0002595630870000025
A2、任意两个所述读者身份标记信息a的值域
Figure FDA0002595630870000026
的子域不重叠,即:
Figure FDA0002595630870000027
其中k,j=1,2,...,m且k≠j;
A3、所有所述读者身份标记信息a的值域
Figure FDA0002595630870000028
的子域的并集,即:
Figure FDA0002595630870000029
Figure FDA00025956308700000210
其中k=1,2,...,m。
(1-1-2)为步骤(1-1-1)中获取的所述读者身份标记信息a的值域
Figure FDA00025956308700000211
的每个子域分配具有顺序特征的标识符,优选为整数标识k,记作:
Figure FDA00025956308700000212
使得任一读者身份标记信息a被映射为一具有顺序特征的标识符,即顺序特征数据,例如:
Figure FDA00025956308700000213
当m小于等于UNICODE字符数时,可采用一个UNICODE字符来表示k,故所述读者身份标记信息a被映射为一个具有顺序特征的UNICODE字符。
4.如权利要求1所述的云数字图书馆读者的借阅隐私保护方法,其特征在于,所述随机特征映射方法为:(1-2)将用户的身份标记信息a根据随机映射规则映射为特定长度的字符串,所述随机映射规则在设定时随机制定并对所有的读者身份标记信息a应用相同的随机映射规则进行映射。
5.如权利要求1所述的云数字图书馆读者的借阅隐私保护方法,其特征在于,步骤(1-2)所述随机特征映射包括以下步骤:
(1-2-1)将所述读者身份标记信息a按照预定的划分规则划分为n个子段,记作:A1,A2,...,An,使其同时满足以下条件:
B1、任意所述读者身份标记信息a的子段长度不为零;
B2、任意两个所述读者身份标记信息a的子段不重叠;
B3、所有所述读者身份标记信息a的子段长度之和等于所述读者身份标记信息a的长度;
(1-2-2)对于步骤(1-2-1)中获取的各个所述读者身份标记信息a的子段Al,l=1,2,...,n的值域
Figure FDA0002595630870000031
划分为ml个子域,记作:
Figure FDA0002595630870000032
使其同时满足以下条件:
C1、所述子段Al值域
Figure FDA0002595630870000033
的任一子域
Figure FDA0002595630870000034
均不为空集,即:
Figure FDA0002595630870000035
C2、任意两个所述子段Al值域
Figure FDA0002595630870000036
的子域不重叠,即:
Figure FDA0002595630870000037
其中kl,jl=1,2,...,ml且kl≠jl
C3、所有所述读者身份标记信息a的值域
Figure FDA0002595630870000038
的子域的并集,即:
Figure FDA0002595630870000039
Figure FDA00025956308700000310
其中kl=1,2,...,ml
(1-2-3)为步骤(1-2-2)中获取的子段Al值域
Figure FDA00025956308700000311
的子域
Figure FDA00025956308700000312
分配唯一标识符
Figure FDA00025956308700000313
对于子段Al,其标识符为设定时随机制定的特定长度的字符串,即对于子段Al的任意具体值al均可被映射函数Fl(al)映射为特定长度的标识符:
Figure FDA00025956308700000314
其中
Figure FDA00025956308700000315
为包含al的子域,l=1,2,...,n,且有:
Figure FDA00025956308700000316
kl,jl=1,2,...,ml且kl≠jl
其中,
Figure FDA00025956308700000317
分别为
Figure FDA00025956308700000318
的长度。
(1-2-4)将步骤(1-2-3)按照设定时随机制定的顺序组合为特定长度的字符串作为随机特征数据,所述特定长度的字符串,其长度为步骤(1-2-3)中各子段Al值域的子域
Figure FDA00025956308700000319
的标识符的长度之和,即:
Figure FDA00025956308700000320
其中,
Figure FDA00025956308700000321
为子段Al值域的子域
Figure FDA00025956308700000322
的标识符的长度,l=1,2,...,n,
Figure FDA00025956308700000323
为所述特定长度的字符串的长度,即随机特征数据的长度。
6.如权利要求1所述的云数字图书馆读者的借阅隐私保护方法,其特征在于,步骤(1)包括:(1-3)将(1-1)中获取的顺序特征数据和(1-2)中获取的随机特征数据组合为特征数据;优选所述顺序特征数据与所述随机特征数据依次拼接为字符串获得所述特征数据。
7.如权利要求1所述的云数字图书馆读者的借阅隐私保护方法,其特征在于,所述读者身份标记信息a的特征数据的长度与所述读者身份标记信息a的长度相同;更优选所述顺序特征数据为UNICODE字符且所述随机特征数据的长度为所述读者身份标记信息a的长度减1。
8.如权利要求1所述的云数字图书馆读者的借阅隐私保护方法,其特征在于,步骤(3)当所述定义在所述读者身份标记信息a上的查询为精确查询时,记作:
Figure FDA0002595630870000041
其中A0为存储所述读者身份标记信息a的字段,a0为原始查询条件,将其转换为定义在存储所述记录表的所述用所述读者身份标记信息a的特征数据a*的字段A0 *上的选择查询σ*,其转换查询条件a0 *按照步骤(1)中的获取所述特征数据的映射方法将原始查询条件a0进行映射获得;
当所述定义在所述读者身份标记信息a上的查询为模糊查询时,记作:
Figure FDA0002595630870000042
其中A0为存储所述读者身份标记信息a的字段,a0为原始查询条件,优选字符串a0从左靠右完整地覆盖了读者编号的r个子段,“%”代表匹配任意长度字符串,将其转换为定义在存储所述记录表的所述用所述读者身份标记信息a的特征数据a*的字段A0 *上的模糊查询σ*,其转换查询条件a0 *为将所有包含a0和特定数量通配字符的字符串按照步骤(1)中获取的随机映射方法映射为含有通配字符的长度与随机特征数据相同的字符串,优选为:a0 *=F1(a1)F1(a2)...Fr(ar)%。
当所述定义在所述读者身份标记信息a上的查询为范围查询时,记作:
Figure FDA0002595630870000043
其中A0为存储所述读者身份标记信息a的字段,a0为原始查询条件将其转换为定义在存储所述记录表的所述用所述读者身份标记信息a的特征数据a*的字段A0 *上的模糊查询σ*,其转换查询条件a0 *按照步骤(1)中顺序映射方法映射将原始查询条件a0进行映射获得,具体为:
当有ai≤aj,必有F0(ai)≤F0(aj)时,
Figure FDA0002595630870000051
当有ai≤aj,必有F0(ai)≥F0(aj)时,
Figure FDA0002595630870000052
9.一种云数字图书馆读者的借阅隐私保护系统,其特征在于,包括用于提供数字图书馆借阅服务的云服务器端和用于提供查询服务的可信客户端;
所述云服务器端,存储有记录表,所述记录表包括用于存储借阅记录的借阅记录表,所述借阅记录表包括用于存储具有顺序特征的读者身份标记信息a的特征数据a*的字段A0 *、以及用于存储包含所述读者身份标记信息a的加密数据的字段B0;优选包含所述读者身份标记信息a的加密数据为包括所述读者身份标记信息a和借阅时间信息的联合加密密文;所述加密密文可采用加密算法完成。所述具有顺序特征的读者身份标记信息a的特征数据a*按照如下方法获取:
将具有顺序特征的读者身份标记信息a通过顺序映射方法和随机映射方法映射为顺序特征数据和随机特征数据,并将顺序特征数据和随机特征数据组合为其特征数据a*
所述可信客户端,用于获取定义在存储所述读者身份标记信息a的字段A0上的查询σ,转换为定义在存储所述记录表的所述读者身份标记信息a的特征数据a*的字段A0 *上的查询σ*提交给云服务器端,并用于获取云服务器端执行查询σ*获得的加密查询结果,加密查询结果关联的包含所述读者身份标记信息a的加密数据解密,以及用于对解密后的所述读者身份标记信息a执行所述定义在存储所述读者身份标记信息a的字段A0上的查询σ,获得查询结果;
优选还包括图书借阅客户端,用于包含读者身份标记信息a的原始图书借阅记录进行通过顺序映射方法和随机映射方法映射为顺序特征数据和随机特征数据,并将顺序特征数据和随机特征数据组合为其特征数据a*,以及用于将所述读者身份标记信息a采用加密算法生成包含所述读者身份标记信息a的加密数据,并将原始借阅记录中的读者身份标记信息a删除、整合其特征数据a*和包含所述读者身份标记信息a的加密数据生成借阅记录,提交到云服务器端存储于所述借阅记录表中。
10.一种云数字图书馆读者的借阅数据库等值连接方法,其特征在于,应用如权利要求9所述的系统,包括以下步骤:
S1、在所述系统的云服务器端建立包含用于存储按照如权利要求1至8任意一项所述的云数字图书馆读者的借阅隐私保护方法的步骤(1)获取的读者身份标记信息a特征数据a*字段A0 *的借阅记录表;所述借阅记录表还包括用于存储按照如权利要求1至8任意一项所述的云数字图书馆读者的借阅隐私保护方法的步骤(2)获取的包含所述读者身份标记信息a的加密数据的字段B0
S2、所述系统的可信客户端对于将读者信息表和借阅记录表中按读者身份标记信息a进行的等值连接操作
Figure FDA0002595630870000061
其中R为明文借阅记录表,R.A0为明文借阅记录表中用于存储包含所述读者身份标记信息a的字段,σ1(R)为对明文借阅记录表执行的查询;U为读者资料表,U.A0为读者资料表中用于存储述读者身份标记信息a的字段,σ2(U)为对读者资料表进行的查询操作;
将对明文借阅记录表执行的查询σ1(R),按照如权利要求1至8任意一项所述的云数字图书馆读者的借阅隐私保护方法的步骤(3)的查询转换方法转换为对云服务器端存储的步骤S1获取的借阅记录表的查询操作
Figure FDA0002595630870000062
按照如权利要求1至8任意一项所述的云数字图书馆读者的借阅隐私保护方法的步骤(4)将查询结果发送给可信客户端解密后与对客户端存储的读者资料表进行的查询σ2(U)的查询结果或对云服务器端存储的读者资料表U*进行的查询σ2(U*)的查询结果进行等值连接,其中对云服务器端存储的读者资料表U*进行的查询σ2(U*)的查询等价于对客户端存储的读者资料表进行的查询σ2(U);或
将对明文借阅记录表执行的查询σ1(R),按照如权利要求1至8任意一项所述的云数字图书馆读者的借阅隐私保护方法的步骤(3)的查询转换方法转换为对云服务器端存储的步骤S1获取的借阅记录表的查询
Figure FDA0002595630870000071
对云服务器端存储的读者资料表增加用于存储按照如权利要求1至8任意一项所述的云数字图书馆读者的借阅隐私保护方法的步骤(1)生成的所述读者身份标记信息a的特征数据a*的字段U.A0 *,并将定义在读者资料表U中用于存储所述读者身份标记信息a的字段U.A0上的查询σ2(U),按照如权利要求1至8任意一项所述的云数字图书馆读者的借阅隐私保护方法的步骤(3)的查询转换方法转换为定义在云服务器端存储的读者资料表中用于存储按照步骤(1)生成的所述读者身份标记信息a的特征数据a*的字段U.A0 *上的查询
Figure FDA0002595630870000072
并将查询
Figure FDA0002595630870000073
和查询
Figure FDA0002595630870000074
执行的加密查询结果返回给客户端,客户端对查询
Figure FDA0002595630870000075
的加密查询结果按照如权利要求1至8任意一项所述的云数字图书馆读者的借阅隐私保护方法的步骤(4)解密后与查询
Figure FDA0002595630870000076
的加密查询结果执行原始查询σ1(R)和σ2(U)并进行等值连接。
CN202010708544.9A 2020-07-22 2020-07-22 一种云数字图书馆读者的借阅隐私保护方法、系统及应用 Pending CN111814188A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010708544.9A CN111814188A (zh) 2020-07-22 2020-07-22 一种云数字图书馆读者的借阅隐私保护方法、系统及应用

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010708544.9A CN111814188A (zh) 2020-07-22 2020-07-22 一种云数字图书馆读者的借阅隐私保护方法、系统及应用

Publications (1)

Publication Number Publication Date
CN111814188A true CN111814188A (zh) 2020-10-23

Family

ID=72862108

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010708544.9A Pending CN111814188A (zh) 2020-07-22 2020-07-22 一种云数字图书馆读者的借阅隐私保护方法、系统及应用

Country Status (1)

Country Link
CN (1) CN111814188A (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107977583A (zh) * 2017-11-24 2018-05-01 温州大学瓯江学院 数字图书馆用户图书行为偏好隐私保护评价方法及系统
CN109359480A (zh) * 2018-10-08 2019-02-19 温州大学瓯江学院 一种面向数字图书馆的用户隐私保护方法及系统
EP3514722A1 (en) * 2018-01-18 2019-07-24 Sap Se Secure substring search to filter encrypted data
CN110543774A (zh) * 2019-08-30 2019-12-06 绍兴文理学院 一种云环境下xml档案隐私数据保护方法及系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107977583A (zh) * 2017-11-24 2018-05-01 温州大学瓯江学院 数字图书馆用户图书行为偏好隐私保护评价方法及系统
EP3514722A1 (en) * 2018-01-18 2019-07-24 Sap Se Secure substring search to filter encrypted data
CN109359480A (zh) * 2018-10-08 2019-02-19 温州大学瓯江学院 一种面向数字图书馆的用户隐私保护方法及系统
CN110543774A (zh) * 2019-08-30 2019-12-06 绍兴文理学院 一种云环境下xml档案隐私数据保护方法及系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
吴宗大等: "数字图书馆用户行为隐私保护研究", 国家图书馆学刊, vol. 29, no. 01 *

Similar Documents

Publication Publication Date Title
CN109074433B (zh) 使用分布式散列表和点对点分布式分类账验证数字资产完整性的方法和系统
Bakken et al. Data obfuscation: Anonymity and desensitization of usable data sets
JP4443224B2 (ja) データ管理システムおよび方法
CN109359480B (zh) 一种面向数字图书馆的用户隐私保护方法及系统
US8601553B1 (en) Techniques of imposing access control policies
GB2484382A (en) Generating a test database for testing applications by applying format-preserving encryption to a production database
KR20150052131A (ko) 블룸 필터를 숨기는 콘텐츠에 의한 안전한 개인 데이터베이스 쿼링
Wu et al. How to protect reader lending privacy under a cloud environment: a technical method
CN109829333B (zh) 一种基于OpenID的关键信息保护方法及系统
US11509467B2 (en) Story assisted mnemonic phrase
Herranz et al. Revisiting distance-based record linkage for privacy-preserving release of statistical datasets
Fatima et al. A novel fingerprinting technique for data storing and sharing through clouds
Jha et al. Big data security and privacy: A review on issues challenges and privacy preserving methods
CN111814188A (zh) 一种云数字图书馆读者的借阅隐私保护方法、系统及应用
Le et al. Distributed secure search in the personal cloud
Schnell Privacy Preserving Record Linkage in the Context of a National Statistical Institute
Hardjono et al. Core identities for future transaction systems
He et al. Multi-party privacy-preserving record linkage method based on trusted execution environment
Verma et al. Applications of Data Security and Blockchain in Smart City Identity Management
Christen et al. Privacy-preserving record linkage using autoencoders
CN111898157A (zh) 机器学习多源训练集的不经意存储访问方法
Li Research and analysis on sensitive data encryption method in accounting information processing system
Shi Evaluating predicates over encrypted data
Batham et al. A new approach for data security using deduplication over cloud data storage
Sakhare et al. Survey on Data Privacy Preserving Techniques in Blockchain Applications

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination