CN106209761A - 相似信息检索方法、终端装置以及相似信息检索系统 - Google Patents

相似信息检索方法、终端装置以及相似信息检索系统 Download PDF

Info

Publication number
CN106209761A
CN106209761A CN201610298128.XA CN201610298128A CN106209761A CN 106209761 A CN106209761 A CN 106209761A CN 201610298128 A CN201610298128 A CN 201610298128A CN 106209761 A CN106209761 A CN 106209761A
Authority
CN
China
Prior art keywords
encryption
data
encrypted
server unit
retrieval
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201610298128.XA
Other languages
English (en)
Inventor
松崎夏芽
海上勇二
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Intellectual Property Corp of America
Original Assignee
Panasonic Intellectual Property Corp of America
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from JP2016007431A external-priority patent/JP2016224400A/ja
Application filed by Panasonic Intellectual Property Corp of America filed Critical Panasonic Intellectual Property Corp of America
Publication of CN106209761A publication Critical patent/CN106209761A/zh
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/04Network architectures or network communication protocols for network security for providing a confidential data exchange among entities communicating through data packet networks
    • H04L63/0428Network architectures or network communication protocols for network security for providing a confidential data exchange among entities communicating through data packet networks wherein the data content is protected, e.g. by encrypting or encapsulating the payload
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/20Network architectures or network communication protocols for network security for managing network security; network security policies in general
    • H04L63/205Network architectures or network communication protocols for network security for managing network security; network security policies in general involving negotiation or determination of the one or more network security mechanisms to be used, e.g. by negotiation between the client and the server or between peers or by selection according to the capabilities of the entities involved
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L9/00Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols
    • H04L9/008Cryptographic mechanisms or cryptographic arrangements for secret or secure communications; Network security protocols involving homomorphic encryption

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Security & Cryptography (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Computer Hardware Design (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

提供一种能够根据用户的想法灵活地选择检索方法的相似信息检索方法、终端装置以及相似信息检索系统。相似信息检索方法包括:指示取得步骤,取得关于数据运算装置(200)进行加密检索或非加密检索的指示;特征量发送步骤,生成加密特征量,并发送给数据运算装置(200);相似值发送步骤,生成加密相似值并发送给数据运算装置(200);指示发送步骤,将在指示取得步骤中取得的指示发送给数据运算装置(200);以及解密步骤,从数据运算装置(200)接收加密参照数据并进行解密。在进行加密检索的情况下,加密方式为同态且在数据运算装置(200)中不能解密的加密方式,在进行非加密检索的情况下,加密方式为在数据运算装置(200)中能够解密的加密方式。

Description

相似信息检索方法、终端装置以及相似信息检索系统
技术领域
本公开涉及一边通过加密将内容隐匿,一边进行相似信息检索的方法、装置以及系统。
背景技术
近年来,例如有如下系统:在家庭中进行血压等的测量,并通过服务器中的分析,关于饮食生活等向用户进行建议。在该分析中,不仅参照其本人的过去信息,还参照相似的其他病例进行建议,由此能够向该用户进行更有真实感的有用建议。在服务器中的相似病例的检索中,根据隐私保护的观点,优选该用户的信息以及参照的其他病例的信息通过加密而隐匿。在专利文献1、专利文献2以及专利文献3中,公开了使用同态加密,并在加密的状态下进行相似信息检索的技术。
在先技术文献
专利文献
专利文献1:日本特开2014-126865号公报
专利文献2:日本特开2014-126866号公报
专利文献3:日本专利第5542474号公报
非专利文献
非专利文献1:光成滋生,“支持云的现有加密技术”,2015.3.24.github
非专利文献2:D.Boneh、E.-J.Goh、K.Nissim,“Evaluating 2-DNFFormulas on Ciphertexts”、TCC05,2005.
发明内容
发明要解决的问题
在以往的相似信息检索中,需要进一步的改善。
本公开的目的在于提供一种能够根据用户的想法灵活地选择检索方法的相似信息检索方法、终端装置以及相似信息检索系统。
用于解决问题的技术方案
本公开的一个技术方案涉及的相似信息检索方法,是服务器装置基于从终端装置提供的信息检索相似信息的方法,包括以下步骤:
在所述终端装置,取得关于是进行加密检索还是进行非加密检索的指示,所述加密检索为所述服务器装置在加密的状态下使用从所述终端装置提供的信息进行所述检索,所述非加密检索为所述服务器装置在不加密的状态下使用从所述终端装置提供的信息进行所述检索,
在所述终端装置,通过用依存于所取得的所述指示的加密方式将表示所取得的数据的特征的第一特征量加密而生成第一加密特征量,在所述指示为进行加密检索的指示的情况下,依存于所述指示的加密方式为同态且在所述服务器装置中不能解密的第一加密方式,在所述指示为进行非加密检索的指示的情况下,依存于所述指示的加密方式为在所述服务器装置中能够解密的第二加密方式,
在所述终端装置,将所生成的所述第一加密特征量发送给所述服务器装置,
在所述终端装置,通过用依存于所述指示的加密方式将表示相似程度的相似值加密而生成加密相似值,
在所述终端装置,将所生成的所述加密相似值发送给所述服务器装置,
在所述终端装置,将所取得的所述指示发送给所述服务器装置,
在所述终端装置,从所述服务器装置接收加密参照数据,所述加密参照数据是所述服务器装置将根据所述指示检索相似信息而得到的参照数据加密而成的信息,
在所述终端装置,将接收到的所述加密参照数据解密。
此外,这些总括或具体技术方案既可以由系统、装置、集成电路、计算机程序或计算机可读取的CD-ROM等记录介质实现,也可以由系统、装置、集成电路、计算机程序和记录介质的任意组合实现。
根据本公开,能够根据用户的想法灵活地选择检索方法。
此外,本公开的进一步的效果和优点根据本说明书和附图的公开内容将变清楚。上述进一步的效果和优点可以通过本说明书和附图所公开的各种实施方式和特征独立地提供,不一定必须提供全部效果和优点。
附图说明
图1A是表示在实施方式1中相似信息检索系统提供的服务的全局的框图。
图1B是表示在实施方式1中设备制造商属于数据中心运营公司的例子的框图。
图1C是表示在实施方式1中设备制造商和管理公司这两方或某一方属于数据中心运营公司的例子的框图。
图2是表示在实施方式1中相似信息检索系统的整体构成的框图。
图3是表示在实施方式1中用户终端装置的构成的框图。
图4是表示在实施方式1中数据运算装置的构成的框图。
图5A是表示在实施方式1中数据运算装置中的参照特征量存储单元的例子的图。
图5B是表示在实施方式1中数据运算装置中的参照数据存储单元的例子的图。
图6是表示在实施方式1中相似信息检索系统的工作的时序图。
图7A是表示在实施方式1中用户终端与数据装置之间的数据格式例的图。
图7B是表示在实施方式1中用户终端与数据装置之间的数据格式例的图。
图8A是表示在实施方式1中用户终端装置的显示的例子的图。
图8B是表示在实施方式1中用户终端装置的显示的例子的图。
图9是表示在实施方式1中用户终端装置显示的时间和特征量的算出例的图。
图10是表示在实施方式2中用户终端装置的构成的框图。
图11是表示在实施方式2中数据运算装置的构成的框图。
图12是表示在实施方式2中相似信息检索系统的工作的时序图。
图13是表示在其他变形例中取得统计化参照数据的情况下的数据运算装置的构成的框图。
图14是表示在实施方式3中用户终端装置的构成的框图。
图15是表示在实施方式3中数据运算装置的构成的框图。
图16是表示在实施方式3中相似信息检索系统的工作的时序图。
图17是表示在实施方式3中用户终端与数据装置之间的数据格式例的图。
图18是表示在实施方式3中用户终端装置的显示的例子的图。
图19是表示在实施方式3中用户终端装置的显示的例子的图。
图20是表示服务类型1(本公司数据中心型云服务)中的相似信息检索系统提供的服务的全局的框图。
图21是表示服务类型2(IaaS利用型云服务)中的相似信息检索系统提供的服务的全局的框图。
图22是表示服务类型3(PaaS利用型云服务)中的相似信息检索系统提供的服务的全局的框图。
图23是表示服务类型4(SaaS利用型云服务)中的相似信息检索系统提供的服务的全局的框图。
标号说明
100 用户终端装置(终端装置)
103 特征量加密单元
105 相似值加密单元
107 解密单元
111 加密切换单元
112 指示发送单元
200 服务器装置(数据运算装置)
具体实施方式
(成为本公开的基础的见解)
作为在加密的状态下进行相似检索的方法,有使用了同态加密的方法。然而,该情况下,服务器侧仅提供相似的信息。如果可能的话,还是希望积累作为参照的数据,以在将来发挥作用。
另一方面,认为:根据用户的不同,隐私保护也很重要,但为了将自身的信息为他人所用或在将来使用,也可以保存在数据库中。或者,考虑可向这样的用户提供奖励(incentive)。作为奖励,例如可考虑积分、更详细的信息提供或更有用的建议等。
因此,对灵活应对上述用户的想法的相似检索方法进行了研究。
本公开的一个技术方案涉及的相似信息检索方法,
是服务器装置基于从终端装置提供的信息检索相似信息的方法,包括以下步骤:
在所述终端装置,取得关于是进行加密检索还是进行非加密检索的指示,所述加密检索为所述服务器装置在加密的状态下使用从所述终端装置提供的信息进行所述检索,所述非加密检索为所述服务器装置在不加密的状态下使用从所述终端装置提供的信息进行所述检索,
在所述终端装置,通过用依存于所取得的所述指示的加密方式将表示所取得的数据的特征的第一特征量加密而生成第一加密特征量,在所述指示为进行加密检索的指示的情况下,依存于所述指示的加密方式为同态且在所述服务器装置中不能解密的第一加密方式,在所述指示为进行非加密检索的指示的情况下,依存于所述指示的加密方式为在所述服务器装置中能够解密的第二加密方式,
在所述终端装置,将所生成的所述第一加密特征量发送给所述服务器装置,
在所述终端装置,通过用依存于所述指示的加密方式将表示相似程度的相似值加密而生成加密相似值,
在所述终端装置,将所生成的所述加密相似值发送给所述服务器装置,
在所述终端装置,将所取得的所述指示发送给所述服务器装置,
在所述终端装置,从所述服务器装置接收加密参照数据,所述加密参照数据是所述服务器装置将根据所述指示检索相似信息而得到的参照数据加密而成的信息,
在所述终端装置,将接收到的所述加密参照数据解密
根据该构成,能够根据用户的想法灵活地选择检索方法。
另外,在该相似信息检索方法中,
所述服务器装置具有保持有多个参照特征量的第一存储器和保持有分别所述多个参照特征量对应的多个参照数据的第二存储器,
所述方法还包括以下步骤:
在所述服务器装置,接收从所述终端装置发送来的所述指示,
在所述服务器装置,按照接收到的所述指示,判断进行所述加密检索和所述非加密检索中的哪一个,
在所述服务器装置,在所述判断中判断为进行所述加密检索的情况下,算出加密距离,所述加密距离表示从所述终端装置接收到的所述第一加密特征量与第一参照特征量的相似程度,所述第一参照特征量是保持于所述第一存储器的所述多个参照特征量中的一个,
在所述服务器装置,判定所算出的所述加密距离与从所述终端装置接收到的所述加密相似值是否一致,
在所述服务器装置,在所述判定中判定为一致的情况下,从所述第二存储器取得第一参照数据,将所取得的所述第一参照数据加密而生成所述加密参照数据,将所生成的所述加密参照数据发送给所述终端装置,所述第一参照数据是与在所述加密距离的算出中使用的所述第一参照特征量对应的数据。
根据该构成,由于服务器装置进行加密距离的算出和加密距离与加密相似值是否一致的判断等,所以能够削减终端装置的计算量。其结果,在该相似信息检索方法中,能够使终端装置的处理计算轻量化。
另外,所述服务器装置具有保持有多个参照特征量的第一存储器和保持有分别与所述多个参照特征量对应的多个参照数据的第二存储器,
所述方法还包括以下步骤:
在所述服务器装置,接收从所述终端装置发送来的所述指示,
在所述服务器装置,按照接收到的所述指示,判断进行所述加密检索和所述非加密检索中的哪一个,
在所述服务器装置,在所述判断中判断为进行所述非加密检索的情况下,算出表示解密特征量与第一参照特征量的相似程度的距离,所述解密特征量是将从所述终端装置接收到的所述第一加密特征量解密而得到的特征量,所述第一参照特征量是多个参照特征量中的一个,
在所述服务器装置,判定所算出的所述距离与解密相似值是否一致,所述解密相似值是将从所述终端装置接收到的所述加密相似值解密而得到的值,
在所述服务器装置,在所述判定中判定为一致的情况下,从所述第二存储器取得第一参照数据,将所取得的所述第一参照数据加密而生成所述加密参照数据,将所生成的所述加密参照数据发送给所述终端装置,所述第一参照数据是与在所述距离的算出中使用的所述第一参照特征量对应的数据。
根据该构成,由于服务器装置进行距离的算出和距离与相似值是否一致的判断等,所以能够削减终端装置的计算量。其结果,在该相似信息检索方法中,能够使终端装置的处理计算轻量化。
另外,在该相似信息检索方法中,
所述第一加密方式是用与所述终端装置保持的私钥对应的公钥进行加密的加密方式,
所述第二加密方式是用与所述服务器装置保持的私钥对应的公钥进行加密的方式。
根据该构成,能够根据是进行加密检索还是进行非加密检索,切换为使用与终端装置或服务器装置的某一个对应的公钥将特征量和相似值加密。也就是说,在用户想隐匿信息并检索时,能够切换为服务器装置进行加密检索,在用户想更详细地进行检索时,能够切换为服务器装置进行非加密检索。
另外,在该相似信息检索方法中,还包括以下步骤:
所述终端装置将登记许可信息发送给所述服务器装置,所述登记许可信息表示是否许可与所述终端装置的用户相关的信息登记在所述服务器装置中,
在所述服务器装置,在接收到的所述登记许可信息表示许可登记的情况下,将从所述终端装置发送来的与所述用户相关的信息登记作为参照特征量和所述参照数据中的至少一个。
根据该构成,用户能够选择向服务器装置提供与自己相关的信息还是不提供与自己相关的信息。因此,用户也能够向服务器装置公开自己的信息而得到更详细的检索结果。或者,也能够将与自己相关的信息保存于服务器装置作为其他用户的相似检索的参照数据而使用。
本公开的一个技术方案涉及的终端装置,是对检索相似信息的服务器装置请求检索的执行的终端装置,具备一个或多个存储器以及执行包括以下的工作的电路,
取得关于是进行加密检索还是进行非加密检索的指示,所述加密检索为服务器装置在加密的状态下使用从所述终端装置提供的信息进行所述检索,所述非加密检索为所述服务器装置在不加密的状态下使用从所述终端装置提供的信息进行所述检索,
通过用依存于所取得的所述指示的加密方式将表示所取得的数据的特征的第一特征量加密而生成第一加密特征量,在所述指示为进行加密检索的指示的情况下,依存于所述指示的加密方式为同态且在所述服务器装置中不能解密的第一加密方式,在所述指示为进行非加密检索的指示的情况下,依存于所述指示的加密方式为在所述服务器装置中能够解密的第二加密方式,
将所生成的所述第一加密特征量发送给所述服务器装置,
通过用依存于所述指示的加密方式将表示相似程度的相似值加密而生成加密相似值,
将所生成的所述加密相似值发送给所述服务器装置,
将所取得的所述指示发送给所述服务器装置,
从所述服务器装置接收加密参照数据,所述加密参照数据是所述服务器装置将根据所述指示检索相似信息而得到的参照数据加密而成的信息,
将接收到的所述加密参照数据解密。
本公开的一个技术方案涉及的相似信息检索系统,
具备提供信息的终端装置和基于所提供的所述信息检索相似信息的服务器装置,所述终端装置具备一个或多个存储器以及执行包括以下的工作的电路,
取得关于是进行加密检索还是进行非加密检索的指示,所述加密检索为服务器装置在加密的状态下使用从所述终端装置提供的信息进行所述检索,所述非加密检索为所述服务器装置在不加密的状态下使用从所述终端装置提供的信息进行所述检索,
通过用依存于所取得的所述指示的加密方式将表示所取得的数据的特征的第一特征量加密而生成第一加密特征量,在所述指示为进行加密检索的指示的情况下,依存于所述指示的加密方式为同态且在所述服务器装置中不能解密的第一加密方式,在所述指示为进行非加密检索的指示的情况下,依存于所述指示的加密方式为在所述服务器装置中能够解密的第二加密方式,
将所生成的所述第一加密特征量发送给所述服务器装置,
通过用依存于所述指示的加密方式将表示相似程度的相似值加密而生成加密相似值,
将所生成的所述加密相似值发送给所述服务器装置,
将所取得的所述指示发送给所述服务器装置,
从所述服务器装置接收加密参照数据,所述加密参照数据是所述服务器装置将根据所述指示检索相似信息而得到的参照数据加密而成的信息,
将接收到的所述加密参照数据解密。
在该终端装置和相似信息检索系统中,能够根据用户的想法灵活地选择检索方法。
此外,在以下说明的实施方式均为表示本公开的一个具体例的实施方式。在以下的实施方式中所示的数值、形状、构成要素、步骤、步骤的顺序等均为一例,并不意图限定本公开。另外,就以下实施方式的构成要素中、没有记载在表示最上位概念的独立权利请求中的构成要素而言,作为任意的构成要素进行说明。另外,在全部实施方式中,也能够将各个内容进行组合。
(提供的服务的全局)
首先,使用图1A、图1B以及图1C说明本实施方式中的相似信息检索系统提供的服务的全局。
图1A是表示在实施方式1中相似信息检索系统提供的服务的全局的框图。图1B是表示在实施方式1中设备制造商属于数据中心运营公司的例子的框图。图1C是表示在实施方式1中设备制造商和管理公司这两方或某一方属于数据中心运营公司的例子的框图。
相似信息检索系统具备组1000、数据中心运营公司1110以及服务提供商1120。
组1000例如是企业、团体或家庭等,不限定其规模。组1000具有:包括第一设备和第二设备的多台设备1101、家庭网关1102。多台设备1101包括:能够与互联网连接的设备(例如智能手机、个人计算机(PC)或电视机等)和其自身不能与互联网连接的设备(例如照明、洗衣机或冰箱等)。多台设备1101也可以包括尽管其自身不能与互联网连接,但能够经由家庭网关1102与互联网连接的设备。另外,用户1010使用组1000内的多台设备1101。
数据中心运营公司1110具备云服务器1111。云服务器1111是经由互联网与各种设备合作的假想化服务器。云服务器1111主要管理用通常的数据库管理工具等难以处理的巨大数据(大数据)等。数据中心运营公司1110进行数据的管理、云服务器1111的管理以及进行这些管理的数据中心的运营等。后面将说明数据中心运营公司1110进行的服务的详细情况。
在此,数据中心运营公司1110不限于仅进行数据的管理或云服务器1111的管理的公司。例如,如图1B所示,在开发或制造多台设备1101中的一台设备的设备制造商进行数据的管理或云服务器1111的管理等的情况下,设备制造商属于数据中心运营公司1110。另外,数据中心运营公司1110不限于一个公司。例如,如图1C所示,在设备制造商和管理公司共同或分担进行数据的管理或云服务器1111的管理的情况下,这两方或某一方属于数据中心运营公司1110。
服务提供商1120具备服务器1121。在此所说的服务器1121不限定其规模,例如也包括个人用PC内的存储器等。另外,也存在服务提供商1120不具备服务器1121的情况。
此外,在上述相似信息检索系统中,家庭网关1102不是必需的。例如,在云服务器1111进行全部数据管理等情况下,无需家庭网关1102。另外,在相似信息检索系统中,像家庭内的全部设备与互联网连接的情况那样,也有不存在其自身不能与互联网连接的设备的情况。
接着,说明上述相似信息检索系统中的信息的流动。
首先,组1000的第一设备或第二设备分别将各日志信息发送给数据中心运营公司1110的云服务器1111。云服务器1111累积第一设备或第二设备的日志信息(图1A的箭头1131)。在此,日志信息是表示多台设备1101的例如运转状况或工作日期和时间等的信息。例如,日志信息包括电视机的收看历史记录、录像机的录像预约信息、洗衣机的运转日期和时间、要洗的衣服的量、冰箱的开闭日期和时间以及冰箱的开闭次数等,但不限于这些信息,也可以包括从各种设备能够取得的各种信息。此外,日志信息也可以经由互联网从多台设备1101本身直接提供给云服务器1111。另外,日志信息也可以从多台设备1101暂时累积在家庭网关1102,并从家庭网关1102提供给云服务器1111。
接着,数据中心运营公司1110的云服务器1111以一定的单位,将累积的日志信息提供给服务提供商1120。在此,一定的单位既可以是能够整理数据中心运营公司1110所累积的信息并提供给服务提供商1120的单位,也可以是服务提供商1120要求的单位。另外,虽然以一定的单位提供,但也可以不以一定的单位提供,提供的信息量可以根据状况而变化。日志信息根据需要保存在服务提供商1120保有的服务器1121中(图1A的箭头1132)。
并且,服务提供商1120将日志信息整理成与提供给用户的服务相适合的信息,并提供给用户。被提供信息的用户既可以是使用多台设备1101的用户1010,也可以是外部的用户1020。作为向用户1010、1020提供信息的方法,例如,也可以从服务提供商1120直接向用户1020提供信息(用图1A的虚线表示的箭头1133、1134)。另外,作为向用户1010提供信息的方法,例如,也可以再次经由数据中心运营公司1110的云服务器1111而将信息提供给用户1010(图1A的箭头1135、1136)。另外,数据中心运营公司1110的云服务器1111也可以将日志信息整理成与提供给用户1020的服务相适合的信息,并提供给服务提供商1120。
此外,用户1010既可以与用户1020不同,也可以相同。
(实施方式1)
在此,作为本公开的实施方式,参照附图并说明与本公开相关的相似信息检索系统。
1.1相似信息检索系统的整体构成
图2是表示在实施方式1中相似信息检索系统的整体构成的框图。
如图2所示,相似信息检索系统10具备:对数据运算装置200请求检索的用户终端装置100(终端装置的一例)、基于从用户终端装置100提供的信息检索相似信息并提供给用户终端装置100的数据运算装置200(是服务器装置的一例)。
用户终端装置100和数据运算装置200分别可以为多个。例如,可以是多个用户终端装置100与一个数据运算装置200连接,也可以是多个数据运算装置200与一个用户终端装置100连接。另外,各装置间的连接方式可以是有线的互联网线、无线通信以及专用通信等中的任一种。此外,在该相似信息检索系统10中,不一定必须是实时通信。例如,用户终端装置100也可以在以某种程度收集感测到的信息或相似检索的请求后,一起发送给数据运算装置200。
1.2用户终端装置
图3是表示在实施方式1中用户终端装置100的构成的框图。
如图3所示,用户进行在加密的状态下使用信息并进行检索的加密检索。也就是说,用户终端装置100对检索相似信息的数据运算装置请求检索。用户终端装置100具有感测单元101、特征量算出单元102、特征量加密单元103、相似值设定单元104、相似值加密单元105、参照数据利用单元106、解密单元107以及密钥存储单元108。
特征量加密单元103、相似值加密单元105以及解密单元107分别与图4所示的数据运算装置200的用A、B、C图示的位置连接。用户终端装置100例如感测用户的血压、脸色、CT扫描信息等与用户相关的信息,并提取特征量,所述特征量表示所取得的数据的特征。并且,用户终端装置100向数据运算装置200请求与该特征量相似的症状的参照数据,并将得到的参照数据利用于对用户的服务。此外,在用户终端装置100对与用户相关的信息进行感测时,在通过用户得到预定的同意后再进行。关于取得同意等手续,设为本公开的范围外。
1.2.1感测单元
感测单元101对用户进行感测。感测到的数据例如是用户的血压、体温等生命数据、用户的脸部图像或利用回波(echo)或CT扫描的数据等图像数据以及应答的声音的数据等。此外,感测到的数据也可以是用户的位置信息(GPS(Global Positioning System:全球定位系统)信息)、购物的历史记录信息等。
1.2.2特征量算出单元
特征量算出单元102根据由感测单元101取得的数据算出特征量。在此算出的特征量例如可以是脸部等的图像信息中的特征性参数的主要成分或某区域的位置、面积、宽度等数据。另外,也可以根据历史记录信息将与其时间轴对应的倾向例如转换成多项式,特征量是其系数。进而,特征量既可以是数值,也可以是将数值排列而成的矢量值。
1.2.3特征量加密单元
特征量加密单元103通过将表示由特征量算出单元102算出的数据的特征的特征量加密而生成加密特征量。特征量加密单元103将生成的加密特征量发送给数据运算装置200。在此,加密方式使用在将特征量加密的状态下,能够通过数据运算装置200进行用于相似信息检索的运算的同态加密。在数据运算装置200中将特征量隐匿的情况下,使用存储在后述的密钥存储单元108中的用户终端装置100的公钥。
1.2.4相似值设定单元
相似值设定单元104设定相似值,所述相似值表示在检索的情况下的相似程度。在此的相似值是表示在数据运算装置200中,检索与特征量何种程度接近的数据的值。例如,数据运算装置200算出特征量与参照特征量之间的欧几里得距离,在检索该值小于某值D的数据的情况下,将某值D设定作为相似值。或者,也可以设定全部作为某值D的相似值的0、1、…、D-1这样的值。另外,或者,相似值也可以按特征量的矢量值设定。
1.2.5相似值加密单元
相似值加密单元105通过将表示相似程度的相似值加密而生成加密相似值。相似值加密单元105将生成的加密相似值发送给数据运算装置200。加密相似值用于在数据运算装置200中,在加密的状态下判定与加密特征量的相似度,并提取符合判定条件的参照ID。
1.2.6解密单元
解密单元107从数据运算装置200接收加密参照数据,所述加密参照数据是通过由用户终端装置100进行的相似信息的检索,将根据加密特征量和加密相似值生成的参照数据(相似检索的结果)加密而成的信息。并且,解密单元107将接收到的加密参照数据解密。
1.2.7参照数据利用单元
参照数据利用单元106利用在解密单元107中解密得到的参照数据。例如,参照数据利用单元106将参照数据作为图或统计值显示于用户终端装置100,或者,使用这些信息,向用户提出生活习惯的改善建议或推荐的饮食等建议。
1.2.8密钥存储单元
密钥存储单元108存储在特征量加密单元103、相似值加密单元105以及解密单元107中使用的密钥。在各个单元中使用的加密方式和密钥既可以相同,也可以不同。例如,在特征量加密单元103和相似值加密单元105中使用的密钥可以是同态加密方式的用户终端装置100的公钥。此外,对应的私钥也存储于密钥存储单元108。另外,在解密单元107中使用的密钥也可以是非同态加密方式的、公钥加密方法的用户终端装置100的私钥。此外,对应的公钥与数据运算装置共有。另外,在解密单元107中使用的密钥也可以设为与特征量加密单元103中使用的密钥相同的、同态加密方式的用户终端装置100的私钥。
1.3数据运算装置
图4是表示在实施方式1中数据运算装置200的构成的框图。
如图4所示,数据运算装置200基于从用户终端装置提供的信息,根据来自用户的检索请求检索相似信息,并将检索到的信息提供给用户终端装置100。数据运算装置200具有参照特征量存储单元201、加密距离计算单元202、参照相似值提取单元203、加密参照数据提取单元204以及参照数据存储单元205。加密距离计算单元202、参照相似值提取单元203以及加密参照数据提取单元204分别与图3所示的用户终端装置100的用A、B、C图示的位置连接。
1.3.1参照特征量存储单元
图5A是表示在实施方式1中数据运算装置中的参照特征量存储单元的例子的图。图5A是表示存储于参照特征量存储单元201的参照特征量的例子。
如图5A所示,在数据运算装置进行相似检索时,参照特征量存储单元201存储成为检索的对象的参照特征量Yi。此外,识别符ID与i对应,将参照特征量记载为Yi。识别符ID和参照特征量成对存储于参照特征量存储单元201。在图5A中,识别符ID设为1、2、…,并存储有与各识别符ID对应的各参照特征量Y1、Y2、…。在该例子中,各参照特征量用矢量值表示。此外,参照特征量也可以加密存储。
1.3.2加密距离计算单元
加密距离计算单元202从用户终端装置100接收加密特征量,所述加密特征量是用同态加密方式加密而成的特征量。加密距离计算单元202在将特征量和参照特征量加密的状态下,算出将距离加密而成的值,所述距离表示接收到的加密特征量与多个参照特征量的至少一个的相似程度。也就是说,加密距离计算单元202算出用户终端装置生成的特征量与存储于数据运算装置200的参照特征量的距离。具体而言,加密距离计算单元202将从参照特征量存储单元201接收到的参照特征量加密。加密距离计算单元202将从用户终端装置接收到的加密特征量与加密的参照特征量的距离在分别加密的状态下算出。
并且,加密距离计算单元202将作为该加密的状态下的距离的加密距离输出至参照相似值提取单元203。加密距离例如在各自的特征量为数值的情况下,可以是差的绝对值,在各自的特征量为将数值作为要素的矢量的情况下,可以是将对应的矢量要素之差的绝对值相加而成的值。另外,加密距离也可以是将各自的矢量要素的乘积相加而成的余弦相似度。
具体而言,在特征量和参照特征量为将数值作为要素的矢量中,特征量为(x1,x2,x3,…xn),参照特征量为(y11,y12,y13,…y1n)的情况下,通过将矢量要素之差的绝对值相加得到的距离用Σ|xi-y1i|表示,余弦相似度用Σxi×y1i表示,欧几里得距离用Σ(xi-y1i)^2表示。由于加密距离计算单元202为了在将特征量和参照特征量加密的状态下进行这些计算,而使用同态加密方式。在同态加密方式的运算中,可以按矢量值的要素进行计算,为了使计算高速化,也可以映射到将特征量的矢量值作为多项式的各系数而成的多项式,并用多项式间的运算进行同态加密方式的距离计算。
1.3.3参照相似值提取单元
参照相似值提取单元203从相似值加密单元接收加密相似值。加密相似值是将表示相似程度的相似值加密而成的信息。此外,优选,该加密而成的信息用同态加密方式加密。
参照相似值提取单元203使用从相似值加密单元105接收到的加密相似值和从加密距离计算单元202接收到的加密距离,判断距离与相似值是否一致。在此,加密距离与加密相似值一致的情况与距离与相似值一致的情况相同。在判断为距离与相似值一致的情况下,参照相似值提取单元203提取对应的参照特征量的识别符ID。在未判断为加密相似值与加密距离一致的情况下,参照相似值提取单元203不提取对应的参照特征量的识别符ID。
1.3.4参照数据存储单元
图5B是表示在实施方式1中数据运算装置200中的参照数据存储单元205的例子的图。图5B示出了存储于参照数据存储单元205的识别符ID和参照数据的例子。
如图5B所示,为了数据运算装置200进行相似检索,参照数据存储单元205将成为检索的对象的参照数据进行存储。识别符ID和参照数据成对存储于参照数据存储单元205。在参照数据存储单元205中,将识别符ID设为1、2、…i,并存储有与各识别符ID对应的各参照数据Z1、Z2、…Zi。此外,识别符ID与i对应,将参照数据记载为Zi。作为参照数据,例如可以是表示血压测量值的倾向的特征量(图5A的参照特征量)所对应的疾病或治疗历史记录(图5B的参照数据)、表示用户的位置信息的特征量(图5A的参照特征量)所对应的购买的商品的历史记录(图5B的参照数据)等。在图5B的例子中,保存有识别符ID为1的用户在2013年10月因脑梗塞住院,识别符ID为2的用户在1999年2月因糖尿病开始治疗这样的疾病或治疗历史记录等。参照数据也可以加密存储。
1.3.5加密参照数据提取单元
在由参照相似值提取单元203判定为一致的情况下,加密参照数据提取单元204生成加密参照数据。加密参照数据是将参照数据加密而成的信息,所述参照数据是在加密距离的算出中使用的参照特征量所对应的数据。加密参照数据提取单元204将生成的加密参照数据发送给用户终端装置100的解密单元107。具体而言,加密参照数据提取单元204从参照数据存储单元205提取与在参照相似值提取单元203中提取的识别符ID对应的参照数据,并将其发送给用户终端装置100的解密单元107。加密参照数据提取单元204为了在发送时保护通信路径上的数据而加密并发送。此外,也可以在加密之前进行匿名化,以使得不能根据参照数据而确定对应的用户。另外,数据运算装置200也可以根据提取的多个参照数据,求出平均值或频率这样的统计信息,将其加密并发送给用户终端装置100的解密单元107。
1.4相似信息检索系统的工作
1.4.1工作概要
使用图6说明相似信息检索系统10的工作。
图6是表示在实施方式1中相似信息检索系统10的工作的时序图。
如图6所示,在步骤S101中,用户终端装置100用感测单元101感测用户,取得与用户相关的数据。
在步骤S102中,特征量算出单元102根据感测单元101感测到的数据算出特征量X。例如,如以下,特征量X的各要素可以是数值的m维矢量。
X=(x1,x2,…,xm)
在步骤S103中,相似值设定单元104设定成为检索时的判定基准的相似值。例如,在检索小于距离D的数据的情况下,设定作为相似值的各距离0、1、2、…、D-1。
在步骤S104中,特征量加密单元103通过用同态加密方式将特征量X加密而生成加密特征量。另外,相似值加密单元105通过用同态加密方式将相似值加密而生成加密相似值。同态加密方式是在数据运算装置200中不能解密的加密方式。此时使用的密钥是用户终端装置100的公钥。
在将加密的函数设为Enc时,加密而成的特征量能够表示为:
Ex=(Enc(x1),Enc(x2),…,Enc(xm))
加密而成的相似值能够表示为:
Enc(0)、Enc(1)、…、Enc(D-1)
在步骤S105中,用户终端装置100向数据运算装置200请求表示加密特征量和加密相似值、并满足条件的相似的参照数据。也就是说,加密特征量发送给加密距离计算单元202,加密相似值发送给参照相似值提取单元203。
具体而言,加密距离计算单元202从特征量加密单元103接收该加密特征量,所述加密特征量是用同态加密方式加密而成的特征量。另外,参照相似值提取单元203从相似值加密单元105接收加密相似值,所述加密相似值是将表示相似程度的相似值加密而成的信息。此外,优选,作为加密而成的信息的加密相似值用同态加密方式加密。
另外,也可以接收多个加密相似值,所述多个加密相似值是将表示多个相似程度的多个相似值分别加密而成的信息。
在步骤S106中,数据运算装置200从参照特征量存储单元201中选择第i个识别符ID的参照特征量Yi=(yi1,yi2,…,yim)。
在步骤S107中,加密距离计算单元202对多个参照特征量的至少一个,在加密的状态下计算距离,所述距离表示加密而成的参照特征量与由数据运算装置200接收到的加密特征量的相似程度。加密而成的参照特征量能够表示为:
Ey=(Enc(yi1),Enc(yi2),…,Enc(yim))
此外,优选,对多个参照特征量的至少一个加密而成的参照特征量用同态加密方式加密。
加密距离计算单元202求出特征量X与参照特征量Yi的各矢量之差并相加,使用同态加密方式的性质计算以下的加密距离EDi。
EDi=Enc(|x1-yi1|+|x2-yi2|+…+|xm-yim|)
此外,在上述说明中,将累加了各矢量要素之差的绝对值而成的值作为加密距离。另外,数据运算装置200也可以对多个加密相似值中的每一个执行步骤S107。
在步骤S108中,参照相似值提取单元203使用加密距离和加密相似值确认是否满足条件。也就是说,步骤S108判定算出的加密距离与由数据运算装置200接收到的加密相似值是否一致。此外,数据运算装置200也可以对多个加密相似值中的每一个执行步骤S108。
作为确认的方法的例子,确认加密距离EDi与加密的函数Enc(0)、Enc(1)、…、Enc(D-1)中的某一个是否一致。如果一致,则意味着加密距离EDi的加密的函数Enc的内容,即,作为特征量与参照特征量的距离的|x1-yi1|+|x2-yi2|+…+|xm-yim|是作为相似的各距离0、1、…、D-1的某一个。
如果哪一个都不一致,即,在不满足条件的情况下,选择下一个识别符ID,返回步骤S106。
如果与某一个一致,即,在满足条件的情况下,在步骤S109中,通过这些特征量间的距离小于相似值D,参照相似值提取单元203记录此时的识别符ID。然后,对参照特征量存储单元201的各识别符ID反复进行步骤S106至步骤S109。
在步骤S110中,在步骤S108中判定为一致的情况下,加密参照数据提取单元204生成加密参照数据,所述加密参照数据是将参照数据加密而成的信息,所述参照数据是在加密距离的算出中使用的参照特征量所对应的数据。也就是说,在步骤S110中,加密参照数据提取单元204从参照数据存储单元205提取与在步骤S109提取的全部识别符ID对应的参照数据,并使用用户终端装置100的公钥进行加密。
在步骤S111中,加密参照数据提取单元204将生成的加密参照数据发送给用户终端装置100。此外,加密参照数据提取单元204也可以对多个加密相似值中的每一个执行步骤S111。
在步骤S112中,解密单元107从加密参照数据提取单元204接收加密参照数据。并且,用户终端装置100将从数据运算装置200接收到的加密参照数据解密并利用参照数据。
1.4.2特征量的算出例
作为在步骤S102中的特征量的算出,例如在由感测单元101取得了脸部和/或回波(echo)信息等的图像数据的情况下,也可以是该图像信息的特征性参数的主要成分或某区域的位置、面积、宽度等。另外,在取得了血压信息的情况下,也可以根据另行存储于用户终端装置100的、迄今为止测量到的血压测量信息的历史记录(在图3中未图示),将与其时间轴对应的倾向例如转换成多项式,并将其系数作为特征量。在图9中示出与时间轴对应的倾向的多项式的例子。
图9是表示在实施方式1中用户终端装置100显示的时间和特征量的算出例的图。在图9中,时间表示从过去(例如1年前)到现在为止的时间。另外,在图9中,根据用×表示的各特征量的各测量值求出近似曲线,将该近似曲线的系数作为特征量。
1.4.3加密距离的算出例
作为步骤S107中的加密距离的算出,在上述说明中,在加密的状态下,求出由用户终端装置100求出的特征量与数据运算装置200中的参照特征量的对应的矢量值之差的累加。加密距离是参照特征量与加密特征量的欧几里得距离。除此之外,加密距离的算出例例如也可以是余弦相似度的算出方法。但是,在该情况下,可以使用能够在加密的状态下求出相加和相乘这两方的全同态加密或者相乘的次数有限的浅(Somewhat)同态加密。
1.4.4用户终端装置与数据运算装置间的数据交换
图7A是表示在实施方式1中用户终端装置100与数据运算装置200之间的数据格式例的图。图7B是表示在实施方式1中用户终端装置100与数据运算装置200之间的数据格式例的图。图7A和图7B表示在步骤S105和步骤S111中在用户终端装置100与数据运算装置200之间交换的数据的格式例,包括发送者的识别符ID、接收者的识别符ID、命令以及数据。此外,在多个用户终端装置100与多个数据运算装置200之间并行交换命令的情况下,也可以追加用于取得步骤S105以及步骤S111的对应的识别符。
1.4.5显示例
图8A是表示在实施方式1中用户终端装置100的显示的例子的图。图8B是表示在实施方式1中用户终端装置100的显示的例子的图。
图8A是图6的步骤S101中的用户终端装置100的显示的例子。
在此,当用户点击(选择)“开始”时,感测单元101启动,进行血压的测量。然后,用户通过“是”、“中止”中的某一个,选择是否根据最近的血压的倾向检索相似病例。在用户点击“是”而同意的情况下,用户终端装置100使用该测量值和最近的历史记录信息,根据倾向算出特征量。另外,在用户点击“中止”而不同意的情况下,用户终端装置100不向数据运算装置200发送信息以进行相似病例的检索。
图8B是使用检索到的参照相似数据向用户提出饮食、运动的建议的情况下的显示的例子。在该情况下,参照相似数据表示血压变动的倾向相似的用户的之后发病的疾病。
在此,用户终端装置100以用户的信息为基础,显示从过去到现在为止的血压的倾向和参照相似数据。在该用户终端装置100中,通过提出基于用户的信息的建议,成为更加伴随有真实感的建议,对用户来说变得有用。
1.5实施方式1的效果
在实施方式1中,数据运算装置200从用户终端装置100接收加密特征量和加密相似值,加密参照数据提取单元204提取加密参照数据。由于数据运算装置200仅提取小于相似值D的加密参照数据并发送给用户终端装置100,所以能够削减用户终端装置100的计算量、数据运算装置200与用户终端装置100之间的通信量。另外,在用户终端装置100中,能够根据用户的想法灵活地设定相似值。
另外,加密特征量以同态加密方式加密,在数据运算装置200中不能解密。因此,在该相似信息检索方法等中,即使在从用户终端装置100向数据运算装置200的发送方面以及数据运算装置内,也能够提高用户检索到的信息的隐匿性。
(实施方式2)
在此,作为本公开的实施方式2,参照附图并说明与本公开相关的相似信息检索系统。实施方式2与实施方式1的不同之处如下。在实施方式1中,在步骤S108中,加密参照相似值提取单元203通过加密距离与加密相似值是否一致来进行判定。这以利用如下决定性加密方式为前提:如果原来的数据相同,则只要在那时候,其加密而成的数据也一致。另一方面,在实施方式2中,有时也使用如下概率性加密方式:通过在加密时生成随机数,也包括随机数并进行加密,由此即使原来的数据相同,其加密而成的数据也不成为相同的值。如果使用概率性加密方式,则根据密文(encrypted text)的频率等的解析变得困难,能够使安全性提高。另一方面,在实施方式1的决定性加密方式中,在加密时使用了随机数的情况下,不能进行加密距离与加密相似值是否一致的判定。
在实施方式2中,将叙述针对使用概率性加密方式的情况,在加密的状态下能够进行用于相似信息的检索的运算的方法。因此,在相似信息检索系统中,转换用于解密的密钥并从用户终端装置提供给数据运算装置,数据运算装置将转换而成的距离解密。并且,在相似信息检索系统中,能够通过解密去除随机数的要素,进行转换距离与转换相似值是否一致的判定。另外,由于使用单向函数转换用于解密的密钥,所以数据运算装置不能够求出密钥本身。在以下说明中,主要针对实施方式2与实施方式1的不同之处进行说明,关于实施方式1与实施方式2相同的构成,标注同一标号并省略与构成相关的详细说明。
2.1用户终端装置
图10是表示实施方式2中的用户终端装置100的构成的框图。
如图10所示,除了实施方式1的构成以外,该用户终端装置100还具备密钥转换单元109和相似值转换单元110。此外,由于标注了与图3同一标号的图10的框图具有与图3相同的功能,所以省略说明。图10中的特征量加密单元103、相似值转换单元110、密钥转换单元109以及解密单元107分别与图11的D、E、F、G连接。
2.1.1密钥转换单元
密钥转换单元109算出密钥转换值。密钥转换值是使用单向函数将用户终端装置100的私钥转换而成的信息。作为单向函数的例子,是将私钥作为幂指数的幂乘运算。使用了单向函数的转换意味着:根据私钥进行幂乘运算很容易,与之相反的根据幂乘值求出其幂指数很困难。对于根据幂乘值求出其幂指数这件事,归结于在离散对数区域上的LOG运算很困难。
2.1.2相似值转换单元
相似值转换单元110使用与在密钥转换单元109使用的函数相同的单向函数,对设定的相似值进行转换。
2.2数据运算装置
图11是表示在实施方式2中数据运算装置200的构成的框图。
如图11所示,除了实施方式1的构成以外,数据运算装置200还具备转换距离解密单元206和代替实施方式1的参照相似值提取单元203的参照转换相似值提取单元207。此外,由于标注了与图4同一标号的图11的框图具有与图4相同的功能,所以省略说明。另外,图11的D、E、F、G与图10的对应的位置连接。
2.2.1转换距离解密单元
转换距离解密单元206通过在转换区域中,使用密钥转换值将加密距离解密而求出转换距离,所述密钥转换值是密钥转换单元109使用单向函数对用户终端装置100的私钥进行转换而成的信息。由于在此使用的同态加密方式是概率性方法,所以在加密距离中包括随机数要素。但是,通过使用密钥转换值进行解密而求出的转换距离除去了随机数要素。
2.2.2参照转换相似值提取单元
参照转换相似值提取单元207判定在转换区域中转换距离与转换相似值是否一致。在转换距离与转换相似值中的某一个一致的情况下,参照转换相似值提取单元207判断为转换距离满足设定好的转换相似值的条件并提取对应的识别符ID。在哪一个都不一致的情况下,不提取对应的识别符ID。
2.3相似信息检索系统的工作
使用图12所示的时序图,说明实施方式2中的相似信息检索系统10的工作。
图12是表示在实施方式2中相似信息检索系统10的工作的时序图。
如图12所示,在步骤S101中,用户终端装置100用感测单元101感测用户,取得与用户相关的数据。
在步骤S102中,特征量算出单元102根据感测单元101感测到的信息算出特征量X。例如,如下,特征量X的各要素可以是数值的m维矢量。
X=(x1,x2,…,xm)
在步骤S103中,相似值设定单元104决定成为检索时的判定基准的相似值。例如,在检索成为小于距离D的数据的情况下,设定各距离0、1、2、…、D-1作为相似值。
在步骤S104中,特征量加密单元103通过用同态加密方式将特征量X加密而生成加密特征量。另外,相似值转换单元110求出相似值的单向函数值。也就是说,相似值转换单元110通过用同态加密方式对相似值进行转换而生成转换相似值。同态加密方式是在数据运算装置200中不能解密的加密方式。此时使用的密钥为用户终端装置100的公钥。在实施方式2中,与实施方式1不同,同态加密方式为包括随机数要素的概率性加密方式。
在此,当将加密的函数设为Enc1时,加密特征量能够表示为:
E1x=(Enc1(x1),Enc1(x2),…,Enc1(xm))
另外,当将用于转换相似值的单向函数设为F时,转换相似值能够表示为:
F(0)、F(1)、…、F(D-1)
在步骤S113中,密钥转换单元109算出密钥转换值F(s),所述密钥转换值F(s)是用预定函数将用户终端装置100保持的私钥s转换而成的信息。预定函数是单向函数。密钥转换单元109根据需要算出密钥转换值,所述密钥转换值是私钥s的运算值(例如s的幂乘值)。
在步骤S105中,用户终端装置100向数据运算装置200请求表示加密特征量、转换相似值以及密钥转换值并满足条件的相似的参照数据。也就是说,用户终端装置100向数据运算装置200发送加密特征量、转换相似值以及密钥转换值,数据运算装置200接收加密特征量、转换相似值以及密钥转换值。具体而言,特征量加密单元103将加密特征量发送给加密距离计算单元202,加密距离计算单元202接收该加密特征量。另外,相似值转换单元110将转换相似值发送给转换距离解密单元206,转换距离解密单元206接收该转换相似值。并且,密钥转换单元109将密钥转换值发送给参照转换相似值提取单元207,参照转换相似值提取单元207接收该密钥转换值。
另外,在步骤S105中,数据运算装置200也可以接收多个转换相似值作为加密相似值,所述多个转换相似值是用单向函数加密了表示多个相似程度的多个相似值中的每一个而成的信息。
在步骤S106中,数据运算装置200从参照特征量存储单元201中选择第i个识别符ID的参照特征量Yi=(yi1,yi2,…,yim)。
在步骤S107中,加密距离计算单元202在加密的状态下计算用加密的函数Enc1加密而成的参照特征量与加密特征量的距离。加密而成的参照特征量能够表示为:
E1y=(Enc1(yi1),Enc1(yi2),…,Enc1(yim))
由此,如果加密距离计算单元202求出特征量X与参照特征量Yi的各矢量之差并相加,则能够使用同态加密方式的性质计算加密距离ED1i。
ED1i=Enc1(|x1-yi1|+|x2-yi2|+…+|xm-yim|)
此外,在上述说明中,将累加了各矢量要素之差的绝对值而成的值作为距离。
在步骤S114中,转换距离解密单元206使用密钥转换值,在转换区域将加密距离解密。解密的结果为:
求出F(|x1-yi1|+|x2-yi2|+…+|xm-yim|)。将其值称为转换距离。此外,加密距离ED1i包括在加密时生成的随机数,加密的函数Enc1即使输入相同,输出也不一致。另一方面,单向函数F在输入相同的情况下,输出一致。
在步骤S108中,转换距离解密单元206通过使用密钥转换值将加密距离解密而生成转换距离。另外,参照转换相似值提取单元207判定生成的转换距离与转换相似值是否一致。也就是说,参照转换相似值提取单元207判断转换距离与转换相似值F(0)、F(1)、…、F(D-1)中的某一个是否一致。假如一致,则意味着单向函数F的内容,即,作为特征量与参照特征量的距离的|x1-yi1|+|x2-yi2|+…+|xm-yim|是各距离0、1、…、D-1的某一个。
假如转换距离与转换相似值中的哪一个都不一致,则参照转换相似值提取单元207选择下一个识别符ID,返回步骤S106。
假如转换距离与转换相似值中的某一个一致,则在步骤S109中,参照转换相似值提取单元207记录此时的识别符ID。然后,对参照特征量存储单元201的各识别符ID反复进行步骤S106至步骤S109。
在步骤S110中,加密参照数据提取单元204从参照数据存储单元205中提取与在S109中提取的全部识别符ID对应的参照数据,并使用用户终端装置100的公钥进行加密。也就是说,在步骤S108中判定为一致的情况下,加密参照数据提取单元204生成加密参照数据,所述加密参照数据是将参照数据加密而成的信息,所述参照数据是在加密距离的算出中使用的参照特征量所对应的数据。
在步骤S111中,加密参照数据提取单元204将生成的加密参照数据发送给用户终端装置100。
在步骤S112中,解密单元107从数据运算装置200接收加密参照数据,所述加密参照数据是将根据加密特征量和加密相似值生成的参照数据加密而成的信息。然后,解密单元107接收从加密参照数据提取单元204发送来的、作为相似检索的结果的加密参照数据,将其解密并利用参照数据。
2.3.1环LWE(Learning With Errors:带错学习)的情况下的具体计算例
作为上述Enc1的具体例,以下说明使用了环LWE的同态加密方式的密钥生成、加密、解密以及密文的乘法运算。此外,关于环LWE,在非专利文献1的第13章中有说明。
密钥生成:将n作为2的幂乘而构成,将p设为p-1为2n的倍数这样的素数而构成环R、Rp。将小于p的素数设为t。将Rt=(Z/tZ)[x]/(x^n+1)设为明文空间。此外,在此,Z是整数,Rt是将以t以下的整数为系数的多项式除以(x^n+1)得到的剩余域(residue field)。另外,任意选择私钥s,任意选择e,从Rp中任意选择a1。然后,将(a0=-(a1×s+t×e),a1)设为公钥。
加密:明文m(∈Rt)的加密使用公钥(a0,a1)如以下。任意选择e1、e2、e3,
Enc1(m)=(m+a0×e1+t×e3,a1×e1+t×e2)
解密:密文c=(c0,c1,…,ck)的解密使用私钥s如以下。
Dec1(c)=c0×s^0+c1×s^1+c2×s^2+…+ck×s^k
(∈Rq)
Dec1(c)成为m+t×e4(其中,|t×e4|<p/2)。
密文的乘法运算:密文c=(c0,c1,…,ck)与密文d=(d0,d1,…,dl)的乘法运算设为h=(h0,h1,…,hk+l)。
在此,hi用
Σcj×di-j=c0×di+c1×di-1+…+ci×d0
求出。
密文的加法运算:密文c=(c0,c1,…,ck)与密文d=(d0,d1,…,dl)的加法运算是在较短的矢量上追加0而设为相同长度后,将各要素相加而求出。
使用以上的加密的函数Enc1,在以下示出图12的时序的具体计算。
在步骤S104中,加密特征量与转换相似值分别如以下。在此,r设为任意的随机数。
E1x=(Enc1(x1),Enc1(x2),…,Enc1(xm))
F(0)=r^0,F(1)=r^1,…,F(D-1)=r^D-1
在步骤S113中,密钥转换单元109求出下一个密钥转换值F(s)。
F(s)=r^s,F(s^2)=r^(s^2),…,F(s^k)=r^(s^k)
在步骤S106中,加密而成的参照特征量如以下。
E1y=(Enc1(y1),Enc1(y2),…,Enc1(ym))
在步骤S107中,加密距离计算单元202使用加密特征量E1x和加密而成的参照特征量E1y求出加密距离EDi。通过加密的函数Enc1的加法和乘法中的同态,求出
ED1i=Enc1(特征量X与参照特征量Yi的距离)
将加密距离ED1i设为(c0,c1,…,ck)。
在步骤S114中,转换距离解密单元206使用加密距离ED1i和密钥转换值,计算以下。
r^c0+F(s)^c1+…+F(s^k)^ck
通过以上所述,其值成为r^Dec1(ED1i)。表示该计算值的幂指数的Dec1(ED1i)成为特征量X与参照特征量Yi的距离。
在步骤S108中,将上述求出的值与转换相似值F(0)=r^0,F(1)=r^1,…,F(D-1)=r^(D-1)分别进行比较(判断是否一致)。如果转换距离与转换相似值一致,则由于特征量X与参照特征量Yi为各距离0~(D-1)中的某一个,所以判断为参照特征量满足相似条件。此外,求出r的幂乘的单向函数严格地说存在不同的输入的函数输出为一致的情况(称为冲突),但在此,认为在概率上能够大致忽视。
2.3.2 BGN加密(Boneh-Goh-Nissim cryptosystem)的情况下的具体计算例
作为加密的函数Enc1的第二具体例,以下说明BGN加密的密钥生成、加密、解密以及密文的乘法运算。此外,关于BGN加密,在非专利文献2中有说明。
密钥生成:分别将q1、q2设为素数,求出N=q1×q2。将G和G’设为关于位数成为N的信息的有限循环群,生成G的生成元g和h=u^q2(在此u为G的生成元)。另外,e设为G×G→G’的配对。配对是对于任意的u,v∈G和a,b∈整数,e(u^a,v^b)=e(u,v)^(ab)成立的函数。
以上说明中,将私钥设为q1,将公钥设为(N,e,g,h)。
加密:明文m∈{0,1,…,T}(T<q2)(在此的明文空间是能够解离散对数问题的程度)的加密使用公钥(N,e,g,h)如下。任意选择随机数r,并将
Enc1(m)=(g^m)×(h^r)=c
作为密文。
解密:密文c的解密使用私钥q1如下进行。
Dec1(c)=c^q1
Dec1(c)为(g^m)^q1×(h^r)^q1
=(g^q1)^m×u^(Nr)
=(g^q1)^m
从这里起,解离散对数问题而将m解密。
密文的乘法运算:在m1的密文E(m1)与m2的密文E(m2)之间满足仅一次的乘法同态性,设为g1=e(g,g),h1=e(g,h)。
当设为u=g^α时,成为h=u^q2=g^αq2。此时,如下,能够根据E1(m1)、E1(m2)制作对于m1m2的密文。
E1(m1)=(g^m1)×(h^r1)
E1(m2)=(g^m2)×(h^r2)
e(E1(m1)、E1(m2))h1^r=(g1^(m1m2))h1^r3∈G’
在此,成为r3=m1r2+r2m1+αq2r1r2+r。
密文的加法运算:在m1的密文E1(m1)与m2的密文E1(m2)之间满足以下的加法同态性。也就是说,能够根据密文E1(m1)和密文E1(m2)制作对于m1+m2的密文。
E1(m1)×E1(m2)=(g^(m1+m2))×h^(r1+r2)=E1(m1+m2)
使用以上的加密的函数Enc1,在以下示出图12的时序的具体计算。
在步骤S104中,加密特征量与转换相似值分别如以下。在此,r设为任意的随机数。
E1x=(Enc1(x1),Enc1(x2),…,Enc1(xm))
F(0)=g1^Q,F(1)=g1^(2Q),…,F(D-1)=g1^((D-1)Q)
在步骤S113中,密钥转换单元109生成任意的随机数R,求出下一个密钥转换值。
F(s)=R×q1=Q
在步骤S106中,加密而成的参照特征量如以下。
E1y=(Enc1(y1),Enc1(y2),…,Enc1(ym))
在步骤S107中,加密距离计算单元202使用加密特征量E1x和加密而成的参照特征量E1y,求出加密距离EDi。Enc1的加法和乘法中的同态,满足以下公式。
求出ED1i=Enc1(x与y的距离)。此外,作为x与y的距离,例如既可以是它们的差,也可以是使用仅一次的乘法同态性,而成为余弦相似度(x1y1+x2y2+…+xmym)。
此外,ED1i为(g1^(x与y的距离))×(h^r4)的形式,包括有随机数要素。
在步骤S114中,使用加密距离ED1i和密钥转换值,计算以下。
(ED1i)^F(s)=((g1^(x与y的距离))×(h^r4))^(R×q1)
=(g1^(x与y的距离))^Q
=(g1^Q)^(x与y的距离)
在步骤S108中,转换距离解密单元206分别对上述求出的值F(0)=g1^Q、F(1)=g1^(2Q)、…、F(D-1)=g1^((D-1)Q)进行比较。如果这些值中的某一个成立,则由于特征量X和参照特征量Yi为各距离0~(D-1)中的某一个,所以判断为参照特征量满足相似条件。
2.4实施方式2的效果
在实施方式2中,由于用户终端装置100利用包括随机数的概率性加密向数据运算装置200发送,所以能够强化安全性。另外,数据运算装置200从用户终端装置100接收加密特征量、加密相似值以及密钥转换值并提取加密参照数据。由于数据运算装置200仅提取小于相似值D的相似数据并发送给用户终端装置100,所以能够削减用户终端装置100的计算量、数据运算装置200与用户终端装置100之间的通信量。另外,在用户终端装置100中,能够根据用户的想法灵活地设定相似值。
另外,就包括随机数而成的概率性加密而言,即使用户基于同一信息进行检索,加密而成的特征量也不会成为相同的值。因此,根据该相似值检索方法等,即使在从用户终端装置100向数据运算装置200的发送方面以及数据运算装置200内,也能够进一步提高用户检索到的信息的隐匿性。其结果,通过使用概率性加密,根据密文的频率等的解析变得困难,能够使安全性提高。
(实施方式3)
在此,作为本公开的实施方式3,参照附图并说明与本公开相关的相似信息检索系统。与实施方式1和实施方式2的不同之处如以下。在实施方式1和实施方式2中,在用户终端装置100中求出的特征量设为与用户的隐私关联的特征量,在数据运算装置200中,在通过加密设为隐匿的状态下,进行相似检索。但是,根据用户的不同,也存在在数据运算装置200中公开特征量,想得到更详细的检索结果的情况。或者,也存在如下情况:有将特征量保存在参照特征量存储单元201和参照数据存储单元205中,想使之作为其他用户的相似检索的参照数据使用这样的意图。在实施方式3中,通过根据用户的选择对加密方式、向参照特征量存储单元201的保存进行切换等,灵活地应对用户的意图。在以下说明中,主要说明该不同之处,并省略具有相同功能的部分的说明。
3.1用户终端装置
图14是表示实施方式3中的用户终端装置100的构成的框图。
如图14所示,除了实施方式1的构成以外,还具备加密切换单元111和指示发送单元112。此外,由于标注了与图3相同的标号的图14的框图具有与图3相同的功能,所以省略说明。此外,图14中的特征量加密单元103、相似值加密单元105、解密单元107以及发送指示部112分别与后述图15的A、B、C、H连接。
3.1.1加密切换单元
加密切换单元111从用户终端装置100取得关于进行加密检索还是进行非加密检索的指示。加密检索为数据运算装置200在加密的状态下使用从用户终端装置100提供的信息进行检索。非加密检索为数据运算装置200在不加密的状态下使用从用户终端装置100提供的信息进行检索。
也就是说,加密切换单元111按照用户的意图,切换在数据运算装置200中是否将特征量设为隐匿。作为该切换的具体例,将在特征量加密单元103中使用的密钥切换设为用户终端装置100的公钥,还是设为数据运算装置200的公钥。在设为用户终端装置100的公钥的情况下,由于仅用户终端装置100具有对应的私钥,所以数据运算装置200在已加密了加密特征量的状态下进行相似检索。另一方面,在使用数据运算装置200的公钥的情况下,由于数据运算装置200具有对应的私钥,所以数据运算装置200将特征量解密并在明文的状态下进行相似检索。另外,作为切换的另一具体例,将在特征量加密单元103中使用的密钥切换设为用户终端装置100的公钥,或原本不加密。
在由加密切换单元111取得了进行加密检索的指示的情况下,使用同态且在数据运算装置200中不能解密的加密方式。另外,在由加密切换单元111取得了进行非加密检索的指示的情况下,使用在数据运算装置200中能够解密的加密方式。
此外,在使用数据运算装置200的公钥进行加密的情况下,或原本不加密而请求相似检索的情况下,能够按照用户的意图,在数据运算装置200中选择将用户的病例、历史记录信息存储在参照特征量存储单元201和参照数据存储单元205中。
图17是表示在实施方式3中用户终端装置100与数据运算装置200之间的数据格式例的图。
如图17所示,当用户选择了在参照特征量存储单元201和参照数据存储单元205中存储用户的病例、历史记录信息的情况下,使用存储许可标记,从用户终端装置100向数据运算装置200通知。此外,该存储许可标记的信息需要不被篡改。例如,也可以附加消息认证代码或数字签名。
3.1.2指示发送单元
指示发送单元112将由加密切换单元111取得的指示发送给数据运算装置200。如图17所示,通过指示发送单元112切换而成的信息使用加密标记区域,从指示发送单元112向数据运算装置200通知。
3.1.3解密单元
解密单元107从数据运算装置200接收加密参照数据,所述加密参照数据是通过由加密切换单元111取得的指示所对应的加密检索或非加密检索,将根据加密特征量和加密相似值生成的参照数据(相似检索的结果)加密而成的信息。并且,解密单元107将接收到的加密参照数据解密。
3.2数据运算装置
图15是表示在实施方式3中数据运算装置200的构成的框图。
如图15所示,除了实施方式1的构成以外,数据运算装置200还具备加密控制单元208。此外,由于标注了与图4相同的标号的图15的框图具有与图4相同的功能,所以省略说明。
3.2.1加密控制单元
加密控制单元208取得从指示发送单元112发送来的指示。加密控制单元208参照图17的加密标记和存储许可标记,进行按照用户的意图的切换所对应的控制。加密控制单元208在加密标记为0的情况下,在加密的状态下进行相似检索。另一方面,加密控制单元208在加密标记为1的情况下,使用数据运算装置200的私钥将特征量解密,在明文的状态下进行相似检索。或者,加密控制单元208使用发送来的明文的特征量进行相似检索。另外,除此之外,加密控制单元208在存储许可标记为1的情况下,将用户的信息存储在参照特征量存储单元201和参照数据存储单元205中。
3.3相似信息检索系统的工作
使用图16说明相似信息检索系统10的工作。
图16是表示在实施方式3中相似信息检索系统的工作的时序图。
如图16所示,在步骤S101中,用户终端装置100用感测单元101感测用户,取得与用户相关的信息。
在步骤S115中,用户终端装置100取得关于是进行加密检索还是非加密检索的指示,所述加密检索为数据运算装置200在加密的状态下使用从用户终端装置100提供的信息进行检索,所述非加密检索为数据运算装置200在不加密的状态下使用从用户终端装置100提供的信息进行检索。
在步骤S102中,根据感测到的信息算出特征量X。例如,如以下,特征量X的各要素可以是数值的m维矢量。
X=(x1,x2,…,xm)
在步骤S103中,决定成为检索时的判定基准的相似值。例如,在检索成为小于距离D的数据的情况下,设定0、1、2、…、D-1作为相似值。
在步骤S104中,特征量加密单元103通过用依存于在步骤S115取得的指示的加密方式将在特征量算出单元102算出的特征量加密而生成加密特征量。相似值加密单元105通过用依存于在指示取得步骤取得的指示的加密方式将表示相似程度的相似值加密而生成加密相似值。在步骤S115取得了进行加密检索的指示的情况下,使用同态且在数据运算装置200中不能解密的加密方式。另外,在步骤S115取得了进行非加密检索的指示的情况下,使用在数据运算装置200中能够解密的加密方式。使用同态加密作为加密方式的密钥设为用户终端装置100的公钥。
当将加密的函数设为Enc时,加密特征量能够表示为
Ex=(Enc(x1),Enc(x2),…,Enc(xm)),加密而成的加密相似值能够表示为:
Enc(0)、Enc(1)、…、Enc(D-1)
在步骤S105中,在用户终端装置100取得了进行加密检索的指示的情况下,从用户终端装置100向数据运算装置200请求相似数据,所述相似数据表示加密特征量和加密而成的加密相似值,并满足条件。也就是说,用户终端装置100将在步骤S115取得的指示发送给数据运算装置200。
在步骤S104中,在步骤S115取得了进行加密检索的指示的情况下,作为加密方式,用用户终端装置100保持的私钥所对应的公钥,将特征量加密。另外,在步骤S104中,在步骤S115取得了进行非加密检索的指示的情况下,作为加密方式,用数据运算装置200保持的私钥所对应的公钥,将特征量加密。
在步骤S104中,在步骤S115取得了进行加密检索的指示的情况下,作为加密方式,用用户终端装置100保持的私钥所对应的公钥,将相似值加密。另外,在步骤S104中,在步骤S115取得了进行非加密检索的指示的情况下,作为加密方式,用数据运算装置200保持的私钥所对应的公钥,将相似值加密。
在步骤S106中,数据运算装置200从第i个识别符ID的参照特征量存储单元201中选择参照特征量Yi=(yi1,yi2,…,yim)。
在步骤S116中,加密控制单元208接收从用户终端装置100发送来的指示。加密控制单元208按照接收到的指示,判断进行加密检索和非加密检索中的哪一个。
在步骤S107中,在步骤S116判断为进行加密检索的情况下,加密距离计算单元202算出加密距离,所述加密距离表示从用户终端装置100接收到的加密特征量和针对多个参照特征量的至少一个加密而成的参照特征量的相似程度。另外,在步骤S116判断为进行非加密检索的情况下,加密距离计算单元202算出距离,所述距离表示将从用户终端装置100接收到的加密特征量解密而得到的解密特征量和多个参照特征量中的至少一个的相似程度。此外,针对多个参照特征量的至少一个加密而成的参照特征量可以是未加密的参照特征量。
具体而言,在步骤S107中,在加密的状态下计算用加密的函数Enc加密而成的参照特征量与加密特征量的距离。加密特征量能够表示为
Ey=(Enc(yi1),Enc(yi2),…,Enc(yim))
如果加密距离计算单元202求出特征量X与参照特征量Yi的各矢量之差并相加,则使用同态加密方式的性质计算以下的加密距离EDi。
EDi=Enc(|x1-yi1|+|x2-yi2|+…+|xm-yim|)
此外,在上述说明中,将累加了各矢量要素之差的绝对值而成的值作为距离。
在步骤S108中,在步骤S116判断为进行加密检索的情况下,参照相似值提取单元203判定在步骤S107算出的加密距离与从用户终端装置100接收到的加密相似值是否一致。另一方面,在步骤S116判断为进行非加密检索的情况下,参照相似值提取单元203判定在步骤S107算出的距离与解密相似值是否一致,所述解密相似值是将从用户终端装置100接收到的加密相似值解密而得到的值。
具体而言,在步骤S108中,使用加密距离和加密相似值确认是否满足条件。作为确认的方法的例子,确认加密的函数EDi与Enc(0)、Enc(1)、…、Enc(D-1)中的某一个是否一致。假如一致,则意味着EDi的Enc函数的内容,即,作为特征量与参照特征量的距离的|x1-yi1|+|x2-yi2|+…+|xm-yim|是0、1、…、D-1的某一个。
假如任一个都不一致,则选择下一个ID,返回步骤S106。
假如与某一个一致,则在步骤S109中,由于特征量间的距离小于相似值D,记录此时的ID。对参照特征量存储单元201的各ID反复进行以上步骤S106至步骤S109。
在步骤S110中,从参照数据存储单元205提取与在S109提取的全部ID对应的参照数据,并使用用户终端装置100的公钥进行加密。也就是说,在步骤S108中判定为一致的情况下,加密参照数据提取单元204生成将参照数据加密而成的信息作为加密参照数据,所述参照数据是在加密距离或距离的算出中使用的参照特征量所对应的数据。
在步骤S111中,加密参照数据提取单元204将生成的加密参照数据发送给用户终端装置100。
在步骤S112中,用户终端装置100将参照数据解密并利用。也就是说,解密单元107进行与在步骤S115中取得的指示对应的加密检索或非加密检索。解密单元107从数据运算装置200接收加密参照数据,所述加密参照数据是通过加密检索或非加密检索,将根据加密特征量和加密相似值生成的参照数据加密而成的信息。解密单元107接收从数据运算装置200发送来的、加密而成的参照数据,并将其解密。
3.4相似信息检索系统的显示例
图18是表示在实施方式3中用户终端装置100的显示的例子的图。
如图18所示,在此,当用户点击显示于用户终端装置100的画面的“开始”时,感测单元101开始测量用户的血压。然后,使用该测量值和最近的历史记录信息,根据倾向算出特征量。然后,在检索相似病例时,用户选择
A)在加密的状态下对您的信息进行相似检索
B)将您的信息在服务器中公开并进行相似检索
C)中止检索
中的任一个。A)和B)为步骤S115的一例。
在此,当选择A)时,在图14的加密切换单元111中,进行使用了用户终端装置100的公钥的加密,在数据运算装置200中,在加密的状态下进行相似检索。
在此,当选择B)时,在图14的加密切换单元111中,进行使用了数据运算装置200的公钥的加密,或不进行加密而在数据运算装置200中,进行明文的状态下的相似检索。
当选择C)时,中止检索。
另外,在上述说明中,在A)、B)中,用户终端装置100将存储许可标记发送给数据运算装置200,所述存储许可标记表示是否许可将与用户相关的信息登记作为在数据运算装置200中的加密检索和非加密检索所使用的信息。
另外,在上述说明中,当选择B)时,例如显示图19所示的画面。
图19是表示在实施方式3中用户终端装置100的显示的例子的图。
如图19所示,用户在该画面上选择是否可将自身的信息保存在服务器的数据库中。在选择了“许可保存。”的情况下,将用户的信息保存在参照特征量存储单元201和参照数据存储单元205中。也就是说,数据运算装置200按照从用户终端装置100接收到的存储许可标记,通过用户的指示,将从用户终端装置100发送来的与用户相关的信息作为参照特征量和参照数据中的至少一个,登记在参照数据存储单元205中。此时,与用户相关的信息不仅包括用户终端装置100的感测单元101感测到的信息,也包括向用户提供的建议的信息、用户选择的建议的信息。另外,用户也可以用PC等通用设备向数据运算装置200发送病历等用户的信息。
3.5实施方式3的效果
在实施方式3中,能够切换在加密的状态下对用户的特征量进行相似检索还是用明文进行相似检索。根据用户的不同,也存在在数据运算装置200中公开特征量,想得到更详细的检索结果的情况。或者,也存在如下情况:有将特征量保存在参照特征量存储单元201和参照数据存储单元205中,想使之作为其他用户的相似检索的参照数据使用的意图。也就是说,用户能够选择是经由数据运算装置200将自身的信息提供给外部(例如服务器的数据库),还是不提供给外部。因此,在相似信息检索方法、终端装置以及相似信息检索系统中,能够根据用户的意图灵活地应对并进行工作。
另外,加密特征量被加密,在数据运算装置200中不能解密。因此,在该相似信息检索方法等中,即使在用户终端装置与数据运算装置的收发路径上和数据运算装置内,也能够进一步提高用户检索到的信息的隐匿性。
(其他变形例)
此外,基于上述各实施方式说明了本公开,但本公开当然不限定于上述各实施方式。以下的情况下也包括在本公开中。
(1)在实施方式1、2中,用矢量说明了特征量,但也可以是数值。另外,也可以对该数值进行映射。
(2)在实施方式1、2中,将相似值设为小于D的连续的值,但是,例如也可以设为完全一致(也就是说,将相似值设为仅为零)或离散的值。
(3)图13是表示在其他变形例中取得统计化参照数据的情况下的数据运算装置的构成的框图。
如图13所示,追加了用于求出统计值的加密参照数据统计化单元209。在实施方式1、2中,数据运算装置200分别将参照数据加密并发送给用户终端装置100,但在数据运算装置200中,也可以根据参照数据例如求出平均值或方差等统计值或频率信息,并发送给用户终端装置100。在该情况下,通过向用户终端装置100提示统计值而不是参照数据本身,即使参照数据向外部流出,也难以确定作为其所有人的用户。因此,成为考虑了隐私保护的构成。
(4)在实施方式1、2中,数据运算装置200中的参照特征量存储单元201和参照数据存储单元205分别用明文保存数据,但也可以加密。该情况下,能够从参照数据存储单元205提取数据并解密而使用,安全性提高。另外,在数据运算装置200中,也可以保存用用户终端装置100的公钥加密而成的数据。该情况下,能够在保持原样的状态下进行加密距离计算或向用户终端装置100发送参照数据。
(5)在实施方式1、2中,用户终端装置100的公钥和私钥存储在密钥存储单元108中,但例如也可以是,能够在用户利用时安装于用户终端装置100的、与用户终端装置100不同的介质。
(6)在实施方式1、2中,用户终端装置100的公钥和私钥设为用户终端装置100的密钥,但也可以在密钥存储单元108中保管每个用户的密钥。在该情况下,在用户与用户终端装置100之间进行认证,在认证成功的情况下,能够从密钥存储单元108选择与特定的用户一致的该密钥并利用。此外,在图7所示的数据格式例中,利用用户的识别符ID来代替用户终端装置100的识别符ID。
(7)在实施方式1、2中,特征量算出单元102也可以具有数据库,按用户保存感测到的信息,并根据在过去感测到的信息算出特征量。在该情况下,识别用户的方法例如也可以通过用户输入识别符ID等,由用户终端装置100认证用户。
(8)在实施方式1、2中,特征量算出单元102也可以从其他介质的数据库取得过去感测到的信息并算出特征量。在该情况下,也可以在其他介质中保持用户的识别符ID,并使用户终端装置100读取。
(9)在实施方式1、2中,数据运算装置200将血压等生命数据作为对象,根据特征量检索具有相似倾向的用户的参照数据(在该情况下,例如为病历、治疗历史记录等),但特征量和参照数据不限于该情况。例如也可以使用GPS等,根据表示行动范围的数据算出特征量,根据该特征量检索具有相似倾向的用户的参照数据(例如,购买历史记录、饮食场所的历史记录等)。
(10)在实施方式1、2中,用户终端装置100将相似值加密并发送给数据运算装置200,但该加密也可以在数据运算装置200侧进行。也就是说,用户终端装置100的相似值加密单元105可以设置于数据运算装置200。此外,在无需隐匿相似值的情况下,也可以不加密。
(11)在实施方式1、2中,数据运算装置200具备参照数据存储单元205,但也可以是与数据运算装置200不同的其他装置具备参照数据存储单元。在该情况下,也可以向与数据运算装置不同的其他装置通知将特征量作为相似值提取的识别符ID,并算出该其他装置对应的参照数据。
(12)在实施方式1、2中,将与特征量相似而提取的识别符ID对应的参照数据的全部发送给用户终端装置100,但也可以不是始终发送全部参照数据。也就是说,数据运算装置200也可以拾取(pick up)参照数据内的一部分,并将拾取的一部分参照数据发送给用户终端装置100。
另外,如图6、图12所示,数据运算装置200针对参照数据存储单元205的全部识别符ID,使用相似值0~D-1确认是否相似,但不限于此。例如,也可以是如下方法:首先,用相似值0对全部识别符ID进行确认,接着用相似值1进行确认,反复进行上述步骤,进行依次确认直到相似值D-1(嵌套)。并且,如果该确认中某一个为一致,则提取对应的识别符ID。
进而,例如,也可以是如下方法:数据运算装置200预先确定向用户终端装置100发送的加密参照数据的最大个数,在数据运算装置200反复进行确认期间,在已到达预先确定的个数时,中断该重复,对于提取的识别符ID提取参照数据并加密,并向用户终端装置100回答加密参照数据。
(13)如图18所示,在实施方式3中,在用户终端装置100中,在A)的将用户的特征量加密的状态下进行相似检索的情况和B)的在服务器中公开并用明文进行相似检索的情况下,所显示的相似检索结果不变。但是,在用户终端装置100中,例如也可以是,在A)的情况下仅显示统计化而成的数据,在B)的情况下显示更详细的单独信息。
(14)如图19所示,在实施方式3中,在用户终端装置100中,在用户选择了能够保存于数据库的情况下,可以向用户提供积分等奖励。另外,在用户终端装置100中,在用户选择了能够保存于数据库的情况下,也可以再次显示与信息处理相关的约定(与允许利用或隐私相关的约定),并取得用户的同意。
(15)在实施方式3中,感测单元101对用户进行感测得到的数据将血压数据作为对象,但例如像血压信息、体重信息等这样测量的对象为多个的情况下,用户可以按测量的对象进行是否保存于数据库的选择。
(16)如图18所示,在实施方式3中,切换了在A)的将用户的特征量加密的状态下进行相似检索的情况和B)的在数据运算装置中公开而用明文进行相似检索的情况下使用的公钥。在A)的情况下,使用用户终端装置100的公钥进行加密,在B)的情况下,使用数据运算装置200的公钥进行加密,但也可以切换加密方式而不仅仅是切换公钥。
此外,在上述技术方案中说明的技术例如能在以下的云服务类型中实现。但是,实现在上述技术方案中说明的技术的云服务的类型不限于此这些。
(服务类型1:本公司数据中心型云服务)
图20是表示服务类型1(本公司数据中心型云服务)中的相似信息检索系统提供的服务的全局的框图。
如图20所示,在本类型中,服务提供商1120从组1000取得信息,并对用户提供服务。在本类型中,服务提供商1120具有数据中心运营公司的功能。即,服务提供商1120保有管理大数据的数据中心1203。因此,不存在数据中心运营公司。
在本类型中,服务提供商1120运营并管理数据中心(云服务器)1203。另外,服务提供商1120管理操作系统(OS)1202和应用1201。服务提供商1120使用服务提供商1120管理的OS1202和应用1201而提供服务(箭头1204)。
(服务的类型2:IaaS利用型云服务)
图21是表示服务类型2(IaaS利用型云服务)中的相似信息检索系统提供的服务的全局的框图。在此,IaaS(Infrastructure as a Service:基础设施即服务)是将用于构造计算机系统并使之工作的基础本身提供作为经由互联网的服务的云服务提供模型。
如图21所示,在本类型中,数据中心运营公司1110运营并管理数据中心(云服务器)1203。另外,服务提供商1120管理OS1202和应用1201。服务提供商1120使用服务提供商1120管理的OS1202和应用1201而提供服务(箭头1204)。
(服务的类型3:PaaS利用型云服务)
图22是表示服务类型3(PaaS利用型云服务)中的相似信息检索系统提供的服务的全局的框图。在此,PaaS(Platform as a Service:平台即服务)是将成为用于构造软件并使之工作的基础的平台提供作为经由互联网的服务的云服务提供模型。
如图22所示,在本类型中,数据中心运营公司1110管理OS1202,并运营和管理数据中心(云服务器)1203。另外,服务提供商1120管理应用1201。服务提供商1120使用数据中心运营公司1110管理的OS1202和服务提供商1120管理的应用1201提供服务(箭头1204)。
(服务的类型4:SaaS利用型云服务)
图23是表示服务类型4(SaaS利用型云服务)中的相似信息检索系统提供的服务的全局的框图。在此,SaaS(Software as a Service)利用型云服务例如是具有如下功能的云服务提供模型:不保有数据中心(云服务器)1203的公司或个人等利用者能够经由互联网等网络,使用保有数据中心(云服务器)1203的平台提供者提供的应用1201。
如图23所示,在本类型中,数据中心运营公司1110管理应用1201,管理OS1202,并运营和管理数据中心(云服务器)1203。另外,服务提供商1120使用数据中心运营公司1110管理的OS1202和应用1201提供服务(箭头1204)。
以上,在任一种云服务的类型1~4中,服务提供商1120提供服务。另外,例如服务提供商或数据中心运营公司也可以自己开发OS、应用或大数据的数据库等,另外,也可以外包给第三者。
此外,对于实施方式1、2、其他变形例以及服务类型1~4实施本领域技术人员能想出的各种变形而得到的方式、通过在不脱离本公开的主旨的范围内将实施方式1、2、其他变形例以及服务类型1~4中的构成要素以及功能任意地组合而实现的方式也包含在本公开中。
产业上的可利用性
本公开涉及的相似检索方法能够通过加密隐匿特征量的内容并进行相似检索,例如能够应用于进行病例等的相似检索的计算机系统中。

Claims (7)

1.一种相似信息检索方法,是服务器装置基于从终端装置提供的信息检索相似信息的方法,包括以下步骤:
在所述终端装置,取得关于是进行加密检索还是进行非加密检索的指示,所述加密检索为所述服务器装置在加密的状态下使用从所述终端装置提供的信息进行所述检索,所述非加密检索为所述服务器装置在不加密的状态下使用从所述终端装置提供的信息进行所述检索,
在所述终端装置,通过用依存于所取得的所述指示的加密方式将表示所取得的数据的特征的第一特征量加密而生成第一加密特征量,在所述指示为进行加密检索的指示的情况下,依存于所述指示的加密方式为同态且在所述服务器装置中不能解密的第一加密方式,在所述指示为进行非加密检索的指示的情况下,依存于所述指示的加密方式为在所述服务器装置中能够解密的第二加密方式,
在所述终端装置,将所生成的所述第一加密特征量发送给所述服务器装置,
在所述终端装置,通过用依存于所述指示的加密方式将表示相似程度的相似值加密而生成加密相似值,
在所述终端装置,将所生成的所述加密相似值发送给所述服务器装置,
在所述终端装置,将所取得的所述指示发送给所述服务器装置,
在所述终端装置,从所述服务器装置接收加密参照数据,所述加密参照数据是所述服务器装置将根据所述指示检索相似信息而得到的参照数据加密而成的信息,
在所述终端装置,将接收到的所述加密参照数据解密。
2.根据权利要求1所述的方法,
所述服务器装置具有保持有多个参照特征量的第一存储器和保持有分别与所述多个参照特征量对应的多个参照数据的第二存储器,
所述方法还包括以下步骤:
在所述服务器装置,接收从所述终端装置发送来的所述指示,
在所述服务器装置,按照接收到的所述指示,判断进行所述加密检索和所述非加密检索中的哪一个,
在所述服务器装置,在所述判断中判断为进行所述加密检索的情况下,算出加密距离,所述加密距离表示从所述终端装置接收到的所述第一加密特征量与第一参照特征量的相似程度,所述第一参照特征量是保持于所述第一存储器的所述多个参照特征量中的一个,
在所述服务器装置,判定所算出的所述加密距离与从所述终端装置接收到的所述加密相似值是否一致,
在所述服务器装置,在所述判定中判定为一致的情况下,从所述第二存储器取得第一参照数据,将所取得的所述第一参照数据加密而生成所述加密参照数据,将所生成的所述加密参照数据发送给所述终端装置,所述第一参照数据是与在所述加密距离的算出中使用的所述第一参照特征量对应的数据。
3.根据权利要求1所述的方法,
所述服务器装置具有保持有多个参照特征量的第一存储器和保持有分别与所述多个参照特征量对应的多个参照数据的第二存储器,
所述方法还包括以下步骤:
在所述服务器装置,接收从所述终端装置发送来的所述指示,
在所述服务器装置,按照接收到的所述指示,判断进行所述加密检索和所述非加密检索中的哪一个,
在所述服务器装置,在所述判断中判断为进行所述非加密检索的情况下,算出表示解密特征量与第一参照特征量的相似程度的距离,所述解密特征量是将从所述终端装置接收到的所述第一加密特征量解密而得到的特征量,所述第一参照特征量是多个参照特征量中的一个,
在所述服务器装置,判定所算出的所述距离与解密相似值是否一致,所述解密相似值是将从所述终端装置接收到的所述加密相似值解密而得到的值,
在所述服务器装置,在所述判定中判定为一致的情况下,从所述第二存储器取得第一参照数据,将所取得的所述第一参照数据加密而生成所述加密参照数据,将所生成的所述加密参照数据发送给所述终端装置,所述第一参照数据是与在所述距离的算出中使用的所述第一参照特征量对应的数据。
4.根据权利要求1所述的方法,
所述第一加密方式是用与所述终端装置保持的私钥对应的公钥进行加密的加密方式,
所述第二加密方式是用与所述服务器装置保持的私钥对应的公钥进行加密的方式。
5.根据权利要求1所述的方法,还包括以下步骤:
所述终端装置将登记许可信息发送给所述服务器装置,所述登记许可信息表示是否许可与所述终端装置的用户相关的信息登记在所述服务器装置中,
在所述服务器装置,在接收到的所述登记许可信息表示许可登记的情况下,将从所述终端装置发送来的与所述用户相关的信息登记作为参照特征量和所述参照数据中的至少一个。
6.一种终端装置,是对检索相似信息的服务器装置请求检索的执行的终端装置,具备一个或多个存储器以及执行包括以下的工作的电路,
取得关于是进行加密检索还是进行非加密检索的指示,所述加密检索为服务器装置在加密的状态下使用从所述终端装置提供的信息进行所述检索,所述非加密检索为所述服务器装置在不加密的状态下使用从所述终端装置提供的信息进行所述检索,
通过用依存于所取得的所述指示的加密方式将表示所取得的数据的特征的第一特征量加密而生成第一加密特征量,在所述指示为进行加密检索的指示的情况下,依存于所述指示的加密方式为同态且在所述服务器装置中不能解密的第一加密方式,在所述指示为进行非加密检索的指示的情况下,依存于所述指示的加密方式为在所述服务器装置中能够解密的第二加密方式,
将所生成的所述第一加密特征量发送给所述服务器装置,
通过用依存于所述指示的加密方式将表示相似程度的相似值加密而生成加密相似值,
将所生成的所述加密相似值发送给所述服务器装置,
将所取得的所述指示发送给所述服务器装置,
从所述服务器装置接收加密参照数据,所述加密参照数据是所述服务器装置将根据所述指示检索相似信息而得到的参照数据加密而成的信息,
将接收到的所述加密参照数据解密。
7.一种相似信息检索系统,具备提供信息的终端装置和基于所提供的所述信息检索相似信息的服务器装置,所述终端装置具一个或多个存储器以及执行包括以下的工作的电路,
取得关于是进行加密检索还是进行非加密检索的指示,所述加密检索为服务器装置在加密的状态下使用从所述终端装置提供的信息进行所述检索,所述非加密检索为所述服务器装置在不加密的状态下使用从所述终端装置提供的信息进行所述检索,
通过用依存于所取得的所述指示的加密方式将表示所取得的数据的特征的第一特征量加密而生成第一加密特征量,在所述指示为进行加密检索的指示的情况下,依存于所述指示的加密方式为同态且在所述服务器装置中不能解密的第一加密方式,在所述指示为进行非加密检索的指示的情况下,依存于所述指示的加密方式为在所述服务器装置中能够解密的第二加密方式,
将所生成的所述第一加密特征量发送给所述服务器装置,
通过用依存于所述指示的加密方式将表示相似程度的相似值加密而生成加密相似值,
将所生成的所述加密相似值发送给所述服务器装置,
将所取得的所述指示发送给所述服务器装置,
从所述服务器装置接收加密参照数据,所述加密参照数据是所述服务器装置将根据所述指示检索相似信息而得到的参照数据加密而成的信息,
将接收到的所述加密参照数据解密。
CN201610298128.XA 2015-05-29 2016-05-06 相似信息检索方法、终端装置以及相似信息检索系统 Pending CN106209761A (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP2015110872 2015-05-29
JP2015-110872 2015-05-29
JP2016007431A JP2016224400A (ja) 2015-05-29 2016-01-18 類似情報検索方法、端末装置及び類似情報検索システム
JP2016-007431 2016-01-18

Publications (1)

Publication Number Publication Date
CN106209761A true CN106209761A (zh) 2016-12-07

Family

ID=57453018

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201610298128.XA Pending CN106209761A (zh) 2015-05-29 2016-05-06 相似信息检索方法、终端装置以及相似信息检索系统

Country Status (1)

Country Link
CN (1) CN106209761A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109726580A (zh) * 2017-10-31 2019-05-07 阿里巴巴集团控股有限公司 一种数据统计方法和装置
CN109726581A (zh) * 2017-10-31 2019-05-07 阿里巴巴集团控股有限公司 一种数据统计方法和装置
CN111712868A (zh) * 2017-12-19 2020-09-25 日本电信电话株式会社 检索装置、检索方法、程序以及记录介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103744976A (zh) * 2014-01-13 2014-04-23 北京工业大学 一种基于同态加密的图像安全检索方法
CN103795715A (zh) * 2014-01-20 2014-05-14 冯丽娟 隐私保护方法、恢复方法及隐私保护系统
JP2014126865A (ja) * 2012-12-27 2014-07-07 Fujitsu Ltd 暗号処理装置および方法
WO2014118230A1 (en) * 2013-01-29 2014-08-07 Nec Europe Ltd. Method and system for providing encrypted data for searching of information therein and a method and system for searching of information on encrypted data

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2014126865A (ja) * 2012-12-27 2014-07-07 Fujitsu Ltd 暗号処理装置および方法
WO2014118230A1 (en) * 2013-01-29 2014-08-07 Nec Europe Ltd. Method and system for providing encrypted data for searching of information therein and a method and system for searching of information on encrypted data
CN103744976A (zh) * 2014-01-13 2014-04-23 北京工业大学 一种基于同态加密的图像安全检索方法
CN103795715A (zh) * 2014-01-20 2014-05-14 冯丽娟 隐私保护方法、恢复方法及隐私保护系统

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109726580A (zh) * 2017-10-31 2019-05-07 阿里巴巴集团控股有限公司 一种数据统计方法和装置
CN109726581A (zh) * 2017-10-31 2019-05-07 阿里巴巴集团控股有限公司 一种数据统计方法和装置
CN109726580B (zh) * 2017-10-31 2020-04-14 阿里巴巴集团控股有限公司 一种数据统计方法和装置
US10749666B2 (en) 2017-10-31 2020-08-18 Alibaba Group Holding Limited Data statistics method and apparatus
CN111611618A (zh) * 2017-10-31 2020-09-01 阿里巴巴集团控股有限公司 一种数据统计方法和装置
CN111611618B (zh) * 2017-10-31 2023-08-04 创新先进技术有限公司 一种数据统计方法和装置
CN111712868A (zh) * 2017-12-19 2020-09-25 日本电信电话株式会社 检索装置、检索方法、程序以及记录介质
CN111712868B (zh) * 2017-12-19 2023-08-08 日本电信电话株式会社 检索装置、检索方法、以及记录介质

Similar Documents

Publication Publication Date Title
CN108717514B (zh) 一种机器学习中的数据隐私保护方法和系统
US10027633B2 (en) Method for performing similar-information search while keeping content confidential by encryption
CN106533650B (zh) 面向云端的交互型隐私保护方法和系统
CN104871477B (zh) 加密系统、重加密密钥生成装置、重加密装置、加密方法
CN107634829A (zh) 基于属性的可搜索加密电子病历系统及加密方法
CN105637798A (zh) 用于隐私保护计数的方法和系统
CN114401079A (zh) 多方联合信息价值计算方法、相关设备及存储介质
CN104365127B (zh) 用于在远程显示单元上追踪移动设备的方法
US20160350552A1 (en) Method for performing similar-information search while keeping content confidential by encryption
CN110190945A (zh) 基于多加密的线性回归隐私保护方法及系统
JP2014096692A (ja) 情報分析システム及び情報分析方法
CN108111587A (zh) 一种基于时间释放的云存储搜索方法
CN106209761A (zh) 相似信息检索方法、终端装置以及相似信息检索系统
Zolfaghari et al. The odyssey of entropy: cryptography
US8638938B2 (en) Symmetric key subscription
CN108650268A (zh) 一种实现多级访问的可搜索加密方法及系统
Islam et al. Commutative re-encryption techniques: Significance and analysis
Vamsi et al. Electronic health record security in cloud: Medical data protection using homomorphic encryption schemes
Paik et al. Introduction to soft-cryptosystem and its application
JP6567979B2 (ja) 類似情報検索方法、サーバ装置及び類似情報検索システム
Vajda Construction for searchable encryption with strong security guarantees
Prakancharoen Database secure manipulation based on paillier’s homomorphic encryption (DSM-PHE)
Raj et al. A security-attribute-based access control along with user revocation for shared data in multi-owner cloud system
De Oliveira Nunes et al. Secure non-interactive user re-enrollment in biometrics-based identification and authentication systems
CN117459215B (zh) 基于全同态加密的问卷测评方法、统计系统、终端及介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
WD01 Invention patent application deemed withdrawn after publication
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20161207