CN113544726A - 中介装置、系统以及计算机程序 - Google Patents
中介装置、系统以及计算机程序 Download PDFInfo
- Publication number
- CN113544726A CN113544726A CN202080020197.9A CN202080020197A CN113544726A CN 113544726 A CN113544726 A CN 113544726A CN 202080020197 A CN202080020197 A CN 202080020197A CN 113544726 A CN113544726 A CN 113544726A
- Authority
- CN
- China
- Prior art keywords
- personal data
- information
- data
- request
- personal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000004590 computer program Methods 0.000 title claims description 6
- 238000012790 confirmation Methods 0.000 claims abstract description 81
- 238000012384 transportation and delivery Methods 0.000 claims abstract description 80
- 230000005540 biological transmission Effects 0.000 claims abstract description 62
- 238000003860 storage Methods 0.000 claims description 73
- 230000002776 aggregation Effects 0.000 claims description 11
- 238000004220 aggregation Methods 0.000 claims description 11
- 238000012545 processing Methods 0.000 description 126
- 238000004891 communication Methods 0.000 description 59
- 238000009826 distribution Methods 0.000 description 56
- 238000000034 method Methods 0.000 description 54
- 238000010586 diagram Methods 0.000 description 48
- 230000008569 process Effects 0.000 description 38
- 230000006870 function Effects 0.000 description 34
- 238000007726 management method Methods 0.000 description 31
- 230000000694 effects Effects 0.000 description 30
- 238000013480 data collection Methods 0.000 description 27
- 230000000875 corresponding effect Effects 0.000 description 26
- 238000006243 chemical reaction Methods 0.000 description 14
- 239000011159 matrix material Substances 0.000 description 9
- 239000000470 constituent Substances 0.000 description 8
- 230000008520 organization Effects 0.000 description 8
- 230000004044 response Effects 0.000 description 8
- 230000010365 information processing Effects 0.000 description 7
- 238000013523 data management Methods 0.000 description 6
- 239000013598 vector Substances 0.000 description 6
- 230000008859 change Effects 0.000 description 4
- 230000007717 exclusion Effects 0.000 description 4
- 239000004065 semiconductor Substances 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 3
- 235000012054 meals Nutrition 0.000 description 3
- 238000013439 planning Methods 0.000 description 3
- 238000009825 accumulation Methods 0.000 description 2
- 238000013459 approach Methods 0.000 description 2
- 230000002860 competitive effect Effects 0.000 description 2
- 235000013305 food Nutrition 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- 238000000513 principal component analysis Methods 0.000 description 2
- 102100031102 C-C motif chemokine 4 Human genes 0.000 description 1
- 101100054773 Caenorhabditis elegans act-2 gene Proteins 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 239000008186 active pharmaceutical agent Substances 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000003750 conditioning effect Effects 0.000 description 1
- 238000010411 cooking Methods 0.000 description 1
- 235000014510 cooky Nutrition 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000008034 disappearance Effects 0.000 description 1
- 239000007789 gas Substances 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- QJGQUHMNIGDVPM-UHFFFAOYSA-N nitrogen group Chemical group [N] QJGQUHMNIGDVPM-UHFFFAOYSA-N 0.000 description 1
- 230000002265 prevention Effects 0.000 description 1
- 230000002040 relaxant effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000010187 selection method Methods 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 230000033772 system development Effects 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/06—Buying, selling or leasing transactions
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
Landscapes
- Business, Economics & Management (AREA)
- Strategic Management (AREA)
- Finance (AREA)
- Accounting & Taxation (AREA)
- Engineering & Computer Science (AREA)
- General Business, Economics & Management (AREA)
- Economics (AREA)
- Development Economics (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Marketing (AREA)
- General Physics & Mathematics (AREA)
- Tourism & Hospitality (AREA)
- General Health & Medical Sciences (AREA)
- Human Resources & Organizations (AREA)
- Health & Medical Sciences (AREA)
- Primary Health Care (AREA)
- Entrepreneurship & Innovation (AREA)
- Game Theory and Decision Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
一种中介装置,具备请求获取部、重复确认获取部、确定部、以及获取发送部。请求获取部获取请求信息。重复确认获取部获取重复确认信息。重复确认信息是显示由第1个人数据管理方管理的第1个人数据和由第2个人数据管理方管理的第2个人数据是涉及同一个人的个人数据的信息,其中,第2个人数据管理方是与第1个人数据管理方不同的个人数据管理方。确定部基于重复确认信息来确定筹集方案以及/或者交付数据。获取发送部按照由确定部确定的筹集方案获取个人数据,以及/或者向数据利用方所保有的利用方装置发送由确定部确定的交付数据。
Description
相关申请的交叉引用
本国际申请要求2019年3月11日在日本专利局提交的日本发明专利申请第2019-043674号、2019年10月15日在日本专利局提交的日本发明专利申请第2019-188985号、以及2019年10月15日在日本专利局提交的日本发明专利申请第2019-188986号的优先权,所述日本发明专利申请的全部内容通过引用而并入本文。
技术领域
本公开涉及对数据利用方与个人数据管理方之间的个人数据交易进行中介的中介装置以及使计算机发挥作为中介装置的功能的计算机程序。
背景技术
已知对个人数据进行管理的个人数据管理方。作为个人数据管理方可列举例如信息库。由寄存个人数据的个人向个人数据管理方传达有关数据利用的策略等,个人数据管理方按照所通知的策略等判断是否可以向第三方提供数据。
此外,专利文献1公开了一种信息处理系统,其目的在于防止从被寄存数据的信息库等所保有的信息处理装置泄露个人信息等。
现有技术文献
专利文献
专利文献1:日本专利第6342094号公报
发明内容
发明要解决的问题
此外,可以认为当企业等个人数据利用方(以下称为数据利用方)从个人数据管理方筹集个人数据时,将数据利用方所需的个人数据的条件即对象条件通知给个人数据管理方。
然而,数据利用方却难以掌握个人数据管理方保有什么个人数据。因此,可以设想作为查询对象的个人数据管理方未充分保有符合对象条件的个人数据的情形。该情形下,数据利用方有时会向另外的个人数据管理方查询等而产生再次交流。此时,数据利用方在筹集个人数据时的工作负荷增加,进而使得数据利用方所进行的通信的通信量增加。
此外,设想同一个人在多个个人数据管理方寄存个人数据的情况。该情况下,数据利用方或个人数据管理方无法掌握寄存在个人数据管理方的哪些数据是同一个人的数据。因此,当数据利用方从多个个人数据管理方筹集个人数据时,可能会产生个人数据的重叠购入。在此所述的重叠购入是指,通过不同的途径两次购入同一人物的个人数据。设想数据利用方会考虑设法以避免上述重叠购入的方式来筹集个人数据。
本公开的一个方面在于提供一种技术,其既能够满足数据利用方在同一个人向多个个人数据管理方寄存数据的情况下产生的需求,又能够更容易地对数据利用方所需要的个人数据进行筹集,而且能够减少数据利用方所进行的通信的通信量。
解决问题的技术方案
本公开的一个方案为一种中介装置,其具备请求获取部、重复确认获取部、确定部、以及获取发送部。请求获取部获取请求信息。重复确认获取部获取重复确认信息。重复确认信息是显示由第1个人数据管理方管理的第1个人数据和由第2个人数据管理方管理的第2个人数据是涉及同一个人的个人数据的信息,其中,第2个人数据管理方是与第1个人数据管理方不同的个人数据管理方。确定部基于重复确认信息来确定筹集方案以及/或者交付数据。筹集方案示出与从包括第1个人数据管理方以及第2个人数据管理方在内的多个个人数据管理方筹集的个人数据相关的条件。交付数据是基于从多个个人数据管理方筹集到的个人数据而生成的数据,并且是发送给数据利用方所保有的利用方装置的数据。获取发送部按照由确定部确定的筹集方案获取个人数据,以及/或者向利用方装置发送由确定部确定的交付数据。
根据上述构成,按照基于重复确认信息而确定的筹集方案来筹集个人数据。以及/或者向利用方装置发送基于重复确认信息而确定的交付数据。因此,能够满足数据利用方在同一个人向多个个人数据管理方寄存数据的情况下产生的需求。此外,由于中介装置代替数据利用方从多个个人数据管理方筹集数据,因此,能够更容易对数据利用方需要的个人数据进行筹集,并且能够减少数据利用方所进行的通信的通信量。
在本公开的一个方案中,确定部可以基于重复确认信息来确定筹集方案。
根据上述构成,按照基于重复确认信息而确定的筹集方案来筹集个人数据。因此,能够满足数据利用方在同一个人向多个个人数据管理方寄存数据的情况下产生的需求。
在本公开的一个方案中,确定部可以确定以下筹集方案,即,筹集通过重复确认信息显示为是涉及同一个人的个人数据的第1个人数据和第2个人数据中的任意一方。
根据上述构成,能够抑制从多个个人数据管理方重复购入涉及同一个人且内容相同的个人数据。
在本公开的一个方案中,确定部可以确定以下筹集方案,即,筹集第1个人数据和第2个人数据中的价格便宜的一方。
根据上述构成,能够抑制重复购入涉及同一个人且内容相同的个人数据,而且数据利用方能够以更便宜的金额购入个人数据。
在本公开的一个方案中,确定部可以确定以下筹集方案,即,对通过重复确认信息显示为是涉及同一个人的个人数据的第1个人数据和第2个人数据双方进行筹集。
根据上述构成,能够在同一个人向第1个人数据管理方和第2个人数据管理方寄存有内容不同的个人数据的情况下,从多个个人数据管理方收集同一个人的个人数据。
在本公开的一个方案中,重复确认获取部可以从管理重复确认信息或能够生成重复确认信息的外部装置获取重复确认信息。
根据上述构成,中介装置易于获取反映个人数据的最新重复状况的重复确认信息。进而,中介装置易于基于最新重复状况来确定筹集方案。
在本公开的一个方案中,中介装置还可以具备存储部,存储部构成为储存重复确认信息。重复确认获取部可以从存储部获取重复确认信息。
根据上述构成,即使在中介装置与管理重复确认信息的外部装置之间不进行数据交换,中介装置也能够获取到重复确认信息。因此,能够减少中介装置的通信量。
在本公开的一个方案中,多个个人数据管理方各自可以对在该个人数据管理方寄存有个人数据的个人或者该个人的个人数据分配规定的识别信息即注册识别信息。重复确认信息可以是以下信息:示出第1个人数据管理方和第2个人数据管理方中涉及同一个人的注册识别信息。
根据上述构成,在多个个人数据管理方以不同的注册识别信息管理涉及同一个人的个人数据的情况下,中介装置能够掌握哪些个人数据是涉及同一个人的个人数据。因此,中介装置能够基于所掌握的结果来确定筹集方案。
在本公开的一个方案中,重复确认获取部可以获取相似度信息作为重复确认信息,相似度信息表示从多个信息库获取到的多个个人数据之间的相似度。
根据上述构成,即使在中介装置与管理重复确认信息的外部装置之间不进行数据交换,中介装置也能够获取到重复确认信息。因此,能够减少中介装置的通信量。
在本公开的一个方案中,个人数据管理方可以是信息库。
本公开的一个方案为一种系统,其具备所述中介装置,且可以具备通知信息获取部以及通知信息发送部。通知信息获取部构成为获取与通过获取发送部获取到的个人数据相对应的通知信息。通知信息是通知给在个人数据管理方寄存有个人数据的个人的信息。通知信息发送部构成为发送由通知信息获取部获取到的通知信息。
根据上述构成,使用从个人数据管理方获取到的个人数据并发送通知信息。因此,能够向寄存有个人数据的个人发送适合于该个人的通知信息。
本公开的另一个方案是一种计算机程序,计算机程序使计算机发挥作为所述中介装置的功能。根据上述构成,能够获得与上述中介装置同样的效果。
附图说明
图1是示出第1实施方式的筹集系统的构成的图。
图2是示出第1~第5实施方式的中介装置的硬件结构的框图。
图3是示出第1实施方式的中介装置的功能性结构的框图。
图4是第1实施方式的数据筹集处理的流程图。
图5是用于说明请求信息的图。
图6是用于说明针对第1信息库的第1实施方式的元数据请求的图。
图7是用于说明针对第2信息库的第1实施方式的元数据请求的图。
图8A是示出第1信息库的分类表基础数据的图;图8B是示出第2信息库的分类表基础数据的图。
图9是用于说明第1实施方式的元数据的图。
图10是用于对确定个人数据的筹集方案的逻辑的一例进行说明的图。
图11是用于说明针对第1信息库的数据请求的图。
图12是用于说明针对第2信息库的数据请求的图。
图13是用于说明来自信息库的交付数据的图。
图14是用于说明标准字典的图。
图15是用于说明第1信息库的数据转换用字典的图。
图16A是示出来自第1信息库的交付数据的图;图16B是示出来自第2信息库的交付数据的图。
图17是示出来自第1信息库的转换后的交付数据的图。
图18是示出来自第2信息库的转换后的交付数据的图。
图19是用于说明通过集成来自各信息库装置的交付数据而生成的集成数据的图。
图20是示出第2实施方式的中介装置的功能性结构的框图。
图21是示出第2实施方式的数据筹集处理的流程图。
图22是示出第3实施方式的筹集系统的构成的图。
图23是示出管理方装置的硬件结构的框图。
图24是用于说明管理方装置9所保有的重复管理表的图。
图25是示出第3以及第4实施方式的中介装置的功能性结构的框图。
图26是示出第3以及第4实施方式的数据筹集处理的流程图。
图27是用于说明ID请求的图。
图28是用于说明ID结果信息的图。
图29是用于说明重复确认请求的图。
图30是用于说明重复结果信息的图。
图31是用于说明第3实施方式的元数据请求的图。
图32是用于说明针对第1信息库的第4实施方式的元数据请求的图。
图33是用于说明针对第2信息库的第4实施方式的元数据请求的图。
图34是示出收集有同一个人的个人数据的集成数据的图。
图35是示出包含个人数据的价格信息的重复状况表的图。
图36是示出第5实施方式的中介装置的功能性结构的框图。
图37是第5实施方式的数据筹集处理的流程图。
图38是示出第6实施方式的筹集系统的构成的图。
图39是示出进行广告分发的装置的硬件结构的框图。
图40是广告分发处理的流程图。
图41是第7以及第8实施方式的数据筹集处理的流程图。
图42是用于说明第7实施方式的元数据请求的图。
图43是示出实施了匿名加工处理的来自第1信息库的交付数据的图。
图44是用于说明第8实施方式的元数据请求的图。
图45是示出执行了统计信息化的来自第1信息库的交付数据的图。
图46是示出第9实施方式的中介装置的功能性结构的框图。
图47是第9实施方式的数据筹集处理的流程图。
图48是示出第9实施方式中的来自第1信息库的转换后交付数据的图。
图49是示出第9实施方式中的来自第2信息库的转换后交付数据的图。
图50是示出表示多个个人数据彼此的相似度的相似度矩阵的图。
图51是示出相似度阈值和关联成功数之间的关系的图。
图52是示出将个人数据表现为数据点的坐标空间的图。
图53是示出将相似度阈值和关联成功数之间的关系扩展成多维度的图。
附图标记的说明
1…筹集系统;2…利用方装置;2a…数据利用方;
3、7、8、11、12…中介装置;4~6…信息库装置;4a~6a…信息库;
9…管理方装置;9a…注册管理方;33、73、83、113…控制部;
331…请求获取部;332…元数据请求生成部;333…元数据请求发送部;
334…元数据接收部;335…条件整理部;336…筹集方案确定部;
337…数据请求生成部;338…数据请求发送部;339…数据接收部;
340…形式处理部;341…数据发送部;731…元数据获取部;
732…更新处理部;831…ID请求生成部;832…ID请求发送部;
833…ID接收部;834…重复确认生成部;835…重复确认发送部;
836…重复确认接收部;931…重复确认获取部;932…更新处理部;
1231…相似度判定部。
具体实施方式
以下参照附图来说明用于实施本公开的实施方式。
[1.第1实施方式]
[1-1.整体构成]
图1所示的筹集系统1具备利用方装置2、中介装置3以及多个信息库装置4~6。
利用方装置2是使用个人数据的数据利用方2a所保有的装置。数据利用方2a是使用个人数据来提高利润的企业等。
在此,本实施方式中所述的个人数据与是否具有个人识别性无关,是指关于个人的全部信息。个人数据包括能够确定和识别个人的个人信息。在此所述的个人信息是例如日本国个人信息保护法第2条第1项所规定的“个人信息”。个人信息除了包括能够通过该信息本身来识别个人的信息以外,还包括能够与其他信息进行对照并由此来识别个人的信息。作为除个人信息以外的个人数据,可列举个人的位置信息或购入信息、IP地址、互联网浏览历史等企业或网络上累积的信息等。此外,作为除个人信息以外的个人数据,还可以列举被加工成无法与个人建立关联的关于个人行动或状态等的数据等。
利用方装置2经由如互联网、专用无线/有线通信线路网的网络而与中介装置3连接。
中介装置3是用来代替数据利用方2a向信息库装置4~6进行个人数据的请求,而且按照适合于数据利用方2a的条件来收购个人数据并向数据利用方2a进行交付的装置。中介装置3例如为在数据利用方2a与信息库4a~6a之间进行个人数据交易中介的从业方所保有。中介装置3经由诸如互联网、专用无线/有线通信线路网的网络而与利用方装置2、以及信息库装置4~6连接。后文将对中介装置3的硬件结构以及功能进行详细说明。
信息库装置4~6各自分别为信息库4a~6a所保有。信息库4a~6a所经营的业务为:管理被个人寄存的个人数据并且将该个人数据提供给企业等第三方。
信息库装置4~6中储存有个人经由个人所保有的智能手机、平板电脑终端、个人计算机等信息处理终端11~17而寄存的个人数据。信息库装置4~6经由诸如互联网、专用无线/有线通信线路网的网络而与中介装置3、以及信息处理终端11~17连接。如后文所述,在信息库装置4~6与中介装置3之间进行各种信息的交换,并且经由中介装置3将个人数据交付给数据利用方2a。
另外,在图1中仅图示了三个信息库装置4~6,不过,中介装置3通常也可以与除三个以外信息库装置进行个人数据等数据的交换。
[1-2.中介装置]
接下来,参照图2来说明中介装置3的硬件结构。中介装置3具备通信部31、存储部32、以及控制部33。
通信部31是用于使中介装置3与网络连接的通信界面。中介装置3能够经由通信部31与利用方装置2、信息库装置4~6通过有线或无线进行数据通信。此外,中介装置3也可以经由通信部31与互联网连接,并经由互联网与外部装置进行数据通信。
存储部32储存各种数据。
控制部33以具有CPU33a、RAM、ROM、以及闪速存储器等半导体存储器(以下称为存储器33b)的周知的微计算机为中心而构成。通过由CPU33a执行保存在非转移实体记录介质中的程序来实现控制部33的各种功能。在该示例中,存储器33b对应于保存有程序的非转移实体记录介质。此外,通过执行该程序来执行与程序相对应的方法。此外,构成控制部33的微计算机的数量可以为一个或多个。
控制部33通过由CPU33a执行程序来进行后述图4所示的数据筹集处理。控制部33通过进行数据筹集处理,而作为图3所示的请求获取部331、元数据请求生成部332、元数据请求发送部333、元数据接收部334、条件整理部335、筹集方案确定部336、数据请求生成部337、数据请求发送部338、数据接收部339、形式处理部340以及数据发送部341而发挥功能。用于实现构成控制部33的上述这些元素331~341的功能的方法不限于软件,也可以使用通过组合逻辑电路和模拟电路等而形成的硬件来实现上述一部分或全部元素的功能。
下文首先参照图3对各元素331~341的功能的概要进行说明。然后参照图4的流程图对各元素331~341的功能进行详细说明。
<请求获取部>
请求获取部331经由通信部31接收来自利用方装置2的请求信息。请求信息是包含数据利用方2a所需要的个人数据的条件即对象条件的信息。后文将对请求信息的具体示例进行说明。
<元数据请求生成部>
元数据请求生成部332基于由请求获取部331接收到的请求信息来生成向信息库装置4~6发送的元数据请求。在此所述的元数据请求是用于向信息库装置4~6请求元数据的信息。在此所述的元数据是指,显示信息库4a~6a所保有的个人数据中与请求信息所包含的对象条件相符的个人数据的属性的信息。在此所述的个人数据的属性是指个人数据所涉及的个人的属性,例如个人的年龄、性别等。个人数据的属性当然也可以是除年龄以及性别以外的个人的属性。换言之,个人数据的属性是该个人数据所包含的表示个人的年龄、性别等各种属性的各数据项目。即,个人数据的属性是指个人数据的数据项目。
在本实施方式中,元数据示出关于该信息库所保有的符合对象条件的全部或一部分个人数据的数据概要。在此所述的数据概要可以是例如个人数据的一部分属性、与个人数据的各个属性相关的统计信息等。
元数据是显示信息库所保有的符合对象条件的全部或一部分个人数据由哪种属性的个人数据构成的信息。具体而言,如后文所述,元数据中包括该信息库所保有的符合对象条件的全部或一部分个人数据的统计量的信息等。后文将对元数据请求以及元数据的具体示例进行说明。
此外,在本实施方式中,各信息库装置4~6各自能够处理的数据形式互不相同。因此,元数据请求生成部332按照各信息库装置4~6能够处理的数据形式而分别对各信息库装置4~6生成元数据请求。
<元数据请求发送部>
元数据请求发送部333经由通信部31向信息库装置4~6发送通过元数据请求生成部332生成的元数据请求。作为针对元数据请求的应答,接收到元数据请求的信息库装置4~6向中介装置3发送元数据。
<元数据接收部>
元数据接收部334经由通信部31从信息库装置4~6接收元数据。
<条件整理部>
条件整理部335根据从信息库装置4~6接收到的元数据来整理交易条件。
<筹集方案确定部>
筹集方案确定部336基于通过元数据接收部334接收到的元数据来确定适合于数据利用方2a的筹集方案。在此所述的筹集方案示出与从信息库装置4~6所保有的符合对象条件的个人数据中筹集的个人数据相关的条件。即,从信息库装置4~6筹集(也就是购入)与筹集方案示出的条件相符的个人数据。后文将对筹集方案的确定逻辑进行说明。
<数据请求生成部>
数据请求生成部337按照通过筹集方案确定部336确定的筹集方案生成数据请求。数据请求是用于向信息库装置4~6请求个人数据的数据。数据请求生成部337按照各信息库装置4~6可处理的数据形式分别对各信息库装置4~6生成数据请求。后文将对数据请求的具体示例进行说明。
<数据请求发送部>
数据请求发送部338经由通信部31向信息库装置4~6发送通过数据请求生成部337生成的数据请求。
<数据接收部>
数据接收部339经由通信部31从接收到数据请求的信息库装置4~6接收交付数据。交付数据包含数据请求中指定的个人数据。后文将对交付数据的具体示例进行说明。
<形式处理部>
形式处理部340将从多个信息库装置4~6接收到的交付数据的数据形式调整成共同的数据形式并集成为一个数据,由此生成集成数据。后文将对集成数据的具体示例进行说明。
<数据发送部>
数据发送部341经由通信部31向利用方装置2发送通过形式处理部340生成的集成数据。由此,从信息库4a~6a筹集到的个人数据被交付给数据利用方2a。
[1-3.处理]
接下来参照图4的流程图对中介装置3的控制部33所执行的数据筹集处理进行说明。其中,通过经由通信部31从利用方装置2接收请求信息而开始执行数据筹集处理。此外,若从数据利用方2a接收到请求信息,则将接收到的请求信息储存在存储部32。
<S101>
在S101中,请求获取部331从存储部32获取来自数据利用方2a的请求信息。本实施方式的请求信息包括图5所示的各个项目。即,请求信息包括时间戳、交易ID、语句类型、目的站、发送源以及语句内容。其中,语句类型是表示该信息属于请求信息、元数据请求、元数据等哪种数据的数据。
语句内容包含预算、报酬、对象条件、请求项目、分布统计轴、利用组织、利用目的以及利用条件的信息。
预算的信息包括数据利用方2a就该交易而言能够支付的预算额的信息、以及表示数据利用方2a的费用结算方式的信息。
报酬的信息是数据利用方2a对提供个人数据的个人支付的报酬的信息。报酬的信息包括报酬的形式、报酬的发行方、报酬的发行时间、可使用与报酬相关的特别优惠等的地域、报酬的生效时刻以及失效时刻等信息。
对象条件是数据利用方2a所需要的个人数据的条件。对象条件例如是用于对个人数据的个人属性(例如性别、年龄、习惯等)进行指定的条件。当数据利用方2a需要条件不同的多个个人数据时,语句内容所包含的对象条件也为多个。此外,语句内容包括数据利用方2a针对每个对象条件需要几件符合该对象条件的个人数据的件数信息。
例如,在图5的示例中,第一个对象条件为:个人数据所涉及的个人的性别为男性且最近三个月浏览食谱网站的次数为3次以上。并且,数据利用方2a所需要的符合该对象条件的个人数据的件数为1000件。第二个对象条件为:个人数据所涉及的个人的性别为女性且最近三个月浏览食谱网站的次数为7次以上。并且,数据利用方2a所需要的符合该对象条件的个人数据的件数为1000件。
请求项目是数据利用方2a希望交付的个人数据的项目(例如性别、年龄层、作为居住地的都道府县等)。
分布统计轴对从信息库装置4~6发送的元数据中包含的个人数据的一部分项目进行指定。即,如后文所述,从信息库装置4~6发送的元数据中包含信息库4a~6a所保有的符合对象条件的全部或一部分个人数据的一览表(即列表)。该列表中针对每一个个人数据的ID均包含该个人数据的一部分项目、和该个人数据的数据价格。在此所述的个人数据的一部分项目换言之即为个人数据所涉及的个人的一部分属性,例如未婚率、年龄层等。分布统计轴对该列表中包含的个人数据的上述一部分项目进行指定。此外,在本实施方式中,分布统计轴所包括的个人数据的属性被设定成由对象条件指定的属性以外的属性。
利用组织、利用目的以及利用条件的信息表示个人数据的利用组织、利用目的以及利用条件。利用组织的信息包括例如利用组织的法人编号、名称、地址、国家、行业等。利用目的的信息包括例如利用的类别(顾客分析、直邮广告发送等)和个别利用目的。个别利用目是例如顾客信息扩展、统计创建、对个人数据的提供源本人的访问、广告分发等。
请求获取部331从利用方装置2接收上述请求信息。
<S102>
接下来,在S102中,元数据请求生成部332基于在S101中接收到的请求信息来生成元数据请求。分别对作为个人数据供应方的每一个信息库4a~6a生成元数据请求。具体而言,图6示出针对第1信息库4a的元数据请求的示例。此外,图7示出针对第2信息库5a的元数据请求的示例。图6以及图7示出的元数据请求均包含相同的项目。
具体而言,元数据请求包括时间戳、交易ID、语句类型、参照交易ID、目的站、发送源以及语句内容。参照交易ID是在S101中接收到的请求信息,换言之,即关于该元数据请求的请求信息的交易ID。
语句内容包含报酬、对象条件、请求项目、分布统计轴、利用组织、利用目的以及利用条件的信息。语句内容所包含的这些信息与请求信息的情形相同。
在此,在本实施方式中,各信息库装置4~6各自能够处理的数据形式不同。因此,按照发送目标方的信息库装置4~6能够处理的数据形式来生成元数据请求。
例如,在第1信息库装置4能够处理的数据形式中,表示个人数据所涉及的个人的性别的变量是“Gender”,“个人的性别为男性”的意思与保存到该变量中的值“1”建立对应。此外,“个人的性别为女性”的意思与保存到变量“Gender”中的值“2”建立对应。
另一方面,例如,在第2信息库装置5能够处理的数据形式中,表示个人数据所涉及的个人的性别的变量为“性别”,“个人的性别为男性”的意思与保存到该变量中的值“男性”建立对应。此外,“个人的性别为女性”的意思与保存到变量“性别”中的值“女性”建立对应。
因此,元数据请求生成部332在例如图6所示的针对第1信息库装置4的元数据请求中,以如“Gender=1”等数据形式来指定对象条件的项目中的“个人数据所涉及的个人的性别为男性”这一条件。
另一方面,元数据请求生成部332在例如图7所示的针对第2信息库装置5的元数据请求中,以如“性别=男性”等数据形式来指定对象条件的项目中的“个人数据所涉及的个人的性别为男性”这一条件。
此外,基于图8A以及图8B所示的分类表基础数据来创建各信息库装置4~6的元数据请求。分类表基础数据是用于将元数据请求等所包含的各项目转换成各信息库装置4~6各自能够处理的数据形式的信息。在某个信息库装置的分类表基础数据中,以该信息库装置能够处理的数据形式描述的“变量名”、“值”以及“意思”被设定成相互建立对应。在本实施方式中,作为中介装置3的交易对象的各信息库装置4~6的分类表基础数据预先储存在中介装置3的存储部32中。不过,分类表基础数据的定位不限于此。例如,在生成元数据请求时,中介装置3可以向各信息库装置4~6发送请求分类表基础数据的信息,并获取各信息库装置4~6的分类表基础数据作为其应答信号。即,可以在生成元数据请求的定时获取分类表基础数据。
<S103>
接下来,在S103中,元数据请求发送部333经由通信部31向信息库装置4~6发送在S102生成的元数据请求。作为元数据请求的应答信息,接收到元数据请求的信息库装置4~6向中介装置3发送元数据。
<S104>
接下来,在S104中,元数据接收部334经由通信部31从各信息库装置4~6接收元数据。以各信息库装置4~6能够处理的数据形式来描述元数据。
本实施方式的元数据包括图9所示的各项目。图9示出从第2信息库装置5接收到的元数据。
元数据包括时间戳、交易ID、语句类型、参照交易ID、目的站、发送源、分类代码基础数据以及语句内容。参照交易ID是与该元数据相关的元数据请求的交易ID,换言之,向作为该元数据发送源的信息库装置发送的元数据请求的交易ID。分类代码基础数据是用于确定与作为该元数据发送源的信息库装置相关的分类代码基础数据的信息。
语句内容包含对象者的信息即对象者信息。对象者信息包括请求信息所包含的对象条件、以及该信息库所保有的个人数据中的符合对象条件的全部或一部分个人数据的件数。此外,对象者信息表示符合对象条件的全部或一部分个人数据由具有哪种属性的个人数据构成。
具体而言,对象者信息包括请求项目统计量。请求项目统计量是与请求项目指定的各属性有关的个人数据的统计量(平均、方差、偏度、中位数等)、最大值以及最小值等。此外,对象者信息包括方差协方差矩阵、个人数据的数据价格分布的信息、以及其他多变量的统计量的信息。
在此,数据价格分布的信息表示在按通过分布统计轴指定的属性对个人数据进行分类时各个类别所包含的个人数据的数据价格。例如,在分布统计轴中指定有“未婚已婚、年龄层、3个月有无购买杂志”的属性。该情况下,数据价格分布的信息中可包含“未婚已婚:未婚;年龄层:30;3个月有无购买杂志=无”的分类所包含的个人数据的数据价格“260、280、290、…”。
在本实施方式中,设想成元数据包含的个人数据的信息的件数大于在请求信息中指定的个人数据的件数。更详细而言,假设元数据所包含的符合某个对象条件的个人数据的信息的件数大于在请求信息中指定的符合该对象条件的个人数据的件数。这是由于:在基于元数据来选择在请求信息中指定的件数的个人数据时,对多种个人数据的选择方法(即筹集方案)进行研究后从多种筹集方案中选定适合于数据利用方2a的筹集方案。不过,通过元数据显示其属性的个人数据的件数不限于此,该个人数据的件数例如也可以与在请求信息中指定的个人数据的件数相同。
<S105>
接下来,在S105中,条件整理部335从符合各信息库装置4~6的数据形式的元数据中整理交易条件。具体而言,条件整理部335利用各信息库装置4~6的分类表基础数据,将符合各信息库装置4~6的数据形式的元数据调整成共同的数据形式,从而整理交易条件。
此外,条件整理部335基于在S104中从各信息库装置4~6接收到的元数据,生成如图10的虚线所示的列表(以下称为元数据列表)。元数据列表是使个人数据的ID、数据源、由分布统计轴指定的属性、以及数据价格建立了对应的数据。数据源是用于识别该数据是来自哪个信息库的数据的信息。如上文所述,在本实施方式中,生成的元数据列表所包含的数据的件数大于在请求信息中指定的个人数据的件数。此外,图10的元数据列表的“数据源”一列中的“第1”表示第1信息库4a,“第2”表示第2信息库5a。
<S106>
接下来,在S106中,筹集方案确定部336基于在S105中生成的元数据列表来确定适合于数据利用方2a的筹集方案。在本实施方式中,筹集方案确定部336基于信息库装置4~6所保有的每个个人数据的数据价格和数据利用方2a所指定的预算额来确定筹集方案。然后,在关注由分布统计轴指定的属性时,筹集方案确定部336基于元数据所示出的个人数据的分布(以下称为原始数据分布)的再现性来确定筹集方案。即,筹集方案确定部336在数据利用方2a的预算额的范围内以使得通过筹集方案筹集的个人数据的数据分布接近原始数据分布的方式来确定筹集方案。
以下,参照图10对筹集方案的确定方法进行具体说明。在图10中,为了简便而考虑了由100个数据组成的元数据列表。在该事例中,来自数据利用方2a的请求信息仅包含一个对象条件。例如,请求信息仅包含图5的对象条件1“个人数据所涉及的个人的性别为男性且最近三个月浏览食谱网站的次数为3次以上”这一对象条件。图10的100个数据是符合对象条件的数据。并且,数据利用方2a需要的与对象条件相符的个人数据的件数为40件。即,从所述100个数据中选择40个数据。此外,数据利用方2a的预算额为11000日元。
数据价格的总额最便宜的筹集方案是方案A,即,在数据价格按从小到大的顺序对数据进行排序,并购入从第1到第40的数据。此外,在图10中,对在筹集方案中购入的数据标示“1”的旗标,对未购入的数据标示“0”的旗标。方案A的购入数据价格的总额为10570日元。但是,例如未婚和已婚的比例在原始的100个数据(以下称为原始数据)中为59:41(3:2),而在方案A中为12:28(1:2.5),从而偏离了原始数据的分布。此外,在图10中,对应于未婚的值为“0”,对应于已婚的值为“1”。这样,存在以下疑虑:实际上可筹集的个人数据的其他项目没有再现原始数据的分布。因此,对购入的数据的明细不同的其他类型(例如图10的方案B和方案C等)也进行研究,并且以与方案A同样的方式评价数据价格的总额以及相对于元数据的分布即原始数据分布的偏离。此外,可使用例如KL(Kullback-Leibler)-divergence(KL散度)等指标值来评价相对于原始数据分布的偏离。图10的示例中,偏离原始数据分布最小的筹集方案是方案C,但是方案C的数据价格的总额为12420日元,超出了预算。因此,确定采用在预算额范围内偏离原始数据分布最小的方案B作为筹集方案。如上所述,从多个筹集方案中将在预算额的范围内偏离原始数据分布最小的方案确定为筹集方案即为本实施方式的筹集方案的确定逻辑。此外,在上文中对请求信息仅包含一个对象条件的情形进行了例示说明,不过,请求信息包含多个对象条件的情形也是同样的确定逻辑。另外,当请求信息包含多个对象条件时,为了不改变在请求信息中指定的各对象条件的件数而变更筹集的数据,从而研究多个方案。
<S107>
接下来,在S107中,数据请求生成部337按照通过筹集方案确定部336确定的筹集方案来生成请求个人数据的数据请求。数据请求生成部337以符合各信息库装置4~6的能够处理的数据形式的方式分别对各信息库装置4~6生成数据请求。
图11示出针对第1信息库4a的数据请求的示例。图12示出针对第2信息库5a的数据请求的示例。这些数据请求均包含相同的项目。
具体而言,数据请求包括时间戳、交易ID、语句类型、参照交易ID、目的站、发送源以及语句内容。参照交易ID是与该数据请求相关的元数据的交易ID,换言之,从作为该数据请求的发送目标方的信息库装置接收到的元数据的交易ID。
语句内容包含与各对象条件相对应的对象者信息。对象者信息包含条件语句、件数、支付额以及购入数据的信息。
条件语句表达对应的对象条件。件数以及支付额表示就对应的对象条件而言,从作为该数据请求的发送目标方的信息库装置筹集的个人数据的件数以及支付额。
购入数据对从作为该数据请求的发送目标方的信息库装置筹集的个人数据进行确定。具体而言,购入数据用于指定基于由统计分布轴指定的各属性以及数据价格而筹集的个人数据。
此外,语句内容包含请求项目,请求项目是数据利用方2a希望交付的个人数据的项目。
数据请求生成部337以符合各信息库装置4~6的能够处理的数据形式的方式,使用各信息库装置4~6的分类代码基础数据分别对各信息库装置4~6生成数据请求。
<S108>
接下来,在S108中,数据请求发送部338经由通信部31向信息库装置4~6发送在S107中生成的数据请求。
<S109>
接下来,在S109中,数据接收部339从接收到数据请求的信息库装置4~6接收如图13所示的包含由数据请求指定的个人数据的交付数据。
具体而言,交付数据包括时间戳、交易ID、语句类型、参照交易ID、目的站、发送源以及语句内容。参照交易ID是与该交付数据相关的数据请求的交易ID,换言之,向作为该交付数据的发送目标方的信息库装置发送的数据请求的交易ID。
语句内容包含与各对象条件相对应的对象者信息。对象者信息包含条件语句、件数以及数据主体的信息。条件语句以及件数与数据请求所包含的条件语句以及件数相同。数据主体是由数据请求所包含的购入数据指定的个人数据。数据主体包含由个人数据的项目中的请求项目指定的项目。并且,语句内容包含请求项目的信息。
<S110>
接下来,在S110中,形式处理部340使从多个信息库装置4~6接收到的交付数据的数据形式达成统一。具体而言,形式处理部340将从各信息库装置4~6接收到的交付数据的数据形式转换成共同的数据形式。然后,形式处理部340将来自各信息库装置4~6的且已被转换成共同的数据形式的交付数据集成为一个数据。以下进行具体说明。
首先,在将来自各信息库装置4~6的交付数据的数据形式转换成共同的数据形式时,形式处理部340使用图14所示的标准字典。标准字典储存在存储部32中。标准字典是如下数据:使中介装置3中就个人数据可包含的各项目而规定的意思、变量名以及值相互建立对应而设定成的数据。以下将规定的变量名以及值分别称为“标准变量名”以及“标准值”。形式处理部340使用该标准字典首先创建各信息库装置4~6的数据转换用字典。数据转换用字典是用于将各信息库装置4~6的交付数据的变量名以及值转换成由标准字典规定的标准变量名以及标准值的数据。
在创建数据转换用字典时,形式处理部340在“意思”项目中对图8A和图8B所示的该信息库的分类表基础数据和图14所示的标准字典进行核对。此外,在进行该核对(即匹配)时,例如可以单纯地使双方数据在“意思”项目内的文本进行匹配,也可以通过除此之外的其他方法使其匹配。
在“意思”项目中对分类表基础数据和标准字典进行核对之后,生成图15所示的数据转换字典,该数据转换字典是通过使分类表基础数据所包含的“变量名”和“值”、标准字典所包含的“标准变量名”和“标准值”、以及“意思”相互建立对应而生成的。此外,可以在将来自各信息库装置4~6的交付数据的数据形式转换成共同的数据形式时生成数据转换字典,也可以预先生成数据转换字典,并将其储存在存储部32中。
然后,形式处理部340使用信息库装置的数据转换字典将从该信息库装置发送的交付数据的变量以及值转换成标准变量以及标准值。由此,从各信息库装置4~6接收到的交付数据的数据形式被转换成共同的数据形式。
例如,使用图15所示的第1信息库装置4的数据转换用字典将图16A所示的来自第1信息库装置4的交付数据转换成图17所示的转换后的交付数据。同样,使用未图示的第2信息库装置5的数据转换用字典将图16B所示的来自第2信息库5a的交付数据转换成图18所示的转换后的交付数据。
然后,形式处理部340将各信息库装置4~6的转换后的交付数据集成为一个数据,并生成如图19所示的集成数据。此外,形式处理部340在生成集成数据时,重新分配每个个人数据的ID,并按顺序累积各信息库装置4~6的交付数据。此外,在集成数据中,能够对来自某个信息库装置的个人数据和来自其他的信息库装置的个人数据彼此加以区分。例如,在图19所示的集成数据中,对来自第1信息库4a的个人数据的ID标附“b”,对来自第2信息库5a的个人数据标附“a”。
形式处理部340以如上方式使来自多个信息库装置4~6的交付数据的数据形式达成一致,并集成为一个数据。
<S111>
接下来,在S111中,数据发送部341向数据利用方2a发送通过形式处理部340生成的集成数据。
控制部33在执行了S111后,结束图4的数据筹集处理。
[1-4.效果]
根据以上详述的第1实施方式,能够获得以下效果。
(1a)在本实施方式中,筹集方案确定部336基于从信息库装置4~6接收到的元数据,来确定适合于数据利用方2a的筹集方案。然后,数据请求发送部338按照已确定的筹集方案将数据请求发送给信息库装置4~6,并且数据接收部339从信息库装置4~6接收个人数据。而且,数据发送部341将接收到的个人数据发送给数据利用方2a。
因此,与数据利用方2a在难以掌握信息库装置4~6所保有的个人数据的情况下直接向信息库装置4~6查询并筹集个人数据的情形相比,能够更容易地进行个人数据的筹集,且能够减少数据利用方2a进行的通信的通信量。
(1b)在本实施方式中,中介装置3从信息库4a~6a所保有的信息库装置4~6获取元数据。
在此,可以考虑以下构成:中介装置3将元数据储存在自身的存储部32中,并定期更新储存在存储部32中的元数据,而从存储部32获取元数据。但是,在该构成中会存在以下情况:从存储部32获取到的元数据未被更新成最新的元数据,从而筹集方案确定部336基于旧的元数据确定筹集方案。相对于此,根据本实施方式的构成,由于中介装置3从信息库装置4~6获取元数据,因此,能够基于内容最新的元数据来确定筹集方案。
(1c)在本实施方式中,筹集方案确定部336基于元数据来确定筹集方案,其中,元数据是显示信息库4a~6a所管理的个人数据中符合对象条件的个人数据的属性的信息。
因此,中介装置3能够根据信息库4a~6a所管理的个人数据中符合对象条件的个人数据的属性来确定筹集方案。
(1d)在本实施方式中,元数据请求发送部333在请求接收部331获取到请求信息的情况下向信息库装置4~6发送元数据请求。并且,元数据接收部334从信息库装置4~6接收元数据。
因此,中介装置3在从利用方装置2获取到请求信息的情况下向信息库装置4~6进行查询,并获取最新的元数据。因此,能够基于最新的元数据来确定筹集方案。
(1e)在本实施方式中,筹集方案确定部336基于信息库装置4~6所保有的每个个人数据的价格、以及请求信息所包含的预算额,来确定筹集方案。因此,能够根据数据利用方2a的预算额来确定适当的筹集方案。
(1f)在本实施方式中,筹集方案确定部336以使得通过筹集方案筹集的个人数据的基于属性的分布接近由元数据示出的原始数据分布的方式来确定筹集方案。
例如,在不考虑原始数据分布而确定个人数据的筹集方案的情况下,有可能以相对于原始数据分布产生了偏离的分布来筹集个人数据。其结果导致出现以下情况:数据利用方2a对个人数据的请求项目所包含的特定项目进行统计等时没有再现元数据的分布,而获得偏倚的结果。
与此相对,根据本实施方式的构成,基于原始数据分布的再现性来确定筹集方案,因此,能够抑制在实际筹集个人数据时产生数据的偏差的情况。
尤其是,在本实施方式中,能够在数据利用方2a的预算额范围内尽可能地抑制产生数据的偏差的情况。
(1g)在本实施方式中,筹集方案确定部336基于从多个信息库装置4~6接收到的元数据,来确定筹集方案,该筹集方案示出与从多个信息库装置4~6所保有的符合对象条件的个人数据的中实际筹集的个人数据有关的条件。数据接收部339从多个信息库装置4~6接收个人数据,并且数据发送部341将从多个信息库装置4~6接收到的个人数据发送给数据利用方2a。
因此,与数据利用方2a在难以掌握信息库装置4~6所保有的个人数据的情况下直接向信息库装置4~6查询并筹集个人数据的情形相比,能够更容易从多个信息库装置4~6筹集适合于数据利用方2a的个人数据。
(1h)在本实施方式中,形式处理部340将从多个信息库装置4~6接收到的个人数据的数据形式统一成共同的数据形式。并且,数据发送部341将来自多个信息库装置4~6的且数据形式已被形式处理部340调整好的个人数据发送给利用方装置2。
因此,通过将数据形式统一成共同的数据形式,能够以数据利用方2a易于处理的数据形式来交付个人数据。
[2.第2实施方式]
[2-1.与第1实施方式的不同点]
第2实施方式的基本构成与第1实施方式相同,因此,对共同的构成省略说明,而以不同点为中心进行说明。此外,与第1实施方式相同的符号表示同一构成,对此参照上文的说明。
在上文所述的第1实施方式中,若中介装置3从利用方装置2接收到请求信息,则向信息库装置4~6发送元数据请求,并从信息库装置4~6接收元数据。
与此相对,在第2实施方式中,图2以及图20所示的中介装置7具备存储部72,存储部72中储存有元数据的集合(以下称为元数据集),元数据集包含与任意的对象条件相对应的元数据。并且,中介装置7若从数据利用方2a接收到请求信息,则从自身所具备的存储部72获取元数据,而并非从信息库装置4~6获取元数据,这一点与第1实施方式不同。以下对第2实施方式进行详细说明。
如图2所示,第2实施方式的中介装置7具备通信部71、存储部72、以及控制部73。上述这些构成71~73的硬件结构与第1实施方式的中介装置3的各构成31~33相同。不过,存储部72中储存的数据与第1实施方式不同。具体而言,在存储部72中储存有与各信息库4a~6a相关的元数据集。
元数据集是相对于请求信息可能包含的任意的对象条件而能够获取到与该对象条件相对应的元数据的数据集。换言之,元数据集是相对于请求信息可能包含的任意的对象条件而能够获取到与该对象条件相对应的元数据所包含的请求项目统计量、数据价格分布等各种信息的数据集。存储部72中储存有包含与中介装置7可请求个人数据的所有信息库4a~6a相关的元数据的元数据集。
具体而言,例如,元数据集包含与中介装置7可请求个人数据的所有信息库所保有的个人数据的年龄、性别、未婚已婚、有无购买杂志等各属性相关的统计量、最大值、最小值等信息。此外,元数据集还包含有关中介装置7可请求个人数据的所有信息库4a~6a的、符合任意的对象条件(即个人数据的属性的任意组合)的个人数据的件数的信息。此外,某个信息库的元数据集包含有关任意的对象条件中的、符合该对象条件的个人数据的数据价格分布的信息。存储部72中储存有上述元数据集。
在本实施方式中,假设储存在存储部72中的元数据集以规定的频率(例如每月一次或每周一次)定期更新。此外,可通过各种方法进行数据集的更新,例如可以以如下方式进行更新。即,中介装置7的保有者从各信息库4a~6a领取储存有元数据集的储存介质,并通过将领取的储存介质内的元数据集储存到存储部72来进行元数据集的更新。
另一方面,控制部73通过由CPU73a执行程序来进行后述的图21所示的数据筹集处理。控制部73通过进行数据筹集处理,而作为图20所示的请求获取部331、元数据获取部731、更新处理部732、筹集方案确定部336、数据请求生成部337、数据请求发送部338、数据接收部339、形式处理部340以及数据发送部341发挥功能。即,取代第1实施方式的要求生成部332、元数据请求发送部333、元数据接收部334以及条件整理部335而使第2实施方式的控制部73作为元数据获取部731以及更新处理部732发挥功能,在这一点上第2实施方式的控制部73与第1实施方式的控制部33不同。
<元数据获取部>
元数据获取部731基于由请求获取部331接收到的请求信息从存储部72获取元数据。具体而言,元数据获取部731从元数据集获取与请求信息相对应的有关各信息库4a~6a的元数据。
<更新处理部>
更新处理部732对储存在存储部72中的元数据集进行更新。
[2-2.处理]
接下来,参照图21的流程图对第2实施方式的中介装置7的控制部73取代第1实施方式的数据筹集处理(图4)而执行的数据筹集处理进行说明。其中,在图21的流程图中,S201、S203~S208的处理(即,除S202以及S209以外的处理)分别与上文所述的图4的S101、S106~S11 1的处理相同。因此,下文省略对这些处理的说明,而仅就不同点的S202以及S209进行说明。
<S202>
在S202中,元数据获取部731基于在S201中获取到的请求信息、以及储存在存储部72中的元数据集而获取元数据。
<S209>
在S209中,更新处理部732对存储部72中储存的元数据集进行更新。例如,在集成数据所包含的个人数据的属性的统计信息或数据价格分布等信息与存储部72中储存的元数据集的信息不同的情况下,更新处理部732将元数据集的信息更新成交付数据所包含的信息。
[2-3.效果]
根据以上详述的第2实施方式,除了上述第1实施方式的效果(1c)、(1e)~(1h)之外,还能够获得以下效果。
(2a)在本实施方式中,筹集方案确定部336基于从存储部72获取的元数据来确定适合于数据利用方2a的筹集方案。并且,数据请求发送部338按照已确定的筹集方案从信息库装置4~6接收个人数据。然后,数据发送部341将接收到的个人数据发送给数据利用方2a。
因此,与数据利用方2a在难以掌握信息库装置4~6所保有的个人数据的情况下直接向信息库装置4~6查询并筹集个人数据的情形相比,能够更容易对适合于数据利用方2a的个人数据进行筹集。
尤其是,元数据获取部731从存储部72获取元数据。即,中介装置7即使不与信息库4a~6a之间进行数据的交换也能够获取元数据。因此,与向信息库4a~6a发送元数据请求而获取元数据的构成相比,能够减少中介装置7的通信量。此外,能够抑制用于进行元数据请求以及元数据的发送接收的API(Application Programming Interface)等系统的开发费用。
[3.第3实施方式]
[3-1.与第1实施方式的不同点]
第3实施方式的基本构成与第1实施方式相同,因此,对共同的构成省略说明,而以不同点为中心进行说明。此外,与第1实施方式相同的符号表示同一构成,对此参照上文的说明。
在上述第1实施方式中,中介装置3从多个信息库4a~6a获取个人数据。在此,可充分想到同一个人向多个信息库4a~6a寄存个人数据的情况。而且,信息库4a~6a或数据利用方2a无法获知寄存在信息库4a~6a中的哪些个人数据来自同一人物。因此,数据利用方2a向多个信息库4a~6a请求个人数据时,存在从不同的信息库4a~6a购入同一人物的相同个人数据的情况。即,有时会产生重叠购入个人数据的情况。
第3实施方式以如下方式来解决抑制上述个人数据的重叠购入的课题。即,在第3实施方式中,如图22所示,假设存在如下装置(以下称为注册管理方9a):该装置掌握着哪个人在哪个信息库寄存有个人数据者。并且,第3实施方式的中介装置8通过向该注册管理方9a所保有的装置即管理方装置9进行查询,来检测在多个信息库4a~6a寄存有个人数据的个人。然后,中介装置8确定不产生重叠购入的筹集方案。以下对第3实施方式的构成进行详细说明。
如图23所示,注册管理方9a的管理方装置9具备通信部91、存储部92、以及控制部93。
通信部91是用于使管理方装置9与网络连接的通信界面。管理方装置9能够经由通信部91而与中介装置8通过有线或无线进行数据通信。此外,也可以是管理方装置9能够经由通信部91与互联网连接,并经由互联网与外部装置进行数据通信。
存储部92储存各种数据。在本实施方式中,在存储部92中储存有如图24所示的重复管理表。重复管理表是使信息库ID、信息库注册者ID、以及个人ID相互建立对应而设定成的信息。
信息库ID是用于识别各信息库的ID。注册管理方9a可以对各信息库分配信息库ID。在本实施方式中,第1信息库4a、第2信息库5a以及第3信息库6a的信息库ID分别为“00001”、“00002”以及“00003”。
信息库注册者ID是各信息库4a~6a对在该信息库4a~6a寄存有个人数据的个人也就是注册者分配的ID。信息库注册者ID是各信息库4a~6a内独有的ID。此外,各信息库4a~6a使寄存有个人数据的个人的信息库注册者ID和该个人所寄存的个人数据以一对一对应的方式建立对应后并对其进行储存。因此,也可以认为信息库注册者ID是对在信息库寄存有个人数据的个人的个人数据分配的ID。
个人ID是与个人一对一相对应的ID,例如,由注册管理方9a对个人分配个人ID。具体而言,例如注册管理方9a向各信息库4a~6a出借用于生成个人ID的工具。然后,各信息库4a~6a方可以使用借入的所述工具来生成个人ID。例如,个人ID可以是利用散列函数等由个人将数据注册到信息库4a~6a时的本人确认信息生成的ID。具体而言,例如,可以将hash(surname_firstname_sex_birthday)等的散列值用作个人ID。在此,hash是散列函数,分别向surname、firstname、sex以及birthday输入寄存数据的个人的姓、名、性别以及出生日期。
在该重复管理表中,可以将个人ID相同的个人数据判断为是同一人物的个人数据。
另一方面,控制部93以具有CPU93a、RAM、ROM、闪速存储器等半导体存储器(以下称为存储器93b)的公知的微计算机为中心而构成。
另一方面,如图2所示,第3实施方式的中介装置8具备通信部81、存储部82、以及控制部83。这些构成81~83的硬件结构与第1实施方式的中介装置3的各构成31~33相同。不过,控制部83所执行的处理与第1实施方式存在部分不同。
具体而言,控制部83通过由CPU83a执行储存在存储器83b中的程序来进行后述图26所示的数据筹集处理。控制部83通过进行数据筹集处理,而作为图25所示的请求获取部331、ID请求生成部831、ID请求发送部832、ID接收部833、重复确认生成部834、重复确认发送部835、重复确认接收部836、元数据请求生成部332、元数据请求发送部333、元数据接收部334、条件整理部335、筹集方案确定部336、数据请求生成部337、数据请求发送部338、数据接收部339、形式处理部340以及数据发送部341来发挥功能。即,第3实施方式的控制部83还作为ID请求生成部831、ID请求发送部832、ID接收部833、重复确认生成部834、重复确认发送部835以及重复确认接收部836发挥功能,这一点与第1实施方式的控制部33不同。下文对存在不同点的各元素832~836等的功能概要进行说明。然后参照图26的流程图对各元素832~836等的功能进行详细说明。
<ID请求生成部>
ID请求生成部831基于由请求获取部331接收到的包含对象条件的请求信息生成向信息库装置4~6发送的ID请求。在此所述的ID请求是用于请求符合对象条件的个人数据所涉及的信息库注册者ID的信息。在本实施方式中,ID请求生成部831按照各信息库装置4~6能够处理的数据形式分别对各信息库装置4~6生成ID请求。ID请求的具体示例如后文所述。
<ID请求发送部>
ID请求发送部832经由通信部81向多个信息库装置4~6发送通过ID请求生成部831生成的ID请求。作为针对ID请求的应答,接收到ID请求的信息库装置4~6将ID结果信息发送给中介装置3。在此所述的ID结果信息是示出符合对象条件的个人数据的信息库注册者ID的信息。本实施方式所述的ID结果信息中还包含符合对象条件的个人数据的价格信息。
<ID接收部>
ID接收部833经由通信部81从多个信息库装置4~6接收ID结果信息。后文将对ID结果信息的具体示例进行说明。
<重复确认生成部>
重复确认生成部834基于从多个信息库装置4~6接收到的ID结果信息来生成向管理方装置9发送的重复确认请求。在此所述的重复确认请求是用于进行如下请求的信息,即,请求确认ID结果信息包含的多个信息库注册者ID所示出的多个个人数据中是否存在涉及同一个人的个人数据。后文将对重复确认请求的具体示例进行说明。
<重复确认发送部>
重复确认发送部835经由通信部81向管理方装置9发送通过重复确认生成部834生成的重复确认请求。作为针对重复确认请求的应答,接收到重复确认请求的管理方装置9将示出重复确认结果的重复结果信息发送给中介装置8。
<重复确认接收部>
重复确认接收部836经由通信部81从管理方装置9接收重复结果信息。后文将对重复结果信息的具体示例进行说明。
<元数据请求生成部>
元数据请求生成部332基于由重复确认接收部836接收到的重复结果信息、以及由请求获取部331接收到的请求信息,来生成向信息库装置4~6发送的元数据请求。在本实施方式中,在由多个信息库管理同一人物的个人数据的情况下,元数据请求生成部332生成从所述多个信息库中的一个信息库请求所述同一人物的数据的元数据请求。
元数据请求发送部333以后的各元素333~341基本上与第1实施方式相同,故省略说明。
[3-2.处理]
接下来,参照图26的流程图对第3实施方式的中介装置8的控制部83取代第1实施方式的数据筹集处理(图4)而执行的数据筹集处理进行说明。
<S301>
S301与上述图4的S101相同,故省略说明。
<S302>
接下来,在S302中,ID请求生成部831基于由请求获取部331接收到的包含对象条件的请求信息,来生成向信息库装置4~6发送的ID请求。
在此,ID请求包括图27所示的各项目。图27中示出针对第1信息库4a的ID请求的示例。ID请求包括与上述图6所示的元数据请求相同的项目。换言之,除语句类型为“ID请求”以外,ID请求的内容基本上与元数据请求的内容相同。尤其是,ID请求包括请求信息所包含的对象条件的信息。
在本实施方式中,各信息库装置4~6各自能够处理的数据形式互不相同。因此,按照发送目标方的信息库装置4~6能够处理的数据形式而分别对各信息库装置4~6生成ID请求。
<S303>
接下来,在S303中,ID请求发送部832经由通信部81向多个信息库装置4~6发送通过ID请求生成部831生成的ID请求。作为针对ID请求的应答,接收到ID请求的信息库装置4~6将ID结果信息发送给中介装置3。
<S304>
ID接收部833经由通信部81从多个信息库装置4~6接收ID结果信息。以各信息库装置4~6的能够处理的数据形式描述ID结果信息。
本实施方式的ID结果信息包括图28所示的各项目。图28中示出从第1信息库4a接收到的ID结果信息。
ID结果信息包括时间戳、交易ID、语句类型、参照交易ID、目的站、发送源以及语句内容。参照交易ID是与该ID结果信息相关的ID请求的交易ID,换言之,是作为该ID结果信息的发送源的信息库装置所接收到的ID请求的交易ID。
语句内容包含以下组合的列表,即,符合由ID请求示出的对象条件的个人数据的信息库注册者ID和价格组成的组合。例如,在图28的示例中,语句内容所包含的{1343482,215}的组合表示:第1信息库4a所保有的个人数据中的符合对象条件的某个人数据的信息库注册者ID为1343482,且价格为215日元。中介装置8从各信息库4a~6a接收如图28所示的ID结果信息。
<S305>
接下来,在S305中,重复确认生成部834基于从多个信息库装置4~6接收到的ID结果信息,来生成向管理方装置9发送的重复确认请求。
如图29所示,本实施方式的重复确认请求包括时间戳、交易ID、语句类型、参照交易ID、目的站、发送源以及语句内容的各项目。
在语句内容中包含从各信息库4a~6a接收到的信息库注册者ID的列表、和各信息库的标识符(在图29中,“语句内容”内的“第1信息库”、“第2信息库”等)。
<S306>
接下来,在S306中,重复确认发送部835经由通信部81向管理方装置9发送通过重复确认生成部834生成的重复确认请求。作为针对重复确认请求的应答,接收到重复确认请求的管理方装置9将重复结果信息发送给中介装置8。
<S307>
重复确认接收部836经由通信部81从管理方装置9接收重复结果信息。
如图30所示,本实施方式的重复结果信息包括时间戳、交易ID、语句类型、参照交易ID、目的站、发送源以及语句内容的各项目。
语句内容包含同一人物在每个信息库4a~6a中的信息库注册者ID的组合。
例如,在图30的示例中,语句内容中包含的(0900838,9888100,430981213)的组合表示:第1信息库4a的信息库注册者ID“0900838”、以及第3信息库6a的信息库注册者ID“9888100”、以及第3信息库6a的信息库注册者ID“430981213”是同一人物的ID。
此外,在从中介装置8接收到重复确认请求时,管理方装置9以如下方式生成重复结果信息。即,管理方装置9参照图24所示的重复管理表。然后,管理方装置9在重复确认请求所包含的信息库注册者ID的列表内确认是否存在与同一个人ID相对应的多个信息库注册者ID。而且,当存在与同一个人ID相对应的多个信息库注册者ID时,管理方装置9将该多个信息库注册者ID归并成一组。由此,生成重复结果信息的语句内容所包含的信息库注册者ID的组合。管理方装置9以如上方式生成重复结果信息。其中,在图24中,符号9a所示的信息库注册者ID对应于同一个人ID。此外,符号9b所示的信息库注册者ID也对应于同一个人ID。
<S308>
元数据请求生成部332基于由重复确认接收部836接收到的重复结果信息、以及由请求获取部331接收到的请求信息,来生成向信息库装置4~6发送的元数据请求。
在此,在多个信息库的信息库注册者ID对应于同一个人ID的情况下,元数据请求生成部332在所述多个信息库中指定一个信息库。然后,元数据请求生成部332针对除被指定的信息库以外的信息库生成元数据请求,以使得除被指定的信息库以外的信息库将对应于所述同一个人ID的信息库注册者ID排除后发送元数据。
具体而言,在本实施方式中,元数据请求生成部332对在S307中接收到的重复结果信息和在S304中接收到的ID结果信息所包含的价格信息进行核对。然后,元数据请求生成部332确定以最便宜的价格提供某个人的个人数据的信息库,并在元数据请求内规定条件,以从除已被确定的信息库以外的信息库发送已将该个人的数据排除的元数据。
此外,在本实施方式中,设想即使是同一人物的个人数据,数据的价格也会因信息库而有所不同。这是由于设想到信息库所获取的利润因信息库而有所不同的缘故。
如图31所示,本实施方式的元数据请求除上述图6所示的元数据请求的各项目之外,语句内容中还包含排除ID的项目。
排除ID是示出不包含在从信息库发送的元数据中的(即被排除的)个人数据的信息库注册者ID的项目。即,接收到元数据请求的信息库将在排除ID指定的信息库注册者ID的数据排除之后向中介装置8发送元数据。由此,从来自除被指定的信息库以外的信息库的元数据中排除对应于同一个人ID的信息库注册者ID的数据。
<S309>
S309与上述图4的S103相同,故省略说明。
<S310>
接下来,在S310中,元数据接收部334经由通信部81从各信息库装置4~6接收元数据。在此,当多个信息库4a~6a的信息库注册者ID对应于某同一个人ID时,元数据接收部334从以最便宜的价格提供该个人的个人数据的信息库接收包含该个人的数据的元数据。并且,元数据接收部334从以最便宜的价格提供该个人的个人数据的信息库以外的信息库接收已将该个人的数据排除的元数据。从而抑制元数据接收部334从多个信息库接收包含同一人物的数据的元数据的情况。
<S311~S317>
S311~S317与上述图4的S105~S111相同,故省略说明。
[3-3.效果]
根据以上详述的第3实施方式,除上述第1实施方式的效果(1a)~(1h)之外,还能够获得以下效果。
(3a)在本实施方式中,筹集方案确定部336基于重复结果信息来生成元数据请求,并基于作为元数据请求的应答而获得的元数据来确定筹集方案。即,筹集方案确定部336基于重复结果信息来确定筹集方案。
因此,按照基于重复确认信息而确定的筹集方案来筹集个人数据。从而能够满足数据利用方2a在同一个人向多个信息库4a~6a寄存数据的情况下产生的需求。此外,中介装置8代替数据利用方2a从多个信息库4a~6a筹集数据,因此,能够更容易对数据利用方2a需要的个人数据进行筹集。
(3b)在本实施方式中,筹集方案确定部336确定对第1个人数据和第2个人数据中的任意一者进行筹集的筹集方案,其中,通过重复结果信息显示出第1个人数据以及第2个人数据是涉及同一个人的个人数据。
因此,能够抑制从多个信息库4a、5a重复购入涉及同一个人的内容相同的个人数据的情况。
(3c)在本实施方式中,筹集方案确定部336确定以下筹集方案:在涉及同一个人的第1个人数据以及第2个人数据中对价格便宜的一方的个人数据进行筹集。
因此,能够抑制重复购入涉及同一个人的内容相同的个人数据的情况,而且数据利用方2a能够以更便宜的金额购入个人数据。
(3d)在本实施方式中,重复确认接收部836从能够生成重复结果信息的外部装置即管理方装置9获取重复结果信息。
在此,可以考虑中介装置8将图24所示的重复状况表储存在自身的存储部82中,并基于储存在存储部82的重复状况表来获取重复结果信息的构成。但是,在该构成中,储存在存储部82的重复状况表有可能未被更新成最新的重复状况表,从而有可能致使获取到的重复结果信息未反映个人数据的最新重复状况。与此相对,根据本实施方式的构成,由于从管理方装置9获取重复结果信息,因此,中介装置8易于获取反映最新的重复状况的重复结果信息。而且中介装置8能够容易基于最新的重复状况来确定筹集方案。
(3e)在本实施方式中,重复结果信息是使涉及同一个人的某个信息库的信息库注册者ID和其他信息库的信息库注册者ID建立对应的信息。
因此,在多个信息库以不同的信息库注册者ID管理涉及同一个人的个人数据的情况下,中介装置8能够掌握由多个信息库管理的任意的个人数据是否是涉及同一个人的个人数据。而且,中介装置8能够根据所掌握的结果来确定筹集方案。
此外,在本实施方式中,重复结果信息相当于重复确认信息,信息库注册者ID相当于注册识别信息,管理方装置9相当于管理重复确认信息或者能够生成重复确认信息的外部装置,S301相当于作为请求获取部的处理,S307相当于作为重复确认获取部的处理,S312相当于作为确定部的处理,S315以及S317相当于作为获取发送部的处理。
[4.第4实施方式]
[4-1.与3实施方式的不同点]
第4实施方式的基本构成与第3实施方式相同,因此,对共同的构成省略说明,而以不同点为中心进行说明。此外,与第3实施方式相同的符号表示同一构成,对此参照上文的说明。
在上述第3实施方式中,中介装置8进行重复确认,以确认寄存在多个信息库4a~6a中的哪些数据是同一个人的数据。然后,中介装置8确定避免重复购入同一个人的个人数据的筹集方案。即,中介装置8仅从多个信息库4a~6a中指定的信息库筹集同一个人的个人数据。
另一方面,可以想到顾客在信息库寄存个人数据,以供信息库向顾客提供某些服务。该情形下,如果每个信息库提供的服务内容不同,则即使是同一个人,也有可能分别在每个信息库寄存数据项目不同的个人数据。因此,假设数据利用方2a欲从多个信息库4a~6a收集并获取同一个人的个人数据。
在第4实施方式中,中介装置8分别从多个信息库4a~6a收集并筹集同一人物的个人数据,这一点与第3实施方式不同。以下对第4实施方式进行详细说明。
第4实施方式的中介装置8的硬件结构以及功能性元素与第3实施方式相同。尤其是,第4实施方式的中介装置8具备图25所示的各元素331~341、831~836。各元素331~341、831~836的功能基本上与第3实施方式相同,不过,元数据请求生成部332以及形式统合部340的功能与第3实施方式部分不同。以下对该元素332、340进行说明。
<元数据请求生成部>
元数据请求生成部332基于由重复确认接收部836接收到的重复结果信息、和由请求获取部331接收到的请求信息,来生成向信息库装置4~6发送的元数据请求。并且能够从接收到的重复结果信息中确定出在多个信息库寄存有个人数据的个人的信息库注册者ID。元数据接收部334生成请求如下元数据的元数据请求,该元数据仅包含向多个信息库(即,也向其他的信息库)寄存有个人数据的个人的数据。
<形式统合部>
形式处理部340将从多个信息库装置4~6接收到的交付数据的数据形式调整成共同的数据形式,并集成为一个数据,由此来生成集成数据。在本实施方式中,形式处理部340通过收集从多个信息库装置4~6接收到的同一个人的个人数据来生成所述集成数据。
[4-2.处理]
接下来,参照上述图26的流程图对第4实施方式的中介装置8的控制部83取代第3实施方式的数据筹集处理而执行的数据筹集处理进行说明。
<S301~S307>
S301~S307与上述第3实施方式的S301~S307相同,故省略说明。
<S308>
接下来,在S308中,元数据请求生成部332基于在S307中接收到的重复结果信息、和在S301中接收到的请求信息,来生成向信息库装置4~6发送的元数据请求。在此,元数据请求生成部332生成用于请求以下元数据的元数据请求,该元数据仅包含向多个信息库寄存有个人数据的个人的数据。
具体而言,元数据请求生成部332生成如图32以及图33所示的元数据请求。图32中示出向第1信息库4a发送的元数据请求的示例。图33中示出向第2信息库5a发送是元数据请求的示例。
本实施方式的元数据请求包含与上述图6所示的元数据请求基本相同的项目,不过不包含分布统计轴的项目。此外,本实施方式的元数据请求在语句内容中还包含对象ID的项目。
在此所述的对象ID是示出从信息库发送的元数据中包含的个人的信息库注册者ID的项目。即,接收到元数据请求的信息库4a~6a向中介装置8发送如下元数据,即,该元数据仅包含由对象ID指定的信息库注册者ID的数据。在对象ID中记述向多个信息库寄存有个人数据的个人的信息库注册者ID。
例如,在上述图24的示例中,信息库ID为“00001”的第1信息库4a的信息库注册者ID“0900838”、信息库ID为“00002”的第2信息库5a的信息库注册者ID“9888100”、以及信息库ID为“00003”的第3信息库6a的信息库注册者ID“430981213”是同一个人的ID。此外,第1信息库4a的信息库注册者ID“2910110”和第2信息库5a的信息库注册者ID“7550360”是同一个人的工D。
因此,如图32所示,对于第1信息库4a而言,作为表示在多个信息库4a~6a寄存有数据的个人的ID,在对象ID处记述有信息库注册者ID“0900838”以及“2910110”。
此外,在图32的示例中,就第1信息库4a而言,如请求项目一栏所示,除性别(Gender)、年龄层(Age10)等基本属性之外,还保存有如孩子的年龄(Age_minor_child)、家庭人数(Num_Family)、自己做饭的频率(Freq_HomeCook)、超市的利用频率(Freq_GSM)、便利店的利用频率(Freq_CVS)、药妆店的利用频率(Freq_DS)的个人数据的属性。
另一方面,如图33所示,对于第2信息库5a而言,作为表示在多个信息库4a、5a寄存有数据的个人的ID,在对象ID处记述有信息库注册者ID“7550360”以及“9888100”。
此外,在图33的示例中,就第2信息库5a而言,如请求项目一栏所示,除性别、年龄层等基本属性外,还保存有如食谱网站月度浏览历史、三个月购买杂志的金额的个人数据的属性。
元数据请求生成部332生成如上所述的元数据请求。
<S309~S315>
S309~S315与上述第3实施方式的S309~S315相同,故省略说明。
<S316>
接下来,在S316中,形式处理部340将从多个信息库装置4~6接收到的交付数据的数据形式调整成共同的数据形式,并集成为一个数据,由此生成集成数据。
在图34中示出集成数据的示例。图中,符号10a示出的个人数据的属性(即数据项目)是第1信息库4a以及第2信息库5a双方均保有的属性。另一方面,符号10b示出的个人数据的属性是仅第1信息库4a保有的属性。此外,符号10c示出的个人数据的属性是仅第2信息库5a保有的属性。形式处理部340以如上所述的方式通过从多个信息库4a~6a收集同一个人的个人数据来生成集成数据。
<S317>
S317与上述第3实施方式的S317相同,故省略说明。
[4-3.效果]
根据以上详述的第4实施方式,除上述第1实施方式的效果(1a)~(1h)以及第3实施方式的效果(3a)、(3d)以及(3e)以外,还能够获得以下效果。
(4a)在本实施方式中,筹集方案确定部336确定对第1个人数据以及第2个人数据双方进行筹集筹集方案,其中,通过重复结果信息显示出第1个人数据以及第2个人数据是同一个人的个人数据。
因此,例如在同一个人向第1信息库4a和第2信息库5a寄存了内容不同的个人数据的情况下,能够从多个信息库4a、5a收集到同一个人的个人数据。由于在多个信息库寄存的个人数据未必相同,因此,中介装置8能够通过收集而生成在信息库4a、5a均不存在的信息。
此外,在本实施方式中的中介装置8的各构成与权利要求的各语句之间的对应关系和第3实施方式相同。
[5.第5实施方式]
[5-1.与第3实施方式的不同点]
第5实施方式的基本构成与第3实施方式相同,因此,对共同的构成省略说明,而以不同点为中心进行说明。此外,与第3实施方式相同的符号表示同一构成,对此参照上文的说明。
在第3实施方式中,中介装置8从外部的管理方装置9获取重复结果信息。与此相对,在第4实施方式中,在中介装置8的存储部82中预先储存有重复状况表。并且,当从利用方装置2接收到请求信息时,中介装置8从存储部82基于重复状况表生成重复结果信息,这一点与第3实施方式不同。以下对第5实施方式进行详细说明。
如图2所示,第5实施方式的中介装置11具备通信部111、存储部112、以及控制部113。这些构成111~113的硬件结构与第3实施方式的中介装置8的各构成81~83相同。不过,储存在第5实施方式的中介装置11的存储部112中的数据与第3实施方式不同。具体而言,在第5实施方式的存储部112中储存有图35所示的重复管理表。
图35的重复状况表与上述图24所示的注册管理方9a所保有的重复管理表基本上相同,所不同的是还包含个人数据的价格的项目。即,图35所示的重复状况表是使信息库ID、信息库注册者ID、个人ID、个人数据的价格相互建立了对应而设定成的信息。
在本实施方式中,假设以规定的频率(例如每月一次或每周一次)来定期更新在存储部112储存的重复状况表。此外,能够以各种方法来进行重复状况表的更新,例如能够以如下方式来进行更新。即,中介装置11的保有者可以从保有管理方装置9的注册管理方9a领取储存有重复状况表的储存介质,并通过将领取的储存介质内的重复状况表储存到存储部112,来进行重复状况表的更新。
另一方面,控制部113通过由CPU113a执行储存在存储器113b的程序来进行后述图37所示的数据筹集处理。控制部113通过进行数据筹集处理,而作为图36所示的各元素331~341、831~833、931、932发挥功能。即,第5实施方式的控制部113取代第3实施方式的图25所示的重复确认生成部834、重复确认发送部835以及重复确认接收部836而作为重复确认获取部931发挥功能,进而作为更新处理部932发挥功能,这一点与第3实施方式不同。以下对存在不同点的重复确认获取部931以及更新处理部932进行说明。
<重复确认获取部>
重复确认获取部931从存储部112获取重复状况表。然后,重复确认获取部931基于由ID接收部833接收到的ID结果信息、和从存储部112获取到的重复状况表,来生成重复结果信息。重复结果信息的生成方法与上述第3实施方式的管理方装置9生成重复结果信息的方法相同,故省略说明。
<更新处理部>
更新处理部932基于通过形式处理部340生成的集成数据来更新在存储部112中储存的重复状况表。
例如,当集成数据所包含的数据与在重复状况表登记的数据不同时,更新处理部932将登记在重复状况表中的数据更新成交付数据所包含的数据。由此,重复状况表被更新成集成数据所包含的数据,即,中介装置11最近购入的最新的数据内容。
[5-2.处理]
接下来,参照图37的流程图对第5实施方式的中介装置11的控制部113取代第3实施方式的数据筹集处理(图26)而执行的数据筹集处理进行说明。
<S401~S404>
S401~S404与上述图26的S301~S304相同,故省略说明。
<S405>
接下来,在S405中,重复确认获取部931从存储部112获取重复状况表。然后,重复确认获取部931基于由ID接收部833接收到的ID结果信息、和从存储部112获取到的重复状况表,来生成重复结果信息,并由此来获取重复结果信息。
<S406~S415>
S406~S415与上述图26的S308~S317相同,故省略说明。
<S416>
接下来,在S416中,更新处理部932基于通过形式处理部340生成的集成数据,对储存在存储部112的重复状况表进行更新。
[5-3.效果]
根据以上详述的第5实施方式,除上述第1实施方式的效果(1a)~(1h)以及第3实施方式的效果(3a)~(3c)以及(3e)外,还能够获得以下效果。
(5a)在本实施方式中,中介装置11从存储部112获取重复状况表。并且,重复确认获取部931基于由ID接收部833接收到的ID结果信息、和获取到的重复状况表,来生成重复结果信息,并由此获取重复结果信息。也就是说,即使中介装置11与管理方装置9之间不进行数据交换,中介装置11也能够获取到重复结果信息。因此,与向管理方装置9发送重复确认请求并获取重复结果信息的构成相比,能够减少管理方装置9的通信量。此外,能够抑制用于对重复确认请求以及重复结果信息进行发送接收的API(Application ProgrammingInterface)等的系统开发费用。
此外,在本实施方式中,重复状况表相当于重复确认信息,S401相当于作为请求获取部的处理,S405相当于作为重复确认获取部的处理,S410相当于作为确定部的处理,S413以及S415相当于作为获取发送部的处理。
[6.第6实施方式]
[6-1.与第3实施方式的不同点]
第6实施方式的基本构成与第3实施方式相同,因此,对共同的构成省略说明,而以不同点为中心进行说明。此外,与第3实施方式相同的符号表示同一构成,对此参照上文的说明。在第6实施方式中,数据利用方2a的利用方装置2使用从信息库4a~6a筹集到的个人数据,向在信息库4a~6a寄存有个人数据的个人进行广告分发,这一点与上述第3实施方式不同。
与第3实施方式相同,图38所示的第6实施方式的筹集系统12具备利用方装置2、中介装置3以及多个信息库装置4~6。第6实施方式的中介装置3以及多个信息库装置4~6与第3实施方式相同。
另一方面,如图39所示,第6实施方式的利用方装置2具备通信部21、存储部22、以及控制部23。通信部21是用于将利用方装置2与网络连接的通信界面。利用方装置2经由通信部21而能够与中介装置8、个人所保有的信息处理终端11~17进行数据通信。
存储部22储存各种数据。在本实施方式中,存储部22中储存有广告信息和发送目标方信息。在此所述的广告信息是向数据利用方2a从信息库4a~6a筹集到的个人数据所涉及的个人发送的广告信息,并且是与筹集到的个人数据的属性(换言之,个人数据所涉及的个人的喜好性等各种属性)相对应的广告信息。
此外,在此所述的发送目标方信息是用于指定被发送广告信息的发送目标方的信息。在本实施方式中,将在信息库4a~6a中寄存有个人数据的个人设想成发送目标方。发送目标方信息可以是例如IDFA(Identification For Advertisers)和ADID(AdvertisingIdentifier)、小型文本文件(cookie)ID、分发对象者的电子邮件地址等用于识别广告信息的发送目标方的标识符。在本实施方式中,假定发送目标方信息包含在从信息库4a~6a获取到的个人数据中。
控制部23以具有CPU23a、RAM、ROM、闪速存储器等半导体存储器(以下称为存储器23b)的公知的微计算机为中心而构成。通过由CPU23a执行保存在非转移实体记录介质中的程序来实现控制部23的各种功能。在该示例中,存储器23b对应于保存有程序的非转移实体记录介质。此外,通过执行该程序来实施与程序对应的方法。控制部23执行后文所述的图40所示的广告分发处理。
[6-2.处理]
接下来,参照图40的流程图对利用方装置2的控制部23所执行的广告分发处理进行说明。此外,在适当的时机来执行广告分发处理。
首先,在S501中,控制部23从存储部22获取广告信息和发送目标方信息。
接下来,在S502中,控制部23进行广告分发。具体而言,控制部23经由通信部21,向在S501获取到的发送目标方信息所显示的发送目标方发送在S501中获取到的广告信息。控制部23在执行S502后结束图40的广告分发处理。
[6-3.效果]
根据以上详述的第6实施方式,除上述第1实施方式的效果(1a)~(1h)以及第3实施方式的效果(3a)~(3e)外,还能够获得以下效果。
(6a)在本实施方式中,利用方装置2使用从信息库4a~6a获取到的个人数据向在信息库4a~6a寄存有个人数据的个人进行广告分发。具体而言,利用方装置2获取如下信息:待通知给从中介装置8获取到的个人数据所涉及的个人的广告信息、以及示出所述广告信息的发送目标方的发送目标方信息。然后,利用方装置2向发送目标方信息示出的发送目标方发送广告信息。
因此,使用从信息库装置4~6获取到的个人数据来发送广告信息。从而能够进行与在信息库4a~6a寄存有个人数据的个人相适的广告分发。
此外,在本实施方式中,筹集系统12相当于系统,广告信息相当于通知信息,S501相当于作为通知信息获取部的处理,S502相当于作为通知信息发送部的处理。
[7.第7实施方式]
[7-1.与第1实施方式的不同点]
第7实施方式的基本构成与第1实施方式相同,因此,对共同的构成省略说明,而以不同点为中心进行说明。此外,与第1实施方式相同的符号表示同一构成,对此参照上文的说明。
在上述第1实施方式中,数据利用方2a经由中介装置3从信息库4a~6a获取个人数据。在此,假设数据利用方不想负担个人数据的处理成本的情形。即,当下,对从信息库4a~6a获取个人数据的数据利用方而言,也存在要求诸如使用隐私标识等安全管理装置的动向。安全管理装置是指,为了实现如防止个人数据的泄漏、消失或损坏等个人数据的安全管理,运营商所采取的必要且得当的措施。然而,对于作为中小企业的数据利用方等而言,有时难以执行上述安全管理装置。因此,上述数据利用方可以考虑取代不执行安全管理措置而获取匿名加工信息。在此所述的匿名加工信息是指,基于个人数据而生成的信息,并且是为了不会确定出该个人数据所涉及的个人而对包含在个人数据中的信息进行变更或删除后生成的信息。
在第7实施方式中,中介装置3基于从信息库4a~6a获取的个人数据而生成匿名加工信息,并将生成的匿名加工信息发送给利用方装置2,这一点与第1实施方式不同。以下对第7实施方式进行详细说明。
第7实施方式的筹集系统1的硬件结构与第1实施方式相同。另一方面,第7实施方式的中介装置3所执行的处理以及发送接收的数据与第1实施方式存在部分不同。
[7-2.处理]
以下参照图41的流程图,对第7实施方式的中介装置3的控制部33取代第1实施方式的数据筹集处理(图4)而执行的数据筹集处理进行说明。此外,在图41的流程图中,S501、S503~S509、S511的处理(即,除S502以及S510以外的处理)分别与上述图4的S101、S103~S109、S111相同。因此,下文省略对这些处理的说明,而仅就作为不同点的S502以及S510进行说明。
<S502>
在S502中,元数据请求生成部332基于在S501中接收到的请求信息来生成元数据请求。在本实施方式中,元数据请求生成部332生成如图42所示的元数据请求。图42所示的元数据请求基本上与图6所示的第1实施方式的元数据请求相同,不过个人数据的利用目的的类别描述有所不同。在图42所示的元数据请求中,将个人数据的利用目的的类别描述为“创建匿名加工信息”。
<S510>
在S510中,形式处理部340使从各信息库装置4~6接收到的交付数据的数据形式统一并且对数据进行转换。然后,形式处理部340将来自各信息库装置4~6的交付数据集成为一个数据。具体而言,与第1实施方式相同,形式处理部340按照各信息库装置4~6的数据转换用字典对从各信息库装置4~6接收到的交付数据中包含的变量名和值等进行转换,由此,使从各信息库装置4~6接收到的交付数据的数据形式统一。而且,形式处理部340对交付数据所包含的变量名和值进行转换,以符合个人信息保护法规定的基准。
具体而言,形式处理部340例如按照图15所示的转换用字典,来转换从第1信息库4a接收到的如图16A所示的交付数据中包含的变量名和值。然后,形式处理部340生成如图43所示的第1信息库4a的转换后交付数据。图43所示的转换后交付数据是被实施了匿名加工处理的匿名加工信息。匿名加工处理是为了无法确定出个人数据所涉及的个人而对个人数据进行变更或删除的处理。匿名加工处理可以是例如以下处理:将个人数据的粒度加粗到无法确定出个人数据所涉及的个人的程度。
具体而言,例如在图43所示的匿名加工信息中,将能够确定个人的信息删除。作为能够确定个人的信息,可列举例如信息库对个人分配的ID(即信息库注册者ID)和姓名等。并且,如图43的ID(a3321、34acd、943dd、…)所不,以随机的方式对个人或个人数据分配ID。
此外,匿名加工信息是例如在特定的地域(例如日本)整体上进行审视时具有特色性或稀有性的信息,故而可以对能够确定个人的信息进行删除或变更。
具体而言,例如,个人数据的个人年龄(Demographic:Age)为“115岁”。该情形下,年龄为“115岁”的信息是在全日本来看较为稀有且能够确定个人的信息。因此,这样的信息在匿名加工信息中可以被删除,或者可以调整成“100岁以上”等。
此外,在匿名加工信息中,也可以对从信息库4a~6a获取到的数据集中的具有特色性或稀有性且能够确定个人的信息进行删除或变更。
例如,“未婚已婚”(Demographic:Marital)为“离婚”或“死别”这样的信息在上述数据集中属于具有特色性或稀有性且能够确定个人的信息。该情形下,当某个人的“未婚已婚”属于“离婚”或“死别”时,如图43的ID“34acd”所示,该个人的“未婚已婚”可以被变更成“离婚或死别”。
此外,例如,三个月购买杂志的金额(Aggregate:1:TotalExpense3MonthSeasonings)大于5000日元这样的信息在上述数据集中属于具有特色性或稀有性且能够确定个人的信息。该情形下,在匿名加工信息中,可以如图43的ID“09aba”的个人所示,并非记入大于5000日元的实际金额,而是将数值调整成“5000日元”这样的整数。
如上所述,中介装置3将从各信息库4a~6a接收到的交付数据转换成匿名加工信息。并且,中介装置3将各信息库4a~6a的匿名加工信息集成为一个数据,从而生成集成数据。此外,实施匿名加工处理以及数据的集成处理的顺序不限于此。例如,可以在将各信息库4a~6a的交付数据集成为一个数据后,再对集成数据实施匿名加工处理。
[7-3.效果]
根据以上详述的第7实施方式,除上述第1实施方式的效果(1a)~(1h)以外,还能够获得以下效果。
在本实施方式中,中介装置3经由通信部31从信息库装置4~6接收个人数据,并基于接收到的个人数据生成匿名加工信息。在此,匿名加工信息是基于个人数据生成的信息,并且是为了无法确定出该个人数据所涉及的个人而对个人数据所包含的信息进行变更或删除后生成的信息(即数据)。并且,中介装置3经由通信部31向利用方装置2发送生成的匿名加工信息。
因此,能够减轻难以执行安全管理装置的数据利用方用于处理个人数据的成本。此外,能够提高与个人数据管理相关的计算机安全性。
[8.第8实施方式]
[8-1.与第7实施方式的不同点]
第8实施方式的基本构成与第7实施方式相同,因此,对共同的构成省略说明,而以不同点为中心进行说明。此外,与第7实施方式相同的符号表示同一构成,对此参照上文的说明。
在上述第1实施方式中,数据利用方2a经由中介装置3从信息库4a~6a获取个人数据。在此,假定对数据利用方2a而言本不需要细粒度的个人数据的情形。例如,可以想到利用方2a在获知本公司的顾客以何种程度购买竞争商品后制定市场战略的情形。该情形下,有时即便不是本公司顾客的数据,但是如果能够获知具有与本公司顾客相似的属性的个人群体对于竞争商品的平均购入量的统计信息的话,数据利用方2a便可以充分思考战略。该情形下,不需要细粒度的个人数据。
在第8实施方式中,中介装置3基于从信息库4a~6a获取到的个人数据来生成统计信息,并将生成的统计信息发送给利用方装置2,这一点与第1实施方式不同。以下对第8实施方式进行详细说明。
第8实施方式的筹集系统1的硬件结构与第1实施方式相同。另一方面,第8实施方式的中介装置3所执行的处理以及发送接收的数据与第1实施方式存在部分不同。
[8-2.处理]
以下参照上述图41的流程图,对第8实施方式的中介装置3的控制部33取代第1实施方式的数据筹集处理(图4)而执行的数据筹集处理进行说明。此外,在图41的流程图中,S501、S503~S509、S511的处理(即,除S502以及S510以外的处理)分别与上述图4的S101、S103~S109、S111相同。因此,下文省略对这些处理的说明,而仅就作为不同点的S502以及S510进行说明。
<S502>
在S502中,元数据请求生成部332基于在S501中接收到的请求信息来生成元数据请求。在本实施方式中,元数据请求生成部332生成如图44所示的元数据请求。图44所示的元数据请求基本上与图6所示的第1实施方式的元数据请求相同,不过个人数据的利用目的的类别描述有所不同。在图41所示的元数据请求中,个人数据的利用目的的类别被描述成“创建统计信息”。
<S510>
在S510中,形式处理部340使从各信息库装置4~6接收到的交付数据的数据形式统一并且对数据进行转换。然后,形式处理部340将来自各信息库装置4~6的交付数据集成为一个数据。具体而言,与第1实施方式相同,形式处理部340按照各信息库装置4~6的数据转换用字典对从各信息库装置4~6接收到的交付数据中包含的变量名和值等进行转换,由此使从各信息库装置4~6接收到的交付数据的数据形式统一。然后,形式处理部340将变量名和值已被转换的交付数据转换成统计信息。在此所述的统计信息是指,对从信息库4a~6a获取到的涉及多个人的个人数据进行统计或加工而获得的信息。
具体而言,例如,形式处理部340按照图15所示的转换用字典对从第1信息库4a接收到的如图16A所示的交付数据所包含的变量名和值进行转换。然后,形式处理部340生成如图45所示的第1信息库4a的转换后交付数据。图45所示的转换后交付数据是已被统计信息化的交付数据。
在图45所示的统计信息中,从第1信息库4a接收到的涉及多个人的个人数据被分类成多个组(例如组ID为1~6的六个组)。例如,可以以个人数据所包含的适当的项目(例如三个月购买杂志的金额)对涉及多个人的个人数据进行映射,并且进行聚类,从而将个人数据分类成多个组。
然后,以各组的组ID为单位,使组大小和符合各种人口统计属性(性别=男性;年龄=15岁等)的个人的总数建立对应。组大小是该组包含的个人或个人数据的总数。
之后,中介装置3将分别对各信息库4a~6a生成的统计信息集成为一个数据,从而生成集成数据。
此外,在上文中通过进行聚类而生成统计信息,不过生成统计信息的方法不限于此。例如,也可以通过交叉表统计等其他统计方法来生成统计信息。
此外,例如在上文中通过将个人数据分类成多个组而生成统计信息,不过,例如也可以不将个人数据分类成多个组,而是将其归总成一个组。并且,可以针对该组生成表示符合各种人口统计属性等的个人或个人数据的总数、平均数、中位数、方差等的统计信息。
此外,例如也可以不分别对各信息库4a~6a生成统计信息,而是将从多个信息库4a~6a接收到的个人数据先全部汇总,并基于汇总成的个人数据生成统计信息。
在如上所述的第8实施方式中,并非以个人数据单位向利用方装置2发送数据,而是以组单位发送数据。
此外,在第8实施方式中,以无法从所生成的统计信息中确定出用于生成统计信息的个人数据所涉及的个人的方式来生成统计信息。即,所生成的统计信息可以是匿名加工信息。
[8-3.效果]
根据以上详述的第8实施方式,除上述第1实施方式的效果(1a)~(1h)以外,还能够获得以下效果。
在本实施方式中,中介装置3经由通信部31从信息库装置4~6接收涉及多个人的个人数据,并基于接收到的个人数据生成统计信息,该统计信息示出与个人数据的属性(即,性别、年龄等项目)有关的统计信息。然后,中介装置3经由通信部31向利用方装置2发送生成的统计信息。
因此,能够在不需要细粒度的个人数据且只要有统计信息即可的情况下向数据利用方2a提供统计信息。此外,由于利用统计信息化通常会加粗数据的粒度,因此,能够减轻难以执行安全管理装置的数据利用方用于处理个人数据的成本。此外,能够提高与个人数据管理相关的计算机安全性。
[9.第9实施方式]
[9-1.与第4实施方式的不同点]
第9实施方式的基本构成与第4实施方式相同,因此,对共同的构成省略说明,而以不同点为中心进行说明。此外,与第4实施方式相同的符号表示同一构成,对此参照上文的说明。
在上述第4实施方式中,中介装置8从多个信息库4a~6a收集同一个人的个人数据。尤其是在第4实施方式中,中介装置8向管理方装置9查询多个信息库4a~6a所保有的个人数据中是否存在同一个人的个人数据。然后,管理方装置9使用图24所示的信息库ID、信息库注册者ID以及个人ID这三个ID来确定同一个人的个人数据。并且,中介装置8从多个信息库4a~6a获取被确定为是同一个人的个人数据的多个个人数据。
而在第9实施方式中,从多个信息库4a~6a收集同一个人的个人数据,这一点与第4实施方式相同。不过,在第9实施方式中,中介装置不向管理方装置9查询。具体而言,第9实施方式与第4实施方式不同的是,中介装置在包含从多个信息库4a~6a接收到的多个个人数据的数据集中对年龄、性别等属性值组合相似的多个个人数据进行确定。然后,从多个信息库4a~6a收集属性值组合相似的多个个人数据以作为涉及同一个人的个人数据。以下对第9实施方式进行详细说明。
相较于上述第4实施方式,第9实施方式的筹集系统的硬件结构与上述第1实施方式相同。另一方面,第9实施方式的中介装置12的功能与第1实施方式存在部分不同。
具体而言,第9实施方式的中介装置12的控制部作为图46所示的各元素331~341、1231而发挥功能。
即,第9实施方式的中介装置12的控制部除作为第1实施方式的图3所示的各元素331~341发挥功能外,还作为相似度判定部1231发挥功能,这一点与第1实施方式不同。
<相似度判定部>
相似度判定部1231从自多个信息库4a~6a接收到的多个个人数据中确定出个人数据的属性值相似的多个个人数据。可以通过判断个人数据间的相似度是否达到规定阈值以上或以下来执行个人数据是否相似的判定。并且,相似度判定部1231将确定出的多个个人数据作为同一个人的个人数据并使其相互建立关联。然后,通过相似度判定部1231而相互建立了关联的多个个人数据作为同一个人的个人数据被数据发送部341发送给数据利用方2a。下文对相似度判定部1231的处理内容进行具体说明。
[9-2.处理]
接下来,参照图47的流程图对第9实施方式的中介装置12的控制部取代第1实施方式的数据筹集处理(图4)而执行的数据筹集处理进行说明。此外,在图47的流程图中,S601~S610、S612的处理(即,除S611以外的处理)分别与上述图4的S101~S111相同。因此,下文省略对这些处理的说明,而仅说明作为不同点的S611。
<S611>
在S611中,相似度判定部1231对从多个信息库4a~6a接收到的多个个人数据进行相似度判定。然后,相似度判定部1231使被判定为彼此相似的多个个人数据相互关联。相似度判定是对多个个人数据是否相似做出的判断。具体而言,相似度判定部1231以如下方式来确定属性值相似的多个个人数据。
即,作为通过形式处理部340使数据形式统一的结果,获得了图48以及图49所示的数据集。
图48示出将从第1信息库4a获得的个人数据的变量和值转换成共同的形式后的数据集。图49示出将从第2信息库5a获得的个人数据的变量和值转换成共同的形式后的数据集。在图48以及图49的示例中,假设分别从第1信息库4a以及第2信息库5a各获取了20个个人数据(ID为1~20的个人数据)。
在图48以及图49所示的数据集中,各ID对应有个人数据的各属性值。在图48以及图49中,值“1”表示符合该属性,值“0”表示不符合该属性。例如,在图48所示的数据集中,ID=1的个人数据为“D:Gender:1”=1、且“D:Age:20-34”=1则表示:ID=1的个人数据所涉及的个人为男性且年龄为20岁-34岁。
此外,在上述第1实施方式中,作为共同的数据形式的标准值包含如图14所示的“男性”、“女性”等文本,不过,在本实施方式中,为了便于之后进计算,而将标准值设定成“0”、“1”等数值。
在此重要的是,通过形式处理部340(即S610的处理)将从不同信息库4a、5a接收到的数据集的变量、值的意思转换成共同的形式,从而达成了一致。值的意思是指,例如“D:Gender:1”表示男性等。由此,能够对从可处理的数据形式不同的多个信息库4a~6a获取到的个人数据间的相似度进行计算。
具体而言,例如在图48以及图49所示的数据集中,可以将各ID的个人数据当作以各属性值为分量的向量。例如,在图48中,可将ID=1的个人数据当作以“D:Gender:1”、“D:Gender:2”、“D:Age:0-19”、“D:Age:20-34”等属性值作为分量的向量(1,0,0,1,…)。并且,可以通过计算向量间的相似度或距离,来计算个人数据彼此的相似度。此外,就向量间的相似度与距离之间的关系而言,相似度越高,距离越小;相似度越低,距离越大。
并且,通过计算图48所示的从第1信息库4a接收到的ID=1~20的个人数据与图49所示的从第2信息库5a接收到的ID=1~20的个人数据之间的相似度,而获得图50所示的相似度矩阵。
在图50所示的相似度矩阵中,行标“1 ID”表示第1信息库4a的ID,列标“2 I D”表示第2信息库5a的ID。即,1 ID=i且2ID=j的分量表示:第1信息库4a的ID=i的个人数据和第2信息库5a的ID=j的个人数据之间的相似度。
此外,在图50的示例中,将两个个人数据(即两个向量)的相似度计算为余弦相似度,不过,两个个人数据的相似度的计算方法不限于此。例如,也可以使用欧氏距离或马氏距离等其他距离或相似度来计算两个个人数据的相似度。此外,在图50所示的相似度矩阵中,余弦相似度未被标准化到0~1的范围内。
然后,相似度判定部1231将相似度矩阵中的相似度达到规定阈值(以下称为相似度阈值)以上的两个个人数据作为同一人物的个人数据而使其彼此关联。
例如,在图50的示例中,在将相似度为5以上的两个个人数据确定为同一人物的个人数据的情况下,以下三个组合形成为同一人物的个人数据的组合。
·第1信息库4a的ID=2的个人数据(1 ID=2)和第2信息库5a的ID=10的个人数据(2 ID=10)
·第1信息库4a的ID=12的个人数据(1 ID=12)和第2信息库5a的ID=12(2 ID=12)或13(2 ID=13)的个人数据
·第1信息库4a的ID=18(1 ID=18)的个人数据和第2信息库5a的ID=7(2 ID=7)的个人数据
其中,存在上述第二组合所示的一个个人数据与多个个人数据关联的情形。该情形下可以考虑例如以下(1)~(3)的处理。
(1)在多个个人数据与一个个人数据关联的情况下,排除包含所述一个个人数据的组合。即,仅在一个个人数据与一个个人数据相关联的情况下将这两个个人数据确定为同一个人的个人数据。
(2)在多个个人数据与一个个人数据关联且所述多个个人数据各自与所述一个个人数据的相似度互不相同的情况下,优选考虑所述多个个人数据中的与所述一个个人数据的相似度高的个人数据。并且,将所述多个个人数据中的被优先考虑的个人数据与所述一个个人数据确定为同一个人的个人数据。
(3)在一个个人数据关联有多个个人数据且所述多个个人数据各自与所述一个个人数据的相似度互相的情况下,当所述多个个人数据中存在相似度比所述一个个人数据高的个人数据时,在相似度更高的个人数据间建立关联。例如,假设就在上述示例中的第2信息库5a的ID=12的个人数据而言,当存在比第1信息库4a的ID=12的个人数据相似度高的其他个人数据时,使该其他的个人数据与第2信息库5a的ID=12的个人数据建立关联等。
此外,可以同时采用上述(1)~(3)中的至少两者。由此,相似度判定部1231在从多个信息库4a~6a接收到的多个个人数据中确定出个人数据的属性值相似的多个个人数据。
并且,在接下来的S612的处理中,通过相似度判定部1231建立了关联的多个个人数据作为同一个人的个人数据被数据发送部341发送给数据利用方2a。
[9-3.效果]
根据以上详述的第9实施方式,除上述第4实施方式的效果(4a)外,还能够获得以下效果。
(9a)在本实施方式中,中介装置12基于示出相似度的相似度矩阵来确定交付数据,其中,相似度是从多个信息库4a~6a获取到的多个个人数据间的相似度并且是基于个人数据的属性值的相似度。尤其是,中介装置12作为重复确认信息而获取相似度矩阵。
具体而言,中介装置12从多个信息库4a~6a获取多个个人数据,并基于个人数据的属性值对获取到的多个个人数据的相似度进行判定(S611)。然后,中介装置12使通过相似度判定而判定为彼此相似的多个个人数据相互建立关联(S611)。并且,中介装置12将基于已建立了关联的多个个人数据而确定的交付数据发送给利用方装置2。
因此,通过将相互建立关联的多个个人数据看作同一个人的个人数据,而能够从多个信息库4a~6a收集涉及同一个人的个人数据。
此外,根据本实施方式,即使在不存在如第4实施方式的注册管理方9a的时期,也就是在比注册管理方9a出现的时期更早的时期,也能够从多个信息库4a~6a收集涉及同一个人的个人数据。
(9b)此外,在第1信息库4a所管理的个人数据的项目与第2信息库5a所管理的个人数据的项目不同的情况下,可能会产生尽可能更多获取将双方的项目补全后的个人数据的采样数的需要。如第4实施方式所述,使用信息库ID、信息库注册者ID以及个人ID这三个ID来进行收集时,仅使真正涉及同一个人的多个个人数据建立关联。因此,存在无法大量地获取上述采样数的情况。关于这一点,根据本实施方式,通过放宽使个人数据建立关联时的相似度阈值,而能够允许个人数据的多对多的关联。从而能够增加上述采样数。
此外,在本实施方式中,图50所示的相似度矩阵相当于相似度信息以及重复确认信息,S601相当于作为请求获取部的处理,S611相当于作为重复确认获取部的处理,S611以及S612相当于作为确定部的处理,S609以及S612相当于作为获取发送部的处理。
[10.其他实施方式]
以上对用于实施本公开的实施方式进行了说明,不过,本公开不限于上述实施方式,能够进行各种变形而加以实施。
(1)在上述各实施方式中,中介装置从多个信息库装置4~6筹集个人数据,不过,供中介装置筹集个人数据的信息库装置的数量不限于此。例如,在上述第1~第2实施方式中,中介装置可以不从多个信息库装置筹集个人数据,而仅从一个信息库装置筹集个人数据。
(2)在上述各实施方式中,作为个人数据管理方例示了信息库,不过,个人数据管理方不限于此。例如,个人数据管理方也可以是如通信运营商或信用卡公司等虽拥有大量顾客数据却并非专营信息库的运营商。这样,个人数据管理方可以是从事既对由个人寄存的个人数据进行管理又向第三方提供该个人数据的行业的个人数据运营商。
(3)在上述各实施方式中,中介装置将从多个信息库装置4~6接收到的交付数据的数据形式调整成共同的数据形式,并集成为一个数据后交付给数据利用方2a,不过,交付的方法不限于此。例如,中介装置也可以不将从多个信息库装置4~6接收到的交付数据调整成共同的数据形式。此外,中介装置也可以不将来自多个信息库装置4~6的交付数据集成为一个交付数据。
(4)上述各实施方式中的筹集方案的确定逻辑仅为一例,也可以以其他确定逻辑来确定筹集方案。例如,在上述各实施方式中,将在数据利用方2a的预算额范围内原始数据分布的再现性最高的方案确定为筹集方案。不过,例如对于即使些许超出(即超出规定金额)预算额但是原始数据分布的再现性却为最高的方案而言,也可以将该方案确定为筹集方案。即,在基于预算额和原始数据分布的再现性来确定筹集方案的情况下,可以以与预算额相比更重视再现性的方式来确定筹集方案。另一方面,也可以以上述各实施方式所述的与再现性相比更重视预算额的方式来确定筹集方案。
此外,例如在信息库等个人数据管理方为了扩充个人数据而针对个人实施问卷调查的情况下,未回答该问卷的个人的个人数据成为缺失数据。在这样个人数据管理方所管理的个人数据包含有缺失数据的情况下,可以以使得缺失数据达到最少的方式来确定筹集方案。
此外,例如也可以以使得被筹集的个人数据的“新鲜度”达到最佳的方式来确定筹集方案。具体而言,中介装置可以从个人数据管理方或自身的存储部等获取个人数据的最终更新日期时间的信息,并基于获取到的最终更新日期时间的信息来确定筹集方案。该情形下,例如中介装置可以以如下方式等来确定筹集方案,即,从最终更新日期时间最新的个人数据起依次将个人数据指定为被筹集的个人数据。
此外,在从某个信息库接收到的元数据所包含的数据价格极低或极高的情况下,换言之,在数据价格为规定阈值以下或规定阈值以上的情况下,该数据价格或该信息库本身比较可疑。该情况下,中介装置可以以避开该极低或极高的数据而筹集个人数据的方式来确定筹集方案。此外,中介装置也可以以避开出示极低或极高的数据价格的信息库而(即,从除该信息库以外的信息库)筹集个人数据的方式来确定筹集方案。
此外,例如中介装置也可以确定以下筹集方案:参考除价格以外的要素,从符合同一个对象条件的多个个人数据中筹集并非最低价格的个人数据。
具体而言,作为除价格以外的要素,中介装置例如可以参考个人数据所包含的属性中的并非由对象条件指定的属性(以下称为非指定属性)与数据利用方2a对个人数据的利用目的等(进而请求信息)之间的拟合度,来确定待筹集的个人数据。
例如,中介装置从利用方装置2接收到包含以下对象条件的请求信息:性别为男性且年龄层为20几岁。并且,中介装置从各信息库4a~6a接收符合上述对象条件的个人数据所涉及的元数据。此时,从请求信息中包含的利用组织的信息判定出数据利用方2a为与餐饮相关的行业(例如食品制造)。而且,作为除性别、年龄层以外的属性(即非指定属性),第1信息库4a所保有的个人数据包含有与餐饮相关的属性(餐食记录等)。另一方面,作为非指定属性,第2信息库5a所保有的个人数据不包含与餐饮相关的属性。该情形下,中介装置可以判断第1信息库4a的个人数据与数据利用方2a的利用组织或利用目的等之间的拟合度较高,即使第1信息库4a的数据的价格高于第2信息库5a的数据,中介装置也可以确定筹集第1信息库4a的数据的筹集方案。
此外,例如在数据利用方的行业与在信息库4a~6a寄存有数据的个人的行业相同的情况下,中介装置可以使数据利用方无法获取到该个人的数据。换言之,中介装置可以排除该个人的个人数据来确定筹集方案。即,中介装置可以基于数据利用方与在信息库4a~6a寄存有数据的个人之间的关系性来确定筹集方案。此外,还可以参考除价格以外的其他要素来确定筹集方案。
此外,例如中介装置也可以从数据利用方2a获取与用于确定筹集方案的条件(换言之,筹集方案的确定逻辑)相关的要求,并基于获取的要求来确定筹集方案。
此外,中介装置也可以不从多个方案中选择适合于数据利用方2a的筹集方案,而是直接输出适合于数据利用方2a的一个筹集方案。
(5)图5例示的请求信息的具体示例和图6、图7例示的元数据请求的具体示例等仅为其中一例,请求信息等可以仅包含图5等所示的项目的一部分,也可以包含图5等中未例示的其他项目。
(6)来自某个信息库的元数据可以是显示该信息库所保有的所有个人数据的属性的信息,还可以是仅显示一部分个人数据的属性的信息。此外,元数据不限于显示个人数据的一部分属性的数据,也可以是显示个人数据的所有属性的数据。
(7)在上述第2实施方式中,存储部72中储存有元数据集,不过,存储部72中储存的数据不限于此。例如,存储部72中也可以储存表示各信息库装置4~6的特征的信息即信息库特征信息。具体而言,信息库特征信息例如是:第1信息库4a管理大量的20几岁~40几岁的女性的个人数据;第2信息库5a管理大量的有家庭的用户的个人数据;第3信息库3a管理大量的60岁以上的老年层用户的个人数据等。该情形下,例如当中介装置从利用方装置2接收到需要有家庭的用户的个人数据的请求信息时,可以向大量管理有家庭的用户的个人数据的第2信息库5a发送元数据请求以及/或数据请求。并且,中介装置可以确定从第2信息库5a筹集个人数据的筹集方案。此外也可以与之相反,即,当中介装置从利用方装置2接收到需要有家庭的用户的个人数据的请求信息时,可以以避开不太管理有家庭的用户的个人数据的信息库的方式来发送元数据请求以及/或数据请求。
即,中介装置可以基于信息库特征信息,向判断为具有符合请求信息所包含的对象条件的特征的信息库(乃至个人数据管理方)发送元数据请求以及/或数据请求。此外,中介装置也可以基于信息库特征信息,不向判断为不具有符合请求信息所包含的对象条件的特征的信息库(乃至个人数据管理方)发送元数据请求以及/或数据请求。
此外,中介装置也可以不从自身的存储部72获取信息库特征信息,而是向各信息库4a~6a进行查询,由此来从各信息库4a~6a获取信息库特征信息。
此外,信息库特征信息相当于管理者特征信息的一例,管理者特征信息是表示各个人数据管理方的特征的信息。此外,管理者特征信息是属性信息的一例,属性信息是示出个人数据管理方所管理的个人数据的属性的信息。
(8)更新处理部732、932所执行的更新处理的内容不限于上述第2以及第5实施方式的更新处理的内容。
例如,在上述第2实施方式中,更新处理部732可以基于从信息库4a~6a筹集到的个人数据来更新在存储部72储存的元数据集。具体而言,例如就从信息库4a~6a筹集到的个人数据(即购入的个人数据)而言,可以获知该个人数据的属性(即数据的内容)。更新处理部732可以基于筹集到的个人数据的内容,对基于作为供应方的信息库4a~6a所保有的个人数据的属性而形成的分布进行更新等,从而对储存在存储部72中的元数据集进行更新。
同样,在上述第5实施方式中,更新处理部932可以基于从信息库4a~6a筹集到的个人数据来更新储存在存储部112的重复状况表。具体而言,例如中介装置从多个信息库4a~6a筹集(即购入)符合对象条件的个人数据。此时,中介装置对购入的多个个人数据的属性(即数据内容)进行相互比较,并且根据数据内容的相似度等来判断购入的多个个人数据是否为涉及同一个人的个人数据。并且,中介装置可以对判断为是涉及同一个人的个人数据的多个个人数据设定同一个人ID,并将数据新添加到图35所示的重复状况表中。
(9)在上述第5实施方式中,中介装置不对管理方装置9进行重复确认而是基于储存在存储部112的重复状况表进行重复确认,不过,也可以在如下情形下对管理方装置9进行重复确认。
即,中介装置利用储存在存储部112的重复状况表,对由ID接收部833接收到的ID结果信息所包含的各信息库注册者ID进行重复状况确认。此时,会出现存在以下信息库注册者的情形,即:在储存于存储部112的重复状况表中无法确认到重复状况的信息库注册者,例如重复状况表中不存在相符的信息库注册者ID等。该情形下,中介装置可以仅就重复状况不明的信息库注册者ID向管理方装置9查询重复状况。并且基于从管理方装置9接收到的重复结果信息对重复状况不明的信息库注册者ID的数据进行登记等,以更新重复状况表。
(10)在上述第3~第5实施方式中,中介装置通过向管理方装置9查询ID结果信息所包含的信息库注册者ID,或者通过参照储存在存储部112的重复状况表,对所述ID进行重复确认。然后,中介装置基于重复确认的结果而向各信息库4a~6a发送元数据请求。不过,进行重复确认的时机不限于此。
例如,在第3实施方式中,中介装置也可以不向各信息库4a~6a发送ID请求,而向各信息库4a~6a发送元数据请求。在此,中介装置以允许同一个人的数据重复的形式从各信息库4a~6a接收元数据。
此时,中介装置从各信息库4a~6a接收元数据、以及涉及以下个人的信息库注册者ID的列表,其中,该个人的数据被包含在元数据中。
并且,中介装置就接收到的信息库注册者ID的列表向管理方装置9进行重复确认请求。如上所述,可以在接收到元数据后进行重复确认。
(11)在上述第3~第6实施方式中,中介装置接收如图28所示的ID结果信息,该ID结果信息包含信息库注册者ID和价格的组合的列表,不过,ID结果信息不限于此。例如,注册管理方9a的管理方装置9也可以保有如图35所示的包含价格信息的重复状况表。该情形下,可以保有如图35所示的包含价格信息的重复状况表。该情形下,图28所示的ID结果信息可以仅包含信息库注册者ID的列表。此外,图30所示的重复结果信息可以包含如({ID,价格},(ID,价格},{ID,价格}…)形式的有关各信息库4a~6a的信息库注册者ID和价格的组合的列表。并且,例如中介装置可以基于接收到的列表,将除最低价格以外的ID指定为元数据中的排除ID。
(12)在上述第3~第6实施方式中,作为注册识别信息,例示了用于识别在信息库4a~6a寄存有个人数据的个人的信息即信息库注册者ID,不过,注册识别信息不限于此。注册识别信息也可以是例如各信息库4a~6a对寄存在该信息库4a~6a的个人数据分配的识别信息。
(13)在上述第6实施方式中,作为通知信息例示了广告信息,不过,通知信息不限于此。例如,通知信息也可以是向个人推荐商品或服务的推荐信息等。
(14)在上述第6实施方式中,假设广告信息的发送目标方信息包含在从信息库4a~6a获取到的个人数据中。不过,例如在发送目标方信息未包含在从信息库4a~6a获取到的个人数据中的情况下等,可以以如下方式进行广告分发。
即,利用方装置2等广告分发装置经由中介装置间接地或不经由中介装置直接地向信息库4a~6a发送针对不同传送对象者的广告信息等通知信息。并且,信息库4a~6a可以针对寄存有个人数据的个人来发送从广告分发装置接收到的通知信息。即,利用方装置2等广告分发装置可以通过信息库4a~6a向寄存有个人数据的个人进行广告分发。
在该情形下,信息库4a~6a可以利用本身具有的与寄存有个人数据的个人之间的某些接点来进行广告分发。
具体而言,例如信息库4a~6a的信息库装置4~6可以通过电子邮件向寄存有个人数据的个人的信息处理终端11~17发送通知信息,也可以向个人所浏览的互联网的网站输出通知信息。此外,例如信息库装置4~6可以在安装于个人的信息处理终端11~17的应用程序软件内输出通知信息,也可以向设置于个人所光临的店面等区域的终端输出通知信息,还可以以其他各种方法向个人发送通知信息。
根据上述构成,即使数据利用方2a等获取到的个人数据不包含发送目标方信息,数据利用方2a等也能够针对个人进行广告分发。
(15)在上述第6实施方式中,由利用方装置2进行广告分发,不过,进行广告分发的主体不限于此。例如,也可以例如由广告代理店等广告分发运营商或进行广告分发的平台运营商等不同于数据利用方2a的一方所保有的装置来进行广告分发,还可以由中介装置进行广告分发。该情形下,广告分发运营商或平台运营商所保有的装置、或中介装置等可以进行图40所示的广告分发处理。
(16)此外,例如上述[7.其他实施方式]的(14)所述,在中介装置等经由信息库4a~6a向在信息库4a~6a中寄存有个人数据的个人进行广告分发的情况下等,中介装置等可以对广告成果指标进行计算。在此所述的广告成果指标是示出与广告分发相关的成果的指标。
具体而言,例如中介装置可以利用从注册管理方9a的管理方装置9获取到的重复结果信息来计算作为广告成果指标的单独用户数。单独用户数是被分发了广告的用户的数量。
即,当各信息库4a~6a针对在该信息库4a~6a寄存有数据的个人进行广告分发时,存在从多个信息库4a~6a向在多个信息库4a~6a寄存有个人数据的个人发送同一个广告信息的情况。即使在该情况下,如果利用重复结果信息,便可获知向哪个个人重复传送了广告信息,由此能够计算出单独用户数。此外,中介装置也可以利用重复结果信息来计算除单独用户数以外的广告成果指标。
此外,例如中介装置等可以在经由信息库4a~6a进行广告分发的情况下等基于重复结果信息来进行广告分发。具体而言,例如中介装置等将排除ID连同传送内容一起发送给多个信息库装置4~6中的除一个信息库装置以外的信息库装置,以不会从多个信息库4a~6a向同一人物重复发送同一个广告信息。在此,信息库装置4~6不向由接收到的排除ID指定的信息库注册者ID所涉及的个人进行广告分发。由此,除所述一个信息库装置以外的信息库装置可以不进行广告分发。当然,也可以通过其他使用重复结果信息的方法来进行广告分发,以不会向同一人物重复发送同一个广告信息。
(17)在上述第9实施方式中,将相似度阈值设定成定值,不过,相似度阈值不限于此,也可以使相似度阈值发生变动。该情形下,例如相似度阈值可以以如下方式发生变动。
即,如图51所示,若使相似度阈值t连续变化,则关联成功数会产生变化。关联成功数是被判断为彼此相似并且相互建立关联的个人数据的组合的数量。
如图51所示,相似度阈值t越大,关联成功数越减少。因此,如果将相似度阈值t设定得过大,则有可能导致本来应被当作是同一个人的个人数据的组合却未被当作同一个人的个人数据组合处理,从而出现了遗漏。此外,若与之相反将相似度阈值t设定得过小,则有可能产生大量的并非来源于同一个人的个人数据的组合。因此,希望既不会将相似度阈值t设定得过大,也不会将相似度阈值t设定得过小。
在上述想法下,例如可以考虑在如图51所示使相似度阈值t连续变化时,采用关联成功数的变化达到最大时的相似度阈值t的值tMAX作为最优阈值。换言之,tMAX是当将关联成功数n看作相似度阈值t的函数n=f(t)时,函数n=f(t)的切线斜率达到最小时的相似度阈值t的值。
此外,在tMAX的值较小的情况下等,若将相似度阈值t设定成tMAX并进行个人数据的关联,则会出现产生大量的并非来源于同一个人的个人数据彼此的组合的情况。该情形下,可以使用处在tMAX以下的、关联成功数的变化较大时的相似度阈值t的值,换言之,可以采用函数n=f(t)的切线斜率为第二最小斜度时的相似度阈值t的值t2MAX作为最优阈值。当然,也可以使用切线的斜度为第三、第四、…最小斜度时的相似度阈值t的值作为最优阈值t。
此外,可以由用户进行设定,以将相似度阈值t设定成tMAX、t2MAX、…等中的任意一个值,还可以由系统自动进行设定。
此外,例如也可以以如下方式来判定多个个人数据彼此是否相似。即,分别针对个人数据的年龄和性别等属性(换言之,个人数据的数据项目)计算个人数据彼此的相似度。然后,当判定为全部或一部分属性的相似度达到阈值以上时,则可以判定为多个个人数据彼此相似。
此外,例如下文具体所述,具有与个人数据的数据项目相对应的坐标轴,并且在将每个个人数据表现为点和向量等的坐标空间中设定新的坐标轴。然后,当所设定的各坐标轴的相似度达到阈值以上时,则可以判定多个个人数据彼此相似,进而可以判定为是涉及同一个人的个人数据。而且例如可以以与上述同样的方式使相似度阈值产生变动,并求算最优的相似度阈值。具体而言,可以求算如下所述的相似度阈值。
即,如图52所示,首先将从信息库4a~6a获取到的个人数据的数据集绘制到坐标空间。图52中的各数据点表示个人数据。此外,图52的坐标空间的各坐标轴与个人数据的各属性(即各数据项目)相对应。例如,就与“性别=男性”这一数据项目对应的坐标轴而言,每个个人数据根据是否属于男性而取值0或1。此外,就与“三个月购买杂志的金额”这一数据项目对应的坐标轴而言,各个人数据的取值为相应的购入金额。
并且,通过对所述数据集进行主成分分析或流形学习,而形成更好地描述数据集的新坐标轴。在图52中,x1坐标轴以及x2坐标轴是新坐标轴。
并且,对每一个新坐标轴设定相似度阈值t=(t1,t2,…)。在此所述的相似度阈值t可以是例如与两个个人数据的各分量的属性值之差有关的阈值。具体而言,例如,某个人数据A在所述新坐标轴中由坐标xA=(x1A,x2A,…)来表现。另一个个人数据B在新坐标轴中由坐标xB=(x1B,x2B,…)来表现。该情形下,当以下所示的各分量之差的绝对值小于或等于相似度阈值时,可以判定为两个个人数据A、B彼此相似。
Δx1=|x1A-x1B|≤t1且Δx2=|x2A-X2B|≤t2…
而且,如图53所示,当使相似度阈值t=(t1,t2,…)的各分量ti连续变化时,可以采用关联成功数n的变化达到最大时的相似度阈值tMAX=(tMAX1,tMAX2,…)等作为最优阈值。
通过如上所述使相似度阈值t动态变化,而能够对每一个个人数据的数据集设定最优相似度阈值t。进而减少遗漏应被当作同一个人的个人数据的组合的个人数据的组合的可能性,或产生大量的并非来源于同一个人的个人数据彼此的组合的可能性。
此外,上述进行主成分分析或流形学习以设定新坐标轴并非是必须的。不过,通过设定新坐标轴而通常能够将各个人数据表现为较少维度的坐标。因此,能够减少计算机处理中的计算量,进而能够使处理高速化。
(18)在上述各实施方式中,中介装置直接向利用方装置2发送基于从信息库4a~6a获取到的个人数据的交付数据。不过,向数据利用方2a发送交付数据的方法不限于此。例如,中介装置暂且先将交付数据发送给与中介装置以及利用方装置均不同的另一个装置。然后,可以经由该另一个装置将交付数据发送给利用方装置2。这样经由另一个装置从中介装置向利用方装置2发送交付数据的情形也包含在本申请所述的“中介装置向利用方装置2发送交付数据”的范围。
(19)除上述中介装置之外,还可以以该中介装置为构成元素的系统、用于使计算机作为该中介装置发挥功能的程序、储存有该程序的半导体存储器等非转移实体记录介质、筹集个人数据的方法等各种方式来实现本公开。
(20)可以由多个构成元素实现上述各实施方式中的一个构成元素所具有的多个功能,或者可以由多个构成元素实现一个构成元素所具有的一个功能。此外,可以由一个构成元素实现多个构成元素所具有的多个功能,或者可以由一个构成元素实现通过多个构成元素实现的一个功能。此外,可以省略上述各实施方式的构成的一部分。还可以将上述各实施方式的构成的至少一部分添加到上述其他各实施方式的构成中,或置换成上述其他各实施方式的构成。并且,由权利要求记载的语句确定的技术思想所包含的所有方式均为本公开的实施方式。
Claims (12)
1.一种中介装置,其特征在于,具备:
请求获取部,所述请求获取部构成为获取请求信息,所述请求信息包含数据利用方所需要的个人数据的条件即对象条件;
重复确认获取部,所述重复确认获取部构成为获取重复确认信息,所述重复确认信息是显示由第1个人数据管理方管理的第1个人数据和由第2个人数据管理方管理的第2个人数据是涉及同一个人的个人数据的信息,其中,所述第2个人数据管理方是与所述第1个人数据管理方不同的个人数据管理方;
确定部,所述确定部构成为基于所述重复确认信息来确定筹集方案以及/或者交付数据,所述筹集方案示出与从包括所述第1个人数据管理方以及所述第2个人数据管理方在内的多个个人数据管理方筹集的个人数据相关的条件,所述交付数据是基于从所述多个个人数据管理方筹集到的个人数据而生成的数据,并且是发送给所述数据利用方所保有的利用方装置的数据;以及
获取发送部,所述获取发送部构成为,按照由所述确定部确定的所述筹集方案获取个人数据,以及/或者向所述利用方装置发送由所述确定部确定的交付数据。
2.根据权利要求1所述的中介装置,其特征在于,
所述确定部基于所述重复确认信息来确定所述筹集方案。
3.根据权利要求2所述的中介装置,其特征在于,
所述确定部确定以下所述筹集方案,即,筹集通过所述重复确认信息显示为是涉及同一个人的个人数据的所述第1个人数据和所述第2个人数据中的任意一方。
4.根据权利要求3所述的中介装置,其特征在于,
所述确定部确定以下所述筹集方案,即,筹集所述第1个人数据和所述第2个人数据中的价格便宜的一方。
5.根据权利要求1~4中任一项所述的中介装置,其特征在于,
所述确定部确定以下所述筹集方案,即,对通过所述重复确认信息显示为是涉及同一个人的个人数据的所述第1个人数据和所述第2个人数据双方进行筹集。
6.根据权利要求1~5中任一项所述的中介装置,其特征在于,
所述重复确认获取部从管理所述重复确认信息或能够生成所述重复确认信息的外部装置获取所述重复确认信息。
7.根据权利要求1~6中任一项所述的中介装置,其特征在于,
还具备存储部,所述存储部构成为储存所述重复确认信息,
所述重复确认获取部从所述存储部获取所述重复确认信息。
8.根据权利要求1~7中任一项所述的中介装置,其特征在于,
所述多个个人数据管理方各自对在该个人数据管理方寄存有个人数据的个人或者该个人的个人数据分配规定的识别信息即注册识别信息,
所述重复确认信息是以下信息:示出所述第1个人数据管理方和所述第2个人数据管理方中涉及同一个人的所述注册识别信息。
9.根据权利要求1~7中任一项所述的中介装置,其特征在于,
所述重复确认获取部获取相似度信息作为所述重复确认信息,所述相似度信息表示从所述多个信息库获取到的多个个人数据之间的相似度。
10.根据权利要求1~9中任一项所述的中介装置,其特征在于,
所述个人数据管理方是信息库。
11.一种系统,其特征在于,
具备权利要求1~10中任一项所述的中介装置,并且所述系统还具备:
通知信息获取部,所述通知信息获取部构成为获取与通过所述获取发送部获取到的个人数据相对应的通知信息,所述通知信息是通知给在所述个人数据管理方寄存有个人数据的个人的信息;以及
通知信息发送部,所述通知信息发送部构成为发送由所述通知信息获取部获取到的通知信息。
12.一种计算机程序,该计算机程序使计算机发挥作为中介装置的功能,所述计算机程序的特征在于,
所述中介装置具备:
请求获取部,所述请求获取部构成为获取请求信息,所述请求信息包含数据利用方所需要的个人数据的条件即对象条件;
重复确认获取部,所述重复确认获取部构成为获取重复确认信息,所述重复确认信息是显示由第1个人数据管理方管理的第1个人数据和由第2个人数据管理方管理的第2个人数据是涉及同一个人的个人数据的信息,其中,所述第2个人数据管理方是与所述第1个人数据管理方不同的个人数据管理方;
确定部,所述确定部构成为基于所述重复确认信息来确定筹集方案以及/或者交付数据,所述筹集方案示出与从包括所述第1个人数据管理方以及所述第2个人数据管理方在内的多个个人数据管理方筹集的个人数据相关的条件,所述交付数据是基于从所述多个个人数据管理方筹集到的个人数据而生成的数据,并且是发送给所述数据利用方所保有的利用方装置的数据;以及
获取发送部,所述获取发送部构成为,按照由所述确定部确定的所述筹集方案获取个人数据,以及/或者向所述利用方装置发送由所述确定部确定的交付数据。
Applications Claiming Priority (7)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019043674A JP6592213B1 (ja) | 2019-03-11 | 2019-03-11 | 仲介装置及びコンピュータプログラム |
JP2019-043674 | 2019-03-11 | ||
JP2019-188985 | 2019-10-15 | ||
JP2019-188986 | 2019-10-15 | ||
JP2019188985 | 2019-10-15 | ||
JP2019188986 | 2019-10-15 | ||
PCT/JP2020/010379 WO2020184580A1 (ja) | 2019-03-11 | 2020-03-10 | 仲介装置、システム及びコンピュータプログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113544726A true CN113544726A (zh) | 2021-10-22 |
Family
ID=72426588
Family Applications (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202080020197.9A Pending CN113544726A (zh) | 2019-03-11 | 2020-03-10 | 中介装置、系统以及计算机程序 |
CN202080020277.4A Active CN113557545B (zh) | 2019-03-11 | 2020-03-10 | 中介装置、系统以及计算机程序 |
Family Applications After (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202080020277.4A Active CN113557545B (zh) | 2019-03-11 | 2020-03-10 | 中介装置、系统以及计算机程序 |
Country Status (2)
Country | Link |
---|---|
CN (2) | CN113544726A (zh) |
WO (2) | WO2020184579A1 (zh) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPWO2022255386A1 (zh) * | 2021-06-03 | 2022-12-08 | ||
JP2023019795A (ja) * | 2021-07-29 | 2023-02-09 | 株式会社日立製作所 | データ流通仲介装置およびデータ流通仲介方法 |
Citations (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20060169768A1 (en) * | 1998-05-29 | 2006-08-03 | E-Micro Corporation | System for associating identification and personal data for multiple magnetic stripe cards or other sources to facilitate a transaction and related methods |
CN101118557A (zh) * | 2007-09-17 | 2008-02-06 | 腾讯科技(深圳)有限公司 | 网络信息搜索方法及搜索系统 |
CN101477547A (zh) * | 2009-01-20 | 2009-07-08 | 中国测绘科学研究院 | 一种基于规则的空间数据整合方法 |
US20090281954A1 (en) * | 2001-12-05 | 2009-11-12 | Henri Waelbroeck | Method for managing distributed trading data |
JP2011086039A (ja) * | 2009-10-14 | 2011-04-28 | Seiko Epson Corp | 情報処理装置、情報処理装置の制御方法およびプログラム |
JP2011257854A (ja) * | 2010-06-07 | 2011-12-22 | Hitachi Ltd | 医療情報管理システム、医療情報管理方法、および医療情報管理プログラム |
JP2014002480A (ja) * | 2012-06-15 | 2014-01-09 | Japan Research Institute Ltd | カード情報処理システム、カード情報処理装置、カード情報処理方法、およびプログラム |
CN104504138A (zh) * | 2014-12-31 | 2015-04-08 | 广州索答信息科技有限公司 | 一种基于人的信息聚合方法和装置 |
JP2016091067A (ja) * | 2014-10-29 | 2016-05-23 | ソフトバンク株式会社 | 個人情報流通方法、個人情報流通システム及び個人情報流通事業者装置 |
CN106547646A (zh) * | 2015-09-23 | 2017-03-29 | 阿里巴巴集团控股有限公司 | 一种数据备份及恢复方法、数据备份及恢复装置 |
CN106687956A (zh) * | 2014-08-08 | 2017-05-17 | 株式会社博报堂Dy控股集团 | 信息处理系统 |
CN106878269A (zh) * | 2016-12-30 | 2017-06-20 | 广州中致易和网络科技有限公司 | 一种网络认证平台 |
CN107066457A (zh) * | 2016-08-23 | 2017-08-18 | 平安科技(深圳)有限公司 | 用户信息视图构建方法和系统 |
CN107909493A (zh) * | 2017-12-04 | 2018-04-13 | 泰康保险集团股份有限公司 | 保单信息处理方法、装置、计算机设备和存储介质 |
CN108074116A (zh) * | 2016-11-09 | 2018-05-25 | 阿里巴巴集团控股有限公司 | 信息提供方法及装置 |
CN108415989A (zh) * | 2018-02-12 | 2018-08-17 | 苏州朗动网络科技有限公司 | 身份信息识别方法、装置、计算机设备和存储介质 |
CN109189813A (zh) * | 2018-08-22 | 2019-01-11 | 中国建设银行股份有限公司 | 一种数据共享方法及装置 |
US20190228180A1 (en) * | 2018-01-22 | 2019-07-25 | Fujitsu Limited | Apparatus, method, and system for providing informati0n and storage medium |
Family Cites Families (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100922770B1 (ko) * | 2001-07-03 | 2009-10-21 | 파나소닉 주식회사 | 정보이용료 과금방법 및 정보이용료 과금 유저단말 |
JP2005115843A (ja) * | 2003-10-10 | 2005-04-28 | Ibm Japan Ltd | サービス提供システム、サーバ、端末装置及びサービス提供方法 |
JP2009193448A (ja) * | 2008-02-15 | 2009-08-27 | Oki Electric Ind Co Ltd | 対話システム、方法及びプログラム |
WO2009111733A2 (en) * | 2008-03-07 | 2009-09-11 | Blue Kai, Inc. | Exchange for tagged user information with scarcity control |
US20140229349A1 (en) * | 2013-02-08 | 2014-08-14 | Kostadin Dimitrov Yanev | Facilitating a personal data market |
CN103488746B (zh) * | 2013-09-22 | 2017-04-26 | 成都锐理开创信息技术有限公司 | 一种获取业务信息的方法及装置 |
JP5894975B2 (ja) * | 2013-11-26 | 2016-03-30 | ヤフー株式会社 | 情報取引装置、情報取引方法及び情報取引プログラム |
CN106294398A (zh) * | 2015-05-21 | 2017-01-04 | 富士通株式会社 | 信息处理装置和信息处理方法 |
JP6398944B2 (ja) * | 2015-10-28 | 2018-10-03 | オムロン株式会社 | データ流通管理システム |
JP6324424B2 (ja) * | 2016-02-29 | 2018-05-16 | ヤフー株式会社 | 情報取引装置、情報取引方法及び情報取引プログラム |
-
2020
- 2020-03-10 WO PCT/JP2020/010378 patent/WO2020184579A1/ja active Application Filing
- 2020-03-10 WO PCT/JP2020/010379 patent/WO2020184580A1/ja active Application Filing
- 2020-03-10 CN CN202080020197.9A patent/CN113544726A/zh active Pending
- 2020-03-10 CN CN202080020277.4A patent/CN113557545B/zh active Active
Patent Citations (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20060169768A1 (en) * | 1998-05-29 | 2006-08-03 | E-Micro Corporation | System for associating identification and personal data for multiple magnetic stripe cards or other sources to facilitate a transaction and related methods |
US20090281954A1 (en) * | 2001-12-05 | 2009-11-12 | Henri Waelbroeck | Method for managing distributed trading data |
CN101118557A (zh) * | 2007-09-17 | 2008-02-06 | 腾讯科技(深圳)有限公司 | 网络信息搜索方法及搜索系统 |
CN101477547A (zh) * | 2009-01-20 | 2009-07-08 | 中国测绘科学研究院 | 一种基于规则的空间数据整合方法 |
JP2011086039A (ja) * | 2009-10-14 | 2011-04-28 | Seiko Epson Corp | 情報処理装置、情報処理装置の制御方法およびプログラム |
JP2011257854A (ja) * | 2010-06-07 | 2011-12-22 | Hitachi Ltd | 医療情報管理システム、医療情報管理方法、および医療情報管理プログラム |
JP2014002480A (ja) * | 2012-06-15 | 2014-01-09 | Japan Research Institute Ltd | カード情報処理システム、カード情報処理装置、カード情報処理方法、およびプログラム |
CN106687956A (zh) * | 2014-08-08 | 2017-05-17 | 株式会社博报堂Dy控股集团 | 信息处理系统 |
JP2016091067A (ja) * | 2014-10-29 | 2016-05-23 | ソフトバンク株式会社 | 個人情報流通方法、個人情報流通システム及び個人情報流通事業者装置 |
CN104504138A (zh) * | 2014-12-31 | 2015-04-08 | 广州索答信息科技有限公司 | 一种基于人的信息聚合方法和装置 |
CN106547646A (zh) * | 2015-09-23 | 2017-03-29 | 阿里巴巴集团控股有限公司 | 一种数据备份及恢复方法、数据备份及恢复装置 |
CN107066457A (zh) * | 2016-08-23 | 2017-08-18 | 平安科技(深圳)有限公司 | 用户信息视图构建方法和系统 |
CN108074116A (zh) * | 2016-11-09 | 2018-05-25 | 阿里巴巴集团控股有限公司 | 信息提供方法及装置 |
CN106878269A (zh) * | 2016-12-30 | 2017-06-20 | 广州中致易和网络科技有限公司 | 一种网络认证平台 |
CN107909493A (zh) * | 2017-12-04 | 2018-04-13 | 泰康保险集团股份有限公司 | 保单信息处理方法、装置、计算机设备和存储介质 |
US20190228180A1 (en) * | 2018-01-22 | 2019-07-25 | Fujitsu Limited | Apparatus, method, and system for providing informati0n and storage medium |
CN108415989A (zh) * | 2018-02-12 | 2018-08-17 | 苏州朗动网络科技有限公司 | 身份信息识别方法、装置、计算机设备和存储介质 |
CN109189813A (zh) * | 2018-08-22 | 2019-01-11 | 中国建设银行股份有限公司 | 一种数据共享方法及装置 |
Non-Patent Citations (1)
Title |
---|
刘荣辉: "《大数据架构技术与实例分析》", vol. 1, 东北师范大学出版社, pages: 282 - 287 * |
Also Published As
Publication number | Publication date |
---|---|
WO2020184580A1 (ja) | 2020-09-17 |
CN113557545B (zh) | 2024-04-05 |
WO2020184579A1 (ja) | 2020-09-17 |
CN113557545A (zh) | 2021-10-26 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
AU2009222546B2 (en) | Generating user information for use in targeted advertising | |
US20050171859A1 (en) | Augmentation of lead with attractiveness information from external source | |
US8073743B2 (en) | Self-distribution methods, coded self-distribution methods, and systems for distributing information | |
US20160171113A1 (en) | Systems and Methods for Controlling Crawling Operations to Aggregate Information Sets With Respect to Named Entities | |
US20140100956A1 (en) | Providing fast alerts for rapidly changing real estate data | |
US20110178855A1 (en) | System and method for increasing marketing performance using spend level data | |
US20120173306A1 (en) | System and Method for Providing Real Estate Referrals | |
US20160063547A1 (en) | Method and system for making targeted offers | |
CN113557545B (zh) | 中介装置、系统以及计算机程序 | |
US11966933B2 (en) | System and method for correlating and enhancing data obtained from distributed sources in a network of distributed computer systems | |
US20110131147A1 (en) | Method and system for recommendation based on locational and societal relation | |
JP6152238B2 (ja) | データ流通システム、およびそのデータ流通システムを実現するゲートウエイシステム | |
JP2001523363A (ja) | 戦略的マーケティングシステム | |
KR102140376B1 (ko) | 신혼 재무 설계 시스템 및 방법 | |
US9069811B2 (en) | Method for building and maintaining trusted supplier records | |
JP6944068B2 (ja) | 仲介装置、システム及びコンピュータプログラム | |
JP6592213B1 (ja) | 仲介装置及びコンピュータプログラム | |
JP2002175432A (ja) | 配信仲介サービス装置の介在によりコンセプトメールを多数のターゲットに配信する方法およびその配信仲介サービス装置 | |
CN107506970B (zh) | 一种项目数据处理的方法和系统 | |
KR102436819B1 (ko) | 견적 서비스 방법 및 이를 수행하는 서버 | |
CN101496047A (zh) | 内容的目标传送 | |
CN105719220A (zh) | 一种互联网信息快捷平台 | |
JP3658386B2 (ja) | メール振分けサーバ、メール振分け方法、及びプログラム | |
WO2002095636A1 (en) | Method and apparatus for demographic payment comparison and alternative service offer system | |
AU2001100016A4 (en) | Method and system for comparing payments made by consumers and seeking alternative offers |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
REG | Reference to a national code |
Ref country code: HK Ref legal event code: DE Ref document number: 40061087 Country of ref document: HK |