CN102667830B - 信息管理装置以及数据处理方法 - Google Patents
信息管理装置以及数据处理方法 Download PDFInfo
- Publication number
- CN102667830B CN102667830B CN201080045407.6A CN201080045407A CN102667830B CN 102667830 B CN102667830 B CN 102667830B CN 201080045407 A CN201080045407 A CN 201080045407A CN 102667830 B CN102667830 B CN 102667830B
- Authority
- CN
- China
- Prior art keywords
- data
- node
- abstract
- user
- object data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/21—Design, administration or maintenance of databases
- G06F16/219—Managing data history or versioning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/60—Protecting data
- G06F21/62—Protecting access to data via a platform, e.g. using keys or access control rules
- G06F21/6218—Protecting access to data via a platform, e.g. using keys or access control rules to a system of files or objects, e.g. local or distributed file system or database
- G06F21/6245—Protecting personal data, e.g. for financial or medical purposes
- G06F21/6254—Protecting personal data, e.g. for financial or medical purposes by anonymising data, e.g. decorrelating personal data from the owner's identification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W12/00—Security arrangements; Authentication; Protecting privacy or anonymity
- H04W12/02—Protecting privacy or anonymity, e.g. protecting personally identifiable information [PII]
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W4/00—Services specially adapted for wireless communication networks; Facilities therefor
- H04W4/02—Services making use of location information
- H04W4/025—Services making use of location information using location based information parameters
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Business, Economics & Management (AREA)
- Signal Processing (AREA)
- Computer Networks & Wireless Communication (AREA)
- Computer Security & Cryptography (AREA)
- Bioethics (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- General Business, Economics & Management (AREA)
- Tourism & Hospitality (AREA)
- Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- Computer Hardware Design (AREA)
- Data Mining & Analysis (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
在信息管理装置中,数据接收部周期性地从多个移动终端接收位置数据。第二提取部产生至少一个位置数据的幂集,并且产生包括用户的识别数据和对象数据在内作为元素的节点。处理部将移动数据集登记到节点中,其中所述移动数据集具有作为元素的至少一个如下位置数据:对移动到由对象数据所示位置之前的位置加以表示的位置数据和对从对象数据所示位置移动之后的位置加以表示的位置数据。抽象部利用抽象化方案来抽象对象数据,其中所述抽象化方案具有根据抽象化的次数来确定的优先级。测试部列出了其它节点,所述其它节点中的每一个与对象数据的节点在识别数据上不同而在对象数据上相同,具有移动数据集,该移动数据集与节点的移动数据集之间的积集是空集,当其它节点的数目等于或大于预定阈值时,输出作为匿名数据的节点的对象数据。
Description
技术领域
本发明涉及一种信息管理装置、数据处理方法及计算机程序,更具体地,涉及一种管理位置数据的信息管理装置、数据处理方法和计算机程序。
背景技术
近年来,利用安装在移动终端、汽车等上的全球定位系统(GPS)和无线局域网(LAN)等测量的位置数据的服务在增长。存在如下可能性,即位置数据是详细描述了在家、办公室、学校等地点的(移动终端、汽车等用户的)个体并允许接触用户的数据,或者是用户不希望陌生人知道的数据,例如爱好、娱乐、医院访问等,并且位置数据是高级的隐私数据。这种隐私数据是匿名的,以保护匿名人。
此处,进行匿名化来处理隐私数据,以使得不能够确定用户。表示不能指定用户的程度的指标被称作匿名指标。作为匿名指标的现有指标是k-匿名或l多样性。在下文中,假定用户数据包括如下匿名指标:对用户及一个或多个敏感数据加以识别的一个或多个准标识符。首先,k-匿名是一种指标,以通过对准标识符进行匿名化,来保证相同准标识符变为k或多个准标识符。通过满足k匿名不能指定用户。另一方面,l多样性是一种指标,通过对准标识符进行匿名化,来保证相同准标识符的敏感数据变为一个或多个准标识符。通过满足l多样性可以阻止了解到用户的敏感数据。
例如,作为示例,假定存在图1A所示的病人的疾病情况记录。在图1A所示的疾病情况记录中,将ZIP码、年龄和国籍作为准标识符进行记录,而疾病情况则作为敏感数据进行记录。在ZIP码和年龄的情况下,通过隐去(turndown)任意字段来执行匿名化,以及在国籍的情况下,则通过隐去国家的名称来执行匿名化。图1B示出了当对图1A所示的疾病情况记录进行匿名化时的示例。通过对ZIP码、年龄和国籍进行匿名化,形成了具有相同准标识符的两组。在任何情况下,k匿名中的“k”是组中用户的数目,以及在本示例中,k=4。通过保证k≥2而使得不能指定与线对应的用户。l匿名中的“l”是组中的疾病情况的数目,用户1至4所属组中的l=2,而用户5至8所属组中的l=1。当浏览者看见该表中(图1B)30岁且ZIP码是148**的用户访问了医院时,浏览者会知道用户是“癌症患者”。但是,即使浏览者认识该用户,通过保证l≥2,使得可以阻止浏览者进一步了解到用户的特征(在该示例中,疾病情况)。存在作为公知匿名指标的t近似性和m不变性,但是省略了其描述。
通过移动终端、汽车等周期性地测量的位置数据本质上依赖于数据。例如,位置数据可能是如下数据:通过该数据指定在家或办公室的个体的数据,以及位置数据可能是使个体特征清晰化的数据,,其中该个体特征例如指定偏好和娱乐的地点以及要访问的医院。然而,难以知道单个位置数据的本质,但是通过分析同一用户的多个位置数据并且检测该用户每天长时间停留的地点,来使该本质清楚。因此,位置历史(相同用户的多个位置数据)的每个位置数据是准标识符,并且是敏感数据。
对于位置数据的匿名化,单个位置数据可以是处于“地点”中的浏览者可以通过其指定用户的数据。当在指定用户之后浏览该用户的位置数据时,该用户要去往哪里是已知的。因此,在单个位置数据的情况下,通过保证k匿名来阻止用户被指定是必要的。图2是示出了单个位置数据的匿名化的示例的概念图。此处,示出了如下示例,即匿名化(抽象)用户1至用户4的位置数据,以满足k匿名(k≥4)。在图2中,黑点是以纬度和经度示出的每个用户的位置数据,以及灰色圆示出了区域。可以通过将每个用户的位置数据转换为包括四个用户的区域数据,使得处于“地点”中的浏览者难以指定所有用户。
关于以上技术,专利文件1和2示出了作为现有技术的匿名化数据的系统的示例,其中所述技术在保护隐私数据的匿名的同时使用了隐私数据。
专利文献1(JP2005-234866A)的隐私数据管理服务器在用于通信的多个终端相连的网络中管理终端用户的隐私数据。隐私数据管理服务器配置有隐私数据库,存储用户的隐私数据;隐私数据管理部,管理隐私数据库中的隐私数据;以及统计数据处理部,计算根据一种隐私数据指定的用户与登记在所述隐私数据库中的用户总数之比。当从终端接收用户的隐私数据的请求消息时,隐私数据管理部搜索隐私数据库。当搜索到隐私数据时,统计处理部计算具有该隐私数据的用户与登记用户之比,以及当搜索到的隐私数据大于阈值时,向终端发送隐私数据。
此外,专利文献2(JP2007-219636A)公开的数据公开装置管理包括隐私数据的数据。数据公开装置配置有保持部,保持各包括一个或多个属性的一个或多个数据;匿名计算部,当公开数据的特性的属性时,计算匿名;以及粒度大小改变公开部,当计算得到的匿名不具有期望的匿名时,改变特定属性的数据的粒度大小,以使得数据具有大于期望阈值的匿名,并且公开该属性的数据。
此外,在使用作为相关技术的专利文献3(JP2005-031965A)公开的使用存在数据的方法中,数据用户侧终端装置使用由数据提供者侧的终端装置通过通信网络在服务器装置的服务控制下公开的存在数据。在这种使用存在数据的方法中,数据用户侧终端装置执行以下步骤:数据收集请求步骤,向服务器装置请求存在数据的收集;存在数据接收步骤,通过服务器装置向数据提供者侧终端装置发送数据提供者募集的广告和指南,执行应用接收以及与数据提供者侧的终端装置进行协作的合同,并且接收根据合同的内容产生的存在数据以及来自数据提供者侧终端装置的存在对象数据;统计处理或存在数据存储步骤,执行对产生的存在数据的统计处理或累积;以及费用数据存储步骤,存储统计处理后的存在数据的费用数据,以支持报酬的支付。
此外,专利文献4(2004-029940A)中公开的数据服务系统配置有第一数据处理装置,与网络相连,以管理数据;第二数据处理装置,向第一数据处理装置提供数据;以及第三数据处理装置,从第一数据处理装置获取数据。在该数据服务系统中,第一数据处理装置配置有邻居数据获取部,获取从第二数据处理装置提供的第二数据处理装置的邻居的周围数据;统计数据产生部,根据邻居数据获取部获取的邻居数据产生统计数据;请求接收部,从第三数据处理装置接收邻居数据的请求;以及邻居数据提供部,基于请求接收部接收到的请求,向第三数据处理装置提供由邻居数据产生部产生的邻居数据。第二数据处理装置配置有邻居数据收集部,收集邻居数据;邻居数据提供部,向第一数据处理装置提供由附近数据收集部收集的邻居数据;以及提供控制部,控制邻居数据提供部提供邻居数据。第三数据处理装置配置有邻居数据请求部,请求邻居数据;以及邻居数据获取部,获取邻居数据请求部所请求的邻居数据。
此外,根据专利文献5(JP2004-318391A)的数据服务装置可以通过网络与访问装置通信,并且基于来自访问装置的请求,向访问装置提供数据。数据服务装置配置有个体数据存储部,存储个体的个体数据;接收部,从访问装置接收包括个体数据的搜索条件的个体数据传输请求;搜索条件确认部,对接收部接收的个体数据传输请求中包括的搜索条件加以确认,当在个体数据传输请求中包括的搜索条件中包括了可能指定个体的条件时,删除可能指定个体的条件,在确认之后输出作为搜索条件的删除了可能指定个体的条件的搜索条件,以及当在个体数据传输请求中包括的搜索条件中不包括可能指定个体的条件时,在确认之后输出与搜索条件一样的在个体数据传输请求中包括的搜索条件;个体数据提取部,在从搜索条件确认部输出的确认结果之后输入搜索条件,并且在确认之后基于搜索条件搜索个体数据存储部,以提取个体数据;数据ID产生部,使用个体数据提取部基于预定规则提取的个体数据来产生数据标识,以识别所提取的个体数据,并且将产生的数据标识分配给所提取的个体数据;以及搜索结果确定部,确定是否可能根据分配有数据ID且由个体数据提取部基于预定规则提取的个体数据来确定个体,以及当确定可能确定个体时,则向访问装置发送分配有数据ID的个体数据。
此外,在专利文献6(2005-346248A)中公开的数据仲裁装置配置有第一数据存储部,存储了对个体加以详细描述并包括个体的邮件地址和诊断结果数据的个体详细描述数据;匿名化部,参考第一数据存储部,以从个体详细描述数据中排除包括名称的预定数据,并且将第二数据存储部中的余下个体详细描述数据和至少一部诊断结果数据作为匿名化个体数据来存储;允许从已登记的提供者的终端访问在第二数据存储部中存储的匿名化个体数据的部;通过使用在第一数据存储部中存储的数据来识别属于多个分类中每一个的个体并且在第三数据存储部存储属于所述多个分类中的每一个的个体的识别数据的部,其中基于在第二数据存储部中存储的匿名化个体数据中的数据分类来规定所述多个分类;以及从登记承办者接收针对在第三数据存储部中包括的多个分类中的每个分类的广告邮件并且通过使用在第三数据存储部中存储的附属个体的识别数据向第一数据存储部中存储的邮件地址传送所述广告邮件的部。
此外,专利文献7(2007-179500A)中公开的匿名化识别数据产生系统配置有数据获取部,其获取受检对象标识数据和对受检对象之间的关系加以表示的受检对象关系数据,其中对于要分析的遗传数据,该受检对象标识数据是对象中的每个受检对象所特有的;标识数据编码部,对数据获取部获取的受检对象标识数据进行编码,并且产生编码标识数据;编码数据产生部,产生基于标识数据编码部产生的编码标识数据及数据获取部获取的受检对象关系数据的编码数据;以及编码数据传输部,向另一装置发送,用于分析。
引用列表
[专利文献1]JP2005-234866A
[专利文献2]JP2007-219636A
[专利文献3]JP2005-031965A
[专利文献4]JP2004-029940A
[专利文献5]JP2004-318391A
[专利文献6]JP2005-346248A
[专利文献7]JP2007-179500A
发明内容
在参考图2描述的用于匿名化的技术中,所述技术对于单个位置数据是有效的,但是对于多个位置数据的位置历史,不可能总是有效。例如,原因在于,对于知道了用户处于某一地方的浏览者要知道用户去往哪里而言,所述数据是必需的。
在专利文献1公开的系统中,当尝试匿名化类似不是以经度和纬度示出的位置数据且具有较少重叠的隐私数据时,几乎私有数据都不能满足阈值。因此,难以将这种隐私数据传送出去(不可能用于服务)
在专利文献2公开的系统中,当处理包括多个位置数据的动作历史时,因为对位置数据匿名化,使得采取了相同动作的用户的数目等于或大于预定数目,认为不可以根据动作历史指定用户。然而,可能知道用户的一部分动作历史的浏览者将知道用户去往了不同的位置。
鉴于上述问题构建了本发明,以及本发明的目的在于提供一种数据管理装置、数据处理方法、数据管理系统和计算机程序,使得当保护匿名的同时将隐私数据用于服务时,知道用户的一部分动作的浏览者将难以知道用户的新动作。
为了解决以上问题,本发明的信息管理装置配置有数据接收部、用户数据存储部、第一提取部、处理部、抽象化方案存储部、抽象部和测试部。数据接收部周期性地从多个移动终端中的每个移动终端接收位置数据。此处,位置数据包括示出了移动终端的位置的位置测量数据、位置测量数据的位置测量时间以及包括移动终端的用户的识别数据在内的伴随数据。用户数据存储部存储数据接收部接收的位置数据,作为每个用户的动作历史。第一提取部通过将在用户数据存储部中存储的动作历史的位置数据中的每个位置数据用作对象数据,来产生包括位置数据的用户的识别数据和对象数据在内的节点。处理部将移动数据集登记到节点,其中移动数据集具有作为元素的至少一个如下位置数据:相对于节点中包括的对象数据,对在移动至对象数据所示位置之前的位置加以表示的位置数据以及对在从对象数据所示的位置移动之后的位置加以表示的位置数据。抽象化方案存储部存储位置数据的抽象化方案。抽象部将在抽象化方案存储部中存储的抽象化方案应用于节点中的对象数据。测试部提取其它节点,以及当其它节点的数目等于或大于预定阈值时,输出作为匿名数据的节点的对象数据,其中其它节点中的每一个具有与节点(具有由抽象部抽象的对象数据)的用户的识别数据不同的识别数据,并且具有与节点的对象数据的位置或者在节点的对象数据的位置中包括的位置相同的位置的对象数据,以及其它节点中的每一个具有移动数据集,该移动数据集与节点的移动数据集之间的积集(product)是空集。
此外,本发明的信息管理装置配置有数据接收部、用户数据存储部、第二提取部、处理部、抽象化方案存储部、抽象部和测试部。数据接收部周期性地从多个移动终端接收位置数据。此处,位置数据包括对移动终端中的每个移动终端的位置加以表示的位置测量数据、位置测量数据的位置测量时间以及包括移动终端的用户的识别数据在内的伴随数据。用户数据存储部存储数据接收部接收的位置数据,作为每个用户的动作历史。第二提取部产生在用户数据存储部中存储的动作历史的至少一个位置数据的幂集,以及通过将在幂集中的每个元素用作对象数据,来产生包括位置数据的用户的识别数据和对象数据在内的节点。处理部将移动数据集登记到节点,其中移动数据集具有作为元素的至少一个如下位置数据:关于节点中包括的对象数据,对在移动至对象数据所示位置之前的位置加以表示的位置数据以及对在从对象数据所示的位置移动之后的位置加以表示的位置数据。抽象化方案存储部存储位置数据的抽象化方案。抽象部将在抽象化方案存储部中存储的抽象化方案应用于节点中的对象数据。测试部提取其它节点,以及当其它节点的数目等于或大于预定阈值时,输出节点的对象数据,作为匿名数据,其中其它节点中的每一个具有与节点(具有由抽象部抽象的对象数据)的用户的识别数据不同的识别数据,并且具有与节点的对象数据的位置或者在节点的对象数据的位置中包括的位置相同的位置的对象数据,以及每一个其它节点具有移动数据集,该移动数据集与节点的移动数据集之间的积集是空集。
此外,本发明的信息管理装置的数据处理方法包括:周期性地从移动终端接收位置数据;通过将在用户数据存储部中存储的动作历史的位置数据中的每个位置数据用作对象数据,来产生包括位置数据的用户的识别数据和对象数据在内的节点;将移动数据集登记到节点,其中移动数据集具有作为元素的至少一个如下位置数据:关于节点中包括的对象数据,对在移动至对象数据所示位置之前的位置加以表示的位置数据以及对在对象数据所示的位置移动之后的位置加以表示的位置数据;将抽象化方案存储部中存储的抽象化方案应用于节点的对象数据;以及提取其它节点,以及当其它节点的数目等于或大于预定阈值时,输出节点的对象数据作为匿名数据,其中每一个其它节点具有与节点(具有由抽象部抽象的对象数据)的用户的识别数据不同的识别数据,并且具有与节点的对象数据的位置或在节点的对象数据的位置中包括的位置相同的位置的对象数据,以及每一个其它节点具有移动数据集,该移动数据集与节点的移动数据集之间的积集是空集。信息管理装置包括用户数据存储部和抽象化方案存储部,用户数据存储部存储从多个移动终端中的每个移动终端接收的位置数据,作为每个用户的动作历史,其中位置数据包括示出了移动终端的位置的位置测量数据以及包括位置测量数据的测量时间和移动终端的用户的识别数据在内的伴随数据,抽象化方案存储部存储了位置数据的抽象化方案。
此外,本发明的信息管理装置的数据处理方法包括:周期性地从移动终端接收位置数据;产生在用户数据存储部中存储的动作历史的至少一个位置数据的幂集,以及通过将在幂集中的每个元素用作对象数据,来产生包括位置数据的用户的识别数据和对象数据在内的节点;将移动数据集登记到节点,其中移动数据集具有作为元素的至少一个如下位置数据:关于节点中包括的对象数据,对在移动至对象数据所示位置之前的位置加以表示的位置数据以及对在对象数据所示的位置移动之后的位置加以表示的位置数据;将抽象化方案存储部中存储的抽象化方案应用于节点的对象数据;以及提取其它节点,以及当其它节点的数目等于或大于预定阈值时,输出节点的对象数据,其中其它节点中的每个节点具有与节点(具有由抽象部抽象的对象数据)的用户的识别数据不同的识别数据,并且具有与节点的对象数据的位置或在节点的对象数据的位置中包括的位置相同的位置的对象数据,以及每一个其它节点具有移动数据集,该移动数据集与节点的移动数据集之间的积集是空集。信息管理装置包括用户数据存储部和抽象化方案存储部,用户数据存储部存储从多个移动终端中的每个移动终端接收的位置数据,作为每个用户的动作历史,其中位置数据包括示出了移动终端的位置的位置测量数据以及包括位置测量数据的测量时间和移动终端的用户的识别数据在内的伴随数据,抽象化方案存储部存储了位置数据的抽象化方案。
此外,一种使计算机执行本发明的信息管理装置的数据处理方法的程序,其中数据处理方法包括:周期性地从移动终端接收位置数据;通过将在用户数据存储部中存储的动作历史的位置数据中的每个位置数据用作对象数据,来产生包括位置数据的用户的识别数据和对象数据在内的节点;将移动数据集登记到节点,其中移动数据集具有作为元素的至少一个如下位置数据:关于节点中包括的对象数据,对在移动至对象数据所示位置之前的位置加以表示的位置数据以及对在从对象数据所示的位置移动之后的位置加以表示的位置数据;对节点的对象数据应用在抽象化方案存储部中存储的抽象化方案;以及提取其它节点,以及当其它节点的数目等于或大于预定阈值时,输出节点的对象数据,作为匿名数据,其中每一个其它节点具有与节点(具有由抽象部抽象的对象数据)的用户的识别数据不同的识别数据,并且具有与节点的对象数据的位置或在节点的对象数据的位置中包括的位置相同的位置的对象数据,以及每一个其它节点具有移动数据集,该移动数据集与节点的移动数据集之间的积集是空集。信息管理装置包括用户数据存储部和抽象化方案存储部,用户数据存储部存储从多个移动终端中的每个移动终端接收的位置数据,作为每个用户的动作历史,其中位置数据包括示出了移动终端的位置的位置测量数据以及包括位置测量数据的测量时间和移动终端的用户的识别数据在内的伴随数据,抽象化方案存储部存储了位置数据的抽象化方案。
此外,一种使计算机执行本发明的信息管理装置的数据处理方法的程序,其中数据处理方法包括:产生在用户数据存储部中存储的动作历史的至少一个位置数据的幂集,以及通过将在幂集中的每个元素用作对象数据,来产生包括位置数据的用户的识别数据和对象数据的节点;将移动数据集登记到节点,其中移动数据集具有作为元素的至少一个如下位置数据:对于节点中包括的对象数据,对在移动至对象数据所示位置之前的位置加以表示的位置数据以及对在从对象数据所示的位置移动之后的位置加以表示的位置数据;对节点的对象数据应用在抽象化方案存储部中存储的抽象化方案;以及提取其它节点,以及当其它节点的数目等于或大于预定阈值时,输出节点的对象数据,作为匿名数据,其中每一个其它节点具有与节点(具有由抽象部抽象的对象数据)的用户的识别数据不同的识别数据,并且具有与节点的对象数据的位置或在节点的对象数据的位置中包括的位置相同的位置的对象数据,以及每一个其它节点具有移动数据集,该移动数据集与节点的移动数据集之间的积集是空集。信息管理装置包括用户数据存储部和抽象化方案存储部,用户数据存储部存储从多个移动终端中的每个移动终端接收的位置数据,作为每个用户的动作历史,其中位置数据包括示出了移动终端的位置的位置测量数据以及包括位置测量数据的测量时间和移动终端的用户的识别数据在内的伴随数据,抽象化方案存储部存储了位置数据的抽象化方案。
附图说明
图1A是为了示出匿名指数而示出了(匿名化之前的)数据的示例的表;
图1B是为了示出匿名指数而示出了(匿名化之后的)数据的示例的表;
图2是示出了单个位置数据的匿名化的示例的概念图;
图3是示出了根据本发明第一示例实施例的匿名化的示例的概念图;
图4是示出了根据本发明第一示例实施例的信息管理装置的结构的功能性框图;
图5是示出了根据本发明第一示例实施例的信息管理装置的操作(匿名化阶段)的示例的流程图;
图6是示出了根据本发明第一示例实施例、第二示例实施例和第散示例实施例的信息管理装置的操作(参照阶段)的示例的流程图;
图7A是示出了根据本发明第二示例实施例的匿名化的示例的概念图;
图7B是示出了根据本发明第二示例实施例的匿名化的示例的概念图;
图8是示出了根据本发明第二示例实施例的匿名化的示例的概念图;
图9是示出了根据本发明第二示例实施例的匿名化的示例的概念图;
图10是示出了根据本发明第二示例实施例的信息管理装置的结构的功能性框图;
图11是示出了根据本发明第二和第三示例实施例的信息管理装置的操作(匿名化阶段)的示例的流程图;
图12是示出了根据本发明第三示例实施例的信息管理装置的结构的功能性框图;
图13是示出了根据本发明第三示例实施例的信息管理装置的操作(匿名化阶段)的示例的流程图;
图14是示出了根据本发明实现示例的信息管理装置中的用户数据存储部的示例的表;
图15是示出了根据本发明实现示例的信息处理装置的处理的图;
图16是示出了根据本发明实现示例的信息管理装置中的抽象方案存储部的示例的表;
图17是示出了根据本发明实现示例的信息管理装置的处理的图;
图18是示出了根据本发明实现示例的信息管理装置的处理的图;
图19是示出了根据本发明实现示例的信息管理装置中的匿名数据存储部的示例的表;
图20是示出了根据本发明实现示例的信息管理装置的处理的图;
图21是示出了根据本发明实现示例的信息管理装置的处理的图;
图22是示出了根据本发明实现示例的信息管理装置的处理的图;
图23是示出了根据本发明实现示例的信息管理装置中的匿名数据存储部的示例的表;
图24是示出了根据本发明实现示例的信息管理装置的处理的图;
图25是示出了根据本发明实现示例的信息管理装置的处理的图;
图26是示出了根据本发明实现示例的信息管理装置的处理的图;
图27是示出了根据本发明实现示例的信息管理装置的处理的图;
具体实施方式
在下文中,将参考附图详细地描述本发明示例实施例的信息管理装置、数据处理方法及计算机程序。对于附图中不涉及本发明本质部分的结构,将省略而不进行说明。
[第一示例实施例]
首先,将描述根据本发明第一示例性实施例的信息管理装置中的匿名化。图3是示出了根据本发明第一示例性实施例的匿名化的概念图。如上所述,因为位置历史包括多个位置数据,知道用户停留位置的浏览者根据位置历史会知道用户要去往的另一位置。因此,在本实施例中,位置历史保证了l多样性,这阻止了浏览者知道该浏览者不知道的位置数据。图3是示例,其中用户1至用户4的位置历史是匿名的(抽象的),以满足l多样性(1=4)。此处,在图3中,每个点示出了对用户停留出的纬度和经度方面的位置加以指示的位置数据,以及对从箭头起始端移动到箭头末端的用户加以指示的将点与另一点相连的箭头。此外,圆示出了区域。在该示例中,抽象区域的中心,以提供1个目的地候选,使得即使当知道了在区域中心(圆的中心点)停留的用户1的浏览者浏览了位置历史时,该浏览者也不可能知道用户1将去往哪里。可以通过增加1(改善l多样性)来改善匿名。这种多样化改善了关于一个位置的多样性。据此,这种多样性可以被称作SDLD(单维l多样性)。在第一示例实施例中,将多个位置数据(位置历史)多样化,使得1维l多样性满足预定条件。下文中,将详细描述本发明的第一示例性实施例。
首先,将描述根据本发明第一示例实施例的信息管理装置100的结构。图4是示出了根据本发明第一示例性实施例的信息管理装置100的结构的功能性框图。信息管理装置100配置有数据接收部102、用户数据存储部104、第一提取部106、处理部108、抽象化方案存储部110、抽象部112、测试部114、匿名数据存储部116以及输出部118。
信息管理装置100是一种信息处理装置,以计算机为例进行说明。通过使用程序(软件)来实现稍后描述的信息管理装置100和其它信息管理装置中的每个组件(功能块),其中该程序通过信息处理装置的硬件结构实现了图4等中的组件。例如,通过以下方式实现本发明:针对每个组件,通过协调计算机的硬件结构和程序(软件)来执行数据计算处理,其中计算机的硬件结构例如是中央处理单元(CPU)、存储器和存储单元,所述程序实现了图4的组件,被存储在了存储单元中,并且被加载到了存储器中。本领域的技术人员应该知道,存在所述实现方法和装置的多种修改示例。在下文中,以下描述的每个组件示出了硬件结构,但是还示出了以功能为单位的块。
例如,可以通过计算机实现该信息管理装置100,其中计算机配置有CPU、存储器(主存储单元)、硬盘单元(辅助存储单元)和通信单元,并且与诸如键盘和鼠标之类的输入单元以及诸如显示器、打印机等输出单元相连。可以通过CPU从硬盘读取程序到存储器并执行程序,来实现从数据接收部102至输出部118的功能。
数据接收部102通过网络与多个终端设备相连。每个终端设备由用户携带。移动终端装载有诸如GPS和无线LAN之类的位置测量单元。数据接收部102从终端设备适当地(例如,周期性地、每个设定时间、或者响应于用户的按钮操作等)接收位置数据。位置数据包括位置测量数据和伴随数据,并且由位置测量单元产生。此处,位置测量单元以纬度、经度和高度等的组合形式示出了位置。伴随数据示出了位置测量时间和诸如用户名称及用户ID(或移动终端ID)之类的用户数据。应该注意,位置测量数据不仅可以是由纬度、经度和高度等表示的针点(pinpoint)数据,还可以是由MinistryofInternalAffairsandCommunications规定的区域网格编码表示的区域数据。
用户数据存储部104记录从用户发送并由数据接收部102持续接收的位置数据,以作为每个用户的动作历史。即,用户数据存储部104将用户名称(或用户ID)、位置测量时间和位置测量数据相关联,并将其作为动作历史来存储。期望的是,通过使用位置测量时间,来按照时间序列存储动作历史。然而,如果第一提取部106可以快速地查阅到动作历史,则本发明不限于该示例。
第一提取部106通过将在用户数据存储部104中存储的动作历史中的每个位置数据用作对象数据,来产生包括对象数据(单个位置数据)的用户名称和对象数据的节点。第一提取部106对在用户数据存储部104中登记的所有用户的动作历史(即,所有位置数据)执行这种处理。即,产生与位置数据的数目相同的数目的节点。
处理部108将对在移动到由第一提取部106产生的每个节点包括的对象数据所示的位置之前的位置加以表示的位置数据以及对从对象数据所示位置移动之后的位置加以表示的位置数据中的每一个用作移动数据,以及产生移动数据作为元素的移动数据集,并将该移动数据集登记到节点。移动数据可以是单个位置数据,其示出了用户在与对象数据相关的时间之前/之后实际停留的位置,或者可以是位置数据集,示出了用户在移动到对象数据所示位置之前或从对象数据所示位置移动之后的可能停留位置。位置数据可以是某时刻之前的位置数据或者可以是移动之后的位置数据,并且可以不存在位置数据。在这种情况下,在节点中包括了对象数据、示出了移动之前的位置的位置数据以及示出了移动之后的位置的位置数据。
抽象化方案存储部110存储了用于抽象位置数据的抽象化方案和优先级。作为抽象化方案的示例,考虑了时间抽象化、用户标识符删除、位置抽象化、位置数据部删除等。此处,在时间抽象化中,删除了时间中的年、月、日、时、分和秒中的一部分。在用户标识符删除中,改变或删除了在位置数据的一部分中包括的用户名称(或用户ID)。在位置抽象化中,将诸如区域网格编码之类的区域数据与利用纬度和经度示出的位置数据改变为宽区域数据的数据。在位置数据删除中,从动作历史中删除位置数据中的一部分。此外,可以设置由诸如用户之类的数据提供者提供的数据匿名的下限,或者可以设置诸如服务提供者之类的浏览者可以使用的数据抽象化的上限。期望的是,抽象化方案存储部110的管理者等可以执行如下管理,例如对抽象化方案的添加、删除和改变。即,信息管理装置100还配置有管理部(未示出),以及管理部基于在用户数据存储部104中存储的位置数据的趋势以及在匿名数据存储部116中存储的匿名数据的精度,来调整匿名数据的内容。
抽象部112按照优先级的顺序将在抽象化方案存储部110中存储的抽象化方案应用到每个节点包括的对象数据。即,首先将优先级1的抽象化方案应用到对象数据。然后,当由该抽象化方案抽象的对象数据不能通过稍后描述的测试部114的测试时,则将优先级2的抽象化方案应用到对象数据上,并且该优先级2的抽象化方案接收测试部114的测试。自此之后,在降低优先级的同时执行抽象化,直到通过测试为止。
此处,在抽象化方案中,优先级越高,抽象化的程度越低,而优先级越低,则抽象化的程度越高。因此,由较高优先级的抽象化方案抽象的对象数据变成了相对于原始对象数据相近或相同(聚焦)的数据。另一方面,由较低优先级的抽象化方案抽象的对象数据变成了相对于原始数据远离(模糊)的数据。如果仅关注单个对象数据,则使用具有较低优先级的抽象化方案来抽象具有较高匿名的对象数据。即,相对于原始位置数据,通过抽象部112的抽象化方案抽象更多地抽象节点的对象数据,并且具有更高的匿名。
测试部114列出了包括如下对象数据的其它节点:具有与应用了抽象化方案的节点的用户名称不同的用户名称并具有与该节点的对象数据的位置相同的位置,以及所述其它节点配置了移动数据集,其中所述其它节点配置的移动数据集与该节点的移动数据集的积集形成了空集。当其它节点的数目等于或大于阈值时,则输出节点的对象数据(要匿名的由抽象化方案抽象的位置数据),作为匿名数据。
匿名数据存储部116存储了从测试部114输出的匿名数据。匿名数据是通过测试部114测试的节点的对象数据,以及由抽象化方案进行抽象和匿名的位置数据。即,匿名数据存储部116将匿名后的用户名(或用户ID)、匿名后的位置测试时间和匿名后的位置测量数据相关联,并将其作为动作历史来存储。此处,应该对用户名、位置测试时间和位置测量数据中的至少一项进行匿名。
输出部118从使用了服务提供商的匿名数据(通过抽象化来匿名的位置数据)的请求者(浏览者)接收请求,其中服务提供商使用位置数据来提供服务。从匿名数据存储部116搜索满足了请求的匿名数据(通过抽象化来匿名的位置数据),并将其发送给请求者(浏览者)。
接下来,将描述根据本发明第一示例实施例的信息管理装置100的操作(数据处理方法)。图5和图6是示出了根据本发明第一示例实施例的信息管理装置100的操作的示例的流程图。信息管理装置100的操作包括图5所示的匿名化阶段和图6所示的参照阶段。在这种情况下,匿名化阶段包括如下过程:产生匿名数据,使得不能根据从多个用户聚集的位置数据来确定用户。参照阶段包括如下过程:搜索并提供满足了浏览者请求的匿名数据。
首先,将描述图5中的匿名化阶段。数据接收部102从多个终端设备(用户)周期性地接收包括位置测量数据及诸如位置测量时间和示出了用户名称的符号之类的伴随数据的位置数据,其中位置测量数据包括纬度、经度、高度等的组合。聚集从用户发送的位置数据,并将其作为每个用户的动作历史存储在用户数据存储部104中(数据接收过程:图5中的步骤S101)。
第一提取部106将在用户数据存储部104中存储的动作历史中的每个位置数据用作对象数据,并且产生包括位置数据的用户名称和对象数据的节点(第一提取过程:图5中的步骤S103)。
处理部108将如下两种数据用作移动数据:对移动到由节点中包括的对象数据所示的位置之前的位置加以表示的位置数据以及对在从对象数据所示的位置移动之后的位置加以表示的位置数据,产生一个或多个移动数据作为元素的移动数据集,并将该移动数据集登记到节点(处理过程:图5中的步骤S105)。
抽象化方案存储部110(抽象化方案存储单元)预先存储了针对位置数据的抽象化方案和优先级,例如时间抽象化、用户标识符删除、位置的抽象化和位置数据删除。抽象部件112选择在抽象方案存储部110中存储并且具有最高优先级而没有用于节点的抽象化方案,以及将选定的抽象化方案用于节点的对象数据(抽象化过程:图5中的步骤S107)。因此,相比于原始位置数据,根据所应用的抽象化方案更高度地抽象节点的对象数据,以改善匿名。
测试部114列出了包括对象数据并具有移动数据集的其它节点,该其它节点包括的对象数据具有与节点的用户名称不同的用户名称,并且具有与节点的对象数据的位置相同的位置,以及其中所述其它节点具有的移动数据集与节点的移动数据集之间的积集是空集。即,所列出的节点是与节点的用户停留在相同位置的不同用户的节点,并且是移动之前或之后与节点的用户停留在不同位置的用户的节点。检查其它节点的数目等于或大于阈值(图5中的步骤S109)。当其它节点的数目等于或多于阈值时(图5中的步骤S109:是),输出作为匿名数据的节点的对象数据(通过抽象化方案进行抽象和匿名的位置数据),以及在匿名数据存储部114(匿名数据存储单元)中存储匿名数据(通过抽象化来匿名的位置数据)(图5中的步骤S111;测试过程:图5中的步骤S109至S111)。因此,可以获得期望的l多样性。因此,还可以获得期望的K匿名。
接下来,将描述图6中的参照阶段。输出部118从使用匿名数据(通过抽象化来匿名的位置数据)的服务提供商的请求者(浏览者)等接收针对预定条件的信息服务的请求(接收过程:图6中的步骤S121)。
输出部118搜索匿名数据存储部116的内容,以提取满足了预定条件的匿名数据(通过抽象化来匿名的位置数据),并且输出至请求者(浏览者)(输出过程:图6中的步骤S123)。
按照这种方式,根据本实施例中的信息管理装置100,可以对每个节点(对象数据)执行抽象化,以满足预定测试条件。即,对一些节点执行抽象化,使得其它节点的数目等于或大于阈值,其中,其它节点中的每个节点具有与节点的用户名称不同的用户名称,具有与节点的对象数据的位置相同位置的对象数据,以及具有移动数据集,其它节点的移动数据集与节点的移动数据集之间的积集是空集。因此,执行抽象化(匿名化),以使存在具有如下位置数据的另一用户:与用户位置中的任意位置的位置数据相同但是与不是任意位置的位置数据的位置数据不同。因此,由于不可能将用户的动作历史与停留在相同位置的其它用户的匿名动作历史区分开来,所以当知道过去在某一位置(某一节点)停留的用户的浏览者尝试浏览匿名用户的动作历史时,将难以确定用户,并且难以了解到用户将去往的其它地方。因此,可以匿名化动作历史,以使得即使在浏览者知道动作历史的一部的情况下,浏览者也不可能知道用户的新动作。
[第二示例实施例]
首先,将描述根据本发明第二示例实施例的信息管理装置的匿名化。图7A和图7B是示出了根据本发明第二示例实施例的匿名化的示例的概念图。在第一示例实施例中,由于不可能将匿名动作历史与停留在相同位置的另外的用户的匿名动作历史区分开来,即使在浏览者(知道过去在某一位置停留的用户)尝试浏览用户的匿名动作历史的情况下,也不可能确定匿名用户,并且不可能知道用户去往的其它位置。然而,当浏览者知道过去在多个位置停留的用户时,则存在如下情况:难以使用户和位置历史相对于浏览者是匿名的。基于该原因,在第二示例实施例中,执行匿名化,使得知道过去在多个位置停留的用户的浏览者不可能知道用户的位置历史。
例如,假定如图7A和7B的示例,用户的动作范围在家、办公室和医院。在这种情况下,当浏览者知道图7A所示的家和办公室时,存在如下可能性:即使在对家、办公室和医院中的每个位置执行了匿名化(抽象化)以满足l多样性的情况下,如果出现在包括家的区域且出现在包括办公室的区域的用户只有唯一一个,则当该用户移动到包括医院的区域时,浏览者就能知道该用户前去的医院。此外,当浏览者知道图7B所示的医院和办公室时,存在如下可能性:当出现在包括医院的区域且出现在包括办公室的区域的用户只有唯一一个时,并且当该用户移动到包括家的区域时,则浏览者将知道该用户的家。按照这种方式,在第二示例实施例中,执行匿名化,使得知道过去在多个位置停留的用户的浏览者不可能知道用户的位置历史。
为了实现该技术方案,列出了浏览者可能知道的位置数据的组合,并且使位置数据匿名,以满足每个组合的l多样性。具体地,图8示出了用户1的位置历史包括2个位置的位置数据的情况,以及图9示出了用户1的位置历史包括3个位置的位置数据的情况。例如,在图8中,当通过抽象位置A与位置B之间的空间来使位置A与位置B匿名时,关于位置A,形成了包括位置A的区域,以包括停留在位置A周围但是并不去往位置B周围的用户2(抽象空间)。另一方面,关于位置B,形成包括位置B的区域,以包括停留在位置B周围但是并不去往位置A周围的用户3(抽象空间)。在这种情况下,并非通过独立地仅使用位置的数据来执行空间抽象化,而是通过参考位置的数据并且将数据彼此相关联来执行空间抽象化。据此,即使在浏览者知道停留在位置A和位置B的用户1的情况下,由于存在用户2和3而导致浏览者不知道用户1去往了哪里。此外,例如,在图9的情况下,基本上可以应用相同的方法。然而,在知道三个位置中每一个位置的情况下,浏览者知道的位置数据的组合是三种,在知道三个位置中的两个位置的情况下,浏览者知道的位置数据的组合是三种,从而导致了总共六种组合。因此,首先,在知道三个位置中每一个位置时的三种组合的情况下,如图8一样抽象化空间(图的中心)。然后,在知道三个位置中的两个位置时的三种组合的情况下,则进一步抽象空间。
这种多样化不仅改善了多个位置中的每个位置的多样性,而且还产生了多个位置的可能组合,并改善了每种组合的多样性。即,处理了多维多样性。这种多样性被称作MDLD(多维l多样性)。在第二示例实施例中,对多个位置数据(位置历史)进行多样化,以满足多维1多样性(MDLD)的预定条件(改善了多样性)。如下定义(在下文中,被称作MDLD保证)满足了MDLD的预定条件。
当在用户的移动范围(稍后描述的移动区域)中包括(用户的)n个位置(节点)时,存在作为位置的重叠的2n-1种组合。MDLD保证在于保证存在如下至少一个其它用户,以满足对所有位置重叠的这种情况加以排除的2n-2种组合中的每一种。例如,当用户的动作包括位置p1,p2和p3时,用户的移动区域是包括p1,p2和p3的范围,并且在用户的移动区域中包括的(用户的)位置是3个。当将该动作的重叠表达为位置的集合时,存在7种组合,例如如下的(23-1=7):{p1}、{p2}、{p3}、{p1,p2}、{p2,p3}、{p3,p1}、{p1,p2,p3}。MDLD保证(满足MDLD)了存在如下至少一个其它用户,其满足了所有位置重叠中除{p1,p2,p3}的六种组合(23-2=6)。
在下文中,将详细描述本发明的第二示例实施例。应该注意,存在如下情况:当存在与第一示例实施例中的功能和操作上的结构相同的结构时,在附图中分配相同的数字或符号,以省略描述。这在其它示例实施例和示例中等同。
首先,将描述根据本发明第二示例实施例的信息管理装置200的结构。图10是示出了根据本发明第二示例性实施例的信息管理装置200的结构的功能性框图。信息管理装置200配置有数据接收部102、用户数据存储部104、第二提取部202、处理部108、抽象化方案存储部110、抽象部112、测试部114、匿名数据存储部116以及输出部118。
根据本发明第一示例实施例的信息管理装置100通过执行以下操作参考一个位置来保证其他位置的多样性:对存在于如下地点的另一用户执行匿名化处理,在所述地点,其它用户具有与另一用户的任意位置的位置数据相同的一个任意数据,并具有与除上述位置数据之外的位置数据不同的其它位置数据。然而,本示例实施例中的信息管理装置200与信息管理装置100的不同之处在于,基于用户的位置数据的任意组合来保证其它位置的多样性。以下将描述不同的结构。
信息管理装置200配置有第二提取部202,以替代根据第一示例实施例的信息管理装置100的结构中的第一提取部106。第二提取部202产生每个用户在用户数据存储部104中存储的动作历史的一个或多个位置数据的任意集合,并且通过将该集合用作对象数据来产生包括位置数据的名称和对象数据的节点。
即,第二提取部202通过将每个用户在用户数据存储部104中存储的位置数据集合用作原始集合,来提取任意组合,并产生部分集合。具体地,第二提取部202产生针对原始集合的所有组合,即所谓的集合,作为用户的部分集合。例如,针对包括用户的位置数据A、B和C的原始集合{A,B,C},产生7个部分集合({A}、{B}、{C}、{A,B}、{A,C}、{B,C}、{A,B,C})。通过将这些部分集合(幂集的元素)用作对象数据,来产生相应的节点。
处理部108提取对在移动到由每个节点(部分集合)的每个位置数据所示的位置之前的位置加以表示的位置数据和对从部分集合的每个位置数据所示的位置移动之后的位置加以表示并且没有包括在该部分集合中的位置数据,作为移动数据,并且将所有提取的移动数据作为移动数据集分配给节点。在这种情况下,移动数据可以是如下的单个位置数据:示出了在移动到对象数据所示位置之前的实际位置或者从对象数据所示位置移动之后的实际位置,并且可以是对在移动到对象数据之前/之后可能存在的一个或多个位置加以表示的位置数据集合。此外,移动数据可以只存在以下数据之一:对移动之前的位置加以表示的位置数据以及对移动之后的位置加以表示的位置数据,并且两者可以都不存在。此时,例如,在节点中包括部分集合(至少一个对象数据)、对移动之前的位置加以表示的位置数据以及对移动之后的位置加以表示的位置数据。
当在测试部件114中测试每个节点的匿名时,设置阈值,并通过与阈值相比较来确定匿名。期望的是,用户可以设置阈值,作为匿名化策略。即,在信息管理装置200中,还可以配置有设置接收部(未示出),其中,该设置接收部接收阈值,该阈值确定了匿名的程度。对于抽象部110产生的位置数据,测试部114可以改变通过与阈值比较来确定匿名。
接下来,将描述根据本发明的第二示例实施例的信息管理装置200的操作(数据处理方法)。图11和图6是示出了根据本发明第二示例实施例的信息管理装置200的操作的示例的流程图。信息管理装置200的操作配置有图11所示的匿名化阶段和图6所示的参照阶段。在这种情况下,匿名化阶段具有与图5所示的信息、管理装置100的操作相同的步骤S101和S105-S109,并且具有如图11所示的下述步骤S201。参照阶段具有与图6所述的信息管理装置100的参照阶段相同的参照阶段。
首先,将描述图11的匿名化阶段。数据接收部102执行数据接收过程(图11的步骤S101)。
第二提取部206根据示出了在步骤S101中存储的每个用户的动作历史的位置数据集合产生每个用户的幂集。第二提取部206将节点分配给幂集中的每个元素,并且通过将在每个元素中包括的所有位置数据用作对象数据,来将如下数据分配给该节点作为移动数据集合:在移动到节点的对象数据所示位置之前的位置的位置数据集合以及从节点的对象数据所示的位置移动之后的位置并且没有包括在每个元素中的位置数据(第二提取过程:图11中的步骤S201)。
此后,处理部108执行处理过程(图11中的步骤S105)。接下来,抽象部112执行抽象过程(图11中的步骤S107)。然后,测试部114执行测试过程(图11中的步骤S109至S111)。接下来,输出部118执行接收过程(图6中的步骤S121)和输出过程(图6中的步骤S123)。
如上所述,根据本发明示例实施例中的信息管理装置200,保证了存在具有如下位置数据集合的另一不同用户,即该另一不同用户的位置数据集合被配置为与用户的位置数据的任意组合相类似的组合,并且在该组合中不包括所述另一不同用户的位置集合。因此,即使知道在多个位置停留的用户的浏览者参考了位置数据集合,也难以确定用户,并且难以知道浏览者已知的位置之外的用户停留位置。因此,可以匿名化动作历史,使得即使在浏览者知道用户的动作的一部分时,浏览者也不可能知道用户的新动作。
[第三示例实施例]
将描述根据本发明第三示例实施例的信息管理装置300的结构。图12是示出了根据本发明示例实施例的信息管理装置300的结构的功能性框图。信息管理装置300配置有数据接收部102、用户数据存储部104、第二提取部202、处理部108、抽象化方案存储部110、抽象部112、测试部114、匿名数据存储部116、输出部118、设置接收部302、呈现部304和样本存储部306。
本示例实施例中的信息管理装置300与第二示例实施例中的信息管理装置200的不同之处在于,当提供者改变匿名的阈值时,可以确定为浏览者提供的位置数据的样本。以下将描述不同的结构。
在测试部114对位置数据进行了匿名测试的情况下,设置接收部302接收阈值的设置改变。因为改变了阈值,样本存储部306将通过了测试部114测试的位置数据保存为样本。呈现部304示出在样本存储部306中存储的样本。
当测试部114确定了位置数据的匿名时,呈现部304列出要使用的一些阈值,并且指定用于设置接收部302的阈值。呈现部304参考在样本存储部306中存储的位置数据,并向提供者示出了阈值和位置数据,其中在样本存储部306中存储了满足设定阈值的位置数据。提供者参考随阈值变化的位置数据,并可以确定哪个阈值适合自己。
接下来,将描述根据本发明第三示例实施例的信息管理装置300的操作(数据处理方法)。图13、图11和图6是示出了根据本发明第三示例实施例的信息管理装置300的信息管理装置的操作的示例的流程图。信息管理装置300的操作配置有图13所示的样本产生阶段,图11所示的匿名化阶段以及图6所示的参照阶段。此处,样本产生阶段具有与图11中所述的信息管理装置200的操作相同的步骤S101、S201、和S105至S109,以及如图13所示的稍后描述的步骤S301至S305。匿名化阶段具有与图11所示的信息管理装置200的操作相同的匿名化阶段。参照阶段具有与图6所示的信息管理装置110中的参照阶段相同的参照阶段。
首先,将描述图13的样本产生阶段。数据接收部102执行数据接收过程(图13中的步骤S101)。
图12的呈现部304为指派给抽象部110的匿名化产生阈值列表,并且从列表的顶部起,为设置接收部302设置阈值。接下来,第二提取部206执行第二提取过程(图13中的步骤S201)。此后,处理部108执行处理过程(图13中的步骤S105)。接下来,抽象部112执行抽象过程(图13中的步骤S107)。然后,测试部114执行测试过程(图13中的步骤S109)。
当位置数据满足在步骤S301处设置的阈值时,测试部114将位置数据存储到样本存储部306中(图13中的步骤S303)。对于在阈值列表中包括的所有阈值,呈现部304重复如下处理:图13中的步骤S301、S201、S105、S107、S109和S303(图13中的步骤S305)。
应该注意,由于图11所示的匿名化阶段和图6所示的参照阶段与第二示例实施例和第三示例实施例的相应部相同,因此进行了省略。
如上所述,根据本示例实施例的信息管理装置300,因为提供者确定了为浏览者提供的位置数据的样本,所以提供者可以根据匿名阈值确定适当的阈值。
[实现示例]
(实现示例1)
根据本发明的信息管理装置的实现示例,将描述以下过程的示例:接收多个用户的位置数据,以及匿名化每个用户的位置数据(匿名化阶段),以改善SDLD(l多样性1维)。该实现示例示出了根据第一示例实施例的一个具体示例。
数据接收部102周期性地接收用户A至用户D的位置数据,以及例如,在地图上示出如图14所示的位置数据列表时,将位置数据存储到用户数据存储部104中(步骤S101)。作为示例,图14示出了每隔一个小时接收的用户A至用户D的位置数据的一部分。在该示例中,位置数据包括纬度和经度所示的位置测量数据(“位置”)以及用户名称和由位置测量时间所示的伴随数据(“位置测量时间”和“用户名称”)。
例如,假定在如图15所示的地图上示出了图14的位置数据列表中的用户A至用户D的每个位置数据。在图15中,黑点示出了用户长时间停留并且通过纬度和经度示出的位置。将黑点和另一黑点相连的线示出了用户的移动,其中在两个黑点之间的线上分配了用户姓名。用户A长时间停留在位置A1和A2,并且往返于这两点之间。用户B长时间停留在位置B1和位置B2,并且往返于这两点之间。用户C长时间停留在位置C1和位置C2,并且往返于这两点之间。用户D长时间停留在位置D1和位置D2,并且往返于这两点之间。此外,假定位置A1与位置B1之间的距离、位置A2与位置B2之间的距离和位置C2与位置D2之间的距离在300m内。此外,假定位置A1与位置C1之间的距离、位置B1与位置C1之间的距离、位置A2与位置D1之间的距离和位置B2与位置D1之间的距离在500m内。
对于所有位置数据,第一提取部106产生节点,以包括图15的每个黑点的用户姓名以及作为对象数据的黑点之一(步骤S103)。将包括位置X的节点表示为节点X。
接下来,处理部108通过将移动到每个节点的对象数据所示的位置之前的每个位置数据以及从对象数据所示的位置移动之后的位置数据用作移动数据,来将具有作为元素的一个或多个移动数据的移动数据集分配给节点(步骤S105)。在图15的示例中,产生移动数据集,以及登记该移动数据集,以使其具有从示出了节点的对象数据的黑点至通过线与该黑点相连的另一黑点的移动数据,作为元素。例如,对于节点A1,在节点A1上登记移动数据集{A2},以使其具有通过线与在节点A1中包括的位置A1(对象数据)相连的位置A2(从对象数据所示的位置移动之后的位置数据),作为元素。在该示例的情况下,不存在移动到对象数据所示的位置之前的位置数据。相反,对于节点A2,在节点A2上登记移动数据集合{A1},以使其具有通过线与节点A2中包括的位置A2(对象数据)相连的位置A1(移动到对象数据所示位置之前的位置数据),作为元素。在该示例的情况下,不存在从对象数据所示位置移动之后的位置数据。
假定图16所示的抽象化方案和优先级彼此相关,并存储在抽象化方案存储部110中。优先级示出了对在每个节点中包括的对象数据执行的抽象化操作的应用顺序。此外,对于抽象化方案,举例说明了位置的抽象化(例如将位置扩展到300m的范围)和位置数据删除。例如,当第一次对位置数据应用抽象化方案时,并没有执行在优先级1中描述的抽象化,以及当第二次对位置数据应用抽象化方案时,将位置转换为优先级1中描述的300m区域,以抽象该位置。
抽象部112将在抽象化方案存储部110中存储的优先级1的抽象化方案应用到所有节点(步骤S107)。如图16所示,在优先级1的抽象方法(“无操作”)中,没有执行操作。因此,节点的对象数据是如图15所示的对象数据,不存在改变。
对于每个节点,测试部114搜索另外的节点,其中该另外的节点具有与该节点的用户名称不同的用户名称以及与该节点的对象数据的位置相同的位置,并具有与该节点的移动数据集合中的移动数据不同的移动数据(步骤S109)。然而,在图15的情况下,因为不存在对象数据是相同的节点,没有节点通过测试部114的测试(步骤S109:否)。
接下来,抽象部112将优先级2的抽象方法应用到每个节点(步骤S107)。如图16所示,优先级2的抽象方法(将位置扩展为300m的区域)在于,将以纬度和经度所示的位置数据扩展为300m直径范围内的圆区域。通过这种抽象化,可以将用户位置从以纬度和经度所示的精确位置抽象为模糊数据,例如在300m直径区域的内部。即,通过抽象以纬度和经度所示的精确数据,来生成匿名的对象数据。
即,抽象部112可以通过对所有节点应用在抽象化方案存储部110中存储的优先级2的抽象化方案,来获得对象数据(通过抽象化来匿名化的位置数据),例如图17所示的圆。包括黑点的圆示出了300m直径的区域,以及抽象了由黑点位置所示的位置。例如,用户A的位置A1与用户B的位置B1被确定为相同位置。
对于每个节点,测试部114搜索另外的节点,并且测试是否该另外的节点的数目等于或大于阈值(步骤S109),其中该另外的节点具有与该节点的用户名称不同的名称以及与对象数据的位置相同的位置,并且该另外的节点的移动数据集与该节点的移动数据集不同。此处,假定阈值是1。如果存在满足条件的一个其它节点,则假定通过测试。对于包括位置C2的节点C2,用户D的位置D2是相同的位置,节点C2的移动数据是{位置C1}、节点D2的移动数据是{位置D1},以及位置C1与位置D1不同。节点C2和节点D2通过了测试(步骤S109:是),以及在匿名数据存储部116中存储节点C2和D2(步骤S111)。
另一方面,其它节点并没有通过测试部的测试。例如,尽管用户B的位置B1与节点A1的位置相同,但是节点A1的移动数据具有位置A2,节点B1的移动数据具有位置B2,以及位置A2和位置B2具有相同的位置。因此,这些节点没有通过测试(步骤S109:否)。相同的方法可用于其它节点。
接下来,抽象部112再次将抽象方案应用到没有通过测试的节点A1、A2、B1、B2、C1和D1(步骤S107)。因为第三次将抽象方法用于节点,所以应用如图16所示的优先级3的抽象化。优先级3的抽象化是,将位置数据扩展到500m直径的圆区域(“扩展位置为500m的范围”)。通过这种抽象化,可以使用户的位置更模糊,例如存在于500m的范围内。即,还可以根据存在于300m范围内的数据来进一步抽象和匿名化对象数据。
即,如图18所示,抽象部112可以将在抽象化方案存储部110中存储的优先级2的抽象化方案应用于所有的节点,以获得对象数据(进一步抽象和匿名化的位置数据)。包括黑点的大圆示出了500m直径的圆,以及进一步抽象化由黑点示出的每个位置。例如,确定的是,用户A的位置A1、用户B的位置B1和用户C的位置C1位于相同的位置。
对于每个节点,测试部114搜索另外的节点,并且检查该另外的节点的数目是否等于或大于阈值(步骤S109),其中该另外的节点与该节点的用户名称不同,与该节点的对象数据的位置相同,以及与该节点的移动数据集不同。对于节点A1,节点B1和节点C1与其位于相同的位置,以及节点C1的移动数据中包括的位置C2与节点A1的移动数据的位置A2不同。因此,节点A1通过了测试部114的测试。相同的操作可以用于节点B1和节点C1。此外,对于节点A2,节点B2和节点D1与其位于相同的位置,以及在节点D1的移动数据中包括的位置D2与节点A2的移动数据的位置A1不同。因此,节点A2通过了测试部的测试。相同的操作可以用于节点B2和节点D1。节点A1、B1、C1、A2、B2和D1通过了测试部的测试(步骤S109:是),并且被存储在匿名数据存储部116(步骤S111)中。
例如,如图19所示,可以示出与用户数据存储部104相对应的匿名数据存储部116。通过扩展本图所示(抽象化的)位置的范围,并且增加处于类似位置的用户,来尝试匿名化。
(实现示例2)
接下来,根据本发明信息管理装置的实现示例,将描述以下示例(匿名化阶段):对每个用户的位置数据执行匿名化来改善MDLD(多维1多样性),以阻止知道用户的部分位置的浏览者了解到用户停留的其它地方。本实现示出了第二示例实施例的一个具体实例。
数据接收部102周期性地接收用户A至用户H的位置数据,以及将在图20的图上示出的位置数据列表存储在用户数据存储部104中。在图20中,黑点和线与实现示例1中的相同。黑点通过纬度和经度示出了用户长时间停留的位置,以及线示出了用户往返于用户停留的位置之间。分配给黑点的位置XN(N=1,2,3…)是用户X的位置数据(A,B,C,D,E,F,G,H…)。
应该注意,位置H1与位置D1位于距离位置A1300m直径的圆内,以及位置B1与位置C1位于距离位置A1500m直径的圆内。此外,位置G1与位置F2位于距离位置A3300m直径的圆内,以及位置H2与位置B3位于距离位置A1500m直径的圆内。此外,位置C2、位置E1与位置F1位于距离位置A2的300m直径的圆内,以及位置B2位于距离位置A2的500m直径的圆内。
为简便起见,将描述对用户A的位置数据的匿名化,但是对于其它用户的位置数据的匿名化,也完成了相同的操作。
第二抽象部202通过将集合(部分集合)用作对象数据,来产生对象数据的节点(步骤S201),其中所述集合(部分集合)具有作为元素的用户A的任意位置数据。例如,因为用户A的位置数据是A1、A2和A3,所以原始集合是{A1,A2,A3},并且该原始集合{A1,A2,A3}的部分集合(即对象数据)变为{A1}、{A2}、{A3}、{A1,A2}、{A1,A3}、{A2,A3}、{A1,A2,A3}。然后,产生节点,以包括其对象数据。
处理部108将通过线与节点中包括的对象数据相连的位置用作移动数据,以将具有移动数据作为元素的移动数据集登记到该节点(步骤S105)。具有对象数据{A1}的节点的移动数据集是{A2,A3}。具有对象数据{A2}的节点的移动数据集是{A1,A3}。具有对象数据{A1,A2}的节点的移动数据集是{A3}。具有对象数据{A1,A3}的节点的移动数据集是{A2}。具有对象数据{A2,A3}的节点的移动数据集是{A1}。此外,具有对象数据{A1,A2,A3}的节点的移动数据集变成了{}。
与实现示例1相同,假定图16所示的抽象方案与优先级彼此相关,并被存储在抽象方案存储部110中。
抽象部112对所有的节点应用在抽象方案存储部110中存储的优先级1的抽象化方案。如图16所示,优先级1的抽象方法是没有操作的过程。因此,节点的对象数据就是图20所示的对象数据,并且不存在改变。
对于每个节点,测试部114搜索另外的节点(步骤S109),其中所述另外的节点具有与该节点不同的用户名称,相同的位置以及不同的移动数据集。然而,在图20的情况下,因为不存在具有相同对象数据的节点,所以没有节点通过测试部114的测试(步骤S109:否)。
接下来,抽象部112对每个节点应用优先级2的抽象方法(步骤S107)。如图16所示,优先级2的抽象方法将以纬度和经度示出的位置扩展为300m直径的圆的数据(“将点扩展为300m直径的圆”)。通过这种抽象化,可以将用户位置从以纬度和经度描述的精确位置模糊化为300m直径的圆区域。即,可以将纬度和经度的准确数据通过抽象化转换为匿名的对象数据。
即,如图16所示,抽象部112可以通过对所有节点应用在抽象化方案存储部110中存储的优先级2的抽象化方案来获得图12中所示的对象数据(通过抽象化来匿名化的位置数据)。包括黑点的圆示出了300m直径的区域,以及使黑点所示的位置模糊化。例如,用户A的位置A1和用户H的位置H1被确定为处于相同位置。
测试部114检查是否处于相同位置且具有不同移动数据的其它节点的数目等于或大于阈值(步骤S109)。应该注意,假定阈值被设置为1。如果满足条件的用户的节点是1个,则该节点通过了测试。因为存在节点D1,其具有与节点A1的移动数据不同的移动数据,并且具有位置数据{D1},所以具有位置数据{A1}的节点A1通过了测试,其中该位置数据{D1}示出了与节点A1的位置相同的位置。因为存在节点E1,其具有与节点A2的移动数据不同的移动数据,并且具有位置数据{E1},所以具有位置数据{A2}的节点A1通过了测试,其中该{E1}位置数据示出了与节点A2的位置相同的位置。因为存在节点G1,其具有与节点A1的移动数据不同的移动数据,并且具有示出了与节点A3的位置相同的位置的位置数据{G1},所以具有{A3}位置数据的节点A3通过了测试。因为存在节点,其具有与节点A2和A3的移动数据不同的移动数据,并且具有位置数据{F1,F2},所以具有{A2,A3}位置数据的节点A2和A3通过了测试,其中该{F1,F2}位置数据示出了与位置数据{A2,A3}的位置相同的位置。然而,其它节点A1和A2(位置数据{A1,A2})、节点A1和A3(位置数据{A1,A3})和节点A1、A2和A3(位置数据{A1,A2,A3})没有通过测试。按照这种方式,因为包括A1、A2和A3的其它节点没有通过测试,所以所有节点变为用于抽象化的对象(步骤S109:否)。
接下来,抽象部112对所有节点应用优先级3的抽象方法。如图16所示,优先级3的抽象方法将以纬度和经度示出的位置数据扩展到500m直径范围内的圆中(“将位置扩展为500m范围”)。通过这种抽象化,使位置数据从以纬度和经度描述的数据模糊化为500m直径的圆的区域数据。即,将对象数据从300m范围的数据进一步抽象化为匿名数据。
即,如图22所示,抽象部112对所有节点应用在抽象化方案存储部110中存储的优先级3的抽象化方案,以产生具有对象数据(进一步抽象化和匿名化的位置数据)的节点。包括黑点的圆示出了500m直径的区域,以及使黑点所示的位置模糊化。例如,用户A的位置A1和用户B的位置B1被确定为处于相同位置。
对于所有节点,测试部114再次检查是否存在处于相同位置且具有不同移动数据的一个或多个节点(步骤S109)。在这种情况下,因为所有节点都通过了测试(步骤S109:是),所以在匿名数据存储部116中存储所有的位置A1、A2和A3(步骤S111)。
例如,可以在图23中示出关于用户A和用户B的匿名数据存储部116。如图23所示,通过扩展(抽象化)位置的范围并增加处于类似位置的用户,来尝试匿名化。
(实现示例3)
接下来,将描述作为本发明信息管理装置实现示例的示例(样本产生阶段),其中当用户参照基于匿名阈值之间的差异的样本时,确定适当阈值。该实现示例示出了第三示例实施例的具体实例。
与实现示例2相同,数据接收部102周期性地从用户A至用户H接收位置数据,以及当在地图上示出位置数据列表时,将如图20所示的位置数据列表存储在用户数据存储部104中(步骤S101)。
假定可以为测试部114设置的阈值是以下任何一个:0、0.2和1。阈值“0”表示,允许在用户的所有节点中不存在位置数据相同而移动数据不同的用户。阈值“0.2”表示,在用户所有节点中的20%节点中,存在位置数据相同而移动数据不同的至少一个用户。阈值“1”表示,在用户的所有节点中,存在位置数据相同而移动数据不同的至少一个用户。
首先,呈现部304设置“0”作为测试部114的阈值(步骤S301)。因为在阈值“0”的情况下利用优先级1执行测试,产生图24的位置数据作为样本(步骤S201、S105至S109和S303)。
接下来,因为呈现部304可以设置另一阈值(步骤S305:是),所以呈现部304为测试部114设置“0.2”的阈值(步骤S301)。因为通过应用优先级2的抽象化方案,7个节点中的两个节点通过了测试,所以在这种情况下,产生图25的样本(步骤S201、S105至S109、S303)。
此外,因为呈现部304可以设置其它阈值(步骤S305:是),呈现部304为测试部114设置“1”的阈值(步骤S301)。如实现2中所描述的,通过应用优先级3的抽象化方案而使全部7个节点通过测试,则产生图26的样本。
因此,呈现部304向用户A呈现形成的三个样本和阈值,以及用户A比较样本,并为设置接收部302设置阈值中用户A想要的期望阈值。
(实现示例4)
接下来,将参考图27描述作为本发明信息管理装置实现示例的匿名化算法,该算法满足了(形成了MDLD保证)MDLD(多维l多样性)。该实现示例示出了第二示例实施例的一个转化示例。
首先,第二提取部206参照用户数据存储部104,并且获取目标用户的移动区域(包括纬度和经度形式的节点)(步骤S401)。目标用户是所有用户。
此处,该移动区域示出了用户停留的一个或多个位置或者用户现在从其移动的一个或多个位置,以及该移动区域包括一个或多个节点。该移动区域与部分集合(或者第二示例实施例中的节点)相对应,其中该部分集合是第二示例实施例中幂集的元素。此外,本实现示例中的节点示出了以纬度和经度以及网格编码(通过数字表示来区分网格的编码)示出的用户的一个位置。即,节点与第二示例实施例中的节点包括的位置(数据)相对应。例如,网格是由国家事务和通信管理局定义的区域网格,对象的分类包括1/4网格(250m×250m)、1/2网格(500m×500m),2倍网格(2km×2km)。
接下来,第二提取部206将目标用户在移动区域中的节点从纬度和经度形式的数据转换为最小区域的数据(步骤S402)。例如,第二提取部206将移动区域中纬度和经度形式的节点转换为1/4网格编码。目标用户是所有用户。此时,处理部108提取每个移动区域中的预定移动数据,并将其分配相应移动区域,作为移动数据集。
对于每个目标用户,重复以下步骤S404至S406的匿名化,直到完成了所有目标用户的匿名化为止(步骤S403:是)。
测试部114计算所有节点的MDLD适应率(步骤S404)。即,测试部114计算在某一用户的移动区域中包括的所有节点的MDLD适应率。
此处,MDLD适应率如下。存在在用户的移动区域中包括的(用户的)n个位置(节点)。当关注一个节点时,包括该节点在内的位置的重叠的组合是2n-1种。从2n-1种组合中将所有节点重叠的情况排除后得到2n-1-1种组合,在该2n-1-1种组合中,与其它用户的一个或多个组合相重叠的一些组合被称作MDLD适应率。例如,当关注包括四个节点P1、P2、P3和P4的动作中的一个节点P1时,则包括节点P1的位置的重叠是{P1}、{P1、P2}、{P1、P3}、{P1、P4}、{P1、P2、P3}、{P1、P2、P4}、{P1、P3、P4},并且存在7(=24-1-1)种组合。此处,当只存在如下其它用户(等于或大于一个)时,则MDLD自适应比率是2/7,其中所述其它用户包括与动作范围中的{P1、P2}、{P1、P4}相同的位置。
抽象部112对具有最低MDLD适应率和节点优先级的节点进行抽象,并使其无效(步骤S405)。通过1个步骤(例如,图16中所示的优先级步骤)抽象化在移动区域中包括的有效节点的最低MDLD自适应比率的节点的区域。此处,当相应节点的区域是双网格编码时,则使该节点(与优先级4的位置数据删除相对应)无效。
在这种情况下,可以通过1个步骤抽象化如下节点:具有最低MDLD适应率及在移动区域中包括的有效节点的最低节点优先级的节点。此处,节点优先级是节点本身的优先级,在动作范围的情况下,则使诸如家和办公室之类更频繁访问的地点的优先级更高。例如,可以通过如下步骤确定优先级:参照用户数据存储部104,以及提取并比较访问每个节点和在每个节点停留的频率。
测试部114确定是否所有有效节点的MDLD适应率是1(步骤S406)。当所有有效节点的适应率变为“1”时,就完成了对一个用户的移动区域的匿名化处理。
在上述示例实施例(实现示例)中,作为本发明的一部,以下组件的任意组合都是有效的,即示例实施例(实现示例)与示例实施例(实现示例)的变型之间的组件,方法、装置、存储介质、计算机程序等之间的组件。
此外,示例实施例(实现示例)中的各种组件并没有必要总是分别独立存在。可以将多个组件形成为一个装置,可以将多个装置中的每个装置的一个元件形成为一个组件,以及组件可以是另一组件的一部。此外,组件的一部可以与另一组件的一部重叠。
此外,在示例实施例中的数据处理方法和计算机程序中,提到了按照顺序的多个过程。然而,该顺序并没有限制多个过程的执行顺序。因此,当示例实施例(实现示例)中的数据处理方法和计算机程序执行时,可以在不妨碍内容的范围内改变多个过程的顺序。
此外,示例实施例(实现示例)中的数据处理方法和计算机程序的多个过程不限于按照不同的时序执行。因此,可以在过程的执行期间出现另一过程,两个或多个过程之间的一部或全部执行时间可以重叠。
尽管已经参考示例实施例(实现示例)描述了本发明,但是本发明不限于示例实施例(实现示例)。本领域技术人员可以理解的本发明结构中的各种修改在本发明的范围内。此外,可能的是,在没有出现技术冲突的范围内组合示例实施例(实现示例)。
本申请要求2009年10月9日提交的日本专利申请号JP2009-234897的优先权,在此并入其公开作为参考。
Claims (9)
1.一种信息管理装置,包括:
数据接收部,被配置为周期性地从多个移动终端接收位置数据,其中所述位置数据包括示出了所述多个移动终端中的每个移动终端的位置的位置测量数据、以及包括所述位置测量数据的位置测量时间以及具有所述移动终端的用户的识别数据的伴随数据;
用户数据存储部,被配置为存储所述数据接收部接收的位置数据,作为每个用户的动作历史;
第二提取部,被配置为针对所述用户数据存储部中存储的动作历史的至少一个位置数据,产生幂集,以及通过将在所述幂集中的每个元素用作对象数据,来产生包括位置数据中用户的所述识别数据和所述对象数据在内的节点;
处理部,被配置为相对于所述节点中包括的所述对象数据,将移动数据集登记到所述节点,所述移动数据集具有作为元素的至少一个如下位置数据:对向对象数据所示位置移动之前的位置加以表示的位置数据,以及对从对象数据所示的位置移动之后的位置加以表示的位置数据;
抽象化方案存储部,被配置为存储位置数据的抽象化方案;
抽象部,被配置为将在所述抽象化方案存储部中存储的抽象化方案应用于所述节点的对象数据;
测试部,被配置为提取其它节点,以及当其它节点的数目等于或大于预定阈值时,输出具有由所述抽象部抽象的对象数据的节点的对象数据,作为匿名数据,其中所述其它节点中的每一个具有与所述节点的用户的识别数据不同的识别数据,并且具有与所述节点的对象数据的位置相同的位置的对象数据、或所述节点的对象数据的位置中包括的位置的对象数据,以及所述其它节点中的每一个具有移动数据集,该移动数据集与所述节点的移动数据集之间的积集是空集;以及
呈现部,被配置为当所述节点通过了所述测试部基于所述阈值之间的差异的测试时,向用户呈现匿名数据的差异。
2.根据权利要求1所述的信息管理装置,其中所述抽象化方案存储部使抽象化方案与优先级相关,并存储该抽象化方案和该优先级,
其中当其它节点的数目小于所述阈值时,所述抽象部通过所述抽象化方案存储部中存储的抽象化方案之中与基于抽象化的次数而确定的优先级相关的抽象化方案,来进一步抽象化所述节点的对象数据,以及
其中所述测试部针对具有由所述抽象部抽象的对象数据的节点,提取其它节点,以及当所述其它节点的数目等于或大于所述阈值时,输出所述节点的所述对象数据,作为匿名数据。
3.根据权利要求1所述的信息管理装置,其中对于在所述对象数据中包括的所有位置数据,所述测试部计算每个位置数据的多样性适应率,并且当所述所有位置数据的所述多样性适应率等于或大于阈值时,输出所述节点的所述对象数据,作为匿名数据,
其中所述位置数据的所述多样性适应率是表示组合的数目的值,在所述组合中,所述节点的位置数据与其它用户的位置数据相重叠,其中当存在n个位置数据时,通过从每个位置数据的位置的重叠的2n-1种组合中减去当所述所有位置数据重叠时的组合来获得2n-1-1种组合,所述组合来自于该2n-1-1种组合,以及
其中当所述所有位置数据的所述多样性适应率小于所述阈值时,所述抽象部对具有最低多样性适应率的所述位置数据进行一次进一步的抽象。
4.根据权利要求1所述的信息管理装置,其中所述抽象化方案是以下抽象化方案之一:位置测量时间的抽象化、用户识别数据的删除、位置测量数据的抽象化以及位置数据的部分删除。
5.根据权利要求1所述的信息管理装置,还包括:
管理部,被配置为执行如下管理:对所述抽象化方案存储部的抽象化方案进行添加、删除和改变。
6.根据权利要求1所述的信息管理装置,还包括:
设置接收部,被配置为设置所述阈值,使得所述节点通过所述测试部的测试。
7.一种信息管理装置的数据处理方法,所述信息管理装置包括用户数据存储部和抽象化方案存储部,所述用户数据存储部存储从多个移动终端中的每一个接收的位置数据,作为每个用户的动作历史,其中所述位置数据包括对所述移动终端的位置加以表示的位置测量数据、以及包括所述位置测量数据的测量时间和所述移动终端的用户的识别数据在内的伴随数据,所述抽象化方案存储部存储了所述位置数据的抽象化方案,
所述数据处理方法包括:
周期性地从所述移动终端接收位置数据;
针对在所述用户数据存储部中存储的动作历史的至少一个位置数据,产生幂集,以及通过将所述幂集中的每个元素用作对象数据,来产生包括位置数据中用户的所述识别数据和所述对象数据在内的节点;
相对于所述节点中包括的所述对象数据,将移动数据集登记到所述节点,其中所述移动数据集具有作为元素的至少一个如下位置数据:对向对象数据所示位置移动之前的位置加以表示的位置数据、以及对从所述对象数据所示位置移动之后的位置加以表示的位置数据;
将在所述抽象化方案存储部中存储的抽象化方案应用于所述节点的所述对象数据;
提取其它节点,以及当其它节点的数目等于或大于预定阈值时,输出具有由抽象部抽象的对象数据的节点的对象数据,作为匿名数据,其中所述其它节点中的每个节点具有与所述节点的用户的识别数据不同的识别数据,并且具有与所述节点的对象数据的位置相同的位置的对象数据、或在所述节点的对象数据的位置中包括的位置的对象数据,以及所述其它节点中的每个节点具有移动数据集,该移动数据集与所述节点的移动数据集之间的积集是空集;以及
当所述节点通过了基于所述阈值之间的差异的测试时,向用户呈现匿名数据的差异。
8.根据权利要求7所述的数据处理方法,其中所述抽象化方案存储部使抽象化方案与优先级相联系,并存储该抽象化方案和该优先级,以及
其中所述数据处理方法进一步包括:
当其它节点的数目小于所述阈值时,通过所述抽象化方案存储部中存储的抽象化方案之中与基于抽象化的次数而确定的优先级相关的抽象化方案,来抽象化所述节点的对象数据,以及
针对具有由抽象部抽象的对象数据的节点,提取所述其它节点,以及当所述其它节点的数目等于或大于所述阈值时,输出所述节点的所述对象数据,作为匿名数据。
9.根据权利要求7所述的数据处理方法,其中输出所述节点的对象数据作为匿名数据包括:
对于在所述对象数据中包括的所有位置数据,计算每个位置数据的多样性适应率,并且当所述所有位置数据的所述多样性适应率等于或大于阈值时,输出所述节点的所述对象数据,作为匿名数据,
其中所述位置数据的所述多样性适应率是表示组合的数目的值,在所述组合中,所述节点的位置数据与其它用户的位置数据相重叠,其中,当存在n个位置数据时,通过从每个位置数据的位置的重叠的2n-1种组合中减去当所述所有位置数据重叠时的组合来获得2n-1-1种组合,所述组合来自于该2n-1-1种组合,以及
其中应用抽象化方案包括:
当所述所有位置数据的所述多样性适应率小于所述阈值时,对具有最低多样性适应率的所述位置数据进行一次进一步的抽象。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009-234897 | 2009-10-09 | ||
JP2009234897 | 2009-10-09 | ||
PCT/JP2010/067646 WO2011043418A1 (ja) | 2009-10-09 | 2010-10-07 | 情報管理装置、そのデータ処理方法、およびコンピュータプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
CN102667830A CN102667830A (zh) | 2012-09-12 |
CN102667830B true CN102667830B (zh) | 2016-03-23 |
Family
ID=43856868
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201080045407.6A Active CN102667830B (zh) | 2009-10-09 | 2010-10-07 | 信息管理装置以及数据处理方法 |
Country Status (5)
Country | Link |
---|---|
US (2) | US8566357B2 (zh) |
EP (1) | EP2487639A4 (zh) |
JP (1) | JP5757241B2 (zh) |
CN (1) | CN102667830B (zh) |
WO (1) | WO2011043418A1 (zh) |
Families Citing this family (29)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2012067213A1 (ja) * | 2010-11-16 | 2012-05-24 | 日本電気株式会社 | 情報処理システム及び匿名化方法 |
JP5839460B2 (ja) * | 2011-10-06 | 2016-01-06 | Kddi株式会社 | 公開情報のプライバシー保護装置、公開情報のプライバシー保護方法およびプログラム |
US8677154B2 (en) * | 2011-10-31 | 2014-03-18 | International Business Machines Corporation | Protecting sensitive data in a transmission |
JP5758315B2 (ja) * | 2012-01-27 | 2015-08-05 | 日本電信電話株式会社 | 匿名データ提供システム、匿名データ装置、及びそれらが実行する方法 |
TW201331770A (zh) * | 2012-01-31 | 2013-08-01 | Ibm | 在資料組中保存隱私的方法與系統 |
JP6125153B2 (ja) * | 2012-04-27 | 2017-05-10 | Kddi株式会社 | 位置情報匿名化装置、位置情報匿名化方法およびプログラム |
JP5962472B2 (ja) * | 2012-12-03 | 2016-08-03 | 富士通株式会社 | 匿名化データ生成方法、装置及びプログラム |
JP6042229B2 (ja) * | 2013-02-25 | 2016-12-14 | 株式会社日立システムズ | k−匿名データベース制御サーバおよび制御方法 |
JP2014164477A (ja) * | 2013-02-25 | 2014-09-08 | Hitachi Systems Ltd | k−匿名データベース制御装置及び制御方法 |
US9594926B2 (en) | 2013-03-05 | 2017-03-14 | Hitachi, Ltd. | Data processing apparatus, data processing system, and data processing method |
JP6063821B2 (ja) * | 2013-06-12 | 2017-01-18 | 株式会社日立ソリューションズ | センサデータ管理システム |
JP2015103025A (ja) * | 2013-11-25 | 2015-06-04 | 富士通株式会社 | 経路情報処理装置、方法、及びプログラム |
JP6053181B2 (ja) * | 2014-02-25 | 2016-12-27 | 日本電信電話株式会社 | 情報収集システムとその情報収集装置、情報提供装置、匿名情報収集方法及びプログラム |
JP6264656B2 (ja) * | 2014-05-08 | 2018-01-24 | 学校法人慶應義塾 | 匿名化システム、発行装置及びプログラム |
CA2852253A1 (en) * | 2014-05-23 | 2015-11-23 | University Of Ottawa | System and method for shifting dates in the de-identification of datesets |
CN104199829B (zh) * | 2014-07-25 | 2017-07-04 | 中国科学院自动化研究所 | 情感数据分类方法和系统 |
JP5951907B1 (ja) * | 2014-09-12 | 2016-07-13 | エブリセンス インク | 情報仲介システム |
JP6456162B2 (ja) * | 2015-01-27 | 2019-01-23 | 株式会社エヌ・ティ・ティ ピー・シー コミュニケーションズ | 匿名化処理装置、匿名化処理方法及びプログラム |
JP6469465B2 (ja) * | 2015-02-02 | 2019-02-13 | 株式会社インテック | 位置情報管理装置及び位置情報管理方法 |
US10552870B1 (en) * | 2016-06-30 | 2020-02-04 | Quantcast Corporation | Privacy-safe frequency distribution of geo-features for mobile devices |
JP6588880B2 (ja) * | 2016-09-30 | 2019-10-09 | 日本電信電話株式会社 | 匿名化装置、匿名化方法、およびプログラム |
JP2018198038A (ja) * | 2017-05-25 | 2018-12-13 | ソニー株式会社 | 情報処理装置、情報処理方法及びコンピュータプログラム |
JP6271799B1 (ja) * | 2017-07-18 | 2018-01-31 | ヤフー株式会社 | データ管理システム、およびデータ管理方法 |
CN109547477B (zh) * | 2018-12-27 | 2021-04-23 | 石更箭数据科技(上海)有限公司 | 一种数据处理方法及其装置、介质、终端 |
WO2020175305A1 (ja) * | 2019-02-26 | 2020-09-03 | 日本電信電話株式会社 | 匿名性評価装置、匿名性評価方法、プログラム |
JP7304234B2 (ja) * | 2019-08-09 | 2023-07-06 | 株式会社日立製作所 | データサーバ、秘匿匿名化システム、及び暗号化方法 |
JP2023007071A (ja) * | 2021-07-01 | 2023-01-18 | 株式会社MaaS Tech Japan | プログラム及び情報処理装置 |
EP4209952A1 (en) * | 2022-01-06 | 2023-07-12 | Volkswagen Ag | A method, a computer program product and a device for dynamic spatial anonymization of vehicle data in a cloud environment |
WO2023131684A1 (en) * | 2022-01-06 | 2023-07-13 | Volkswagen Aktiengesellschaft | A method, a computer program product and a device for dynamic spatial anonymization of vehicle data in a cloud environment |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1395708A (zh) * | 2000-11-16 | 2003-02-05 | 株式会社Ntt都科摩 | 移动状态信息提供方法和服务器 |
WO2009096015A1 (ja) * | 2008-01-31 | 2009-08-06 | Fujitsu Limited | 公開情報送信方法、公開情報送信システム、中央装置及びプログラム |
Family Cites Families (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20020111172A1 (en) | 2001-02-14 | 2002-08-15 | Dewolf Frederik M. | Location based profiling |
JP2004029940A (ja) | 2002-06-21 | 2004-01-29 | Sony Corp | 情報提供システム、情報処理装置および方法、記録媒体、並びにプログラム |
US7751825B2 (en) | 2002-06-27 | 2010-07-06 | Qualcomm Incorporated | Controlling geographic location information of devices operating in wireless communication systems |
US7202801B2 (en) * | 2002-12-11 | 2007-04-10 | Geospatial Technologies, Inc. | Method and apparatus for an automated location-based, dynamic notification system (ALDNS) |
JP4429619B2 (ja) | 2003-04-15 | 2010-03-10 | 三菱電機株式会社 | 情報提供装置 |
JP2005031965A (ja) | 2003-07-11 | 2005-02-03 | Nippon Telegr & Teleph Corp <Ntt> | プレゼンス情報利用方法、情報利用者側端末装置、情報提供者側端末装置およびサーバ装置 |
JP4417132B2 (ja) * | 2004-02-19 | 2010-02-17 | 日本電信電話株式会社 | プライバシ情報管理サーバ及び方法並びにプログラム |
JP2005244547A (ja) * | 2004-02-26 | 2005-09-08 | Nippon Telegr & Teleph Corp <Ntt> | 位置情報提供条件決定方法とそのプログラム、位置情報送信装置、位置情報受信装置及び移動通信端末 |
JP2005346248A (ja) | 2004-06-01 | 2005-12-15 | Mpo:Kk | 情報仲介方法及び装置 |
US7707413B2 (en) * | 2004-12-02 | 2010-04-27 | Palo Alto Research Center Incorporated | Systems and methods for protecting private information in a mobile environment |
JP4822842B2 (ja) | 2005-12-28 | 2011-11-24 | 株式会社エヌ・ティ・ティ・データ | 匿名化識別情報生成システム、及び、プログラム。 |
JP2007219636A (ja) | 2006-02-14 | 2007-08-30 | Nippon Telegr & Teleph Corp <Ntt> | データ開示方法およびデータ開示装置 |
US8571580B2 (en) * | 2006-06-01 | 2013-10-29 | Loopt Llc. | Displaying the location of individuals on an interactive map display on a mobile communication device |
WO2008108158A1 (ja) * | 2007-03-02 | 2008-09-12 | Nec Corporation | 情報開示制御システム、情報開示制御プログラム、情報開示制御方法 |
JP5333891B2 (ja) | 2008-03-28 | 2013-11-06 | 住友大阪セメント株式会社 | セメントモルタル用組成物、および舗装体の補修方法 |
-
2010
- 2010-10-07 CN CN201080045407.6A patent/CN102667830B/zh active Active
- 2010-10-07 WO PCT/JP2010/067646 patent/WO2011043418A1/ja active Application Filing
- 2010-10-07 EP EP10822088.0A patent/EP2487639A4/en not_active Withdrawn
- 2010-10-07 JP JP2011535451A patent/JP5757241B2/ja active Active
- 2010-10-07 US US13/500,854 patent/US8566357B2/en active Active
-
2013
- 2013-09-09 US US14/021,327 patent/US8849861B2/en active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1395708A (zh) * | 2000-11-16 | 2003-02-05 | 株式会社Ntt都科摩 | 移动状态信息提供方法和服务器 |
WO2009096015A1 (ja) * | 2008-01-31 | 2009-08-06 | Fujitsu Limited | 公開情報送信方法、公開情報送信システム、中央装置及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
US20120197915A1 (en) | 2012-08-02 |
EP2487639A1 (en) | 2012-08-15 |
EP2487639A4 (en) | 2017-05-24 |
CN102667830A (zh) | 2012-09-12 |
JPWO2011043418A1 (ja) | 2013-03-04 |
US8566357B2 (en) | 2013-10-22 |
US8849861B2 (en) | 2014-09-30 |
US20140040289A1 (en) | 2014-02-06 |
JP5757241B2 (ja) | 2015-07-29 |
WO2011043418A1 (ja) | 2011-04-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN102667830B (zh) | 信息管理装置以及数据处理方法 | |
US20180322175A1 (en) | Methods and systems for analyzing entity performance | |
US9298897B2 (en) | Method of and systems for privacy preserving mobile demographic measurement of individuals, groups and locations over time and space | |
EP2884439A1 (en) | Methods and systems for analyzing entity performance | |
US20150302431A1 (en) | Method, management server and computer readable recording medium for managing a customer relationship | |
US8069137B2 (en) | Methods, systems, and storage mediums for implementing intelligent agent services | |
Slough et al. | External Validity and Meta‐Analysis | |
CN102067126A (zh) | 对分布式搜索的结果进行货币化和优先级区分 | |
CN102057376B (zh) | 用于进行分布式搜索的方法 | |
US20100042575A1 (en) | Methods, systems, and computer program products for implementing ontological domain services | |
CN112819544A (zh) | 基于大数据的广告投放方法、装置、设备及存储介质 | |
CN104750860B (zh) | 一种不确定数据的数据存储方法 | |
CN111755092B (zh) | 一种医疗数据互联互通方法及医疗系统 | |
Yin et al. | Exploring individual activity-travel patterns based on geolocation data from mobile phones | |
Amichi et al. | Revealing an inherently limiting factor in human mobility prediction | |
CN109919811A (zh) | 基于大数据的保险代理人培养方案生成方法及相关设备 | |
Ahmed | Retrieving Mobile Phone Information Based on Digital Search Tree | |
US20230237521A1 (en) | System and method for merging a two or more multi-level marketing system into a multi-line multi-level marketing system and identifying cross-line re-entry in the commission tree | |
Rodrigues | My places identification of user’s geographic map | |
JP2002215866A (ja) | 経営分析システム | |
Fageeri et al. | Analyzing Customer Satisfaction Over Telecom Companies in Sudan Using Apriori Algorithm | |
CN117472783A (zh) | 测试一体化平台 | |
CN117370446A (zh) | 一种基于用户行为的分析标记方法 | |
CN117009202A (zh) | 埋点数据处理方法、装置、设备及存储介质 | |
CN111400568A (zh) | 行为意图分析方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |