CN104011720B - 行动属性分析方法以及装置 - Google Patents
行动属性分析方法以及装置 Download PDFInfo
- Publication number
- CN104011720B CN104011720B CN201280063302.2A CN201280063302A CN104011720B CN 104011720 B CN104011720 B CN 104011720B CN 201280063302 A CN201280063302 A CN 201280063302A CN 104011720 B CN104011720 B CN 104011720B
- Authority
- CN
- China
- Prior art keywords
- scene
- vector
- life pattern
- cluster
- pattern
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/28—Databases characterised by their database models, e.g. relational or object models
- G06F16/284—Relational databases
- G06F16/285—Clustering or classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
- G06Q30/0204—Market segmentation
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Strategic Management (AREA)
- Entrepreneurship & Innovation (AREA)
- Finance (AREA)
- Development Economics (AREA)
- Accounting & Taxation (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Economics (AREA)
- Data Mining & Analysis (AREA)
- Game Theory and Decision Science (AREA)
- Databases & Information Systems (AREA)
- Tourism & Hospitality (AREA)
- Quality & Reliability (AREA)
- Operations Research (AREA)
- Human Resources & Organizations (AREA)
- General Engineering & Computer Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
提供一种技术,从积蓄了人的行动的履历数据中提取用户的行动模式,使用该模式从场所或时间等多样的观点上总括且高效地对用户的行动的倾向或特征进行分析。本发明所涉及的行动属性分析装置通过将人群的行动记载为每个时间段的场景值而成的场景矢量来表现行动模式,通过对场景矢量进行聚类而提取出人群整体所包含的生活模式后,基于各人符合哪个生活模式而进行分类(参照图1)。
Description
技术领域
本发明涉及使用人的行动属性来对分析对象进行分类的方法及其装置。
背景技术
便携电话那样的便携通信设备与其基站之间的无线通信记录、或道路交通系统中的汽车的探测器信息表示了人的移动履历。同样可以说交通系统IC卡的利用履历也表示了人的移动履历。在对交通系统IC卡赋予电子货币功能的情况下,可以认为卡与移动履历一起还积蓄了购物这样的人的行动履历。在购物这样的观点中,信用卡的利用履历也是人的行动履历。此外,使用可佩戴于人的传感器终端测定出的人的生物体信息(体温、脉搏、手腕的加速度等)是在生理学的观点上的人的行动履历。
虽然这些履历由于记录的目的和手段不同,在一日的生活中留存在履历的部分各种各样,但都表示人何时、在何处、在做什么。在下述专利文献1以及专利文献2中,公开了从这些多样的人的行动履历中提取人的行动模式,并提供匹配于各个用户的信息的服务或营销中活用的技术。
在专利文献1中,公开了从交通系统IC卡的利用履历中提取用户的移动或购物等的行动模式,并使用该模式提供匹配于用户的行动的信息的技术。在专利文献1中行动模式是交通系统IC卡的用户所利用的车站或店铺的列表。通过使用该模式能够掌握用户的移动或购物的倾向。
在专利文献2中,公开了使用用户所携带的移动终端和店铺中设置的无线台来积蓄用户的来店履历,从该来店履历中提取用户的店铺的变迁模式,使用该模式将用户下次来店的可能性高的店铺的信息分发至用户之下的技术。在专利文献2中行动模式是关于某店铺下次来店的店铺的ID(识别符)和来店的次数、以及基于来店次数的店铺间的变迁概率的列表。通过对每个用户生成该行动模式,能够掌握用户利用店铺的倾向。
先行技术文献
专利文献
专利文献1:(日本)特开2010-157055号公报
专利文献2:(日本)特开2004-70419号公报
发明的概要
发明要解决的课题
通过使用上述专利文献1以及2中记载的行动模式,能够掌握用户的移动或购物等行动的倾向,实现匹配于个人的服务,但另一方面存在如下的课题。
(课题一)
上述专利文献1以及2中记载的行动模式并未考虑用户“何时”利用了车站、设施、店铺名。例如,认为在某车站的用户利用车站内的便利店的状况下,在早上利用的用户、在白天利用的用户、或仅平日/仅休息日利用的用户的利用的目的分别不同,但在专利文献1以及2中记载的行动模式中作为相同的模式而处理。因此,根据用户的行动的模式能够掌握的仅是在车站、设施、店铺的“场所”的观点上的用户的倾向,难以在早上、白天、平日、休息日等“时间”的观点上掌握用户的倾向。
(课题二)
由于若用户的数目或取得行动履历的期间扩大则行动模式的数目爆发性地增加,所以难以总括地掌握用户的倾向。由于专利文献1中记载的行动模式将用户所利用的车站、设施、店铺名设为模式的属性,专利文献2中记载的行动模式将店铺、设施的代码设为模式的属性,因此若车站、设施、店铺不同,则成为不同的模式。因此,在这些文献中记载的技术中,生成无数行动模式。因此,现实的是仅将以模式的出现频度为依据的“经常”即高频度的模式设为分析对象。此时,很难找到重复利用店铺名不同但类型相同的店铺的模式、或各用户的利用频度低但整体上被看做特定的倾向的模式(在理发店之后通过电车出行等)等。
在从用户的行动履历中提取用户的行动模式而活用于信息提供或营销时,优选能够以一定程度的规模(一万人以上等)且总括地分析用户的行动。但是在专利文献1以及2中记载的技术中,可以说在观点的多样性和处理的效率性上存在课题。
发明内容
本发明是为了解决上述那样的课题而完成的,提供从积蓄了人的行动而成的履历数据中提取用户的行动模式,使用该模式而在场所或时间等多样的观点上总括且高效地分析用户的行动的倾向或特征的技术。
用于解决课题的手段
本发明所涉及的行动属性分析装置通过将人群的行动记载为每个时间段的场景(scene)值的场景矢量来表现行动模式,通过对场景矢量进行聚类来提取人群整体所包含的生活模式后,对各人符合哪个生活模式进行分类。
发明效果
根据本发明所涉及的行动属性分析装置,能够在场所或时间等多样的观点上总括且高效地分析用户的行动的倾向或特征。
附图说明
图1是实施方式一所涉及的行动属性分析装置1的结构图。
图2是表示行动属性分析装置1的硬件结构的图。
图3是表示IC卡利用履历103的数据结构的图。
图4是表示信用卡利用履历104的数据结构的图。
图5是表示场景列表105的数据结构的图。
图6是表示事件列表106的数据结构的图。
图7是表示场景矢量表107的数据结构的图。
图8是表示目标场景矢量表205的数据结构的图。
图9是表示生活模式表206的数据结构的图。
图10是表示用户信息209的数据结构的图。
图11是表示场所信息210的数据结构的图。
图12是表示日历信息211的数据结构的图。
图13是表示特征矢量表305的数据结构的图。
图14是表示簇表306的数据结构的图。
图15是表示提取条件207的一例的图。
图16是表示提取参数208的一例的图。
图17是表示分析条件307的一例的图。
图18是表示分析参数308的一例的图。
图19是表示实施方式一中的行动属性分析装置1的处理步骤的流程图。
图20是表示步骤S10的处理步骤的流程图。
图21是表示步骤S20的处理步骤的流程图。
图22是表示步骤S30的处理步骤的流程图。
图23是说明行动属性分析装置1的场景提取规则以及表示场景的数值的图。
图24是表示场景提取部101实施的步骤S101的详细的处理步骤的流程图。
图25是表示生活模式提取条件设定部201实施的步骤S201的详细的处理步骤的流程图。
图26是表示生活模式提取条件设定部201显示的生活模式提取条件设定画面的一例的图。
图27是表示生活模式提取条件设定部201显示的加权设定画面的一例的图。
图28是表示生活模式提取条件设定部201显示的属性追加设定画面的一例的图。
图29是表示生活模式提取条件设定部201显示的参数设定画面的一例的图。
图30是表示显示所提取的生活模式的画面的一例的图。
图31是表示簇分析条件设定部301实施的步骤S301的详细的处理步骤的流程图。
图32是表示簇分析条件设定部301在步骤S301中显示的生活模式簇分析条件设定画面的一例的图。
图33是表示在点击了提取条件显示按钮301112时显示的生活模式提取条件显示画面的一例的图。
图34是表示在点击了参数设定指示按钮301131时显示的参数设定画面的一例的图。
图35是表示特征矢量生成部302实施的步骤S302的详细的处理步骤的流程图。
图36是表示簇显示部304部显示簇的画面的一例的图。
图37是表示详细分析的画面的一例的图。
图38是表示详细分析的画面的一例的图。
图39是表示饼图显示的一例的图。
图40是表示矩阵显示的一例的图。
图41是实施方式二所涉及的行动属性分析装置1的结构图。
图42是表示模式矢量表405的数据结构的图。
图43是表示期间生活模式表406的数据结构的图。
图44是表示提取条件407的一例的图。
图45是表示提取参数408的一例的图。
图46是表示实施方式二中的行动属性分析装置1的处理步骤的流程图。
图47是表示期间生活模式提取部40的处理步骤的流程图。
图48是表示模式提取条件设定部401中的期间生活模式提取条件设定画面的一例的图。
图49是表示在点击了参数设定指示按钮40141时显示的参数设定画面的一例的图。
图50是表示期间生活模式显示部404将所生成的簇表现为一日的模式的变迁,并显示给分析者的画面的一例的图。
图51是表示实施方式三所涉及的行动属性分析装置1的整体结构的图。
具体实施方式
以下,首先关于本发明的思路说明概略,之后说明具体的实施方式。
<本发明的概略>
在本发明中,通过以下的三个方法(1)场景矢量生成~(3)生活模式簇分析,使用人群的行动属性对分析对象进行分析。(1)在场景矢量生成中将行动履历表现为后述的场景矢量,(2)在生活模式提取中从场景矢量的集合中提取生活模式,(3)在生活模式簇分析中基于分析对象属于各生活模式的哪个而进行分类。以下,说明各方法的概略。
(1)场景矢量生成
在本发明中通过将用户的一日作为“场景”的变迁把握,将时刻(或者时间段)设为要素序号,将表示场景的值设为要素值的矢量(称为“场景矢量”)来表现人的行动,以便能够针对用户的行动不仅在场所上而且在时间或行动的目的等多样的观点上掌握倾向。例如在将用户的行动表现为每1小时的场景变迁的情况下,场景矢量具有24个(对应于1日=24小时)要素,各要素值成为表示该用户每1小时度过的场景的值。具体而言通过以下的处理生成场景矢量。
(1.1)场景的提取
场景是指“在自家度过”、“在职场或学校度过”、“出去游玩”等、人具有某目的在某场所度过的时间。认为人在一日度过的场景的数目最多也小于10个。在本发明中,基于用户的行动履历中记录的移动时间、在移动目的地的场所停留的长度、在该场所停留的频度等,推定并提取该场景。具体而言,认为将从平日的早晨至傍晚/夜晚为止长时间停留的场所推定为“职场”或“学校”,不限于星期几而将从傍晚/夜晚至次日的早晨为止停留的场所推定为“家”,将在休息日的白天或傍晚短时间停留的场所推定为用于“购物”或“娱乐/娱乐”的场所,用户分别度过了“工作”、“自家”、“游玩”这样的场景。可提取的场景根据所利用的行动履历的特性而不同。例如在利用具有学生证或职员证的功能的交通系统IC卡的利用履历的情况下,还能够从入退室管理记录中提取“在图书馆度过”,“在5F的居室度过”,“在6F的会议室度过”等场景。
关于人具有某目的在某场所度过的“场景”,既有将几个小时设为单位的场景,也有“打电话”“买东西(支付)”“进行(简单的)进餐”等只需几秒至几十分钟的场景。在本发明中将后者的比较短时间的度过方式与“场景”区分而称为“事件”。在从人的行动履历中可提取的事件中,例如从便携电话的移动履历中有“通话”这样的事件,或从附有电子货币功能的交通系统IC卡的利用履历中有“支付”这样的事件。进而若能够对用户建立关联则能够从多个行动的履历中提取事件。例如,若汽车的用户加入使用了探测器信息的收费的服务(作为一例“基于运营者的信息提供”),并通过汽车公司合作的信用卡进行该费用的支付,则能够将汽车的用户和信用卡的用户相关联。因此,若将汽车的探测器信息用作人的行动履历,进而将信用卡的利用履历用作第二履历,则除了根据移动推定的场景之外,还能够将店铺中的“支付”提取为事件。若能够这样将主要的行动履历与用户建立对应,则能够利用如下的履历作为用于提取事件的第二履历。例如存在店铺的会员卡或点卡的利用履历(来店或购买这样的事件)、会员制HP(主页)的网络接入履历(网络阅览或网络购物中的订单这样的事件)等。在各自的履历中出现的用户的对应建立、即收集人名能够通过利用其姓名、性别、住所等注册信息来实现。
关于一日的场景变迁,基本上将以几个小时为单位的场景设为对象,“事件”可选取为“场景”之中发生的事件。例如“购物”是“出去游玩”这样的场景中发生的事件。但是根据分析的目的即使是几十分钟的事件也可以作为场景而处理。例如在使用具有前述的职员证功能的交通系统IC卡的利用履历而希望关注职员的公司生活并分析一日的度过方式的情况下,也可以将“在职员食堂进餐”这样的时间的度过方式作为场景而处理。
所提取的场景以及事件以“谁”“何时”“在何处”度过了“什么”场景/事件这样的要素来表现。各要素的具体的值根据提取场景以及事件的行动履历的特性而决定。在交通系统IC卡的利用履历的情况下,“谁”成为IC卡的用户ID、“何时”成为刷IC卡的检票机或者卡终端机的时刻,“在何处”成为检票机所在的车站名或者终端机所在的店铺名,“哪个场景”成为从IC卡的利用履历中可提取的场景或者事件名。在利用了便携电话与基站的无线通信记录或汽车的探测器信息的情况下,“在何处”成为基站或汽车的位置信息(纬度和经度)。此外,在如前述那样从信用卡的利用履历中提取的“支付”事件的情况下,“在何处”成为店铺名,除了上述四个要素之外,还能够提取“多少钱”(金额)。
(1.2)向场景的数值的变换
接着,由于将一日以场景矢量表现,所以将所提取的场景变换为数值。变换为场景的数值具体而言考虑如下的方法。首先,在将可提取的场景的数目设为N时,将出现频度最高的场景的值设为“1”、将出现频度第2高的场景的值设为“N”。将该频度第3高的场景的值设为“N-1”,将该频度第4高的场景的值设为“N-2”,以下同样地设定N个场景的值。根据这样,在用于提取后述的生活模式的聚类中,能够将在相同的时刻出现的场景之中出现频度高的场景彼此置于在矢量空间上远离的位置。
场景的值不限定于“1”“N”“N-1”…。也可以将频度最高的场景的值设为“N”,将该频度接着高的场景的值设为“1”,“2”,“3”,…,也可以是1至0的小数值。此外,决定场景的值的顺序在上述中设为出现频度的降序,但也可以是例如将多个场景在相同日同时出现的频度作为共现频度或者共现概率而计算,在将出现频度最高的场景的值设为“1”时,将相对于该场景易于同时出现的场景的值设为“N”,将相对于该场景易于同时出现的场景设为“N-1”…。
或也可以是与各场景对应的值由分析系统的管理者考虑场景的意义而任意设定。具体而言,由于“自家”和“游玩”是私人的场景,所以使其分别为“1”和”2”,使“工作”以与私人的场景存在差的方式设为“5”等。
(1.3)场景矢量的值的设定
在本发明中由于将用户的一日以场景变迁而理解,所以将用户的一日通过以时刻(或者时间段)为要素序号的场景矢量来表现。对于一日的范围的理解方式,考虑从上午0时至次日上午0时为止,或从早晨的4时至次日的早晨的4时为止等几种方式。此外,时刻有以1小时为单位,以30分为单位等,但也可以不将一定的长度设为单位,也可以是活动多的白天以30分为单位,深夜以2小时为单位等。在场景矢量的各时刻中设置表示用户度过的场景的数值而生成矢量。
另外,也可以根据行动履历预先生成场景矢量,将这些作为基本数据而进行与分析的目的相应的提取和加工,从而提取生活模式,以便能够在多样的观点上高效地分析用户的行动的倾向或特征。
关于一日的场景的变迁,若人相同、或者即使人不同但职业(公司员工、学生等)或年龄段、性别等相同,则认为有一定程度相似的倾向。因此,由于预想若将场景矢量的数据按每个用户并按每日生成则成为重复多的数据,所以也可以是场景矢量以成为唯一的列表的方式生成,按每个用户并按每日的数据设为对该列表的指针。由此能够高效地积蓄庞大的数据。
(2)生活模式提取
设想一日的场景变迁有夜晚为自家,白天为工作或学校等几个典型的模式。因此,在本发明中,对表示一日的场景变迁的场景矢量进行聚类,提取一日的场景变迁的模式(称为“生活模式”)。通过本处理,能够概略性地掌握在人群之中存在怎样的生活模式。具体而言,通过下述的处理提取生活模式。
(2.1)生活模式提取条件设定
首先,设定用于缩减希望提取生活模式的对象者的条件。具体而言,使用如下的信息设定条件。
(2.1.1)用户的属性
若有用户的年龄段、性别、住所等用户信息,则能够将这些用作生活模式的提取条件。例如若将对象者设为“30多岁的男性”或“首都内居住的20多岁女性”,则能够关于在人群之中与上述条件相符的人,提取各自的典型的一日的度过方式、即生活模式。
(2.1.2)场景的属性
如前述那样,场景通过“谁”在“何时”“何处”做“什么”而度过来表现。能够将这些场景的属性设为生活模式的提取条件。例如存在“自家在纬度x经度y的范围内的人”(在何处,做什么),“在×月△日来到○车站的人”(何时,在何处),“平日,进行工作的人”(何时,做什么)等。若使用这样的条件,则在上述例子中能够提取“自家在纬度x经度y的范围内的人”的典型的一日的度过方式(从自家去工作而直接回家、或回家时绕道等)。
(2.1.3)事件的属性
事件也与场景相同,通过“谁”在“何时”“何处”做“什么”而度过来表现,除此之外还可以有“多少钱”(金额)等依赖于履历的要素。作为使用这些的提取条件,有“○月×日在△△百货商店购物的人”(何时,在何处,做什么)、“×月○回以上利用了职员食堂的人”(何时,在何处)等。
(2.2)场景矢量的提取
按照(2.1)中说明的生活模式的提取条件,提取匹配于条件的场景矢量,在以易于提取与分析的目的相符的生活模式的方式对场景矢量进行加工之后,生成聚类对象的场景矢量(称为“目标场景矢量”)。匹配于条件的场景矢量能够通过参照用户信息或矢量所包含的场景/事件的属性而提取。作为场景矢量的加工方法,例如有场景值的加权、对场景矢量的属性附加等。这些处理仅在特别设定提取条件的情况下实施即可。以下,说明场景值的加权和属性附加。
(2.2.1)场景矢量的加权
场景矢量的加权是下述处理:以与(2.1)中说明的用于缩减希望提取生活模式的对象者的条件相符的场景矢量,成为与条件不相符的场景矢量不同的值的方式,变换场景值。由此,能够从具有同样的倾向而如果这样就不免埋没在相同的生活模式中的场景矢量之中,有意地提取与提取条件相符的场景矢量。作为场景矢量的加权的一例,在此说明基于场景的加权和基于事件的加权这两个观点上的加权。
(a)基于场景的加权
在本发明中,将一日通过场景变迁、即将表示场景的数值设为值的矢量来表现,但其中对分析者所关注的场景进行加权。例如分析的目的为“关于在×月△日来到○车站的用户,在○车站度过了怎样的场景”的情况下,首先取得包含日期为“×月△日”且场所为“○车站”的场景(不拘泥于场景的类型)的场景矢量(一日的场景的变迁),仅对场所为“○车站”的场景值附加权重。作为权重的一例,考虑使值为10倍等。或在“关于在×月来到○车站的用户,在○车站度过了怎样的场景,希望区分平日和休息日地分析”情况下,与上述相同地可列举对取得“在×月来到○车站的人”的场景矢量并对场所为“○车站”的场景附加权重,进而以平日的矢量和休息日的矢量远离地位于矢量空间上的方式,将日期为休息日(星期六/星期日)的场景矢量的值全部乘以-1的方法。
在此,作为对分析者关注的场景的加权的具体的手段,可列举对场景的值进行整数倍、或乘以-1的手段,但不限于此,能够区分与提取条件相符的场景矢量与其他场景矢量即可。可以想到考虑了场景矢量在矢量空间上的位置的各种加权手段。
(b)基于事件的加权
场景矢量由场景的变迁构成,比较短时间的时间的度过方式即事件未在场景矢量上表现。与此相对,在分析者关注于事件而希望分析的情况下,在场景矢量中,对发生事件的场景或发生事件的时刻附加权重。
例如,在分析者关注于基于信用卡的“支付”这样的事件而希望知道“在×月△日来到○车站且在A百货商店进行了购物的人,在怎样的场景中进行了购物”(“工作”的途中?“游玩”的途中?)的情况下,提取“在×月△日来到○车站,且在该日有A百货商店中的信用卡的利用履历的人”的场景矢量,对包含信用卡的精算时刻的场景进行加权(例如使值为10倍)。在还希望知道“支付”事件是处于场景最初,还是处于最后的情况下,仅对与精算时刻对应的时刻的值进行加权。例如,在某用户在×月△日的○车站从13时至18时为止度过“游玩”这样的场景,且有在14时在A百货商店利用了信用卡的履历的情况下,在场景矢量中,使14时的值为10倍。在所关注的事件是“支付”的情况下,还可以在支付金额中加重权重。例如,若支付金额为3万日元以上则使场景的值为20倍,除此以外为10倍等。
(2.2.2)矢量的属性的附加
在希望将与提取条件相符的场景矢量提取为与其他场景矢量不同的场景矢量的情况下,认为(2.2.1)记载的加权是适合的。另一方面,在被暂且提取为相同的生活模式的场景矢量之中,希望进一步挖掘并分析存在怎样的模式(所谓深度分析)的情况下,认为比起加工场景值本身,将用于挖掘的预备属性预先追加至场景矢量,在需要挖掘的时刻参照该预备的属性进一步对生活模式进行细分即可。将该预备的属性在本发明中称为场景矢量的属性。以下,与需要场景矢量的属性的情况一并进行说明。
在希望还添加场景以外的观点而提取用户的生活模式的情况下,对矢量附加属性而追加与观点对应的值。作为一例设想“在×月△日来到○车站的人中若有按各年龄段的倾向则希望知道”这样的分析需求。在这样的情况下,考虑将“在×月△日来到○车站的人”按各年龄段分开,分别提取生活模式这样的方法。具体而言,按年龄段(例如小于20岁、20多岁、30多岁、40多岁、50多岁、60多岁以上这六个)分别提取相同的数目(例如分别10模式)的生活模式,将这些汇总而设为“在×月△日来到○车站的人”的生活模式。
但是,若根据该方法,提取的生活模式的数目增加(六个年龄段×10模式=60模式),且由于各自的年龄段的用户数目不同所以导致所生成的模式的粒度不一致(例如在60多岁以上的用户数目少的情况下,所生成的模式与其他年龄段的模式相比差异小)。对于该问题,考虑在按照年龄段提取的生活模式之中汇总对年龄段共通的相似的模式这样的方法,但需要为了汇总而计算模式间的类似度,或者以人工的方式判断模式间的类似性,花费工夫。
另一方面,“在×月△日来到○车站的人中,若有按各年龄段的倾向则希望知道”这样的分析需求,比起“希望分别知道分年龄段的倾向”,还能够分析为“希望若发现某年龄段特有的模式则将该部分提取为该年龄段的模式,将与年龄段无关地共通的模式设为一个模式”。实际上,可以想到希望根据聚类对象的数据的状况而灵活地得到聚类结果这样的需求较多。
鉴于以上的研究,认为对于上述那样的分析需求,比起对场景矢量进行加权并将与提取条件相符的场景矢量作为与其他场景矢量不同的场景矢量处理,优选暂且提取为相同的模式的场景矢量,根据需要而挖掘提取条件。
因此,在本发明中,为了应对上述需求而对聚类对象的场景矢量附加属性。作为能够附加的属性,可列举用户的年龄段、性别、住所等用户的属性。在上述分析需求的情况下,对场景矢量追加表示年龄段的“小于20多岁”、“20多岁”、“30多岁”、“40多岁”、“50多岁”、“60多岁以上”这6维(属性),参照用户信息等取得场景矢量的用户的年龄段,进行对符合的属性值设置“1”,对除此以外的属性值设置“0”等。此外,考虑住所(追加“东京都”“神奈川县”“琦玉县”“千叶县”“其他”这5维)、通过某些手段得到的用户的喜好(问卷调查的结果等。“满足于服务”“大致满足”“不满”这3维)等作为用于挖掘的属性。
(2.3)场景矢量聚类
对所生成的场景矢量进行聚类。在聚类的算法中,有几个已有的算法。例如k-means法是非阶层型聚类的代表性算法,但不限于此。另外,在使用如k-means法那样需要预先指定簇数的算法的情况下,预先设定默认值而实施聚类。或也可以是变更簇数而数次试行聚类,使用所生成的簇的评价函数选择最佳的簇数。
通过对场景矢量进行聚类,从而生成汇总了一日的场景变迁相类似的场景矢量而成的簇。该簇是表示相同的行动模式的场景矢量的集合,在本发明中称为“生活模式”。或也可以将对属于簇的场景矢量进行平均后的矢量(代表矢量)称为“生活模式”。即,将类似的场景矢量的整体性倾向称为“生活模式”。表示“在×月△日来到○车站的人”的生活模式的一例。
·早晨离开自家,为工作来到○车站的模式
·早晨离开自家,去工作,工作归来时为游玩来到○车站的模式
·中午离开自家,为游玩来到○车站的模式
·傍晚离开自家,为游玩来到○车站的模式
(2.4)生活模式显示
将(2.3)中提取出的生活模式显示给分析者。通过k-means法等对场景矢量进行聚类而得到的结果,成为簇的ID和属于该簇的场景矢量的ID列表。即使将该列表原样显示给分析者或显示簇的重心(平均矢量),分析者也难以立刻理解怎样的生活模式被提取。因此,在本发明中,为了使分析者易于理解,生成表示簇的特征的“代表场景矢量”,对各簇、即对于生活模式将特征性的场景变迁可视化并显示。以下详细地进行说明。
(2.4.1)代表场景矢量的生成
场景矢量表示场景变迁,场景矢量的要素序号表示一日之中的各时刻,要素值表示各时刻中的场景。该构造对于生活模式也是同样。因此,从属于各簇的场景矢量中提取各时刻中的典型的场景,生成将该值设为属性值的场景矢量并设为“代表场景矢量”。由于场景矢量和生活模式(簇)的构造相同,所以能够将簇的代表场景矢量设为该簇的特征。具体而言,通过以下那样的步骤生成代表场景矢量。
首先,参照属于簇的场景矢量,将场景或者事件的出现频度按各时刻进行合计。将在各时刻中的场景之中频度最高的、或者占有规定比例以上(例如50%以上)的场景(一个以上)设为该时刻中的典型性场景,将表示该场景的数值设为与该时刻对应的代表场景矢量的场景值。此时,也可以记录各时刻中的场景的频度分布,在之后的代表场景矢量的可视化中根据分析者的指示提示场景的分布信息(方差值等)。
(2.4.2)代表场景矢量的可视化
在显示所生成的代表场景矢量时,对每个场景设定颜色并显示。由此,能够更具视觉性地掌握场景的变迁。进而,也可以将场景变迁显示为状态变迁图。具体而言,对每个场景设定节点的颜色,进而按照场景的长度(时间长)设定节点的大小而将场景间的变迁以箭头来表现。由此,能够更具视觉性地掌握簇的特征。
(2.5)补充
(2.1)生活模式提取条件设定、(2.2)场景矢量的提取,(2.3)场景矢量聚类、(2.4)生活模式显示不限于分别只执行一次。在本发明的行动属性分析装置1中,设为能够接受(2.4)生活模式显示的结果而改变生活模式的提取条件并再次提取场景矢量而执行聚类等、反复试行而得到期望的分析结果的结构。因此,所提取出的生活模式只要没有来自分析者的删除的指示,就与提取条件一起保存。
为了使分析者对模式提取的试行高效化,也可以具有对模式的提取条件统计性地进行分析的功能。具体而言,关于提取条件所包含的项目分别显示所匹配的场景矢量的数目,或对各项目进行交叉合计并显示等。例如,将“从×月○日至□日为止来到x车站的人”与“日期”和“在x车站停留时的场景”分别合计而进行矩阵显示等。
在(2.4)生活模式显示中,设置能够输出与属于簇的场景矢量对应的用户的ID,以便能够对与分析者有兴趣的簇匹配的用户进行深度分析的功能。
上述说明是设定模式的提取条件,提取场景矢量并进行聚类,但不限于此。在存在作为基本的提取条件,希望对此逐渐改变条件而提取生活模式的情况下,也可以首先使用作为基本的提取条件来提取生活模式,下次以后不执行聚类而对根据所述作为基本的提取条件而提取出的生活模式分配场景矢量。例如在“每月希望知道来到某车站的人的生活模式”的情况下,首先从几个月量的行动的履历中提取生活模式,计算各簇的平均矢量(重心)。接着若最新的行动履历被积蓄一个月量,则提取成为对象的场景矢量(“来到某车站的人的场景矢量”),对各场景矢量实施下述的处理。即对该场景矢量和所述计算的各簇的平均矢量之间的类似度进行计算,对类似度最高的平均矢量的簇分配场景矢量。若被分配给各簇的场景矢量的数目有差异或哪个平均矢量都有类似度低的场景矢量等、不能对簇均等地分配场景矢量,则重新对场景矢量进行聚类而再提取生活模式。
进而也可以将与生活模式的代表场景矢量相当的场景矢量以人工的方式生成,将匹配于生活模式提取条件的场景矢量分配至该以人工的方式生成的代表场景矢量。在本发明中由于将一日的场景的变迁通过矢量来表现,所以通过分析者指定变迁的场景的种类和顺序以及变迁的时刻,能够容易地生成代表场景矢量。
(3)生活模式簇分析
通过聚类而提取的生活模式表示人们度过的典型的一日。但是即使是相同的用户,例如在平日与休息日中一日的度过方式不同的情况较多。另一方面,从一定程度的期间看,一人的用户所度过的典型的一日存在一定的倾向,表示“该人的特性(风格)”。或存在以下情况:在某特定的场所(街区、店铺、景点等)聚集的人中存在某种倾向(“积极的上班族”“平常在家的情况较多的人”等),表示该“场所的特性(风格)”。
因此,在本发明中,按每个用户在行动履历之中取得各生活模式出现的频度,将其作为各用户的特征量而实施聚类。或在场所(成为街区的中心的车站或设施等)是分析对象的情况下,收集利用了该场所的用户的生活模式,以该出现频度为该场所的特征量。这些特征量表现了用户或利用某场所的用户通过怎样的变迁以什么比例度过了怎样的场景这样的生活的样式。在本发明中,通过使用该特征量对用户或场所进行聚类,从而将用户或场所基于生活样式而分类。
在本步骤的生活模式簇分析中,首先设定簇分析的条件,生成对分析对象赋予特征的矢量,执行聚类,将结果显示给分析者。以下,说明各步骤。
(3.1)簇分析条件设定
按照分析的需求,分析者设定簇分析的对象以及用于对象的特征赋予的生活模式。表示一例。
(3.1:分析条件的例1)
分析需求:“希望知道在×月△日为游玩来到○车站的人的平常的生活”
分析对象:“在×月△日为游玩来到○车站的人”
利用的生活模式:“从×月△人来到○车站的人的一个月的场景矢量中提取出的生活模式”
(3.1:分析条件的例2)
分析需求:“希望知道首都内居住的20多岁女性在怎样的场景中利用便利店”
分析对象:“便利店”
利用的生活模式:“对有利用便利店的实际经历的首都内居住20多岁女性的场景矢量以利用时刻进行加权而提取出的生活模式”
关于例1,由于分析需求是“在×月△日为游玩来到○车站的人的平常的生活”,所以例如使用从×月这一个月期间等较长的期间中提取出的生活模式而不是分析对象者的该日的生活模式。另一方面,关于例2,由于希望知道利用便利店的方式,所以使用从作为利用了便利店当日的场景矢量、且对便利店中的利用时刻附加权重而得到的场景矢量中提取出的生活模式。
(3.2)特征矢量生成
关于(3.1)中设定的簇分析对象(“为游玩而来的人”“便利店”等),对所设定的生活模式的出现频度进行计数,生成将生活模式数目设为维数而将各生活模式的出现频度设为值的特征矢量(显示例参照图36)。
此时,也可以对生活模式的出现频度附加权重。根据生活模式,有的对分析对象共通出现,也有的仅对少数的分析对象出现。前者分析对象的特征赋予没有效果,反而被认为是成为噪声的生活模式,后者与其相反。对此,使用tf-idf法等对生活模式的出现频度进行加权。
(3.3)特征矢量聚类
使用所生成的特征矢量,对分析对象进行聚类。即,对生活模式的出现频度相类似的分析对象进行汇总。由于聚类的具体的手段与场景矢量聚类相同,所以在此省略说明。由此,例如生成在平日早晨离开自家去工作的模式多且在休息日午后去游玩的模式多的用户的簇、以及在平日和休息日都中午离开自家去游玩的模式多的用户的簇等、与生活模式的出现频度相应的簇。
(3.4)簇显示
与生活模式提取相同,聚类的结果是被自动生成的簇的ID、和属于各簇的特征矢量的ID的列表。为了将这些以易于分析者明白的方式显示,在本发明中提供如下的手段。
首先,对各簇通过在各簇中特征性地出现的生活模式赋予特征。具体而言,生成属于各簇的特征矢量的平均矢量,取得平均矢量中矢量值为阈值以上的属性、即生活模式的ID而设为代表生活模式。接着,取得该代表生活模式的代表场景矢量,作为场景的变迁而显示给分析者。关于代表场景矢量以及其可视化,由于在(2)生活模式提取的(2.4)生活模式显示中叙述,所以在此省略说明。
此外,关于各簇,为了能够使分析者容易实施深度分析或切片和切块(Slice&Dice)分析,在本发明中提供如下的手段。
(3.4.1)图表显示功能
关于分析者所选择的簇,对属于该簇的分析对象的细节进行图表显示。具体而言,在分析对象为用户的情况下参照用户的性别、年龄段、住所等用户的属性,在为场所的情况下参照住所或场所的分类(车站或店铺等)等的属性,对属于各生活模式簇的分析对象的详细内容进行图表显示。设为图表能够从饼图或棒图等几个类型中选择。进一步用作详细内容的属性也可以是系统提供以外的属性。也可以使系统读入分析者使用某些手段而得到的用户或者场所的属性、例如每个用户的信用卡的利用金额或某店铺中的信用卡的利用金额等,将这些作为属性而参照,对簇的详细内容进行图表显示。
(3.4.2)矩阵显示
关于分析者选择的一个以上生活模式簇,对属于该簇的分析对象的细节进行矩阵显示。具体而言,将分析者选择的属性(例如用户的性别或年龄段等,参照上述)设为分析轴,按每个生活模式簇将与分析轴对应的分析对象的数目以矩阵形式显示。例如,“属于生活模式簇1的用户男性为51人,女性为69人”等。进而设为分析轴能够分阶层地设定。例如分析者能够首先将性别设定为分析轴,将年龄段设定为其下位的分析轴,此时如“属于生活模式簇1的用户男性为51人,其中30多岁为17人,40多岁为12人…”那样进行矩阵显示。进而设为由前述的分析者读入的属性也能够设定为分析轴。例如将“属于生活模式簇1的用户男性为51人,其中信用卡的利用金额为1万日元以上为14人,3万日元以上为9人…”等进行矩阵显示。此外,在上述矩阵显示中也可以具有用于对分析轴间的关联性进行统计性分析的功能。具体而言是分析轴间的独立性(x自乘检定)或无相关的检定功能、相关矩阵或方差矩阵的生成分析功能等。
(3.5)补充
(3.1)簇分析条件设定、(3.2)特征矢量生成、(3.3)特征矢量聚类、(3.4)簇显示不限于分别只执行一次。在本发明的行动属性分析装置1中,设为能够接受(3.4)簇显示的结果而改变簇分析的条件并再次生成特征矢量并执行聚类等反复试行而得到期望的分析结果的结构。因此,在生活模式簇分析中生成的簇只要没有来自分析者的删除的指示就与生成条件一起保存。此外,在(3.4)簇显示中,设置能够输出属于各生活模式簇的分析对象(用户或者场所)的ID,以便能够对分析者有兴趣的生活模式簇进行深度分析的功能。
进而(2)生活模式提取和(3)生活模式簇分析不限于在一次分析中仅各执行一次。在数据分析中,一般对相同的数据从几个不同的观点上进行分析,或基于分析了某数据的结果而缩减数据并进一步分析。在本发明的行动属性分析装置1中,能够基于(3)生活模式簇分析的结果,改变生活模式提取的条件,并再次执行(2)生活模式提取。
以上,在上述说明中说明了在(2)中提取将一日设为单位的生活模式,在(3)中生成将生活模式的出现频度设为特征量的矢量并对用户或场所等进行聚类这样的“2阶段聚类”的方法。
(4)2阶段聚类以外的手段
聚类不仅限于2阶段。在此,作为其他手段,说明在(3)的用户或场所等的聚类中将用户或场所的特征矢量以聚类以外的手段进行分类的方法。此外,说明使用(2)中提取的一日的生活模式而提取某期间的生活模式,对用户或场所等进行聚类的方法。
(4.1)利用了人物形象(persona)的用户/场所的分类
在上述(3)中设定簇分析的分析条件,生成特征矢量并进行聚类,但聚类的方法不限于此。例如,存在分析者具体设想的用户形象(人物形象)或场所的使用方式的形象,希望以依据该形象的方式对用户/场所进行分类的情况下,使用所提取的生活模式而人为地生成特征矢量,将通过所提取的生活模式而赋予了特征的用户/场所人为地分配给所生成的特征矢量,对分析对象进行分类。
例如在预先设想“平日的生活模式主要为直行直归,休息日为早晨出去而傍晚很快回家的生活模式的用户”“平日在回家时绕道的生活模式多且休息日较迟出去而深夜回家的生活模式的用户”这样的用户像,希望将利用某车站的人归于这些用户像而分类的情况下,分析者使用已提取出的生活模式将这些用户像以特征矢量来表现。具体而言,分析者选择在一个月期间平日的直行直归的生活模式为○回、休息日的早晨出去的生活模式为×回等与用户像匹配的生活模式而指定期间中的出现频度。对于该分析者指定的特征矢量,计算与分析对象的用户/场所的特征矢量的类似度,对类似度最高的用户度像分配分析对象的用户/场所。
(4.2)多阶段聚类
“多阶段聚类”是使用将一日设为单位的生活模式,提取将1周期间或10日期间等一定的期间设为单位的期间的生活模式,生成将该模式的出现频度设为特征量的矢量而对用户或场所等进行聚类的方法。在“多阶段聚类”中由于一日的生活模式的提取与(2)生活模式提取相同所以省略说明。作为一例,使用该一日的生活模式生成用户的1周期间的生活模式。并且使用1周期间的生活模式的出现频度生成用户的特征矢量并实施聚类。由于该处理与(3)生活模式聚类分析相同所以省略说明。说明提取1周期间的生活模式的处理步骤的细节。
(4.2.1)
对生活模式提取中生成的生活模式,赋予可识别的ID。在聚类中算法自动赋予簇序号,但将该簇序号基于簇间的类似度而重新分配。具体而言,考虑生成各簇的平均矢量(属于簇的场景矢量的平均),将平均矢量按照长度的降序而排序,按照其结果顺序分配从1开始的ID,或选择平均矢量之中的任意一个,关于剩余的矢量计算与所述选择的矢量的类似度(欧几里得距离等),按照其值的降序排序剩余的矢量而按照其结果顺序(最初为选择的矢量)分配从1开始的ID等的步骤。
(4.2.2)
在生活模式提取中对设为对象的场景矢量赋予通过聚类而自动生成的簇ID,但将这些变换为上述那样重新分配的簇ID,将用户作为第一关键词,将日期作为第二关键词而排序场景矢量。
(4.2.3)
按提取了生活模式的每个用户实施下述的处理。首先将用户的场景矢量按照日期顺序分割为7日期间,生成将场景矢量所属的生活模式的ID(重新分配的ID)设为属性值的7维的属性矢量。在提取出场景矢量的期间不是7的倍数的情况下,产生小于7日期间(7维)的余数,但在此忽略这些。此外,若有不具备符合的场景矢量的日期则将该日的值设为“0”。
(4.2.4)
关于全部用户实施上述(4.2.3)的处理而生成多个7维的属性矢量,对这些进行聚类来提取7日期间的生活模式。
以上,说明了本发明的概要。以下参照附图说明具体的实施方式。
<实施方式一>
在本发明的实施方式一中,说明使用交通系统IC卡的利用履历来提取用户的生活模式,使用该生活模式对用户进行聚类的行动属性分析装置。
(系统的整体结构)
图1是本实施方式一所涉及的行动属性分析装置1的结构图。行动属性分析装置1将IC卡利用履历103以及信用卡利用履历104设为输入,将分析报告309设为输出。IC卡利用履历103是存储了交通系统IC卡81的用户在车站的检票机82或店铺中设置的终端机83中使用交通系统IC卡81的履历的数据。信用卡利用履历104是存储了信用卡(未图示)的用户在店铺等中将信用卡用于支付的履历的数据。分析报告309是存储了对分析对象进行簇分析的结果的报告。
行动属性分析装置1是使用人群的行动属性对分析对象进行分类的装置,大体上由下面三个功能部构成。即场景矢量生成部10、生活模式提取部20、生活模式簇分析部30。
(系统的功能结构:场景矢量生成部10)
场景矢量生成部10根据人的行动履历而生成表示用户的一日的场景的变迁的场景矢量。其输入是IC卡利用履历103以及信用卡利用履历104中存储的数据,向场景列表105、事件列表106、以及场景矢量表107输出数据。关于这些输入输出数据的细节,在数据结构的说明中使用附图进行详述。
场景矢量生成部10进一步具有场景提取部101以及事件提取部102这两个功能部。关于这些功能部的细节,在处理步骤的说明中使用流程图进行详述。
(系统的功能结构:生活模式提取部20)
生活模式提取部20按照分析者设定的提取条件提取场景矢量,对此执行聚类来提取生活模式。其输入是场景列表105、事件列表106以及场景矢量表107中存储的数据,向目标场景矢量表205以及生活模式表206输出数据。此外,生成提取条件207以及参数208作为临时数据。进而还存在利用用户信息209、场所信息210以及日历信息211中存储的数据作为参照数据的情况。关于这些输入输出数据和参照数据的细节以及临时数据的一例,在数据结构以及临时数据的说明中使用附图进行详述。
生活模式提取部20进一步具有模式提取条件设定部201、场景矢量提取部202、场景矢量聚类部203、以及生活模式显示部204这四个功能部。关于这些功能部的细节,在处理步骤的说明中使用流程图进行详述。
(系统的功能结构:生活模式簇分析部30)
生活模式簇分析部30按照分析者设定的分析条件而生成分析对象的特征矢量,执行聚类并生成分析对象的簇。其输入是目标场景矢量表205以及生活模式表206中存储的数据,向特征矢量表305以及簇表306输出数据。此外,生成分析条件307以及参数308作为临时数据。关于这些输入输出数据的细节以及临时数据的一例,在数据结构以及临时数据的说明中使用附图进行详述。
生活模式簇分析部30进一步具有簇分析条件设定部301、特征矢量生成部302、特征矢量聚类部303、以及簇显示部304这四个功能部。关于这些功能部的细节,在处理步骤的说明中使用流程图进行详述。
上述各功能部可以使用实现这些功能的电路设备等硬件构成,也可以由CPU(Central Processing Unit,中央处理单元)等运算装置和规定其动作的程序构成。以下设想将上述各功能部作为程序而安装。上述各数据、表、列表等数据类能够存储至硬盘等存储装置。
(硬件结构)
图2是表示行动属性分析装置1的硬件结构的图。如图2所示,行动属性分析装置1具备CPU2、硬盘3、存储器4、显示器控制部5、显示器51、键盘控制部6、键盘61、鼠标控制部7、以及鼠标71。CPU2执行数据的输入输出、读入、存储、以及安装了图1中说明的各功能部的程序。硬盘3是保存图1中说明的各数据的存储装置,存储器4是暂时加载程序以及数据并存储的装置。显示器51是向用户显示数据的装置,被显示器控制部5控制。键盘61以及鼠标71是接受来自用户的输入的装置,分别被键盘控制部6以及鼠标控制部7控制。
(数据结构)
接着,使用图3~图18说明图1中说明的各数据的结构。
(数据结构:IC卡利用履历103)
图3是表示IC卡利用履历103的数据结构的图。IC卡利用履历103是存储了用户利用交通系统IC卡的履历的数据,存储了用户在车站的检票机或精算机、店铺等中设置的终端机等中刷卡的记录。
IC卡利用履历103具有用户ID10301、时刻10302、车站名/店铺名10303、终端机类型10304、以及金额10305。用户ID10301是存储交通系统IC卡81的用户的ID的区域,通过检票机82或终端机83的读写器装置读入IC卡车票81中存储的用户的ID而取得。时刻10302是存储用户利用检票机82或终端机83的时刻的区域。车站名/店铺名10303是存储利用了交通系统IC卡的车站名或者店铺名的区域。终端机类型10304是存储利用了交通系统IC卡的终端机的类型的区域,在本实施方式一中设为有“进站检票机”、“出站检票机”、“店铺终端”以及“充值终端”这4种。金额10305是存储在检票机82或终端机83中被支付的金额的区域。
(数据结构:信用卡利用履历104)
图4是表示信用卡利用履历104的数据结构的图。信用卡利用履历104是存储了用户利用信用卡的履历的数据,用作用户的第二行动履历。
信用卡利用履历104具有卡ID10401、时刻10402、店铺名10403、以及金额10404。卡ID10401是存储信用卡的ID的区域。时刻10402是存储利用了信用卡的时刻的区域。店铺名10403是存储利用了信用卡的店铺名的区域。金额10404是存储用户利用信用卡而精算的金额的区域。
(数据结构:场景列表105)
图5是表示场景列表105的数据结构的图。场景列表105是存储了用户度过的场景的数据,由场景提取部101生成。场景列表105具有用户ID10501、场景名10502、开始时刻10503、结束时刻10504、场所ID10505、以及场景矢量ID10506。
用户ID10501是存储交通系统IC卡81的用户的ID的区域。场景名10502存储从IC卡利用履历103中提取出的场景名。在本实施方式一中,设为在场景中有无论平日/休息日从夜晚至早晨度过的“自家”、在平日的白天长时间度过的“工作”、休息日在出去目的地长时间度过的“娱乐”、以及无论平日/休息日在出去目的地短时间度过的“出门”这四个。关于这些场景的提取步骤在后面叙述。开始时刻10503存储场景开始的时刻,结束时刻10504存储场景结束的时刻。在本实施方式一中考虑根据通过检票机而场景被切换。具体而言,设为在某车站进站的时刻,至此为止的场景被切换为下一个场景。此外,认为一般人早晨从自家出发而夜晚返回自家。因此在本实施方式一中该日最初的场景为“自家”,以最初的检票机的通过(进站)为界限切换为下一个场景。即一日的最初的场景“自家”在一日的最初的检票机的通过时刻结束,若下一个场景是“工作”则将检票机的通过时刻设为“工作”的场景的开始时刻。若在用户到达工作目的地的最近车站而通过(出站)出站检票机,在该场所停留几个小时后,在相同的车站通过(进站)进站检票机则“工作”的场景结束,下一个场景开始。在这样从交通系统IC卡的利用履历中提取场景的情况下,场景的开始·结束时刻成为检票机的通过(进站)时刻,度过场景的场所成为车站名(出站车站名)。从而场所ID10505存储用户度过场景的场所、即出站的车站的ID。场景矢量ID10506存储包含该记录中存储的场景的场景矢量的ID。
场景列表105将至此为止提取出的全部用户的全部场景汇总而存储,但不限于此。例如也可以按每一日、一周期间、一个月等期间、或按每个用户的ID、按每个场景而分割存储。
(数据结构:事件列表106)
图6是表示事件列表106的数据结构的图。事件列表106是存储了用户度过的事件的数据,由事件提取部102生成。如图6所示,事件列表106具有用户ID10601、事件名10602、时刻10603、场所ID10604、金额10605、以及场景矢量ID10606。
用户ID10601是存储交通系统IC卡的用户的ID的区域。事件名10602存储从IC卡利用履历103以及信用卡利用履历104中提取出的事件的名称。在本实施方式一中,设为事件有基于交通系统IC卡的电子货币功能或者信用卡的“支付”、以及基于交通系统IC卡的充值功能的“入款”这两个。关于这些事件的定义以及提取步骤在后面叙述。时刻10603存储发生了事件的时刻,场所ID10604存储发生了事件的场所的ID。金额10605存储通过“支付”以及“入款”被交易的金额。场景矢量ID10606存储能够对该记录中存储的事件建立对应的场景矢量的ID。
本实施方式一中的事件列表106将至此为止提取出的全部用户的全部事件汇总而存储,但不限于此。例如也可以按每一日、一周期间、一个月等期间、或按每个用户的ID、按每个事件分割而存储。
(数据结构:场景矢量表107)
图7是表示场景矢量表107的数据结构的图。场景矢量表107是存储了场景矢量的数据,由场景矢量生成部10生成。在本实施方式一中,将一日设为从上午3时至次日的上午3时,场景矢量表现为以1小时为单位的24维的矢量。此外如前述那样,在本实施方式一中,场景为“自家”“工作”“娱乐”“出门”这四个,分别将表示场景的数值设为“1”、“4”、“2”、“3”。从而,本实施方式一中的场景矢量是“1”、“4”、“2”、“3”的任一个被设置为值而成的24维的矢量。
场景矢量表107具有场景矢量ID10701、用户ID10702、日期10703以及时刻10704。ID10701存储识别场景矢量的ID。用户ID10702存储与场景矢量对应的用户的ID,日期10703存储与场景矢量对应的日期。时刻10704存储各时刻中的场景值。时刻10704被分为24份,有从存储上午3时的场景的值的“3”至存储次日的上午2时的场景的值的“26”的区域。
本实施方式一中的场景矢量表107将至此为止提取出的全部用户的全部场景矢量汇总而存储,但不限于此。例如也可以按每一日、一周期间、一个月等期间、或按每个用户的ID分割而存储。
(数据结构:目标场景矢量表205)
图8是表示目标场景矢量表205的数据结构的图。目标场景矢量表205是生活模式提取部20按照提取条件提取成为聚类对象的场景矢量(以下,称为目标场景矢量)而得到的数据。在目标场景矢量表205中,存储在场景矢量表107中存储的场景矢量之中匹配于生活模式提取的条件的场景矢量。有根据生活模式提取的条件对矢量值附加权重或附加属性的情况。
目标场景矢量表205具有目标场景矢量ID20501、用户ID20502、场所ID20503、日期20504、时刻20505、属性20506以及模式ID20507。
目标场景矢量ID20501存储用于识别目标场景矢量的ID。用户ID20502存储该记录中存储的目标场景矢量的用户ID,场所ID20503存储该记录中存储的目标场景矢量所包含的场景/事件发生的场所的ID。日期20504存储日期。时刻20505存储各时刻中的场景的值或者被加权的场景的值。属性20506存储根据提取条件而附加的属性。由于属性的数目根据提取条件而不同,所以属性的数目不定。模式ID20507存储生活模式提取部20的场景矢量聚类部203对目标矢量进行聚类的结果,即该记录的目标场景矢量所属的簇的ID(=生活模式的ID)。
目标场景矢量表205在每次生活模式提取部20提取场景矢量时被生成。所生成的目标场景矢量表205通过目标场景矢量表ID被识别,只要没有来自分析者的删除的指示就被保存。
(数据结构:生活模式表206)
图9是表示生活模式表206的数据结构的图。生活模式表206是存储了对目标场景矢量进行聚类的结果的数据。在本实施方式一中,使用k-means法作为聚类的算法。作为生活模式提取部20的参数而指定所生成的簇的数目。此外,算法自动赋予所生成的簇的ID,将该ID用作与各簇对应的生活模式的ID。
生活模式表206具有图9(a)所示的生活模式列表20600和(b)所示的聚类结果表20610。生活模式列表20600是存储了至此为止提取出的生活模式的提取条件或参数等的数据,聚类结果表20610是存储了对目标场景矢量进行聚类的结果的数据。聚类结果表20610在每次生活模式提取部20执行聚类时生成。所生成的聚类结果表20610通过聚类结果ID被识别,只要没有来自分析者的删除的指示就被保存。
生活模式列表20600具有生活模式列表ID20601、生活模式列表名称20602、生成日20603、目标场景矢量表ID20604、提取条件20605、聚类结果ID20606、以及参数20607。
生活模式列表ID20601存储用于识别生活模式列表20600中存储的场景矢量的提取条件或聚类结果的ID。生活模式列表名称20602存储为了分析者易于理解场景矢量的提取条件或聚类结果而赋予的名称。生活模式列表名称20602在初始状态下存储生活模式列表ID。生成日20603存储执行聚类的日期,目标场景矢量表ID20604存储用于识别目标场景矢量表205的说明中叙述的目标场景矢量表205的ID。提取条件20605存储分析者为了生成目标场景矢量而设定的条件。在图9中,在提取条件20605中作为一例存储了“在2010年12月1日在X车站…”等的自然文所记载的提取条件,但这是为了易于理解,实际上是模式提取条件设定部201设定的条件与值所成的组的列表。聚类结果ID20606存储对聚类结果表20610赋予的ID,聚类结果表20610是存储了对目标场景矢量进行聚类的结果的表。参数20607存储分析者为了对目标场景矢量进行聚类而设定的参数。
聚类结果表20610具有模式ID20611、模式名称20612、平均矢量20613、代表场景矢量20614、矢量件数20615、以及目标场景矢量ID20616。
模式ID20611存储场景矢量聚类部203对各簇赋予的ID。模式名称20612存储为了分析者易于理解各簇而赋予的名称。模式名称20612在初始状态下存储模式ID。平均矢量20613存储属于该簇的场景矢量的平均矢量。代表场景矢量20614存储代表簇的场景矢量。代表场景矢量20614是为了显示给分析者的矢量,是表示该簇的特征的矢量。关于代表场景矢量的生成在后面叙述。矢量件数20615存储属于簇的目标场景矢量的件数。目标场景矢量ID20616存储属于簇的目标场景矢量的ID。该目标场景矢量被存储于通过生活模式列表20600的目标场景矢量表ID20604中存储的ID而识别的目标场景矢量表205。
(数据结构:用户信息209)
图10是表示用户信息209的数据结构的图。用户信息209是存储了用户的姓名、性别、出生年月日等用户的属性信息的数据。在本实施方式一中,将交通系统IC卡的利用履历以及信用卡的利用履历用作用户的行动的履历。因此,在用户信息209中,存储交通系统IC卡以及信用卡的用户的信息。
用户信息209具有交通系统IC卡用户信息20900和信用卡所有者信息20910。图10(a)是表示交通系统IC卡用户信息20900的数据结构的图,图10(b)是表示信用卡所有者信息20910的数据结构的图。
交通系统IC卡用户信息20900具有用户ID20901、姓名20902、出生年月日20903、性别20904、住所20905、电话号码20906、以及e-mail(电子邮件)20907。用户ID20901存储交通系统IC卡的用户的ID。姓名20902存储用户的姓名。出生年月日20903存储用户的出生年月日,性别20904存储用户的性别。住所20905存储用户的住所,电话号码20906存储用户的电话号码。e-mail20907存储用户的邮件地址。
信用卡所有者信息20910具有卡ID20911、姓名20912、出生年月日20913、性别20914、住所20915、以及电话号码20916。卡ID20911存储信用卡的ID。姓名20912存储卡所有者的姓名。出生年月日20913存储卡所有者的出生年月日,性别20914存储卡所有者的性别。住所20915存储卡所有者的住所,电话号码20916存储卡所有者的电话号码。
(数据结构:场所信息210)
图11是表示场所信息210的数据结构的图。场所信息210是存储了场所的属性信息的数据。在本实施方式一中,由于将交通系统IC卡的利用履历以及信用卡的利用履历用作用户的行动的履历,所以在场所信息210中,存储在交通系统IC卡履历103以及信用卡利用履历104内存储的、可利用交通系统IC卡以及信用卡的车站或店铺的信息。
场所信息210具有场所ID21001、名称21002、分类21003、区域21004、住所21005以及e-mail21006。场所ID21001存储场所的ID。名称21002存储场所的名称。分类21003存储场所的分类。在本实施方式一中设为场所有“车站”、“店铺”、“设施”这3种。区域21004存储车站、店铺或设施所在的区域名。在车站的情况下存储路线名,在店铺或设施的情况下存储店铺所在的大楼或区域的名称。住所21005存储车站或店铺的住所。e-mail21006存储成为向车站或店铺发送的信息的目的地地址的邮件地址。
(数据结构:日历信息211)
图12是表示日历信息211的数据结构的图。日历信息211是存储了星期或节日等日历信息的数据。在本实施方式一中,使用日本的一般的日历信息。即将星期一~星期五设为平日,将星期六、星期天以及节假日设为休息日。
日历信息211具有日期21101、星期几21102、以及平日/休息日21103。日期21101存储IC卡利用履历103中存储的期间的日期。星期几21102存储日期21101中存储的日期为星期几。平日/休息日21103存储日期21103中存储的日期是平日还是休息日的区分。
(数据结构:特征矢量表305)
图13是表示特征矢量表305的数据结构的图。特征矢量表305是存储了用户/场所等生活模式簇分析部30设为分析对象的特征矢量的数据。
特征矢量表305具有特征矢量ID30501、分析对象ID30502、以及生活模式ID30503。特征矢量表30501存储用于识别特征矢量的ID。分析对象ID30502存储用于识别生活模式簇分析的对象的ID。具体而言,在分析对象是用户的情况下存储用户的ID,在是场所的情况下存储场所的ID。生活模式ID30503存储将对分析对象赋予特征的生活模式的ID设为要素序号,将其出现频度(附带权重)设为要素值的矢量。具体而言,将生活模式表206的聚类结果表20610的模式ID20611中存储的生活模式的ID设为要素序号即可。
特征矢量表305在每次生活模式簇分析部30生成特征矢量时被生成。所生成的特征矢量表305通过特征矢量列表ID被识别,只要没有来自分析者的删除的指示就被保存。
(数据结构:簇表306)
图14是表示簇表306的数据结构的图。簇表306存储对特征矢量进行聚类的结果。在本实施方式一中,使用k-means法作为聚类的算法。作为生活模式簇分析部30的参数而指定所生成的簇的数目。此外,算法自动赋予所生成的簇的ID。
簇表306具有图14(a)所示的簇列表30600、图14(b)所示的聚类结果表30610。簇列表30600是存储了至此为止生成的簇的生成条件或参数等的数据。聚类结果表30610是存储了对特征矢量进行聚类的结果的数据。聚类结果表30610在每次生活模式簇分析部30执行特征矢量的聚类时被生成。所生成的聚类结果表30610通过簇列表30600的聚类结果ID30608中存储的ID而被识别,只要没有来自分析者的删除的指示就被保存。
簇列表30600具有簇列表ID30601、簇列表名称30602、生成日30603、生活模式列表ID30604、特征矢量列表ID30605、分析对象设定条件30606、分析对象30607、聚类结果ID30608、以及参数30609。
簇列表ID30601存储用于识别簇列表30600中存储的分析对象设定条件或聚类结果的ID。簇列表名称30602存储为了分析者易于理解分析对象设定条件或聚类结果而赋予的名称。簇列表名称30602在初始状态下存储簇列表ID。生成日30603存储执行了聚类的日期,生活模式列表ID30604存储为了对分析对象赋予特征而利用的生活模式的列表ID。特征矢量列表ID30605存储特征矢量表305的ID,特征矢量表305是存储了使用生活模式对分析对象赋予特征的特征矢量的表。分析对象设定条件30606存储分析者为了提取分析对象而设定的条件。在图14中,在分析对象设定条件30606中,作为一例存储了“在2010年12月1日在X车站…”等的自然文所记载的设定条件,但这是为了易于理解,实际上是簇分析条件设定部301设定的条件与值所成的组的列表。分析对象30607存储表示分析对象是用户还是场所的数据。若簇分析条件设定部301选择用户作为分析对象则存储“用户”,若选择场所则存储“场所”。聚类结果ID30608存储聚类结果表的ID,聚类结果表是存储了对特征矢量进行聚类的结果的表。参数30609存储分析者为了对特征矢量进行聚类而设定的参数。
聚类结果表30610具有簇ID30611、簇名称30612、平均矢量30613、代表生活模式30614、特征矢量数30615、以及特征矢量ID30616。
簇ID30611存储特征矢量聚类部303赋予各簇的ID。簇名称30612存储为了分析者易于理解各簇而赋予的名称。簇名称30612在初始状态下存储簇ID。平均矢量30613存储属于该簇的特征矢量的平均矢量。代表生活模式30614存储对该簇赋予特征的生活模式的ID。具体而言,对属于该簇的特征矢量的平均矢量之中权重大的、即出现频度高的生活模式的ID存储高位的数个,或存储权重为阈值以上的生活模式的ID。特征矢量数30615存储属于簇的特征矢量的数目,特征矢量ID30616中存储属于簇的特征矢量的ID。
(临时数据)
接着,关于图1所示的临时数据,在图15~图18中表示其一例。
(临时数据:提取条件207)
图15是表示提取条件207的一例的图。提取条件207是存储了生活模式提取部20中由分析者设定的场景矢量的提取条件的临时数据。
(临时数据:提取参数208)
图16是表示提取参数208的一例的图。提取参数208是存储了生活模式提取部20中由分析者设定的场景矢量的聚类条件的临时数据,具体而言存储所生成的簇数。
(临时数据:分析条件307)
图17是表示分析条件307的一例的图。分析条件307是存储了生活模式簇分析部30中由分析者设定的特征矢量的生成条件的临时数据。
(临时数据:分析参数308)
图18是表示分析参数308的一例的图。分析参数308是存储了生活模式簇分析部30中由分析者设定的特征矢量的聚类条件的临时数据,具体而言存储所生成的簇数。
(处理步骤)
接着,使用图19~图39说明行动属性分析装置1的处理步骤。
(处理步骤:整体的处理步骤)
图19是表示本实施方式一中的行动属性分析装置1的处理步骤的流程图。场景矢量生成部10首先使用积蓄了用户的行动的履历的IC卡利用履历103以及信用卡利用履历104预先生成场景矢量(S10)。接着,生活模式提取部20提取匹配于分析者所指定的条件的场景矢量而执行聚类,提取生活模式(S20)。接着,生活模式簇分析部30使用步骤S20中提取的生活模式生成分析对象的特征矢量,执行聚类而生成分析对象的簇(S30)。各步骤的细节在以下进行说明。
(场景矢量生成部10的处理步骤)
图20是表示步骤S10的处理步骤的流程图。场景矢量生成部10的场景提取部101从IC卡利用履历103中提取场景以及事件并存储至场景列表105以及事件列表106,同时将提取出的场景变换为场景值而存储至场景矢量表107(S101)。接着,事件提取部102从信用卡利用履历104中提取事件并存储至事件列表106(S102)。
另外,本实施方式一中的场景矢量生成部10的处理通过分批处理而执行。设为在初始状态下对至此为止积蓄的全部IC卡利用履历103执行上述处理,以后每日对该日积蓄的利用履历执行处理,提取场景、事件、场景矢量,分别追加存储到场景列表105、事件列表106、以及场景矢量表107。
(生活模式提取部20的处理步骤)
图21是表示步骤S20的处理步骤的流程图。生活模式提取部20的模式提取条件设定部201设定分析者所指定的提取成为聚类的对象的场景矢量的条件以及聚类的参数,分别将提取条件转交给场景矢量提取部202,将参数转交给场景矢量聚类部203(S201)。
场景矢量提取部202从场景矢量表107提取匹配于所转交的条件的场景矢量,根据条件进行加工,生成目标场景矢量。场景矢量提取部202将该目标场景矢量存储至目标场景矢量表205,将该ID和场景矢量的提取条件转交给场景矢量聚类部203(S202)。
场景矢量聚类部203将所转交的参数、目标场景矢量表的ID、场景矢量的提取条件、以及执行了聚类的日期存储至生活模式表206的生活模式列表20600,以目标场景矢量的表ID为关键词而从目标场景矢量表205取得聚类对象的场景矢量,按照参数执行聚类。场景矢量聚类部203将聚类的结果存储至生活模式表206的聚类结果表20610,将生活模式的列表的ID转交给生活模式显示部204(S203)。
生活模式显示部204以所转交的生活模式的列表的ID为关键词从生活模式表206的生活模式列表20600以及聚类结果表20610取得所生成的生活模式并显示给分析者(S204)。
(生活模式簇分析部30的处理步骤)
图22是表示步骤S30的处理步骤的流程图。生活模式簇分析部30的簇分析条件设定部301首先设定分析者所指定的生成作为聚类的对象的特征矢量的条件以及聚类的参数(S301)。特征矢量生成部302按照所设定的条件生成特征矢量(S302)。特征矢量聚类部303对所生成的特征矢量进行聚类并将其结果存储至簇表306(S303)。簇显示部304向分析者显示簇(S304)。
(处理步骤:场景矢量生成部10的详细的处理步骤)
接着,说明场景矢量生成部10的详细的处理步骤。
(处理步骤:场景矢量生成部10中的场景提取部101的详细的处理步骤)
图23是说明行动属性分析装置1的场景提取规则以及表示场景的数值的图。如前述那样在本实施方式一中提取“自家”“工作”“娱乐”“出门”这四个场景。为了提取这些场景,在本实施方式一中,定义了下述规则:该规则使用了用户度过场景的时间段、其长度、以及星期几这三个。即,一日的最初和最后出现的场景为“自家”、若是除了一日的最初和最后以外且平日的7个小时以上则为“工作”,若是“休息日”则为“娱乐”,这以外为“出门”。分别将表示场景的数值设为“1”“4”“2”“3”。场景矢量生成部10使用图23所示的规则从IC卡利用履历103中提取场景并存储至场景列表105,生成场景矢量并存储至场景矢量表107。
图24是表示场景提取部101实施的步骤S101的详细的处理步骤的流程图。图24中i是表示IC卡利用履历103中存储的履历的索引的变量。在本实施方式一中设想IC卡利用履历103以用户ID以及日期为关键词被排序,且所存储的全部履历为未处理。从而对i的初始值设置0,但在从过去量的履历中已经提取完场景而从所追加的IC卡利用履历中提取场景的情况下,i是指所追加的履历的索引。作为其他变量,Uid是设置用户ID的变量,Pid是设置场所ID的变量,分别以null(空)初始化。Sv是设置24维的场景矢量的变量,矢量的值全部以null初始化。此外St以及Et是设置场景的开始和结束时刻的变量,分别以null初始化。以下说明图24的各步骤。
(图24:步骤S101001~S101003)
场景提取部101对i设置0(S101001)。场景提取部101对i加1(S101002),若IC卡利用履历103的第i个利用履历的用户ID10301与Uid相同则跳过至步骤S101007,若不相同则前进至步骤S101004(S101003)。
(图24:步骤S101004)
场景提取部101关于Uid中设置的用户的全部利用履历判断处理是否结束,对表示场景的结束时刻的变量Et设置一日的最后的时刻“26:59”,提取“自家”场景。具体而言,对场景列表105的末尾的用户ID10501设置Uid,对场景名10502设置“自家”,对开始时刻10503设置St的值,对结束时刻10504设置Et的值,对场所ID10505设置Pid的值(在一日的最后出站的车站的场所ID),对从场景矢量Sv的时刻St至时刻Et为止的值设置表示“自家”的数值“1”。
(图24:步骤S101005)
场景提取部101参照场景矢量表107,检索与Sv相符的场景矢量是否已经存储。若已经存储则对存储了该场景矢量的记录的用户ID10702设置Uid,对日期10703设置St的日期部分(其中若过了24时则为其前日)。若Sv没有在场景矢量表107中存储则对场景矢量表107的末尾的时刻10704设置Sv,对用户ID10702设置Uid,对日期10703设置St的日期部分(其中若过了24时则为其前日)。进而取得该记录的场景矢量ID10701,从场景列表105的末尾向列表开头按顺序检索用户ID10501与Uid一致的记录,对一致的记录的场景矢量ID10506设置所取得的场景矢量ID10701。此外,关于事件列表106也同样,对场景矢量ID10606设置所取得的场景矢量ID10701。
(图24:步骤S101006)
场景提取部101对Uid设置IC卡利用履历103的第i个用户ID10301的值,对表示场景的开始时刻的变量St设置一日的最初的时刻“03:00”并将Sv初始化。
(图24:步骤S101007)
若i比IC卡利用履历103中存储的履历数目大则结束本处理,这以外则前进至步骤S101008。
(图24:步骤S101008)
若IC卡利用履历103的第i个终端机类型10304为“进站检票机”则前进至步骤S101009,这以外则前进至步骤S101019。
(图24:步骤S101009)
场景提取部101若步骤S101008中利用履历的终端机为进站检票机,则判断为场景已变迁,将IC卡利用履历103的第i个时刻10302中存储的时刻减去1分钟而存储至表示场景的结束时刻的变量Et。
(图24:步骤S101010)
在St的值表示了一日的最初的场景的情况(St=“03:00”)下前进至步骤S101011,这以外则前进至步骤S101013。
(图24:步骤S101011)
场景提取部101取得IC卡履历103的第i个车站名/店铺名10303,参照与其对应的场所信息210的记录,取得进站车站的场所ID21001并对Pid进行设置。
(图24:步骤S101012)
场景提取部101对场景列表105的末尾的用户ID10501设置Uid,对场景名10502设置“自家”,对开始时刻10503设置对St设置的值,对结束时刻10504设置对Et设置的值,对场所ID10505设置Pid的值(在一日的最初进站的车站的场所ID)。
(图24:步骤S101012:补充)
在1日之中最初在检票机进站的情况下,认为直至该紧前在自家停留。因此,设为将前一个的场景(第i-1个场景)提取为自家场景。
(图24:步骤S101013)
场景提取部101根据场景开始时刻St和结束时刻Et计算停留时间(场景的长度)。若停留时间为规定时间以上(例如7个小时以上)则前进至步骤S101014,这以外则前进至步骤S101017。
(图24:步骤S101014)
场景提取部101根据IC卡利用履历103的时刻10302取得日期,进一步参照日历信息211的星期几21102取得该履历的日期。若日期为平日则前进至步骤S101015,这以外则前进至步骤S101016。
(图24:步骤S101015)
在检票机进站的是1日之中的第2次以后,且在紧前的场所停留的是平日的7个小时以上的情况下,认为直至该进站的紧前为止是工作中。因此,场景提取部101将“工作”场景提取为前一个的场景(第i-1个场景)。场景提取部101与步骤S101012相同地设置各表的值。
(图24:步骤S101016)
在检票机进站的是1日之中的2次以后,且在紧前的场所停留的是平日以外的7个小时以上的情况下,认为直至该进站的紧前是外出游玩。因此,场景提取部101将“娱乐”场景提取为前一个的场景(第i-1个场景)。场景提取部101与步骤S101012相同地设置各表的值。
(图24:步骤S101017)
在检票机进站的是1日之中的2次以后,且在紧前的场所停留的是小于7个小时的情况下,认为直至该进站的紧前为止是其他一般的外出。因此,场景提取部101将“出门”场景提取为前一个的场景(第i-1个场景)。场景提取部101与步骤S101012相同地设置各表的值。
(图24:步骤S101018)
场景提取部101对表示场景的开始时刻的变量St设置IC卡利用履历103的第i个时刻10302,返回至步骤S101002。
(图24:步骤S101019)
若IC卡利用履历103的第i个终端机类型10304为“出站检票机”则前进至步骤S101020,这以外则前进至步骤S101021。
(图24:步骤S101020)
在用户出站检票机的情况下,该出站车站成为场景场所。因此,在场景提取部101取得IC卡利用履历103的第i个车站名/店铺名10303,根据场所信息210取得对应的场所ID21001并对Pid进行设置之后返回至步骤S101002。
(图24:步骤S101021)
若IC卡利用履历103的第i个终端机类型10304为“店铺终端”则前进至步骤S101022,这以外则返回至步骤S101002。
(图24:步骤S101022)
在利用履历是店铺内的履历的情况下,认为用户使用电子货币功能等进行了支付。因此,场景提取部101对Pid设置该店铺的场所ID21001,提取“支付”事件并对事件列表106进行设置,返回步骤S101002。具体而言,对事件列表106的末尾的用户ID10601设置Uid,对事件名10602设置“支付”,对时刻10603设置IC卡利用履历103的第i个时刻10302,对场所ID10604设置Pid,对金额10605设置IC卡利用履历103的第i个金额10305。
(处理步骤:场景矢量生成部10中的事件提取部102的详细的处理步骤)
在图20的步骤S102中,事件提取部102从信用卡利用履历104中提取事件并存储至事件列表106。具体而言,对信用卡利用履历104中存储的履历之中未处理的履历,实施下述的处理。
事件提取部102取得信用卡利用履历104的卡ID10401的值,从用户信息209的信用卡所有者信息20910中取得所有者的姓名、出生年月日、性别、住所等信息。接着,事件提取部102参照用户信息209的交通系统IC卡用户信息20900,从用户ID20901中取得与用户的姓名、出生年月日、性别、住所一致的ID,对事件列表106的末尾的用户ID10601进行设置。
事件提取部102进一步对事件名10602设置“支付”,对时刻10603设置信用卡利用履历104的时刻10402。进一步从场所信息210中取得信用卡利用履历104的店铺名10403中设置的店铺名的场所ID21001并对场所ID10604进行设置,对金额10605设置信用卡利用履历104的金额10404。事件提取部102以用户ID10601和时刻10603的值为关键词从场景矢量表107中取得包含该用户的该时刻的场景矢量的ID,并对场景矢量ID10606进行设置。
(处理步骤:生活模式提取部20的详细的处理步骤)
接着,使用流程图以及画面例说明前述的生活模式提取部20的详细的处理步骤。
(处理步骤:生活模式提取部20中的生活模式提取条件设定部201的详细的处理步骤)
图25是表示生活模式提取条件设定部201实施的步骤S201的详细的处理步骤的流程图。以下说明图25的各步骤。
生活模式提取条件设定部201首先在步骤S201001中显示提取对象设定画面。关于本步骤中的画面的结构以及分析者对提取条件的输入的细节使用附图在后面叙述。在步骤S201002中分析者输入提取条件,若指示设定的完成则结束本处理。这以外前进至步骤S201003。在步骤S201003中在分析者指示了提取生活模式的对象者的ID的列表的读入的情况下前进至步骤S201004,这以外前进至步骤S201005。在步骤S201004中从分析者指定的文件读入对象者的用户的ID。在步骤201005中在分析者指示了过去生成的生活模式的提取条件的读入的情况下前进至步骤S201006,这以外前进至步骤S201007。在步骤S201006中,读入分析者所选择的生活模式的提取条件。在步骤S201007中在分析者指示了加权的情况下前进至步骤S201008,这以外前进至步骤S201009。在步骤201008中分析者指定在提取生活模式时希望加权的项目(“何时”“谁”“在何处”“哪个场景”)。关于加权的指定使用附图在后面叙述。在步骤S201009中在分析者指示了属性的追加的情况下前进至步骤S201010,这以外前进至步骤S201011。在步骤S201010中追加分析者希望追加的属性。关于属性的追加使用附图在后面叙述。在步骤S201011中在分析者指示了所提取的模式数的指定的情况下前进至步骤S201012,这以外返回步骤S201001。在步骤S201012中分析者指定所提取的生活模式的数目。关于生活模式的数目的指定使用附图在后面叙述。
(画面例:生活模式提取部20的生活模式提取条件设定部201中的生活模式提取条件设定画面的一例)
图26是表示生活模式提取条件设定部201显示的生活模式提取条件设定画面的一例的图。生活模式提取条件设定画面具有日期设定区域201110、对象者设定区域201120、场景/事件设定区域201130、以及指示按钮区域201140。以下,说明分析者在各区域可设定的条件,但为了易于理解,关于对于所设定的条件怎样提取场景矢量这样的场景矢量提取步骤202的处理也适当进行说明。
日期设定区域201110是分析者设定提取生活模式的期间或星期几的区域,具有期间201111、星期几201112、以及平休(平日/休息日)201113。期间201111是指定提取生活模式的期间的区域。若分析者指定期间,则行动属性分析装置1仅从与所指定的期间的日期匹配的场景矢量中提取生活模式。该期间201111的指定在本实施方式一中设为必须,但不限于此。在期间未被指定的情况下,也可以从场景矢量表107中存储的全部期间的场景矢量中提取生活模式。星期几201112是选择提取生活模式的一个以上的星期几的区域。若分析者选择星期几,则行动属性分析装置1仅从在期间201111中所指定的期间中与所选择的星期几匹配的场景矢量中提取生活模式。在星期几未被选择的情况下,无论是星期几都提取生活模式。平休201113是选择提取生活模式的日期的类型的区域。若分析者选择日的类型,则行动属性分析装置1仅从期间201111中所指定的期间中与所选择的类型(平日或休息日)匹配的场景矢量中提取生活模式。在日的类型未被选择的情况下,从平日/休息日双方的场景矢量中提取生活模式。
对象者设定区域201120是分析者设定提取生活模式的对象者的区域,具有性别201121、住所201122、年龄段201123以及ID201124。性别201121是选择提取生活模式的对象者的性别的区域。若分析者选择性别,则行动属性分析装置1仅从与所选择的性别匹配的对象者的场景矢量中提取生活模式。在性别未被选择的情况下,与性别无关地从全部对象者的场景矢量提取生活模式。住所201122是选择提取生活模式的对象者的住所的区域。在本实施方式一中住所的选择成为将都道府县名以列表的方式选择的结构,但不限于此。还能够进行基于分析者的文本输入、或市区町村名的选择。若分析者选择住所,则行动属性分析装置1仅从将所选择的都道府县设为住所的对象者的场景矢量中提取生活模式。在住所未被选择的情况下,与住所的都道府县无关地从全部对象者的场景矢量中提取生活模式。年龄段201123是选择提取生活模式的对象者的年龄段的区域。若分析者选择一个以上年龄段,则行动属性分析装置1仅从出生年月日与被选择的年龄段匹配的对象者的场景矢量中提取生活模式。在年龄段未被选择的情况下,与出生年月日无关地从全部对象者的场景矢量中提取生活模式。ID201124是指定提取生活模式的对象者的ID的区域。若分析者指定一个以上ID,则行动属性分析装置1仅从ID与被指定的ID匹配的对象者的场景矢量中提取生活模式。在ID未被指定的情况下,与ID无关地从全部对象者的场景矢量中提取生活模式。另外,分析者对ID的指定也能够是从文件的读入。
场景/事件设定区域201130是分析者选择提取生活模式的场景矢量(一日的场景的变迁)所包含的场景或者事件的区域,具有场景/事件201131、场所201132、以及次数201133。场景/事件201131是选择提取生活模式的场景矢量所包含的场景/事件的区域。若分析者选择场景(在本实施方式一中“自家”“工作”“娱乐”“出门”这四个)或者事件(在本实施方式一中“支付”和”入款”)的任一个,则行动属性分析装置1仅从包含所选择的场景或者事件的场景矢量中提取生活模式。场所201132是选择提取生活模式的场景矢量所包含的场景/事件所发生的场所的区域。若分析者指定场所,则行动属性分析装置1仅从包含发生了场景或者事件的场所与被指定的场所匹配的场所的场景矢量中提取生活模式。更详细地说,参照场所信息210而取得分析者输入的场所的ID,参照场景列表105或者事件列表106而取得包含该场所ID的场景矢量的ID,从场景矢量表107取得场景矢量并设置到目标场景矢量表205。另外,场所不仅能够指定场所信息210的名称21002中存储的场所名,还能够指定分类21003中存储的分类名(“车站”“店铺”“设施”)或区域21004中存储的区域名。在这些被指定的情况下,取得与该选择的分类或者区域符合的场所的ID,并参照场景列表105或者事件列表106。次数201133是指定发生了场景或者事件的次数的区域。在日期设定区域201110的期间201111中期间被指定,且场景/事件设定区域201130的场景/事件201131以及场所201132中场景或者事件和场所被设定时,仅从在该期间中将该场所作为场景或者事件停留指定次数的用户的场景矢量中提取生活模式。另外,在图26的画面例中场景/事件设定区域201130中可设定的场景/事件201131、场所201132、以及次数201133分别只有两个,但不限于此。若有分析者的指示则还能够进一步增加可设定的场景/事件201131、场所201132、以及次数201133的数目。
指示按钮区域201140是分析者指示提取生活模式的选项、参数、生活模式提取的执行的区域,具有对象者读入按钮201141、生活模式读入按钮201142、加权按钮201143、属性追加按钮201144、参数按钮201145、以及模式提取执行按钮201146。若分析者点击对象者读入按钮201141,则行动属性分析装置1显示用于指定存储了对象者的ID的文件的画面。若分析者指定存储了对象者的ID的文件,则行动属性分析装置1读入文件,并显示在对象者设定区域201120的ID201124。若分析者点击生活模式读入按钮201142,则行动属性分析装置1显示用于选择过去所生成的生活模式的画面。若分析者选择过去所生成的生活模式,则行动属性分析装置1读入生活模式的提取条件,并显示在生活模式提取条件设定画面。若分析者点击加权按钮201143,则行动属性分析装置1显示图27中说明的加权设定画面。分析者通过加权设定画面对场景矢量进行加权。若分析者点击属性追加按钮201144,则行动属性分析装置1显示图28中说明的属性追加设定画面。分析者通过属性追加设定画面对场景矢量追加属性。若分析者点击参数按钮201145,则行动属性分析装置1显示图29中说明的参数设定画面。分析者通过参数设定画面设定生活模式提取的参数。若分析者点击模式提取执行按钮201146,则行动属性分析装置1提取与提取条件设定画面中设定的条件匹配的提取对象者的场景矢量,执行聚类,从而提取生活模式。
(画面例:生活模式提取部20的生活模式提取条件设定部201中的加权设定画面的一例)
图27是表示生活模式提取条件设定部201显示的加权设定画面的一例的图。加权设定画面具有日加权设定区域2011431、对象者加权设定区域2011432、场景/事件加权设定区域2011433、以及指示按钮区域2011434。
日加权设定区域2011431是设定包含分析者希望加权的日的期间、星期几、平日/休息日的区域,具有期间20114311、星期几20114312、以及平休20114313。若分析者指定期间20114311,则行动属性分析装置1对与所指定的期间的日期匹配的场景矢量赋予权重。具体而言,若该加权被指定,则场景矢量提取部202在各场景矢量中将全部的值乘以“-1”的矢量。若分析者选择星期几20114312,则行动属性分析装置1对与所选择的星期几匹配的场景矢量赋予权重。具体而言,若该加权被指定,则场景矢量提取部202在各场景矢量中将全部的值乘以“-1”的矢量。若分析者选择平休20114313,则行动属性分析装置1对与平日或者休息日(包含节日)之中所选择的一方匹配的场景矢量赋予权重。具体而言,若该加权被指定,则场景矢量提取部202在各场景矢量中将全部的值乘以“-1”的矢量。通过如上述那样对日赋予权重,能够将赋予权重的日的生活模式和未赋予权重的日的生活模式分开而提取。另外,在加权设定画面中对日的加权的值设为“-1”,但不限于此。只要是能够将以表示默认的场景的数值(在本实施方式一中“1”“2”“3”“4”)为值的矢量、和与所指定的条件匹配的矢量在矢量空间上分离的值即可。
对象者加权设定区域2011432是分析者设定希望加权的对象者的属性的区域,具有性别20114321、住所20114322、以及年龄段20114323。若分析者在性别20114321中选择赋予权重的对象者的性别,则行动属性分析装置1对与所选择的性别匹配的对象者的场景矢量赋予权重。具体而言,若该加权被指定,则场景矢量提取部202在各场景矢量中将全部的值乘以“-1”的矢量。若分析者在住所20114322中选择赋予权重的对象者的住所的都道府县,则行动属性分析装置1对将所选择的都道府县设为住所的对象者的场景矢量赋予权重。具体而言,若该加权被指定,则场景矢量提取部202在各场景矢量中将全部的值乘以“-1”的矢量。若分析者在年龄段20114323中选择赋予权重的对象者的年龄段,则行动属性分析装置1对出生年月日与被选择的年龄段匹配的对象者的场景矢量赋予权重。具体而言,若该加权被指定,则场景矢量提取部202在各场景矢量中将全部的值乘以“-1”的矢量。通过如上述那样对对象者赋予权重,能够将赋予了权重的对象者的生活模式和未赋予权重的对象者的生活模式分开而提取。另外,在加权设定画面中对对象者的加权的值设为“-1”,但不限于此。只要是能够将以表示默认的场景的数值(在本实施方式一中“1”“2”“3”“4”)为值的矢量、和与所指定的条件匹配的矢量在矢量空间上分离的值即可。
场景/事件加权设定区域2011433是分析者设定希望加权的场景或者事件的名称以及场所的区域,具有场景/事件20114331以及场所20114332。若分析者选择场景/事件20114331,则行动属性分析装置1对包含所选择的场景或者事件的场景矢量的该场景或者事件的时刻赋予权重。具体而言,若该加权被指定,则场景矢量提取部202将与该场景或者事件的时刻对应的场景值乘以“10”。若分析者选择场所20114332,则行动属性分析装置1对场景矢量中在所指定的场所发生的场景或者事件的时刻赋予权重。具体而言,若该加权被指定,则场景矢量提取部202将与该场景或者事件的时刻对应的场景值乘以“10”。
在图27的画面例中在场景/事件加权设定区域2011433中可设定的场景/事件20114331以及场所20114332分别只有两个,但不限于此。若有分析者的指示则还能够进一步增加可设定的场景/事件20114331以及场所20114332的数目。
指示按钮区域2011434是分析者指示加权的取消或完成的区域,具有取消按钮20114341以及完成按钮20114342。若分析者点击取消按钮20114341,则行动属性分析装置1将至此为止输入的加权的设定全部清除并返回生活模式提取条件设定画面。若分析者点击完成按钮20114342,则行动属性分析装置1存储分析者对加权的设定并返回生活模式提取条件设定画面。
(画面例:生活模式提取部20的生活模式提取条件设定部201中的属性追加设定画面的一例)
图28是表示生活模式提取条件设定部201显示的属性追加设定画面的一例的图。如图28所示,属性追加设定画面具有日属性追加设定区域2011441、用户属性追加设定区域2011442、以及指示按钮区域2011443。
日属性追加设定区域2011441具有星期几20114411以及平休20114412。若分析者选择星期几20114411,则行动属性分析装置1对场景矢量追加星期几的属性。具体而言,若该属性追加被指定,则场景矢量提取部202参照场景矢量表107的日期10703,从日历信息211中取得与日期对应的星期几,生成对应至星期一~星期日的7维的矢量,将对应的星期几的矢量值设置为1,这以外设置为0,并存储至目标场景矢量表205的属性20506。若分析者选择平休20114412,则行动属性分析装置1对场景矢量追加表示平日/休息日的属性。具体而言,若该属性追加被指定,则场景矢量提取部202参照场景矢量表107的日期10703,从日历信息211中取得与日期对应的平日/休息日的类型,生成表示平日和休息日的类型的1维的矢量,若为平日则将矢量值设置为1,这以外设置为0,并存储至目标场景矢量表205的属性20506。
用户属性设定区域2011442具有性别20114421、住所20114422、以及年龄段20114423。若分析者选择性别20114421,则行动属性分析装置1对场景矢量追加表示性别的属性。具体而言,若该属性追加被指定,则场景矢量提取部202参照场景矢量表107的用户ID10702,取得用户信息209的交通系统IC卡用户信息20900的性别20904,生成表示性别的1维的矢量,若是男性则将矢量值设置为1,这以外设置为0,并设置到目标场景矢量表205的属性20506。若分析者选择住所20114422,则行动属性分析装置1对场景矢量追加表示用户的住所的属性。具体而言,若该属性追加被指定,则场景矢量提取部202参照场景矢量表107的用户ID10702,取得用户信息209的交通系统IC卡用户信息20900的住所20905,生成表示住所的矢量(在本实施方式一中住所是以“东京都”、“神奈川县”、“琦玉县”、“千叶县”、“其他”为属性的5维的矢量),将与用户的住所对应的属性的值设置为1,这以外设置为0,并设置到目标场景矢量表205的属性20506。若分析者选择年龄段20114423,则行动属性分析装置1对场景矢量追加表示年龄段的属性。具体而言,若该属性追加被指定,则场景矢量提取部202参照场景矢量表107的用户ID10702,取得用户信息209的交通系统IC卡用户信息20900的出生年月日20903,生成表示年龄段的矢量(在本实施方式一中年龄段是以“10多岁”、“20多岁”、“30多岁”、“40多岁”、“50多岁”、“60多岁”、“这以上”为属性的7维的矢量),将与用户的年龄对应的属性的值设置为1,这以外设置为0,并设置到目标场景矢量表205的属性20506。
指示按钮区域2011443是分析者指示属性追加的取消或完成的区域,具有取消按钮20114431以及完成按钮20114432。若分析者点击取消按钮20114431,则行动属性分析装置1将至此为止输入的属性追加的设定全部清除并返回生活模式提取条件设定画面。若分析者点击完成按钮20114432,则行动属性分析装置1存储分析者对属性追加的设定并返回生活模式提取条件设定画面。
(画面例:生活模式提取部20的生活模式提取条件设定部201中的参数设定画面的一例)
图29是表示生活模式提取条件设定部201显示的参数设定画面的一例的图。参数设定画面具有模式数设定区域2011451、以及指示按钮区域2011452。
若分析者在模式数设定区域2011451中指定模式数,则场景矢量聚类部203将目标场景矢量聚类为所指定的数目的簇。指示按钮区域2011452是分析者指定参数设定的取消或完成的区域,具有取消按钮20114521以及完成按钮20114522。若分析者点击取消按钮20114521,则行动属性分析装置1将至此为止输入的模式数的设定全部清除并返回生活模式提取条件设定画面。若分析者点击完成按钮20114522,则行动属性分析装置1存储分析者对模式数的设定并返回生活模式提取条件设定画面。另外,在分析者未指定模式数的情况下,在本实施方式一中将默认的簇数设为12,但不限于此。
(处理步骤:生活模式提取部20中的场景矢量提取部202的详细的处理步骤)
在步骤S202中,场景矢量提取部202适当参照用户信息209以及日历信息211而从场景矢量表107中提取与在生活模式提取条件设定部201中由分析者设定的条件匹配的场景矢量,若属性的追加被设定则追加属性,并存储至目标场景矢量表205的时刻20505以及属性20506。此外,对用户ID20502存储用户的ID,对场所ID20503存储发生了场景或者事件的场所的ID,对日期20504存储场景矢量的日期。与各设定条件对应的场景矢量的提取步骤、加权步骤、以及属性的追加步骤由于在生活模式提取条件设定部201中的画面的说明等中已叙述,所以在此省略。
(处理步骤:生活模式提取部20中的场景矢量聚类部203的详细的处理步骤)
在步骤S203中,场景矢量聚类部203对目标场景矢量表205中存储的目标场景矢量应用k-means法而执行聚类,将聚类结果存储至生活模式表206的聚类结果表20610。具体而言,对聚类结果表20610的模式ID20611的值存储簇ID,将属于该簇的目标场景矢量的平均矢量存储至平均矢量20613(关于代表矢量20614在后面叙述)。进而将属于该簇的目标场景矢量的数目存储至矢量件数20615,将目标场景矢量的ID存储至目标场景矢量ID20616。此外,以属于该簇的目标场景矢量ID为关键词而参照目标场景矢量表205,对目标场景矢量ID20501的值与目标场景矢量ID一致的记录的模式ID20507设置该模式ID。另外,聚类的簇数设定为在生活模式提取条件设定部201中设定的簇数。在未设定的情况下将簇数例如设为12。
说明场景矢量聚类部203生成聚类结果表20610的代表场景矢量20614的步骤。具体而言,关于所生成的各簇实施以下的处理。首先参照属于簇的场景矢量,将场景或者事件的出现频度按各时刻进行合计。将各时刻的场景之中的频度最高的、或例如占有50%以上的场景(一个以上)设为该时刻中的典型性场景,将表示该场景的数值作为与该时刻对应的代表矢量的要素值而生成代表矢量,并存储至聚类结果表20610的代表场景矢量20614。
(处理步骤:生活模式提取部20中的生活模式显示部204的详细的处理步骤)
生活模式显示部204显示由步骤S201~S203提取出的生活模式。以下,使用画面例说明生活模式显示的处理步骤。
图30是表示显示所提取出的生活模式的画面的一例的图。本画面是将由步骤S201~S203生成的簇(=生活模式)以与场景矢量相同的格式作为场景变迁来表现,并显示给分析者的画面。图30(a)是将场景变迁以状态变迁图来表现的一例,图30(b)是将场景变迁以场景值来表现的一例。
如图30(a)所示,生活模式显示画面具有生活模式显示区域20400以及指示按钮区域20410。
生活模式显示区域20400是显示所提取出的生活模式的区域,具有选择勾选框20401、模式名20402、生活模式20403、以及件数20404。选择勾选框20401是用于分析者在执行“对象ID输出”时选择簇的勾选框。模式名20402是显示模式名的区域。模式名显示生活模式表206的聚类结果表20610的模式名称20612中存储的值。在分析者没有对模式赋予名称的状态下,显示如“模式1”、“模式2”…那样自动赋予的字符串。该字符串能够由分析者任意改写。例如,图30(a)中“模式1”是“直行直归模式”,“模式2”是“工作归来时绕道模式”等。生活模式204003显示所提取出的生活模式。具体而言,取得聚类结果表20610的代表场景矢量20614中存储的场景值,对每个场景设定节点的颜色,进而按照场景的长度(时间长)设定节点的大小并将场景间的变迁以箭头来表现。件数20404显示属于簇的目标场景矢量的数目。目标场景矢量的数目从聚类结果表20610的矢量件数20615中取得。
指示按钮区域20410具有提取条件显示指示按钮20411、对象ID输出指示按钮20412、以及保存指示按钮20413。提取条件显示指示按钮20411是用于指示显示生活模式提取条件设定部201所设定的条件的按钮。若分析者点击本按钮,则生活模式显示部204显示图26所示的生活模式提取设定画面,将提取生活模式的设定条件提示给分析者。对象者ID输出指示按钮20412是用于将分析者所选择的簇(生活模式)内出现的用户的ID进行文件输出的按钮。该功能在希望更详细地或者从别的观点分析与分析者关注的生活模式符合的用户的情况下,用于取得符合的用户的ID。所输出的用户的ID的列表能够经由对象者读入按钮201141等而利用。分析者所选择的簇中出现的用户的ID能够在下一个步骤中取得。在聚类结果表20610中,参照分析者所选择的模式的ID与模式ID20611一致的记录,取得该记录的目标场景矢量ID20616中存储的目标场景矢量ID并参照目标场景矢量表205,取得用户ID20502中存储的用户ID。保存指示按钮20413是用于指示保存所提取出的生活模式的按钮,能够赋予对分析者来说易于理解的名称、例如“○车站停留模式”等的名称并记录。
图30(b)是将场景的变迁以矢量来表示的一例,对每个场景设定矢量的值的颜色,按每个时刻设置表示场景的数值而表现。由于图30(b)中的画面的结构以及功能与图30(a)相同所以省略说明。
(处理步骤:生活模式簇分析部30的详细的处理步骤)
接着,说明前述的生活模式簇分析部30的详细的处理步骤。
(处理步骤:生活模式簇分析部30中的生活模式簇分析条件设定部301的详细的处理步骤)
图31是表示簇分析条件设定部301实施的步骤S301的详细的处理步骤的流程图。以下说明图31的各步骤。
簇分析条件设定部301接受分析者对用于分析对象的特征赋予的生活模式进行选择的结果(S30101)。若分析者指示显示所选择的生活模式的提取条件则前进至步骤30103,这以外跳过至步骤S30104(S30102)。在步骤S30103中将所选择的生活模式的提取条件显示给分析者。关于提取条件的显示使用附图在后面叙述。在步骤S30104中若分析者指示将在提取出生活模式的场景矢量中出现的用户或者场所设为分析对象则前进至步骤S30105,这以外前进至步骤S30107。在步骤S30105中若分析者指示缩减分析对象则前进至步骤S30106,这以外跳过至步骤S30108。在步骤S30106中将所选择的生活模式的提取条件显示给分析者,分析者缩减条件。关于分析对象的缩减在后面叙述。在步骤S30107中分析者设定分析对象并前进至步骤S30108。关于分析对象的设定在后面叙述。在步骤S30108中若分析者指示结束生活模式簇分析的条件设定则结束本处理,这以外返回步骤S30101。
(画面例:生活模式簇分析部30的生活模式簇分析条件设定部301中的生活模式簇分析条件设定画面的一例)
图32是表示簇分析条件设定部301在步骤S301中显示的生活模式簇分析条件设定画面的一例的图。生活模式簇分析条件设定画面具有生活模式选择区域301110、分析对象设定区域301120、以及指示按钮区域301130。
生活模式选择区域301110具有生活模式选择301111以及提取条件显示按钮301112。生活模式选择301111是分析者从所生成的生活模式之中选择用于分析对象的特征赋予的生活模式的区域。提取条件显示按钮301112是分析者指示所选择的生活模式的提取条件的显示的按钮。若分析者点击提取条件显示按钮301112,则行动属性分析装置1显示图33中说明的生活模式提取条件显示画面,显示所选择的生活模式的提取条件。
分析对象设定区域301120具有指示将分析对象设为用户的选择钮301121、指示将其设为场所的选择钮301122、以及分析对象设定按钮301123。若分析者点击分析对象设定按钮301123,则行动属性分析装置1显示分析对象设定画面。由于分析对象设定画面与图33所示的生活模式提取条件设定画面相同所以省略详细的说明。分析对象设定画面显示以默认的方式所选择的生活模式提取条件。分析者通过变更该提取条件而设定分析对象。例如,在生活模式的提取条件是“在2010年12月1日在X车站停留的人的一个月的生活模式”时,将用户的性别缩减为仅女性,或变更为“在Y车站停留的人”而不是“X车站”等。若分析者选择指示将分析对象设为用户的选择钮301121,则行动属性分析装置1将与该分析条件匹配的用户设为分析对象。另一方面,若选择指示将分析对象设为场所的选择钮301122,则行动属性分析装置1将场景矢量中出现的场所设为分析对象。
指示按钮区域301130具有参数设定指示按钮301131、以及簇分析执行按钮301132。若分析者点击参数设定指示按钮301131,则行动属性分析装置1显示图34所示的参数设定画面。分析者通过参数设定画面设定生活模式提取的参数。若分析者点击簇分析执行按钮301132,则行动属性分析装置1提取与在分析对象设定区域301120中设定的条件匹配的分析对象,对生活模式的出现频度进行计数并生成特征矢量,执行聚类而生成簇。
图33是表示在点击了提取条件显示按钮301112时显示的生活模式提取条件显示画面的一例的图。由于图33与图26所示的生活模式提取条件设定画面的结构相同(但除了指示按钮区域201140以外),所以省略详细的说明。
图34是表示在点击了参数设定指示按钮301131时显示的参数设定画面的一例的图。参数设定画面具有簇数设定区域3011311以及指示按钮区域3011312。若分析者在簇数设定区域3011311中指定簇数,则特征矢量聚类部303将特征矢量聚类为所指定的数目的簇。指示按钮区域3011312是分析者指示簇设定的取消或完成的区域,具有取消按钮30113121以及完成按钮30113122。若分析者点击取消按钮30113121,则行动属性分析装置1将至此为止输入的簇数的设定全部清除并返回生活模式簇分析条件设定画面。若分析者点击完成按钮30113122,则行动属性分析装置1存储簇数的设定并返回生活模式簇分析条件设定画面。另外,在分析者没有指定簇数的情况下,在本实施方式一中将默认的簇数设为20,但不限于此。
(处理步骤:生活模式簇分析部30中的特征矢量生成部302的详细的处理步骤)
特征矢量生成部302在步骤S302中,生成将分析对象以生活模式的出现频度赋予特征而得到的特征矢量。详细而言,关于分析对象的目标场景矢量,检验各目标场景矢量匹配于哪个生活模式,按每个生活模式对匹配的目标场景矢量的数目进行计数,生成以生活模式为要素序号、以匹配的目标场景矢量的数目为要素值的矢量。
若分析对象的设定条件与提取出生活模式的提取条件相同,则将设为对频度进行计数的对象的目标场景矢量,设为在生活模式提取中生成的目标场景矢量即可。另一方面,在分析对象的设定条件与生活模式提取的提取条件不同的情况下,以与场景矢量提取部202相同的步骤生成分析对象的目标场景矢量,计算该各目标场景矢量匹配于哪个生活模式的类似度,对类似度最高的生活模式分配目标场景矢量,然后按每个生活模式对匹配的目标场景矢量的数目进行计数。
分析对象是如前述那样的用户或者场所。在将用户设为分析对象的情况下,参照目标场景矢量的用户ID而按每个用户对匹配的生活模式的频度进行计数即可。在将场所设为分析对象的情况下,以目标场景矢量的用户ID和日期为关键词,从场景矢量表107、场景列表105、以及事件列表106中取得场所ID,按每个场所对匹配的生活模式的频度进行计数。
图35是表示特征矢量生成部302实施的步骤S302的详细的处理步骤的流程图。以下说明图35的各步骤。
(图35:步骤S30201)
特征矢量生成部302检验簇分析条件设定部301所选择的生活模式的提取条件、与通过簇分析对象设定画面设定的簇分析对象设定条件是否相同。若相同则跳过至步骤S30204,这以外前进至步骤S30202。
(图35:步骤S30202)
特征矢量生成部302生成与簇分析条件匹配的目标场景矢量,并存储至目标场景矢量表205。关于生成目标场景矢量的处理步骤,由于与场景矢量提取部202的处理步骤相同所以在此省略说明。
(图35:步骤S30203)
特征矢量生成部302关于步骤S30202所生成的目标场景矢量分别实施下述的处理。计算目标场景矢量与聚类结果表20610中存储的各生活模式的平均矢量20613之间的类似度,取得类似度最高的生活模式的ID并存储至目标场景矢量表205的模式ID20507。目标场景矢量与生活模式的平均矢量之间的类似度适用求得矢量间的距离(欧几里得距离)而设为类似度等的方法即可。
(图35:步骤S30204)
若分析者选择用户作为分析对象则前进至步骤S30205,这以外前进至步骤S30206。
(图35:步骤S30205)
特征矢量生成部302参照目标场景矢量表205,按每个用户取得生活模式的出现频度并存储至特征矢量表305。具体而言,对特征矢量表305的分析对象30502设置用户ID,若目标场景矢量表205的用户ID20502与用户ID相同则取得模式ID20507中存储的生活模式ID,将特征矢量表305的生活模式ID30503之中与取得的模式ID对应的值加1。
(图35:步骤S30206)
特征矢量生成部302与步骤S30205相同地对生活模式的出现频度进行计数。其中,按每个场所ID而不是按每个用户ID进行计数并存储至特征矢量表305。具体而言,对特征矢量表305的分析对象305002设置场所ID,若目标场景矢量表205的场所ID20503与场所ID相同则取得模式ID20507中存储的生活模式ID,将特征矢量表305的生活模式ID30503之中与取得的模式ID对应的值加1。
(图35:步骤S30207)
特征矢量生成部302对所计数的生活模式的出现频度进行加权。根据生活模式,既有在较多的分析对象中出现的生活模式,也有仅在特定的分析对象中出现的生活模式。前者那样的生活模式的出现频度即使高,对特征赋予也没有用,而后者应重视。因此,在本实施方式一中,以使前者那样的出现频度变小而后者的出现频度变得更大的方式进行加权。具体而言,应用矢量空间模型中的tf-idf法。关于tf-idf法由于是较多的文献中记载的公知技术,所以省略说明。
(处理步骤:生活模式簇分析部30中的特征矢量聚类部303的详细的处理步骤)
特征矢量聚类部303在步骤S303中对特征矢量表305中存储的特征矢量应用k-means法而执行聚类,并存储至聚类结果表30610。具体而言,对聚类结果表30610的簇ID30611的值存储簇ID,将属于该簇的特征矢量的平均矢量存储至平均矢量30613。代表生活模式30614存储将该簇赋予特征的生活模式的ID。具体而言,参照属于该簇的特征矢量的平均矢量,取得矢量值为阈值以上的要素序号、即生活模式的ID并存储。进而将属于该簇的特征矢量的数目存储至矢量数30615,将特征矢量的ID存储至特征矢量ID30616。聚类的簇数设为生活模式簇分析条件设定部301所设定的簇数(或者在未设定的情况下为20)。
(处理步骤:生活模式簇分析部30中的簇显示304的详细的处理步骤)
簇显示部304在步骤S304中显示所生成的簇。以下,使用画面例说明簇显示304的处理的步骤。另外,在以下的说明中,设为下述状态:已经以簇列表30600的生活模式列表ID30604中存储的生活模式列表ID为关键词检索生活模式列表20600而已取得与生活模式列表ID对应的聚类结果表20610,并且能够参照存储了用于簇分析的生活模式的聚类结果表20610。
图36是表示簇显示部304显示簇的画面的一例的图。如图36所示,簇显示画面具有簇显示区域30400和指示按钮区域30410。
簇显示区域30400是显示所生成的簇的区域,具有选择勾选框30401、簇名30402、代表生活模式30403、以及件数30404。选择勾选框30401是用于分析者在执行“详细分析”以及“对象ID输出”时选择簇的勾选框。簇名30402是显示簇名的区域。簇名显示簇表306的聚类结果表30610的簇名称30612中存储的值。在分析者没有对簇赋予名称的状态下,显示如“簇1”、“簇2”…那样自动赋予的字符串。该字符串能够由分析者任意改写。代表生活模式30403显示将簇赋予特征的生活模式。具体而言,取得聚类结果表30610的代表生活模式30614中存储的生活模式的ID,以该生活模式ID为关键词检索生活模式表206的聚类结果表20610,取得与该生活模式对应的代表矢量20614,使用代表矢量生成与图30(a)相同的场景变迁图并显示。件数30404显示属于簇的特征矢量的数目。特征矢量的数目从聚类结果表30610的特征矢量数30615中取得。另外,在簇分析中,按每个用户或场所分析对象生成特征矢量。从而特征矢量数目表示属于该簇的用户或者场所的数目。
指示按钮区域30410具有详细分析指示按钮30411、对象ID输出指示按钮30412、以及保存指示按钮30413。详细分析指示按钮30411是用于分析者指示详细分析簇的按钮。关于详细分析,使用画面例在后面叙述。对象ID输出指示按钮30412是用于分析者指示输出属于所选择的簇的分析对象的ID的文件的按钮。通过选择簇而对对象ID进行文件输出,能够将所输出的ID作为对象以不同的条件而提取生活模式或进行簇分析。保存指示按钮30413是分析者对簇赋予易于理解的名称而指示保存的按钮。
接着说明详细分析。详细分析是在分析者希望将属于各簇的分析对象按场景矢量的各属性等详细地分析的情况下使用的功能。若分析者在簇显示画面中选择簇并点击详细分析指示按钮30411,则显示详细分析画面。
图37是表示详细分析的画面的一例的图。详细分析画面具有显示形式选择区域3041110、轴设定区域3041120、分析轴列表3041130、以及指示按钮区域3041140。
在显示形式选择区域3041110中,分析者能够选择图表显示3041111或者矩阵显示3041116。若图表显示3041111被选择,则对所选择的簇的分属性的详细内容进行图表显示。在可显示的图表中,有饼图3041112、棒图3041113、折线图3041114、以及带状图3041115,但不限于此。关于图表显示,使用画面例在后面叙述。若矩阵显示被选择,则对所选择的簇的分属性的详细内容进行矩阵显示。关于矩阵显示,使用画面例在后面叙述。
轴设定区域3041120是用于分析者将希望作为分析的观点的轴从分析轴列表3041130拖放(drag&drop)的区域。轴能够选择多个,能够进一步指定是将所选择的各轴独立使用,还是依赖使用。具体而言,在从分析轴列表3041130拖出希望使用的轴并向轴设定区域3041120放时,若放到与分析者已经设定的轴相同的等级,则将轴独立使用。另一方面,若放到分析者已经设定的轴的下位的等级。则将被放置的轴作为已经设定的轴的下位的轴而使用。在图37的画面例中在轴设定区域3041120中设定了“性别”“年龄段”“住所”这三个轴,但由于分别以相同的等级设定,所以行动属性分析装置1关于分析者所选择的簇分别显示“分男女”、“分年龄段”、“分住所”的详细内容。另一方面,在后述的图38的画面例中设定了“性别”和“购买倾向”这两个轴,但“购买倾向”以“性别”的下位的等级被设定。因此行动属性分析装置1将属于分析者选择的簇的用户首先以男女分开,接着分男女地以购买倾向分开显示。
分析轴列表3041130是显示成为分析的观点的轴的区域。在分析轴中有用户属性3041131、场所属性3041132、以及用户所设定的用户设定属性3041133这3种类。用户属性3041131是在分析对象为用户时有效的轴,有年龄段、住所、性别这3种类。这些能够以用户ID为关键词从用户信息209中取得。场所属性3041132是在分析对象为场所时有效的轴,有类型以及住所。这些能够以场所ID为关键词从场所信息210中取得。用户属性以及场所属性是由行动属性分析装置1预先准备的轴,相对于此,用户设定属性是由分析者设定的轴。具体而言,分析者预先准备存储了分析对象的ID(用户ID或者场所ID)和其属性的数据,将该数据通过详细分析画面读入,从而能够利用用户设定的轴。作为用户设定的轴的一例,在图37中表示了“购买倾向”。该轴是表示用户的购买的倾向、即将多少金额在购买中使用的倾向的轴,由分析者使用某种手段(本说明书未记载)按每个用户ID分析属于“~¥10000”“~¥3000”…的哪个类型,生成数据并读入。
指示按钮区域3041140具有分析轴读入指示按钮3041141以及显示指示按钮3041142。分析轴读入指示按钮3041141是指示将前述的用户设定的轴的数据从外部数据读入的按钮。显示指示按钮3041142是指示按照分析者所选择的显示形式以及分析轴而显示所选择的簇的细节的按钮。
在图37中,作为详细分析的一例,分析者将“性别”、“年龄段”、“住所”设定为独立的轴,指示饼图显示。若在该状态下分析者点击显示指示按钮3041142,则显示后述的图39所示的画面。
图38是表示详细分析的画面的一例的图。在本图中,作为详细分析的一例,分析者选择多个簇,在轴设定区域3041120中将“性别”设定为第一轴,进而将“购买倾向”设定为该轴的下位的轴,指示矩阵显示。若在该状态下分析者点击显示指示按钮3041142,则显示如图40所示的画面。
图39是表示饼图显示的一例的图。在本画面中,将属于分析者所选择的簇的用户的详细内容在(a)中分男女、在(b)中分年龄段、在(c)中分住所的都道府县的比例来显示。
图40是表示矩阵显示的一例的图。在本画面中,行动属性分析装置1将属于分析者所选择的簇的用户首先以性别分开,接着以购买倾向分开而显示与各单元对应的人数。
<实施方式一:汇总>
以上那样,本实施方式一所涉及的行动属性分析装置1能够发挥以下那样的效果。
(1)总括性和可扩展性
在本发明中,将用户的1日作为场景变迁把握,进而将场景变迁以场景矢量来表现。由此,由于与用户在1日度过的场景的数目无关而矢量的维数一定,且能够覆盖用户的1日,所以能够与用户的数目无关地将用户的1日总括且可扩展地设为对象。用户的1日的生活模式通过对场景矢量进行聚类而提取。因此即使用户的数目庞大也能够将生活模式的数目收敛到适合的范围内。此外,由于将所提取出的生活模式作为属性而对分析对象赋予特征,所以能够期待所生成的特征矢量不稀疏,能够得到良好的聚类结果。
(2)分析的多样性和用户性
关于表示1日的场景变迁的矢量,对分析者关注的日或用户的加权、或对1日之中的关注的场景的加权、或属性附加是容易的。此外,使用1日的生活模式,能够提取1周期间的模式或一个月的模式。因此,分析者能够灵活地进行与分析的目的相应的行动的模式的提取,能够容易地执行期望的分析。
<实施方式二>
在本发明的实施方式二中,说明使用以一日为单位的生活模式来提取以一定的期间(1周期间或10日期间等)为单位的期间的生活模式,生成以期间的生活模式的出现频度为特征量的矢量并实施对用户或场所等进行聚类的多阶段聚类的结构例。由于本实施方式二中的行动属性分析装置1的硬件的结构与实施方式一相同所以省略说明。
(系统的整体结构)
图41是本实施方式二所涉及的行动属性分析装置1的结构图。本实施方式二中的行动属性分析装置1大体上由以下四个功能构成。即场景矢量生成部10、生活模式提取部20、期间生活模式提取部40、以及生活模式簇分析部30。在这些功能之中,场景矢量生成部10、生活模式提取部20、以及生活模式簇分析部30由于与实施方式一所涉及的行动属性分析装置1相同所以省略详细的说明。
(系统的功能结构:期间生活模式提取部40)
期间生活模式提取部40使用生活模式提取部20所提取出的一日的生活模式来提取期间的生活模式。其输入是生活模式表206,向模式矢量表405以及期间生活模式表406输出数据。此外,生成提取条件407以及参数408作为临时数据。输入数据的细节与本实施方式一相同。关于输出数据的细节以及临时数据的一例,使用附图详述。
期间生活模式提取部40进一步具备模式提取条件设定部401、模式矢量提取部402、模式矢量聚类部403、以及期间生活模式显示部404这四个功能部。关于这些功能部的细节,使用流程图进行说明。
(数据结构:模式矢量表405)
图42是表示模式矢量表405的数据结构的图。模式矢量表405是存储了表示一日的生活模式的排列的模式矢量的数据。模式矢量表405具有模式矢量ID40501、用户ID40502、生活模式ID40503、以及期间的生活模式ID40504。模式矢量ID40501存储用于识别模式矢量的ID。用户ID40502存储与期间的生活模式对应的用户的ID。生活模式ID40503存储期间中的一日的生活模式的ID。期间的生活模式ID40504存储作为对模式矢量进行聚类的结果提取的期间的生活模式的ID。
(数据结构:期间生活模式表406)
期间生活模式表406存储对模式矢量进行聚类的结果。在本实施方式二中,与实施方式一同样,聚类的算法使用k-means法。所生成的簇的数目作为期间的生活模式提取的参数而指定。算法自动赋予所生成的簇的ID。
图43是表示期间生活模式表406的数据结构的图。期间生活模式表406具有图43(a)所示的期间的生活模式列表40600和图43(b)所示的聚类结果表40610。
期间的生活模式列表40600是存储了至此为止生成的期间的生活模式的提取条件或参数等的表,聚类结果表40610在期间生活模式提取部40每次执行模式矢量的聚类时被生成。所生成的聚类结果表40610通过期间的生活模式列表40600的聚类结果ID40607中存储的ID而被识别,只要没有来自分析者的删除的指示就被保存。
期间的生活模式列表40600具有期间的生活模式列表ID40601、期间的生活模式列表名称40602、生成日40603、生活模式列表ID40604、模式矢量表ID40605、提取条件40606、聚类结果ID40607、以及参数40608。期间的生活模式列表ID40601存储用于识别在期间的生活模式列表40600中存储的提取条件或聚类结果的ID。期间的生活模式列表名称40602存储为了分析者对提取条件或聚类结果易于理解而赋予的名称。生活模式列表名称40602在初始状态下存储期间的生活模式列表ID。生成日40603存储执行了聚类的日期。生活模式列表ID40604存储生活模式表206的生活模式列表ID20601,生活模式表206是存储了在模式矢量的生成中使用的一日的生活模式的表。模式矢量表ID40605存储用于识别作为聚类对象的模式矢量表405的ID。提取条件40606存储分析者为了生成模式矢量而设定的条件。在图43中,提取条件40606作为一例,存储了以“在X车站停留的人的12月的…”这样的自然文记载的提取条件,但这是为了易于理解,实际上是模式提取条件设定部401设定的条件与值所成的组的列表。聚类结果ID40607存储对聚类结果表40610赋予的ID,聚类结果表是存储了将模式矢量进行聚类的结果的表。参数40608存储分析者为了对模式矢量进行聚类而设定的参数。
聚类结果表40610具有模式ID40611、模式名称40612、平均矢量40613、代表模式矢量40614、矢量件数40615、以及模式矢量ID40616。模式ID40611存储模式矢量聚类部403对各簇赋予的ID。模式名称40612存储为了分析者对各簇易于理解而赋予的名称。模式名称40612在初始状态下存储模式ID。平均矢量406013存储属于该簇的模式矢量的平均矢量。代表模式矢量40614存储代表簇的模式矢量。代表模式矢量40614是用于显示给分析者的矢量,并且是表示该簇的特征的矢量。代表模式矢量以与场景矢量聚类部203生成代表矢量的步骤相同的步骤而生成。矢量件数40615存储属于簇的模式矢量的件数。模式矢量ID40616存储属于簇的模式矢量的ID。该模式矢量被存储在模式矢量表405。
(临时数据:提取条件407)
图44是表示提取条件407的一例的图。提取条件407是期间生活模式提取部40存储由分析者设定的模式矢量的提取条件的临时数据。
(临时数据:提取参数408)
图45是表示提取参数408的一例的图。提取参数408是期间生活模式提取部40存储由分析者设定的模式矢量的聚类条件的临时数据。
(处理步骤)
接着使用图46~图50说明本实施方式二中的行动属性分析装置1的处理步骤。
(处理步骤:整体的处理步骤)
图46是表示本实施方式二中的行动属性分析装置1的处理步骤的流程图。由于步骤S10的场景矢量生成、步骤S20的生活模式提取与实施方式一相同所以省略说明。在步骤S20和S30之间,新追加了步骤S40。
在步骤S40中,行动属性分析装置1使用步骤S20中提取出的一日的生活模式来提取由分析者指定的期间(日的排列)的模式。接着行动属性分析装置1使用步骤S40中提取出的期间的生活模式而生成分析对象的特征矢量,执行聚类并生成分析对象的簇(S30)。
(期间生活模式提取部40的处理步骤)
图47是表示期间生活模式提取部40的处理步骤的流程图。以下说明图47的各步骤。
(图47:步骤S401)
期间生活模式提取部40的模式提取条件设定部401设定分析者所指定的聚类的用于提取作为对象的模式矢量的条件以及聚类的参数,将提取条件转交给模式矢量提取部402,将参数转交给模式矢量聚类部403。
(图47:步骤S402)
模式矢量提取部402以转交的条件所包含的一日的生活模式列表ID为关键词,参照聚类结果表20610,取得与提取条件匹配的对象者的对象期间中的一日的生活模式的ID,生成模式矢量并存储至模式矢量表405,将该表ID和模式矢量的提取条件转交给模式矢量聚类部403。
(图47:步骤S403)
模式矢量聚类部403将所转交的参数、模式矢量表的ID、模式矢量的提取条件、以及执行了聚类的日期存储至期间的生活模式列表40600,以模式矢量表的ID为关键词从模式矢量表405中取得聚类对象的模式矢量,按照参数而执行聚类,将结果存储至聚类结果表40610,将期间的生活模式列表40600的ID转交给期间生活模式显示部404。
(图47:步骤S404)
期间生活模式显示部404以所转交的期间的生活模式列表40600的ID为关键词从期间的生活模式列表40600以及聚类结果表40610中取得所生成的期间的生活模式并显示给分析者。
(画面例:期间生活模式提取部40的期间的生活模式提取条件设定部401中的期间的生活模式提取条件设定画面的一例)
图48是表示模式提取条件设定部401中的期间生活模式提取条件设定画面的一例的图。期间生活模式提取条件设定画面具有生活模式选择区域40110、对象者设定区域40120、对象期间设定区域40130、以及指示按钮区域40140。
生活模式选择区域40110是选择在提取期间的生活模式时使用的生活模式的区域。若分析者从至此为止提取出的生活模式中选择一个,则将该生活模式的提取条件显示在对象者设定区域40120。在期间的生活模式的提取中,需要分析对象期间中的对象者的一日匹配于哪个生活模式。因此在期间的生活模式的提取中,作为对象者能够选择的被限定于已提取了1日的生活模式的对象者内。在新设定了分析对象的情况下,能够生成该对象者的目标场景矢量,计算与已经提取的生活模式的类似度而分配,但在本实施方式二中设为如前述那样限定。分析者通过缩减在对象者设定区域40120中显示的条件而设定期间的生活模式提取的对象者。在原样使用所显示的生活模式提取条件的情况下,已提取了生活模式的对象者全员成为期间的生活模式提取的对象者。对象期间也被限定于分析者所选择的生活模式的提取期间内。
分析者在对象期间设定区域40130中,设定从何时起提取几日期间的模式。另外,作为选项能够选择星期几。若星期几被选择,则在该设定的期间之中,仅以所设定的星期几为对象而生成模式矢量。
指示按钮区域40140具有参数设定指示按钮40141、以及模式提取执行按钮40142。若分析者点击参数设定指示按钮40141,则行动属性分析装置1显示图49所示的参数设定画面。分析者通过参数设定画面设定期间的生活模式提取参数。若分析者点击模式提取执行按钮40142,则行动属性分析装置1提取与在生活模式选择区域40110和对象者设定区域40120中设定的条件匹配的生活模式,执行聚类而生成簇。
图49是表示在点击了参数设定指示按钮40141时显示的参数设定画面的一例的图。参数设定画面具有簇数设定区域401411以及指示按钮区域401412。若分析者在簇数设定区域401411中指定簇数,则模式矢量聚类部403将特征矢量聚类为所指定的数目的簇。指示按钮区域401412是分析者指示簇设定的取消或完成的区域,具有取消按钮4014121以及完成按钮4014122。这些动作与图34相同。
(处理步骤:期间生活模式提取部40中的模式矢量提取部402的详细的处理步骤)
说明模式矢量提取部402的处理步骤。另外,在以下的说明中,设想为期间的生活模式提取条件中的期间的条件是1周期间的生活模式(星期一~星期日的生活模式)。
首先在期间的生活模式提取条件中,对分析者所选择的一日的生活模式赋予基于模式间的类似度的ID。场景矢量聚类部203将算法自动赋予的簇序号用作模式ID,但将该模式ID基于簇间的类似度而重新分配。具体而言,从生活模式表206的平均矢量20613中取得与各模式对应的簇的平均矢量(属于簇的场景矢量的平均)并计算其长度,按照其值的降序排序模式,按照排序的结果顺序重新分配从1开始的ID,或选择平均矢量之中的任意的一个,关于剩余的矢量计算与所述选择的矢量之间的类似度(欧几里得距离等)并按照其值的降序排序剩余的矢量,按照其结果顺序(最初为选择的矢量)重新分配从1开始的ID等。
接着使用重新分配的模式ID改写目标场景矢量表205的模式ID20507。具体而言,从生活模式表206的目标场景矢量表ID20604中取得目标场景矢量的列表ID,取得与该列表ID对应的目标场景矢量表205,将目标场景矢量表205的模式ID20507改写为重新分配的ID。并且,以用户为第一关键词、以日期为第二关键词而排序目标场景矢量表205。
模式提取条件设定部401按所设定的每个对象者实施下述的处理。首先将用户的场景矢量按照日期顺序以7日期间分割,生成以场景矢量所属的生活模式的ID(重新分配的ID)为属性值的7维的矢量并存储至模式矢量表405的生活模式ID40503。在提取出场景矢量的期间不是7的倍数的情况下,发生小于7日期间(7维)的余数,但在此忽略这些。此外,若存在没有符合的场景矢量的日期则将该日的值设为“0”。
(处理步骤:期间生活模式提取部40中的模式矢量聚类部403的详细的处理步骤)
模式矢量聚类部403对模式矢量表405中存储的模式矢量应用k-means法而执行聚类,将聚类结果存储至聚类结果表40610。具体而言,对聚类结果表40610的模式ID40611的值存储簇ID,将属于该簇的模式矢量的平均矢量存储至平均矢量40613。对代表矢量40614存储属于该簇的模式矢量的代表矢量。另外,代表矢量的生成步骤与实施方式一中的目标场景矢量聚类20610的代表矢量生成步骤相同。进而将属于该簇的模式矢量的数目存储至矢量件数40615,将模式矢量的ID存储至模式矢量ID40616。此外,以属于该簇的模式矢量ID为关键词而参照模式矢量表405,对模式矢量ID40501的值与模式矢量ID一致的记录的生活模式ID40503设置该模式ID。另外,聚类的簇数设为在模式提取条件设定部401中设定的簇数(在未设定的情况下为10)。
(处理步骤:期间生活模式提取部40中的期间生活模式显示部404的详细的处理步骤)
图50是表示期间生活模式显示部404将所生成的簇表现为一日的模式的变迁并显示给分析者的画面的一例的图。期间的生活模式显示画面具有期间的模式显示区域40400和指示按钮区域40410。
期间的模式显示区域40400是显示所生成的期间的生活模式的区域,具有选择勾选框40401、模式名40402、代表期间模式40403、以及件数40404。选择勾选框40401是用于分析者在执行“用户ID输出”时选择簇的勾选框。模式名40402是显示模式名的区域。模式名显示在期间生活模式表406的聚类结果表40610的模式名称40612中存储的值。在分析者没有对簇赋予名称的状态下,显示如“模式1”、“模式2”…那样自动地赋予的字符串。该字符串能够由分析者任意改写。例如,在图50中“模式1”为“平日工作休息日娱乐模式”、“模式2”为“平日绕道且休息日出门模式”等。代表期间模式40403显示对簇赋予特征的期间的生活模式。具体而言,取得在聚类结果表40610的模式ID40611中存储的生活模式ID,以该生活模式ID为关键词而检索聚类结果表20610,取得与该生活模式对应的模式名称20612,使用代表模式矢量40614生成图50所示的一日的生活模式的变迁图并显示。件数40404显示属于簇的模式矢量的数目。模式矢量的数目从聚类结果表40610的矢量件数40615中取得。另外,期间生活模式提取部40按每个用户生成模式矢量。从而模式矢量数即为属于该簇的用户的数目。
指示按钮区域40410具有提取条件显示指示按钮40411、生活模式显示指示按钮40412、用户ID输出指示按钮40413、以及保存指示按钮40414。提取条件显示指示按钮40411是用于分析者指示显示模式提取条件设定部401所设定的条件的按钮。若分析者点击该按钮,则期间生活模式显示部404显示图48所示的期间的生活模式提取设定画面,将提取出期间的生活模式的设定条件提示给分析者。生活模式显示指示按钮40412是分析者指示显示在期间的生活模式中使用的生活模式的按钮。若分析者点击该按钮,则期间生活模式显示部404取得期间生活模式表406的生活模式列表ID40604,参照生活模式表206的生活模式列表ID20601,取得对应的一日的生活模式的列表,在图30所示的一日的生活模式显示画面中显示生活模式。用户ID输出指示按钮40413是分析者指示对与选择的模式匹配的用户的ID进行文件输出的按钮。若分析者在选择勾选框40401中选择模式,点击用户ID输出指示按钮40413,则期间生活模式显示部404参照期间生活模式表406取得所选择的模式矢量ID40616,参照模式矢量表405的模式矢量ID40501,取得对应的用户ID40502,并输出至文件。由此,能够将所输出的ID的用户作为对象而以其他条件提取期间生活模式。保存指示按钮40414是分析者对模式赋予易于理解的名称而指示保存的按钮。
<实施方式二:汇总>
以上那样,本实施方式二所涉及的行动属性分析装置1能够从人群内包含的1日的生活模式进一步提取出某期间的生活模式,使用该生活模式对分析对象进行分析。
<实施方式三>
在本发明的实施方式三中,说明具有内容分发功能的结构例,该内容分发功能为:分析者分析用户的行动属性,对希望分发的内容选择其效果受到期待的用户或者场所,从而分发内容。由于行动属性分析装置1的硬件的结构与实施方式一相同所以省略说明。
(系统的整体结构)
图51是表示本实施方式三所涉及的行动属性分析装置1的整体结构的图。在本实施方式三中的行动属性分析装置1大体上具有以下四个功能。即场景矢量生成部10、生活模式提取部20、生活模式簇分析部30、以及内容分发部91。由于场景矢量生成部10、生活模式提取部20、以及生活模式簇分析部30与实施方式一相同,所以省略详细的说明。
内容分发部91对生活模式提取部20或者生活模式簇分析部30所提取出的用户或者场所的ID分发由分析者选择的内容。内容表92是存储了所分发的内容的数据。内容93是对用户的便携电话94或车站的数字标牌95发送而由这些设备显示的数据,例如,考虑车站中的店铺广告或车站附近的地域信息等。便携电话94是交通系统IC卡的用户的便携电话,其e-mail地址被存储至用户信息209的e-mail20907。数字标牌95是被设置在车站或公共设施等的信息提供装置,其设置场所设为与场所信息210中存储的场所相关联。即若对场所信息210中存储的e-mail21006发送内容93,则在该场所中设置的数字标牌上显示内容。
(处理步骤)
接着,说明本实施方式三所涉及的行动属性分析装置1的处理步骤。场景矢量生成部10首先使用积蓄了用户的行动的履历的IC卡利用履历103以及信用卡利用履历104而预先生成场景矢量。接着,生活模式提取部20提取与分析者指定的条件匹配的场景矢量,执行聚类,提取生活模式,生活模式簇分析部30使用所提取出的生活模式而生成分析对象的特征矢量,执行聚类,生成分析对象的簇。若分析者基于生活模式提取部20或者生活模式簇分析部30的处理结果而发现应分发内容的用户或者场所,则将用户或者场所的ID作为ID列表而输出至适当的文件等。内容分发部91对与该ID对应的用户的便携电话94、或者与该ID对应的场所的数字标牌95发送内容。
例如,若生活模式簇分析部30将以在工作归来时绕道至x车站的“绕道模式”为主要生活模式的20多岁至30多岁的女性的用户ID作为ID列表而输出,则内容分发部91将与该用户ID对应的邮件地址从用户信息209中取得。若分析者根据内容表92指定在x车站的车站大楼开店的面向年轻女性的店铺(杂货店等)的广告的内容,则内容分发部91将该内容分发至上述邮件地址。
<实施方式三:汇总>
以上那样,本实施方式三所涉及的行动属性分析装置1能够基于生活模式的分析结果,分发适于用户或者场所的内容。
以上,基于实施方式具体说明了由本发明人完成的发明,但不用说本发明不限定于所述实施方式,在不脱离其主旨的范围内能够进行各种变更。例如,能够将某实施方式中的结构在其他实施方式中组合或置换。
此外,关于上述各结构、功能、处理部等,能够将这些全部或者一部分通过例如在集成电路中设计而作为硬件来实现,也能够通过处理器执行实现各自的功能的程序而作为软件来实现。实现各功能的程序、表等信息能够存储至存储器或硬盘等存储装置、IC卡、DVD等存储介质。
附图标记说明:
1 行动属性分析装置
10 场景矢量生成部
20 生活模式提取部
30 生活模式簇分析部
40 期间生活模式提取部
91 内容分发部
92 内容表
101 场景提取部
102 事件提取部
103 IC卡利用履历
104 信用卡利用履历
105 场景列表
106 事件列表
107 场景矢量表
201 模式提取条件设定部
202 场景矢量提取部
203 场景矢量聚类部
204 生活模式显示部
205 目标场景矢量表
206 生活模式表
207 提取条件
208 提取参数
209 用户信息
210 场所信息
211 日历信息
301 簇分析条件设定部
302 特征矢量生成部
303 特征矢量聚类部
304 簇显示部
305 特征矢量表
306 簇表
307 分析条件
308 分析参数
309 分析报告
401 模式提取条件设定部
402 模式矢量提取部
403 模式矢量聚类部
404 期间生活模式显示部
Claims (14)
1.一种行动属性分析装置,其特征在于,具备:
场景提取部,从记录了人群的行动履历的履历数据中,提取属于所述人群的人物行动的场景;
场景矢量生成部,将所述场景提取部所提取的场景的每个人的变迁作为场景矢量来表现,并将记述了所述场景矢量的场景矢量数据存储至存储装置,所述场景矢量具有1日的时间段作为要素序号,且具有表示与所述时间段对应的场景的值作为与所述要素序号对应的要素值;
生活模式提取部,通过对所述场景矢量进行聚类来提取所述场景的变迁模式,从而将所述变迁模式提取为所述人群内包含的生活模式;以及
生活模式分析部,根据在所述履历数据之中所述生活模式与分析对象相关联地出现的频度,对所述分析对象赋予特征并对所述分析对象进行聚类。
2.如权利要求1所述的行动属性分析装置,其特征在于,
所述场景提取部基于所述履历数据所记述的所述行动履历的发生场所、发生时间段以及持续时间,推定所述行动履历的目的,从而从所述履历数据中提取与所述目的对应的场景。
3.如权利要求2所述的行动属性分析装置,其特征在于,
所述场景提取部为:
在所述履历数据表示在车站的检票口进站的情况下,
若该进站是1日之中的最初的进站,则将该进站的紧前的所述行动履历提取为表示该人物在自家的场景,若该进站不是1日之中的最初的进站,则将该进站的紧前的所述行动履历提取为表示所述人物在外出的场景,
在提取表示所述人物在外出的场景的情况下,
在该进站的紧前的所述行动履历表示在平日以规定时间以上在相同的场所停留的情况下,提取为表示所述人物在工作的场景,在该进站的紧前的所述行动履历表示在平日以外以规定时间以上在相同的场所停留的情况下,提取为表示所述人物在外出游玩的场景。
4.如权利要求1所述的行动属性分析装置,其特征在于,
所述场景矢量生成部在将能够作为表示所述场景的值使用的值分配为所述场景矢量的要素值时,以场景间的矢量空间上的距离成为与场景的出现频度或意义相应的大小的方式,实施所述分配。
5.如权利要求1所述的行动属性分析装置,其特征在于,
所述生活模式提取部在接受到应提取包含特定的场景的生活模式之意的指定时,仅从所述场景矢量之中的包含该场景的场景矢量中提取所述生活模式。
6.如权利要求1所述的行动属性分析装置,其特征在于,
所述生活模式提取部在接受到应提取适于特定的分析目的的所述生活模式之意的指定时,将所述场景矢量的要素之中的与该分析目的相符的部分的要素值,变换为与属于相同的所述生活模式的其他所述场景矢量的要素值不同的值。
7.如权利要求6所述的行动属性分析装置,其特征在于,
所述生活模式提取部将所述变换后的场景矢量以及在所述变换前与其属于相同的所述生活模式的场景矢量,提取为相互不同的所述生活模式。
8.如权利要求1所述的行动属性分析装置,其特征在于,
所述生活模式提取部在接受到希望挖掘并提取适于特定的分析目的所述生活模式之意的请求时,将与该分析目的对应的附加属性追加至所述场景矢量。
9.如权利要求8所述的行动属性分析装置,其特征在于,
所述生活模式分析部在对所述分析对象进行聚类后,在接受到应在属于所述生活模式的所述场景矢量之中进一步提取适于特定的分析目的的场景矢量之意的指定时,从所述聚类后的分析对象中,进一步提取被追加了与该分析目的对应的所述附加属性的所述场景矢量。
10.如权利要求1所述的行动属性分析装置,其特征在于,
所述生活模式提取部确定所提取的所述生活模式内的最典型的所述场景的变迁,按每个所述生活模式进行可视化并输出。
11.如权利要求10所述的行动属性分析装置,其特征在于,
所述生活模式提取部参照表示属于簇的所述场景的变迁的矢量,将所述簇内的各所述时间段中的所述场景之中频度最高的场景,设为所述簇内的该时间段中的典型的场景,所述簇是通过所述聚类生成的簇,
所述生活模式提取部生成具有表示所述典型的场景的值作为与该时间段对应的要素值的场景矢量,并将其设为所述簇的特征,
所述生活模式分析部根据在所述履历数据之中分析对象与所述簇的特征相符的频度,对所述分析对象赋予特征并对所述分析对象进行聚类。
12.如权利要求1所述的行动属性分析装置,其特征在于,
所述生活模式提取部从所提取的所述生活模式之中,进一步对在某期间中的所述人群的1日的生活模式的排列进行聚类,从而将所述人群的所述期间中的典型的生活模式提取为期间生活模式,
所述生活模式分析部根据在所述履历数据之中所述期间生活模式与分析对象相关联地出现的频度,对所述分析对象赋予特征并对所述分析对象进行聚类。
13.如权利要求1所述的行动属性分析装置,其特征在于,具备:
内容分发部,将与所述生活模式对应的内容信息分发到与该生活模式对应的场所。
14.一种行动属性分析方法,其特征在于,具有:
从记录了人群的行动履历的履历数据中提取场景的场景提取步骤;
将所述场景提取步骤中提取的场景的每个人的变迁作为场景矢量来表现,并将记述了所述场景矢量的场景矢量数据存储至存储装置的步骤,所述场景矢量具有1日的时间段作为要素序号,且具有表示与所述时间段对应的场景的值作为与所述要素序号对应的要素值;
对所述场景矢量进行聚类来提取所述场景的变迁模式,从而将所述变迁模式提取为所述人群的生活模式的步骤;以及
根据在所述履历数据之中所述生活模式与分析对象相关联地出现的频度,对所述分析对象赋予特征而对所述分析对象进行聚类的步骤。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2011282015A JP5785869B2 (ja) | 2011-12-22 | 2011-12-22 | 行動属性分析プログラムおよび装置 |
JP2011-282015 | 2011-12-22 | ||
PCT/JP2012/081662 WO2013094426A1 (ja) | 2011-12-22 | 2012-12-06 | 行動属性分析方法および装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104011720A CN104011720A (zh) | 2014-08-27 |
CN104011720B true CN104011720B (zh) | 2017-05-24 |
Family
ID=48668322
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201280063302.2A Expired - Fee Related CN104011720B (zh) | 2011-12-22 | 2012-12-06 | 行动属性分析方法以及装置 |
Country Status (4)
Country | Link |
---|---|
US (1) | US20150051948A1 (zh) |
JP (1) | JP5785869B2 (zh) |
CN (1) | CN104011720B (zh) |
WO (1) | WO2013094426A1 (zh) |
Families Citing this family (43)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8036979B1 (en) | 2006-10-05 | 2011-10-11 | Experian Information Solutions, Inc. | System and method for generating a finance attribute from tradeline data |
US8606626B1 (en) | 2007-01-31 | 2013-12-10 | Experian Information Solutions, Inc. | Systems and methods for providing a direct marketing campaign planning environment |
US8606666B1 (en) | 2007-01-31 | 2013-12-10 | Experian Information Solutions, Inc. | System and method for providing an aggregation tool |
US8543523B1 (en) * | 2012-06-01 | 2013-09-24 | Rentrak Corporation | Systems and methods for calibrating user and consumer data |
US9953304B2 (en) * | 2012-12-30 | 2018-04-24 | Buzd, Llc | Situational and global context aware calendar, communications, and relationship management |
JP6359899B2 (ja) * | 2013-07-31 | 2018-07-18 | 技研商事インターナショナル株式会社 | 行動ログ分析システム及びそのプログラム |
WO2015049802A1 (ja) * | 2013-10-04 | 2015-04-09 | 株式会社日立製作所 | データベース生成装置およびその生成方法 |
CN103810241B (zh) * | 2013-11-22 | 2017-04-05 | 北京奇虎科技有限公司 | 一种低频点击的过滤方法和装置 |
JP5805169B2 (ja) * | 2013-11-25 | 2015-11-04 | ヤフー株式会社 | 行動パターン分析装置および行動パターン分析方法 |
JP2015135589A (ja) * | 2014-01-17 | 2015-07-27 | 株式会社日立製作所 | 情報分析システム、及び情報分析方法 |
US10262362B1 (en) | 2014-02-14 | 2019-04-16 | Experian Information Solutions, Inc. | Automatic generation of code for attributes |
JP6295769B2 (ja) * | 2014-03-26 | 2018-03-20 | 株式会社豊田中央研究所 | 人物動態計算装置、人物動態計算システム、及びプログラム |
US9576030B1 (en) | 2014-05-07 | 2017-02-21 | Consumerinfo.Com, Inc. | Keeping up with the joneses |
WO2016067460A1 (ja) * | 2014-10-31 | 2016-05-06 | 株式会社日立製作所 | 交通行動推定システム、交通シミュレーションシステム、交通行動推定方法 |
US9928233B2 (en) * | 2014-11-12 | 2018-03-27 | Applause App Quality, Inc. | Computer-implemented methods and systems for clustering user reviews and ranking clusters |
US10445152B1 (en) * | 2014-12-19 | 2019-10-15 | Experian Information Solutions, Inc. | Systems and methods for dynamic report generation based on automatic modeling of complex data structures |
JP6575091B2 (ja) * | 2015-03-20 | 2019-09-18 | 富士ゼロックス株式会社 | 旅程推定装置及びプログラム |
US11625629B2 (en) * | 2016-03-04 | 2023-04-11 | Axon Vibe AG | Systems and methods for predicting user behavior based on location data |
US9805306B1 (en) * | 2016-11-23 | 2017-10-31 | Accenture Global Solutions Limited | Cognitive robotics analyzer |
US20190207946A1 (en) * | 2016-12-20 | 2019-07-04 | Google Inc. | Conditional provision of access by interactive assistant modules |
US10592995B1 (en) | 2017-01-27 | 2020-03-17 | Intuit Inc. | Methods, systems, and computer program product for providing expense information for an electronic tax return preparation and filing software delivery model |
US11270185B1 (en) | 2017-01-27 | 2022-03-08 | Intuit Inc. | Methods, systems, and computer program product for generating a personalized flow for a software delivery model |
JP6668277B2 (ja) * | 2017-02-17 | 2020-03-18 | 日本電信電話株式会社 | 行動パターン分類装置、行動パターン分類方法、及び行動パターン分類プログラム |
US10127227B1 (en) | 2017-05-15 | 2018-11-13 | Google Llc | Providing access to user-controlled resources by automated assistants |
US11436417B2 (en) | 2017-05-15 | 2022-09-06 | Google Llc | Providing access to user-controlled resources by automated assistants |
WO2019016890A1 (ja) * | 2017-07-19 | 2019-01-24 | 三菱電機株式会社 | 行動可視化装置および行動可視化方法 |
EP3696704B1 (en) * | 2017-10-13 | 2022-07-13 | Nippon Telegraph And Telephone Corporation | Synthetic data generation apparatus, method for the same, and program |
WO2019102533A1 (ja) * | 2017-11-22 | 2019-05-31 | 花王株式会社 | 文献分類装置 |
US20210225050A1 (en) * | 2018-03-17 | 2021-07-22 | Dataspark Pte Ltd. | Human Daily Activity Represented by and Processed as Images |
SG11202009110QA (en) * | 2018-04-17 | 2020-11-27 | Dataspark Pte Ltd | Image analysis of human daily activity represented by layered images |
EP3682345B1 (en) | 2018-08-07 | 2021-11-24 | Google LLC | Assembling and evaluating automated assistant responses for privacy concerns |
JP7343973B2 (ja) * | 2018-12-28 | 2023-09-13 | 株式会社日立製作所 | 行動パタン分析支援装置、行動パタン分析支援システム及び行動パタン分析支援方法 |
CN111461153B (zh) * | 2019-01-22 | 2023-08-04 | 刘宏军 | 人群特征深度学习方法 |
US20220222686A1 (en) * | 2019-05-21 | 2022-07-14 | Nippon Telegraph And Telephone Corporation | Analysis apparatus, analysis system, analysis method and program |
JP6890764B2 (ja) * | 2019-09-27 | 2021-06-18 | 楽天グループ株式会社 | 教師データ生成システム、教師データ生成方法、及びプログラム |
KR102197660B1 (ko) * | 2019-10-23 | 2021-01-04 | 숭실대학교산학협력단 | 고령자 생활 패턴 인지 시스템 및 방법 |
CN111080339B (zh) * | 2019-11-18 | 2024-01-30 | 口口相传(北京)网络技术有限公司 | 基于场景的类目偏好数据生成方法及装置 |
US20210312224A1 (en) * | 2020-04-02 | 2021-10-07 | Goldenspear Llc | System and method for creating per-customer machine vision personas based on mobile network metadata |
US11977523B1 (en) * | 2020-04-27 | 2024-05-07 | Splunk Inc. | Enhanced data extraction via efficient extraction rule matching |
CN111680248A (zh) * | 2020-04-28 | 2020-09-18 | 五八有限公司 | 一种生成消息的推送批次号的方法及装置 |
CN111782966B (zh) | 2020-06-30 | 2023-07-28 | 北京百度网讯科技有限公司 | 用户分群方法、装置、计算机设备和介质 |
US20230134941A1 (en) * | 2021-11-02 | 2023-05-04 | At&T Intellectual Property I, L. P. | Automated security hangar for private cellular networks |
CN114936959B (zh) * | 2022-06-17 | 2023-05-23 | 上海市城乡建设和交通发展研究院 | 实现车辆匹配和乘客上车点的识别方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102017550A (zh) * | 2007-11-14 | 2011-04-13 | 高通股份有限公司 | 用于确定地理用户简档以基于所述简档确定有目标的内容消息的适宜性的方法和系统 |
CN102282556A (zh) * | 2008-11-25 | 2011-12-14 | 谷歌公司 | 基于预期用户行为提供数字内容 |
Family Cites Families (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6327574B1 (en) * | 1998-07-07 | 2001-12-04 | Encirq Corporation | Hierarchical models of consumer attributes for targeting content in a privacy-preserving manner |
US6430539B1 (en) * | 1999-05-06 | 2002-08-06 | Hnc Software | Predictive modeling of consumer financial behavior |
AU2001249080A1 (en) * | 2000-02-29 | 2001-09-12 | Expanse Networks, Inc. | Privacy-protected targeting system |
US7202791B2 (en) * | 2001-09-27 | 2007-04-10 | Koninklijke Philips N.V. | Method and apparatus for modeling behavior using a probability distrubution function |
JP2003256466A (ja) * | 2002-03-04 | 2003-09-12 | Denso Corp | 適応的情報検索システム |
WO2006014824A1 (en) * | 2004-07-26 | 2006-02-09 | Wireless 5Th Dimensional Networking, Inc. | Context-based search engine residing on a network |
WO2006044939A2 (en) * | 2004-10-19 | 2006-04-27 | Rosen James S | System and method for location based social networking |
US7835859B2 (en) * | 2004-10-29 | 2010-11-16 | Aol Inc. | Determining a route to a destination based on partially completed route |
US7672865B2 (en) * | 2005-10-21 | 2010-03-02 | Fair Isaac Corporation | Method and apparatus for retail data mining using pair-wise co-occurrence consistency |
US7974889B2 (en) * | 2007-10-19 | 2011-07-05 | Raimbeault Sean M | Social networking interactive shopping system |
JP5079642B2 (ja) * | 2008-09-16 | 2012-11-21 | 日本電信電話株式会社 | 履歴処理装置、履歴処理方法および履歴処理プログラム |
WO2011006140A2 (en) * | 2009-07-09 | 2011-01-13 | Cubic Corporation | Predictive techniques in transit alerting |
JP5466713B2 (ja) * | 2009-12-11 | 2014-04-09 | 株式会社日立製作所 | 生活パターン分類装置及び生活パターン分類システム |
US20110178845A1 (en) * | 2010-01-20 | 2011-07-21 | American Express Travel Related Services Company, Inc. | System and method for matching merchants to a population of consumers |
US20120042262A1 (en) * | 2010-08-11 | 2012-02-16 | Apple Inc. | Population segmentation based on behavioral patterns |
-
2011
- 2011-12-22 JP JP2011282015A patent/JP5785869B2/ja active Active
-
2012
- 2012-12-06 US US14/367,422 patent/US20150051948A1/en not_active Abandoned
- 2012-12-06 WO PCT/JP2012/081662 patent/WO2013094426A1/ja active Application Filing
- 2012-12-06 CN CN201280063302.2A patent/CN104011720B/zh not_active Expired - Fee Related
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102017550A (zh) * | 2007-11-14 | 2011-04-13 | 高通股份有限公司 | 用于确定地理用户简档以基于所述简档确定有目标的内容消息的适宜性的方法和系统 |
CN102282556A (zh) * | 2008-11-25 | 2011-12-14 | 谷歌公司 | 基于预期用户行为提供数字内容 |
Also Published As
Publication number | Publication date |
---|---|
US20150051948A1 (en) | 2015-02-19 |
JP5785869B2 (ja) | 2015-09-30 |
CN104011720A (zh) | 2014-08-27 |
JP2013131170A (ja) | 2013-07-04 |
WO2013094426A1 (ja) | 2013-06-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104011720B (zh) | 行动属性分析方法以及装置 | |
Stepchenkova et al. | Benchmarking CVB website performance: Spatial and structural patterns | |
CN102708130B (zh) | 计算用户微细分以用于要约匹配的可扩展引擎 | |
JP5414562B2 (ja) | 情報処理装置及び情報処理システム | |
WO2018040069A1 (zh) | 信息推荐系统及方法 | |
CN110110221A (zh) | 政务数据智能推荐方法和系统 | |
CN107004203A (zh) | 信息处理系统以及方法 | |
CN109002492B (zh) | 一种基于LightGBM的绩点预测方法 | |
CN101563701A (zh) | 信息提供系统 | |
Stoicescu | Big Data, the perfect instrument to study today’s consumer behavior | |
CN106779808A (zh) | 一种商圈中消费者空间行为分析系统及方法 | |
Wohlfarth et al. | A data-mining approach to travel price forecasting | |
CN106570718A (zh) | 信息的投放方法及投放系统 | |
CN107220745B (zh) | 一种意图行为数据的识别方法、系统及设备 | |
CN110363604A (zh) | 页面生成方法和装置 | |
CN105975537A (zh) | 一种应用程序的排序方法及装置 | |
CN101706926A (zh) | 一种卷烟消费信息调查及处理方法 | |
CN109754290A (zh) | 一种游戏数据的处理方法和装置 | |
JP2020053053A (ja) | 情報処理装置、情報処理方法、及びプログラム | |
US9342834B2 (en) | System and method for setting goals and modifying segment criteria counts | |
KR20060052685A (ko) | 콘택트 포인트 네비게이션 시스템 및 그 방법 또는 그 방법을 기록한 기록 매체 및 그 방법을 전송하는 전송 매체 | |
CN108776857A (zh) | Nps短信调研方法、系统、计算机设备和存储介质 | |
CN109961199A (zh) | 一种分析数据波动的方法和装置 | |
US20170330221A1 (en) | Systems and methods for integration of universal marketing activities | |
CN116523069A (zh) | 基于联邦建模的优惠券推送方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20170524 Termination date: 20181206 |