CN114287017A - 模式提取程序、装置以及方法 - Google Patents
模式提取程序、装置以及方法 Download PDFInfo
- Publication number
- CN114287017A CN114287017A CN201980099698.8A CN201980099698A CN114287017A CN 114287017 A CN114287017 A CN 114287017A CN 201980099698 A CN201980099698 A CN 201980099698A CN 114287017 A CN114287017 A CN 114287017A
- Authority
- CN
- China
- Prior art keywords
- evaluation value
- combination
- pattern
- combination pattern
- samples
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 21
- 238000011156 evaluation Methods 0.000 claims abstract description 129
- 238000000605 extraction Methods 0.000 claims description 91
- 239000000284 extract Substances 0.000 claims description 17
- 238000010586 diagram Methods 0.000 description 8
- 238000012545 processing Methods 0.000 description 8
- 238000005516 engineering process Methods 0.000 description 7
- 230000006870 function Effects 0.000 description 6
- 238000010219 correlation analysis Methods 0.000 description 3
- 238000012217 deletion Methods 0.000 description 3
- 230000037430 deletion Effects 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 230000011218 segmentation Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000000630 rising effect Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
- G06Q30/0204—Market segmentation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/40—Data acquisition and logging
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q30/00—Commerce
- G06Q30/02—Marketing; Price estimation or determination; Fundraising
- G06Q30/0201—Market modelling; Market analysis; Collecting market data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2462—Approximate or statistical queries
Landscapes
- Business, Economics & Management (AREA)
- Engineering & Computer Science (AREA)
- Accounting & Taxation (AREA)
- Development Economics (AREA)
- Finance (AREA)
- Strategic Management (AREA)
- Entrepreneurship & Innovation (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- General Physics & Mathematics (AREA)
- Marketing (AREA)
- General Business, Economics & Management (AREA)
- Economics (AREA)
- Game Theory and Decision Science (AREA)
- General Engineering & Computer Science (AREA)
- Computer Hardware Design (AREA)
- Databases & Information Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明提供模式提取程序、装置以及方法,获取样本集合数据,该样本集合数据与多个属性各自的属性值和表示针对动作的反应是否成功的标签信息分别建立关联,获取分别为1个以上的属性值的组合的多个组合模式,针对多个组合模式中的各个组合模式,基于样本集合数据所示的样本中的满足组合模式的样本的数量和满足组合模式的样本中的成功例的比例来决定评价值,提取与多个组合模式各自的评价值中成为极大值的评价值对应的组合模式,由此提取出能够得到从市场化的观点出发有用的段的信息的属性值的组合模式。
Description
技术领域
公开的技术涉及模式提取程序、模式提取装置以及模式提取方法。
背景技术
在市场化的领域中,进行按照与市场化的需求对应的属性的组合将顾客的集团细分化的“分段”。细分化后的顾客的各集合被称为“段”,各段中包含的顾客具有共通的属性。段的信息用于锁定业务对象、或者区分使用业务战略。
非专利文献1:“What is Market Segmentation?”、[online]、[令和1年8月21日检索]、因特网<https://www.qualtrics.com/experience-management/brand/what-is-market-segmentation/>
为了得到从市场化的观点出发有用的段的信息,需要根据市场化的需求而适当地对顾客的集团进行分段。
发明内容
作为一个技术方案,公开的技术的目的在于,提取能够得到从市场化的观点出发有用的段的信息这样的属性值的组合模式。
作为一个技术方案,公开的技术获取样本集合数据,该样本集合数据与多个数据项目各自的数据项目值和关于规定的现象的标签信息分别建立关联。另外,公开的技术获取分别为1个以上的上述数据项目值的组合的多个组合模式。而且,公开的技术对于上述多个组合模式中的各个组合模式,决定评价值。基于上述样本集合数据所示的样本中的满足组合模式的样本的数量和满足该组合模式的样本中的上述标签信息表示规定的值的样本的比例来决定评价值。并且,公开的技术提取与上述多个组合模式各自的评价值中成为极大值的评价值对应的组合模式。
作为一个技术方案,具有如下的效果,能够提取能够得到从市场化的观点出发有用的段的信息这样的属性的组合模式。
附图说明
图1是第一实施方式和第二实施方式的模式提取装置的功能框图。
图2是用于说明段的图。
图3是用于说明第一实施方式中的评价值为极大值的组合模式的提取的图。
图4是用于说明通过关联分析对组合模式的提取的图。
图5是表示作为第一实施方式和第二实施方式的模式提取装置发挥功能的计算机的概略结构的框图。
图6是表示第一实施方式的模式提取处理的一例的流程图。
图7是用于说明第一实施方式的模式提取处理的图。
图8是用于说明第二实施方式的模式提取处理的图。
图9是用于说明第二实施方式的模式提取处理的图。
图10是表示第二实施方式的模式提取处理的一例的流程图。
具体实施方式
以下,参照附图,对公开的技术的实施方式的一例进行说明。
<第一实施方式>
如图1所示,对模式提取装置10输入样本集合数据。样本集合数据是表示样本的集合的数据,该样本的集合与多个数据项目各自的数据项目值和关于规定的现象的标签信息分别相关联。
例如,在各个样本相当于顾客的情况下,“多个数据项目”为顾客的属性,例如可以是性别、年龄、未婚/已婚、职业等。该情况下的“数据项目值”是关于各属性的属性值。例如,属性“性别”可以是男性/女性,属性“年龄”可以是20多岁/30多岁/40多岁/...、属性“未婚/已婚”可以是未婚/已婚、属性“职业”可以是公司职员/自营业/...。
另外,本实施方式的“关于规定的现象的标签信息”是表示是否对于来自外部的推动(动作)进行如期待的反应的信息。以下,将对于动作进行如期待的反应的样本称为“成功例”,将未进行如期待的反应的样本称为“失败例”,将表示是成功还是失败的标签信息与各样本建立对应。
模式提取装置10执行模式提取处理,从样本集合数据中提取段并输出。
这里,对本实施方式的段进行说明。如图2所示,“段”是指将动作的成功率同样较高的样本的集团利用该样本各自共通具有的属性值的组合模式来表现。在图2的例子中,空心的正(+)和负(-)的标记表示各样本,正所表示的样本是成功例,负所表示的样本是失败例。在图2所示的样本集合中,共通地具有某属性值的组合模式的样本的集合为“段”。另外,将段所包含的样本中的、成功例的比例称为该段的“成功率”。
例如,如图2所示,在共通地具有某属性值的组合模式的样本的集合为段1的情况下,段1所包含的样本数为8个,其中的成功例为4个,因此段1的成功率为“50%”。另外,在共通地具有其他的属性值的组合模式的样本的集合为段2的情况下,段2所包含的样本数为9个,其中的成功例为3个,因此段2的成功率为“33%”。
如图1所示,模式提取装置10在功能上,包含样本获取部12、组合模式获取部14、决定部16、以及提取部18。
样本获取部12获取输入到模式提取装置10的样本集合数据,并转交给组合模式获取部14。
组合模式获取部14获取从样本集合数据中包含的各样本所具有的多个属性值中选择的1个以上的属性值的组合作为组合模式。具体而言,组合模式获取部14通过对于从最初选择的属性值的集合即初始属性值集合中选择的属性值追加和删除其他属性的属性值,而获取组合模式。初始属性值集合可以是属性值处于排他关系的属性,例如为性别、未婚/已婚等属性值的集合(例如,{男性、女性、未婚、已婚})。
组合模式获取部14将所获取的属性值的组合模式转交给决定部16。
决定部16对于从组合模式获取部14转交的组合模式中的各个,决定评价值。决定部16基于样本集合数据所示的样本中的满足组合模式的样本的数量和满足组合模式的样本中的标签信息表示规定的值的样本的比例来决定评价值。满足组合模式的样本的数量是指具有组合模式所表示的属性值的组合的样本的数量,表示满足组合模式的集合的大小。标签信息表示规定的值的样本是成功例。即,满足组合模式的样本中的标签信息表示规定的值的样本的比例是指满足组合模式的集合中的成功率。
具体而言,决定部16针对每个组合模式决定具有如下的性质的评价值,如果集团为相同的大小,若成功率越高则评价值越大,如果成功率相同,若集团越大则评价值越大。作为评价值,例如能够使用平方值(X2)。决定部16将针对每个组合模式决定的评价值转交给提取部18。
提取部18对于从决定部16转交的评价值较大的组合模式,按照在满足该组合模式的集合所包含的样本中不存在较大的重叠的方式进行选择,并将其提取为段。
具体而言,提取部18提取与多个组合模式各自的评价值中成为极大值的评价值对应的组合模式。更具体而言,如图3所示,对于特定的组合模式的评价值提取部18获取多个组合模式中,针对在特定的组合模式追加1个以上的数据项目值而获得的组合模式的评价值。另外,提取部18获取针对从特定的组合模式中删除了1个以上的数据项目值而获得的组合模式的评价值。在特定的组合模式的评价值比所获取的任何评价值都高的情况下,提取部18提取特定的组合模式作为评价值为极大值的组合模式。
即,提取部18提取由组合模式获取部14获取的组合模式中的、在追加1个以上的属性值的情况下以及在删除了1个以上的属性值的情况下由决定部16决定的评价值减少的组合模式。提取部18将提取出的组合模式作为段输出。
通过提取具有上述的性质的评价值为极大值的组合模式,能够找到在一般的关联分析中无法找到的段。
例如,如图4所示,通过关联分析,求出属性值的各种组合模式各自的集合的成功率,提取与成功率为所设定的阈值(在图4的例子中,为40%)以上的集合对应的组合模式作为段。在该情况下,像图4的集合A和集合B那样,提取样本重复(虚线C的部分)且组合模式类似的集合,成为缺乏对整体的全面性的提取结果。
另一方面,通过使用本实施方式的评价值,提取满足评价值为极大值的组合模式的集合,能够提取与成功率较高、并且样本较多的集合对应的组合模式。另外,由于极大值邻接的情况很少,因此在提取多个段时,能够提高对整体的全面性。
另外,在提取与成功率为所设定的阈值以上的集合对应的组合模式作为段的情况下,由于提取结果依赖于阈值的设定,因此不一定提取出适当的段。例如,如图4所示,若将成功率的阈值设为40%,则提取出集合D和集合E。在包含集合D和集合E的集合F的成功率小于40%的情况下,即使从市场化的观点出发,集合F是适当的集合,也不能作为段提取。
另一方面,在本实施方式中,通过提取满足成功率较高、并且样本越多则成为越大的评价值的极大值的组合模式的集合,能够不依赖于成功率的阈值而提取适当的段。
模式提取装置10例如能够由图5所示的计算机40实现。计算机40具备CPU(CentralProcessing Unit:中央处理单元)41、作为暂时存储区域的存储器42、以及非易失性的存储部43。另外,计算机40具备:输入部、显示部等输入输出装置44、以及控制针对存储介质49的数据的读入和写入的R/W(Read/Write:读/写)部45。另外,计算机40具备与因特网等网络连接的通信I/F(Interface:接口)46。CPU41、存储器42、存储部43、输入输出装置44、R/W部45以及通信I/F46经由总线47而相互连接。
存储部43能够由HDD(Hard Disk Drive:硬盘驱动器)、SSD(Solid State Drive:固态硬盘)、闪存等实现。在作为存储介质的存储部43中存储有用于使计算机40作为模式提取装置10发挥功能的模式提取程序50。模式提取程序50具有样本获取工序52、组合模式获取工序54、决定工序56、以及提取工序58。
CPU41从存储部43读出模式提取程序50并在存储器42中展开,依次执行模式提取程序50所具有的工序。CPU41通过执行样本获取工序52,从而作为图1所示的样本获取部12进行动作。另外,CPU41通过执行组合模式获取工序54,从而作为图1所示的组合模式获取部14进行动作。另外,CPU41通过执行决定工序56,从而作为图1所示的决定部16进行动作。另外,CPU41通过执行提取工序58,从而作为图1所示的提取部18进行动作。由此,执行模式提取程序50的计算机40作为模式提取装置10发挥功能。此外,执行程序的CPU41为硬件。
此外,由模式提取程序50实现的功能例如也可以由半导体集成电路、更详细地说由ASIC(Application Specific Integrated Circuit:专用集成电路)等实现。
接下来,对第一实施方式的模式提取装置10的作用进行说明。样本获取部12获取输入到模式提取装置10的样本集合数据,并转交给组合模式获取部14。而且,在模式提取装置10中,执行图6所示的模式提取处理。此外,模式提取处理是公开的技术的模式提取方法的一例。
在步骤S12中,组合模式获取部14从初始属性值集合中选择未选择的属性值,获取由所选择的属性值构成的组合模式P,将所获取的组合模式P转交给决定部16。而且,决定部16确定具有所转交的组合模式P所表示的属性值的样本的集合,基于该集合的样本数和成功率来决定评价值。
这里,初始属性值集合为{男性、女性、未婚、已婚},从中选择“男性”,如图7所示,对于组合模式P=〔男性〕,作为评价值的一例的X2被决定为0.22。
接下来,在步骤S14中,组合模式获取部14获取在当前的组合模式P中追加了一个其他属性的属性值的组合模式,并转交给决定部16。而且,决定部16决定所转交的组合模式的评价值,并将所决定的评价值转交给提取部18。而且,提取部18通过判定所决定的评价值是否比针对组合模式P的评价值上升,来探索通过追加而评价值上升的属性值。
接下来,在步骤S16中,提取部18判定在上述步骤S14中,是否找到通过追加而评价值上升的属性值。在找到的情况下,处理移至步骤S18,在未找到的情况下,处理移至步骤S20。
在步骤S18中,组合模式获取部14获取将通过追加而评价值上升的属性值追加到当前的组合模式P而得的组合模式作为新的组合模式P,并转交给决定部16。而且,决定部16决定所转交的组合模式P的评价值,处理返回步骤S14。
例如,如图7所示,若在当前的组合模式P=〔男性〕中追加了属性“年龄”的属性值“30多岁”而得的组合模式〔男性×30多岁〕的X2为10.0,则比组合模式P=〔男性〕的X2=0.22上升。因此,成为新的组合模式P=〔男性×30多岁〕。
而且,返回步骤S14,若在当前的组合模式P=〔男性×30多岁〕中追加了属性“未婚/已婚”的属性值“已婚”而得的组合模式的X2为14.2,则X2上升。因此,成为新的组合模式P=〔男性×30多岁×已婚〕。
在未找到更多通过追加而评价值上升的属性值的情况下,在当前的组合模式P=〔男性×30多岁×已婚〕的状态下,处理移至步骤S20。
在步骤S20中,组合模式获取部14获取从当前的组合模式P中删除了一个属性值而得的组合模式,并转交给决定部16。而且,决定部16决定所转交的组合模式的评价值,并将所决定的评价值转交给提取部18。而且,提取部18判定所决定的评价值是否比针对组合模式P的评价值上升,来探索通过删除而评价值上升的属性值。
接下来,在步骤S22中,提取部18判定在上述步骤S20中,是否找到通过删除而评价值上升的属性值。在找到的情况下,处理移至步骤S24,在未找到的情况下,处理移至步骤S26。
在步骤S24中,提取部18从当前的组合模式P中删除通过删除而评价值上升的属性值,获取新的组合模式P,并将所获取的组合模式P转交给决定部16。而且,决定部16决定所转交的组合模式P的评价值,处理返回步骤S14。
例如,如图3所示,从当前的组合模式P=〔男性×30多岁×已婚〕中删除了属性值“已婚”而得的组合模式〔男性×30多岁〕的X2为8.49。另外,删除了属性值“30多岁”的组合模式〔男性×已婚〕的X2为11.86,删除了属性值“男性”的组合模式〔30多岁×已婚〕的X2为10.00。哪个组合模式的评价值都不会从组合模式P=〔男性×30多岁×已婚男性〕的评价值14.22上升。因此,不从当前的组合模式P中删除任何的属性值。
在步骤S26中,提取部18提取当前的组合模式P作为段,并输出。
接下来,在步骤S28中,提取部18判定所提取的段是否达到规定量。在未达到的情况下,处理返回步骤S12。在步骤S12中,从初始属性值集合中选择迄今未选择的属性值。在上述的初始属性值集合={男性、女性、已婚、未婚}的情况下,例如,选择属性值“女性”。在所提取的段达到规定量的情况下,模式提取处理结束。
像以上说明的那样,第一实施方式的模式提取装置针对属性值的每个组合模式,基于满足组合模式的集合的样本数和成功率来计算评价值,提取评价值为极大值的组合模式作为段。由此,能够提取能够得到从市场化的观点出发有用的段的信息这样的属性值的组合模式。
<第二实施方式>
接下来,对第二实施方式进行说明。应予说明,在第二实施方式的模式提取装置中,对于与第一实施方式的模式提取装置10同样的部分标注相同的附图标记而省略详细的说明。
如图1所示,模式提取装置210在功能上,包含样本获取部12、组合模式获取部214、决定部216、以及提取部218。
组合模式获取部214集中获取从样本集合数据中包含的各样本所具有的多个属性值中选择的1个以上的属性值的组合模式。组合模式获取部214将所获取的属性值的组合模式转交给决定部216。
决定部216对于从组合模式获取部214转交的组合模式中的每一个,决定与第一实施方式同样的评价值。另外,在通过后述的提取部218,从样本集合中除去规定的成功例的情况下,决定部216对于除去后的样本集合,再次决定组合模式各自的评价值。
如图8所示,提取部218从由组合模式获取部214获取的多个组合模式中,提取由决定部216决定的评价值为最大的组合模式作为段。另外,如图9所示,提取部218从样本集合数据中,除去满足评价值最大的组合模式的样本中的成功例的样本,并将所除去的样本的信息通知给决定部216。由此,在决定部216中再次决定评价值。若通过决定部216再次决定评价值,则提取部218基于再次决定的评价值,如图9所示,提取评价值最大的组合模式,并反复。
这样,在除去评价值最大的组合模式的成功例之后,提取接下来评价值最大的组合模式,因此,实质上提取评价值为极大值的组合模式。
模式提取装置210例如能够由图5所示的计算机40实现。在计算机40的存储部43中存储有用于使计算机40作为模式提取装置210发挥功能的模式提取程序250。模式提取程序250具有样本获取工序52、组合模式获取工序254、决定工序256、以及提取工序258。
CPU41从存储部43读出模式提取程序250并在存储器42中展开,依次执行模式提取程序250所具有的工序。CPU41通过执行样本获取工序52,从而作为图1所示的样本获取部12进行动作。另外,CPU41通过执行组合模式获取工序254,从而作为图1所示的组合模式获取部214进行动作。另外,CPU41通过执行决定工序256,从而作为图1所示的决定部216进行动作。另外,CPU41通过执行提取工序258,从而作为图1所示的提取部218进行动作。由此,执行模式提取程序250的计算机40作为模式提取装置210发挥功能。此外,执行程序的CPU41为硬件。
此外,由模式提取程序250实现的功能例如也可以由半导体集成电路、更详细地说由ASIC等实现。
接下来,对第二实施方式的模式提取装置210的作用进行说明。样本获取部12获取输入到模式提取装置210的样本集合数据,并转交给组合模式获取部214。而且,在模式提取装置210中,执行图10所示的模式提取处理。应予说明,模式提取处理是公开的技术的模式提取方法的一例。
在步骤S212中,组合模式获取部214集中获取从样本集合数据中包含的各样本所具有的多个属性值中选择的1个以上的属性值的组合模式,并转交给决定部216。而且,决定部216对于从组合模式获取部214转交的组合模式中的每一个,决定评价值,并转交给提取部218。而且,提取部218提取由决定部216决定的评价值最大的组合模式。
接下来,在步骤S214中,提取部218输出所提取的组合模式作为段。
接下来,在步骤S218中,提取部218判定所提取的段是否达到规定量。在未达到的情况下,处理移至步骤S220,在达到的情况下,模式提取处理结束。
在步骤S220中,提取部218从样本集合数据中,除去在上述步骤S212中提取出的满足评价值最大的组合模式(所提取的段)的样本中的、成功例的样本。
接下来,在步骤S222中,提取部218判定在样本集合数据中是否残留成功例的样本。在残留的情况下,提取部218向决定部216通知在上述步骤S220中除去的样本的信息,处理返回步骤S212,在未残留的情况下,模式提取处理结束。
返回步骤S212,决定部216对于成功例除去后的样本集合,再次决定组合模式各自的评价值,提取部218基于再次决定的评价值,提取评价值最大的组合模式,并反复。
像以上说明的那样,第二实施方式的模式提取装置针对属性值的每个组合模式,基于满足组合模式的集合的样本数和成功率来计算评价值,提取评价值为最大的组合模式作为段。而且,除去所提取的满足组合模式的成功例的样本,进行每个组合模式的评价值的计算以及评价值为最大的组合模式的提取,并反复。这实质上相当于第一实施方式那样,提取评价值为极大值的组合模式。因此,与第一实施方式同样,能够提取能够得到从市场化的观点出发有用的段的信息这样的属性值的组合模式。
此外,上述各实施方式中使用的属性和属性值是例示,也可以使用其他的属性和属性值。
另外,在上述各实施方式中,说明了模式提取程序预先存储(安装)于存储部的方式,但不限于此。公开的技术的程序也可以以存储于CD-ROM、DVD-ROM、USB存储器等存储介质的方式来提供。
附图标记的说明
10、210…模式提取装置;12…样本获取部;14、214…组合模式获取部;16、216…决定部;18、218…提取部;40…计算机;41…CPU;42…存储器;43…存储部;49…存储介质;50、250…模式提取程序。
Claims (13)
1.一种模式提取程序,其特征在于,使计算机执行如下的处理,
获取样本集合数据,该样本集合数据与多个数据项目各自的数据项目值和关于规定的现象的标签信息分别建立关联,
获取分别为1个以上的所述数据项目值的组合的多个组合模式,
针对所述多个组合模式中的各个组合模式,基于所述样本集合数据所示的样本中的满足组合模式的样本的数量、和满足该组合模式的样本中的所述标签信息表示规定的值的样本的比例来决定评价值,
提取与所述多个组合模式各自的评价值中成为极大值的评价值对应的组合模式。
2.根据权利要求1所述的模式提取程序,其中,
所述评价值具有如下的性质,如果满足所述组合模式的样本的数量相同,若所述比例越高则所述评价值越大,如果所述比例相同,若满足所述组合模式的样本的数量越多则所述评价值越大。
3.根据权利要求1或2所述的模式提取程序,其中,
在针对所述多个组合模式中的特定的组合模式的评价值比针对在所述特定的组合模式中追加了1个以上的所述数据项目值而得的组合模式的评价值、以及针对从所述特定的组合模式中删除了1个以上的所述数据项目值而得的组合模式的评价值双方均高的情况下,提取所述特定的组合模式作为所述评价值为极大值的组合模式。
4.根据权利要求1或2所述的模式提取程序,其中,
从所述多个组合模式中,提取所述评价值最大的组合模式作为所述评价值为极大值的组合模式,
反复从所述样本集合数据中,除去满足所述评价值最大的组合模式的样本中的、所述标签信息表示规定的值的样本,再次决定所述多个组合模式各自的评价值,基于再次决定的评价值,提取所述评价值最大的组合模式。
5.一种模式提取装置,其特征在于,包含:
样本获取部,其获取样本集合数据,该样本集合数据与多个数据项目各自的数据项目值和关于规定的现象的标签信息分别建立关联;
组合模式获取部,获取分别为1个以上的所述数据项目值的组合的多个组合模式;
决定部,针对所述多个组合模式中的各个组合模式,基于所述样本集合数据所示的样本中的满足组合模式的样本的数量、和满足该组合模式的样本中的所述标签信息表示规定的值的样本的比例来决定评价值;以及
提取部,提取与所述多个组合模式各自的评价值中成为极大值的评价值对应的组合模式。
6.根据权利要求5所述的模式提取装置,其中,
所述决定部决定具有如下的性质的所述评价值,如果满足所述组合模式的样本的数量相同,若所述比例越高则所述评价值越大,如果所述比例相同,若满足所述组合模式的样本的数量越多则所述评价值越大。
7.根据权利要求5或6所述的模式提取装置,其中,
在针对所述多个组合模式中的特定的组合模式的评价值比针对在所述特定的组合模式中追加了1个以上的所述数据项目值而得的组合模式的评价值、以及针对从所述特定的组合模式中删除了1个以上的所述数据项目值而得的组合模式的评价值的双方均高的情况下,所述提取部提取所述特定的组合模式作为所述评价值为极大值的组合模式。
8.根据权利要求5或6所述的模式提取装置,其中,
所述提取部反复从所述多个组合模式中,提取所述评价值最大的组合模式作为所述评价值为极大值的组合模式,并且在再次决定所述评价值的情况下,基于再次决定的评价值,提取所述评价值最大的组合模式,
所述决定部从所述样本集合数据中,除去满足所述评价值最大的组合模式的样本中的、所述标签信息表示规定的值的样本,再次决定所述多个组合模式各自的评价值。
9.一种模式提取方法,其特征在于,由计算机执行如下的处理,
获取样本集合数据,该样本集合数据与多个数据项目各自的数据项目值和关于规定的现象的标签信息分别建立关联,
获取分别为1个以上的所述数据项目值的组合的多个组合模式,
针对所述多个组合模式中的各个组合模式,基于所述样本集合数据所示的样本中的满足组合模式的样本的数量、和满足该组合模式的样本中的所述标签信息表示规定的值的样本的比例来决定评价值,
提取与所述多个组合模式各自的评价值中成为极大值的评价值对应的组合模式。
10.根据权利要求9所述的模式提取方法,其中,
所述评价值具有如下的性质,如果满足所述组合模式的样本的数量相同,若所述比例越高则所述评价值越大,通过所述比例相同,若满足所述组合模式的样本的数量越多则所述评价值越大。
11.根据权利要求9或10所述的模式提取方法,其中,
在针对所述多个组合模式中的特定的组合模式的评价值比针对在所述特定的组合模式中追加了1个以上的所述数据项目值而得的组合模式的评价值、以及针对从所述特定的组合模式中删除了1个以上的所述数据项目值而得的组合模式的评价值双方均高的情况下,提取所述特定的组合模式作为所述评价值为极大值的组合模式。
12.根据权利要求9或10所述的模式提取方法,其中,
从所述多个组合模式中,提取所述评价值最大的组合模式作为所述评价值为极大值的组合模式,
反复从所述样本集合数据中,除去满足所述评价值最大的组合模式的样本中的、所述标签信息表示规定的值的样本,再次决定所述多个组合模式各自的评价值,基于再次决定的评价值,提取所述评价值最大的组合模式。
13.一种存储了模式提取程序的存储介质,该模式提取程序使计算机执行如下的处理,
获取样本集合数据,该样本集合数据与多个数据项目各自的数据项目值和关于规定的现象的标签信息分别建立关联,
获取分别为1个以上的所述数据项目值的组合的多个组合模式,
针对所述多个组合模式中的各个组合模式,基于所述样本集合数据所示的样本中的满足组合模式的样本的数量、和满足该组合模式的样本中的所述标签信息表示规定的值的样本的比例来决定评价值,
提取与所述多个组合模式各自的评价值中成为极大值的评价值对应的组合模式。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2019/033949 WO2021038801A1 (ja) | 2019-08-29 | 2019-08-29 | パターン抽出プログラム、装置、及び方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114287017A true CN114287017A (zh) | 2022-04-05 |
Family
ID=74684677
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201980099698.8A Pending CN114287017A (zh) | 2019-08-29 | 2019-08-29 | 模式提取程序、装置以及方法 |
Country Status (5)
Country | Link |
---|---|
US (1) | US20220172235A1 (zh) |
EP (1) | EP4024312A4 (zh) |
JP (1) | JP7168095B2 (zh) |
CN (1) | CN114287017A (zh) |
WO (1) | WO2021038801A1 (zh) |
Citations (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1479246A (zh) * | 2002-06-18 | 2004-03-03 | ŷķ����ʽ���� | 光学信息码的读取方法和光学信息码的读取装置 |
JP2009223809A (ja) * | 2008-03-18 | 2009-10-01 | Fujitsu Ltd | 仕訳条件作成プログラム、仕訳条件作成装置および仕訳条件作成方法 |
JP2009276831A (ja) * | 2008-05-12 | 2009-11-26 | Toshiba Corp | 情報分析装置およびその制御プログラム |
US8554602B1 (en) * | 2009-04-16 | 2013-10-08 | Exelate, Inc. | System and method for behavioral segment optimization based on data exchange |
CN103597485A (zh) * | 2011-06-08 | 2014-02-19 | 株式会社东芝 | 模式提取装置及其方法 |
JP2014048780A (ja) * | 2012-08-30 | 2014-03-17 | Accenture Global Services Ltd | マーケティング装置、マーケティング方法、プログラム、及び記録媒体 |
JP2014170410A (ja) * | 2013-03-04 | 2014-09-18 | Nippon Telegr & Teleph Corp <Ntt> | 情報可視化装置、方法及びプログラム |
JP2014219871A (ja) * | 2013-05-09 | 2014-11-20 | 日本電信電話株式会社 | プロフィール推定モデル学習装置、プロフィール推定装置、方法、及びプログラム |
CN105389548A (zh) * | 2015-10-23 | 2016-03-09 | 南京邮电大学 | 基于人脸识别的婚恋评价系统和方法 |
JP2016035684A (ja) * | 2014-08-04 | 2016-03-17 | 日本電信電話株式会社 | 情報管理システム、情報管理方法、及び情報管理プログラム |
JP2016053829A (ja) * | 2014-09-03 | 2016-04-14 | ソニー株式会社 | 情報処理方法、プログラム、及び情報処理装置 |
CN105701498A (zh) * | 2015-12-31 | 2016-06-22 | 腾讯科技(深圳)有限公司 | 一种用户分类方法及服务器 |
JP2016118865A (ja) * | 2014-12-19 | 2016-06-30 | インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation | 生成装置、生成方法、及び、プログラム |
CN106651409A (zh) * | 2015-10-29 | 2017-05-10 | 北京京东尚科信息技术有限公司 | 预测用户婚姻状态的方法和装置 |
CN106919706A (zh) * | 2017-03-10 | 2017-07-04 | 广州视源电子科技股份有限公司 | 数据更新的方法及装置 |
CN106971317A (zh) * | 2017-03-09 | 2017-07-21 | 杨伊迪 | 基于人脸识别与大数据分析的广告投放效果评价与智能推送决策方法 |
CA3015447A1 (en) * | 2016-02-22 | 2017-08-31 | Tata Consultancy Services Limited | Systems and methods for computing data privacy-utility tradeoff |
CN109147949A (zh) * | 2018-08-16 | 2019-01-04 | 辽宁大学 | 一种基于分类回归树来用于检测教师亚健康状态的方法 |
CN109949175A (zh) * | 2019-03-26 | 2019-06-28 | 桂林电子科技大学 | 一种基于协同过滤和相似性度量的用户属性推断方法 |
US11188940B1 (en) * | 2015-09-01 | 2021-11-30 | Groupon, Inc. | Method, apparatus, and computer program for predicting consumer behavior |
Family Cites Families (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20020049720A1 (en) * | 2000-05-11 | 2002-04-25 | Chase Manhattan Bank | System and method of data mining |
US20050071223A1 (en) * | 2003-09-30 | 2005-03-31 | Vivek Jain | Method, system and computer program product for dynamic marketing strategy development |
US20050216525A1 (en) * | 2004-03-26 | 2005-09-29 | Andre Wachholz-Prill | Defining target group for marketing campaign |
US7627620B2 (en) * | 2004-12-16 | 2009-12-01 | Oracle International Corporation | Data-centric automatic data mining |
US20070112733A1 (en) * | 2005-11-14 | 2007-05-17 | Beyer Dirk M | Method and system for extracting customer attributes |
JP5228461B2 (ja) * | 2007-12-05 | 2013-07-03 | 富士通株式会社 | パターン抽出装置、パターン抽出プログラムおよびパターン抽出方法 |
KR20130009754A (ko) * | 2010-02-01 | 2013-01-23 | 점프탭, 인크. | 통합형 광고 시스템 |
US10178043B1 (en) * | 2014-12-08 | 2019-01-08 | Conviva Inc. | Dynamic bitrate range selection in the cloud for optimized video streaming |
US11138618B1 (en) * | 2015-06-22 | 2021-10-05 | Amazon Technologies, Inc. | Optimizing in-application purchase items to achieve a developer-specified metric |
WO2017094207A1 (ja) * | 2015-11-30 | 2017-06-08 | 日本電気株式会社 | 情報処理システム、情報処理方法および情報処理用プログラム |
US20170193538A1 (en) * | 2016-01-06 | 2017-07-06 | Oracle International Corporation | System and method for determining the priority of mixed-type attributes for customer segmentation |
US10936620B2 (en) * | 2016-11-22 | 2021-03-02 | Flytxt BV | Systems and methods for management of multi-perspective customer segments |
JP7120649B2 (ja) * | 2017-05-09 | 2022-08-17 | 日本電気株式会社 | 情報処理システム、情報処理装置、予測モデル抽出方法および予測モデル抽出プログラム |
US20180361253A1 (en) * | 2017-05-22 | 2018-12-20 | Scientific Revenue, Inc. | Method of automating segmentation of users of game or online service with limited a priori knowledge |
WO2019087526A1 (ja) * | 2017-11-02 | 2019-05-09 | 日本電気株式会社 | 評価システム、評価方法および評価用プログラム |
US10769647B1 (en) * | 2017-12-21 | 2020-09-08 | Wells Fargo Bank, N.A. | Divergent trend detection and mitigation computing system |
US10248527B1 (en) * | 2018-09-19 | 2019-04-02 | Amplero, Inc | Automated device-specific dynamic operation modifications |
-
2019
- 2019-08-29 CN CN201980099698.8A patent/CN114287017A/zh active Pending
- 2019-08-29 EP EP19943242.8A patent/EP4024312A4/en active Pending
- 2019-08-29 WO PCT/JP2019/033949 patent/WO2021038801A1/ja unknown
- 2019-08-29 JP JP2021541906A patent/JP7168095B2/ja active Active
-
2022
- 2022-02-14 US US17/671,471 patent/US20220172235A1/en active Pending
Patent Citations (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1479246A (zh) * | 2002-06-18 | 2004-03-03 | ŷķ����ʽ���� | 光学信息码的读取方法和光学信息码的读取装置 |
JP2009223809A (ja) * | 2008-03-18 | 2009-10-01 | Fujitsu Ltd | 仕訳条件作成プログラム、仕訳条件作成装置および仕訳条件作成方法 |
JP2009276831A (ja) * | 2008-05-12 | 2009-11-26 | Toshiba Corp | 情報分析装置およびその制御プログラム |
US8554602B1 (en) * | 2009-04-16 | 2013-10-08 | Exelate, Inc. | System and method for behavioral segment optimization based on data exchange |
CN103597485A (zh) * | 2011-06-08 | 2014-02-19 | 株式会社东芝 | 模式提取装置及其方法 |
JP2014048780A (ja) * | 2012-08-30 | 2014-03-17 | Accenture Global Services Ltd | マーケティング装置、マーケティング方法、プログラム、及び記録媒体 |
JP2014170410A (ja) * | 2013-03-04 | 2014-09-18 | Nippon Telegr & Teleph Corp <Ntt> | 情報可視化装置、方法及びプログラム |
JP2014219871A (ja) * | 2013-05-09 | 2014-11-20 | 日本電信電話株式会社 | プロフィール推定モデル学習装置、プロフィール推定装置、方法、及びプログラム |
JP2016035684A (ja) * | 2014-08-04 | 2016-03-17 | 日本電信電話株式会社 | 情報管理システム、情報管理方法、及び情報管理プログラム |
JP2016053829A (ja) * | 2014-09-03 | 2016-04-14 | ソニー株式会社 | 情報処理方法、プログラム、及び情報処理装置 |
JP2016118865A (ja) * | 2014-12-19 | 2016-06-30 | インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation | 生成装置、生成方法、及び、プログラム |
US11188940B1 (en) * | 2015-09-01 | 2021-11-30 | Groupon, Inc. | Method, apparatus, and computer program for predicting consumer behavior |
CN105389548A (zh) * | 2015-10-23 | 2016-03-09 | 南京邮电大学 | 基于人脸识别的婚恋评价系统和方法 |
CN106651409A (zh) * | 2015-10-29 | 2017-05-10 | 北京京东尚科信息技术有限公司 | 预测用户婚姻状态的方法和装置 |
CN105701498A (zh) * | 2015-12-31 | 2016-06-22 | 腾讯科技(深圳)有限公司 | 一种用户分类方法及服务器 |
CA3015447A1 (en) * | 2016-02-22 | 2017-08-31 | Tata Consultancy Services Limited | Systems and methods for computing data privacy-utility tradeoff |
CN106971317A (zh) * | 2017-03-09 | 2017-07-21 | 杨伊迪 | 基于人脸识别与大数据分析的广告投放效果评价与智能推送决策方法 |
CN106919706A (zh) * | 2017-03-10 | 2017-07-04 | 广州视源电子科技股份有限公司 | 数据更新的方法及装置 |
CN109147949A (zh) * | 2018-08-16 | 2019-01-04 | 辽宁大学 | 一种基于分类回归树来用于检测教师亚健康状态的方法 |
CN109949175A (zh) * | 2019-03-26 | 2019-06-28 | 桂林电子科技大学 | 一种基于协同过滤和相似性度量的用户属性推断方法 |
Also Published As
Publication number | Publication date |
---|---|
WO2021038801A1 (ja) | 2021-03-04 |
US20220172235A1 (en) | 2022-06-02 |
JP7168095B2 (ja) | 2022-11-09 |
EP4024312A4 (en) | 2022-08-10 |
EP4024312A1 (en) | 2022-07-06 |
JPWO2021038801A1 (zh) | 2021-03-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9195738B2 (en) | Tokenization platform | |
JP5299272B2 (ja) | 分析プログラムおよび分析装置 | |
KR101099908B1 (ko) | 문서 간 유사도 계산 시스템 및 방법 | |
US9025890B2 (en) | Information classification device, information classification method, and information classification program | |
KR101705778B1 (ko) | 데이터 스트림 상에서 가중화 최대 빈발 패턴을 마이닝하기 위한 슬라이딩 윈도우 기반 빈발 패턴 관리 방법 | |
JP6065844B2 (ja) | インデックス走査装置及びインデックス走査方法 | |
JP2019212126A (ja) | 販売支援システム、販売支援方法および販売支援プログラム | |
CN111310930B (zh) | 优化装置、优化方法和非暂态计算机可读存储介质 | |
JP5194818B2 (ja) | データ分類方法およびデータ処理装置 | |
JP4985724B2 (ja) | 単語認識プログラム、単語認識方法、単語認識装置 | |
US20140172897A1 (en) | Device, method, and program for processing data with tree structure | |
CN114287017A (zh) | 模式提取程序、装置以及方法 | |
CN111160445B (zh) | 投标文件相似度计算方法及装置 | |
US9437020B2 (en) | System and method to check the correct rendering of a font | |
US9910846B2 (en) | Conversion device and conversion method | |
JP6551026B2 (ja) | 候補語評価装置、候補語評価システム、プログラム及び候補語評価方法 | |
CN105260423A (zh) | 电子名片去重方法及装置 | |
CN115904970A (zh) | 回归测试方法及设备 | |
CN107729898B (zh) | 检测文本图像中的文本行的方法和装置 | |
JPWO2019171538A1 (ja) | 意味推定システム、方法およびプログラム | |
CN112861005A (zh) | 用于信息推送的方法及装置、设备 | |
CN108133012B (zh) | 一种标签设置方法及装置 | |
CN114816845B (zh) | 一种基于MongoDB的快速数据回滚方法及装置 | |
CN104899213A (zh) | 一种解析组织机构名的方法和装置 | |
US20230195280A1 (en) | Identification device, identification method, and identification program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |