CN106796618A - 时序预测装置和时序预测方法 - Google Patents

时序预测装置和时序预测方法 Download PDF

Info

Publication number
CN106796618A
CN106796618A CN201480081491.5A CN201480081491A CN106796618A CN 106796618 A CN106796618 A CN 106796618A CN 201480081491 A CN201480081491 A CN 201480081491A CN 106796618 A CN106796618 A CN 106796618A
Authority
CN
China
Prior art keywords
time series
event
series data
data
causality
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201480081491.5A
Other languages
English (en)
Inventor
早矢仕裕
冨田直史
石黑正雄
广井和重
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Publication of CN106796618A publication Critical patent/CN106796618A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N5/00Computing arrangements using knowledge-based models
    • G06N5/04Inference or reasoning models
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations
    • G06F17/18Complex mathematical operations for evaluating statistical data, e.g. average values, frequency distributions, probability functions, regression analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • Mathematical Physics (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Analysis (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Algebra (AREA)
  • Databases & Information Systems (AREA)
  • Probability & Statistics with Applications (AREA)
  • Operations Research (AREA)
  • Evolutionary Biology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Medical Informatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computational Linguistics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

预测关于事件的时序数据的变化的信息处理装置即时序预测装置(10),基于与包含作为预测对象的事件的多个事件分别关联的时序数据和与事件间的因果关系关联的时序数据,计算表示上述事件间的因果关系的强弱的指标即关联度,基于计算出的关联度来预测与上述事件关联的时序数据的变化。时序预测装置(10)使用与上述事件间的因果关系关联的时序数据中的、与上述事件关联的用语的共现频度来计算关联度。时序预测装置(10)基于与作为预测对象的事件具有因果关系的事件所关联的时序数据,构建预测与作为预测对象的事件关联的时序数据的变化的多个预测模型,通过与关联度相应地对各预测模型进行加权而将预测模型各自的预测结果汇总。

Description

时序预测装置和时序预测方法
技术领域
本发明涉及时序预测装置和时序预测方法。
背景技术
专利文献1中记载了:“第一数据收集单元取得预先确定的期间内的时序文本数据。第一评价值计算单元基于时序文本数据对每个对象计算时序的评价值。第二数据收集单元取得预先确定的期间内的时序数值数据。变化率计算单元基于时序数值数据对每个对象计算时序的变化率。第三数据收集单元收集预先确定的期间后的文本信息。第二评价值计算单元基于收集的文本信息对每个对象计算评价值。关注度计算单元使用对每个对象计算的时序的评价值、时序的变化率和评价值计算每个对象的关注度。显示单元显示每个对象的关注度。”
现有技术文献
专利文献
专利文献1:日本特开2012-79227号公报
发明要解决的技术问题
近年来,公开了政府统计、新闻报道、SNS(Social Networking Service:社交网路服务)上的发言等关于社会动向的多种时序数据,提出了利用这些时序数据来预测关于社会动向的事件(现象)的时间变化的技术。通过基于这样的技术来预测社会动向,将其结果应用于市场营销等项目策划立案,能够建立符合社会动向变化的收益性高的项目。
关于社会动向的事件的变化预测,例如能够通过输入关于社会动向的多种时序数据,预测关于作为预测对象的事件的时序数据的变化来实现。例如,为了预测“外国人增加”这一事件的变化,可以使用政府统计、新闻报道、SNS上的发言等的关于“外国人增加”的时序数据,来构建预测“外国人的人数”的变化的预测模型。其中,将社会动向的变化作为预测对象时,因为多个事件相互关联而使社会动向的变化发生,所以为了高精度地预测关于作为预测对象的事件的时序数据的变化,考虑事件之间的因果关系是重要的。
此处,在专利文献1中公开的技术中,将事件之间的因果关系视为固定的,基于过去得到的数据构建预测模型。因此,在构建预测模型之后事件之间的因果关系变化的情况下预测精度会降低。
发明内容
本发明的目的在于提供一种能够根据事件之间的因果关系的变化来高精度地预测事件的变化的时序预测装置和时序预测方法。
用于解决问题的技术手段
为了达成上述目的的本发明中的一个方面,是一种预测关于事件(现象)的时序数据的变化的信息处理装置,其包括:关联度计算部,其基于与包含作为预测对象的事件的多个事件分别关联的时序数据和与上述事件间的因果关系关联的时序数据,计算作为表示上述事件间的因果关系的强弱的指标的关联度;和变化预测部,其基于上述关联度,预测与上述事件关联的时序数据的变化。
本申请公开的其他问题及其解决方法通过具体实施方式和附图来进一步说明。
发明效果
根据本发明,能够根据事件之间的因果关系的变化,高精度地预测事件的变化。
附图说明
图1是具有因果关系的多个事件的一例。
图2是表示时序预测装置10的硬件结构的图。
图3是说明时序预测装置10具备的功能(软件结构)和管理的数据的数据流图。
图4是因果关系数据121的一例。
图5是时序文本数据1221的一例。
图6是时序数值数据1222的一例。
图7是说明时序数据收集处理S700的流程图。
图8是关联度数据123的一例。
图9是说明关联度计算处理S900的流程图。
图10是说明第一特征量计算处理S902的流程图。
图11是用于计算第一特征量的式子的一例。
图12是说明第二特征量计算处理S903的流程图。
图13是变化指标数据124的一例。
图14是说明变化预测处理S1400的流程图。
图15是使用变化指标构建的预测模型的一例。
图16是使用时序数据122构建的预测模型的一例。
图17是基于关联度将预测结果汇总的式子的一例。
图18是说明预测结果表示处理S1800的流程图。
图19是设定画面1900的一例。
图20是预测结果显示画面2000的一例。
具体实施方式
以下对一个实施方式使用附图进行详细叙述。
以下说明的时序预测装置收集与包含作为预测对象的事件的多个事件分别关联的时序数据、和与事件间的因果关系关联的时序数据,使用收集了的时序数据,计算作为表示事件间的因果关系的强弱的指标的关联度。并且,时序预测装置一边基于计算出的关联度考虑事件间的因果关系的影响,一边预测与作为预测对象的事件关联的时序数据的变化。
在图1中示出具有因果关系的多个事件的一例。该图中,记载了“景气”、“收入”、“安心感”的文字的各个圆表示与各事件对应的节点2(node),并且连接各节点2的边3(edge)表示事件之间的因果关系。时序预测装置从互联网收集这些与事件和因果关系关联的时序数据,使用收集了的时序数据,计算事件之间的因果关系的强弱作为关联度。例如,图1中,在作为预测对象的事件(子节点)是“安心感”的情况下,时序预测装置例如从互联网收集SNS(Social Networking Service:社交网路服务)数据、新闻数据、平均个人收入、收入额对生活的影响度这些时序数据,计算与作为父节点的“收入”之间的因果关系的强弱作为事件之间的关联度。
时序预测装置例如使用与事件之间的因果关系关联的时序数据中的、与事件关联的用语(关键字)的共现频度(共现:collocation)来计算。另外,时序预测装置例如基于与上述作为预测对象的事件具有因果关系的事件所关联的时序数据,构建用于预测与作为预测对象的事件关联的时序数据的变化的多个预测模型,与计算出的关联度相应地对各预测模型加权,将各预测模型的预测结果汇总,由此进行上述变化预测。
这样,时序预测装置将事件之间的因果关系的变化(例如伴随消费税增税等原因引起的因果关系的变化)视为关联度的变化,使用关联度预测时序数据的变化,所以例如能够高精度地预测关于社会动向的时序数据的变化。然后,通过将这样得到的预测结果应用于例如市场营销等项目策划立案,能够有助于建立符合社会动向变化的收益性高的项目。
在图2中示出了时序预测装置的硬件结构。时序预测装置10是信息处理装置(计算机),包括处理器11、主存储装置12、辅助存储装置13、输入装置14、输出装置15和通信装置16。它们通过总线等通信单元可通信地连接。
处理器11例如用CPU(Central Processing Unit:中央处理单元)、MPU(MicroProcessing Unit:微处理单元)构成。主存储装置12是存储程序和数据的装置,例如是ROM(Read Only Memory:只读存储器)、RAM(Random Access Memory:随机存取存储器)、NVRAM(Non Volatile RAM:非易失性存储器)等。辅助存储装置13是硬盘驱动器、SSD(SolidState Drive:固态硬盘)、光学式存储装置等。辅助存储装置13中保存的程序和数据随时被载入主存储装置12中。
输入装置14是从用户接受信息和指示的输入的用户接口,例如是键盘、鼠标、触摸面板等。输出装置15是对用户提供信息的用户接口,例如是图形卡、液晶显示器等。通信装置16是经由互联网50与其他装置通信的通信接口,例如是NIC(Network Interface Card:网络接口卡)和无线LAN接口。
图3是说明时序预测装置10具备的功能(软件结构)和管理的数据的数据流图。如该图所示,时序预测装置10包括时序数据收集部111、关联度计算部112、变化预测部113和预测结果显示部114各功能。这些功能通过处理器11读取并运行主存储装置12中保存的程序而实现。
另外,如该图所示,时序预测装置10存储了因果关系数据121、时序数据122(时序文本数据1221、时序数值数据1222)、关联度数据123和变化指标数据124。这些数据例如由在时序预测装置10中工作的DBMS(DataBase Management System:数据库管理系统)管理。
该图所示的功能中,时序数据收集部111参照与事件和事件间的因果关系相关的数据即因果关系数据121,经由互联网50收集时序文本数据1221和时序数值数据1222。其中,因果关系数据121例如由时序预测装置10的用户等预先创建。
在图4中示出了因果关系数据121的一例。如该图所示,因果关系数据121包含与事件相关的信息即节点信息数据301、和与事件间的因果关系相关的信息即因果关系信息数据302。
该图中,节点信息数据301的节点ID303是区分各个事件(节点)的标识符(以下称为节点ID)。节点名304是该事件的名称。关联关键字305是与该事件关联的用语的集合。节点关联数据名306是与该事件关联的数据(以下称为节点关联数据)的名称。节点关联数据种类307是该节点关联数据的种类。节点关联数据取得处308是表示该节点关联数据的取得处的信息。其中,节点关联数据种类307例如是“数值数据”和“文本数据”。节点关联数据取得处308例如是表示上传了节点关联数据的URL(Uniform Resource Locator:统一资源定位器)的“http://○○○.jp”、或表示用于取得节点关联数据的API(ApplicationProgramming Interface:应用编程接口)的“API△△△”。
该图中,因果关系信息数据302的因果关系ID309是区分各个因果关系的识别符。父节点ID310是构成该因果关系的2个事件(节点)中的父节点的ID,子节点ID311是构成该因果关系的2个事件(节点)中的子节点的ID。因果关系关联数据名312是与该因果关系关联的数据(以下称为因果关系关联数据)的名称。因果关系关联数据种类313是该因果关系关联数据的种类。因果关系关联节点关联数据取得处314是表示该因果关系关联数据的取得处的信息。
在图5中示出了时序数据收集部111收集的时序文本数据1221的一例。该图中的数据名401对应于节点信息数据301的节点关联数据名306、或者因果关系信息数据302的因果关系关联数据名312。该图中,举例示出了数据名401分别为“SNS数据”和“新闻数据”的2个时序文本数据1221。关联节点ID402是与该时序文本数据1221关联的事件的节点ID303。关联因果关系ID403是与该时序文本数据1221关联的因果关系信息数据302的因果关系ID309。文本数据本体404是时序文本数据1221的本体,具有时间4041和文本4042各项目。例如,时序文本数据1221是微博客的情况下,时间4041是在微博客上发表文章的时间(日期),文本4042是微博客的文章的正文。
在图6中示出了时序数据收集部111生成的时序数值数据1222的一例。其中,构成时序数值数据1222的元素中,对于附加了与图5相同的符号的元素,因为与图5相同,所以省略重复的说明。该图中,举例示出了数据名401分别为“平均个人收入”和“收入额对生活的影响度”的2个时序数值数据1222。数值数据本体501是时序数值数据1222的本体,具有时间5011和数值5012各项目。例如,数据名401是“平均个人收入”的时序数值数据1222的时间5011,是取得信息(例如平均年收入额)的年度,数值5012是取得的信息(例如平均年收入额)。
图7是说明图3所示的时序数据收集部111进行的处理(以下称为时序数据收集处理S700)的流程图。以下,与该图一同说明时序数据收集处理S700。
首先,时序数据收集部111从因果关系数据121中选择节点信息数据301的节点(用节点ID303确定的记录)中的一个、或者因果关系信息数据302的因果关系(用因果关系ID309确定的记录)中的一个(S701)。
接着,时序数据收集部111经由互联网50访问S701中选择的节点的节点关联数据取得处308或者S701中选择的因果关系的因果关系关联节点关联数据取得处314,取得时序数据122(S702)。
接着,时序数据收集部111判定S701中选择的节点的节点关联数据种类307、或者S701中选择的因果关系的因果关系关联数据种类313是否为数值数据(S703)。S701中选择的节点关联数据种类307、或者S701中选择的因果关系关联数据种类313是数值数据的情况下(S703:是),时序数据收集部111将S702中取得的时序数据122作为时序数值数据1222存储(S704)。S701中选择的节点关联数据种类307、或者S701中选择的因果关系关联数据种类313不是数值数据的情况下(S703:否),时序数据收集部111将S702中取得的时序数据122作为时序文本数据1221存储(S705)。
时序数据收集部111反复进行以上处理,由此取得与选择的节点或因果关系关联的所有数据(S706)。
另外,时序数据收集部111反复进行以上处理直到对于因果关系数据121的所有记录(所有节点和所有因果关系)的处理完成(S707)。
返回图3继续说明。关联度计算部112参照因果关系数据121以及时序数据122(时序文本数据1221、时序数值数据1222),生成表示节点之间的因果关系的强弱的数据即关联度数据123。
在图8中示出了关联度数据123的一例。关联度数据123的关联因果关系ID701对应于因果关系数据121的因果关系信息数据302的因果关系ID309。关联度数据本体702具有时间7021和关联度7022各项目。时间7021是与关联度7022对应的时间,关联度7022是表示各时间7021时的因果关系的强弱的指标(关联度)。
图9是说明关联度计算部112进行的处理(以下称为关联度计算处理S900)的流程图。以下与该图一同说明关联度计算处理S900。
关联度计算部112首先选择一个因果关系信息数据302的因果关系(用节点ID303确定的记录)(S901)。
接着,关联度计算部112使用与选择的因果关系关联的时序文本数据1221和与选择的因果关系关联的节点信息数据301,计算表示因果关系的强弱的指标即第一特征量(S902)。
图10是说明计算第一特征量的处理(以下称为第一特征量计算处理S902)的流程图。以下与该图一同说明第一特征量计算处理S902。
首先,关联度计算部112参照时序文本数据1221的关联因果关系ID403,取得与S901中选择的因果关系关联的时序文本数据1221(S1001)。例如,S901中选择了图4所示的因果关系ID309为“#A”的因果关系的情况下,关联度计算部112从时序文本数据1221中取得关联因果关系ID403中包含“#A”的时序文本数据1221(图5中数据名401为“SNS数据”的时序文本数据1221)。
接着,关联度计算部112取得因果关系的父节点和子节点的关联关键字(S1002)。例如,S901中选择了图4所示的因果关系ID309为“#A”的因果关系的情况下,父节点ID310是“#1”,子节点ID311是“#2”,所以关联度计算部112从节点信息数据301取得“收入,工资”作为父节点的关联关键字305,取得“将来,安心”作为子节点的关联关键字305。
接着,关联度计算部112用预先确定的方法,计算表示因果关系的强弱的指标即第一特征量(S1003)。
在图11中示出用于计算第一特征量的式子的一例。关联度计算部112基于取得的时序文本数据1221中的一定期间中的父节点的关联关键字305和子节点的关联关键字305的共现频度来计算第一特征量。其中,用于计算共现频度的分析期间,例如由时序预测装置10的用户通过后述的设定画面1900指定。计算关联度时,关联度计算部112使用从当前时刻向过去回溯分析单位相应的时序文本数据1221。例如,当前时间是“2014年3月30日”,分析单位的指定是“30天”的情况下,关联度计算部112使用“2014年3月1日”~“2014年3月30日”的期间的时序文本数据1221来计算关联度。
图11中的值c,是例如在将图4所示的因果关系ID309为“#A”的因果关系作为对象的情况下,在过去30天中,包含父节点的关联关键字305即“收入,工资”中的任意一方、并且包含子节点的关联关键字305即“将来,安心”中的任意一方的时序文本数据1221的件数。另外,图11的计算式中的值n,是过去30天中的包含子节点的关联关键字305即“将来,安心”中的任意一方的时序文本数据1221的件数。图11的计算式中的值b,是用于防止关联度成为“0”的平滑参数,例如由时序预测装置10的用户预先设定。
例如,当前时间是“2014年3月30日”,分析单位是“30天”,平滑参数的值b是“0.01”,时序数据是图5的数据名401为“SNS数据”、在“2014年3月1日”~“2014年3月30日”的期间中包含关键字“收入,工资”中的任意一方、并且包含“将来,安心”中的任意一方的数据件数为40件,包含关键字“将来,安心”中的任意一方的数据件数为100件的情况下,求出图4所示的因果关系ID309为“#A”的因果关系中的第一特征量是(40/100)+0.01=0.41。
另外,与S901中选择的因果关系关联的时序文本数据1221不存在的情况下,关联度计算部112将第一特征量设为例如b(平滑参数)。另外,存在多个与作为对象的因果关系关联的时序文本数据1221的情况下,关联度计算部112例如用图11的式子对每个时序文本数据1221求出特征量,将对于所有时序文本数据1221求出的特征量的平均值作为第一特征量。另外,关联度计算部112也可以对每个时序文本数据1221设定权重,将对用图11所示的式子求出的每个时序文本数据1221的特征量加权求出的平均值作为第一特征量。
返回图9,接着,关联度计算部112使用与因果关系相关的时序数值数据1222求出表示因果关系的强弱的指标即第二特征量(S903)。
图12是说明计算第二特征量的处理(以下称为第二特征量计算处理S903)的流程图。以下与该图一同说明第二特征量计算处理S903。
首先,关联度计算部112参照时序数值数据1222中的关联因果关系ID403,取得与因果关系关联的时序数值数据1222(S1201)。例如,S901中选择了图4所示的因果关系ID309为“#A”的因果关系的情况下,从图6所示的时序数值数据1222中取得关联因果关系ID403中包含“#A”的时序数值数据1222即“收入额对生活的影响度”。
接着,关联度计算部112求出第二特征量(S1202)。第二特征量例如通过对时序数值数据1222的过去1年的数值的平均除以预先确定的值而求出。例如,当前时间是“2014年4月1日”,S901中选择了图4的因果关系ID309为“#A”的因果关系的情况下,在图6所示的“收入额对生活的影响度”中,求出将2013年的数值5012即“39”除以预先确定的值“100”得到的值“0.39”作为第二特征量。
另外,与S901中选择的因果关系关联的时序数值数据1222不存在的情况下,关联度计算部112将第二特征量设为例如“0”。另外,S901中选择了多个与因果关系关联的时序数值数据1222的情况下,关联度计算部112例如对每个时序数值数据1222计算特征量,将所有数据的平均值作为第二特征量。另外,关联度计算部112也可以对每个时序数值数据1222设定不同的权重,将对每个时序数值数据1222计算出的特征量加权求出的平均值作为第二特征量。
返回图9,接着,关联度计算部112使用如上所述求出的第一特征量和第二特征量计算关联度(S904)。关联度计算部112例如将第一特征量与第二特征量的平均值作为关联度。例如,S901中选择了图4所示的因果关系ID309为“#A”的因果关系的情况下,第一特征量是“0.41”,第二特征量是“0.39”,关联度计算部112将(0.41+0.39)/2=0.40作为关联度。
关联度计算部112对于各因果关系反复进行以上处理,由此对于因果关系数据121中包含的所有因果关系计算关联度(S905)。
再次返回图3继续说明。变化预测部113使用因果关系数据121、关联度数据123、和变化指标数据124中保存的数据预测与事件的变化相关的指标即变化指标的变化,生成变化指标数据124作为预测结果。
在图13中示出了变化指标数据124的一例。变化指标数据124的节点ID1201对应于与变化指标本体1203对应的因果关系数据121的节点ID303。变化指标名1202是变化指标的名称。变化指标本体1203是变化指标的本体,具有时间12031和指标值12032各项目,表示各时间的变化指标的大小。
图14是说明变化预测部113进行的处理(以下称为变化预测处理S1400)的流程图。以下与该图一同说明变化预测处理S1400。
变化预测部113首先决定变化指标的预测顺序(S1401)。变化预测部113例如通过读取时序预测装置10的用户预先设定的预测顺序而决定变化指标的预测顺序。例如,图1的事件的例子中,变化预测部113将预测顺序设为“景气”→“收入”→“安心感”等。
接着,变化预测部113按照S1401中决定的预测顺序选择一个变化指标(S1402)。
接着,变化预测部113取得选择的变化指标的节点ID1201,生成父节点的节点ID的列表(S1403)。生成父节点的节点ID的列表,通过从因果关系信息数据302取得子节点ID311是节点ID1201的因果关系的父节点ID310而进行。例如,S1402中选择了图13的变化指标数据124中的“对将来的安心度”作为变化指标的情况下,变化预测部113在图4的因果关系信息数据302中,选择子节点ID311中包含变化指标数据124的节点ID1201“#2”的因果关系ID309为“#A”的因果关系的父节点ID310“#1”,将其登录在父节点的节点ID列表中。
接着,变化预测部113使用S1403中取得的父节点的变化指标,构建用于预测S1402中选择的变化指标的变化的预测模型(S1404)。其中,存在多个与父节点对应的变化指标的情况下,构建多个与1个父节点对应的变化指标、和S1402中选择的变化指标的预测模型。
在图15中示出使用变化指标构建的预测模型的一例。例如,S1402中在图13所示的变化指标中选择了“对将来的安心度”的情况下,变化预测部113使用与节点ID310为“#1”的节点对应的变化指标即“平均个人收入”,构建预测“对将来的安心度”的模型。
返回图14,接着,变化预测部113使用与S1402中选择的变化指标对应的节点关联的时序数据,构建预测S1402中选择的变化指标的变化的预测模型(S1405)。首先,变化预测部113参照图5所示的时序文本数据1221和图6所示的时序数值数据1222的关联节点ID402,取得与S1402中选择的变化指标对应的节点关联的时序数据122。然后,变化预测部113使用取得的时序数据122,构建预测1402中选择的变化指标的变化的预测模型。
在图16中示出使用时序数据122构建的预测模型的一例。例如,S1402中在图13所示的变化指标中选择了“对将来的安心度”的情况下,变化预测部113取得节点ID402为“#2”的图5的“SNS数据”。此处“SNS数据”是时序文本数据1221,所以变化预测部113在“SNS数据”中,以分析单位即“30天”的间隔,统计包含节点的关联关键字305即“将来,安心”中的任意一方的数据的件数,由此构建预测模型。
返回图14,接着,变化预测部113使用节点之间的关联度对各预测模型的预测结果进行加权而将多个预测结果汇总(S1406)。此处,加权以节点之间的关联度越大则权重越大的方式进行。由此,以重视基于关联度较大的父节点的预测结果的方式进行预测。具体而言,例如变化预测部113基于图17所示的式子,对于S1404和S1405中计算出的预测模型生成的预测结果,将预测结果汇总。
变化预测部113对所有节点进行以上操作,由此预测对各节点的变化指标的变化(S1407)。
返回图2继续说明。该图所示的预测结果显示部114从用户接受用于分析的设定信息。然后,预测结果显示部114基于接受的设定信息、和因果关系数据121、关联度数据123、和变化指标数据124,起动上述关联度计算处理S900和变化预测处理S1400,生成显示其结果的画面并在输出装置15上显示结果。
图18是说明预测结果显示部114进行的处理(以下称为预测结果显示处理S1800)的流程图。以下与该图一同说明预测结果显示处理S1800。
预测结果显示部114首先显示图19所示的设定画面1900,从用户接受设定信息(S1801)。用户在设定画面1900的分析单位1902中指定数据的分析单位(30天等)。另外,用户在分析期间1903中指定用于分析的数据的期间。另外,用户在因果关系数据名1904中指定用于分析的因果关系数据121的名称。
返回图18,接着,预测结果显示部114基于S1801中接受的设定信息,起动关联度计算部112进行的关联度计算处理S900、和变化预测部113进行的变化预测处理S1400(S1802)。
接着,预测结果显示部114生成并显示记载了变化预测处理S1400的结果的画面(以下称为预测结果显示画面2000)。
在图20中示出预测结果显示画面2000的一例。如该图所示,预测结果显示画面2000具有预测结果显示区域2002和因果关系关联信息显示区域2003。
预测结果显示部114参照因果关系数据121和关联度数据123,生成表达因果关系的结果的图表。例如,如该图所示,预测结果显示部114基于节点信息数据301和因果关系信息数据302,在预测结果显示区域2002中显示由节点2004~2006和有向边2007~2008构成的图表。
另外,预测结果显示部114在预测结果显示区域2002中以关联度变化图表2009的形式显示关联度数据123的关联度数据本体702。如该图所示,预测结果显示部114基于关联因果关系ID701,使有向边2007、2008与关联度变化图表2009对应地显示。其中,有向边2007、2008也可以与关联度的大小相应地变更线的粗细等、与关联度相应地改变显示方式。另外,也可以如符号2012所示在关联度有较大变化的情况下对变化点进行强调显示(用圆圈包围等)。
这样,时序预测装置10的用户能够根据预测结果显示区域2002的显示内容,容易地得知事件之间的因果关系的强弱随时间如何变化。该图所示的例子中,用户能够容易地得知从“收入”到“安心感”的关联度增加、“收入”对“安心感”造成的影响增大。
返回图18,接着,预测结果显示部114参照变化指标数据1202的变化指标名1202和变化指标本体1203,生成并显示表示变化指标的变化的预测的图表(以下称为变化预测图表)(S1804)。例如,如图20所示,预测结果显示部114以变化预测图表2010的形式显示变化指标名1202和变化指标本体1203。由此,用户能够直观地得知事件的变化。
预测结果显示部114将一个因果关系作为对象,在因果关系关联信息显示区域2003中显示指定的时间中的与因果关系相关的信息(S1805)。用户能够在因果关系关联信息显示区域2003的因果关系指定栏2013中指定作为信息的显示对象的因果关系和时间。其中,也可以通过由用户选择关联度变化图表2009的变化点2012,而使与变化点2012对应的因果关系和时间自动地成为信息的显示对象。
预测结果显示部114提取在指定的时间中、包含父节点的关联关键字305和子节点的关联关键字305双方的时序数据122,在因果关系关联语显示部2014中按出现频度从高到低的顺序显示提取的时序数据122中包含的用语。由此,用户在关联度的大小随时间变化的情况下,能够通过参照显示的用语而获得关于因果关系变化的原因的知识。例如,图20的例子中,根据关联度变化图表2009,能够得知父节点“收入”与子节点“安心感”的关联度增加,在因果关系关联语显示部2014中按出现频度从高到低的顺序,显示了“消费税”、“制度”、“增加”这些用语,所以用户能够得知因为消费税增加等制度改正而使“收入”对“安心感”造成的影响增大。
如以上所说明,根据本实施方式的时序预测装置10,因为将事件之间的因果关系的变化视为关联度的变化,使用关联度预测时序数据的变化,所以例如能够高精度地预测关于社会动向的时序数据的变化。而且,这样得到的预测结果,例如能够通过应用于市场营销等项目策划立案而有助于建立符合社会动向变化的收益性高的项目。
另外,本发明不限定于上述实施方式,包括各种变形例。例如,上述实施方式是为了易于理解地说明本发明而详细说明的,并不限定于必须具备说明的所有结构。另外,能够将某个实施方式的结构的一部分置换为其他实施方式的结构,也能够在某个实施方式的结构上添加其他实施方式的结构。另外,对于各实施方式的结构的一部分,能够追加、删除、置换其他结构。
上述各结构、功能、处理部、处理单元等的一部分或全部,例如可以通过集成电路设计等而用硬件实现。另外,上述各结构、功能等,也可以通过处理器解释、运行实现各功能的程序而用软件实现。实现各功能的程序、表、文件等信息,能够保存在存储器、硬盘、SSD等记录装置、或者IC卡、SD卡、DVD等记录介质中。
控制线和信息线示出了认为说明上必要的,并不一定示出了产品上所有的控制线和信息线。实际上也可以认为几乎所有结构都相互连接。
附图标记的说明
10 时序预测装置,50 互联网,111 时序数据收集部,112 关联度计算部,113 变化预测部,114 预测结果显示部,121 因果关系数据,1221 时序文本数据,1222 时序数值数据,123 关联度数据,124变化指标数据,301 节点信息数据,302 因果关系信息数据,S700 时序数据收集处理,S900 关联度计算处理,S902 第一特征量计算处理,S903 第二特征量计算处理,S1400 变化预测处理,S1800 预测结果显示处理,1900 设定画面。

Claims (14)

1.一种预测关于事件的时序数据的变化的信息处理装置,其特征在于,包括:
关联度计算部,其基于与包含作为预测对象的事件的多个事件分别关联的时序数据和与所述事件间的因果关系关联的时序数据,计算作为表示所述事件间的因果关系的强弱的指标的关联度;和
变化预测部,其基于所述关联度,预测与所述事件关联的时序数据的变化。
2.如权利要求1所述的时序预测装置,其特征在于:
所述关联度计算部使用与所述事件间的因果关系关联的时序数据中的与所述事件关联的用语的共现频度,计算所述关联度。
3.如权利要求1所述的时序预测装置,其特征在于:
所述变化预测部基于与所述作为预测对象的事件具有因果关系的事件所关联的时序数据,构建预测与所述作为预测对象的事件关联的时序数据的变化的多个预测模型,
通过与所述关联度相应地对各所述预测模型进行加权而将所述预测模型各自的预测结果汇总。
4.如权利要求1~3中任一项所述的时序预测装置,其特征在于:
生成表示所述时序数据的时间变化的图表。
5.如权利要求4所述的时序预测装置,其特征在于:
生成表示所述关联度的时间变化的图表。
6.如权利要求1~3中任一项所述的时序预测装置,其特征在于:
在与所述事件间的因果关系关联的时序数据中,提取包含与所述事件分别关联的用语双方的时序数据,生成表示提取了的所述时序数据中包含的用语的出现频度的信息。
7.如权利要求1所述的时序预测装置,其特征在于:
还包括时序数据收集部,其经由互联网取得与包含作为预测对象的事件的多个事件分别关联的时序数据和与所述事件间的因果关系关联的时序数据。
8.一种使用预测关于事件的时序数据的变化的信息处理装置进行的时序预测方法,其特征在于,包括:
使信息处理装置基于与包含作为预测对象的事件的多个事件分别关联的时序数据和与所述事件间的因果关系关联的时序数据,计算作为表示所述事件间的因果关系的强弱的指标的关联度的步骤;和
使信息处理装置基于所述关联度,预测与所述事件关联的时序数据的变化的步骤。
9.如权利要求8所述的时序预测方法,其特征在于:
还包括使所述信息处理装置使用与所述事件间的因果关系关联的时序数据中的与所述事件关联的用语的共现频度,计算所述关联度的步骤。
10.如权利要求8所述的时序预测方法,其特征在于,还包括:
使所述信息处理装置基于与所述作为预测对象的事件具有因果关系的事件所关联的时序数据,构建预测与所述作为预测对象的事件关联的时序数据的变化的多个预测模型的步骤;和
使所述信息处理装置通过与所述关联度相应地对各所述预测模型进行加权而将所述预测模型各自的预测结果汇总的步骤。
11.如权利要求8~10中任一项所述的时序预测方法,其特征在于:
还包括使所述信息处理装置生成表示所述时序数据的时间变化的图表的步骤。
12.如权利要求11所述的时序预测方法,其特征在于:
还包括使所述信息处理装置生成表示所述关联度的时间变化的图表的步骤。
13.如权利要求8~10中任一项所述的时序预测方法,其特征在于:
还包括使所述信息处理装置在与所述事件间的因果关系关联的时序数据中,提取包含与所述事件分别关联的用语双方的时序数据,生成表示提取了的所述时序数据中包含的用语的出现频度的信息的步骤。
14.如权利要求8所述的时序预测方法,其特征在于:
还包括使所述信息处理装置经由互联网取得与包含作为预测对象的事件的多个事件分别关联的时序数据和与所述事件间的因果关系关联的时序数据的步骤。
CN201480081491.5A 2014-10-21 2014-10-21 时序预测装置和时序预测方法 Pending CN106796618A (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2014/077916 WO2016063341A1 (ja) 2014-10-21 2014-10-21 時系列予測装置、及び時系列予測方法

Publications (1)

Publication Number Publication Date
CN106796618A true CN106796618A (zh) 2017-05-31

Family

ID=55760416

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201480081491.5A Pending CN106796618A (zh) 2014-10-21 2014-10-21 时序预测装置和时序预测方法

Country Status (4)

Country Link
US (1) US20170300819A1 (zh)
JP (1) JP6247775B2 (zh)
CN (1) CN106796618A (zh)
WO (1) WO2016063341A1 (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109271488A (zh) * 2018-10-08 2019-01-25 广东工业大学 一种结合行为序列和文本信息的社交网络用户间因果关系发现方法及系统
CN112016689A (zh) * 2019-05-28 2020-12-01 株式会社日立制作所 信息处理装置、预测判别系统以及预测判别方法
CN115495498A (zh) * 2022-09-23 2022-12-20 共青科技职业学院 数据关联方法、系统、电子设备及存储介质

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6735219B2 (ja) * 2016-12-05 2020-08-05 株式会社日立製作所 予測システム及び予測方法
JP7304698B2 (ja) * 2019-01-08 2023-07-07 株式会社日立製作所 水需要予測方法およびシステム
JP7246736B2 (ja) * 2020-06-04 2023-03-28 株式会社xenodata lab. 指標推定システムおよびそのプログラム
JP7235329B2 (ja) * 2020-06-04 2023-03-08 株式会社xenodata lab. 経済指標推定システムおよびそのプログラム
JP7545864B2 (ja) 2020-10-22 2024-09-05 株式会社日立製作所 意思決定支援装置
CN112579866B (zh) * 2020-12-09 2023-06-20 成都中科大旗软件股份有限公司 一种基于时间热度指数分析事件发展趋势的方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH11250085A (ja) * 1998-03-02 1999-09-17 Nippon Telegr & Teleph Corp <Ntt> 事象推移予測方法および事象推移予測プログラムを記録した記録媒体
JP2008234618A (ja) * 2007-02-23 2008-10-02 Oki Electric Ind Co Ltd 知識抽出装置、知識抽出方法およびコンピュータプログラム
JP2010122825A (ja) * 2008-11-18 2010-06-03 Osaka Prefecture Univ データ予測装置、データ予測方法、データ予測プログラム

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109271488A (zh) * 2018-10-08 2019-01-25 广东工业大学 一种结合行为序列和文本信息的社交网络用户间因果关系发现方法及系统
CN109271488B (zh) * 2018-10-08 2021-08-27 广东工业大学 一种结合行为序列和文本信息的社交网络用户间因果关系发现方法及系统
CN112016689A (zh) * 2019-05-28 2020-12-01 株式会社日立制作所 信息处理装置、预测判别系统以及预测判别方法
CN112016689B (zh) * 2019-05-28 2023-08-18 株式会社日立制作所 信息处理装置、预测判别系统以及预测判别方法
CN115495498A (zh) * 2022-09-23 2022-12-20 共青科技职业学院 数据关联方法、系统、电子设备及存储介质

Also Published As

Publication number Publication date
JP6247775B2 (ja) 2017-12-13
WO2016063341A1 (ja) 2016-04-28
US20170300819A1 (en) 2017-10-19
JPWO2016063341A1 (ja) 2017-05-18

Similar Documents

Publication Publication Date Title
CN106796618A (zh) 时序预测装置和时序预测方法
US11645590B2 (en) System and method for learning contextually aware predictive key phrases
US9501540B2 (en) Interactive visualization of big data sets and models including textual data
CN107040397B (zh) 一种业务参数获取方法及装置
KR101594500B1 (ko) 채팅내용에 기반하여 필요정보를 제공하는 인공지능 채팅 방법
JP2019509556A (ja) ユーザー・クレジット評価方法、装置及び記憶媒体
JP2017224184A (ja) 機械学習装置
US20180240138A1 (en) Generating and presenting statistical results for electronic survey data
JP5848199B2 (ja) 影響力予測装置、影響力予測方法、及びプログラム
CN110134845A (zh) 项目舆情监控方法、装置、计算机设备及存储介质
CN107609711A (zh) 一种报考信息的提供方法、装置、设备及存储介质
CN107451249B (zh) 事件发展趋势的预测方法及装置
CN110489593A (zh) 视频的话题处理方法、装置、电子设备及存储介质
CN112368720A (zh) 信息处理设备、信息处理方法和程序
US20190026637A1 (en) Method and virtual data agent system for providing data insights with artificial intelligence
JP2016206914A (ja) 意思決定支援システム、及び意志決定支援方法
JP6898542B2 (ja) 情報処理装置、その制御方法、及びプログラム
CN116450814A (zh) 基于事件处理模型的事件处理方法、装置、设备及介质
JP2005267095A (ja) 情報表示方法及び装置及び情報表示プログラム
CN112015912A (zh) 一种基于知识图谱的指标智能可视化方法及装置
TW201126359A (en) Keyword evaluation systems and methods
CN105190619A (zh) 终端装置以及装置的程序
US20210192813A1 (en) Methods and systems for facilitating generation of navigable visualizations of documents
JP4938367B2 (ja) セキュリティ診断システム
CN111444170A (zh) 基于预测业务场景的自动机器学习方法和设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20170531

RJ01 Rejection of invention patent application after publication