CN101425065B - 实体关系挖掘设备和方法 - Google Patents

实体关系挖掘设备和方法 Download PDF

Info

Publication number
CN101425065B
CN101425065B CN2007101679749A CN200710167974A CN101425065B CN 101425065 B CN101425065 B CN 101425065B CN 2007101679749 A CN2007101679749 A CN 2007101679749A CN 200710167974 A CN200710167974 A CN 200710167974A CN 101425065 B CN101425065 B CN 101425065B
Authority
CN
China
Prior art keywords
entity
sequential
entity relationship
relationship
inter
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN2007101679749A
Other languages
English (en)
Other versions
CN101425065A (zh
Inventor
许荔秦
胡长建
福岛俊一
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Data Hall (Beijing) Polytron Technologies Inc
Original Assignee
NEC China Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC China Co Ltd filed Critical NEC China Co Ltd
Priority to CN2007101679749A priority Critical patent/CN101425065B/zh
Priority to JP2008273950A priority patent/JP4795417B2/ja
Priority to US12/261,852 priority patent/US20090112825A1/en
Publication of CN101425065A publication Critical patent/CN101425065A/zh
Application granted granted Critical
Publication of CN101425065B publication Critical patent/CN101425065B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提出了一种关系挖掘设备和方法,针对新闻、博客、产业报告、技术文章等各种形式的有可能谈及各种关系的文本进行时序性关系和事件的数据挖掘。根据本发明,可以自动地从大量来源于互联网或其他媒介的上述文本中抽取实体间关系实例,并针对抽取出的实例,挖掘实体间的时序关系、联系度以及实体在各类别中的重要度,并最终从中抽取出重要的事件。同时,在本发明中,针对公司实体和商业关系,还可以对抽取出的上述时序关系进行计算,得到产业的五种竞争力量分析。此外,还可以通过可视化模块将所得到的结果呈现给最终用户。

Description

实体关系挖掘设备和方法
技术领域
本发明涉及数据挖掘领域,更具体地,涉及一种关系挖掘设备和方法,用于对新闻、博客、产业报告、技术文章等各种形式的有可能谈及各种关系的文本进行时序性关系和事件的数据挖掘。尤其有利的是,本发明可以应用于公司商业关系领域,用于时序行商业关系和商业事件的数据挖掘。
背景技术
随着全球化进程的飞速发展,公司之间形成了比以往更加错综复杂的商业联系,同时一个公司的发展进程要比以往迅速很多,而发展进程中其他有商业联系的公司对它的发展起着至关重要的作用。
另一方面,随着信息化的发展,商业新闻大量地出现在互联网等媒介上。这些商业新闻中包含了大量的公司间商业关系的信息。以往到现在积累下来的所有商业新闻几乎可以涵盖所有产业中的所有商业联系的信息。这些信息形成了一个时序性的商业信息过程。如果商业咨询行业能从中得到这些信息,从这些信息中建立起时序性的商业信息过程,并推导出一些对用户(用户主要是一些公司咨询者)有用的商业性事件,包括公司间的商业联系模式以及那些发展迅速的公司的商业联系发展模式以及产业链中重要公司的商业联系发展模式等,那么这将是一个非常有前景的技术。
如何从大量的新闻中提取这些商业联系、商业联系的时序性发展过程和商业事件呢?用人工去跟踪分析是不现实的,现在的信息规模对人力来讲是完全遥不可及的事情。
采用自动程序装置去提取是唯一可行的办法。这一装置要解决的问题就是跟踪大量的新闻,从中提取商业关系,然后得到公司间时序性的商业联系以及商业事件,并最终呈现。
对于上述问题,业界目前还没有完整的解决方案,只有解决一些子问题的技术,例如:
日本专利JP 2006-195535中提出了从文本新闻中提取商业关系实例的技术。每个商业关系实例是特定公司间特定商业关系的一个新闻中的“快照”。但是这个专利没有提出如何对这些实例进行进一步的时序性数据挖掘和商业性事件挖掘的方法。
参考文献1[E Keogh,S Kasetty.“On the Need for Time SeriesData Mining Benchmarks:A Survey and Empirical Demonstration”.Data Mining and Knowledge Discovery,7(4),2003]总结了很多时序性数据挖掘的技术,但是并没有针对商业性事件做挖掘的技术,同时也没有针对商业关系是一个网状结构的时序性数据做处理的技术。
发明内容
本发明主要针对新闻、博客、产业报告、技术文章等各种形式的有可能谈及各种关系的文本进行时序性关系和事件的数据挖掘。根据本发明,可以自动地从大量来源于互联网或其他媒介的上述文本中抽取各种实体间关系实例,并针对抽取出的实例,挖掘实体间的时序关系,本发明也可以挖掘实体间的联系度以及实体在各类别中的重要度,并最终从中抽取出重要的事件。同时,在本发明中,针对公司实体和商业关系,还可以对抽取出的上述时序关系进行计算,得到产业的五种竞争力量分析。此外,还可以通过可视化模块将所得到的结果呈现给最终用户。
为了实现上述目的,本发明提出了一种实体关系挖掘设备,其特征在于包括:时序实体关系提取装置,用于读取实体关系实例,生成带权值的时序实体关系。
优选地,所述时序实体关系提取装置还根据所生成的带权值的时序实体关系,生成实体间时序综合联系度。
优选地,所述实体关系挖掘设备还包括:时序实体重要度提取装置,用于读取所述时序实体关系提取装置所生成的实体间时序综合联系度,生成时序实体重要度。
优选地,所述实体关系挖掘设备还包括:事件检测装置,用于读取所述时序实体关系提取装置所生成的带权值的时序实体关系和实体间时序综合联系度,生成事件。
优选地,所述实体关系挖掘设备还包括:事件检测装置,用于读取所述时序实体关系提取装置和所述时序实体重要度提取装置所生成的带权值的时序实体关系、实体间时序综合联系度、时序实体重要度,生成事件。
优选地,所述实体关系挖掘设备还包括:关系实例提取装置,用于读取文本信息数据,生成实体关系实例。
优选地,所述时序实体关系提取装置包括:时序插值单元,用于对一段指定时间内没有实体关系实例出现时的实体关系利用插值计算该实体关系的权值,最终在指定时间段内任何实体之间的任何持续性关系在任何时间都有权值。
优选地,所述实体是公司,以及所述关系是商业关系。更优选地,所述实体关系挖掘设备还包括:时序五种行业竞争力量分析装置,用于根据带权值的时序实体关系和时序实体重要度,生成时序行业竞争力量数据。
优选地,所述实体是产品、人或国家,以及所述关系是产品间的关系、人际关系或国家间的关系。
优选地,所述实体关系挖掘设备还包括:可视化装置,用于根据带权值的时序实体关系、实体间时序综合联系度、时序实体重要度、时序行业竞争力量数据中的至少一个,生成可视化界面。
为了实现上述目的,本发明还提出了一种实体关系挖掘方法,其特征在于包括:时序实体关系提取步骤,读取实体关系实例,生成带权值的时序实体关系。
优选地,在所述时序实体关系提取步骤中,还根据所生成的带权值的时序实体关系,生成实体间时序综合联系度。
优选地,所述实体关系挖掘方法还包括:时序实体重要度提取步骤,读取在所述时序实体关系提取步骤中生成的实体间时序综合联系度,生成时序实体重要度。
优选地,所述实体关系挖掘方法还包括:事件检测步骤,读取在所述时序实体关系提取步骤中生成的带权值的时序实体关系和实体间时序综合联系度,生成事件。
优选地,所述实体关系挖掘方法还包括:事件检测步骤,读取在述时序实体关系提取步骤和所述时序实体重要度提取步骤中生成的带权值的时序实体关系、实体间时序综合联系度、时序实体重要度,生成事件。
优选地,所述实体关系挖掘方法还包括:关系实例提取步骤,读取文本信息数据,生成实体关系实例。
优选地,所述时序实体关系提取步骤包括:时序插值子步骤,对一段指定时间内没有实体关系实例出现时的实体关系利用插值计算该实体关系的权值,最终在指定时间段内任何实体之间的任何持续性关系在任何时间都有权值。
优选地,所述实体是公司,以及所述关系是商业关系。更优选地,所述实体关系挖掘方法还包括:时序五种行业竞争力量分析步骤,根据带权值的时序实体关系和时序实体重要度,生成时序行业竞争力量数据。
优选地,所述实体是产品、人或国家,以及所述关系是产品间的关系、人际关系或国家间的关系。
优选地,所述实体关系挖掘方法还包括:可视化步骤,根据带权值的时序实体关系、实体间时序综合联系度、时序实体重要度、时序行业竞争力量数据中的至少一个,生成可视化界面。
根据本发明,有效地解决了以下技术问题:
从海量资讯中抽取实体关系并进行时序性的自动数据挖掘;
跟踪海量时序性的实体关系并最终挖掘有效事件;
根据海量时序性的实体关系得到五种产业竞争力分析;以及
对上述挖掘出的实体信息的可视化呈现。
附图说明
通过下面结合附图说明本发明的优选实施例,将使本发明的上述及其它目的、特征和优点更加清楚,其中:
图1示出了公司商业关系挖掘系统的方框图。
图2a根据本发明的第一实施例、示出了公司商业关系挖掘模块2的方框图和数据流程图;图2b根据本发明的第二实施例、示出了公司商业关系挖掘模块2的方框图和数据流程图;以及图2c根据本发明的第三实施例、示出了公司商业关系挖掘模块2的方框图和数据流程图。
图3示出了时序公司关系提取子模块22的方框图和数据流程图。
图4a示出了时序公司商业重要度提取子模块23的一个方框图和数据流程图;以及图4b示出了时序公司商业重要度提取子模块23的另一方框图和数据流程图。
图5a示出了商业性事件检测子模块24的一个方框图和数据流程图;以及图5b示出了商业性事件检测子模块24的另一方框图和数据流程图。
图6示出了时序五种行业竞争力量分析子模块25的方框图和数据流程图。
图7示出了可视化模块4的方框图和数据流程图。
图8a和8b示出了基本图形的生成示例。
具体实施方式
下面参照附图对本发明的优选实施例进行详细说明,在描述过程中省略了对于本发明来说是不必要的细节和功能,以防止对本发明的理解造成混淆。此外,在以下的描述中,以公司作为实体的示例、以商业关系作为关系的示例,对本发明的关系挖掘设备和方法进行详细的描述。但是,应当注意的是,本发明中所提及的实体并不局限于公司,也可以表示自然人、国家或者产品等实体,相应地,本发明中所提及的关系并不局限于商业关系,也可以应用于人际关系,国家关系等各种其他社会关系上。
基于公司作为实体的系统描述
图1示出了公司商业关系挖掘系统的方框图。符号1表示文本信息数据,放置在数据库中,可以是新闻、博客、产业报告、技术文章等各种形式的有可能谈及商业关系的文本或者可以转化为文本的其他形式的数据来源。符号2表示本发明的实体关系挖掘设备,该设备读取文本信息数据1并进行公司商业关系的挖掘,最终生成含有多种表现形式的关系数据,存储在公司商业关系数据库3中。可视化模块4读取公司商业关系数据库3中的数据,以生成可视化界面,其中该可视化模块4可以设置在实体关系挖掘设备2内部或外部实现生成可视化界面的功能。
公司商业关系挖掘设备
图2a根据本发明的第一实施例、示出了公司商业关系挖掘模块2的方框图和数据流程图。在本实施例中,公司商业关系挖掘模块2可以分为四个子模块:商业关系实例提取子模块21读取文本信息数据1,生成公司商业关系实例31,该模块为可选的模块,在本发明中也可以采用除实施例中公开的其他方法实现;时序公司关系提取子模块22读取商业关系实例提取子模块21所生成的公司商业关系实例31,生成带权值的时序公司商业关系32和公司间时序综合商业联系度33;时序公司商业重要度提取子模块23读取时序公司关系提取子模块22所生成的公司间时序综合商业联系度33,生成时序公司商业重要度34;商业性事件检测子模块24读取时序公司关系提取子模块22和时序公司商业重要度提取子模块23所生成的带权值的时序公司商业关系32、公司间时序综合商业联系度33、时序公司商业重要度34,生成商业性事件35。
文本信息1包括内容、发布时间以及可选的来源(例如从什么网站得到),有如下的数据结构:
时间
内容
来源(可选)
表1.新闻数据结构
公司关系实例31是指文本信息1中提到的两个公司之间的某种商业关系,有如下的数据结构:
    公司A
    公司B
    关系类型
    日期
    来源(可选)
表2.公司关系实例数据结构例子
其中的关系类型可以有竞争、合作、控股、供货、合并、并购等。在以下的数学表达中,我们用RI(A,B,X,t′)来表示一个公司关系实例,表示公司A和公司B在日期t′有X商业关系实例。
带权值的时序公司商业关系32是指在一段给定的时间段里,两个公司间存在时序的某种商业关系及其权值,权值是指在此时间单位内有这种关系的可信度。具体来讲,就是在这个时间段内的每个时间单位内(这里我们取一个月)这两个公司的都保持有这种商业关系和对应权值,权值越大关系越可信,权值为0时,说明没有这种关系。其数据结构的一个例子如表3:
    公司A
    公司B
    关系类型
    {(月,权值),(月,权值),…}
表3.带权值的时序公司商业关系数据结构例子
我们用sA,B,X(t)来表示表示公司A和公司B在时间单位t内对X商业关系的权值。
表4给出了两个例子,给定时间段为2000年3月到2007年9月。
    公司A     公司A
    公司B     公司B
    竞争     合作
    {(2000/3,0.8),(2000/4,0.6)…(2007/9,0.01)}     {(2000/3,0),…,(2000/6,0.9)…(2007/9,0.01)}
表4.带权值的时序公司商业关系例子
公司间时序综合商业联系度33是指在一段给定的时间段里,两个公司间存在时序的综合商业联系度以及由此推出的在这一时间段内的总商业联系度,总商业联系度是对时序联系度做的平均。其数据结构的一个例子如下:
    公司A
公司B
总商业联系度
{(月,商业联系度),(月,商业联系度),…}
表5.公司间时序综合商业联系度数据结构例子
我们用sA,B(t)来表示公司A和公司B在时间t内的商业联系度,用sA,B来表示公司A和公司B的总商业联系度。表6给出了一个例子。
    公司A
    公司B
    0.8
    {(2000/3,0.7),(2000/6,0.9),…(2007/9,0.01)}
表6.公司间时序综合商业联系度例子
时序公司商业重要度34是指在一段给定的时间段里、一个公司的时序的商业重要度。商业重要度是指一个公司在本行业或跨行业中的重要度。其数据结构如下:
  公司A
  {(月,商业重要度),(月,商业重要度),…}
表7.时序公司商业重要度数据结构例子
我们用sA(t)来表示公司A在时间t内的商业重要度。
商业性事件35是指从上述数据中能推演得到的有效的且对用户或者其他公司有启发意义的事件。可以分为简单事件和复杂事件。简单事件是指公司间发生的事件性的商业关系,可以从带权值的时序公司商业关系32中直接得到,如公司A在2000年1月合并了公司B。复杂事件是指从行业分析的角度得到的高层次的且对用户或者其他公司有启发意义的事件,这些事件不能直接得到而只能通过对带权值的时序公司商业关系32、公司间时序综合商业联系度33、时序公司商业重要度34的分析得到。例如,公司A从1998年1月到2001年1月是本行业的核心公司;公司B从1999年1月到2000年1月发展迅速;公司C从2004年1月到2005年1月恶化;A和B从1999年3月到2000年1月发展迅速;C和D从2004年3月到2005年1月关系恶化。
商业关系实例提取子模块21
商业关系实例提取子模块21可以采用已有技术实现。例如,日本专利JP 2006-195535中提到的方法。
时序公司关系提取子模块22
图3示出了时序公司关系提取子模块22的方框图和数据流程图。
公司商业关系实例强度计算单元221根据每一个公司商业关系实例RI(A,B,X,t′),计算其对应时间单位t内的公司商业关系A,B,X的强度SI(A,B,X,t)。
在时间单位t之内,公司商业关系实例A,B,X可能出现多次,例如不同新闻网站会提到,在t内可能有多次时间都提到。我们用Ct来表示时间单位t内公司商业关系实例出现的次数,那么SI(A,B,X,t)可以用下式计算:
SI ( A , B , X , t ) = si A , B , X ( t ) = Σ i = 1 C t ms ( n i )
其中ni是对应的第i个实例,ms(ni)是这个实例中新闻的匹配得分。实际上强度就是所有时间单位t内的实例得分总和。
时序插值单元222对一段指定时间内没有公司商业关系实例出现时的公司关系利用插值计算其权值,最终在指定时间段内任何公司之间的任何持续性关系在任何时间都有权值。持续性的公司关系是指关系会持续一段时间,而不是一次性的事件性的关系,例如竞争、合作、控股、供货等都是持续性的商业关系。例如:在2000年6月没有出现公司A和公司B之间的竞争关系,但是在之前2000年1月出现了这种关系,那么就利用之前的这种关系的权值来插值求得2000年6月的权值。例如,求插值的方法如下:
假设某两公司的某种关系RI第一次发生在t0,最后一次发生在tm
为了计算tn时的公司关系强度,假设在tn之前的一次实例发生在tk,在其之后的一次实例发生在tl,那么:
s A , B , X ( t n ) = si A , B , X ( t n ) RI ( A , B , X , t n ) exists 0 t n < t 0 si A , B , X ( t m ) &CenterDot; e - &lambda; ( t n - t m ) t n > t m t l - t n t l - t k &CenterDot; si A , B , X ( t k ) &CenterDot; e - &lambda; ( t n - t k ) t 0 < t k < t n < t l < t m
在上述示例中,所述关系的权值随着时间的变化按照指数衰减或增加。但是,正如本领域普通技术人员所公知的那样,这种变化也可以是随着时间的变化按照线性衰减或增加的。
事件性商业关系以及冲突处理单元223对事件性的商业关系进行处理。事件性的商业关系是指这种商业关系是一次发生的事件而不是持续性的商业关系,例如合并、并购都是事件性的商业关系,而竞争、合作、控股、供货是持续性的商业关系。处理过程包括本身这种关系权值的处理,发生冲突时的处理,对其他有影响的关系的处理。例如,处理方法如下:
首先,解决冲突问题。冲突问题的解决办法如下:
时间冲突:理论上事件性关系应该只发生一次,但是互联网上信息不完全可靠,因此可能会发生冲突。如果发生冲突,即同时存在RI(A,B,X,t1),RI(A,B,X,t2)(t1<t2),那么调整新的公司关系强度为:
sA,B,X(t1)=siA,B,X(t1)+siA,B,X(t2)
sA,B,X(t2)=0
方向冲突:专门针对于有方向性的事件性关系的处理,如并购。这种关系对两个公司来讲只可能有一个方向是正确的。在同时存在RI(A,B,X,t1),RI(B,A,X,t2)(t1<t2)时,如果
sA,B,X(t1)≥sB,A,X(t2)
sA,B,X(t1)=sA,B,X(t1)
sB,A,X(t2)=0
否则
sA,B,X(t1)=0
sB,A,X(t2)=sB,A,X(t2)
然后,解决对其他商业关系的影响。如果X是合并或并购关系而且sA,B,X(t1)>TH,其中TH是一个预定阈值,那么A和B在t1之后合并为一个公司,A和B之间不再保存持续性关系,合并后公司A(B)和其他公司的关系权值按如下调整:
sA′,C,X(t)=sA,C,X(t)+sB,C,X(t)
在完成上述处理之后,事件性商业关系以及冲突处理单元223输出带权值的时序公司商业关系32。
公司间时序综合商业联系度计算单元224计算两个公司之间时序的综合性的商业联系度以及平均的总商业联系度。具体地,对各种关系权值做加权平均,得到时序的综合商业联系度,即
sA,B(t)=∑w(X)·sA,B,X(t)
其中w(X)是各个关系的权值,采用经验值或采用统计的办法得到。统计的办法可以是采用统计某种关系在每个工业界之内出现的概率作为权值。之后对所有时间取平均得到总商业联系度。在完成上述处理之后,公司间时序综合商业联系度计算单元224输出公司间时序综合商业联系度33。
时序公司商业重要度提取子模块23
图4a示出了时序公司商业重要度提取子模块23的一个方框图和数据流程图。
图创建单元231对于每个时间单位内的公司都创建一个图。图的顶点是公司,联系顶点的边是两公司的综合商业联系度33。这样就生成了一个带权值的无向图。
图节点重要度计算单元232用图节点重要度计算方法来计算每个节点(也就是公司)的重要度,例如,Page Rank方法或HITS算法。图节点重要度计算单元232输出时序公司商业重要度34。
图4b示出了时序公司商业重要度提取子模块23的另一方框图和数据流程图。
图创建单元231对于每个时间单位内的公司都创建一个图。图的顶点是公司,联系顶点的边是两公司的综合商业联系度33。这样就生成了一个带权值的无向图。
图节点连接度计算单元233用传统的图节点连接度计算方法来计算每个节点(也就是公司)的重要度,例如,每个节点连接数之和或每个节点连接权值之和。图节点连接度计算单元233输出时序公司商业重要度34。
商业性事件检测子模块24
图5a示出了商业性事件检测子模块24的一个方框图和数据流程图。
基于规则的事件提取单元242利用预定义规则241去检测所有的输入数据并输出与预定义规则241匹配的商业性事件。预定义规则241可由人工预先定义。一些规则的例子如下:
·简单事件的提取直接从带权值的时序公司商业关系32中提取,其中对于需要进一步判断的并购事件,存在两种情况:A公司有可能并购B公司,也有可能并购B公司的一个部门;对于这两种情况的判断,可以按下面的标准区分:
如果A公司并购B公司发生时,A公司的重要度①远大于B公司,或者②大于B公司而且B公司的重要度在之后持续下降,则A公司并购B公司;
Figure S2007101679749D00122
如果并不满足上述条件,则A公司并购B公司的一个部门;
·如果公司A的商业重要度SA(t)>Th1,t0≤t≤t1,那么A从t0到t1是一个关键公司;
·对于公司A,如果 S A ( t 1 ) - S A ( t 0 ) t 1 - t 0 > Th 2 , 那么A从t0到t1发展迅速;
·对于公司A,如果 S A ( t 0 ) - S A ( t 0 ) t 1 - t 0 > Th 3 , 那么A从t0到t1出现问题;
·对于公司A和B,如果 S A , B ( t 1 ) - S A , B ( t 0 ) t 1 - t 0 > Th 4 , 那么A和B从t0到t1关系发展迅速;
·对于公司A和B,如果 S A , B ( t 0 ) - S A , B ( t 1 ) t 1 - t 0 > Th 5 , 那么A和B从t0到t1关系恶化。
图5b示出了商业性事件检测子模块24的另一方框图和数据流程图。
与图5a相比较,图5b中增加了辅助信息243(一些预先收集到的公开的公司信息,如公司销售额,公司利润等)和公司外部得分计算单元244。公司外部得分计算单元244对辅助信息243进行任何可行的简单计算,例如简单相加、加权相加等任何可行的得分计算,计算出公司的外部得分。
这里,基于规则的事件提取单元242所采用的规则除了结合图5a所描述的预定义规则241以外,还可以添加包含公司外部得分计算单元244利用辅助信息243而得到的外部公司得分信息,例如:
·如果公司A的商业重要度SA(t)>Th1,t0≤t≤t1,且A的外部得分大于一个阈值,那么A从t0到t1是一个关键公司;
·对于公司A,如果 S A ( t 1 ) - S A ( t 0 ) t 1 - t 0 > Th 2 , 且A在t1时外部得分大于一个阈值,那么A从t0到t1发展迅速;
·对于公司A,如果 S A ( t 0 ) - S A ( t 1 ) t 1 - t 0 > Th 3 , 且A在t1时外部得分小于一个阈值,那么A从t0到t1出现问题。
*具体实例(时序公司关系提取子模块22、时序公司商业重要度提取子模块23、商业性事件检测子模块24的具体输出结果)
以下,针对时序公司关系提取子模块22、时序公司商业重要度提取子模块23、商业性事件检测子模块24的具体输出结果给出一个具体例子。
以下实例针对A,B,C,D 4个公司,时间段取2007.1.1到2007.7.31(2007年1月1日到2007年7月31日),公司关系时间单位为月。
时序公司关系提取子模块22从新闻中得到如下公司关系实例31:
  实例1   实例2   实例3   实例4   实例5   实例6   实例6
    A   A   A   A   A   A   A
    B   B   B   B   C   C   C
    竞争   竞争   竞争   合作   并购   竞争   竞争
    2007.1.8   2007.1.9   2007.3.2   2007.4.1   2007.5.8   2007.2.7   2007.5.9
  实例6   实例7   实例8   实例9   实例10   实例11   实例4   实例5
    A     B     B     A     A   A   C   A
    D     C     C     D     D   D   D   D
    控股     合作     合作     合作     合作   合作   竞争   竞争
    2007.6.9     2007.2.4     2007.2.5     2007.5.8     2007.5.9   2007.7.2   2007.6.1   2007.7.8
公司商业关系实例强度计算单元221得出的实例强度,其中匹配得分都取1.0:
    2.0     1.0     1.0     1.0     1.0     1.0
    A     A     A     A     A     A
    B     B     B     C     C     C
    竞争     竞争     合作     并购     竞争     竞争
    2007.1     2007.3     2007.4     2007.5     2007.2     2007.5
    1.0     2.0     2.0     1.0     1.0     1.0
    A     B     A     A     C     A
    D     C     D     D     D     D
    控股     合作     合作     合作     竞争     竞争
    2007.6     2007.2     2007.5     2007.7     2007.6     2007.7
时序插值单元222得出的插值后的公司关系,λ=0.223144
    A     A
    B     B
    竞争     合作
    {(2007/1,2.0)(2007/2,1.2)(2007/3,1.0)(2007/4,0.8)(2007/5,0.64)(2007/6,0.512)(2007/7,0.4096)}     {(2007/4,1.0)(2007/5,0.8)(2007/6,0.64)(2007/7,0.512)}
    A     A
    C     C
    并购     竞争
    {(2007/5,1.0)}     {(2007/2,1.0)(2007/3,0.8)(2007/4,0.8)(2007/5,1.0)(2007/6,0.8)(2007/7,0.64)}
    A     A
    D     D
    控股     合作
    {(2007/6,1.0)(2007/7,0.8)}     {(2007/5,1.0)(2007/6,0.8)(2007/7,1.0)}
    B     C
    C     D
    合作     竞争
    {(2007/2,1.0)(2007/3,0.8)(2007/4,0.64)(2007/5,0.512)(2007/6,0.4906)(2007/7,0.32768)}     {(2007/6,1.0)(2007/7,0.8)}
事件性商业关系以及冲突处理单元223输出的带权值的时序公司商业关系32如下:
    A     A
    B     B
    竞争     合作
    {(2007/1,2.0)(2007/2,1.2)(2007/3,1.0)(2007/4,0.8)(2007/5,0.64)(2007/6,0.512)(2007/7,0.4096)}     {(2007/4,1.0)(2007/5,1.312)(2007/6,1.1 306)(2007/7,0.83968)}
   A     A
   C     C
   并购     竞争
   {(2007/5,1.0)}     {(2007/2,1.0)(2007/3,0.8)(2007/4,0.8)}
    A     A
    D     D
    控股     合作
    {(2007/6,1.0)(2007/7,0.8)}     {(2007/5,1.0)(2007/6,0.8)(2007/7,1.0)}
    B     A
    C     D
    合作     竞争
    {(2007/2,1.0)(2007/3,0.8)(2007/4,0.64)}     {(2007/6,1.0)(2007/7,0.8)}
公司间时序综合商业联系度计算单元224得到公司间时序综合商业联系度33如下,各个连续性关系权值取1,事件性关系(并购、合并)关系权值取0:
    A     A
    B     C
    1.5497     0.65
    {(2007/1,2.0)(2007/2,1.2)(2007/3,1.0)(2007/4,1.8)(2007/5,1.956)(2007/6,1.6426)(2007/7,1.24928)}     {(2007/1,0)(2007/2,1.0)(2007/3,0.8)(2007/4,0.8)}
    A     B
    D     C
    0.9143     0.61
    {(2007/1,0)(2007/2,0)(2007/3,0)(2007/4,0)(2007/5,1.0)(2007/6,2.8)(2007/7,2.6)}     {(2007/1,0)(2007/2,1.0)(2007/3,0.8)(2007/4,0.64)}
时序公司商业重要度提取子模块23(图4a)求得的时序公司商业重要度34如下:
    A     B
  {(2007/1,1.4)(2007/2,1.9)(2007/3,1.5)(2007/4,2.1)(2007/5,2.1)(2007/6,3.1)(2007/7,2.7)}   {(2007/1,1.4)(2007/2,1.9)(2007/3,1.5)(2007/4,2.0)(2007/5,1.9)(2007/6,1.6)(2007/7,1.2)}
    C D
    {(2007/1,0)(2007/2,1.8)(2007/3,1.4)(2007/4,1.3)(2007/5,0)(2007/6,0)(2007/7,0)} {(2007/1,0)(2007/2,0)(2007/3,0)(2007/4,1.8)(2007/5,1.0)(2007/6,2.7)(2007/7,2.5)}
商业性事件检测子模块24得到的事件如下:
A并购C,2007.5
A与D在2007.5后关系发展迅速
D在2007.6后发展迅速
图2b根据本发明的第二实施例、示出了公司商业关系挖掘模块2的方框图和数据流程图。与图2a相比,削减了时序公司商业重要度提取子模块23,因此,不再生成时序公司商业重要度34。相应地,商业性事件检测子模块24中的规则将不再匹配任何与时序公司商业重要度34相关的部分。
图2c根据本发明的第三实施例、示出了公司商业关系挖掘模块2的方框图和数据流程图。与图2a相比,在图2c中增加了时序五种行业竞争力量分析子模块25,时序五种行业竞争力量分析子模块25生成时序行业竞争力量数据36。
五种行业竞争力量(Five Forces)是由Michael E.Porter提出的(Competitive Strategy,Free Press,1980,《竞争战略》,华夏出版社,1997),包括:潜在入侵者、供应商议价能力、现有行业竞争者、消费者议价能力、替代品生产者这五种力量。这五种力量的分析对提高企业竞争力有很大的好处。这五种行业竞争力量是随着时间变化的,因此,在公司商业关系数据库3中所存储的是时序行业竞争力量数据36。时序五种行业竞争力量分析子模块25根据带权值的时序公司商业关系32和时序公司商业重要度34来计算得到时序行业竞争力量数据36。
图6示出了时序五种行业竞争力量分析子模块25的方框图和数据流程图。
时序五种行业竞争力量分析子模块25包括6个单元,其中行业划分单元251根据需要的行业,对输入的带权值的时序公司商业关系32和时序公司商业重要度34进行划分,输出单一行业(即所需行业)的时序公司商业关系32和商业重要度34。行业划分单元251可以用多种方法来实现上述行业划分,第一种方法是:可以用已有的公司列表对带权值的时序公司商业关系32和时序公司商业重要度34进行过滤,第二种方法是:可以采用用户给出的公司列表进行过滤,第三种方法是:可以采用对行业进行基于图的聚类得到各个行业的输入。符号252~256表示5个独立的单元,分别用于计算五种行业竞争力量。
潜在入侵者分析单元252进行如下操作:
计算时间t0时的潜在入侵者:挑选在t0及t0之前商业重要度为0(还没有这个公司或还没有进入这个行业)而t0到t0+Δt之间商业重要度大于0的公司。潜在入侵者得分为这些公司的个数。也可以计算这些公司的商业重要度得分。
供应商议价能力分析单元253进行如下操作:
计算时间t0时的供应商议价能力:取时间t0时的所有供货关系,对供货方在本行业内的供货关系权值累加得到供应商议价能力。
消费者议价能力分析单元254进行如下操作:
计算时间t0时的消费者议价能力:取时间t0时的所有供货关系,对购买方在本行业内的供货关系权值累加得到消费者议价能力。
现有行业竞争者分析单元255进行如下操作:
计算时间t0时的现有行业竞争者:取时间t0时的所有本行业竞争关系,计算权值累加得分作为结果。
替代品生产者分析单元256进行如下操作:
第一方案:计算时间t0时的替代品生产者:由于这个系统中没有产品信息,因此无法得到替代品生产者分析结果,这里我们用未来竞争趋势来替换替代品生产者,未来竞争趋势不涉及产品信息,表明企业未来可能遇到的全面竞争。挑选在t0时没有,但是t0到t0+Δt之间有的所有竞争关系,计算权值累加得分作为结果。
第二方案:用人工挑选出行业中几类产品对应的子行业,选择在t0时的每一个产品子行业和其他产品子行业之间的竞争关系,计算权值累加得分作为结果。
可视化模块
可视化模块4用于将本发明抽取的公司商业关系描绘成一个用于用户交互的商业关系呈现视图,其中用户可以对该商业关系进行检索定位、商业关系区间变化查看、检测事件的同步显示以及构建各种视图之间的内在联系。可视化模块为可选模块,而且可视化的具体方案不局限于本发明中的方法,也可以采用现有的方案实现。
图7示出了可视化模块4的方框图和数据流程图。
数据缓冲区+数据加载+数据预处理单元41用于数据库中数据的快速加载,并以时序信息加以分块存放到特定的缓冲区中,以便系统快速提取恰当的数据信息。数据缓冲区+数据加载+数据预处理单元41的输入信息是公司商业关系数据库3中的所有信息,输出信息根据实际用户交互的事件解析确定,基本上是下面三种数据的组合:
1)时序公司商业重要度34;
2)带权值的时序公司商业关系32;
3)商业性事件35。
系统初始化设置单元42产生一个基本的视图任务,而用户交互事件解析单元48用于产生一系列视图任务。视图任务执行单元43主要执行以下两个操作:其一是原始数据的描述定位,这部分能够被数据缓冲区+数据加载+数据预处理单元41解析并提取相关数据信息,另外一个是该任务对应的一系列算法调用流程,比如提取后数据进行基本图生成,采用何种图附加信息计算算法,采用何种视图渲染方法等。视图任务执行单元43是一个视图任务引擎,用于执行和引导相关视图任务的流向。
基本图形生成单元44用于生成基本的节点信息和连线信息。图8a和8b示出了基本图形的生成示例,节点和连线的构成存在至少两种:第一,节点以公司信息为基础,而连线信息则以公司商业关系实体为基础,同时公司的重要度对应着节点的大小,公司商业关系的权值对应着连线的粗细或者连线的长短参数,线的颜色对应着商业关系的类型(如图8a所示);第二,节点以商业关系的起始为节点,连线又可以分为公司基准线和事件起始关联线,对于事件起始关联线,颜色对应着对应的商业关系(如图8b所示)。
图形附加信息计算单元45用于规划视图布局,主要完成:1)节点位置信息计算:对各个节点和连线进行布局,尽量避免交叉和重叠,最终得到各个节点/连线的三维坐标值,2)定位信息:计算特定节点或者连线在所有关联视图上的定位信息,结果会以<object,view,position>的形式存放到表结构中;3)关联信息:对节点和对应的连线,计算与其关联的后台其他数据信息,比如节点特定时间发生的事件信息,连线对应着特定时间内体现的新闻信息等;4)层信息:以公司商业关系作为层分割的基准;5)分区信息:计算哪些节点和连线在特定的视图中是一组的,这些可能映射到图的聚类、特定事件关联实体列表或者特定时间区间关联实体列表等;6)预加载信息:计算特定视图中与特定层、特定分区实体组对应的、需要加载的数据描述,这些信息将会自动启动数据模块进行加载以改善用户体验。
视图渲染引擎46基于视图高速缓存和图形的基本信息和附加信息(分别由基本图形生成单元44和图形附加信息计算单元45产生)来渲染生成相应的视图,并根据视图任务解析的结果,映射特定的用户事件信息到特定的视图区域。
界面呈现单元47用于将视图渲染引擎46的生成结果输出到屏幕,并合理匹配映射鼠标事件和键盘事件到特定的视图区域。
此外,基于上述对公司商业关系的实施例的描述可知,当所述的实体为自然人时,人与人之间存在人际关系,其中所述的关系类型可以有朋友、同事、夫妻、直系亲属、旁系亲属、对手、上下级、监管等连续性关系,以及结婚、生子、离婚等事件性关系,而对应的人之间会有一定的重要度,人的重要度可以反映人在社会上的作用,在实体为人时,本领域技术人员完全可以采用上述的方法和装置进行关系挖掘。
同样,本发明的方法也适用于国际关系,对应于国际关系中的关系类型可以有盟国关系、友好关系、敌对关系等连续性关系,以及可能会存在宣战、断交、吞并等事件性关系。对应的国家的重要度反映了该国家在世界上的作用。本发明的方法也可用于表示实体为产品的情况,此时产品之间的关系可为归属、竞争等连续性关系,以及具有替代、升级等事件性关系。而对应的产品的重要度可反映产品在市场的上所占的份额。综上所述,本领域普通技术人员在阅读本发明的具体实施例(公司、商业关系)之后,完全可以按照一定的对应关系,将本发明应用于除公司和商业关系以外的其它实体和关系上。
至此已经结合优选实施例对本发明进行了描述。应该理解,本领域技术人员在不脱离本发明的精神和范围的情况下,可以进行各种其它的改变、替换和添加。因此,本发明的范围不局限于上述特定实施例,而应由所附权利要求所限定。

Claims (78)

1.一种实体关系挖掘设备,其特征在于包括:
时序实体关系提取装置,用于读取实体关系实例,生成带权值的时序实体关系,所述时序实体关系提取装置还根据所生成的带权值的时序实体关系,生成实体间时序综合联系度;
事件检测装置,用于读取所述时序实体关系提取装置所生成的带权值的时序实体关系和实体间时序综合联系度,生成事件,
所述事件检测装置包括:
基于规则的事件提取单元,利用与带权值的时序实体关系、实体间时序综合联系度有关的预定义规则,检测所有的输入数据,输出与所述预定义规则匹配的事件。
2.根据权利要求1所述的实体关系挖掘设备,其特征在于
所述事件检测装置还包括:实体外部得分计算单元,对预先收集到的与实体有关的辅助信息进行得分计算,得到实体的外部得分,以及
所述基于规则的事件提取单元还利用与带权值的时序实体关系、实体间时序综合联系度、实体外部得分有关的预定义规则,检测所有的输入数据,输出与所述预定义规则匹配的事件。
3.根据权利要求1所述的实体关系挖掘设备,其特征在于还包括:
关系实例提取装置,用于读取文本信息数据,生成实体关系实例。
4.根据权利要求1所述的实体关系挖掘设备,其特征在于所述时序实体关系提取装置包括:
时序插值单元,用于对一段指定时间内没有实体关系实例出现时的实体关系利用插值计算该实体关系的权值,最终在指定时间段内任何实体之间的任何持续性关系在任何时间都有权值。
5.根据权利要求4所述的实体关系挖掘设备,其特征在于所述时序实体关系提取装置还包括以下单元中的至少一个:
实体关系实例强度计算单元,用于根据每一个实体关系实例,计算其对应时间单位内的实体关系的强度,即该实体关系的权值;以及
事件性关系以及冲突处理单元,用于对事件性的关系进行处理,得到带权值的时序实体关系。
6.根据权利要求4所述的实体关系挖掘设备,其特征在于对于出现实体关系实例的两个连续时间点之间的时间段,所述时序插值单元按照权值随时间线性衰减或增加/指数衰减或增加的方式,进行该实体关系的权值的插值计算。
7.根据权利要求1所述的实体关系挖掘设备,其特征在于所述实体是公司、产品、人或国家,以及所述关系是商业关系、产品间的关系、人际关系或国家间的关系。
8.根据权利要求1~7之一所述的实体关系挖掘设备,其特征在于还包括:
可视化装置,用于根据带权值的时序实体关系、实体间时序综合联系度中的至少一个,生成可视化界面,
所述可视化装置以节点和连线生成可视化界面,其中:
每个节点表示一个实体,节点间的连线表示实体间关系的类型和权值:节点的大小对应于实体的重要度,连线的粗细或长短参数对应于实体间关系的权值,连线的颜色对应于实体间关系的类型。
9.根据权利要求1~7之一所述的实体关系挖掘设备,其特征在于还包括:
可视化装置,用于根据带权值的时序实体关系、实体间时序综合联系度中的至少一个,生成可视化界面,
所述可视化装置以节点和连线生成可视化界面,其中:
以关系的起始为节点,连线分为实体基准线和事件起始关联线,事件起始关联线的颜色对应于实体间关系的类型。
10.一种实体关系挖掘设备,其特征在于包括:
时序实体关系提取装置,用于读取实体关系实例,生成带权值的时序实体关系,所述时序实体关系提取装置还根据所生成的带权值的时序实体关系,生成实体间时序综合联系度;
时序实体重要度提取装置,用于读取所述时序实体关系提取装置所生成的实体间时序综合联系度,生成时序实体重要度;
事件检测装置,用于读取所述时序实体关系提取装置和所述时序实体重要度提取装置所生成的带权值的时序实体关系、实体间时序综合联系度、时序实体重要度,生成事件,
所述时序实体重要度提取装置包括:
图创建单元,用于针对每个时间单位内的实体,创建无向图,在所述无向图中,顶点是各个实体,联系顶点的边以两实体间的综合联系度为权值;
图节点重要度计算单元,采用图节点重要度计算方法,来计算每个节点的重要度,即实体重要度,
所述图节点重要度计算方法是Page Rank方法或HITS算法,
所述事件检测装置包括:
基于规则的事件提取单元,利用与带权值的时序实体关系、实体间时序综合联系度、时序实体重要度有关的预定义规则,检测所有的输入数据,输出与所述预定义规则匹配的事件。
11.根据权利要求10所述的实体关系挖掘设备,其特征在于
所述事件检测装置还包括:实体外部得分计算单元,对预先收集到的与实体有关的辅助信息进行得分计算,得到实体的外部得分;以及
所述基于规则的事件提取单元还利用与带权值的时序实体关系、实体间时序综合联系度、时序实体重要度、实体外部得分有关的预定义规则,检测所有的输入数据,输出与所述预定义规则匹配的事件。
12.根据权利要求11所述的实体关系挖掘设备,其特征在于对于并购事件,所述基于规则的事件提取单元基于发生并购时两实体的实体重要度和/或并购发生后两实体的实体重要度的变化,确定是实体间的完全并购事件还是实体间的部分并购事件。
13.根据权利要求10所述的实体关系挖掘设备,其特征在于还包括:
关系实例提取装置,用于读取文本信息数据,生成实体关系实例。
14.根据权利要求10所述的实体关系挖掘设备,其特征在于所述时序实体关系提取装置包括:
时序插值单元,用于对一段指定时间内没有实体关系实例出现时的实体关系利用插值计算该实体关系的权值,最终在指定时间段内任何实体之间的任何持续性关系在任何时间都有权值。
15.根据权利要求14所述的实体关系挖掘设备,其特征在于所述时序实体关系提取装置还包括以下单元中的至少一个:
实体关系实例强度计算单元,用于根据每一个实体关系实例,计算其对应时间单位内的实体关系的强度,即该实体关系的权值;以及
事件性关系以及冲突处理单元,用于对事件性的关系进行处理,得到带权值的时序实体关系。
16.根据权利要求14所述的实体关系挖掘设备,其特征在于对于出现实体关系实例的两个连续时间点之间的时间段,所述时序插值单元按照权值随时间线性衰减或增加/指数衰减或增加的方式,进行该实体关系的权值的插值计算。
17.根据权利要求10所述的实体关系挖掘设备,其特征在于所述实体是公司,以及所述关系是商业关系。
18.根据权利要求17所述的实体关系挖掘设备,其特征在于还包括:
时序五种行业竞争力量分析装置,用于根据带权值的时序实体关系和时序实体重要度,生成时序行业竞争力量数据,
所述时序五种行业竞争力量分析装置包括:
行业划分单元,用于根据需要的行业,对输入的带权值的时序实体关系和时序实体重要度进行划分,输出单一行业的时序实体关系和重要度;以及
以下单元中的至少一个:
潜在入侵者分析单元,用于计算给定时间t0时的潜在入侵者;
供应商议价能力分析单元,用于计算给定时间t0时的供应商议价能力;
消费者议价能力分析单元,用于计算给定时间t0时的消费者议价能力;
现有行业竞争者分析单元,用于计算时间t0时的现有行业竞争者;
替代品生产者分析单元,用于计算给定时间t0时的替代品生产者。
19.根据权利要求18所述的实体关系挖掘设备,其特征在于所述替代品生产者分析单元通过分析未来竞争趋势,获得未来可能的全面竞争者,来代替计算给定时间t0时的替代品生产者。
20.根据权利要求10所述的实体关系挖掘设备,其特征在于所述实体是产品、人或国家,以及所述关系是产品间的关系、人际关系或国家间的关系。
21.根据权利要求10~17和20之一所述的实体关系挖掘设备,其特征在于还包括:
可视化装置,用于根据带权值的时序实体关系、实体间时序综合联系度、时序实体重要度中的至少一个,生成可视化界面,
所述可视化装置以节点和连线生成可视化界面,其中:
每个节点表示一个实体,节点间的连线表示实体间关系的类型和权值:节点的大小对应于实体的重要度,连线的粗细或长短参数对应于实体间关系的权值,连线的颜色对应于实体间关系的类型。
22.根据权利要求10~17和20之一所述的实体关系挖掘设备,其特征在于还包括:
可视化装置,用于根据带权值的时序实体关系、实体间时序综合联系度、时序实体重要度中的至少一个,生成可视化界面,
所述可视化装置以节点和连线生成可视化界面,其中:
以关系的起始为节点,连线分为实体基准线和事件起始关联线,事件起始关联线的颜色对应于实体间关系的类型。
23.根据权利要求18或19所述的实体关系挖掘设备,其特征在于还包括:
可视化装置,用于根据带权值的时序实体关系、实体间时序综合联系度、时序实体重要度、时序行业竞争力量数据中的至少一个,生成可视化界面,
所述可视化装置以节点和连线生成可视化界面,其中:
每个节点表示一个实体,节点间的连线表示实体间关系的类型和权值:节点的大小对应于实体的重要度,连线的粗细或长短参数对应于实体间关系的权值,连线的颜色对应于实体间关系的类型。
24.根据权利要求18或19所述的实体关系挖掘设备,其特征在于还包括:
可视化装置,用于根据带权值的时序实体关系、实体间时序综合联系度、时序实体重要度、时序行业竞争力量数据中的至少一个,生成可视化界面,
所述可视化装置以节点和连线生成可视化界面,其中:
以关系的起始为节点,连线分为实体基准线和事件起始关联线,事件起始关联线的颜色对应于实体间关系的类型。
25.一种实体关系挖掘设备,其特征在于包括:
时序实体关系提取装置,用于读取实体关系实例,生成带权值的时序实体关系,所述时序实体关系提取装置还根据所生成的带权值的时序实体关系,生成实体间时序综合联系度;
时序实体重要度提取装置,用于读取所述时序实体关系提取装置所生成的实体间时序综合联系度,生成时序实体重要度;
事件检测装置,用于读取所述时序实体关系提取装置和所述时序实体重要度提取装置所生成的带权值的时序实体关系、实体间时序综合联系度、时序实体重要度,生成事件,
所述时序实体重要度提取装置包括:
图创建单元,用于针对每个时间单位内的实体,创建无向图,在所述无向图中,顶点是各个实体,联系顶点的边以两实体间的综合联系度为权值;
图节点连接度计算单元,采用图节点连接度计算方法,来计算每个节点的重要度,即实体重要度,
所述图节点连接度计算方法为:计算每个节点连接数之和或每个节点连接权值之和,
所述事件检测装置包括:
基于规则的事件提取单元,利用与带权值的时序实体关系、实体间时序综合联系度、时序实体重要度有关的预定义规则,检测所有的输入数据,输出与所述预定义规则匹配的事件。
26.根据权利要求25所述的实体关系挖掘设备,其特征在于
所述事件检测装置还包括:实体外部得分计算单元,对预先收集到的与实体有关的辅助信息进行得分计算,得到实体的外部得分;以及
所述基于规则的事件提取单元还利用与带权值的时序实体关系、实体间时序综合联系度、时序实体重要度、实体外部得分有关的预定义规则,检测所有的输入数据,输出与所述预定义规则匹配的事件。
27.根据权利要求26所述的实体关系挖掘设备,其特征在于对于并购事件,所述基于规则的事件提取单元基于发生并购时两实体的实体重要度和/或并购发生后两实体的实体重要度的变化,确定是实体间的完全并购事件还是实体间的部分并购事件。
28.根据权利要求25所述的实体关系挖掘设备,其特征在于还包括:
关系实例提取装置,用于读取文本信息数据,生成实体关系实例。
29.根据权利要求25所述的实体关系挖掘设备,其特征在于所述时序实体关系提取装置包括:
时序插值单元,用于对一段指定时间内没有实体关系实例出现时的实体关系利用插值计算该实体关系的权值,最终在指定时间段内任何实体之间的任何持续性关系在任何时间都有权值。
30.根据权利要求29所述的实体关系挖掘设备,其特征在于所述时序实体关系提取装置还包括以下单元中的至少一个:
实体关系实例强度计算单元,用于根据每一个实体关系实例,计算其对应时间单位内的实体关系的强度,即该实体关系的权值;以及
事件性关系以及冲突处理单元,用于对事件性的关系进行处理,得到带权值的时序实体关系。
31.根据权利要求29所述的实体关系挖掘设备,其特征在于对于出现实体关系实例的两个连续时间点之间的时间段,所述时序插值单元按照权值随时间线性衰减或增加/指数衰减或增加的方式,进行该实体关系的权值的插值计算。
32.根据权利要求25所述的实体关系挖掘设备,其特征在于所述实体是公司,以及所述关系是商业关系。
33.根据权利要求32所述的实体关系挖掘设备,其特征在于还包括:
时序五种行业竞争力量分析装置,用于根据带权值的时序实体关系和时序实体重要度,生成时序行业竞争力量数据,
所述时序五种行业竞争力量分析装置包括:
行业划分单元,用于根据需要的行业,对输入的带权值的时序实体关系和时序实体重要度进行划分,输出单一行业的时序实体关系和重要度;以及
以下单元中的至少一个:
潜在入侵者分析单元,用于计算给定时间t0时的潜在入侵者;
供应商议价能力分析单元,用于计算给定时间t0时的供应商议价能力;
消费者议价能力分析单元,用于计算给定时间t0时的消费者议价能力;
现有行业竞争者分析单元,用于计算时间t0时的现有行业竞争者;
替代品生产者分析单元,用于计算给定时间t0时的替代品生产者。
34.根据权利要求33所述的实体关系挖掘设备,其特征在于所述替代品生产者分析单元通过分析未来竞争趋势,获得未来可能的全面竞争者,来代替计算给定时间t0时的替代品生产者。
35.根据权利要求25所述的实体关系挖掘设备,其特征在于所述实体是产品、人或国家,以及所述关系是产品间的关系、人际关系或国家间的关系。
36.根据权利要求25~32和35之一所述的实体关系挖掘设备,其特征在于还包括:
可视化装置,用于根据带权值的时序实体关系、实体间时序综合联系度、时序实体重要度中的至少一个,生成可视化界面,
所述可视化装置以节点和连线生成可视化界面,其中:
每个节点表示一个实体,节点间的连线表示实体间关系的类型和权值:节点的大小对应于实体的重要度,连线的粗细或长短参数对应于实体间关系的权值,连线的颜色对应于实体间关系的类型。
37.根据权利要求25~32和35之一所述的实体关系挖掘设备,其特征在于还包括:
可视化装置,用于根据带权值的时序实体关系、实体间时序综合联系度、时序实体重要度中的至少一个,生成可视化界面,
所述可视化装置以节点和连线生成可视化界面,其中:
以关系的起始为节点,连线分为实体基准线和事件起始关联线,事件起始关联线的颜色对应于实体间关系的类型。
38.根据权利要求33或34所述的实体关系挖掘设备,其特征在于还包括:
可视化装置,用于根据带权值的时序实体关系、实体间时序综合联系度、时序实体重要度、时序行业竞争力量数据中的至少一个,生成可视化界面,
所述可视化装置以节点和连线生成可视化界面,其中:
每个节点表示一个实体,节点间的连线表示实体间关系的类型和权值:节点的大小对应于实体的重要度,连线的粗细或长短参数对应于实体间关系的权值,连线的颜色对应于实体间关系的类型。
39.根据权利要求33或34所述的实体关系挖掘设备,其特征在于还包括:
可视化装置,用于根据带权值的时序实体关系、实体间时序综合联系度、时序实体重要度、时序行业竞争力量数据中的至少一个,生成可视化界面,
所述可视化装置以节点和连线生成可视化界面,其中:
以关系的起始为节点,连线分为实体基准线和事件起始关联线,事件起始关联线的颜色对应于实体间关系的类型。
40.一种实体关系挖掘方法,其特征在于包括:
时序实体关系提取步骤,读取实体关系实例,生成带权值的时序实体关系,根据所生成的带权值的时序实体关系,生成实体间时序综合联系度;
事件检测步骤,读取在所述时序实体关系提取步骤中生成的带权值的时序实体关系和实体间时序综合联系度,生成事件,
所述事件检测步骤包括:
基于规则的事件提取子步骤,利用与带权值的时序实体关系、实体间时序综合联系度有关的预定义规则,检测所有的输入数据,输出与所述预定义规则匹配的事件。
41.根据权利要求40所述的实体关系挖掘方法,其特征在于
所述事件检测步骤还包括:实体外部得分计算子步骤,对预先收集到的与实体有关的辅助信息进行得分计算,得到实体的外部得分;以及
在所述基于规则的事件提取子步骤中,还利用与带权值的时序实体关系、实体间时序综合联系度、实体外部得分有关的预定义规则,检测所有的输入数据,输出与所述预定义规则匹配的事件。
42.根据权利要求40所述的实体关系挖掘方法,其特征在于还包括:
关系实例提取步骤,读取文本信息数据,生成实体关系实例。
43.根据权利要求40所述的实体关系挖掘方法,其特征在于所述时序实体关系提取步骤包括:
时序插值子步骤,对一段指定时间内没有实体关系实例出现时的实体关系利用插值计算该实体关系的权值,最终在指定时间段内任何实体之间的任何持续性关系在任何时间都有权值。
44.根据权利要求43所述的实体关系挖掘方法,其特征在于所述时序实体关系提取步骤还包括以下子步骤中的至少一个:
实体关系实例强度计算子步骤,根据每一个实体关系实例,计算其对应时间单位内的实体关系的强度,即该实体关系的权值;以及
事件性关系以及冲突处理子步骤,对事件性的关系进行处理,得到带权值的时序实体关系。
45.根据权利要求43所述的实体关系挖掘方法,其特征在于在所述时序插值子步骤中,对于出现实体关系实例的两个连续时间点之间的时间段,按照权值随时间线性衰减或增加/指数衰减或增加的方式,进行该实体关系的权值的插值计算。
46.根据权利要求40所述的实体关系挖掘方法,其特征在于所述实体是公司、产品、人或国家,以及所述关系是商业关系、产品间的关系、人际关系或国家间的关系。
47.根据权利要求40~46之一所述的实体关系挖掘方法,其特征在于还包括:
可视化步骤,根据带权值的时序实体关系、实体间时序综合联系度中的至少一个,生成可视化界面,
在所述可视化步骤中,以节点和连线生成可视化界面,其中:
每个节点表示一个实体,节点间的连线表示实体间关系的类型和权值:节点的大小对应于实体的重要度,连线的粗细或长短参数对应于实体间关系的权值,连线的颜色对应于实体间关系的类型。
48.根据权利要求40~46之一所述的实体关系挖掘方法,其特征在于还包括:
可视化步骤,根据带权值的时序实体关系、实体间时序综合联系度中的至少一个,生成可视化界面,
在所述可视化步骤中,以节点和连线生成可视化界面,其中:
以关系的起始为节点,连线分为实体基准线和事件起始关联线,事件起始关联线的颜色对应于实体间关系的类型。
49.一种实体关系挖掘方法,其特征在于包括:
时序实体关系提取步骤,读取实体关系实例,生成带权值的时序实体关系,根据所生成的带权值的时序实体关系,生成实体间时序综合联系度;
时序实体重要度提取步骤,读取在所述时序实体关系提取步骤中生成的实体间时序综合联系度,生成时序实体重要度;
事件检测步骤,读取在所述时序实体关系提取步骤和所述时序实体重要度提取步骤中生成的带权值的时序实体关系、实体间时序综合联系度、时序实体重要度,生成事件,
所述时序实体重要度提取步骤包括:
图创建子步骤,针对每个时间单位内的实体,创建无向图,在所述无向图中,顶点是各个实体,联系顶点的边以两实体间的综合联系度为权值;
图节点重要度计算子步骤,采用图节点重要度计算方法,来计算每个节点的重要度,即实体重要度,
所述图节点重要度计算方法是Page Rank方法或HITS算法,
所述事件检测步骤包括:
基于规则的事件提取子步骤,利用与带权值的时序实体关系、实体间时序综合联系度、时序实体重要度有关的预定义规则,检测所有的输入数据,输出与所述预定义规则匹配的事件。
50.根据权利要求49所述的实体关系挖掘方法,其特征在于
所述事件检测步骤还包括:实体外部得分计算子步骤,对预先收集到的与实体有关的辅助信息进行得分计算,得到实体的外部得分;以及
在所述基于规则的事件提取子步骤中,还利用与带权值的时序实体关系、实体间时序综合联系度、时序实体重要度、实体外部得分有关的预定义规则,检测所有的输入数据,输出与所述预定义规则匹配的事件。
51.根据权利要求50所述的实体关系挖掘方法,其特征在于在所述基于规则的事件提取子步骤中,对于并购事件,基于发生并购时两实体的实体重要度和/或并购发生后两实体的实体重要度的变化,确定是实体间的完全并购事件还是实体间的部分并购事件。
52.根据权利要求49所述的实体关系挖掘方法,其特征在于还包括:
关系实例提取步骤,读取文本信息数据,生成实体关系实例。
53.根据权利要求49所述的实体关系挖掘方法,其特征在于所述时序实体关系提取步骤包括:
时序插值子步骤,对一段指定时间内没有实体关系实例出现时的实体关系利用插值计算该实体关系的权值,最终在指定时间段内任何实体之间的任何持续性关系在任何时间都有权值。
54.根据权利要求53所述的实体关系挖掘方法,其特征在于所述时序实体关系提取步骤还包括以下子步骤中的至少一个:
实体关系实例强度计算子步骤,根据每一个实体关系实例,计算其对应时间单位内的实体关系的强度,即该实体关系的权值;以及
事件性关系以及冲突处理子步骤,对事件性的关系进行处理,得到带权值的时序实体关系。
55.根据权利要求53所述的实体关系挖掘方法,其特征在于在所述时序插值子步骤中,对于出现实体关系实例的两个连续时间点之间的时间段,按照权值随时间线性衰减或增加/指数衰减或增加的方式,进行该实体关系的权值的插值计算。
56.根据权利要求49所述的实体关系挖掘方法,其特征在于所述实体是公司,以及所述关系是商业关系。
57.根据权利要求56所述的实体关系挖掘方法,其特征在于还包括:
时序五种行业竞争力量分析步骤,根据带权值的时序实体关系和时序实体重要度,生成时序行业竞争力量数据,
所述时序五种行业竞争力量分析步骤包括:
行业划分子步骤,根据需要的行业,对输入的带权值的时序实体关系和时序实体重要度进行划分,输出单一行业的时序实体关系和重要度;以及
以下子步骤中的至少一个:
潜在入侵者分析子步骤,计算给定时间t0时的潜在入侵者;
供应商议价能力分析子步骤,计算给定时间t0时的供应商议价能力;
消费者议价能力分析子步骤,计算给定时间t0时的消费者议价能力;
现有行业竞争者分析子步骤,计算时间t0时的现有行业竞争者;以及
替代品生产者分析子步骤,计算给定时间t0时的替代品生产者。
58.根据权利要求57所述的实体关系挖掘方法,其特征在于在所述替代品生产者分析子步骤中,通过分析未来竞争趋势,获得未来可能的全面竞争者,来代替计算给定时间t0时的替代品生产者。
59.根据权利要求49所述的实体关系挖掘方法,其特征在于所述实体是产品、人或国家,以及所述关系是产品间的关系、人际关系或国家间的关系。
60.根据权利要求49~56和59之一所述的实体关系挖掘方法,其特征在于还包括:
可视化步骤,根据带权值的时序实体关系、实体间时序综合联系度、时序实体重要度中的至少一个,生成可视化界面,
在所述可视化步骤中,以节点和连线生成可视化界面,其中:
每个节点表示一个实体,节点间的连线表示实体间关系的类型和权值:节点的大小对应于实体的重要度,连线的粗细或长短参数对应于实体间关系的权值,连线的颜色对应于实体间关系的类型。
61.根据权利要求49~56和59之一所述的实体关系挖掘方法,其特征在于还包括:
可视化步骤,根据带权值的时序实体关系、实体间时序综合联系度、时序实体重要度中的至少一个,生成可视化界面,
在所述可视化步骤中,以节点和连线生成可视化界面,其中:
以关系的起始为节点,连线分为实体基准线和事件起始关联线,事件起始关联线的颜色对应于实体间关系的类型。
62.根据权利要求57或58所述的实体关系挖掘方法,其特征在于还包括:
可视化步骤,根据带权值的时序实体关系、实体间时序综合联系度、时序实体重要度、时序行业竞争力量数据中的至少一个,生成可视化界面,
在所述可视化步骤中,以节点和连线生成可视化界面,其中:
每个节点表示一个实体,节点间的连线表示实体间关系的类型和权值:节点的大小对应于实体的重要度,连线的粗细或长短参数对应于实体间关系的权值,连线的颜色对应于实体间关系的类型。
63.根据权利要求57或58所述的实体关系挖掘方法,其特征在于还包括:
可视化步骤,根据带权值的时序实体关系、实体间时序综合联系度、时序实体重要度、时序行业竞争力量数据中的至少一个,生成可视化界面,
在所述可视化步骤中,以节点和连线生成可视化界面,其中:
以关系的起始为节点,连线分为实体基准线和事件起始关联线,事件起始关联线的颜色对应于实体间关系的类型。
64.一种实体关系挖掘方法,其特征在于包括:
时序实体关系提取步骤,读取实体关系实例,生成带权值的时序实体关系,根据所生成的带权值的时序实体关系,生成实体间时序综合联系度;
时序实体重要度提取步骤,读取在所述时序实体关系提取步骤中生成的实体间时序综合联系度,生成时序实体重要度;
事件检测步骤,读取在所述时序实体关系提取步骤和所述时序实体重要度提取步骤中生成的带权值的时序实体关系、实体间时序综合联系度、时序实体重要度,生成事件,
所述时序实体重要度提取步骤包括:
图创建子步骤,针对每个时间单位内的实体,创建无向图,在所述无向图中,顶点是各个实体,联系顶点的边以两实体间的综合联系度为权值;
图节点连接度计算子步骤,采用图节点连接度计算方法,来计算每个节点的重要度,即实体重要度,
所述图节点连接度计算方法为:计算每个节点连接数之和或每个节点连接权值之和,
所述事件检测步骤包括:
基于规则的事件提取子步骤,利用与带权值的时序实体关系、实体间时序综合联系度、时序实体重要度有关的预定义规则,检测所有的输入数据,输出与所述预定义规则匹配的事件。
65.根据权利要求64所述的实体关系挖掘方法,其特征在于
所述事件检测步骤还包括:实体外部得分计算子步骤,对预先收集到的与实体有关的辅助信息进行得分计算,得到实体的外部得分;以及
在所述基于规则的事件提取子步骤中,还利用与带权值的时序实体关系、实体间时序综合联系度、时序实体重要度、实体外部得分有关的预定义规则,检测所有的输入数据,输出与所述预定义规则匹配的事件。
66.根据权利要求65所述的实体关系挖掘方法,其特征在于在所述基于规则的事件提取子步骤中,对于并购事件,基于发生并购时两实体的实体重要度和/或并购发生后两实体的实体重要度的变化,确定是实体间的完全并购事件还是实体间的部分并购事件。
67.根据权利要求64所述的实体关系挖掘方法,其特征在于还包括:
关系实例提取步骤,读取文本信息数据,生成实体关系实例。
68.根据权利要求64所述的实体关系挖掘方法,其特征在于所述时序实体关系提取步骤包括:
时序插值子步骤,对一段指定时间内没有实体关系实例出现时的实体关系利用插值计算该实体关系的权值,最终在指定时间段内任何实体之间的任何持续性关系在任何时间都有权值。
69.根据权利要求68所述的实体关系挖掘方法,其特征在于所述时序实体关系提取步骤还包括以下子步骤中的至少一个:
实体关系实例强度计算子步骤,根据每一个实体关系实例,计算其对应时间单位内的实体关系的强度,即该实体关系的权值;以及
事件性关系以及冲突处理子步骤,对事件性的关系进行处理,得到带权值的时序实体关系。
70.根据权利要求68所述的实体关系挖掘方法,其特征在于在所述时序插值子步骤中,对于出现实体关系实例的两个连续时间点之间的时间段,按照权值随时间线性衰减或增加/指数衰减或增加的方式,进行该实体关系的权值的插值计算。
71.根据权利要求64所述的实体关系挖掘方法,其特征在于所述实体是公司,以及所述关系是商业关系。
72.根据权利要求71所述的实体关系挖掘方法,其特征在于还包括:
时序五种行业竞争力量分析步骤,根据带权值的时序实体关系和时序实体重要度,生成时序行业竞争力量数据,
所述时序五种行业竞争力量分析步骤包括:
行业划分子步骤,根据需要的行业,对输入的带权值的时序实体关系和时序实体重要度进行划分,输出单一行业的时序实体关系和重要度;以及
以下子步骤中的至少一个:
潜在入侵者分析子步骤,计算给定时间t0时的潜在入侵者;
供应商议价能力分析子步骤,计算给定时间t0时的供应商议价能力;
消费者议价能力分析子步骤,计算给定时间t0时的消费者议价能力;
现有行业竞争者分析子步骤,计算时间t0时的现有行业竞争者;以及
替代品生产者分析子步骤,计算给定时间t0时的替代品生产者。
73.根据权利要求72所述的实体关系挖掘方法,其特征在于在所述替代品生产者分析子步骤中,通过分析未来竞争趋势,获得未来可能的全面竞争者,来代替计算给定时间t0时的替代品生产者。
74.根据权利要求64所述的实体关系挖掘方法,其特征在于所述实体是产品、人或国家,以及所述关系是产品间的关系、人际关系或国家间的关系。
75.根据权利要求64~71和74之一所述的实体关系挖掘方法,其特征在于还包括:
可视化步骤,根据带权值的时序实体关系、实体间时序综合联系度、时序实体重要度中的至少一个,生成可视化界面,
在所述可视化步骤中,以节点和连线生成可视化界面,其中:
每个节点表示一个实体,节点间的连线表示实体间关系
的类型和权值:节点的大小对应于实体的重要度,连线的粗细或长短参数对应于实体间关系的权值,连线的颜色对应于实体间关系的类型。
76.根据权利要求64~71和74之一所述的实体关系挖掘方法,其特征在于还包括:
可视化步骤,根据带权值的时序实体关系、实体间时序综合联系度、时序实体重要度中的至少一个,生成可视化界面,
在所述可视化步骤中,以节点和连线生成可视化界面,其中:
以关系的起始为节点,连线分为实体基准线和事件起始关联线,事件起始关联线的颜色对应于实体间关系的类型。
77.根据权利要求72或73所述的实体关系挖掘方法,其特征在于还包括:
可视化步骤,根据带权值的时序实体关系、实体间时序综合联系度、时序实体重要度、时序行业竞争力量数据中的至少一个,生成可视化界面,
在所述可视化步骤中,以节点和连线生成可视化界面,其中:
每个节点表示一个实体,节点间的连线表示实体间关系的类型和权值:节点的大小对应于实体的重要度,连线的粗细或长短参数对应于实体间关系的权值,连线的颜色对应于实体间关系的类型。
78.根据权利要求72或73所述的实体关系挖掘方法,其特征在于还包括:
可视化步骤,根据带权值的时序实体关系、实体间时序综合联系度、时序实体重要度、时序行业竞争力量数据中的至少一个,生成可视化界面,
在所述可视化步骤中,以节点和连线生成可视化界面,其中:
以关系的起始为节点,连线分为实体基准线和事件起始关联线,事件起始关联线的颜色对应于实体间关系的类型。
CN2007101679749A 2007-10-31 2007-10-31 实体关系挖掘设备和方法 Active CN101425065B (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
CN2007101679749A CN101425065B (zh) 2007-10-31 2007-10-31 实体关系挖掘设备和方法
JP2008273950A JP4795417B2 (ja) 2007-10-31 2008-10-24 エンティティ関係マイニング装置および方法
US12/261,852 US20090112825A1 (en) 2007-10-31 2008-10-30 Entity relation mining apparatus and method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2007101679749A CN101425065B (zh) 2007-10-31 2007-10-31 实体关系挖掘设备和方法

Publications (2)

Publication Number Publication Date
CN101425065A CN101425065A (zh) 2009-05-06
CN101425065B true CN101425065B (zh) 2013-01-09

Family

ID=40584172

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2007101679749A Active CN101425065B (zh) 2007-10-31 2007-10-31 实体关系挖掘设备和方法

Country Status (3)

Country Link
US (1) US20090112825A1 (zh)
JP (1) JP4795417B2 (zh)
CN (1) CN101425065B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105389470A (zh) * 2015-11-18 2016-03-09 福建工程学院 一种中医针灸领域实体关系自动抽取的实现方法

Families Citing this family (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2488373A (en) * 2011-02-28 2012-08-29 Hsbc Holdings Plc Database ranks results based on reputational scores
US20130117272A1 (en) * 2011-11-03 2013-05-09 Microsoft Corporation Systems and methods for handling attributes and intervals of big data
JP5899946B2 (ja) * 2012-01-17 2016-04-06 富士通株式会社 分割装置、分割方法、および分割プログラム
US11106724B2 (en) 2012-03-28 2021-08-31 Nec Corporation Matching result display device, matching result display method, program, and recording medium
CN103365912B (zh) * 2012-04-06 2016-12-14 富士通株式会社 对实体关系模式进行聚类、提取的方法和设备
US20150012530A1 (en) * 2013-07-05 2015-01-08 Accenture Global Services Limited Determining an emergent identity over time
EP2947610A1 (en) * 2014-05-19 2015-11-25 Mu Sigma Business Solutions Pvt. Ltd. Business problem networking system and tool
CN105468605B (zh) * 2014-08-25 2019-04-12 济南中林信息科技有限公司 一种实体信息图谱生成方法及装置
CN104182535B (zh) * 2014-08-29 2017-05-24 苏州大学 一种人物关系抽取方法和装置
CN105989143B (zh) * 2015-02-28 2019-09-03 科大讯飞股份有限公司 网络实体热度分析方法及系统
CN104657750B (zh) * 2015-03-23 2018-04-27 苏州大学张家港工业技术研究院 一种用于人物关系抽取的方法和装置
CN105138636B (zh) * 2015-08-21 2018-07-24 浪潮软件集团有限公司 一种实体关系的图形构建方法及装置
JP6502807B2 (ja) * 2015-09-15 2019-04-17 株式会社東芝 情報抽出装置、情報抽出方法および情報抽出プログラム
WO2017100534A1 (en) * 2015-12-11 2017-06-15 Servicenow, Inc. Computer network threat assessment
CN105677726A (zh) * 2015-12-29 2016-06-15 上海律巢网络科技有限公司 一种数据检索及结果呈现方法与系统
CN106991090B (zh) * 2016-01-20 2020-12-11 北京国双科技有限公司 舆情事件实体的分析方法及装置
CN107180030B (zh) * 2016-03-09 2020-11-17 创新先进技术有限公司 一种网络上的关系数据生成方法及装置
JP2017204054A (ja) * 2016-05-10 2017-11-16 コニカミノルタ株式会社 相性算出装置、相性算出方法、およびコンピュータプログラム
CN107610693B (zh) * 2016-07-11 2021-01-29 科大讯飞股份有限公司 文本语料库的构建方法和装置
CN108052501A (zh) * 2017-12-13 2018-05-18 北京数洋智慧科技有限公司 一种基于人工智能的实体关系对识别方法及系统
CN111274812B (zh) * 2018-12-03 2023-04-18 阿里巴巴集团控股有限公司 一种人物关系识别方法、设备及存储介质
CN110378569A (zh) * 2019-06-19 2019-10-25 平安国际智慧城市科技股份有限公司 产业关系链构建方法、装置、设备及存储介质
CN112241458B (zh) * 2020-10-13 2022-10-28 北京百分点科技集团股份有限公司 文本的知识结构化处理方法、装置、设备和可读存储介质
CN113191118B (zh) * 2021-05-08 2023-07-18 山东省计算中心(国家超级计算济南中心) 一种基于序列标注的文本关系抽取方法
CN113793227B (zh) * 2021-09-16 2023-10-31 中国电子科技集团公司第二十八研究所 一种用于社交网络事件的类人智能感知与预测方法
CN114818734B (zh) * 2022-05-25 2023-10-31 清华大学 基于目标-属性-关系的对抗场景语义分析方法以及装置

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001306998A (ja) * 2000-04-18 2001-11-02 Toshiba Corp 時系列分析方法
JP2007265229A (ja) * 2006-03-29 2007-10-11 Hitachi East Japan Solutions Ltd 時系列分析プログラム、時系列分析システム、およびそれに用いられる端末装置

Family Cites Families (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0527092A (ja) * 1991-07-17 1993-02-05 Hitachi Plant Eng & Constr Co Ltd 放射性金属廃棄物の除染方法
JP3699807B2 (ja) * 1997-06-30 2005-09-28 株式会社東芝 相関関係抽出装置
US6859785B2 (en) * 2001-01-11 2005-02-22 Case Strategy Llp Diagnostic method and apparatus for business growth strategy
US7251613B2 (en) * 2001-09-05 2007-07-31 David Flores System and method for generating a multi-layered strategy description including integrated implementation requirements
US20030046125A1 (en) * 2001-09-05 2003-03-06 Nextstrat, Inc. System and method for enterprise strategy management
US7716170B2 (en) * 2002-01-08 2010-05-11 Wafik Farag Holistic dynamic information management platform for end-users to interact with and share all information categories, including data, functions, and results, in collaborative secure venue
US7346529B2 (en) * 2002-05-07 2008-03-18 David R. Flores Method for developing an enterprise alignment framework hierarchy by compiling and relating sets of strategic business elements
JP4146326B2 (ja) * 2003-10-24 2008-09-10 株式会社東芝 時系列活動データ分析装置、方法及びプログラム
US8010460B2 (en) * 2004-09-02 2011-08-30 Linkedin Corporation Method and system for reputation evaluation of online users in a social networking scheme
US7657493B2 (en) * 2006-09-28 2010-02-02 Microsoft Corporation Recommendation system that identifies a valuable user action by mining data supplied by a plurality of users to find a correlation that suggests one or more actions for notification
US7930197B2 (en) * 2006-09-28 2011-04-19 Microsoft Corporation Personal data mining
US7849104B2 (en) * 2007-03-01 2010-12-07 Microsoft Corporation Searching heterogeneous interrelated entities
US10698886B2 (en) * 2007-08-14 2020-06-30 John Nicholas And Kristin Gross Trust U/A/D Temporal based online search and advertising
US8156002B2 (en) * 2007-10-10 2012-04-10 Yahoo! Inc. Contextual ad matching strategies that incorporate author feedback

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001306998A (ja) * 2000-04-18 2001-11-02 Toshiba Corp 時系列分析方法
JP2007265229A (ja) * 2006-03-29 2007-10-11 Hitachi East Japan Solutions Ltd 時系列分析プログラム、時系列分析システム、およびそれに用いられる端末装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
Eamonn Keogh等.On the Need for Time Series Data Mining Benchmarks: A Survey and Empirical Demonstration.《Data Mining and Knowledge Discovery》.2003,第7卷(第4期),349-371.
On the Need for Time Series Data Mining Benchmarks: A Survey and Empirical Demonstration;Eamonn Keogh等;《Data Mining and Knowledge Discovery》;20031231;第7卷(第4期);349-371 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105389470A (zh) * 2015-11-18 2016-03-09 福建工程学院 一种中医针灸领域实体关系自动抽取的实现方法

Also Published As

Publication number Publication date
CN101425065A (zh) 2009-05-06
US20090112825A1 (en) 2009-04-30
JP4795417B2 (ja) 2011-10-19
JP2009116869A (ja) 2009-05-28

Similar Documents

Publication Publication Date Title
CN101425065B (zh) 实体关系挖掘设备和方法
Beske-Janssen et al. 20 years of performance measurement in sustainable supply chain management–what has been achieved?
Baldwin et al. Trade effects of the euro: evidence from sectoral data
CN101408886B (zh) 通过分析文档的段落来选择该文档的标签
CN101566997B (zh) 确定与给定的词集相关的词
Berdiyeva et al. Artificial intelligence in accounting and finance: Meta-analysis
Abbasi et al. Operational efficiency-based ranking framework using uncertain DEA methods: an application to the cement industry in Iran
CN101408885A (zh) 利用统计分布对主题进行建模
CN101645066A (zh) 一种互联网新颖词监测方法
Polese et al. Sustainability in footwear industry: a big data analysis
JP2007257223A (ja) 金融関連情報統合表示プログラム、装置、及び方法。
Sotoudeh-Anvari et al. A new data envelopment analysis in fully fuzzy environment on the base of the degree of certainty of information
Rosnidah et al. Detecting and preventing fraud with big data analytics: Auditing perspective
Zerafa et al. ExTraVis: exploration of traffic incidents using a visual interactive system
Martínez-Zarzoso et al. CEECs integration into regional and global production networks
Abounia Omran Application of Data Mining and Big Data Analytics in the Construction Industry
Bhadauria et al. Examining the interlinkages among the virtual experiential technique’s influencing factors in the ecommerce industry: An ism and micmac approach
Förschler et al. Reading between the lines: The effect of language sentiment on economic indicators
CN108182596A (zh) 一种基于大数据环境下企业销售管理方法
Čelebić et al. Development of an Integrated Model for Open-Pit-Mine Discontinuous Haulage System Optimization
Duho Examining Anti-Corruption Disclosures, Profitability and Financial Stability Among Extractive Firms in Africa
Muli Economic integration, ease of doing business, economic growth and foreign direct investment in the east African community
Bauk et al. Maritime Blockchain Constraints' Analysis by ISM and MICMAC Techniques
Bildosola et al. Technology Roadmapping of Emerging Technologies: Scientometrics and Time Series Approach
Bengo et al. Measuring a blended performance: Managerial insights from the field of impact entrepreneurship

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20171213

Address after: 100190 Zhongguancun street, Haidian District, Beijing, No. 18, block B, block 18

Patentee after: Data Hall (Beijing) Polytron Technologies Inc

Address before: 100007 room 12, room B, South Xin Bin International Building, No. 22, Dongsishitiao a Dongcheng District, Dongcheng District, Beijing

Patentee before: NEC (China) Co., Ltd.

TR01 Transfer of patent right