CN110309313B - 生成事件转移图谱的方法及装置 - Google Patents

生成事件转移图谱的方法及装置 Download PDF

Info

Publication number
CN110309313B
CN110309313B CN201810195827.0A CN201810195827A CN110309313B CN 110309313 B CN110309313 B CN 110309313B CN 201810195827 A CN201810195827 A CN 201810195827A CN 110309313 B CN110309313 B CN 110309313B
Authority
CN
China
Prior art keywords
event
sample data
types
data set
transition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810195827.0A
Other languages
English (en)
Other versions
CN110309313A (zh
Inventor
舒怡
曾祥辉
周冰洁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Gridsum Technology Co Ltd
Original Assignee
Beijing Gridsum Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Gridsum Technology Co Ltd filed Critical Beijing Gridsum Technology Co Ltd
Priority to CN201810195827.0A priority Critical patent/CN110309313B/zh
Publication of CN110309313A publication Critical patent/CN110309313A/zh
Application granted granted Critical
Publication of CN110309313B publication Critical patent/CN110309313B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Animal Behavior & Ethology (AREA)
  • Computational Linguistics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种生成事件转移图谱的方法及装置,该方法包括获取同一领域的第一样本数据集合,利用事件提取模型提取该第一样本数据集合中每一条样本数据所包含的事件。将每一条样本数据所包含的事件,按照事件发生时间的先后顺序进行排序得到事件序列。然后,根据第一样本集合中每一条样本数据的事件序列,得到不同事件类型之间的事件转移图谱。该方法能够从样本数据中自动提取事件,并统计得到不同事件类型之间的转移关系,获得事件转移图谱。从而实现跨样本数据分析不同事件之间的关系,而且根据样本数据自动生成事件转移图谱的效率高。

Description

生成事件转移图谱的方法及装置
技术领域
本发明涉及计算机技术领域,尤其涉及一种生成事件转移图谱的方法及装置。
背景技术
随着大数据技术飞速发展,基于大量数据的事件关联分析应运而生。目前的事件关联分析通常是基于同一主体(例如,同一用户,同一个文本数据)的事件之间关系进行分析。例如,针对同一用户在某个网站的数据分析该用户的行为事件。又如,在以文本数据为分析对象的应用场景中,从该文本数据中摘取某些句子作为该文本数据的事件摘要。无法跨数据分析不同数据的事件之间的关系。
发明内容
鉴于上述问题,提出了本发明提供了一种生成事件转移图谱的方法及装置,以提供一种自动生成事件转移图谱的方法的解决方法。
本发明实施例提供了一种生成事件转移图谱的方法,包括:
获取属于同一领域的第一样本数据集合,其中,所述第一样本数据集合中的每一条样本数据包括至少一个事件;
利用事件提取模型,提取所述第一样本数据集合中每一条样本数据所包含的事件;
将所述每一条样本数据所包含的事件,按照事件发生时间的先后顺序排序得到事件序列;
根据所述每一条样本数据对应的事件序列,得到不同事件类型之间的事件转移图谱。
本发明实施例还提供了一种生成事件转移图谱的装置,包括:
第一获取单元,用于获取属于同一领域的第一样本数据集合,其中,所述第一样本数据集合中的每一条样本数据包括至少一个事件;
提取单元,用于利用事件提取模型,提取所述第一样本数据集合中每一条样本数据所包含的事件;
排列单元,用于将所述每一条样本数据所包含的事件,按照事件发生时间的先后顺序排序得到事件序列;
图谱获取单元,用于根据所述每一条样本数据对应的事件序列,得到不同事件类型之间的事件转移图谱。
本发明实施例又提供了一种存储介质,其上存储有程序,所述程序被处理器执行时实现上述生成事件转移图谱的方法。
本发明实施例再提供了一种处理器,所述处理器用于运行程序,所述程序运行时执行上述生成事件转移图谱的方法。
本发明提供的生成事件转移图谱的方法,获取同一领域的第一样本数据集合,利用事件提取模型提取该第一样本数据集合中每一条样本数据所包含的事件。将每一条样本数据所包含的事件,按照事件发生时间的先后顺序进行排序得到事件序列。然后,根据第一样本集合中每一条样本数据的事件序列,得到不同事件类型之间的事件转移图谱。该方法能够从样本数据中自动提取事件,并统计得到不同事件类型之间的转移关系,获得事件转移图谱。从而实现跨样本数据分析不同事件之间的关系,而且根据样本数据自动生成事件转移图谱的效率高。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了本申请实施例一种生成事件转移图谱的方法流程图;
图2示出了本申请实施例一种获得事件提取模型过程的流程图;
图3示出了本申请实施例一种获取包含事件类型之间的转移概率信息的事件转移图谱过程的流程图;
图4示出了本申请实施例一种获得事件类型之间的转移概率过程的流程图;
图5示出了本申请实施例另一种一种获得事件类型之间的转移概率过程的流程图;
图6示出了本申请实施例一种事件转移图谱的示意图;
图7示出了本申请实施例另一种生成事件转移图谱的方法的流程图;
图8示出了本申请实施例一种展示事件序列的示意图;
图9示出了本申请实施例另一种展示事件序列的示意图;
图10示出了本申请实施例另一种事件转移图谱的示意图;
图11示出了本申请实施例一种生成事件转移图谱的装置框图;
图12示出了本申请实施例另一种生成事件转移图谱的装置框图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
请参见图1,示出了本申请实施例一种生成事件转移图谱的方法流程图,该方法可以应用于计算机中,如图1所示,该方法可以包括以下步骤:
S110,获取属于同一领域的第一样本数据集合。
其中,该第一样本数据集合中的每一条样本数据包括至少一个事件。
领域可以分为多个层级,例如,一级领域、二级领域、三级领域等;其中,一级领域可以根据不同业务场景划分,例如,电子商务领域、司法领域等。二级领域可以根据一级领域的需求划分,例如,在司法领域中,样本数据是裁判文书,而裁判文书对应的案件类型有多个,例如,刑事、民事和行政,因此,司法领域可以根据案件类型划分二级领域。同一案件类型的裁判文书又包括很多类案由,因此,二级领域下可以划分多个三级领域,例如,可以根据案由划分三级领域,即,一个案由就是一个三级领域;此时,对于司法这一一级领域,二级领域为案件类型、三级领域为案由。
对于包含多个层级的领域,多个事件对应的最末级的领域相同才认为这些事件属于同一领域。例如,如果两个事件都是侵害商标权纠纷领域的事件,则这两个事件属于同一领域。
不同领域对应的样本不同,例如,在司法领域中,一篇裁判文书就是一条样本数据。在电子商务领域中,用户在一段时间内在某个网站上的浏览数据和/或购买信息就是一条样本数据。
S120,利用事件提取模型,提取第一样本数据集合中每一条样本数据所包含的事件。
事件提取模型根据大量样本数据训练得到,训练得到事件提取模型后,可以直接利用事件提取模型从样本数据中提取出相应的事件。例如,样本数据属于领域A,则利用领域A对应的事件提取模型提取样本数据所包含的事件。
在本申请的一个实施例中,如图2所示,训练事件提取模型的过程可以包括以下步骤:
S121,获取属于同一领域的第二样本数据集合。
例如,在司法领域,一篇裁判文书就是一个样本数据,一篇裁判文书中通常包括原告和被告在不同时间发生的多个事件。因此,一篇裁判文书能够提取出多个事件。
获得属于同一领域的大量第二样本数据后,对样本所包含事件的事件要素进行标记,这些标记内容及样本中被标记的样本内容本身(例如,裁判文书中被标记的句子原文)都作为样本数据。
例如,对于裁判文书,对裁判文书所涉及事件的事件类型及事件要素进行标记,其中,事件要素主要包括事件发生时间、事件主体、事件所涉及的物等信息。这些标记后的信息,以及样本中被标记的样本内容本身作为一个第二样本数据所包含事件的事件信息。
其中,事件类型可以根据事件所包含的事件内容划分,属于同一事件类型的事件具有相同事件内容,例如,事件类型是成立公司,则该事件类型所包含的事件都包括成立/创建公司的事件内容。
而且,标记的事件类型经过标准化处理,例如,将事件内容实质一致,但事件描述不一致的事件统一定义为同一类事件。其中,可以以机器容易识别的动宾语法结构定义每一类事件,同时,保留不同事件特有的类型数据,例如,成立公司、注册商标、转让商标等。
S122,根据该第二样本数据集合中全部样本数据所包含的事件信息训练得到用于提取事件的事件提取模型。
根据第二样本数据中标记的信息在裁判文书中的位置及语句特征等与事件或行为之间的对应关系,进行机器学习训练,得到事件提取模型。
训练事件提取模型的过程,即,对于任意一个类型的事件,通过机器训练得到该事件对应的事件特征。利用该事件提取模型的过程就是利用事件特征从样本数据中提取相应的事件。
例如,可以利用神经网络训练得到事件提取模型,第二样本数据集合作为神经网络的输入数据,经过训练后,在神经网络的输出获得事件提取模型。
当然,在本申请的其它实施例中,可以利用其它机器学习方法训练得到事件提取模型,此处不再一一举例说明。
对于同一领域,训练事件提取模型的过程只需进行一次,得到事件提取模型后,直接利用该事件提取模型从事件数据中提取相应的事件,以及,确定该事件的事件类型。例如,侵害商标权纠纷这一领域的事件包括成立公司、注册商标、认定著名商标、使用商标(未经授权)等多个事件类型。
S130,将第一样本数据集合中每一条样本数据所包含的事件,按照事件发生时间的先后顺序进行排序,得到对应的事件序列。
以任一条样本数据为对象,将每一条样本数据所包含的事件按照发生时间的先后顺序排序,获得该样本数据对应的事件序列。遍历第一样本数据集合中的所有样本数据,获得每一条样本数据对应的事件序列。
例如,样本数据是裁判文书,则对于每一篇裁判文书,将从该裁判文书中提取的所有事件按照时间先后顺序进行排序,得到该裁判文书对应的事件序列。
在本申请的一个实施例中,优选从裁判文书的经审理查明段中提取该裁判文书所包含的所有事件。其中,经审理查明段的内容通常在裁判文书的当事人诉辩之后,用于叙述法院认定的事实,通常以“经审理查明”开头。经审理查明段的内容反映了法官在庭审阶段结合证据及双方认可后确认的案件事实。
S140,根据每一条样本数据对应的事件序列,得到不同事件类型之间的事件转移图谱。
事件转移图谱是一个描述事件之间顺承、因果关系的事理演化逻辑有向图。图中节点表示抽象、泛化的事件类型,有向边表示事件之间顺承、因果关系。
事件转移图谱可以应用于多个领域中,例如电子商务领域、司法领域或人们的日常生活等领域。
在本申请的一个实施例中,根据第一样本数据集合中每一条样本数据所对应的事件序列,构建不同事件类型之间的拓扑图,得到事件转移图谱。
事件序列中每一个节点代表一个具体的事件,而事件转移图谱中的每一节点代表一个事件类型;在利用事件序列构建事件转移图谱时,需要将事件序列中的事件映射到对应的事件类型,再根据事件序列中该事件的事件转化关系连接不同的事件类型,最终得到事件转移图谱。
在本申请的一个优选实施例中,事件转移图谱还可以包括事件类型之间直接转移的转移概率信息。
在本申请的一个实施例中,如图3所示,获得包含事件类型之间的转移概率信息的事件转移图谱的过程可以包括以下步骤:
S141,利用第一样本数据集合内全部样本数据对应的事件序列,构建不同事件类型之间的拓扑图。
S142,统计第一样本数据集合中全部样本数据涉及的各种事件类型之间直接转移的转移概率。
在本申请的一个实施例中,如图4所示,统计第一样本数据集合中全部样本数据涉及的各种事件类型之间直接转移的转移概率的过程可以包括以下步骤:
S1421,统计第一样本数据集合中从当前事件类型直接转移到各个相邻事件类型的转移概率。
本实施例中的相邻事件类型是与当前事件类型之间具有直接转移关系的事件类型。
当前事件类型是第一样本数据集合中涉及的任意一种事件类型。
S1422,遍历第一样本数据集合中的所有事件类型,得到第一样本数据集合所涉及的所有事件类型之间直接转移的转移概率。
例如,当前事件类型为A,则统计从A出发直接转移到各种相邻事件类型的转移概率,以该方式遍历第一样本数据集合中的全部事件类型,得到全部事件类型之间直接转移的转移概率。
在本申请的另一种实施例中,如图5所示,统计第一样本数据集合中全部样本数据涉及的各种事件类型之间直接转移的转移概率的过程可以包括以下步骤:
S1423,统计第一样本数据集合中从各个相邻事件类型直接转移到当前事件类型的转移概率。
S1424,遍历第一样本数据集合中的所有事件类型,得到第一样本数据集合所涉及的所有事件类型之间直接转移的转移概率。
例如,当前事件类型为B,则统计从各种相邻事件类型直接转移到B的转移概率,以该方式遍历第一样本数据集合中的全部事件类型,得到全部事件类型之间直接转移的转移概率。
本申请实施例中,计算两个事件之间转移概率的过程可以包括以下方式:
一种:利用第一样本数据集合中从当前事件类型直接转移到某相邻事件类型的有向组合的数量与当前事件类型总数的比值,计算得到当前事件直接转移到某相邻事件类型的转移概率。其中,转移概率可以是该比值对应的百分数、分数或小数。
例如,两个不同的事件类型e1和e2,e1直接转移到e2的转移概率计算公式如公式1所示:
P(e1,e2)=N(e1->e2)/N(e1) (公式1)
公式1中,P(e1,e2)为e1直接转移到e2的转移概率,N(e1->e2)为在全部第一样本数据中e1直接转移到e2这种有向组合的次数,N(e1)为第一样本数据集合中e1这种事件类型的总数。
在本申请的一个实施例中,该当前事件类型的总数N(e1)可以是第一样本数据集合中从当前事件类型出发转移到相邻事件类型的所有有向组合的数量;
在本申请的另一个实施例中,该当前事件类型的数量可以是第一样本数据集合中所有包含该当前事件类型的第一样本数据的数量。
这两种方式都能得到当前事件类型的总数,保证同一事件转移图谱中当前事件类型的总数的计算标准相同即可。
另一种:直接将从当前事件类型直接转移到相邻事件类型的次数作为转移概率。
这两种方式均能计算得到转移概率,保证同一事件转移图谱中计算转移概率的标准相同即可。
S143,根据该转移概率及对应的拓扑图获得事件转移图谱。
在本申请的一个实施例中,在拓扑图中每连接一个事件类型,统计该事件类型相关的转移概率;即,统计从当前事件类型相关的转移概率的过程与构建事件转移图谱的过程可以交叉进行。
在本申请的另一个实施例中,构建拓扑图与统计转移概率的过程分别独立进行,例如,先构建完成拓扑图,然后,再计算拓扑图中各个事件类型之间的直接转移概率。
如图6所示,示出了本申请实施例一种事件转移图谱的示意图,图6中,每一个节点代表一个事件类型,有向边代表其中不同事件类型之间的顺承、因果关系。
图6中包括事件类型1、事件类型2、事件类型3和事件类型4,其中,事件类型1->事件类型2的转移概率是20%;事件类型1->事件类型3的转移概率是75%;事件类型2->事件类型3的转移概率是25%;事件类型2->事件类型3的转移概率是75%;事件类型3->事件类型4的转移概率是15%。
本实施例提供的生成事件转移图谱的方法,获取同一领域的第一样本数据集合,然后,利用事件提取模型提取该第一样本数据集合中每一条样本数据所包含的事件。将每一条样本数据所包含的事件,按照事件发生时间的先后顺序进行排序,得到该样本数据对应的事件序列;然后,根据第一样本集合中每一条样本数据的事件序列,得到不同事件类型之间的事件转移图谱。该方法能够从样本数据自动提取事件,并能够得到不同事件类型之间的转化关系获得事件转移图谱。从而实现跨样本数据分析不同事件之间的关系,而且根据样本数据自动生成事件转移图谱的效率高。
请参见7,示出了本申请实施例另一种生成事件转移图谱的方法的流程图,本实施例中,利用事件提取模型提取得到样本中的事件后,还可以提取事件对应的事件要素。
如图7所示,该方法在图1所示实施例的基础上还可以包括以下步骤:
S210,获取第一样本数据集合中每一条样本数据所包含事件的事件要素。
其中,事件要素可以包括事件主体、事件发生时间、事件发生地点等。不同领域对应的事件主体可能不同,例如,在电子商务领域中,事件主体是某个网站的用户;而在司法领域中,裁判文书中的事件主体包括原告和被告。
优选的,在本申请的一个优选实施例中,获取事件的事件要素中的事件主体之后,对于一条样本数据中包含不同事件主体的应用场景,S130中获得事件序列的过程可以包括:
将第一样本数据集合中每一条样本数据包含的各个事件区分为各个事件主体的事件,并将各个事件主体的事件分别按照事件发生时间的先后顺序排布,得到各个事件主体对应的事件序列。
该步骤是在获取事件所包含的事件主体后,根据每一条样本数据中包含的不同事件主体区分事件,得到各个事件主体的事件;然后,针对任一个事件主体的事件,按照事件发生时间的先后顺序进行排布,得到该事件主体对应的事件序列。
例如,从一篇裁判文书中提取出的不同事件之后,如果一条样本数据涉及到多个事件主体,则可以从同一条样本数据所包含的所有事件按照事件主体分类,并针对不同的事件主体分别按照事件发生时间由先到后的顺序,得到各个事件主体对应的事件序列。由此得到的作为构建事件转移图谱的基础事件序列,会更符合事件发展的逻辑联系,对于包含事件类型之间的转移概率信息的事件转移图谱,其中的相邻事件类型间的转移概率更准确更有参考指导价值。
在本申请的一个优选实施例中,在S130中获得各个事件主体对应的事件序列后,S140利用事件序列得到事件转移图谱的过程可以包括:
针对任一事件主体,利用第一样本数据集合中涉及的该事件主体对应的事件序列构建得到该事件主体对应的事件转移图谱;遍历第一样本数据集合中涉及的所有事件主体,得到第一样本数据集合涉及的全部事件转移图谱。
在申请的一个优选实施例中,S130之后该方法还可以包括:
S220,分别展示各个事件主体对应的事件序列。
获得同一样本数据中各个事件主体对应的事件序列后,可以分别显示各个事件序列,以便用户快速了解该样本数据所涉及的不同事件主体的所有事件。
如图8所示,是本申请实施例一种展示事件序列的示意图;如图8所示,横轴是时间轴,纵轴是事件主体轴,而且,事件主体轴的上半部分代表原告、下半部分代表被告。时间轴从左至右,表示时间的演进方向。由图8可知,同一裁判文书中的所有事件,在时间轴上按照时间演进方向依次排列,但是,事件主体是原告的事件均在纵轴的上半部分显示,事件主体是被告的事件均在纵轴的下半部分显示。
如图9所示,是本申请实施例另一种展示事件序列的示意图,其中T为时间轴,A为事件主体轴,各个事件主体(例如,甲、乙、丙)可以通过在A轴上不同的区间或取值进行区分。
上述两个示例都是事件主体共用同一时间轴的情形,当然也可以一个事件主体带有一个时间轴,每个事件主体的事件序列通过自己的时间轴显示出来。除了上述列举的几种展示方式,本领域技术人员根据上述公开的内容及启示,还能通过组合或拓展等获得其他多种展示方式,都能实现本发明实施例的可视化展示,每种展示方式都有自己的优点和用处,本发明实施例对此不做限定。
本实施例中,获得事件转移图谱后,还可以根据某个事件类型与其它事件类型之间直接转移的转移概率的大小顺序显示。
S230,根据事件转移图谱中不同事件类型之间直接转移的转移概率,获取从目标事件类型直接转移到其它事件类型的转移概率。
S240,按照该转移概率由高到低的顺序显示目标事件类型对应的事件转移关系。
如图10所示,是本申请实施例图6所示的事件转移图谱的另一种示意图。如图10所示,事件类型2的下一个事件类型可能是事件类型3和事件类型4,其中,事件类型2->事件类型4的转移概率是75%,事件类型2->事件类型3的转移概率是25%。
本实施例提供的生成事件转移图谱的方法,在利用事件提取模型提取得到样本中的事件后,还可以根据事件涉及的事件主体、事件发生时间、发生地点等事件要素,分别在不同的要素轴上展示,实现多维信息分离显示,使得事件之间的关系更直观。
相应于上述的生成事件转移图谱的方法实施例,本申请还提供了相应的装置实施例。
请参见图11,示出了本申请实施例一种生成事件转移图谱的装置框图,该装置可以应用于计算机中。如图11所示,该装置可以包括:第一获取单元110、提取单元120、排列单元130和图谱获取单元140。
第一获取单元110,用于获取属于同一领域的第一样本数据集合。
其中,该第一样本数据集合中的每一条样本数据包括至少一个事件。
例如,在司法领域,一篇裁判文书就是第一样本数据集合中的一个样本数据,裁判文书中通常包含原告和被告在不同时间发生的多个事件,因此,一篇裁判文书包含多个不同的事件。
提取单元120,用于利用事件提取模型,提取第一样本数据集合中每一条样本数据所包含的事件。
事件提取模型根据大量样本数据训练得到,训练得到事件提取模型后,可以直接利用事件提取模型从样本数据中提取出相应的事件。例如,样本数据属于领域A,则利用领域A对应的事件提取模型提取样本数据所包含的事件。
排列单元130,用于将每一条样本数据所包含的事件,按照事件发生时间的先后顺序排序得到事件序列。
以任一条样本数据为对象,将每一条样本数据所包含的事件按照发生时间的先后顺序排序,获得该样本数据对应的事件序列。遍历第一样本数据集合中的所有样本数据,获得每一条样本数据对应的事件序列。
图谱获取单元140,用于根据每一条样本数据对应的事件序列,得到不同事件类型之间的事件转移图谱。
在本申请的一个实施例中,根据第一样本数据集合中每一条样本数据所对应的事件序列,构建不同事件类型之间的拓扑图,得到事件转移图谱。
在本申请的一个优选实施例中,事件转移图谱还可以包括事件类型之间直接转移的转移概率信息。
在本申请的一个实施例中,图谱获取单元140获得包含转移概率信息的事件转移图谱的过程包括:
利用所述第一样本数据集合内全部样本数据对应的所述事件序列,构建不同事件类型之间的拓扑图,并统计所述第一样本数据集合内全部样本数据涉及的各种事件类型之间直接转移的转移概率;根据所述各种事件类型之间的转移概率及对应的拓扑图,得到所述事件转移图谱。
在本申请的一个实施例中,统计第一样本数据集合中全部样本数据涉及的各种事件类型之间直接转移的转移概率的过程可以包括:
统计第一样本数据集合中从当前事件类型直接转移到各个相邻事件类型的转移概率;遍历第一样本数据集合中的所有事件类型,得到第一样本数据集合所涉及的所有事件类型之间直接转移的转移概率。
在本申请的另一个实施例中,统计第一样本数据集合中从各个相邻事件类型直接转移到当前事件类型的转移概率;遍历第一样本数据集合中的所有事件类型,得到第一样本数据集合所涉及的所有事件类型之间直接转移的转移概率。
在本申请的一个实施例中,如图11所示,该装置还可以包括训练事件提取模型的相关单元:第二获取单元150和模型训练单元160。
第二获取单元150,用于获取属于同一领域的第二样本数据集合。
该第二样本数据集合中的每一条样本数据均包括至少一个事件的事件信息。
例如,在司法领域,一篇裁判文书就是第二样本数据集合中的一个样本数据。
获得属于同一领域的大量第二样本数据后,对样本所包含事件的事件要素进行标记,这些标记内容及样本中被标记的样本内容本身(例如,裁判文书中被标记的句子原文)都作为样本数据。
模型训练单元160,用于根据第二样本数据集合中全部样本数据所包含事件的事件信息,训练得到用于提取事件的事件提取模型。
根据第二样本数据中标记的信息在裁判文书中的位置及语句特征等与事件或行为之间的对应关系,进行机器学习训练,得到事件提取模型。
训练事件提取模型的过程,即,对于任意一个类型的事件,通过机器训练得到该事件对应的事件特征。利用该事件提取模型的过程就是利用事件特征从样本数据中提取相应的事件。
本实施例提供的生成事件转移图谱的装置,获取同一领域的第一样本数据集合,然后,利用事件提取模型提取该第一样本数据集合中每一条样本数据所包含的事件。将每一条样本数据所包含的事件,按照事件发生时间的先后顺序进行排序,得到该样本数据对应的事件序列;然后,根据第一样本集合中每一条样本数据的事件序列,得到不同事件类型之间的事件转移图谱。该装置能够从样本数据自动提取事件,并能够得到不同事件类型之间的转化关系获得事件转移图谱。从而实现跨样本数据分析不同事件之间的关系,而且根据样本数据自动生成事件转移图谱的效率高。
请参见图12,示出了本申请实施例另一种生成事件转移图谱的装置框图,该装置在图10所示实施例的基础上还可以包括:第三获取单元210;
第三获取单元210,用于获取所述第一样本数据集合中每一条样本数据所包含事件的事件要素。
其中,事件要素可以包括事件主体、事件发生时间、事件发生地点等。
在本申请的一个优选实施例中,对于一条样本数据中包含不同事件主体的应用场景,排列单元130具体用于:
将第一样本数据集合中每一条样本数据包含的各个事件区分为各个事件主体的事件,并将各个事件主体的事件分别按照事件发生时间的先后顺序排布,得到各个事件主体对应的事件序列。
例如,从一篇裁判文书中提取出的不同事件之后,如果一条样本数据涉及到多个事件主体,则可以从同一条样本数据所包含的所有事件按照事件主体分类,并针对不同的事件主体分别按照事件发生时间由先到后的顺序,得到各个事件主体对应的事件序列。
在排列单元获得各个事件主体所对应的事件序列的应用场景中,图谱获取单元140具体用于:
针对任一事件主体,利用第一样本数据集合中涉及的该事件主体对应的事件序列构建得到该事件主体对应的事件转移图谱;遍历第一样本数据集合中涉及的所有事件主体,得到第一样本数据集合涉及的全部事件转移图谱。
在本申请的优选实施例中,该装置还包括:第一展示单元220。
第一展示单元220,用于分别展示各个事件主体对应的事件序列,以便用户快速了解该样本数据所涉及的不同事件主体的所有事件。展示方式可以采用图8所示的方式,本申请并不限定。
在本申请的另一优选实施例中,该装置还可以包括:第四获取单元230和第二展示单元240;
第四获取单元230,用于根据事件转移图谱中不同事件类型之间直接转移的转移概率,获取从目标事件类型直接转移到其它事件类型的转移概率;
第二展示单元240,用于按照该转移概率由高到低的顺序显示目标事件类型对应的事件转移关系。
本实施例提供的生成事件转移图谱的装置,在利用事件提取模型提取得到样本中的事件后,还可以根据事件涉及的事件主体、事件发生时间、发生地点等事件要素,分别在不同的要素轴上展示,实现多维信息分离显示,使得事件之间的关系更直观。
所述生成事件转移图谱装置包括处理器和存储器,上述第一获取单元、提取单元、排列单元、图谱获取单元、第二获取单元、模型训练单元、第三获取单元、第一展示单元、第四获取单元和第二展示单元等均作为程序单元存储在存储器中,由处理器执行存储在存储器中的上述程序单元来实现相应的功能。
处理器中包含内核,由内核去存储器中调取相应的程序单元。内核可以设置一个或以上,通过调整内核参数来实现自动生成事件转移图谱。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM),存储器包括至少一个存储芯片。
本发明实施例提供了一种存储介质,其上存储有程序,该程序被处理器执行时实现所述生成事件转移图谱的方法。
本发明实施例提供了一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行所述生成事件转移图谱的方法。
本发明实施例提供了一种设备,设备包括处理器、存储器及存储在存储器上并可在处理器上运行的程序,处理器执行程序时实现以下步骤:
获取属于同一领域的第一样本数据集合,其中,该第一样本数据集合中的每一条样本数据包括至少一个事件;利用事件提取模型,提取该第一样本数据集合中每一条样本数据所包含的事件;将该每一条样本数据所包含的事件,按照事件发生时间的先后顺序排序得到事件序列;根据该每一条样本数据对应的事件序列,得到不同事件类型之间的事件转移图谱。
在本申请一种可能的实现方式中,处理器执行程序时还可以实现以下步骤:
获取属于同一领域的第二样本数据集合,该第二样本数据集中的每一条样本数据均包括至少一个事件的事件信息;根据该第二样本数据集合中全部样本数据所包含事件的事件信息,训练得到用于提取事件的事件提取模型。
在本申请一种可能的实现方式中,处理器在执行程序实现在提取该第一样本数据集合中每一条样本数据所包含的事件之后,还可以实现以下步骤:
获取该第一样本数据集合中每一条样本数据所包含事件的事件要素,该事件要素至少包括事件发生时间。
在本申请一种可能的实现方式中,该事件要素还包括事件主体;
该将每一条样本数据所包含的事件,按照事件发生时间的先后顺序排序得到事件序列,包括:
将该第一样本数据集合中每一条样本数据包含的各个事件区分为各个事件主体的事件,并将各个事件主体的事件分别按照事件发生时间的先后顺序排布,得到各个事件主体对应的事件序列。
在本申请一种可能的实现方式中,该事件转移图谱还包括不同的事件类型之间直接转移的转移概率;
该根据每一条样本数据对应的事件序列,得到不同该事件类型之间的事件转移图谱,包括:
利用该第一样本数据集合内全部样本数据对应的该事件序列,构建不同事件类型之间的拓扑图,并统计该第一样本数据集合内全部样本数据涉及的各种事件类型之间直接转移的转移概率;
根据该各种事件类型之间的转移概率及对应的拓扑图,得到该事件转移图谱。
在本申请一种可能的实现方式中,该统计第一样本数据集合内全部样本数据涉及的各种事件类型之间直接转移的转移概率,包括:
对于该第一样本数据集合内全部样本数据涉及的每种事件类型,执行以下操作:
分别统计从该事件类型直接转移到该事件类型的各种相邻事件类型的次数;
利用该事件类型直接转移到该各种相邻事件类型的次数,分别计算该事件类型直接转移到该各种相邻事件类型的转移概率。
在本申请一种可能的实现方式中,该统计第一样本数据集合内全部样本数据涉及的各种事件类型之间直接转移的转移概率,包括:
对于该第一样本数据集合内全部样本数据涉及的每种事件类型,执行以下操作:
分别统计从该事件类型的各种相邻事件类型直接转移到该事件类型的次数;
利用从该各种相邻事件类型直接转移到该事件类型的次数,分别计算从该各种相邻事件类型直接转移到该事件类型的转移概率。
其中,本文中的设备可以是服务器、PC、PAD、手机等。
本实施例提供的设备,获取同一领域的第一样本数据集合,然后,利用事件提取模型提取该第一样本数据集合中每一条样本数据所包含的事件。将每一条样本数据所包含的事件,按照事件发生时间的先后顺序进行排序,得到该样本数据对应的事件序列;然后,根据第一样本集合中每一条样本数据的事件序列,得到不同事件类型之间的事件转移图谱。该设备能够从样本数据自动提取事件,并能够得到不同事件类型之间的转化关系获得事件转移图谱。从而实现跨样本数据分析不同事件之间的关系,而且根据样本数据自动生成事件转移图谱的效率高。
本申请还提供了一种计算机程序产品,当在数据处理设备上执行时,适于执行初始化有如下方法步骤的程序:
获取属于同一领域的第一样本数据集合,其中,该第一样本数据集合中的每一条样本数据包括至少一个事件;利用事件提取模型,提取该第一样本数据集合中每一条样本数据所包含的事件;将该每一条样本数据所包含的事件,按照事件发生时间的先后顺序排序得到事件序列;根据该每一条样本数据对应的事件序列,得到不同事件类型之间的事件转移图谱。
在本申请一种可能的实现方式中,处理器执行程序时还可以实现以下步骤:
获取属于同一领域的第二样本数据集合,该第二样本数据集中的每一条样本数据均包括至少一个事件的事件信息;根据该第二样本数据集合中全部样本数据所包含事件的事件信息,训练得到用于提取事件的事件提取模型。
在本申请一种可能的实现方式中,处理器在执行程序实现在提取该第一样本数据集合中每一条样本数据所包含的事件之后,还可以实现以下步骤:
获取该第一样本数据集合中每一条样本数据所包含事件的事件要素,该事件要素至少包括事件发生时间。
在本申请一种可能的实现方式中,该事件要素还包括事件主体;
该将每一条样本数据所包含的事件,按照事件发生时间的先后顺序排序得到事件序列,包括:
将该第一样本数据集合中每一条样本数据包含的各个事件区分为各个事件主体的事件,并将各个事件主体的事件分别按照事件发生时间的先后顺序排布,得到各个事件主体对应的事件序列。
在本申请一种可能的实现方式中,该事件转移图谱还包括不同的事件类型之间直接转移的转移概率;
该根据每一条样本数据对应的事件序列,得到不同该事件类型之间的事件转移图谱,包括:
利用该第一样本数据集合内全部样本数据对应的该事件序列,构建不同事件类型之间的拓扑图,并统计该第一样本数据集合内全部样本数据涉及的各种事件类型之间直接转移的转移概率;
根据该各种事件类型之间的转移概率及对应的拓扑图,得到该事件转移图谱。
在本申请一种可能的实现方式中,该统计第一样本数据集合内全部样本数据涉及的各种事件类型之间直接转移的转移概率,包括:
对于该第一样本数据集合内全部样本数据涉及的每种事件类型,执行以下操作:
分别统计从该事件类型直接转移到该事件类型的各种相邻事件类型的次数;
利用该事件类型直接转移到该各种相邻事件类型的次数,分别计算该事件类型直接转移到该各种相邻事件类型的转移概率。
在本申请一种可能的实现方式中,该统计第一样本数据集合内全部样本数据涉及的各种事件类型之间直接转移的转移概率,包括:
对于该第一样本数据集合内全部样本数据涉及的每种事件类型,执行以下操作:
分别统计从该事件类型的各种相邻事件类型直接转移到该事件类型的次数;
利用从该各种相邻事件类型直接转移到该事件类型的次数,分别计算从该各种相邻事件类型直接转移到该事件类型的转移概率。
本实施例提供的计算机程序产品,获取同一领域的第一样本数据集合,然后,利用事件提取模型提取该第一样本数据集合中每一条样本数据所包含的事件。将每一条样本数据所包含的事件,按照事件发生时间的先后顺序进行排序,得到该样本数据对应的事件序列;然后,根据第一样本集合中每一条样本数据的事件序列,得到不同事件类型之间的事件转移图谱。该计算机程序产品能够从样本数据自动提取事件,并能够得到不同事件类型之间的转化关系获得事件转移图谱。从而实现跨样本数据分析不同事件之间的关系,而且根据样本数据自动生成事件转移图谱的效率高。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。存储器是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
以上仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。

Claims (7)

1.一种生成事件转移图谱的方法,其特征在于,包括:
获取属于同一领域的第一样本数据集合,其中,所述第一样本数据集合中的每一条样本数据包括至少一个事件;
利用事件提取模型,提取所述第一样本数据集合中每一条样本数据所包含的事件;
将所述每一条样本数据所包含的事件,按照事件发生时间的先后顺序排序得到事件序列;
根据所述每一条样本数据对应的事件序列,得到不同事件类型之间的事件转移图谱;
其中,所述事件转移图谱还包括不同的事件类型之间直接转移的转移概率;
所述根据每一条样本数据对应的事件序列,得到不同所述事件类型之间的事件转移图谱,包括:
利用所述第一样本数据集合内全部样本数据对应的所述事件序列,构建不同事件类型之间的拓扑图,并统计所述第一样本数据集合内全部样本数据涉及的各种事件类型之间直接转移的转移概率;
根据所述各种事件类型之间的转移概率及对应的拓扑图,得到所述事件转移图谱;
所述统计所述第一样本数据集合内全部样本数据涉及的各种事件类型之间直接转移的转移概率,包括:
分别统计从所述事件类型直接转移到所述事件类型的各种相邻事件类型的次数;
利用所述事件类型直接转移到所述各种相邻事件类型的次数,分别计算所述事件类型直接转移到所述各种相邻事件类型的转移概率;
分别统计从所述事件类型的各种相邻事件类型直接转移到所述事件类型的次数;
利用从所述各种相邻事件类型直接转移到所述事件类型的次数,分别计算从所述各种相邻事件类型直接转移到所述事件类型的转移概率;
根据P(e1,e2)=N(e1->e2)/N(e1),计算两个不同的事件类型之间直接转移的转移概率,其中,e1和e2为两个不同的事件类型,P(e1,e2)为e1直接转移到e2的转移概率,N(e1->e2)为在全部第一样本数据中e1直接转移到e2这种有向组合的次数,N(e1)为第一样本数据集合中e1这种事件类型的总数。
2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取属于同一领域的第二样本数据集合,所述第二样本数据集中的每一条样本数据均包括至少一个事件的事件信息;
根据所述第二样本数据集合中全部样本数据所包含事件的事件信息,训练得到用于提取事件的事件提取模型。
3.根据权利要求1所述的方法,其特征在于,在提取所述第一样本数据集合中每一条样本数据所包含的事件之后,所述方法还包括:
获取所述第一样本数据集合中每一条样本数据所包含事件的事件要素,所述事件要素至少包括事件发生时间。
4.根据权利要求3所述的方法,其特征在于,所述事件要素还包括事件主体;
所述将每一条样本数据所包含的事件,按照事件发生时间的先后顺序排序得到事件序列,包括:
将所述第一样本数据集合中每一条样本数据包含的各个事件区分为各个事件主体的事件,并将各个事件主体的事件分别按照事件发生时间的先后顺序排布,得到各个事件主体对应的事件序列。
5.一种生成事件转移图谱的装置,其特征在于,包括:
第一获取单元,用于获取属于同一领域的第一样本数据集合,其中,所述第一样本数据集合中的每一条样本数据包括至少一个事件;
提取单元,用于利用事件提取模型,提取所述第一样本数据集合中每一条样本数据所包含的事件;
排列单元,用于将所述每一条样本数据所包含的事件,按照事件发生时间的先后顺序排序得到事件序列;
图谱获取单元,用于根据所述每一条样本数据对应的事件序列,得到不同事件类型之间的事件转移图谱;
其中,所述事件转移图谱还包括不同的事件类型之间直接转移的转移概率;
所述根据每一条样本数据对应的事件序列,得到不同所述事件类型之间的事件转移图谱,包括:
利用所述第一样本数据集合内全部样本数据对应的所述事件序列,构建不同事件类型之间的拓扑图,并统计所述第一样本数据集合内全部样本数据涉及的各种事件类型之间直接转移的转移概率;
根据所述各种事件类型之间的转移概率及对应的拓扑图,得到所述事件转移图谱;
所述统计所述第一样本数据集合内全部样本数据涉及的各种事件类型之间直接转移的转移概率,包括:
分别统计从所述事件类型直接转移到所述事件类型的各种相邻事件类型的次数;
利用所述事件类型直接转移到所述各种相邻事件类型的次数,分别计算所述事件类型直接转移到所述各种相邻事件类型的转移概率;
分别统计从所述事件类型的各种相邻事件类型直接转移到所述事件类型的次数;
利用从所述各种相邻事件类型直接转移到所述事件类型的次数,分别计算从所述各种相邻事件类型直接转移到所述事件类型的转移概率;
根据P(e1,e2)=N(e1->e2)/N(e1),计算两个不同的事件类型之间直接转移的转移概率,其中,e1和e2为两个不同的事件类型,P(e1,e2)为e1直接转移到e2的转移概率,N(e1->e2)为在全部第一样本数据中e1直接转移到e2这种有向组合的次数,N(e1)为第一样本数据集合中e1这种事件类型的总数。
6.一种存储介质,其上存储有程序,其特征在于,所述程序被处理器执行时实现权利要求1至4任一项所述的生成事件转移图谱的方法。
7.一种处理器,所述处理器用于运行程序,其特征在于,所述程序运行时执行权利要求1至4任一项所述的生成事件转移图谱的方法。
CN201810195827.0A 2018-03-09 2018-03-09 生成事件转移图谱的方法及装置 Active CN110309313B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810195827.0A CN110309313B (zh) 2018-03-09 2018-03-09 生成事件转移图谱的方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810195827.0A CN110309313B (zh) 2018-03-09 2018-03-09 生成事件转移图谱的方法及装置

Publications (2)

Publication Number Publication Date
CN110309313A CN110309313A (zh) 2019-10-08
CN110309313B true CN110309313B (zh) 2022-04-22

Family

ID=68073842

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810195827.0A Active CN110309313B (zh) 2018-03-09 2018-03-09 生成事件转移图谱的方法及装置

Country Status (1)

Country Link
CN (1) CN110309313B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022000325A1 (zh) * 2020-06-30 2022-01-06 西门子股份公司 基于语义的因果事件概率分析方法、装置和系统

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101655849A (zh) * 2008-08-20 2010-02-24 中兴通讯股份有限公司 一种电子产品码信息服务数据的定义和存储方法
CN104794013A (zh) * 2015-03-20 2015-07-22 百度在线网络技术(北京)有限公司 定位系统运行状态、建立系统运行状态模型的方法及装置
CN106095928A (zh) * 2016-06-12 2016-11-09 国家计算机网络与信息安全管理中心 一种事件类型识别方法及装置
CN107506734A (zh) * 2017-08-28 2017-12-22 中国民航大学 一种群体突发异常事件检测与定位方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101655849A (zh) * 2008-08-20 2010-02-24 中兴通讯股份有限公司 一种电子产品码信息服务数据的定义和存储方法
CN104794013A (zh) * 2015-03-20 2015-07-22 百度在线网络技术(北京)有限公司 定位系统运行状态、建立系统运行状态模型的方法及装置
CN106095928A (zh) * 2016-06-12 2016-11-09 国家计算机网络与信息安全管理中心 一种事件类型识别方法及装置
CN107506734A (zh) * 2017-08-28 2017-12-22 中国民航大学 一种群体突发异常事件检测与定位方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
事理图谱:事件演化的规律和模式;李忠阳等;《哈工大SCIR》;20170515;1-5页 *

Also Published As

Publication number Publication date
CN110309313A (zh) 2019-10-08

Similar Documents

Publication Publication Date Title
CN109948641B (zh) 异常群体识别方法及装置
CN109299258B (zh) 一种舆情事件检测方法、装置及设备
CN109597856A (zh) 一种数据处理方法、装置、电子设备及存储介质
CN109190007B (zh) 数据分析方法及装置
CN110968654B (zh) 文本数据的地址类目确定方法、设备以及系统
CN111080304B (zh) 一种可信关系识别方法、装置及设备
CN107341220A (zh) 一种多源数据融合方法和装置
TW201923629A (zh) 資料處理方法及裝置
CN104077417A (zh) 社交网络中的人物标签推荐方法和系统
CN111143578A (zh) 基于神经网络抽取事件关系的方法、装置和处理器
WO2020063524A1 (zh) 一种法律文书的确定方法及系统
CN104850905A (zh) 一种基于机器学习的法律风险量化评估系统及其方法
CN111680506A (zh) 数据库表的外键映射方法、装置、电子设备和存储介质
CN112818162A (zh) 图像检索方法、装置、存储介质和电子设备
CN110263817B (zh) 一种基于用户账号的风险等级划分方法及装置
CN109492401B (zh) 一种内容载体风险检测方法、装置、设备及介质
CN106991090A (zh) 舆情事件实体的分析方法及装置
CN112363996B (zh) 用于建立电网知识图谱的物理模型的方法及系统和介质
CN110309313B (zh) 生成事件转移图谱的方法及装置
CN113837635A (zh) 风险检测处理方法、装置及设备
CN111259975B (zh) 分类器的生成方法及装置、文本的分类方法及装置
US11308130B1 (en) Constructing ground truth when classifying data
CN107577667B (zh) 一种实体词处理方法和装置
CN110427492A (zh) 生成关键词库的方法、装置和电子设备
CN110765100B (zh) 标签的生成方法、装置、计算机可读存储介质及服务器

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant