CN111782800A - 一种面向事件追溯的智能会议分析方法 - Google Patents
一种面向事件追溯的智能会议分析方法 Download PDFInfo
- Publication number
- CN111782800A CN111782800A CN202010612574.XA CN202010612574A CN111782800A CN 111782800 A CN111782800 A CN 111782800A CN 202010612574 A CN202010612574 A CN 202010612574A CN 111782800 A CN111782800 A CN 111782800A
- Authority
- CN
- China
- Prior art keywords
- conference
- data
- knowledge
- event
- extraction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000004458 analytical method Methods 0.000 title claims abstract description 48
- 238000000605 extraction Methods 0.000 claims description 64
- 238000000034 method Methods 0.000 claims description 30
- 239000013598 vector Substances 0.000 claims description 23
- 230000000007 visual effect Effects 0.000 claims description 21
- 238000012545 processing Methods 0.000 claims description 16
- 238000007499 fusion processing Methods 0.000 claims description 14
- 238000012216 screening Methods 0.000 claims description 14
- 230000004927 fusion Effects 0.000 claims description 13
- 238000003062 neural network model Methods 0.000 claims description 13
- 238000012549 training Methods 0.000 claims description 12
- 238000004140 cleaning Methods 0.000 claims description 9
- 238000007781 pre-processing Methods 0.000 claims description 9
- 238000002360 preparation method Methods 0.000 claims description 9
- 238000013507 mapping Methods 0.000 claims description 7
- 230000002194 synthesizing effect Effects 0.000 claims description 7
- 230000000694 effects Effects 0.000 claims description 6
- 238000013441 quality evaluation Methods 0.000 claims description 6
- 230000011218 segmentation Effects 0.000 claims description 6
- 230000006870 function Effects 0.000 claims description 4
- 238000012163 sequencing technique Methods 0.000 claims description 3
- 238000010276 construction Methods 0.000 abstract description 3
- 238000013473 artificial intelligence Methods 0.000 abstract description 2
- 230000000875 corresponding effect Effects 0.000 description 6
- 238000013461 design Methods 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 2
- 230000002457 bidirectional effect Effects 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000001303 quality assessment method Methods 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 238000013518 transcription Methods 0.000 description 1
- 230000035897 transcription Effects 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/34—Browsing; Visualisation therefor
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/10—Text processing
- G06F40/12—Use of codes for handling textual entities
- G06F40/126—Character encoding
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
- G06F40/295—Named entity recognition
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- General Health & Medical Sciences (AREA)
- Databases & Information Systems (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Animal Behavior & Ethology (AREA)
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Document Processing Apparatus (AREA)
Abstract
本发明涉及人工智能信息技术领域,具体的讲是一种面向事件追溯的智能会议分析方法,包括获取会议系统数据;构建知识图谱;利用知识图谱进行会议智能检索或会议事件追溯及分析,本发明与现有技术相比,提供一种面向时间追溯的智能会议分析方法,并且提供了一种多源异构数据的会议系统领域的知识图谱构建方法,可以灵活的针对不同类型的会议,从已有的开放百科知识库中抽取特定领域的知识,结合会议提供的文件数据等构建针对特定会议类型的知识图谱,同时所构建的知识图谱可以帮助提升会议纪要内容的准确率,提升检索结果的准确率,智能检索分析能可视化会议进度,人员任务落实情况等。
Description
技术领域
本发明涉及人工智能信息技术领域,具体的讲是一种面向事件追溯的智能会议分析方法。
背景技术
目前的智能会议系统大多关注语音识别、声纹识别、实时翻译以及单个会议文件中的简单检索,然而许多会议内容是多次会议整合的结果,彼此内容之间并没有形成关联连接,导致当前的会议系统无法进行会议事件的追溯。
而要进行会议时间追溯,就需要对会议内容进行关联,即需要构建会议领域的知识图谱。
为此构建一种会议领域的知识图谱并且利用该知识图谱建立面向事件追溯的智能会议分析方法是十分有必要的。
发明内容
本发明突破了现有技术的难题,提供了一种会议领域的知识图谱并且利用该知识图谱建立面向事件追溯的智能会议分析方法,达成帮助提升会议纪要内容的准确率,提升检索结果的准确率,以及在此基础上进行的事件追溯及智能检索的目的。
为了达到上述目的,本发明设计了一种面向事件追溯的智能会议分析方法,其特征在于:按照如下步骤进行分析:
S1获取会议系统数据;
S2构建知识图谱;
S3利用知识图谱进行会议智能检索或会议事件追溯及分析。
相应的,会议系统数据包括结构化数据、非结构化数据、半结构化数据中的一种或几种。
相应的,会议系统数据来自百科知识的补充连接数据、会议用户上传的文件数据、按照会议类型自行爬取的网站数据、会议过程中语音识别产生的文本数据中的一种或几种。
相应的,S2中构建知识图谱的步骤如下:
S21知识抽取:对获取的会议系统数据分别进行抽取处理,通过实体抽取和关系抽取获得原始知识,并根据会议开始前填写的会议人员名单、时间地点信息、语音识别得到的文本进行实体抽取后得到的内容进行会议事件抽取,形成可视化数据空间;
S22知识融合:对抽取的数据进行知识融合处理,把可视化数据空间映射到可视化对象,形成初级知识图谱,其中知识融合处理包括指代消解、实体消歧、实体连接中的一种或几种;
S23知识加工:进一步扩充初级知识图谱,并将每次会议得到的新数据加入知识图谱中进行知识图谱更新;其中扩充初级知识图谱的方式包括知识推理、质量评估、本体提取中的一种或几种。
相应的,S3中会议智能检索的具体方法为:输入检索项,根据输入文字动态优先显示已经在知识图谱中出现的实体以作为候选项,同时,针对近似自然语言的查询,根据知识图谱进行语义识别从而返回更准确的结果,并提供多种结果筛选及排序方式。
相应的,S3中会议事件追溯及分析的具体方法为:
S31对会议文本数据进行清理;
S32进行数据预处理,同时构建会议领域事件抽取数据集;
S33获得数据特征向量;
S34综合数据特征向量,使用神经网络模型获取句子编码和实体编码;
S35添加句子位置信息编码,再使用神经网络模型获取文档级别的句子编码和实体编码;
S36对S35获取的编码进行训练,输出触发词标记和实体类型标记;
S37结合句子位置信息编码,找到事件元素对应内容,完成事件追溯及分析。
相应的,S21中所述的抽取处理包括:结构化数据D2R直接映射;
非结构化数据按照顺序进行实体抽取、关系抽取、会议事件抽取;
半结构化数据则利用爬虫提取结构信息。
相应的,S31对会议文本数据进行清理的具体方式为:根据会议模板中的关键字进行段落筛选,减少无关信息干扰。
相应的,S32中数据预处理的具体方式为:对数据进行分句、分词、词性标注中的一种或几种处理。
相应的,S33中获得数据特征向量的具体方式为:预训练词嵌入获得词向量;
预训练实体类型嵌入获得实体向量;
通过使用该词语相对于句首词语的距离进行one-hot编码得到词语的位置特征向量。
进一步的,本发明设计了一种具有事件追溯功能的智能会议分析系统,其特征在于:包括数据准备模块,用于获取不同源的会议系统数据;
知识图谱构建模块,包括知识抽取单元、知识融合单元、知识加工单元,其中知识抽取单元用于对数据准备模块中获取的会议数据进行抽取,知识融合单元用于对多个源得到的数据进行融合,保证实体的一致性;知识加工单元用于扩充、更新知识图谱;
知识应用模块,包括智能检索单元和会议事件追溯分析单元,智能检索单元用于对会议数据通过知识图谱进行检索,并提供结果筛选及排序方式;会议事件追溯分析单元用于对抽取到的事件通过知识图谱进行可视化追溯,了解任务的进度情况与完成效果。
进一步的,本发明设计了一种计算机设备,其特征在于:包括处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为:可执行面向事件追溯的智能会议分析方法:
S1获取会议系统数据,包括结构化数据、非结构化数据、半结构化数据中的一种或几种;
S2构建知识图谱;
S3利用知识图谱进行会议智能检索或会议事件追溯及分析。
其中,会议系统数据来自百科知识的补充连接数据、会议用户上传的文件数据、按照会议类型自行爬取的网站数据、会议过程中语音识别产生的文本数据中的一种或几种。
其中,S2中构建知识图谱的步骤如下:
S21知识抽取:对获取的会议系统数据分别进行抽取处理,通过实体抽取和关系抽取获得原始知识,并根据会议开始前填写的会议人员名单、时间地点信息、语音识别得到的文本进行实体抽取后得到的内容进行会议事件抽取,形成可视化数据空间;
S22知识融合:对抽取的数据进行知识融合处理,把可视化数据空间映射到可视化对象,形成初级知识图谱,其中知识融合处理包括指代消解、实体消歧、实体连接中的一种或几种;
S23知识加工:进一步扩充初级知识图谱,并将每次会议得到的新数据加入知识图谱中进行知识图谱更新;其中扩充初级知识图谱的方式包括知识推理、质量评估、本体提取中的一种或几种。
其中,S3中会议智能检索的具体方法为:输入检索项,根据输入文字动态优先显示已经在知识图谱中出现的实体以作为候选项,同时,针对近似自然语言的查询,根据知识图谱进行语义识别从而返回更准确的结果,并提供多种结果筛选及排序方式。
其中,S3中会议事件追溯及分析的具体方法为:
S31对会议文本数据进行清理;
S32进行数据预处理,同时构建会议领域事件抽取数据集;
S33获得数据特征向量;
S34综合数据特征向量,使用神经网络模型获取句子编码和实体编码;
S35添加句子位置信息编码,再使用神经网络模型获取文档级别的句子编码和实体编码;
S36对S35获取的编码进行训练,输出触发词标记和实体类型标记;
S37结合句子位置信息编码,找到事件元素对应内容,完成事件追溯及分析。
进一步的,本发明设计了一种计算机可读存储介质,其特征在于:所述计算机可读存储介质内存储有计算机可执行指令,所述计算机可执行指令被处理器执行时,使得所述处理器执行如下步骤:S1获取会议系统数据,包括结构化数据、非结构化数据、半结构化数据中的一种或几种;
S2构建知识图谱;
S3利用知识图谱进行会议智能检索或会议事件追溯及分析。
其中,会议系统数据来自百科知识的补充连接数据、会议用户上传的文件数据、按照会议类型自行爬取的网站数据、会议过程中语音识别产生的文本数据中的一种或几种。
其中,S2中构建知识图谱的步骤如下:
S21知识抽取:对获取的会议系统数据分别进行抽取处理,通过实体抽取和关系抽取获得原始知识,并根据会议开始前填写的会议人员名单、时间地点信息、语音识别得到的文本进行实体抽取后得到的内容进行会议事件抽取,形成可视化数据空间;
S22知识融合:对抽取的数据进行知识融合处理,把可视化数据空间映射到可视化对象,形成初级知识图谱,其中知识融合处理包括指代消解、实体消歧、实体连接中的一种或几种;
S23知识加工:进一步扩充初级知识图谱,并将每次会议得到的新数据加入知识图谱中进行知识图谱更新;其中扩充初级知识图谱的方式包括知识推理、质量评估、本体提取中的一种或几种。
其中,S3中会议智能检索的具体方法为:输入检索项,根据输入文字动态优先显示已经在知识图谱中出现的实体以作为候选项,同时,针对近似自然语言的查询,根据知识图谱进行语义识别从而返回更准确的结果,并提供多种结果筛选及排序方式。
其中,S3中会议事件追溯及分析的具体方法为:
S31对会议文本数据进行清理;
S32进行数据预处理,同时构建会议领域事件抽取数据集;
S33获得数据特征向量;
S34综合数据特征向量,使用神经网络模型获取句子编码和实体编码;
S35添加句子位置信息编码,再使用神经网络模型获取文档级别的句子编码和实体编码;
S36对S35获取的编码进行训练,输出触发词标记和实体类型标记;
S37结合句子位置信息编码,找到事件元素对应内容,完成事件追溯及分析。
本发明与现有技术相比,提供一种面向时间追溯的智能会议分析方法,并且提供了一种多源异构数据的会议系统领域的知识图谱构建方法,可以灵活的针对不同类型的会议,从已有的开放百科知识库中抽取特定领域的知识,结合会议提供的文件数据等构建针对特定会议类型的知识图谱,同时所构建的知识图谱可以帮助提升会议纪要内容的准确率,提升检索结果的准确率,智能检索分析能可视化会议进度,人员任务落实情况等。
附图说明
图1为本发明一具体实施所述的一种面向事件追溯的智能会议分析方法的流程示意图。
图2为本发明一具体实施例所述的一种面向事件追溯的智能会议分析方法中构建知识图谱的流程示意图。
图3为本发明一具体实施例所述的一种面向事件追溯的智能会议分析方法中会议事件追溯及分析的流程示意图。
图4为本发明一具体实施例所述的一种具有事件追溯功能的智能会议分析系统的架构示意图。
具体实施方式
下面结合附图对本发明作进一步描述,但不作为对本发明的限定。
参见图1,在一个具体实施例中设计了一种面向事件追溯的智能会议分析方法,按照如下步骤进行分析:
S1获取会议系统数据,所述会议系统数据包括结构化数据、非结构化数据、半结构化数据中的一种或几种;
优选的,会议系统数据来自百科知识的补充连接数据、会议用户上传的文件数据、按照会议类型自行爬取的网站数据、会议过程中语音识别产生的文本数据中的一种或几种。
S2构建知识图谱;
S3利用知识图谱进行会议智能检索或会议事件追溯及分析。
在一具体实施例中,参见图2,优选的,构建知识图谱的步骤如下:
S21知识抽取:对数据准备模块中获取的各种异构数据分别进行抽取处理,通过实体抽取和关系抽取获得原始知识(例如:人员姓名、任务名称、会议文件、政策法规等),并根据会议开始前填写的会议人员名单、时间地点信息、语音识别得到的文本进行实体抽取后得到的内容进行会议事件抽取,形成可视化数据空间;
S22知识融合:对多个源得到的数据进行实体消歧和连接等知识融合处理,保证实体的一致性,把可视化数据空间映射到可视化对象,形成初级知识图谱,其中知识融合处理包括但不限于指代消解、实体消歧、实体连接中的一种或几种;
S23知识加工:使用知识推理等方式进一步扩充初级知识图谱,使得知识图谱更加智能,此外,每次会议得到的新数据加入知识图谱中进行知识图谱更新,主要是其中的会议事件实体更新;
优选的,其中扩充初级知识图谱的方式包括但不限于知识推理、质量评估、本体提取中的一种或几种。
在一具体实施例中,优选的,会议智能检索的具体方法为:输入检索项,根据输入文字动态优先显示已经在知识图谱中出现的实体以作为候选项,同时,针对近似自然语言的查询,根据知识图谱进行语义识别从而返回更准确的结果,并提供多种结果筛选及排序方式。
在一具体实施例中,优选的,会议事件追溯及分析是针对有过多次会议的事件,根据知识图谱中抽取到的事件,以可视化的方式返回该事件的事件,重要任务节点及完成情况等,随时了解任务进度和会议落实效果。
参见图3,其具体方法为:
S31对会议文本数据进行清理,由于会议语音转写得到的文本文件一般内容较多,首先根据会议模板中的关键字进行段落筛选,减少无关信息干扰;
S32进行数据预处理,即进行中文分词和词性标注等基础工作,同时手动构建针对会议领域的事件抽取数据集,会议事件抽取可以认为是一个事件表填充任务,将事件表的填写项目作为触发标记,根据填写值判断实体类型标记;
S33对分词后的结果使用word2vec模型进行词嵌入的训练(得到词向量),同时还有实体类型嵌入及词语位置特征向量的获得;
S34综合上述三种数据特征向量,通过使用双向GRU网络获取到句子编码和实体编码;
S35加入每个句子的位置信息编码,在通过一个GRU网络获取文档级别的实体和句子编码(对于重复的实体编码进行融合);
S36对S35获取的编码进行训练,输出触发词标记和实体类型标记;
S37根据GRU神经网络得到的结果和句子位置信息,使用模板匹配方法找到事件元素对应内容,完成事件追溯与分析。
优选的,S21中所述的抽取处理包括但不限于:结构化数据D2R直接映射;
非结构化数据按照顺序进行实体抽取、关系抽取、会议事件抽取;
半结构化数据则利用爬虫提取结构信息。
优选的,S31对会议文本数据进行清理的具体方式为:根据会议模板中的关键字进行段落筛选,减少无关信息干扰。
优选的,神经网络模型除了可以使用双向GRU网络模型,还可以使用其他任何可以达到相同目的相同效果的网络模型。
参见图4,本发明设计了一种具有事件追溯功能的智能会议分析系统,包括数据准备模块,用于获取不同源的会议系统数据;
知识图谱构建模块,包括知识抽取单元、知识融合单元、知识加工单元,其中知识抽取单元用于对数据准备模块中获取的会议数据进行抽取,知识融合单元用于对多个源得到的数据进行融合,保证实体的一致性;知识加工单元用于扩充、更新知识图谱;
知识应用模块,包括智能检索单元和会议事件追溯分析单元,智能检索单元用于对会议数据通过知识图谱进行检索,并提供结果筛选及排序方式;会议事件追溯分析单元用于对抽取到的事件通过知识图谱进行可视化追溯,了解任务的进度情况与完成效果。
在一具体实施例中,本发明还设计了一种计算机设备,包括处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为:可执行面向事件追溯的智能会议分析方法:获取会议系统数据,包括结构化数据、非结构化数据、半结构化数据中的一种或几种;之后构建知识图谱;最后利用知识图谱进行会议智能检索或会议事件追溯及分析。
其中,会议系统数据来自百科知识的补充连接数据、会议用户上传的文件数据、按照会议类型自行爬取的网站数据、会议过程中语音识别产生的文本数据中的一种或几种。
其中,构建知识图谱的步骤如下:
S21知识抽取:对获取的会议系统数据分别进行抽取处理,通过实体抽取和关系抽取获得原始知识,并根据会议开始前填写的会议人员名单、时间地点信息、语音识别得到的文本进行实体抽取后得到的内容进行会议事件抽取,形成可视化数据空间;
S22知识融合:对抽取的数据进行知识融合处理,把可视化数据空间映射到可视化对象,形成初级知识图谱,其中知识融合处理包括指代消解、实体消歧、实体连接中的一种或几种;
S23知识加工:进一步扩充初级知识图谱,并将每次会议得到的新数据加入知识图谱中进行知识图谱更新;其中扩充初级知识图谱的方式包括知识推理、质量评估、本体提取中的一种或几种。
其中,会议智能检索的具体方法为:输入检索项,根据输入文字动态优先显示已经在知识图谱中出现的实体以作为候选项,同时,针对近似自然语言的查询,根据知识图谱进行语义识别从而返回更准确的结果,并提供多种结果筛选及排序方式。
其中,会议事件追溯及分析的具体方法为:
S31对会议文本数据进行清理;
S32进行数据预处理,同时构建会议领域事件抽取数据集;
S33获得数据特征向量;
S34综合数据特征向量,使用神经网络模型获取句子编码和实体编码;
S35添加句子位置信息编码,再使用神经网络模型获取文档级别的句子编码和实体编码;
S36对S35获取的编码进行训练,输出触发词标记和实体类型标记;
S37结合句子位置信息编码,找到事件元素对应内容,完成事件追溯及分析。
在一具体实施例中,本发明还设计了一种计算机可读存储介质,该计算机可读存储介质内存储有计算机可执行指令,所述计算机可执行指令被处理器执行时,使得所述处理器执行如下方法:获取会议系统数据,包括结构化数据、非结构化数据、半结构化数据中的一种或几种;构建知识图谱;利用知识图谱进行会议智能检索或会议事件追溯及分析。
其中,会议系统数据来自百科知识的补充连接数据、会议用户上传的文件数据、按照会议类型自行爬取的网站数据、会议过程中语音识别产生的文本数据中的一种或几种。
其中,参见图2,构建知识图谱的步骤如下:
S21知识抽取:对获取的会议系统数据分别进行抽取处理,通过实体抽取和关系抽取获得原始知识,并根据会议开始前填写的会议人员名单、时间地点信息、语音识别得到的文本进行实体抽取后得到的内容进行会议事件抽取,形成可视化数据空间;
S22知识融合:对抽取的数据进行知识融合处理,把可视化数据空间映射到可视化对象,形成初级知识图谱,其中知识融合处理包括指代消解、实体消歧、实体连接中的一种或几种;
S23知识加工:进一步扩充初级知识图谱,并将每次会议得到的新数据加入知识图谱中进行知识图谱更新;其中扩充初级知识图谱的方式包括知识推理、质量评估、本体提取中的一种或几种。
其中,会议智能检索的具体方法为:输入检索项,根据输入文字动态优先显示已经在知识图谱中出现的实体以作为候选项,同时,针对近似自然语言的查询,根据知识图谱进行语义识别从而返回更准确的结果,并提供多种结果筛选及排序方式。
其中,参见图3,会议事件追溯及分析的具体方法为:
S31对会议文本数据进行清理;
S32进行数据预处理,同时构建会议领域事件抽取数据集;
S33获得数据特征向量;
S34综合数据特征向量,使用神经网络模型获取句子编码和实体编码;
S35添加句子位置信息编码,再使用神经网络模型获取文档级别的句子编码和实体编码;
S36对S35获取的编码进行训练,输出触发词标记和实体类型标记;
S37结合句子位置信息编码,找到事件元素对应内容,完成事件追溯及分析。
以某大型公司开内部会议的场景为例:首先使用语音识别的方式将会议内容转为文本信息,结合会议识别文本、会议人员上传的相关文件以及网络爬取的会议主题相关的内容构建特定主题或特定领域的知识图谱,主要抽取会议主题,会议内容,关键任务,进度安排等与会议事件相关的实体,构成会议知识图谱。这样,针对同一主题的多次会议,就可以利用知识图谱进行相关会议内容的自动关联,帮助更好的分析会议关键内容及检索会议主题信息,明确会议任务落实情况和会议精神传达,提高会议的有效性。
本发明将知识图谱应用于智能会议中进行事件追溯和检索,更加高效、智能以及人性化。同时设计了一种新型的用于会议系统特定场景的事件抽取算法,利用触发词和词嵌入等特征及循环神经网络,实现会议事件抽取。还利用知识图谱解决智能会议系统中会议进度难追溯,会议效果难落实以及会议信息管理不善的问题。
本领域普通技术人员可以理解上述实施例方法中的全部或部分流程,是可以通过计算机程序指令相关的硬件来完成,所述程序可存储于一个计算机可读存储介质中,如本发明的实施例中,该程序可存储于计算机系统的存储介质中,并被该计算机系统中的至少一个处理器执行,以实现包括如上述各方法的实施例的流程。其中所述存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)或随机存储记忆体(Random AccessMemory,RAM)等。
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本发明的范围限制,应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。
Claims (13)
1.一种面向事件追溯的智能会议分析方法,其特征在于:按照如下步骤进行分析:
S1获取会议系统数据;
S2构建知识图谱;
S3利用知识图谱进行会议智能检索或会议事件追溯及分析。
2.根据权利要求1所述的一种面向事件追溯的智能会议分析方法,其特征在于:所述的会议系统数据包括结构化数据、非结构化数据、半结构化数据中的一种或几种。
3.根据权利要求2所述的一种面向事件追溯的智能会议分析方法,其特征在于:所述的会议系统数据来自百科知识的补充连接数据、会议用户上传的文件数据、按照会议类型自行爬取的网站数据、会议过程中语音识别产生的文本数据中的一种或几种。
4.根据权利要求1所述的一种面向事件追溯的智能会议分析方法,其特征在于:S2中构建知识图谱的步骤如下:
S21知识抽取:对获取的会议系统数据分别进行抽取处理,通过实体抽取和关系抽取获得原始知识,并根据会议开始前填写的会议人员名单、时间地点信息、语音识别得到的文本进行实体抽取后得到的内容进行会议事件抽取,形成可视化数据空间;
S22知识融合:对抽取的数据进行知识融合处理,把可视化数据空间映射到可视化对象,形成初级知识图谱,其中知识融合处理包括指代消解、实体消歧、实体连接中的一种或几种;
S23知识加工:进一步扩充初级知识图谱,并将每次会议得到的新数据加入知识图谱中进行知识图谱更新;其中扩充初级知识图谱的方式包括知识推理、质量评估、本体提取中的一种或几种。
5.根据权利要求1所述的一种面向事件追溯的智能会议分析方法,其特征在于:S3中会议智能检索的具体方法为:输入检索项,根据输入文字动态优先显示已经在知识图谱中出现的实体以作为候选项,同时,针对近似自然语言的查询,根据知识图谱进行语义识别从而返回更准确的结果,并提供多种结果筛选及排序方式。
6.根据权利要求1所述的一种面向事件追溯的智能会议分析方法,其特征在于:S3中会议事件追溯及分析的具体方法为:
S31对会议文本数据进行清理;
S32进行数据预处理,同时构建会议领域事件抽取数据集;
S33获得数据特征向量;
S34综合数据特征向量,使用神经网络模型获取句子编码和实体编码;
S35添加句子位置信息编码,再使用神经网络模型获取文档级别的句子编码和实体编码;
S36对S35获取的编码进行训练,输出触发词标记和实体类型标记;
S37结合句子位置信息编码,找到事件元素对应内容,完成事件追溯及分析。
7.根据权利要求4所述的一种面向事件追溯的智能会议分析方法,其特征在于:S21中所述的抽取处理包括:结构化数据D2R直接映射;
非结构化数据按照顺序进行实体抽取、关系抽取、会议事件抽取;
半结构化数据则利用爬虫提取结构信息。
8.根据权利要求6所述的一种面向事件追溯的智能会议分析方法,其特征在于:S31对会议文本数据进行清理的具体方式为:根据会议模板中的关键字进行段落筛选,减少无关信息干扰。
9.根据权利要求6所述的一种面向事件追溯的智能会议分析方法,其特征在于:S32中数据预处理的具体方式为:对数据进行分句、分词、词性标注中的一种或几种处理。
10.根据权利要求6所述的一种面向事件追溯的智能会议分析方法,其特征在于:S33中获得数据特征向量的具体方式为:预训练词嵌入获得词向量;
预训练实体类型嵌入获得实体向量;
通过使用该词语相对于句首词语的距离进行one-hot编码得到词语的位置特征向量。
11.一种具有事件追溯功能的智能会议分析系统,其特征在于:包括数据准备模块,用于获取不同源的会议系统数据;
知识图谱构建模块,包括知识抽取单元、知识融合单元、知识加工单元,其中知识抽取单元用于对数据准备模块中获取的会议数据进行抽取,知识融合单元用于对多个源得到的数据进行融合,保证实体的一致性;知识加工单元用于扩充、更新知识图谱;
知识应用模块,包括智能检索单元和会议事件追溯分析单元,智能检索单元用于对会议数据通过知识图谱进行检索,并提供结果筛选及排序方式;会议事件追溯分析单元用于对抽取到的事件通过知识图谱进行可视化追溯,了解任务的进度情况与完成效果。
12.一种计算机设备,其特征在于:包括处理器;
用于存储处理器可执行指令的存储器;
其中,所述处理器被配置为:可执行权利要求1-10任一项所述的方法。
13.一种计算机可读存储介质,其特征在于:所述计算机可读存储介质内存储有计算机可执行指令,所述计算机可执行指令被处理器执行时,使得所述处理器执行权利要求1-10中任一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010612574.XA CN111782800B (zh) | 2020-06-30 | 2020-06-30 | 一种面向事件追溯的智能会议分析方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010612574.XA CN111782800B (zh) | 2020-06-30 | 2020-06-30 | 一种面向事件追溯的智能会议分析方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN111782800A true CN111782800A (zh) | 2020-10-16 |
CN111782800B CN111782800B (zh) | 2023-11-21 |
Family
ID=72761398
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010612574.XA Active CN111782800B (zh) | 2020-06-30 | 2020-06-30 | 一种面向事件追溯的智能会议分析方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111782800B (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112487197A (zh) * | 2020-11-06 | 2021-03-12 | 中科云谷科技有限公司 | 基于会议记录构建知识图谱的方法、装置及处理器 |
CN113127633A (zh) * | 2021-06-17 | 2021-07-16 | 平安科技(深圳)有限公司 | 智能会议管理方法、装置、计算机设备及存储介质 |
CN113256262A (zh) * | 2021-06-04 | 2021-08-13 | 上海明略人工智能(集团)有限公司 | 会议纪要的自动生成方法、系统、存储介质及电子设备 |
CN116304109A (zh) * | 2023-03-30 | 2023-06-23 | 上海云思智慧信息技术有限公司 | 基于会议知识图谱的检索方法、系统、介质及电子设备 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140195884A1 (en) * | 2012-06-11 | 2014-07-10 | International Business Machines Corporation | System and method for automatically detecting and interactively displaying information about entities, activities, and events from multiple-modality natural language sources |
CN109885698A (zh) * | 2019-02-13 | 2019-06-14 | 北京航空航天大学 | 一种知识图谱构建方法及装置、电子设备 |
CN110489565A (zh) * | 2019-08-15 | 2019-11-22 | 广州拓尔思大数据有限公司 | 基于领域知识图谱本体中的对象根类型设计方法及系统 |
CN110717018A (zh) * | 2019-04-15 | 2020-01-21 | 中国石油大学(华东) | 一种基于知识图谱的工业设备故障维修问答系统 |
CN111079430A (zh) * | 2019-10-21 | 2020-04-28 | 国家电网公司华中分部 | 一种组合深度学习和概念图谱的电力故障事件抽取方法 |
CN111222305A (zh) * | 2019-12-17 | 2020-06-02 | 共道网络科技有限公司 | 一种信息结构化方法和装置 |
-
2020
- 2020-06-30 CN CN202010612574.XA patent/CN111782800B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20140195884A1 (en) * | 2012-06-11 | 2014-07-10 | International Business Machines Corporation | System and method for automatically detecting and interactively displaying information about entities, activities, and events from multiple-modality natural language sources |
CN109885698A (zh) * | 2019-02-13 | 2019-06-14 | 北京航空航天大学 | 一种知识图谱构建方法及装置、电子设备 |
CN110717018A (zh) * | 2019-04-15 | 2020-01-21 | 中国石油大学(华东) | 一种基于知识图谱的工业设备故障维修问答系统 |
CN110489565A (zh) * | 2019-08-15 | 2019-11-22 | 广州拓尔思大数据有限公司 | 基于领域知识图谱本体中的对象根类型设计方法及系统 |
CN111079430A (zh) * | 2019-10-21 | 2020-04-28 | 国家电网公司华中分部 | 一种组合深度学习和概念图谱的电力故障事件抽取方法 |
CN111222305A (zh) * | 2019-12-17 | 2020-06-02 | 共道网络科技有限公司 | 一种信息结构化方法和装置 |
Non-Patent Citations (1)
Title |
---|
熊蕊;吴晨生;赵桂芬;: "人物相关会议信息抽取系统设计及实现", 情报杂志, no. 07 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112487197A (zh) * | 2020-11-06 | 2021-03-12 | 中科云谷科技有限公司 | 基于会议记录构建知识图谱的方法、装置及处理器 |
CN113256262A (zh) * | 2021-06-04 | 2021-08-13 | 上海明略人工智能(集团)有限公司 | 会议纪要的自动生成方法、系统、存储介质及电子设备 |
CN113127633A (zh) * | 2021-06-17 | 2021-07-16 | 平安科技(深圳)有限公司 | 智能会议管理方法、装置、计算机设备及存储介质 |
CN116304109A (zh) * | 2023-03-30 | 2023-06-23 | 上海云思智慧信息技术有限公司 | 基于会议知识图谱的检索方法、系统、介质及电子设备 |
Also Published As
Publication number | Publication date |
---|---|
CN111782800B (zh) | 2023-11-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111782800B (zh) | 一种面向事件追溯的智能会议分析方法 | |
CN108804521B (zh) | 一种基于知识图谱的问答方法及农业百科问答系统 | |
CN111639171B (zh) | 一种知识图谱问答方法及装置 | |
CN111026842B (zh) | 自然语言处理方法、自然语言处理装置及智能问答系统 | |
CN110990590A (zh) | 一种基于强化学习和迁移学习的动态金融知识图谱构建方法 | |
CN111475623A (zh) | 基于知识图谱的案件信息语义检索方法及装置 | |
CN110717034A (zh) | 一种本体构建方法及装置 | |
CN105930452A (zh) | 一种识别自然语言的智能应答方法 | |
CN109947952B (zh) | 基于英语知识图谱的检索方法、装置、设备及存储介质 | |
CN109710935B (zh) | 一种基于文物知识图谱的博物馆导览与知识推荐方法 | |
CN109325040B (zh) | 一种faq问答库泛化方法、装置及设备 | |
CN111625658A (zh) | 基于知识图谱的语音交互方法、装置、设备及存储介质 | |
CN105787134B (zh) | 智能问答方法、装置及系统 | |
CN110347810B (zh) | 对话式检索回答方法、装置、计算机设备及存储介质 | |
CN113821605B (zh) | 一种事件抽取方法 | |
CN112256939A (zh) | 一种针对化工领域的文本实体关系抽取方法 | |
CN111831794A (zh) | 一种基于知识图谱的综合管廊行业知识问答系统构建方法 | |
CN112163097A (zh) | 一种军事知识图谱构建方法及系统 | |
CN113515589A (zh) | 数据推荐方法、装置、设备以及介质 | |
CN112115252A (zh) | 智能辅助写作处理方法、装置、电子设备及存储介质 | |
CN111209753A (zh) | 一种实体命名识别方法及装置 | |
CN115599899A (zh) | 基于飞行器知识图谱的智能问答方法、系统、设备及介质 | |
CN116227466A (zh) | 一种语义不同措辞相似的句子生成方法、装置及设备 | |
CN114281972A (zh) | 基于主体对象跟踪和认知推理的对话控制方法、系统存储介质和服务器 | |
CN113449066A (zh) | 利用知识图谱来存储文物数据的方法、处理器及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |