CN112966493A - 一种知识图谱构建方法及系统 - Google Patents
一种知识图谱构建方法及系统 Download PDFInfo
- Publication number
- CN112966493A CN112966493A CN202110179910.0A CN202110179910A CN112966493A CN 112966493 A CN112966493 A CN 112966493A CN 202110179910 A CN202110179910 A CN 202110179910A CN 112966493 A CN112966493 A CN 112966493A
- Authority
- CN
- China
- Prior art keywords
- identification information
- statement
- video stream
- knowledge graph
- audio stream
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000010276 construction Methods 0.000 title claims abstract description 16
- 238000000034 method Methods 0.000 claims abstract description 43
- 238000012545 processing Methods 0.000 claims abstract description 30
- 230000000295 complement effect Effects 0.000 claims abstract description 17
- 238000000354 decomposition reaction Methods 0.000 claims abstract description 10
- 230000015654 memory Effects 0.000 claims description 25
- 230000008569 process Effects 0.000 claims description 14
- 238000004458 analytical method Methods 0.000 claims description 10
- 230000006870 function Effects 0.000 description 23
- 230000009471 action Effects 0.000 description 4
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000013461 design Methods 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000012552 review Methods 0.000 description 3
- 230000003068 static effect Effects 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 238000004590 computer program Methods 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 238000003491 array Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 238000009960 carding Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000001360 synchronised effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/211—Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/20—Education
- G06Q50/205—Education administration or guidance
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Business, Economics & Management (AREA)
- General Health & Medical Sciences (AREA)
- General Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- Educational Technology (AREA)
- Tourism & Hospitality (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Artificial Intelligence (AREA)
- Educational Administration (AREA)
- Computational Linguistics (AREA)
- Strategic Management (AREA)
- General Engineering & Computer Science (AREA)
- Economics (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Primary Health Care (AREA)
- General Business, Economics & Management (AREA)
- Two-Way Televisions, Distribution Of Moving Picture Or The Like (AREA)
Abstract
本申请涉及一种知识图谱构建方法及系统,方法包括响应于获取到的音频流或者视频流,将音频流或者视频流转化为语句;对语句的组成进行分解,分解的内容包括定语、主语、状语、谓语、宾语和补语;根据分解结果,解析语句的含义并定位其中的识别信息,识别信息的数量为多个,识别信息包括主语和/或宾语;解析语句的含义并定位其中的关联信息,关联信息包括定语、状语、谓语和补语;根据关联信息建立各识别信息之间的连接关系以及根据识别信息及各识别信息之间的连接关系建立知识图谱;其中,对于相同的识别信息,进行合并处理。本申请可以对视频或者录音的内容进行梳理,将其重点内容和各部分之间的联系以图谱的形式体现出来。
Description
技术领域
本申请涉及数据处理技术领域,尤其是涉及一种知识图谱构建方法及系统。
背景技术
老师在讲课过程中,可以对讲课内容进行录音或者录像,方便学生进行课下再学习,但是这些音频或者视频缺乏整体性的概括,无法体现讲课的重点内容和各部分之间的联系。
发明内容
本申请提供一种知识图谱构建方法及系统,可以对视频或者录音的内容进行梳理,将其重点内容和各部分之间的联系以图谱的形式体现出来。
第一方面,本申请提供了一种知识图谱构建方法,包括:
响应于获取到的音频流或者视频流,将音频流或者视频流转化为语句;
对语句的组成进行分解,分解的内容包括定语、主语、状语、谓语、宾语和补语;
根据分解结果,解析语句的含义并定位其中的识别信息,识别信息的数量为多个,识别信息包括主语和/或宾语;
解析语句的含义并定位其中的关联信息,关联信息包括定语、状语、谓语和补语;
根据关联信息建立各识别信息之间的连接关系;以及
根据识别信息及各识别信息之间的连接关系建立知识图谱;
其中,对于相同的识别信息,进行合并处理。
通过采用上述技术方案,可以将音频或者视频的主要内容及各部分之间的联系筛选出来,并以知识图谱的方式体现出来,通过这个知识图谱,可以快速了解音频或者视频的组成,方便学生进行针对性的复习,也方便老师进行总结。
在第一方面的一种可能的实现方式中,所述音频流或者视频流的数量为多个;
对于出现在不同的音频流或者视频流中的相同的识别信息,进行合并处理。
通过采用上述技术方案,可以将多个音频流或者视频流进行整理,方便学生进行针对性的复习,也方便老师进行总结。
在第一方面的一种可能的实现方式中,所述连接关系包括平行关系和层级关系,在平行关系中,识别信息间不存在直接的连接关系,在层级关系中,识别信息间存在直接的连接关系。
通过采用上述技术方案,限制了连接关系的种类,能够使知识图谱的组成更加简洁。
在第一方面的一种可能的实现方式中,还包括:
对获取到的音频流或者视频流进行编号;
记录每个识别信息的地址,地址包括该识别信息出现的音频流或者视频流的编号及其在音频流或者视频流中出现的时间;以及
将地址关联到知识图谱中与之对应的识别信息上。
通过采用上述技术方案,可以通过识别信息找到对应的音频流或者视频流,方便用户进行快速定位。
第二方面,本申请提供了一种知识图谱构建装置,包括:
第一处理单元,用于响应于获取到的音频流或者视频流,将音频流或者视频流转化为语句;
第二处理单元,用于对语句的组成进行分解,分解的内容包括定语、主语、状语、谓语、宾语和补语;
第一解析单元,用于根据分解结果,解析语句的含义并定位其中的识别信息,识别信息的数量为多个,识别信息包括主语和/或宾语;
第二解析单元,用于解析语句的含义并定位其中的关联信息,关联信息包括定语、状语、谓语和补语;
第三处理单元,用于根据关联信息建立各识别信息之间的连接关系;以及
第四处理单元,用于根据识别信息及各识别信息之间的连接关系建立知识图谱,对于相同的识别信息,进行合并处理。
在第二方面的一种可能的实现方式中,所述音频流或者视频流的数量为多个;
对于出现在不同的音频流或者视频流中的相同的识别信息,进行合并处理。
在第二方面的一种可能的实现方式中,所述连接关系包括平行关系和层级关系,在平行关系中,识别信息间不存在直接的连接关系,在层级关系中,识别信息间存在直接的连接关系。
在第二方面的一种可能的实现方式中,还包括:
编号单元,用于对获取到的音频流或者视频流进行编号;
记录单元,用于记录每个识别信息的地址,地址包括该识别信息出现的音频流或者视频流的编号及其在音频流或者视频流中出现的时间;以及
关联单元,用于将地址关联到知识图谱中与之对应的识别信息上。
第三方面,本申请提供了一种显示内容识别系统,所述系统包括:
一个或多个存储器,用于存储指令;以及
一个或多个处理器,用于从所述存储器中调用并运行所述指令,执行如第一方面及第一方面任意可能的实现方式中所述的知识图谱构建方法。
第四方面,本申请提供了一种计算机可读存储介质,所述计算机可读存储介质包括:
程序,当所述程序被处理器运行时,如第一方面及第一方面任意可能的实现方式中所述的知识图谱构建方法被执行。
第五方面,本申请提供了一种计算机程序产品,包括程序指令,当所述程序指令被计算设备运行时,如第一方面及第一方面任意可能的实现方式中所述的知识图谱构建方法被执行。
第六方面,本申请提供了一种芯片系统,该芯片系统包括处理器,用于实现上述各方面中所涉及的功能,例如,生成,接收,发送,或处理上述方法中所涉及的数据和/或信息。
该芯片系统,可以由芯片构成,也可以包括芯片和其他分立器件。
在一种可能的设计中,该芯片系统还包括存储器,该存储器,用于保存必要的程序指令和数据。该处理器和该存储器可以解耦,分别设置在不同的设备上,通过有线或者无线的方式连接,或者处理器和该存储器也可以耦合在同一个设备上。
附图说明
图1是本申请实施例提供的一种对音频流或者视频流进行转化、分解和解析的过程示意框图。
图2是本申请实施例提供的一种知识图谱的结构示意框图。
图3基于图2给出的另一种知识图谱的结构示意框图。
具体实施方式
以下结合附图,对本申请中的技术方案作进一步详细说明。
本申请实施例展示的知识图谱构建方法,主要目的是对老师的讲课内容进行梳理,一方面方便学生进行针对性的复习,另一方面也方面老师进行梳理和总结。
以一个具体的场景为例,老师依据教学大纲等参考内容准备课程,但是考虑到不同人的理解情况和讲课当中出现的实际,会出现实际的讲课内容与教学大纲等存在偏离的情况;从学生的角度看,其理解能力也是不同的,对于讲课内容,可能出现部分理解的情况,在没有引导的情况下,也很难抓住重点和难点。
请参阅图1和图2,为本申请实施例公开的一种知识图谱构建方法,该方法主要包括以下步骤:
S101,响应于获取到的音频流或者视频流,将音频流或者视频流转化为语句;
S102,对语句的组成进行分解,分解的内容包括定语、主语、状语、谓语、宾语和补语;
S103,根据分解结果,解析语句的含义并定位其中的识别信息,识别信息的数量为多个,识别信息包括主语和/或宾语;
S104,解析语句的含义并定位其中的关联信息,关联信息包括定语、状语、谓语和补语;
S105,根据关联信息建立各识别信息之间的连接关系;以及
S106,根据识别信息及各识别信息之间的连接关系建立知识图谱;
其中,对于相同的识别信息,进行合并处理。
本申请实施例展示的知识图谱构建方法,可以应用于一台服务器、电脑、手机或者其他的类似终端上,讲课内容以视频或者音频的方式存储,然后发送给本申请实施例展示的知识图谱构建方法存在的终端上,终端对讲课内容的视频或者音频进行分析和处理后,将讲课内容以知识图谱的方式呈现出来。
具体的说,在步骤S101中,响应于获取到的音频流或者视频流,终端会将音频流或者视频流转化为语句,然后再进行后续的分析过程。
应理解,视频流由图像流和音频流两部分组成,图像流提供的是影像,音频流提供的是声音,对于视频流而言,可以将其中的音频流分离出来再进行处理。
还应理解,音频流的是文字的一种体现形式,对于获取到的音频流,可以使用语音识别加文字转换的方式进行处理,转换完成后,进行后续的处理步骤。
在步骤S102中,会对语句的组成进行分解,分解的内容包括定语、主语、状语、谓语、宾语和补语,分解的目的是理解语句所要表达的意思。
对于在步骤S101中的文字,其是由语句组成的,对于这些语句,机器根本无法直接进行理解,需要借助分析工具才能理解语句所要表达的意思。对于语句而言,可以将其分为六个部分,分别是定语、主语、状语、谓语、宾语和补语,具体解释如下:
主语即“动作的发出者”(主谓宾结构中)或者“表述的对象”(主系表结构中),一般放在句首,有时也放在中间或者句尾。充当主语的可以是名词、代词;也可以是短语、不定式;甚至可以是整个句子。
谓语是句子的灵魂,主要用来“陈述主语的状态”或者“表明主语发出的动作”。
宾语与主语相对,表示动作的承受者。名词、代词、数词以及句子都可以做宾语(宾语从句)。
定语就是为了限定句中某个的成分。形容词、数词、代词、从句(定语从句)等成分基本都可以做定语(动词除外)。定语在所修饰的词前,就被称为前置定语;反之,则为后置定语。
状语的作用是传递和修饰,传递的信息包括:时间、地点、原因、目的、结果、方式、程度等,其使用的目的就是使表达更为丰满、具体。
表语主要用来解释说明主语的性质、状态、特性等。
通过对语句的分解,就可以将其中的主要信息找到,以几个具体的例子来讲:
第一个,“今天我们讲的是三角函数”,在这句话中,主语是 “我们”,谓语是“讲”,宾语是“三角函数”,从关联性的角度看,这句话中最重要的信息就是“三角函数”。
第二个,“三角函数包括正弦函数、余玄函数和正切函数”,在这句话中,主语是“三角函数”,谓语是“包括”,宾语是“正弦函数、余玄函数和正切函数”,从关联性的角度看,这句话中最重要的信息就是“三角函数”与“正弦函数、余玄函数和正切函数”。
通过上述两个举例可以看到,通过对语句的组成进行拆解和分析,就可以得到用于制作知识图谱的关键信息。
对语句的结构进行分解后,执行步骤S103和步骤S104,在步骤S103中,解析语句的含义并定位其中的识别信息,识别信息的数量为多个,识别信息包括主语和/或宾语;而在步骤S104中,会解析语句的含义并定位其中的关联信息,关联信息包括定语、状语、谓语和补语。
通过步骤S103和步骤S104,就可以将转换完成的文字中的关键信息筛选出来,同时各关键信息之间的关系也能够进行判断,筛选出来的关键信息称之为识别信息,识别信息之间的关系信息称为关联信息。
应理解,对于一节课而言,除了这些关键信息之外,还存在大量的其他信息,例如讲解习题和提问环节等,这些信息就可以直接忽略掉。
在一些可能的实现方式中,可以使用筛选的方式,例如对于关键信息,可以设置一个关键信息数据库,通过对比的方式进行筛选,对于关联信息,也可以采用这种方式进行处理。
在另一些可能的实现方式中,使用神经网络语言模型进行分析。
接着执行步骤S105,在该步骤中,根据关联信息建立各识别信息之间的连接关系,目的是将离散的识别信息连接起来,使之能够组成一个类似于网络的结构并呈现出来。
应理解,经过前面的分解和解析后,能够得到多个识别信息,但是这些识别信息是离散的,类似于信息孤岛,无法使用,当使用关联信息将其连接起来时,识别信息的连接关系就会变得明确。
并且,关联信息也是随着识别信息一同出现的,例如在上面给出的例子中,关联信息和识别信息出现在了同一个句子中,因此,可以轻易地根据关联信息建立起识别信息之间的关系。
最后执行步骤S106,在该步骤中,会根据识别信息及各识别信息之间的连接关系建立知识图谱,也就是对于步骤S101至步骤S105中的内容,会以知识图谱的形式体现出来。
同时,为了使知识图谱的体现形式更加简洁,对于相同的识别信息,需要进行合并处理,继续以上面两个例子进行说明,在整个视频流或者音频流中, “三角函数”出现了很多次,但是对于知识图谱而言,仅需要记录一次就够了,因为知识图谱更多的是反映一个框架,而不是完整的内容,将相同的识别信息进行合并后,可以使知识图谱更加清晰和简洁。
对于学生而言,可以使用知识图谱了解视频流或者音频流中的主要内容,能够根据自己的实际情况确定哪些内容理解了,哪些内容没有理解,或者哪些内容遗漏了,没有注意到。
对于老师而言,可以通过知识图谱来对自己讲课的内容进行梳理,例如可以发现哪些内容讲到了,哪些内容没有讲到,或者哪部分出现了遗漏等,便于调整和完善教案,及时发现教学内容中的优缺点。
整体而言,本申请实施例展示的知识图谱构建方法,能够将老师讲课过程中产生的音频流和视频流的内容进行梳理,并将梳理的内容以知识图谱的形式体现出来,一方面,方便学生进行查漏补缺,另一方面,也方便老师对自己的教案进行调整和完善,起到提高讲课效果的作用。
作为申请提供的知识图谱构建方法的一种具体实施方式,所述音频流或者视频流的数量为多个,对于出现在不同的音频流或者视频流中的相同的识别信息,进行合并处理。
在该方式中,可以对多个音频流或者视频流进行处理,例如一个星期或者一个月的课程,都能够进行框架的梳理,然后用知识图谱的方式体现出来,相比于单个的音频流或者视频流的处理,这种方式的体现明显更加合适。因为对于一个老师而言,其讲课的内容应当是连续的。
通过这样的处理方式,能够使知识图谱中包含更多的内容,进行更加全面的反映。
在处理过程中,因为会得到多个识别信息,当两个音频流或者视频流中出现了同一个识别信息时,就能够通过这两个识别信息将这两个音频流或者视频流关联起来。
同样的,在关联过程中,对于出现在不同的音频流或者视频流中的识别信息,也要进行合并处理,在合并过程中,与之关联的其他识别信息也就通过合并后的识别信息关联起来。
作为申请提供的知识图谱构建方法的一种具体实施方式,对于连接关系,进行了限制,仅使用连接关系包括平行关系和层级关系两种,在平行关系中,识别信息间不存在直接的连接关系,在层级关系中,识别信息间存在直接的连接关系。
也就是在最终的知识图谱中,对于识别信息而言,仅存在有关系和没有关系两种状态。进行了这样的限制后,知识图谱中展现的关系是更加直接的,也便于理解。
请参阅图3,作为申请提供的知识图谱构建方法的一种具体实施方式,对于知识图谱而言,增加了与音频流或者视频流的关联性,具体的处理步骤如下:
S201,对获取到的音频流或者视频流进行编号;
S202,记录每个识别信息的地址,地址包括该识别信息出现的音频流或者视频流的编号及其在音频流或者视频流中出现的时间;以及
S203,将地址关联到知识图谱中与之对应的识别信息上。
具体的说,在步骤S201中,会对获取到的音频流或者视频流进行编号,接着记录每个识别信息的地址,地址包括该识别信息出现的音频流或者视频流的编号及其在音频流或者视频流中出现的时间,也就是步骤S202中的内容,以一个具体的例子说明,
音频流或者视频流的数量为五个,其编号分别是001、002、003、004和005,其中一个识别信息分别出现在了编号为001的音频流或者视频流中的第十分钟处、编号为003的音频流或者视频流中的第十五分钟处和编号为005的音频流或者视频流中的第七分钟处,那么这些内容,可以将其称之为地址,均会关联到知识图谱中与之对应的识别信息上,也就是步骤S203中的内容。
此时,知识图谱中的内容是更加丰富的,因为除了能够对音频流或者视频流中的内容进行梳理之外,还能够提供追溯的功能,对于学生而言,就可以直接找到相应的音频流或者视频流,进行回看;对于老师而言,可以根据这些具体的地址进行查看,进行总结和再提高。
相比于单纯的梳理,这种能够提供追溯的方式明显能够提供更多的使用场景。
本申请实施例还提供了一种知识图谱构建装置,包括:
第一处理单元,用于响应于获取到的音频流或者视频流,将音频流或者视频流转化为语句;
第二处理单元,用于对语句的组成进行分解,分解的内容包括定语、主语、状语、谓语、宾语和补语;
第一解析单元,用于根据分解结果,解析语句的含义并定位其中的识别信息,识别信息的数量为多个,识别信息包括主语和/或宾语;
第二解析单元,用于解析语句的含义并定位其中的关联信息,关联信息包括定语、状语、谓语和补语;
第三处理单元,用于根据关联信息建立各识别信息之间的连接关系;以及
第四处理单元,用于根据识别信息及各识别信息之间的连接关系建立知识图谱,对于相同的识别信息,进行合并处理。
进一步地,所述音频流或者视频流的数量为多个;
对于出现在不同的音频流或者视频流中的相同的识别信息,进行合并处理。
进一步地,所述连接关系包括平行关系和层级关系,在平行关系中,识别信息间不存在直接的连接关系,在层级关系中,识别信息间存在直接的连接关系。
进一步地,还增加了:
编号单元,用于对获取到的音频流或者视频流进行编号;
记录单元,用于记录每个识别信息的地址,地址包括该识别信息出现的音频流或者视频流的编号及其在音频流或者视频流中出现的时间;以及
关联单元,用于将地址关联到知识图谱中与之对应的识别信息上。
在一个例子中,以上任一装置中的单元可以是被配置成实施以上方法的一个或多个集成电路,例如:一个或多个专用集成电路(application specificintegratedcircuit,ASIC),或,一个或多个数字信号处理器(digital signal processor,DSP),或,一个或者多个现场可编程门阵列(field programmable gate array,FPGA),或这些集成电路形式中至少两种的组合。
再如,当装置中的单元可以通过处理元件调度程序的形式实现时,该处理元件可以是通用处理器,例如中央处理器(central processing unit,CPU)或其它可以调用程序的处理器。再如,这些单元可以集成在一起,以片上系统(system-on-a-chip,SOC)的形式实现。
在本申请中可能出现的对各种消息/信息/设备/网元/系统/装置/动作/操作/流程/概念等各类客体进行了赋名,可以理解的是,这些具体的名称并不构成对相关客体的限定,所赋名称可随着场景,语境或者使用习惯等因素而变更,对本申请中技术术语的技术含义的理解,应主要从其在技术方案中所体现/执行的功能和技术效果来确定。
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
还应理解,在本申请的各个实施例中,第一、第二等只是为了表示多个对象是不同的。例如第一时间窗和第二时间窗只是为了表示出不同的时间窗。而不应该对时间窗的本身产生任何影响,上述的第一、第二等不应该对本申请的实施例造成任何限制。
还应理解,在本申请的各个实施例中,如果没有特殊说明以及逻辑冲突,不同的实施例之间的术语和/或描述具有一致性、且可以相互引用,不同的实施例中的技术特征根据其内在的逻辑关系可以组合形成新的实施例。
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个计算机可读存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的计算机可读存储介质包括:U盘、移动硬盘、只读存储器(Read-OnlyMemory,ROM)、随机存取存储器(Random Access Memory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
本申请实施例还提供了一种计算机程序产品,该计算机程序产品包括指令,当该指令被执行时,以使得该终端设备和该网络设备执行对应于上述方法的终端设备和网络设备的操作。
本申请实施例还提供了一种显示内容识别系统,所述系统包括:
一个或多个存储器,用于存储指令;以及
一个或多个处理器,用于从所述存储器中调用并运行所述指令,执行如上述内容中所述的知识图谱构建方法。
本申请实施例还提供了一种芯片系统,该芯片系统包括处理器,用于实现上述内容中所涉及的功能,例如,生成,接收,发送,或处理上述方法中所涉及的数据和/或信息。
该芯片系统,可以由芯片构成,也可以包括芯片和其他分立器件。
上述任一处提到的处理器,可以是一个CPU,微处理器,ASIC,或一个或多个用于控制上述的反馈信息传输的方法的程序执行的集成电路。
在一种可能的设计中,该芯片系统还包括存储器,该存储器,用于保存必要的程序指令和数据。该处理器和该存储器可以解耦,分别设置在不同的设备上,通过有线或者无线的方式连接,以支持该芯片系统实现上述实施例中的各种功能。或者,该处理器和该存储器也可以耦合在同一个设备上。
可选地,该计算机指令被存储在存储器中。
可选地,该存储器为该芯片内的存储单元,如寄存器、缓存等,该存储器还可以是该终端内的位于该芯片外部的存储单元,如ROM或可存储静态信息和指令的其他类型的静态存储设备,RAM等。
可以理解,本申请实施例中的存储器可以是易失性存储器或非易失性存储器,或可包括易失性和非易失性存储器两者。
非易失性存储器可以是ROM、可编程只读存储器(programmable ROM,PROM)、可擦除可编程只读存储器(erasable PROM,EPROM)、电可擦除可编程只读存储器(electricallyEPROM,EEPROM)或闪存。
易失性存储器可以是RAM,其用作外部高速缓存。RAM有多种不同的类型,例如静态随机存取存储器(static RAM,SRAM)、动态随机存取存储器(dynamic RAM,DRAM)、同步动态随机存取存储器(synchronous DRAM,SDRAM)、双倍数据速率同步动态随机存取存储器(double data rate SDRAM,DDR SDRAM)、增强型同步动态随机存取存储器(enhancedSDRAM,ESDRAM)、同步连接动态随机存取存储器(synch link DRAM,SLDRAM)和直接内存总线随机存取存储器。
本具体实施方式的实施例均为本申请的较佳实施例,并非依此限制本申请的保护范围,故:凡依本申请的结构、形状、原理所做的等效变化,均应涵盖于本申请的保护范围之内。
Claims (10)
1.一种知识图谱构建方法,其特征在于,包括:
响应于获取到的音频流或者视频流,将音频流或者视频流转化为语句;
对语句的组成进行分解,分解的内容包括定语、主语、状语、谓语、宾语和补语;
根据分解结果,解析语句的含义并定位其中的识别信息,识别信息的数量为多个,识别信息包括主语和/或宾语;
解析语句的含义并定位其中的关联信息,关联信息包括定语、状语、谓语和补语;
根据关联信息建立各识别信息之间的连接关系;以及
根据识别信息及各识别信息之间的连接关系建立知识图谱;
其中,对于相同的识别信息,进行合并处理。
2.根据权利要求1所述的一种知识图谱构建方法,其特征在于,所述音频流或者视频流的数量为多个;
对于出现在不同的音频流或者视频流中的相同的识别信息,进行合并处理。
3.根据权利要求1或2所述的一种知识图谱构建方法,其特征在于,所述连接关系包括平行关系和层级关系,在平行关系中,识别信息间不存在直接的连接关系,在层级关系中,识别信息间存在直接的连接关系。
4.根据权利要求2所述的一种知识图谱构建方法,其特征在于,还包括:
对获取到的音频流或者视频流进行编号;
记录每个识别信息的地址,地址包括该识别信息出现的音频流或者视频流的编号及其在音频流或者视频流中出现的时间;以及
将地址关联到知识图谱中与之对应的识别信息上。
5.一种知识图谱构建装置,其特征在于,包括:
第一处理单元,用于响应于获取到的音频流或者视频流,将音频流或者视频流转化为语句;
第二处理单元,用于对语句的组成进行分解,分解的内容包括定语、主语、状语、谓语、宾语和补语;
第一解析单元,用于根据分解结果,解析语句的含义并定位其中的识别信息,识别信息的数量为多个,识别信息包括主语和/或宾语;
第二解析单元,用于解析语句的含义并定位其中的关联信息,关联信息包括定语、状语、谓语和补语;
第三处理单元,用于根据关联信息建立各识别信息之间的连接关系;以及
第四处理单元,用于根据识别信息及各识别信息之间的连接关系建立知识图谱,对于相同的识别信息,进行合并处理。
6.根据权利要求5所述的一种知识图谱构建装置,其特征在于,所述音频流或者视频流的数量为多个;
对于出现在不同的音频流或者视频流中的相同的识别信息,进行合并处理。
7.根据权利要求5或6所述的一种知识图谱构建装置,其特征在于,所述连接关系包括平行关系和层级关系,在平行关系中,识别信息间不存在直接的连接关系,在层级关系中,识别信息间存在直接的连接关系。
8.根据权利要求5或6所述的一种知识图谱构建装置,其特征在于,还包括:
编号单元,用于对获取到的音频流或者视频流进行编号;
记录单元,用于记录每个识别信息的地址,地址包括该识别信息出现的音频流或者视频流的编号及其在音频流或者视频流中出现的时间;以及
关联单元,用于将地址关联到知识图谱中与之对应的识别信息上。
9.一种显示内容识别系统,其特征在于,所述系统包括:
一个或多个存储器,用于存储指令;以及
一个或多个处理器,用于从所述存储器中调用并运行所述指令,执行如权利要求1至4中任意一项所述的知识图谱构建方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质包括:
程序,当所述程序被处理器运行时,如权利要求1至4中任意一项所述的知识图谱构建方法被执行。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110179910.0A CN112966493A (zh) | 2021-02-07 | 2021-02-07 | 一种知识图谱构建方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110179910.0A CN112966493A (zh) | 2021-02-07 | 2021-02-07 | 一种知识图谱构建方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112966493A true CN112966493A (zh) | 2021-06-15 |
Family
ID=76284606
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110179910.0A Pending CN112966493A (zh) | 2021-02-07 | 2021-02-07 | 一种知识图谱构建方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112966493A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114390331A (zh) * | 2022-01-13 | 2022-04-22 | 徐州工业职业技术学院 | 一种视频教学方法、系统、设备及介质 |
CN116501892A (zh) * | 2023-05-06 | 2023-07-28 | 广州番禺职业技术学院 | 一种基于物联网自动跟随系统的实训知识图谱构建方法 |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106462607A (zh) * | 2014-05-12 | 2017-02-22 | 谷歌公司 | 自动化阅读理解 |
CN107545000A (zh) * | 2016-06-28 | 2018-01-05 | 百度在线网络技术(北京)有限公司 | 基于知识图谱的信息推送方法及装置 |
CN107545791A (zh) * | 2017-08-29 | 2018-01-05 | 广州思涵信息科技有限公司 | 一种利用课件自动生成课堂教学知识图谱的系统和方法 |
CN107609478A (zh) * | 2017-08-09 | 2018-01-19 | 广州思涵信息科技有限公司 | 一种匹配课堂知识内容的实时学情分析系统及方法 |
CN107633005A (zh) * | 2017-08-09 | 2018-01-26 | 广州思涵信息科技有限公司 | 一种基于课堂教学内容的知识图谱构建、对比系统及方法 |
CN109275046A (zh) * | 2018-08-21 | 2019-01-25 | 华中师范大学 | 一种基于双视频采集的教学数据标注方法 |
CN109902187A (zh) * | 2019-03-21 | 2019-06-18 | 广东小天才科技有限公司 | 一种特征知识图谱的构建方法及装置、终端设备 |
CN110347798A (zh) * | 2019-07-12 | 2019-10-18 | 之江实验室 | 一种基于自然语言生成技术的知识图谱辅助理解系统 |
CN110543574A (zh) * | 2019-08-30 | 2019-12-06 | 北京百度网讯科技有限公司 | 一种知识图谱的构建方法、装置、设备及介质 |
CN110851610A (zh) * | 2018-07-25 | 2020-02-28 | 百度在线网络技术(北京)有限公司 | 知识图谱生成方法、装置、计算机设备以及存储介质 |
CN111046656A (zh) * | 2019-11-15 | 2020-04-21 | 北京三快在线科技有限公司 | 文本处理方法、装置、电子设备及可读存储介质 |
CN111651690A (zh) * | 2020-05-29 | 2020-09-11 | 深圳市天一智联科技有限公司 | 涉案信息查找方法、装置以及计算机设备 |
-
2021
- 2021-02-07 CN CN202110179910.0A patent/CN112966493A/zh active Pending
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106462607A (zh) * | 2014-05-12 | 2017-02-22 | 谷歌公司 | 自动化阅读理解 |
CN107545000A (zh) * | 2016-06-28 | 2018-01-05 | 百度在线网络技术(北京)有限公司 | 基于知识图谱的信息推送方法及装置 |
CN107609478A (zh) * | 2017-08-09 | 2018-01-19 | 广州思涵信息科技有限公司 | 一种匹配课堂知识内容的实时学情分析系统及方法 |
CN107633005A (zh) * | 2017-08-09 | 2018-01-26 | 广州思涵信息科技有限公司 | 一种基于课堂教学内容的知识图谱构建、对比系统及方法 |
CN107545791A (zh) * | 2017-08-29 | 2018-01-05 | 广州思涵信息科技有限公司 | 一种利用课件自动生成课堂教学知识图谱的系统和方法 |
CN110851610A (zh) * | 2018-07-25 | 2020-02-28 | 百度在线网络技术(北京)有限公司 | 知识图谱生成方法、装置、计算机设备以及存储介质 |
CN109275046A (zh) * | 2018-08-21 | 2019-01-25 | 华中师范大学 | 一种基于双视频采集的教学数据标注方法 |
CN109902187A (zh) * | 2019-03-21 | 2019-06-18 | 广东小天才科技有限公司 | 一种特征知识图谱的构建方法及装置、终端设备 |
CN110347798A (zh) * | 2019-07-12 | 2019-10-18 | 之江实验室 | 一种基于自然语言生成技术的知识图谱辅助理解系统 |
CN110543574A (zh) * | 2019-08-30 | 2019-12-06 | 北京百度网讯科技有限公司 | 一种知识图谱的构建方法、装置、设备及介质 |
CN111046656A (zh) * | 2019-11-15 | 2020-04-21 | 北京三快在线科技有限公司 | 文本处理方法、装置、电子设备及可读存储介质 |
CN111651690A (zh) * | 2020-05-29 | 2020-09-11 | 深圳市天一智联科技有限公司 | 涉案信息查找方法、装置以及计算机设备 |
Non-Patent Citations (2)
Title |
---|
李艳燕等: "面向智慧教育的学科知识图谱构建与创新应用", 《网络出版地址: HTTP://KNS.CNKI.NET/KCMS/DETAIL/62.1022.G4.20190725.0934.008.HTML》 * |
钟亮: "基于中文百科的初中数学学科知识图谱构建与应用", 《硕士学位论文全文数据库社会科学II辑》 * |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114390331A (zh) * | 2022-01-13 | 2022-04-22 | 徐州工业职业技术学院 | 一种视频教学方法、系统、设备及介质 |
CN114390331B (zh) * | 2022-01-13 | 2023-09-08 | 徐州工业职业技术学院 | 一种视频教学方法、系统、设备及介质 |
CN116501892A (zh) * | 2023-05-06 | 2023-07-28 | 广州番禺职业技术学院 | 一种基于物联网自动跟随系统的实训知识图谱构建方法 |
CN116501892B (zh) * | 2023-05-06 | 2024-03-29 | 广州番禺职业技术学院 | 一种基于物联网自动跟随系统的实训知识图谱构建方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Broussard et al. | Artificial intelligence and journalism | |
O’Halloran et al. | A digital mixed methods research design: Integrating multimodal analysis with data mining and information visualization for big data analytics | |
Krämer et al. | Culture, technology, cultural techniques–Moving beyond text1 | |
Chandler et al. | Listening to voices and visualizing data in qualitative research: Hypermodal dissemination possibilities | |
Cassidy et al. | Failing grade: 89% of introduction-to-psychology textbooks that define or explain statistical significance do so incorrectly | |
Schrodt et al. | Political science: KEDS—a program for the machine coding of event data | |
Mantie | A comparison of “popular music pedagogy” discourses | |
Schwartz | The epistemological status of second language acquisition | |
Bernauer et al. | Blending the old and the new: Qualitative data analysis as critical thinking and using NVivo with a generic approach | |
Van Dijk | Discourse studies and hermeneutics | |
Kapatsinski | Frequency of use leads to automaticity of production: Evidence from repair in conversation | |
US10909986B2 (en) | Assessment of speech consumability by text analysis | |
CN112966493A (zh) | 一种知识图谱构建方法及系统 | |
Friedman et al. | Nodes and arcs: concept map, semiotics, and knowledge organization | |
Monreal | A move-step analysis of the concluding chapters in computer science PhD theses | |
Zhang | Exploring personal metadiscourse markers across speech and writing using cluster analysis | |
Smith et al. | From values to virtues: an investigation into the ethical content of English primary school assemblies | |
EP4186056A1 (en) | Self-adapting and autonomous methods for analysis of textual and verbal communication | |
CN112199951A (zh) | 一种事件信息生成的方法及装置 | |
Beckers | The voice of the people in the news: A content analysis of public opinion displays in routine and election news | |
Foucault | Linguistics and social sciences | |
Baker et al. | How to use corpus linguistics in sociolinguistics: A case study of modal verb use, age and change over time | |
Su et al. | Framing overseas Chinese students: A comparative analysis of newspaper coverage in mainland China, US, and Hong Kong | |
CN113050933B (zh) | 脑图数据处理方法、装置、设备及存储介质 | |
Jacobs et al. | Production modes: Writing as materializing and stimulating thoughts |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20210615 |
|
RJ01 | Rejection of invention patent application after publication |