CN112084793B - 基于依存句法的语义识别方法、设备和可读存储介质 - Google Patents
基于依存句法的语义识别方法、设备和可读存储介质 Download PDFInfo
- Publication number
- CN112084793B CN112084793B CN202010964475.8A CN202010964475A CN112084793B CN 112084793 B CN112084793 B CN 112084793B CN 202010964475 A CN202010964475 A CN 202010964475A CN 112084793 B CN112084793 B CN 112084793B
- Authority
- CN
- China
- Prior art keywords
- sentence
- dependency
- processed
- target
- trunk
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 52
- 238000004458 analytical method Methods 0.000 claims abstract description 68
- 239000013598 vector Substances 0.000 claims description 119
- 238000000605 extraction Methods 0.000 claims description 50
- 239000011159 matrix material Substances 0.000 claims description 41
- 230000009466 transformation Effects 0.000 claims description 16
- PXFBZOLANLWPMH-UHFFFAOYSA-N 16-Epiaffinine Natural products C1C(C2=CC=CC=C2N2)=C2C(=O)CC2C(=CC)CN(C)C1C2CO PXFBZOLANLWPMH-UHFFFAOYSA-N 0.000 claims description 13
- 230000009977 dual effect Effects 0.000 claims description 9
- 239000000945 filler Substances 0.000 claims 4
- 238000012549 training Methods 0.000 description 67
- 238000004891 communication Methods 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 6
- 238000013473 artificial intelligence Methods 0.000 description 5
- 230000000295 complement effect Effects 0.000 description 5
- 238000011156 evaluation Methods 0.000 description 5
- 238000002372 labelling Methods 0.000 description 5
- 238000010801 machine learning Methods 0.000 description 5
- 230000007547 defect Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 230000004927 fusion Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 230000007812 deficiency Effects 0.000 description 2
- 230000001419 dependent effect Effects 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 230000004931 aggregating effect Effects 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
- G06F40/35—Discourse or dialogue representation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/211—Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
- G06F40/216—Parsing using statistical methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Probability & Statistics with Applications (AREA)
- Machine Translation (AREA)
Abstract
本申请公开了一种基于依存句法的语义识别方法、设备和可读存储介质,所述基于依存句法的语义识别方法包括:获取待处理语句和所述待处理语句对应的关联语句,并抽取所述关联语句对应的关键实体,进而对所述待处理语句进行依存句法分析,以对所述待处理语句的句子主干抽取,获得所述待处理语句对应的目标句子主干,进而基于所述关键实体和所述目标句子主干,生成所述待处理语句对应的完整语义数据,以对所述待处理语句进行语义识别。本申请解决了语义识别效率低的技术问题。
Description
技术领域
本申请涉及金融科技(Fintech)的人工智能领域,尤其涉及一种基于依存句法的语义识别方法、设备和可读存储介质。
背景技术
随着金融科技,尤其是互联网科技金融的不断发展,越来越多的技术(如分布式、区块链Blockchain、人工智能等)应用在金融领域,但金融业也对技术提出了更高的要求,如对金融业对应待办事项的分发也有更高的要求。
随着计算机软件和人工智能的不断发展,人工智能的应用领域也越来越广泛,在基于人工智能的对话系统中,在智能客服提出上文语句后,用户回复的下文语句通常存在成分缺失的情况,进而为了正确识别下文语句的语义,通常将上文语句和下文语句进行拼接,获得拼接语句,进而通过语义识别模型对拼接语句进行识别,即可确定下文语句的语义,其中,语义识别模型是基于预先标注好了的上下文配对数据进行训练获得的,但是,若当前的对话场景更换为新的对话场景时,则需要重新标注上下文配对数据,以对语义识别模型进行维护更新,也即,语义识别模型仅适用于已经进行了上下文配对数据标注了的对话场景,而在对话系统中,由于用户的多样化,时常会产生新的对话场景,而由于对话系统中语义识别通常是实时进行的,而标注上下文配对数据和进行模型维护更新通常需要大量时间,进而由于当前的语义识别模型却难以适用于新的对话场景,将导致语义识别模型难以及时进行准确地语义识别,进而导致语义识别的效率较低。
发明内容
本申请的主要目的在于提供一种基于依存句法的语义识别方法、设备和可读存储介质,旨在解决现有技术中语义识别效率低的技术问题。
为实现上述目的,本申请提供一种基于依存句法的语义识别方法,所述基于依存句法的语义识别方法应用于基于依存句法的语义识别设备,所述基于依存句法的语义识别方法包括:
获取待处理语句和所述待处理语句对应的关联语句,并抽取所述关联语句对应的关键实体;
对所述待处理语句进行依存句法分析,以对所述待处理语句的句子主干抽取,获得所述待处理语句对应的目标句子主干;
基于所述关键实体和所述目标句子主干,生成所述待处理语句对应的完整语义数据,以对所述待处理语句进行语义识别。
本申请还提供一种基于依存句法的语义识别装置,所述基于依存句法的语义识别装置为虚拟装置,且所述基于依存句法的语义识别装置应用于基于依存句法的语义识别设备,所述基于依存句法的语义识别装置包括:
第一抽取模块,用于获取待处理语句和所述待处理语句对应的关联语句,并抽取所述关联语句对应的关键实体;
第二抽取模块,用于对所述待处理语句进行依存句法分析,以对所述待处理语句的句子主干抽取,获得所述待处理语句对应的目标句子主干;
生成模块,用于基于所述关键实体和所述目标句子主干,生成所述待处理语句对应的完整语义数据,以对所述待处理语句进行语义识别。
本申请还提供一种基于依存句法的语义识别设备,所述基于依存句法的语义识别设备为实体设备,所述基于依存句法的语义识别设备包括:存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的所述基于依存句法的语义识别方法的程序,所述基于依存句法的语义识别方法的程序被处理器执行时可实现如上述的基于依存句法的语义识别方法的步骤。
本申请还提供一种可读存储介质,所述可读存储介质上存储有实现基于依存句法的语义识别方法的程序,所述基于依存句法的语义识别方法的程序被处理器执行时实现如上述的基于依存句法的语义识别方法的步骤。
本申请提供了一种基于依存句法的语义识别方法、设备和可读存储介质,相比于现有技术采用的基于预先标注好了的上下文配对数据进行训练获得的语义识别模型,对下文语句进行语义识别的技术手段,本申请在获取待处理语句和所述待处理语句对应的关联语句之后,首先抽取所述关联语句对应的关键实体,进而对所述待处理语句进行依存句法分析,以对所述待处理语句的句子主干抽取,获得所述待处理语句对应的目标句子主干,其中,需要说明的是,在所述待处理语句中除所述目标句子主干之外的非句子主干部分对语义识别的贡献度较小,且对语义识别存在干扰,进而实现了基于依存句法分析的方法,在待处理语句中剔除对语义识别的贡献度小的非句子主干部分的目的,使得目标句子主干更加贴近于待处理语句的真实语义,进而基于所述关键实体和所述目标句子主干,生成所述待处理语句对应的完整语义数据,也即,基于所述关联语句中抽取的关键实体,对目标句子主干中缺失的句子成分进行填补,使得填补后的目标句子主干具备待处理语句的完整语义,获得完整语义数据,进而基于完整语义数据,即可实现对待处理语句的准确语义识别,其中,需要说明的是,本申请中整个语义识别过程是基于依存句法分析进行的,且依存句法分析可适用于所有对话场景,进而在当前的对话场景更改为新的对话场景时,无需重新进行上下文配对数据的标注,可对下文语句快速进行准确地语义识别,克服了现在技术中基于预先标注好了的上下文配对数据进行训练获得的语义识别模型,对下文语句进行语义识别时,若当前的对话场景更改为新的对话场景,则由于当前的语义识别模型难以适用新的对话场景,将导致语义识别模型难以及时进行准确地语义识别的技术缺陷,提高了语义识别的效率。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本申请基于依存句法的语义识别方法第一实施例的流程示意图;
图2为本申请基于依存句法的语义识别方法中所述待分析语句对应的依存关系树的示意图;
图3为本申请基于依存句法的语义识别方法第二实施例的流程示意图;
图4为本申请实施例方案涉及的硬件运行环境的设备结构示意图。
本申请目的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅用以解释本申请,并不用于限定本申请。
本申请实施例提供一种基于依存句法的语义识别方法,在本申请基于依存句法的语义识别方法的第一实施例中,参照图1,所述基于依存句法的语义识别方法包括:
步骤S10,获取待处理语句和所述待处理语句对应的关联语句,并抽取所述关联语句对应的关键实体;
在本实施例中,需要说明的是,所述基于依存句法的语义识别方法应用于智能对话系统,所述关联语句为对话时的上文语句,所述待处理语句为预处理后的对话时的下文语句,也即,所述待处理语句和所述关联语句为上下文关系,其中,预处理的目的为在所述待处理语句中去除干扰进行依存句法分析的背景成分。
获取待处理语句和所述待处理语句对应的关联语句,并抽取所述关联语句对应的关键实体,具体地,在人机对话系统中收集所述待处理语句,并将所述待处理语句的下文语句作为关联语句,进而基于预设实体成分,在所述关联语句中抽取关键实体,其中,所述预设实体成分包括名词成分、宾语从句成分和主语从句成分等,所述关键实体为所述关联语句中所述预设实体成分对应的句子成分,例如,假设所述预设实体成分为宾语从句成分和名词成分,则所述关键实体包括所述关联语句中所有的名词和宾语从句。
步骤S20,对所述待处理语句进行依存句法分析,以对所述待处理语句的句子主干抽取,获得所述待处理语句对应的目标句子主干;
在本实施例中,需要说明的是,所述基于依存句法的语义识别设备包括预设依存句法模型,其中,所述预设依存句法模型为预先训练好的机器学习模型,用于对语句进行依存句法分析,其中,依存句法分析的过程即为解析语句的句法信息的过程,其中,所述句法信息包括句型信息和词成分信息,例如,假设语句为“我是谁”,则经过依存句法分析后,句型信息表明该语句为主谓宾句,词成分信息表明“我”为主语,“是”为谓语,“谁”为宾语。
对所述待处理语句进行依存句法分析,以对所述待处理语句的句子主干抽取,获得所述待处理语句对应的目标句子主干,具体地,基于预设依存句法模型,对所述待处理语句进行依存句法分析,获得待处理语句的句法信息,进而基于待处理语句的句法信息,抽取所述待处理语句对应的目标句子主干。
其中,所述对所述待处理语句进行依存句法分析,以对所述待处理语句的句子主干抽取,获得所述待处理语句对应的目标句子主干的步骤包括:
步骤S21,对所述待处理语句进行依存句法分析,获得所述待处理语句对应的依存句法分析结果;
在本实施例中,对所述待处理语句进行依存句法分析,获得所述待处理语句对应的依存句法分析结果,具体地,将所述待处理语句输入所述预设依存句法模型,分别对所述待处理语句进行依存关系判别和依存关系类型预测,以对所述待处理语句进行依存句法分析,获得依存句法分析结果,其中,需要说明的是,进行依存关系判别的目的为判别词与词之间的依存关系,进行依存关系类型预测的目的是预测依存关系的类型,例如,假设待处理语句为语句“ABC”,其中A、B和C均为待处理语句中的词,则进行依存关系判别后,可判定B依存于A,C依存于B,进行依存关系类型预测后,可确定A与B之间的依存关系为主谓关系,B与C之间的依存关系为动宾关系,其中,在一种可实施的方式中,所述对所述待处理语句进行依存关系判别和依存关系类型预测,以对所述待处理语句进行依存句法分析,获得依存句法分析结果的步骤包括:
对所述待处理语句进行依存关系判别,获得所述待处理语句对应的依存关系判别结果,并对所述待处理语句进行依存关系类型预测,获得所述待处理语句对应的依存关系类型预测结果,进而将所述依存关系判别结果和所述依存关系类型结果进行融合,获得所述待处理语句中词与词之间的依存关系类型标签,其中,所述依存关系类型标签为依存关系类型的标识,进而将所述依存关系类型标签作为所述依存句法分析结果,其中,所述依存关系类型预测结果可用矩阵进行表示,所述依存关系类型预测结果对应的矩阵形式为依存关系类型预测概率矩阵,其中,所述依存关系类型预测概率矩阵中的每一比特位上的值均为所述待处理语句中一词与另外一词之间的依存关系类型标签概率预测向量,其中,所述依存关系类型预测向量中的每一比特位上的值均为所述待处理语句中一词与另外一词的依存关系属于该比特位对应的预设依存关系的概率值,其中,所述预设依存关系包括主谓关系、动宾关系等,例如,假设词A与词B之间的所述依存关系类型标签概率预测向量为(0.1,0.9),则0.1表示词A与词B之间为主谓关系的概率为10%,0.9表示词A与词B之间的动宾关系的概率为90%。
步骤S22,基于所述依存句法分析结果,抽取所述待处理语句对应的所述目标句子主干。
在本实施例中,需要说明的是,所述依存句法分析结果包括依据关系标签预测结果,其中,所述依存关系类型预测结果为所述待处理语句中词与词之间的依存关系类型,其中,所述依存关系类型包括主谓关系类型、动宾关系类型和动补结构类型等。
基于所述依存句法分析结果,抽取所述待处理语句对应的所述目标句子主干,具体地,基于所述依存关系类型预测结果,确定所述待处理语句中各待处理词的词成分,进而基于待处理语句中各所述待处理词的词性和各所述待处理词的词成分,确定所述待处理语句的句型信息,其中,所述词性为待处理词的本身的性质,例如所述词性包括动词、名称和量词等,所述词成分为待处理词在所述待处理语句中表现的性质,例如所述词成分包括主语、谓语和宾语等,进而基于所述句型信息,在所述待处理语句中选取目标核心词,进而基于所述依存关系类型预测结果,在所述待处理语句中选取所述目标核心词关联的各目标句子主干词,进而将所述目标核心词和各所述目标句子主干词组成所述目标句子主干。
其中,所述依存句法分析结果包括依存关系类型预测结果,
所述基于所述依存句法分析结果,抽取所述待处理语句对应的所述目标句子主干的步骤包括:
步骤S221,基于所述依存关系类型预测结果,确定所述待处理语句对应的句型信息;
在本实施例中,基于所述依存关系类型预测结果,确定所述待处理语句对应的句型信息,具体地,基于所述待处理语句中各待处理词之间的依存关系类型,确定各所述待处理词的词成分,进而获取各所述待处理词的词性,进而基于各所述待处理词的词性和词成分,对所述待处理语句进行句型判别,确定所述待处理语句的句型信息,其中,所述句型信息为所述待处理语句的句型的标识信息,所述待处理语句的句型包括动词性谓语句、名词性谓语句、形容词性谓语句、介词性谓语句、连动句、双宾语语句、比字句、被字句、把字句和兼语句等,其中,所述动词性谓语句为动词做谓语的语句,所述名词性谓语句为名词做谓语的语句,所述形容词性谓语句为形容词做谓语语句,所述介词性谓语句为介词做谓语的语句,所述连动句为两个连续的互不支配的动词同为谓语的语句,所述双宾语语句为谓语对应的依存关系类型同时包括间宾关系类型和动宾关系类型的语句,所述比字句为谓语的状语中有“比”开始的状语的语句,所述被字句为谓语的状语中有“被”开始的状语的语句,所述把字句为谓语的状语中有“把”开始的状语的语句,所述兼语句为宾语对应的依存关系类型为兼语类型的语句。
步骤S222,基于所述句型信息和所述依存关系类型预测结果,抽取所述目标句子主干。
在本实施例中,基于所述句型信息和所述依存关系类型预测结果,抽取所述目标句子主干,具体地,基于所述句型信息,在所述待处理语句的待处理词中选取目标核心词,其中,所述目标核心词为做核心谓语的待处理词,例如,假设所述句型信息表示待处理语句为动词性谓语句,则所述待处理语句的谓语上的动词即为所述目标核心词,进而基于预设词成分优选级和所述待处理语句中词与词之间的依存关系类型,选取所述目标核心词对应的各目标句子主干词,进而将所述目标核心词和各所述目标句子主干词共同对应的依存句法向量作为所述目标句子主干,其中,所述预设词成分优先句子为抽取句子主干时优先抽取的词成分,且需要说明的是,为了保证目标句子主干的语义清晰且精简程度高,需要预先设置好抽取的词成分的数量,例如,假设预先设置好抽取的词成分包括主语、谓语和宾语,且谓语为动词,则基于所述依存关系类型中的主谓关系类型,确定所述目标核心词对应的主语作为所述目标句子主干词,并基于所述依存关系类型中的动宾关系类型,确定所述目标核心词对应的主语作为所述目标句子主干词,进而所述目标句子主干则由主语、谓语和宾语组成。
在另一种实施例方式中,所述基于所述句型信息和所述依存关系类型预测结果,抽取所述目标句子主干的步骤包括:
基于所述句型信息、所述待处理语句中词与词之间的依存关系类型以及所述待处理语句中各待处理词的词性,生成所述待处理语句对应的依存关系树,进而基于预设词成分优先级和所述依存关系树,抽取所述目标句子主干,其中,所述预设词成分优先级为在句子主干抽取过程的提取词成分的优先级,在一种可实施的方式中,所述待处理语句为“十分失望的他后来又考了几次财政厅的公务员”,则如图2所示为所述待处理语句对应的依存关系树的示意图,其中,ROOT表示所述待处理语句,m、a、u、r、nt、d、v、q和n均为词性的标签,ADV、RAD、ATT、HED、SBV、CMP和VOB为依存关系类型的标签。
其中,所述基于所述句型信息和所述依存关系类型预测结果,抽取所述目标句子主干的步骤包括:
步骤A10,基于所述句型信息,确定所述待处理语句对应的目标核心词;
在本实施例中,基于所述句型信息,确定所述待处理语句对应的目标核心词,具体地,基于所述句型信息,确定所述待处理语句对应的核心谓语,其中,所述核心谓语为决定所述待处理语句的句型信息的谓语,进而将所述核心谓语对应的待处理词作为所述目标核心词。
步骤A20,基于预设词成分优先级和所述依存关系类型预测结果,确定所述目标核心词对应的各目标句子主干词;
在本实施例中,需要说明的是,需要说明的是,所述预设词成分优先级为在句子主干抽取过程的提取词成分的优先级,所述预设词成分优先级包括预设第一优先级、预设第二优先级和预设第三优先级,其中,在一种可实施的方式中,所述预设第一优先级对应的词成分包括主语、谓语、宾语、状语和补语,所述预设第二优先级对应的词成分包括定语,所述预设第三优先级对应的词成分包括除所述预设第一优先级和所述预设第二优先级共同对应的词成分之外的其他词成分。
基于预设词成分优先级和所述依存关系类型预测结果,确定所述目标核心词对应的各目标句子主干词,具体地,基于所述待处理语句中词与词之间的依存关系类型,确定所述目标核心词对应的各待选取词的词成分,进而基于所述预设词成分优先级的层数,在各待选取词的词成分中选取优先级词成分,进而将各所述优先级词成分对应的待处理词作为所述目标句子主干词,其中,需要说明的是,所述预设词成分优先级的第一层为预设第一优先级,所述预设成分优先级的第二层为预设第二优先级,所述预设词成分的第三层为预设第三优先级。
步骤A30,基于所述句型信息、所述目标核心词和各所述目标句子主干词,生成所述目标句子主干。
在本实施例中,基于所述句型信息、所述目标核心词和各所述目标句子主干词,生成所述目标句子主干,具体地,获取所述目标核心词的词成分和词性,以及各所述目标句子主干词的词成分和词性,进而基于所述句型信息、所述目标核心词、所述目标核心词的词性和词成分、各所述目标句子主干词和各所述目标句子主干词对应的词性和对应的词成分,生成所述目标句子主干,其中,在一种可实施的方式中,假设所述待处理语句为“十分失望的他后来又考了几次财政厅的公务员”,则所述目标句子主干为{句型:主谓宾句,主语:[他,ATT:[十分失望的]],谓语:[考,RAD:[了]],前置宾语:[],宾语:[公务员,ATT:财政厅的]:COO:[],CMP:[几次],ADV:[后来,又]},其中,ATT为定中关系类型的标签,RAD为右附加关系类型的标签,COO为并列关系类型的标签,CMP为动补结构类型的标签,ADV为状中结构类型的标签,其中,谓语即为所述目标核心词。
另外地,需要说明的是,由于句子主干抽取是基于依存句法分析获得的待处理语句对应的句型信息、对应的词成分和对应的词与词之间的依存关系类型进行的,进而本实施例可解释句子主干抽取结果的原因,对于句子主干抽取结果的可解释性强,进而句子主干抽取结果的置信度极高。
步骤S30,基于所述关键实体和所述目标句子主干,生成所述待处理语句对应的完整语义数据,以对所述待处理语句进行语义识别。
在本实施例中,基于所述关键实体和所述目标句子主干,生成所述待处理语句对应的完整语义数据,以对所述待处理语句进行语义识别,具体地,基于所述关键实体,对所述目标句子主干进行缺失成分补全,获得所述目标句子主干对应的完整语义句子主干,并将所述完整语义句子主干作为所述完整语义数据,进而基于所述完整语义数据和预设语义识别模型,即可实现对所述待处理语句的语义识别,其中,需要说明的是,由于本实施例通过分别抽取了关联语句的关键实体和待处理语句的目标句子主干,获取待处理语句的完整语义数据,进而基于所述完整语义数据,即可实现待处理语句的准确语义识别,其中,相比于现有技术采用的基于预先标注好了的上下文配对数据进行训练获得的语义识别模型,对下文语句进行语义识别的技术手段,本实施例中的预设语义识别模型的模型输入数据更加简洁,输入数据量更少,进而预设语义识别模型基于模型输入数据的计算量将更少,进而可提高语义识别时的计算效率,进而可提高语义识别的效率。
另外地,需要说明的是,在另一种可实施的方案中,在步骤S10之后,可对所述待处理语句进行依存句法分析,获得所述待处理语句中词与词之间的依存关系类型,进而基于所述待处理语句中词与词之间的依存关系类型,确定待处理语句中各待处理词对应的词成分,进而基于预设词成分信息,判别所述待处理语句是否缺少预设词成分,其中,所述预设词成分信息为具备完整语义的语句具备的词成分信息,所述预设词成分信息包括具备完整语义的语句的各预设词成分,所述预设词成分包括主语、谓语、宾语、状语和补语等,进而若缺少,则基于所述关键实体,对所述待处理语句进行缺失成分填补,获得填补语句,并对所述填补语句进行语义识别,以实现对所述待处理语句的语义识别,若不缺少,则直接对所述待处理语句进行语义识别,其中,需要说明的时,由于填补语句为填补了缺少的预设词成分的语句,进而填补语句相比于待处理语句具备更加完整的语义信息,进而基于填补语句,识别对待处理语句的语义,可提高了语义识别的准确率。
其中,所述完整语义数据至少包括一完整语义语句,所述关键实体至少包括一关键填充词,
所述基于所述关键实体和所述目标句子主干,生成所述待处理语句对应的完整语义语句的步骤包括:
步骤S31,判断所述目标句子主干是否缺失句子主干成分;
在本实施例中,判断所述目标句子主干是否缺失句子主干成分,具体地,获取所述目标句子主干对应的各句子主干词成分,进而基于各所述句子主干词成分,判断所述目标句子主干是否拥有所有的预设句子主干词成分,其中,所述预设句子主干词成分包括主语成分、谓语成分、宾语成分、状语成分和补语成分等,进而若未拥有,则判定所述目标句子主干缺失句子主干成分,若拥有,则获取各所述句子主干词成分对应的各句子主干词的句子主干词性,若存在各所述句子主干词性中存在目标句子主干词性符合预设成分缺失标志词性,则判定所述目标句子主干缺失句子主干成分,若不存在各所述句子主干词性中存在目标句子主干词性符合预设成分缺失标志词性,则判定所述目标句子主干未缺失句子主干成分,其中,所述预设成分缺失标志词性为表示目标句子主干缺失所述预设成分缺失标志词性对应的词成分的标志,其中,所述预设成分缺失标志词性包括代词,例如,目标句子主干A为“是啊那怎么办”,其中,“那”的词性为代词,目标句子主干B为“会有雨吗”,进而对于目标句子主干A,可判定“那”的词性符合预设成分缺失标志词性,进而判定所述目标句子主干缺失句子主干成分,对于目标句子主干B,可知目标句子主干中缺失主语成分,进而判定所述目标句子主干未拥有所有的预设句子主干词成分,进而判定所述目标句子主干缺失句子主干成分。
步骤S32,若缺失,则基于所述关键填充词,对所述目标句子主干进行缺失成分填补,获得所述完整语义语句。
在本实施例中,若缺失,则基于所述关键填充词,对所述目标句子主干进行缺失成分填补,获得所述完整语义语句,具体地,若缺失,则确定所述目标句子主干的主干缺失成分位置,并将所述关键填充词填充至所述目标句子主干的主干缺失成分位置,获得所述完整语义语句。
其中,所述基于所述关键填充词,对所述目标句子主干进行缺失成分填补,获得所述完整语义语句的步骤包括:
步骤B10,确定所述目标句子主干的主干缺失成分位置;
在本实施例中,需要说明的是,所述主干缺失成分位置为目标句子主干缺失的句子主干成分的词成分位置,例如,假设目标句子主干缺失的句子主干成分为主语,则所述主干缺失成分位置为主语位置。
步骤B20,将所述关键填充词填充至所述主干缺失成分位置,获得所述目标句子主干对应的第一填补句子主干;
在本实施例中,将所述关键填充词填充至所述主干缺失成分位置,获得所述目标句子主干对应的第一填补句子主干,具体地,判断所述主干缺失成分位置上是否存在待替换词,其中,所述待替换词为符合预设成分缺失标志词性的主干缺失成分位置上的词,进而若存在,则将所述待替换词替换为所述关键填充词,获得所述第一填补句子主干,若不存在,则将所述关键填充词填补所述主干缺失成分位置上的空缺,获得所述第一填补句子主干。
另外的,需要说明的是,若所述待处理语句对应的句型信息为名词性谓语句,则获取所述待处理语句的谓语位置上的目标谓语名词,并在所述关联语句中确定与所述目标谓语名词的词性相同的待更换词,并在所述关联语句中将所述待更换词替换为所述目标谓语名词,并将替换后的关联语句作为所述完整语义语句,例如,将所述关联语句为“深圳的天气怎么样”,所述待处理语句为“广州咧”,则所述目标谓语名词为“广州”,其中,“广州”为地理名词,进而所述关联语句中的待更换词为“深圳”,进而所述完整语义语句为“广州的天气怎么样”。
步骤B30,基于所述第一填补句子主干,生成所述完整语义语句。
在本实施例中,基于所述第一填补句子主干,生成所述完整语义语句,具体地,基于所述第一填补句子主干中各句子主干词之间的依存关系类型,将所述第一填补句子主干中的各句子主干词进行组合,获得所述完整语义语句,其中,所述依存关系类型包括主谓关系和动宾关系等,例如,假设所述第一填补句子主干包括词A、词B和词C,其中,词A和词B之间为主谓关系,词B和词C之间为动宾关系,则所述完整语义语句为“ABC”。
其中,所述基于所述关键填充词,对所述目标句子主干进行缺失成分填补,获得所述完整语义语句的步骤包括:
步骤C10,将所述关键填充词和所述目标句子主干进行拼接,获得所述完整语义语句。
在本实施例中,将所述关键填充词和所述目标句子主干进行拼接,获得所述完整语义语句,具体地,将所述关键填充词和所述目标句子主干进行拼接,获得具备关键语义信息的拼接语句,并将具备关键语义信息的拼接语句作为所述完整语义语句,其中,所述关键语义信息为所述关键填充词所具备的语义信息,进而将具备关键语义信息的拼接语句输入预设语义识别模型,即可准确识别所述待处理语句的语义,例如,假设所述关键填充词为关联语句“知识就是力量是什么意思”中的主语从句“知识就是力量”,所述目标句子主干对应的语句为“谁说的啊”,进而具备关键语义信息的拼接语句为“知识就是力量谁说的啊”。
其中,所述基于所述关键填充词,对所述目标句子主干进行缺失成分填补,获得所述完整语义语句的步骤包括:
步骤D10,将所述关键填充词和所述目标句子主干输入预设语句填补模型,对所述目标句子主干的缺失成分进行填补,获得第二填补句子主干;
在本实施例中,需要说明的是,所述预设语句填补模型为预设训练的好的神经网络模型,用于基于关键填充词,对所述目标句子主干的缺失成分进行填补。
将所述关键填充词和所述目标句子主干输入预设语句填补模型,对所述目标句子主干的缺失成分进行填补,获得第二填补句子主干,具体地,将所述关键填充词和所述目标句子主干输入预设语句填补模型,以识别所述目标句子主干的缺失成分位置,并将所述关键填充词填充至所述目标句子主干的缺失成分位置,获得所述第二填补句子主干。
步骤D20,基于所述第二填补句子主干,生成所述完整语义语句。
在本实施例中,基于所述第二填补句子主干,生成所述完整语义语句,具体地,基于所述第二填补句子主干中各句子主干词之间的依存关系类型,将所述第二填补句子主干中的各句子主干词进行组合,获得所述完整语义语句。
其中,所述完整语义数据至少包括一完整语义语句,
在所述基于所述关键实体和所述目标句子主干,生成所述待处理语句对应的完整语义数据的步骤之后,所述基于依存句法的语义识别方法还包括:
步骤E10,基于预设语言模型,分别对各所述完整语义语句进行语句通顺度评分,获得各所述完整语义语句对应的通顺度评分;
在本实施例中,需要说明的是,所述预设语言模型为预先训练好的机器学习模型,用于评估语句的通顺程度,且语句越通顺,则预设语言模型输出的评分越高。
基于预设语言模型,分别对各所述完整语义语句进行语句通顺度评分,获得各所述完整语义语句对应的通顺度评分,具体地,对于每一所述完整语义语句均执行以下步骤:
将所述完整语义语句输入所述预设语言模型,以分别预测所述完整语义语句中每一待选择完整语义词在所述完整语义语句对应的各词成分位置的位置概率评估值,进而在每一所述待选择完整语义词对应的各位置概率中选择目标概率链,其中,所述目标概率链中的各位置概率评估值之和为最大位置概率评估值之和,进而将所述目标概率链对应的位置概率评估值之和作为所述通顺度评分,其中,所述位置概率评估值为评估待选择完整语义词与词成分位置的匹配程度的概率的值,进而获得各所述待填补语句对应的通顺度评分。
步骤E20,基于各所述通顺度评分,在各所述完整语义语句中选取目标完整语义语句。
在本实施例中,基于各所述通顺度评分,在各所述完整语义语句中选取目标完整语义语句,具体地,在各所述通顺度评分中选取最大通顺度评分作为目标通顺度评分,并将所述目标通顺度评分对应的完整语义语句作为所述目标完整语义语句。
本实施例提供了一种基于依存句法的语义识别方法、设备和可读存储介质,相比于现有技术采用的基于预先标注好了的上下文配对数据进行训练获得的语义识别模型,对下文语句进行语义识别的技术手段,本实施例在获取待处理语句和所述待处理语句对应的关联语句之后,首先抽取所述关联语句对应的关键实体,进而对所述待处理语句进行依存句法分析,以对所述待处理语句的句子主干抽取,获得所述待处理语句对应的目标句子主干,其中,需要说明的是,在所述待处理语句中除所述目标句子主干之外的非句子主干部分对语义识别的贡献度较小,且对语义识别存在干扰,进而实现了基于依存句法分析的方法,在待处理语句中剔除对语义识别的贡献度小的非句子主干部分的目的,使得目标句子主干更加贴近于待处理语句的真实语义,进而基于所述关键实体和所述目标句子主干,生成所述待处理语句对应的完整语义数据,也即,基于所述关联语句中抽取的关键实体,对目标句子主干中缺失的句子成分进行填补,使得填补后的目标句子主干具备待处理语句的完整语义,获得完整语义数据,进而基于完整语义数据,即可实现对待处理语句的准确语义识别,其中,需要说明的是,本实施例中整个语义识别过程是基于依存句法分析进行的,且依存句法分析可适用于所有对话场景,进而在当前的对话场景更改为新的对话场景时,无需重新进行上下文配对数据的标注,可对下文语句快速进行准确地语义识别,克服了现在技术中基于预先标注好了的上下文配对数据进行训练获得的语义识别模型,对下文语句进行语义识别时,若当前的对话场景更改为新的对话场景,则由于当前的语义识别模型难以适用新的对话场景,将导致语义识别模型难以及时进行准确地语义识别的技术缺陷,提高了语义识别的效率。
进一步地,参照图3,基于本申请中第一实施例,在本申请的另一实施例中,所述对所述待处理语句进行依存句法分析,获得所述待处理语句对应的依存句法分析结果的步骤包括:
步骤S211,对所述待处理语句进行向量化,获得向量化语句;
在本实施例中,对所述待处理语句进行向量化,获得向量化语句,具体地,生成所述待处理语句中每一待处理词对应的待处理词向量、待处理词性向量和待处理词位置向量,其中,所述待处理词向量为表示待处理词的编码向量,用于唯一表示所述待处理词,所述待处理词性向量为表示所述待处理词的词性的编码向量,所述待处理词位置向量为表示所述待处理词在所述待处理语句中的位置的编码向量,进而基于每一所述待处理词对应的待处理词向量、对应的待处理词性向量和对应的待处理词位置向量,生成每一所述待处理词对应的向量化词,进而将各所述向量化词构成的矩阵作为所述向量化语句。
其中,所述待处理语句至少包括一待处理词,所述向量化语句至少包括一向量化词,
所述对所述待处理语句进行向量化,获得向量化语句的步骤包括:
步骤F10,获取所述待处理词对应的待处理词向量、对应的待处理词性向量和对应的待处理词位置向量;
在本实施例中,获取所述待处理词对应的待处理词向量、对应的待处理词性向量和对应的待处理词位置向量,具体地,基于预设词向量生成模型,将所述待处理词映射至预设向量空间,获得所述待处理词对应的待处理词向量,并为所述待处理词匹配对应的待处理词性向量,进一步地,基于所述待处理词在所述待处理语句中的位置,生成所述待处理词对应的待处理词位置向量。
步骤F20,基于所述待处理词向量、所述待处理词性向量和所述待处理词位置向量,生成所述向量化词。
在本实施例中,基于所述待处理词向量、所述待处理词性向量和所述待处理词位置向量,生成所述向量化词,具体地,将所述待处理词、所述待处理词性向量和所述待处理词位置向量输入预设向量化词计算公式,获得所述向量化词,其中,所述预设向量化词计算公式如下所示:
其中,Xi为所述向量化词,Ew为所述待处理词向量,Et为所述待处理词性向量,Ep为所述待处理词位置向量,为向量之间的concate操作。
步骤S212,基于预设依存关系判别模型,对所述向量化语句进行依存关系判别,获得依存关系判别结果;
在本实施例中,需要说明的是,所述预设依存句法模型包括预设依存关系判别模型,其中,所述预设依存关系判别模型为用于判别待处理语句中词与词之间是否存在依存关系的机器学习模型。
基于预设依存关系判别模型,对所述向量化语句进行依存关系判别,获得依存关系判别结果,具体地,将所述向量化语句输入所述预设依存关系判别模型,对所述向量化语句进行依存关系判别,以判别待处理语句中词与词之间是否存在依存关系,获得依存关系判别结果。
其中,所述预设依存关系判别模型包括第一特征提取模型、第一全连接网络、第二全连接网络和第一双仿射变换网络,
所述基于预设依存关系判别模型,对所述向量化语句进行依存关系判别,获得依存关系判别结果的步骤包括:
步骤G10,基于所述第一特征提取模型,对所述向量化语句进行特征提取,获得第一特征提取结果;
在本实施例中,需要说明的是,所述第一特征提取模型为对所述向量化语句进行特征提取的神经网络,所述第一特征提取模型包括Transformer模型、RNN网络和CNN网络等。
基于所述第一特征提取模型,对所述向量化语句进行特征提取,获得第一特征提取结果,具体地,将所述向量化语句输入所述第一特征提取模型,对所述向量化语句进行特征提取,获得第一特征提取矩阵,并将所述第一特征提取矩阵作为所述第一特征提取结果。
步骤G20,基于所述第一全连接网络和所述第二全连接网络,分别对所述第一特征提取结果进行全连接,获得第一句子向量和第二句子向量;
在本实施例中,基于所述第一全连接网络和所述第二全连接网络,分别对所述第一特征提取结果进行全连接,获得第一句子向量和第二句子向量,具体地,将所述第一特征提取矩阵输入第一全连接网络,对所述第一特征提取矩阵进行全连接,获得第一句子向量,并将所述第一特征提取矩阵输入第二全连接网络,对所述第一特征提取矩阵进行全连接,获得第二句子向量,其中,需要说明的是,所述第一句子向量至少包括一词头向量,用于表示依存关系中作为被依存的词的表示向量,所述第二句子向量至少包括一词尾向量,用于表示依存关系中作为依存的词的表示向量,例如,假设词A依存于词B,则词B对应的词表示向量为词头向量,词A对应的词表示向量为词尾向量。
步骤G30,基于所述第一双仿射变换网络,对所述第一句子向量和所述第二句子向量进行双仿射变换,获得依存关系得分矩阵;
在本实施例中,基于所述第一双仿射变换网络,对所述第一句子向量和所述第二句子向量进行双仿射变换,获得依存关系得分矩阵,具体地,将所述第一句子向量和所述第二句子向量输入所述第一双仿射变换网络,对所述第一句子向量和所述第二句子向量进行双仿射变换,以计算第一句子向量中每一词头向量和第二句子向量中每一词尾向量存在依存关系的概率得分,获得所述依存关系得分矩阵,其中,所述依存关系得分矩阵为由每一词头向量和每一词尾向量之间存在依存关系的概率得分组成的得分矩阵。
步骤G40,基于所述依存关系得分矩阵,确定所述依存关系判别结果。
在本实施例中,基于所述依存关系得分矩阵,确定所述依存关系判别结果,具体地基于预设最大生成树算法,在所述依存关系得分矩阵中选取满足预设得分选取条件的最大概率得分和,并将所述最大概率得分和对应的各目标概率得分对应的依存关系对应的向量化词组成的依存关系向量作为所述依存关系判别结果,其中,所述预设得分选取条件包括各目标概率得分对应的待处理词与所述待处理语句中的待处理词一一对应等,例如,假设各所述目标概率得分为A和B,其中,目标概率得分A表示词b依附于词a的概率得分,目标概率得分B表示词c依附于词b的概率得分,且词a对应向量化词为向量X,词b对应向量化词为向量Y,词c对应向量化词为向量Z,进而所述依存关系向量为向量(X,1,0,0,1,Y,1,0,0,1,Z),其中(1,0,0,1)表示词与词之间存在依存关系。
步骤S213,基于预设依存关系类型预测模型和所述依存关系判别结果,对所述向量化语句进行依存关系类型预测,获得所述依存关系类型预测结果。
在本实施例中,所述预设依存句法模型包括预设依存关系类型预测模型,其中,所述预设依存关系类型预测模型为用于预测待处理语句中词与词之间的依存关系类型的机器学习模型。
基于预设依存关系类型预测模型和所述依存关系判别结果,对所述向量化语句进行依存关系类型预测,获得所述依存关系类型预测结果,具体地,基于所述预设依存关系类型预测模型,对所述向量化语句进行依存关系类型预测,获得依存关系类型概率得分矩阵,其中,需要说明的是,所述依存关系类型概率得分矩阵中每一比特位上存在一依存关系类型概率得分向量,其中,所述依存关系类型概率得分向量每一比特位上的数值为预设依存关系类型的概率得分,例如,假设所述依存关系类型概率得分向量为(A,B,C),且所述依存关系类型概率得分向量的第一位对应主谓关系,第二位对应动宾关系,第三位对应并列关系,则A为所述依存关系类型概率得分向量对应的两词之间的依存关系为主谓关系的概率得分,B为所述依存关系类型概率得分向量对应的两词之间的依存关系为动宾关系的概率得分,A为所述依存关系类型概率得分向量对应的两词之间的依存关系为主谓关系的概率得分,进而基于所述依存关系判别结果,在所述依存关系类型概率得分矩阵中选取各目标依存关系类型概率得分向量,进而将各所述目标依存关系类型概率得分向量中的最大数值对应的依存关系类型作为目标依存关系类型,进而获得待处理语句的词与词之间的依存关系类型,也即,获得所述依存关系类型预测结果。
其中,所述依存关系判别结果包括依存关系向量,
所述基于预设依存关系类型预测模型和所述依存关系判别结果,对所述向量化语句进行依存关系类型预测,获得所述依存关系类型预测结果的步骤包括:
步骤H10,基于所述预设依存关系类型预测模型,对所述向量化语句进行依存关系类型预测,获得依存关系类型概率得分矩阵;
在本实施例中,需要说明的是,所述预设依存关系类型预测模型包括第二特征提取模型、第三全连接网络、第四全连接网络和第二双仿射变换网络。
基于所述预设依存关系类型预测模型,对所述向量化语句进行依存关系类型预测,获得依存关系类型概率得分矩阵,具体地,将所述向量化语句输入第二特征提取模型,对所述向量化语句进行特征提取,获得第二特征提取矩阵,并将所述第二特征提取矩阵分别输入第三全连接网络和第四全连接网络,获得所述第二特征提取矩阵对应的第三句子向量和对应的第四句子向量,将所述第三句子向量和所述第四句子向量输入第二双仿射变换网络,对所述第三句子向量和所述第四句子向量进行双仿射变换,获得所述依存关系类型概率得分矩阵。
步骤H20,将所述依存关系类型概率得分矩阵和所述依存关系向量进行融合,获得所述依存关系类型预测结果。
在本实施例中,将所述依存关系类型概率得分矩阵和所述依存关系向量进行融合,获得所述依存关系类型预测结果,具体地,基于预设融合规则,将所述依存关系类型概率得分矩阵中的每一依存关系类型概率得分向量与所述依存关系向量进行融合,获得各所述依存关系类型概率得分向量对应的依存关系类型概率向量,其中,所述预设融合规则包括加权平均、拼接、求和等,所述依存关系类型概率向量每一比特位上的数值为预设依存关系类型的概率,所述预设依存关系类型包括主谓关系类型、动宾关系类型和并列关系类型等,进而分别在各所述依存关系类型概率向量中选取最大概率数值作为目标依存关系类型概率,进而在各所述目标依存关系类型概率中确定符合预设概率选取条件的各最大依存关系类型概率对应的依存关系类型,并将各最大依存关系类型概率对应的依存关系类型作为依存关系类型预测结果,其中,预设概率选取条件包括选取的各最大依存关系类型概率对应的待处理词与所述待处理语句中的各待处理词一一对应,例如,假设待处理语句为ABC,则预设概率选取条件为选取的各最大依存关系类型概率的数量为2,且各最大依存关系类型概率对应的各待处理词可组成待处理语句ABC。
另外地,需要说明的是,在一种实施方式中,所述预设依存句法模型可基于如下步骤训练获得:
步骤M10,获取训练数据和待训练依存句法模型,其中,所述训练数据包括训练语句和所述训练语句对应的预设依存类型标签;
在本实施例中,需要说明的是,所述预设依存类型标签为预先标注好的训练语句中词与词之间的依存关系类型的标识,所述待训练依存句法模型为未训练好的依存句法模型。
获取训练数据和待训练依存句法模型,其中,所述训练数据包括训练语句和所述训练语句对应的预设依存类型标签,具体地,获取标注依存句法分析数据集和待训练依存句法模型,并收集依存句法分析数据集,并对所述依存句法分析数据集进行人工标注,获得人工标注依存句法分析数据集,进而将所述标注依存句法分析数据集和所述人工标注依存句法分析数据集进行合并,获得训练数据集,以扩充所述待训练依存句法模型对应的训练样本的数量。
步骤M20,将所述训练数据输入所述待训练依存句法模型,以对所述训练语句进行依存句法分析,获得类型训练预测标签;
在本实施例中,需要说明的是,所述训练数据至少包括一训练语句。
将所述训练数据输入所述待训练依存句法模型,以对所述训练语句进行依存句法分析,获得类型训练预测标签,具体地,基于所述待训练依存句法模型中的向量化网络,对所述训练语句进行向量化,获得向量化训练语句,进而基于所述待训练依存句法模型中的预设依存关系判别模型,对所述向量化训练语句进行依存关系判别,获得训练依存关系向量,并基于所述待训练依存句法模型中的预设依存关系类型预测模型,对所述向量化训练语句进行依存关系类型预测,获得训练依存关系类型概率得分矩阵,进而将所述训练依存关系向量和所述训练依存关系类型概率得分矩阵,确定类型训练预测标签,其中,所述类型训练预测标签为训练语句对应的依存关系类型的标识。
步骤M30,基于所述类型训练预测标签和所述预设依存类型标签,计算依存句法模型误差;
在本实施例中,基于所述类型训练预测标签和所述预设依存类型标签,计算依存句法模型误差,具体地,计算所述类型训练预测标签和所述预设依存类型标签之间的距离,获得依存句法模型误差。
步骤M40,基于所述依存句法模型误差,对所述待训练依存句法模型进行更新,直至所述待训练依存句法模型满足预设更新结束条件,将所述待训练依存句法模型作为所述预设依存句法模型。
在本实施例中,基于所述依存句法模型误差,对所述待训练依存句法模型进行更新,直至所述待训练依存句法模型满足预设更新结束条件,将所述待训练依存句法模型作为所述预设依存句法模型,具体地,基于所述依存句法模型误差,计算梯度信息,并通过反向传播的方式,根据所述梯度信息,更新所述待训练依存句法模型的模型参数,获得更新后的待训练依存句法模型,进而判断更新后的待训练依存句法模型是否满足预设更新结束条件,若满足,则将更新后的待训练依存句法模型作为所述预设依存句法模型,若不满足,则重新获取训练语句,以对更新后的待训练依存句法模型的模型参数重新进行训练更新,直至更新后的待训练依存句法模型满足预设更新结束条件,其中,所述预设更新结束条件包括达到最大迭代次数和损失函数收敛等。
进一步地,基于训练好的预设依存句法模型,即可训练所述预设复述句识别模型,具体地,获取复述句训练数据和待训练复述句识别模型,其中,所述复述句训练语句包括第一待识别训练语句、第二待识别训练语句和语句标签,其中,所述语句标签为所述第一待识别训练语句和所述第二待识别训练语句是否为复述句的标识,所述复述句训练数据可用向量进行表示,例如,假设所述复述句训练数据为向量(X1,X2,Y),则X1为第一复述句训练语句,X2为所述第二复述句训练语句,Y为所述语句标签,进而生成所述第一待识别训练语句和所述第二待识别训练语句共同对应的训练句子向量表示,并基于所述预设依存句法模型,分别对所述第一待识别训练语句和所述第二待识别训练语句进行依存句法分析,获得所述第一待识别训练语句对应的第一训练依存向量和所述第二待识别训练语句对应的第二训练依存向量,进而将所述训练句子向量表示、所述第一训练依存向量和所述第二训练依存向量聚合后输入所述待训练复述句识别模型,获得输出复述句识别标签,进而基于所述输出复述句识别标签和所述语句标签,计算复述句识别模型误差,并基于所述复述句识别模型误差,对所述待训练复述句识别模型进行更新,直至所述待训练复述句识别模型满足预设训练结束条件,将所述待训练复述句识别模型作为所述预设复述句识别模型,其中,所述预设训练结束条件包括损失函数收敛和模型达到最大迭代次数等。
本实施提供了一种基于机器学习的依存句法分析方法,首先对所述待处理语句进行向量化,获得向量化语句,进而基于预设依存关系判别模型,对所述向量化语句进行依存关系判别,获得依存关系判别结果,进而实现了判定待处理语句的词与词之间是否存在依存关系的目的,进而基于预设依存关系类型预测模型和所述依存关系判别结果,对所述向量化语句进行依存关系类型预测,获得所述依存关系类型预测结果,进而实现了预测待处理语句中词与词之间的依存关系类型的目的,且由于所述依存关系类型是基于预测关系判别结果进行预测的,避免了词与词之间存在依存关系的概率极低时,预测词与词之间存在各种类型的预设依存关系的概率却较高的情况发生,提高了依存关系类型预测的准确性,进而提高了依存句法分析的准确性,进而基于所述依存关系类型预测结果,即可抽取所述待处理语句对应的目标句子主干,进而基于所述关键实体和所述目标句子主干,即可生成所述待处理语句对应的完整语义数据,进而基于完整语义数据,即可实现对待处理语句的准确语义识别,其中,需要说明的是,本申请中整个语义识别过程是基于依存句法分析进行的,且依存句法分析可适用于所有对话场景,进而在当前的对话场景更改为新的对话场景时,无需重新进行上下文配对数据的标注,可对下文语句快速进行准确地语义识别,为克服现在技术中基于预先标注好了的上下文配对数据进行训练获得的语义识别模型,对下文语句进行语义识别时,若当前的对话场景更改为新的对话场景,则由于当前的语义识别模型难以适用新的对话场景,将导致语义识别模型难以及时进行准确地语义识别的技术缺陷奠定了基础,
参照图4,图4是本申请实施例方案涉及的硬件运行环境的设备结构示意图。
如图4所示,该基于依存句法的语义识别设备可以包括:处理器1001,例如CPU,存储器1005,通信总线1002。其中,通信总线1002用于实现处理器1001和存储器1005之间的连接通信。存储器1005可以是高速RAM存储器,也可以是稳定的存储器(non-volatilememory),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储设备。
可选地,该基于依存句法的语义识别设备还可以包括矩形用户接口、网络接口、摄像头、RF(Radio Frequency,射频)电路,传感器、音频电路、WiFi模块等等。矩形用户接口可以包括显示屏(Display)、输入子模块比如键盘(Keyboard),可选矩形用户接口还可以包括标准的有线接口、无线接口。网络接口可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。
本领域技术人员可以理解,图4中示出的基于依存句法的语义识别设备结构并不构成对基于依存句法的语义识别设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图4所示,作为一种计算机存储介质的存储器1005中可以包括操作系统、网络通信模块以及基于依存句法的语义识别程序。操作系统是管理和控制基于依存句法的语义识别设备硬件和软件资源的程序,支持基于依存句法的语义识别程序以及其它软件和/或程序的运行。网络通信模块用于实现存储器1005内部各组件之间的通信,以及与基于依存句法的语义识别系统中其它硬件和软件之间通信。
在图4所示的基于依存句法的语义识别设备中,处理器1001用于执行存储器1005中存储的基于依存句法的语义识别程序,实现上述任一项所述的基于依存句法的语义识别方法的步骤。
本申请基于依存句法的语义识别设备具体实施方式与上述基于依存句法的语义识别方法各实施例基本相同,在此不再赘述。
本申请实施例还提供一种基于依存句法的语义识别装置,所述基于依存句法的语义识别装置应用于基于依存句法的语义识别设备,所述基于依存句法的语义识别装置包括:
第一抽取模块,用于获取待处理语句和所述待处理语句对应的关联语句,并抽取所述关联语句对应的关键实体;
第二抽取模块,用于对所述待处理语句进行依存句法分析,以对所述待处理语句的句子主干抽取,获得所述待处理语句对应的目标句子主干;
生成模块,用于基于所述关键实体和所述目标句子主干,生成所述待处理语句对应的完整语义数据,以对所述待处理语句进行语义识别。
可选地,所述生成模块包括:
判断子模块,用于判断所述目标句子主干是否缺失句子主干成分;
填补子模块,用于若缺失,则基于所述关键填充词,对所述目标句子主干进行缺失成分填补,获得所述完整语义语句。
可选地,所述填补子模块包括:
第一确定单元,用于确定所述目标句子主干的主干缺失成分位置;
填充单元,用于将所述关键填充词填充至所述主干缺失成分位置,获得所述目标句子主干对应的第一填补句子主干;
第一生成单元,用于基于所述第一填补句子主干,生成所述完整语义语句。
可选地,所述填补子模块还包括:
拼接单元,用于将所述关键填充词和所述目标句子主干进行拼接,获得所述完整语义语句。
可选地,所述填补子模块还包括:
填补单元,用于将所述关键填充词和所述目标句子主干输入预设语句填补模型,对所述目标句子主干的缺失成分进行填补,获得第二填补句子主干;
第二生成单元,用于基于所述第二填补句子主干,生成所述完整语义语句。
可选地,所述第二抽取模块包括:
依存句法分析子模块,用于对所述待处理语句进行依存句法分析,获得所述待处理语句对应的依存句法分析结果;
抽取子模块,用于基于所述依存句法分析结果,抽取所述待处理语句对应的所述目标句子主干。
可选地,所述依存句法分析子模块包括:
向量化单元,用于对所述待处理语句进行向量化,获得向量化语句;
判别单元,用于基于预设依存关系判别模型,对所述向量化语句进行依存关系判别,获得依存关系判别结果;
预测单元,用于基于预设依存关系类型预测模型和所述依存关系判别结果,对所述向量化语句进行依存关系类型预测,获得所述依存关系类型预测结果。
可选地,所述判别单元包括:
特征提取子单元,用于基于所述第一特征提取模型,对所述向量化语句进行特征提取,获得第一特征提取结果;
全连接子单元,用于基于所述第一全连接网络和所述第二全连接网络,分别对所述第一特征提取结果进行全连接,获得第一句子向量和第二句子向量;
双仿射变换子单元,用于基于所述第一双仿射变换网络,对所述第一句子向量和所述第二句子向量进行双仿射变换,获得依存关系得分矩阵;
第一确定子单元,用于基于所述依存关系得分矩阵,确定所述依存关系判别结果。
可选地,所述预测单元包括:
预测子单元,用于基于所述预设依存关系类型预测模型,对所述向量化语句进行依存关系类型预测,获得依存关系类型概率得分矩阵;
融合子单元,用于将所述依存关系类型概率得分矩阵和所述依存关系向量进行融合,获得所述依存关系类型预测结果。
可选地,所述抽取子模块包括:
第二确定单元,用于基于所述依存关系类型预测结果,确定所述待处理语句对应的句型信息;
抽取单元,用于基于所述句型信息和所述依存关系类型预测结果,抽取所述目标句子主干。
可选地,所述抽取单元包括:
第二确定子单元,用于基于所述句型信息,确定所述待处理语句对应的目标核心词;
第三确定子单元,用于基于预设词成分优先级和所述依存关系类型预测结果,确定所述目标核心词对应的各目标句子主干词;
生成子单元,用于基于所述句型信息、所述目标核心词和各所述目标句子主干词,生成所述目标句子主干。
可选地,所述基于依存句法的语义识别装置还包括:
评分模块,用于基于预设语言模型,分别对各所述完整语义语句进行语句通顺度评分,获得各所述完整语义语句对应的通顺度评分;
选取模块,用于基于各所述通顺度评分,在各所述完整语义语句中选取目标完整语义语句。
本申请基于依存句法的语义识别装置的具体实施方式与上述基于依存句法的语义识别方法各实施例基本相同,在此不再赘述。
本申请实施例提供了一种可读存储介质,且所述可读存储介质存储有一个或者一个以上程序,所述一个或者一个以上程序还可被一个或者一个以上的处理器执行以用于实现上述任一项所述的基于依存句法的语义识别方法的步骤。
本申请可读存储介质具体实施方式与上述基于依存句法的语义识别方法各实施例基本相同,在此不再赘述。
以上仅为本申请的优选实施例,并非因此限制本申请的专利范围,凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本申请的专利处理范围内。
Claims (11)
1.一种基于依存句法的语义识别方法,其特征在于,所述基于依存句法的语义识别方法包括:
获取待处理语句和所述待处理语句对应的关联语句,并抽取所述关联语句对应的关键实体;
对所述待处理语句进行依存句法分析,以对所述待处理语句的句子主干抽取,获得所述待处理语句对应的目标句子主干;
基于所述关键实体和所述目标句子主干,生成所述待处理语句对应的完整语义数据,以对所述待处理语句进行语义识别;
所述对所述待处理语句进行依存句法分析,以对所述待处理语句的句子主干抽取,获得所述待处理语句对应的目标句子主干的步骤包括:
对所述待处理语句进行依存句法分析,获得所述待处理语句对应的依存句法分析结果;
基于所述依存句法分析结果,抽取所述待处理语句对应的所述目标句子主干;
所述对所述待处理语句进行依存句法分析,获得所述待处理语句对应的依存句法分析结果的步骤包括:
对所述待处理语句进行向量化,获得向量化语句;
基于预设依存关系判别模型,对所述向量化语句进行依存关系判别,获得依存关系判别结果;
基于预设依存关系类型预测模型和所述依存关系判别结果,对所述向量化语句进行依存关系类型预测,获得依存关系类型预测结果;
所述预设依存关系判别模型包括第一特征提取模型、第一全连接网络、第二全连接网络和第一双仿射变换网络,
所述基于预设依存关系判别模型,对所述向量化语句进行依存关系判别,获得依存关系判别结果的步骤包括:
基于所述第一特征提取模型,对所述向量化语句进行特征提取,获得第一特征提取结果;
基于所述第一全连接网络和所述第二全连接网络,分别对所述第一特征提取结果进行全连接,获得第一句子向量和第二句子向量;
基于所述第一双仿射变换网络,对所述第一句子向量和所述第二句子向量进行双仿射变换,获得依存关系得分矩阵;
基于所述依存关系得分矩阵,确定所述依存关系判别结果。
2.如权利要求1所述基于依存句法的语义识别方法,其特征在于,所述完整语义数据至少包括一完整语义语句,所述关键实体至少包括一关键填充词,
所述基于所述关键实体和所述目标句子主干,生成所述待处理语句对应的完整语义语句的步骤包括:
判断所述目标句子主干是否缺失句子主干成分;
若缺失,则基于所述关键填充词,对所述目标句子主干进行缺失成分填补,获得所述完整语义语句。
3.如权利要求2所述基于依存句法的语义识别方法,其特征在于,所述基于所述关键填充词,对所述目标句子主干进行缺失成分填补,获得所述完整语义语句的步骤包括:
确定所述目标句子主干的主干缺失成分位置;
将所述关键填充词填充至所述主干缺失成分位置,获得所述目标句子主干对应的第一填补句子主干;
基于所述第一填补句子主干,生成所述完整语义语句。
4.如权利要求2所述基于依存句法的语义识别方法,其特征在于,所述基于所述关键填充词,对所述目标句子主干进行缺失成分填补,获得所述完整语义语句的步骤包括:
将所述关键填充词和所述目标句子主干进行拼接,获得所述完整语义语句。
5.如权利要求2所述基于依存句法的语义识别方法,其特征在于,所述基于所述关键填充词,对所述目标句子主干进行缺失成分填补,获得所述完整语义语句的步骤包括:
将所述关键填充词和所述目标句子主干输入预设语句填补模型,对所述目标句子主干的缺失成分进行填补,获得第二填补句子主干;
基于所述第二填补句子主干,生成所述完整语义语句。
6.如权利要求1所述基于依存句法的语义识别方法,其特征在于,所述依存关系判别结果包括依存关系向量,
所述基于预设依存关系类型预测模型和所述依存关系判别结果,对所述向量化语句进行依存关系类型预测,获得依存关系类型预测结果的步骤包括:
基于所述预设依存关系类型预测模型,对所述向量化语句进行依存关系类型预测,获得依存关系类型概率得分矩阵;
将所述依存关系类型概率得分矩阵和所述依存关系向量进行融合,获得所述依存关系类型预测结果。
7.如权利要求1所述基于依存句法的语义识别方法,其特征在于,所述依存句法分析结果包括依存关系类型预测结果,
所述基于所述依存句法分析结果,抽取所述待处理语句对应的所述目标句子主干的步骤包括:
基于所述依存关系类型预测结果,确定所述待处理语句对应的句型信息;
基于所述句型信息和所述依存关系类型预测结果,抽取所述目标句子主干。
8.如权利要求7所述基于依存句法的语义识别方法,其特征在于,所述基于所述句型信息和所述依存关系类型预测结果,抽取所述目标句子主干的步骤包括:
基于所述句型信息,确定所述待处理语句对应的目标核心词;
基于预设词成分优先级和所述依存关系类型预测结果,确定所述目标核心词对应的各目标句子主干词;
基于所述句型信息、所述目标核心词和各所述目标句子主干词,生成所述目标句子主干。
9.如权利要求1所述基于依存句法的语义识别方法,其特征在于,所述完整语义数据至少包括一完整语义语句,
在所述基于所述关键实体和所述目标句子主干,生成所述待处理语句对应的完整语义数据的步骤之后,所述基于依存句法的语义识别方法还包括:
基于预设语言模型,分别对各所述完整语义语句进行语句通顺度评分,获得各所述完整语义语句对应的通顺度评分;
基于各所述通顺度评分,在各所述完整语义语句中选取目标完整语义语句。
10.一种基于依存句法的语义识别设备,其特征在于,所述基于依存句法的语义识别设备包括:存储器、处理器以及存储在存储器上的用于实现所述基于依存句法的语义识别方法的程序,
所述存储器用于存储实现基于依存句法的语义识别方法的程序;
所述处理器用于执行实现所述基于依存句法的语义识别方法的程序,以实现如权利要求1至9中任一项所述基于依存句法的语义识别方法的步骤。
11.一种可读存储介质,其特征在于,所述可读存储介质上存储有实现基于依存句法的语义识别方法的程序,所述实现基于依存句法的语义识别方法的程序被处理器执行以实现如权利要求1至9中任一项所述基于依存句法的语义识别方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010964475.8A CN112084793B (zh) | 2020-09-14 | 2020-09-14 | 基于依存句法的语义识别方法、设备和可读存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010964475.8A CN112084793B (zh) | 2020-09-14 | 2020-09-14 | 基于依存句法的语义识别方法、设备和可读存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112084793A CN112084793A (zh) | 2020-12-15 |
CN112084793B true CN112084793B (zh) | 2024-05-14 |
Family
ID=73737938
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010964475.8A Active CN112084793B (zh) | 2020-09-14 | 2020-09-14 | 基于依存句法的语义识别方法、设备和可读存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112084793B (zh) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112733517B (zh) * | 2021-01-12 | 2022-12-06 | 上海复佳信息科技有限公司 | 需求模板符合性检查的方法、电子设备及存储介质 |
CN113268578B (zh) * | 2021-06-24 | 2023-08-29 | 中国平安人寿保险股份有限公司 | 文本语义的识别方法、装置、计算机设备及存储介质 |
CN113626608B (zh) * | 2021-10-12 | 2022-02-15 | 深圳前海环融联易信息科技服务有限公司 | 增强语义的关系抽取方法、装置、计算机设备及存储介质 |
CN114611487B (zh) * | 2022-03-10 | 2022-12-13 | 昆明理工大学 | 基于动态词嵌入对齐的无监督泰语依存句法分析方法 |
CN114861657A (zh) * | 2022-05-18 | 2022-08-05 | 北京金山数字娱乐科技有限公司 | 会议关键句提取方法及装置 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109241538A (zh) * | 2018-09-26 | 2019-01-18 | 上海德拓信息技术股份有限公司 | 基于关键词和动词依存的中文实体关系抽取方法 |
CN110874531A (zh) * | 2020-01-20 | 2020-03-10 | 湖南蚁坊软件股份有限公司 | 一种话题分析方法、装置和存储介质 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8478581B2 (en) * | 2010-01-25 | 2013-07-02 | Chung-ching Chen | Interlingua, interlingua engine, and interlingua machine translation system |
US9461876B2 (en) * | 2012-08-29 | 2016-10-04 | Loci | System and method for fuzzy concept mapping, voting ontology crowd sourcing, and technology prediction |
US20190213284A1 (en) * | 2018-01-11 | 2019-07-11 | International Business Machines Corporation | Semantic representation and realization for conversational systems |
-
2020
- 2020-09-14 CN CN202010964475.8A patent/CN112084793B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109241538A (zh) * | 2018-09-26 | 2019-01-18 | 上海德拓信息技术股份有限公司 | 基于关键词和动词依存的中文实体关系抽取方法 |
CN110874531A (zh) * | 2020-01-20 | 2020-03-10 | 湖南蚁坊软件股份有限公司 | 一种话题分析方法、装置和存储介质 |
Non-Patent Citations (2)
Title |
---|
中文网页语义标注:由句子到RDF表示;荆涛;左万利;孙吉贵;车海燕;;计算机研究与发展(07);全文 * |
自然语言句子抽象语义表示AMR研究综述;曲维光;周俊生;吴晓东;戴茹冰;顾敏;顾彦慧;;数据采集与处理(01);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN112084793A (zh) | 2020-12-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112084793B (zh) | 基于依存句法的语义识别方法、设备和可读存储介质 | |
CN111026842B (zh) | 自然语言处理方法、自然语言处理装置及智能问答系统 | |
CN109033305B (zh) | 问题回答方法、设备及计算机可读存储介质 | |
CN112069801A (zh) | 基于依存句法的句子主干抽取方法、设备和可读存储介质 | |
CN109857846B (zh) | 用户问句与知识点的匹配方法和装置 | |
CN111651996A (zh) | 摘要生成方法、装置、电子设备及存储介质 | |
CN109933792A (zh) | 基于多层双向lstm和验证模型的观点型问题阅读理解方法 | |
US20220358292A1 (en) | Method and apparatus for recognizing entity, electronic device and storage medium | |
CN115238045B (zh) | 一种生成式事件论元抽取方法、系统及存储介质 | |
CN114969278A (zh) | 一种基于知识增强图神经网络的文本问答模型 | |
CN111177402A (zh) | 基于分词处理的评价方法、装置、计算机设备及存储介质 | |
CN116661805B (zh) | 代码表示的生成方法和装置、存储介质及电子设备 | |
CN111291565A (zh) | 一种用于命名实体识别的方法与装置 | |
CN113408287A (zh) | 实体识别方法、装置、电子设备及存储介质 | |
CN112084769A (zh) | 依存句法模型优化方法、装置、设备及可读存储介质 | |
CN113486174B (zh) | 模型训练、阅读理解方法、装置、电子设备及存储介质 | |
CN112633007B (zh) | 一种语义理解模型构建方法及装置、语义理解方法及装置 | |
CN113705207A (zh) | 语法错误识别方法及装置 | |
CN113918710A (zh) | 文本数据处理方法、装置、电子设备和可读存储介质 | |
CN113569578B (zh) | 一种用户意图识别方法、装置和计算机设备 | |
CN111161238A (zh) | 图像质量评价方法及装置、电子设备、存储介质 | |
CN116258147A (zh) | 一种基于异构图卷积的多模态评论情感分析方法及系统 | |
CN115689603A (zh) | 用户反馈信息收集方法、装置及用户反馈系统 | |
CN112069800A (zh) | 基于依存句法的句子时态识别方法、设备和可读存储介质 | |
CN112668345B (zh) | 语法缺陷数据识别模型构建方法和语法缺陷数据识别方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |