CN110532558B - 一种基于句子结构深层解析的多意图识别方法及系统 - Google Patents
一种基于句子结构深层解析的多意图识别方法及系统 Download PDFInfo
- Publication number
- CN110532558B CN110532558B CN201910808700.6A CN201910808700A CN110532558B CN 110532558 B CN110532558 B CN 110532558B CN 201910808700 A CN201910808700 A CN 201910808700A CN 110532558 B CN110532558 B CN 110532558B
- Authority
- CN
- China
- Prior art keywords
- vector
- relation
- word
- semantic
- intention
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Machine Translation (AREA)
Abstract
本发明涉及一种多意图识别方法及系统,其中,多意图识别方法,包括以下步骤:获取用户的语言信息;对语言信息进行预处理;根据语言修正信息中每个词构建对应词的特征向量;根据长短时记忆模型对每个词的字符向量进行编码;根据编码字符向量、词向量、词性向量、NER向量和本体向量经Bi‑LSTM编码;根据深度神经网络对隐向量进行编码;根据父子关系矩阵和句法关系矩阵识别目标词的父词和父词与目标前词的句法关系;根据预设配价知识库对父词和句法关系进行语义解析;根据语义关系进行意图分类。在本发明的技术方案中,其能够根据句子结构对单个句子进行深层解析,解析出单个句子中包含的多意图信息。
Description
技术领域
本发明涉及语言识别领域,尤其涉及一种基于句子结构深层解析的多意图识别方法和一种基于句子结构深层解析的多意图识别系统。
背景技术
意图识别是指在人机交互的过程中,机器对于用户的自然语言进行理解,识别出用户的具体意图。例如在智能家居的人机对话系统中,用户对聊天机器人说“帮我打开灯”,那么用户的意图就是“打开灯”的设备操作。意图识别在人工智能领域的人机对话系统和信息检索领域都有广泛的应用。
当前,意图识别的算法主要是针对单个意图的分类或者匹配,所谓单意图是指句子中只有一个意图,如“帮我打开灯”只有“打开灯”的意图。但是在实际应用中,用户会在句子中表达多个意图,比如“打开灯关闭空调”就包含了“打开灯”和“关闭空调”两个意图。在处理这类多意图的句子时,目前的分类算法和匹配算法都会遇到相应的困难。因为分类算法和匹配算法都归属于1-best的类型,即从多选项中选择出一个最好的类别。这种处理方式天然地与多意图相对立。
为了支持多意图,当前的分类算法和匹配算法多采用拆分句子的方案。但当前拆分句子的方案还只是局限于句子的表层信息,如根据句子中的标点符号来做拆分,或根据句子中的动词来做拆分。但是这些处理方案都能很容易的找到反面案例,比如句子中可能并不存在标点符号,又比如句子中的单个的动词并不能表达出用户的意图。因此上述的处理方案并不能从根本上将一个多意图的句子拆分成多个单意图的句子。
发明内容
本发明旨在至少解决现有技术或相关技术中存在的技术问题之一。
为此,本发明的一个目的在于提供一种基于句子结构深层解析的多意图识别方法,其能够根据句子结构对单个句子进行深层解析,解析出单个句子中包含的多意图信息。
本发明的另一个目的在于提供一种基于句子结构深层解析的多意图识别系统,其能够根据单个句子的结构解析出该句子中所包含的所有语义关系,然后将这些语义关系映射成意图。
为实现上述目的,本发明第一方面的技术方案提供了一种基于句子结构深层解析的多意图识别方法,包括以下步骤:获取用户的语言信息;对语言信息进行预处理,得到语言修正信息;根据语言修正信息中每个词构建对应词的特征向量,特征向量包括字符向量、词向量、词性向量、NER向量和本体向量;根据长短时记忆模型对每个词的字符向量进行编码,得到编码字符向量;根据编码字符向量、词向量、词性向量、NER向量和本体向量经Bi-LSTM编码,得到隐向量;根据深度神经网络对隐向量进行编码,得到语言修正信息中词与词之间的父子关系矩阵和句法关系矩阵;根据父子关系矩阵和句法关系矩阵识别目标词的父词和父词与目标词的句法关系;根据预设配价知识库对父词和句法关系进行语义解析,得到语义关系;根据语义关系进行意图分类,并得到对应于语言信息的多意图集合。
在该技术方案中,本方法通过对句子结构进行深层解析,分析出句子中词语间的语义关系。对这些语义关系做意图分类,汇总得出句子的多意图;在LSTM网络的Embedding层(词嵌入层)融入了词的字符特征、词特征、词性特征、NER(Named Entity Recognition,名实体)特征,以及词的本体特征,同时采用RNN对词的多字符编码,能够使对单个语句的意图识别更加准确。
在上述技术方案中,优选地,根据语义关系进行意图分类,并得到对应于语言信息的多意图集合包括以下步骤:根据深度神经网络对语义关系进行编码,形成语义向量;根据深度神经网络对语义向量和特征向量拼接成一个,得到拼接向量,并对拼接向量进行编码;根据归一化指数函数对编码后的拼接向量进行识别,得到对应于语义关系的意图类别;对语义关系的意图类别进行汇总,得到多意图集合。
在该技术方案中,本方法不仅能够接收序列化的句子字符和词的信息,还能够接收句子深层结构解析后的结构化语义信息,这两类输入信息凭借各自的特征网络层(DNN网络和Bi-LSTM网络)编码成向量,然后通过汇总网络层(深度神经网络)和分类器输出对应的意图类别。
在上述任一技术方案中,优选地,预处理包括数字转变和错别字纠正中的至少一种。
在该技术方案中,通过对接收的语言信息进行数字转变、错别字纠正等处理,保证语言信息的正确性,从而进一步提高多意图识别的准确性。
在上述任一技术方案中,优选地,句法关系包括主谓关系、动宾关系、述补关系、偏正关系、后补关系、并列关系、承接关系、递进关系、选择关系、转折关系、假设关系、因果关系、条件关系、解说关系和目的关系中的至少一种。
在上述任一技术方案中,优选地,Bi-LSTM编码为双向LSTM编码。
本发明第二方面的技术方案提供了一种基于句子结构深层解析的多意图识别系统,包括:获取模块,被设置为用于获取用户的语言信息;预处理模块,被设置为用于对语言信息进行预处理,得到语言修正信息;向量构建模块,被设置为用于根据语言修正信息中每个词构建对应词的特征向量,特征向量包括字符向量、词向量、词性向量、NER向量和本体向量;向量编码模块,被设置为用于根据长短时记忆模型对每个词的字符向量进行编码,得到编码字符向量;Bi-LSTM编码模块,被设置为用于根据编码字符向量、词向量、词性向量、NER向量和本体向量经Bi-LSTM编码,得到隐向量;矩阵构建模块,被设置为用于根据深度神经网络对隐向量进行编码,得到语言修正信息中词与词之间的父子关系矩阵和句法关系矩阵;句法关系识别模块,被设置为用于根据父子关系矩阵和句法关系矩阵识别目标词的父词和父词与目标词的句法关系;语义解析模块,被设置为用于根据预设配价知识库对父词和句法关系进行语义解析,得到语义关系;意图分类模块,被设置为用于根据语义关系进行意图分类,并得到对应于语言信息的多意图集合。
在该技术方案中,本系统通过对句子结构进行深层解析,分析出句子中词语间的语义关系。对这些语义关系做意图分类,汇总得出句子的多意图;在LSTM网络的Embedding层(词嵌入层)融入了词的字符特征、词特征、词性特征、NER(Named Entity Recognition,名实体)特征,以及词的本体特征,同时采用RNN对词的多字符编码,能够使对单个语句的意图识别更加准确。
在上述技术方案中,优选地,意图分类模块包括:语义向量单元,被设置为用于根据深度神经网络对语义关系进行编码,形成语义向量;拼接单元,被设置为用于根据深度神经网络对语义向量和特征向量拼接成一个,得到拼接向量,并对拼接向量进行编码;意图分类单元,被设置为用于根据归一化指数函数对编码后的拼接向量进行识别,得到对应于语义关系的意图类别;汇总单元,被设置为用于对语义关系的意图类别进行汇总,得到多意图集合。
在该技术方案中,本系统不仅能够接收序列化的句子字符和词的信息,还能够接收句子深层结构解析后的结构化语义信息,这两类输入信息凭借各自的特征网络层(DNN网络和Bi-LSTM网络)编码成向量,然后通过汇总网络层(深度神经网络)和分类器输出对应的意图类别。
在上述任一技术方案中,优选地,预处理模块包括数字转变单元和错别字纠正单元。
在该技术方案中,数字转变单元能够对接收的语言信息进行数字转变且错别字纠正单元能够对接收的语言信息进行错别字纠正,能够保证语言信息的正确性,从而进一步提高多意图识别的准确性。
在上述任一技术方案中,优选地,句法关系包括主谓关系、动宾关系、述补关系、偏正关系、后补关系、并列关系、承接关系、递进关系、选择关系、转折关系、假设关系、因果关系、条件关系、解说关系和目的关系中的至少一种。
在上述任一技术方案中,优选地,Bi-LSTM编码为双向LSTM编码。
附图说明
本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描 述中将变得明显和容易理解,其中:
图1示出了本发明一个实施例所涉及的多意图识别方法的流程框图;
图2示出了本发明另一个实施例所涉及的多意图识别方法的流程框图;
图3示出了本发明第三个实施例所涉及的多意图识别系统的结构框图;
图4示出了本发明第四个实施例所涉及的多意图识别系统的结构框图;
图5示出了本发明第五个实施例所涉及的多意图识别系统的结构框图。
实施方式
为了能够更清楚地理解本发明的上述目的、特征和优点,下面结合附图和具体实施方式对本发明进行进一步的详细描述。需要说明的是,在不冲突的情况下,本申请的实施例及实施例中的特征可以相互组合。
在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是,本发明还可以采用其他不同于在此描述的其他方式来实施,因此,本发明的保护范围并不限于下面公开的具体实施例的限制。
下面参照图1至图5描述根据本发明一些实施例的基于句子结构深层解析的多意图识别方法及系统。
如图1所示,按照本发明一个实施例的基于句子结构深层解析的多意图识别方法,包括以下步骤:
S10,获取用户的语言信息;
S20,对语言信息进行预处理,得到语言修正信息;
S30,根据语言修正信息中每个词构建对应词的特征向量,特征向量包括字符向量、词向量、词性向量、NER向量和本体向量;
由于一个词汇对应多个字符,因此,S40,根据长短时记忆模型对每个词的字符向量进行编码,得到编码字符向量;
S50,根据编码字符向量、词向量、词性向量、NER向量和本体向量经Bi-LSTM编码,得到隐向量;
S60,根据深度神经网络对隐向量进行编码,得到语言修正信息中词与词之间的父子关系矩阵和句法关系矩阵;
S70,根据父子关系矩阵和句法关系矩阵识别目标词的父词和父词与目标词的句法关系;
S80,根据预设配价知识库对父词和句法关系进行语义解析,得到语义关系;
S90,根据语义关系进行意图分类,并得到对应于语言信息的多意图集合。
在该实施例中,本方法通过对句子结构进行深层解析,分析出句子中词语间的语义关系。对这些语义关系做意图分类,汇总得出句子的多意图;在LSTM网络的Embedding层(词嵌入层)融入了词的字符特征、词特征、词性特征、NER(Named Entity Recognition,名实体)特征,以及词的本体特征,同时采用RNN对词的多字符编码,能够使对单个语句的意图识别更加准确。
如图2所示,按照本发明另一个实施例的基于句子结构深层解析的多意图识别方法,S90,根据语义关系进行意图分类,并得到对应于语言信息的多意图集合,此步骤利用“分类模型”来分析各语义关系的意图,为提高系统的泛化能力,模型的输入来源包括两部分:句子和语义关系,其具体包括以下步骤:
S901,根据深度神经网络对语义关系进行编码,形成语义向量;
S902,根据深度神经网络对语义向量和特征向量进行拼接,得到拼接向量,并对拼接向量进行编码;
S903,根据归一化指数函数对编码后的拼接向量进行识别,得到对应于语义关系的意图类别;
在步骤S902中,拼接向量经过了DNN(深度神经网络)编码,输出一个向量Z。此输出层和softmax的输入层之间有一层网络全连接,设此网络连接的权重矩阵为W,则softmax的输入V=WZ。假设V是一个n维向量,softmax会对其做一个归一化处理,作为最终的输出S,公式为:
。
S904,对语义关系的意图类别进行汇总,得到多意图集合;
其中,每个语义关系都具有相对应的意图,语言信息的最终意图就是该信息中包含的所有语义关系对应的意图类别的集合,从而实现了语言信息的多意图识别。
在该实施例中,本方法不仅能够接收序列化的句子字符和词的信息,还能够接收句子深层结构解析后的结构化语义信息,这两类输入信息凭借各自的特征网络层(DNN网络和Bi-LSTM网络)编码成向量,然后通过汇总网络层(深度神经网络)和分类器输出对应的意图类别。
在本实施例中,结构化的语义关系和序列化的句子字符信息在各自的特征网络中被编码成向量。其中,语义关系的特征网络选用DNN(Deep Neural Network,深度神经网络),句子输入采用了Bi-LSTM(Bi-directional Long Short Term Memory,双向LSTM)作为特征网络。
本发明第三个实施例的基于句子结构深层解析的多意图识别方法中,预处理包括数字转变和错别字纠正中的至少一种。
在该实施例中,通过对接收的语言信息进行数字转变、错别字纠正等处理,保证语言信息的正确性,从而进一步提高多意图识别的准确性。
如图3所示,按照本发明第三个实施例的基于句子结构深层解析的多意图识别系统1000,包括:
获取模块10,被设置为用于获取用户的语言信息;
预处理模块20,被设置为用于对语言信息进行预处理,得到语言修正信息;
向量构建模块30,被设置为用于根据语言修正信息中每个词构建对应词的特征向量,特征向量包括字符向量、词向量、词性向量、NER向量和本体向量;
向量编码模块40,被设置为用于根据递归神经网络对每个词的字符向量进行编码,得到编码字符向量;
Bi-LSTM编码模块50,被设置为用于根据编码字符向量、词向量、词性向量、NER向量和本体向量经Bi-LSTM编码,得到隐向量;
矩阵构建模块60,被设置为用于根据深度神经网络对隐向量进行编码,得到语言修正信息中词与词之间的父子关系矩阵和句法关系矩阵;
句法关系识别模块70,被设置为用于根据父子关系矩阵和句法关系矩阵识别目标词的父词和父词与目标词的句法关系;
语义解析模块80,被设置为用于根据预设配价知识库对父词和句法关系进行语义解析,得到语义关系;
意图分类模块90,被设置为用于根据语义关系进行意图分类,并得到对应于语言信息的多意图集合。
在该实施例中,本系统通过对句子结构进行深层解析,分析出句子中词语间的语义关系。对这些语义关系做意图分类,汇总得出句子的多意图;在LSTM网络的Embedding层(词嵌入层)融入了词的字符特征、词特征、词性特征、NER(Named Entity Recognition,名实体)特征,以及词的本体特征,同时采用RNN对词的多字符编码,能够使对单个语句的意图识别更加准确。
如图4所示,按照本发明第四个实施例的基于句子结构深层解析的多意图识别系统,意图分类模块90包括:
语义向量单元901,被设置为用于根据深度神经网络对语义关系进行编码,形成语义向量;
拼接单元902,被设置为用于根据深度神经网络对语义向量和特征向量拼接成一个,得到拼接向量,并对拼接向量进行编码;
意图分类单元903,被设置为用于根据归一化指数函数对编码后的拼接向量进行识别,得到对应于语义关系的意图类别;
汇总单元904,被设置为用于对语义关系的意图类别进行汇总,得到多意图集合。
在该实施例中,本系统不仅能够接收序列化的句子字符和词的信息,还能够接收句子深层结构解析后的结构化语义信息,这两类输入信息凭借各自的特征网络层(DNN网络和Bi-LSTM网络)编码成向量,然后通过汇总网络层(深度神经网络)和分类器输出对应的意图类别。
如图5所示,按照本发明第五个实施例的基于句子结构深层解析的多意图识别系统,预处理模块20包括数字转变单元201和错别字纠正单元202。
在该实施例中,数字转变单元能够对接收的语言信息进行数字转变且错别字纠正单元能够对接收的语言信息进行错别字纠正,能够保证语言信息的正确性,从而进一步提高多意图识别的准确性。
在上述任一实施例中,优选地,句法关系包括主谓关系、动宾关系、述补关系、偏正关系、后补关系、并列关系、承接关系、递进关系、选择关系、转折关系、假设关系、因果关系、条件关系、解说关系和目的关系中的至少一种。
在上述任一实施例中,优选地,Bi-LSTM编码为双向LSTM编码。
在该实施例中,双向长短时递归神经网络(Bidirectional Long Short-termMemory,Bi-LSTM)在对当前语音帧进行判断时,不仅可以有效利用“历史”的语言信息,还可以利用“未来”的语言信息,这使得原始输入的语音特征能够得到更有效的挖掘,从而进行更加准确的决策。
需要说明的是,在本发明上述任一实施例中,深度神经网络(Deep NeuralNetworks,简称DNN)是一款语音识别软件,其工作原理是模仿人脑思考方式,从而使该软件的语音识别速度更快,识别准确率也更高。
深度神经网络可以根据大量的文本、语音等基于自然语言中词与词的父子关系和句法关系训练得到。这里,利用训练好的深度神经网络识别出语言信息中词与词父子关系和句法关系。
长短时递归神经网络(Long Short-term Memory Recurrent Neural Network,LSTM-RNN)被认为是一种高效并且应用广泛的语音识别领域的深度学习框架。LSTM通过在传统递归神经网络RNN基础上引入长短时记忆模块,有效解决了传统简单RNN训练梯度消失等问题,此外RNN的网络结构使得语音时序序列中时间维度的信息得到利用,因而较之传统深度学习框架如,实用性和准确度上有了很大提升。而双向长短时递归神经网络(Bidirectional Long Short-term Memory,Bi-LSTM)在对当前语音帧进行判断时,不仅可以有效利用“历史”的语言信息,还可以利用“未来”的语言信息,这使得原始输入的语音特征能够得到更有效的挖掘,从而进行更加准确的决策。
递归神经网络(RNN)是两种人工神经网络的总称。一种是时间递归神经网络(recurrent neural network),另一种是结构递归神经网络(recursive neuralnetwork)。时间递归神经网络的神经元间连接构成有向图,而结构递归神经网络利用相似的神经网络结构递归构造更为复杂的深度网络。两者训练的算法不同,但属于同一算法变体。
人工神经网络的发展历史己有60多年,是采用物理可实现的系统模仿人脑神经细胞的结构和功能,是在神经生理学和神经解剖学的基础上,利用电子技术、光学技术等模拟生物神经网络的结构和功能原理而发展起来的一门新兴的边缘交叉学科,(下面简称为神经网络,NeuralNetwork)。这些学科相互结合,相互渗透和相互推动。神经网络是当前科学理论研究的主要"热点"之一,它的发展对目前和未来的科学技术的发展将有重要的影响。神经网络的主要特征是:大规模的并行处理、分布式的信息存储、良好的自适应性、自组织性、以及很强的学习能力、联想能力和容错能力。神经网络在处理自然语言理解、图像识别、智能机器人控制等方面具有独到的优势。与冯·诺依曼计算机相比,神经网络更加接近人脑的信息处理模式。
自从20世纪80年代,Hopfield首次提出了利用能量函数的概念来研究一类具有固定权值的神经网络的稳定性并付诸电路实现以来,关于这类具有固定权值神经网络稳定性的定性研究得到大量的关注。由于神经网络的各种应用取决于神经网络的稳定特性,所以,关于神经网络的各种稳定性的定性研究就具有重要的理论和实际意义。递归神经网络具有较强的优化计算能力,是目前神经计算应用最为广泛的一类神经网络模型。
根据不同的划分标准,神经网络可划分成不同的种类。按连接方式来分主要有两种:前向神经网络和反馈(递归)神经网络。前向网络主要是函数映射,可用于模式识别和函数逼近。递归神经网络因为有反馈的存在,所以它是一个非线性动力系统,可用来实现联想记忆和求解优化等问题。由于神经网络的记亿信息都存储在连接权上,根据连接权的获取方式来划分,一般可分为有监督神经网络、无监督神经网络和固定权值神经网络。有监督学习是在网络训练往往要基于一定数量的训练样木。在学习和训练过程中,网络根据实际输出与期望输出的比较,进行连接权值和阂值的调节。通常称期望输出为教师信号,是评价学习的标准。最典型的有监督学习算法是BP(BackProPagation)算法。对于无监督学习,无教师信号提供给网络,网络能根据其特有的结构和学习规则,进行连接权值和闽值的调整,以表示外部输入的某种固有特征。
预设配价知识库是指维护词的配价成分,即各成分所需的本体类别。表达格式为:父词(配价成分1,配价成分2,。。。),配价成分1(本体类别1,本体类别2,。。。),配价成分2(本体类别1,本体类别2,。。。)。以“打开”为例,其配价知识表达为:
打开(施事,受事),施事(人,),受事(设备,物品);
句法分析解析出围绕着父词构句的句法成分,这些句法成分的本体类别会和父词的配价知识进行一一匹配。根据匹配的结果确定各句法成分分别扮演什么样的语义关系。以“我打开了灯”为例,其句法关系是:
“打开”的主语:“我”;本体类别:人;
“打开”的宾语:“灯”;本体类别:设备。
然后将句法关系和“打开”的配价成分进行一一匹配,可以分析出:
“打开”的施事:“我”;
“打开”的受事:“灯”。
本发明实施例还提供一种计算机存储介质(非临时性计算机可读存储介质),所述计算机存储介质存储有计算机程序,所述计算机程序包括程序信令,所述程序信令当被计算机执行时使所述计算机执行如前述实施例所述的方法,所述计算机可以为上述提到的多意图识别装置或电子设备的一部分。
上述非临时性计算机可读存储介质可以采用一个或多个计算机可读的介质的任意组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ReadOnly Memory;以下简称:ROM)、可擦式可编程只读存储器(Erasable Programmable ReadOnly Memory;以下简称:EPROM)或闪存、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本文件中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。
计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于无线、电线、光缆、RF等等,或者上述的任意合适的组合。
可以以一种或多种程序设计语言或其组合来编写用于执行本申请操作的计算机程序代码,所述程序设计语言包括面向对象的程序设计语言—诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言—诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络,包括局域网(Local AreaNetwork;以下简称:LAN)或广域网(Wide Area Network;以下简称:WAN)连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
本申请实施例还提供一种计算机程序产品,当上述计算机程序产品中的指令由处理器执行时,可以实现本申请图1和图2所示实施例提供的基于句子结构深层解析的多意图识别方法。
在本发明中,术语“第一”、“第二”、“第三”仅用于描述的目的,而不能理解为指示或暗示相对重要性;术语“多个”则指两个或两个以上,除非另有明确的限定。术语“安装”、“相连”、“连接”、“固定”等术语均应做广义理解,例如,“连接”可以是固定连接,也可以是可拆卸连接,或一体地连接;“相连”可以是直接相连,也可以通过中间媒介间接相连。对于本领域的普通技术人员而言,可以根据具体情况理解上述术语在本发明中的具体含义。
本发明的描述中,需要理解的是,术语“上”、“下”、“左”、“右”、“前”、“后”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或单元必须具有特定的方向、以特定的方位构造和操作,因此,不能理解为对本发明的限制。
在本说明书的描述中,术语“一个实施例”、“一些实施例”、“具体实施例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或实例。而且,描述的具体特征、结构、材料或特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种基于句子结构深层解析的多意图识别方法,其特征在于,包括以下步骤:
获取用户的语言信息;
对所述语言信息进行预处理,得到语言修正信息;
根据所述语言修正信息中每个词构建对应所述词的特征向量,所述特征向量包括字符向量、词向量、词性向量、NER向量和本体向量;
根据长短时记忆模型对每个所述词的所述字符向量进行编码,得到编码字符向量;
根据所述编码字符向量、所述词向量、所述词性向量、所述NER向量和所述本体向量经Bi-LSTM编码,得到隐向量;
根据深度神经网络对所述隐向量进行编码,得到所述语言修正信息中词与词之间的父子关系矩阵和句法关系矩阵;
根据所述父子关系矩阵和所述句法关系矩阵识别目标词的父词和所述父词与所述目标词的句法关系;
根据预设配价知识库对所述父词和所述句法关系进行语义解析,得到语义关系;
根据语义关系进行意图分类,并得到对应于所述语言信息的多意图集合。
2.根据权利要求1所述的基于句子结构深层解析的多意图识别方法,其特征在于,根据语义关系进行意图分类,并得到对应于所述语言信息的多意图集合包括以下步骤:
根据所述深度神经网络对所述语义关系进行编码,形成语义向量;
根据深度神经网络对所述语义向量和所述特征向量拼接成一个,得到拼接向量,并对所述拼接向量进行编码;
根据归一化指数函数对编码后的所述拼接向量进行识别,得到对应于所述语义关系的意图类别;
对所述语义关系的所述意图类别进行汇总,得到所述多意图集合。
3.根据权利要求1或2所述的基于句子结构深层解析的多意图识别方法,其特征在于:所述预处理包括数字转变和错别字纠正中的至少一种。
4.根据权利要求1或2所述的基于句子结构深层解析的多意图识别方法,其特征在于:所述句法关系包括主谓关系、动宾关系、述补关系、偏正关系、后补关系、并列关系、承接关系、递进关系、选择关系、转折关系、假设关系、因果关系、条件关系、解说关系和目的关系中的至少一种。
5.根据权利要求1或2所述的基于句子结构深层解析的多意图识别方法,其特征在于:所述Bi-LSTM编码为双向LSTM编码。
6.一种基于句子结构深层解析的多意图识别系统,其特征在于,包括:
获取模块,被设置为用于获取用户的语言信息;
预处理模块,被设置为用于对所述语言信息进行预处理,得到语言修正信息;
向量构建模块,被设置为用于根据所述语言修正信息中每个词构建对应所述词的特征向量,所述特征向量包括字符向量、词向量、词性向量、NER向量和本体向量;
向量编码模块,被设置为用于根据长短时记忆模型对每个所述词的所述字符向量进行编码,得到编码字符向量;
Bi-LSTM编码模块,被设置为用于根据所述编码字符向量、所述词向量、所述词性向量、所述NER向量和所述本体向量经Bi-LSTM编码,得到隐向量;
矩阵构建模块,被设置为用于根据深度神经网络对所述隐向量进行编码,得到所述语言修正信息中词与词之间的父子关系矩阵和句法关系矩阵;
句法关系识别模块,被设置为用于根据所述父子关系矩阵和所述句法关系矩阵识别目标词的父词和所述父词与所述目标词的句法关系;
语义解析模块,被设置为用于根据预设配价知识库对所述父词和所述句法关系进行语义解析,得到语义关系;
意图分类模块,被设置为用于根据语义关系进行意图分类,并得到对应于所述语言信息的多意图集合。
7.根据权利要求6所述的基于句子结构深层解析的多意图识别系统,其特征在于,所述意图分类模块包括:
语义向量单元,被设置为用于根据所述深度神经网络对所述语义关系进行编码,形成语义向量;
拼接单元,被设置为用于根据深度神经网络对所述语义向量和所述特征向量拼接成一个,得到拼接向量,并对所述拼接向量进行编码;
意图分类单元,被设置为用于根据归一化指数函数对编码后的所述拼接向量进行识别,得到对应于所述语义关系的意图类别;
汇总单元,被设置为用于对所述语义关系的所述意图类别进行汇总,得到所述多意图集合。
8.根据权利要求6或7所述的基于句子结构深层解析的多意图识别系统,其特征在于:所述预处理模块包括数字转变单元和错别字纠正单元。
9.根据权利要求6或7所述的基于句子结构深层解析的多意图识别系统,其特征在于:所述句法关系包括主谓关系、动宾关系、述补关系、偏正关系、后补关系、并列关系、承接关系、递进关系、选择关系、转折关系、假设关系、因果关系、条件关系、解说关系和目的关系中的至少一种。
10.根据权利要求6或7所述的基于句子结构深层解析的多意图识别系统,其特征在于:所述Bi-LSTM编码为双向LSTM编码。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910808700.6A CN110532558B (zh) | 2019-08-29 | 2019-08-29 | 一种基于句子结构深层解析的多意图识别方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910808700.6A CN110532558B (zh) | 2019-08-29 | 2019-08-29 | 一种基于句子结构深层解析的多意图识别方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN110532558A CN110532558A (zh) | 2019-12-03 |
CN110532558B true CN110532558B (zh) | 2023-07-18 |
Family
ID=68665231
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910808700.6A Active CN110532558B (zh) | 2019-08-29 | 2019-08-29 | 一种基于句子结构深层解析的多意图识别方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110532558B (zh) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111126056B (zh) * | 2019-12-06 | 2023-05-09 | 北京明略软件系统有限公司 | 一种识别触发词的方法及装置 |
CN111488740B (zh) * | 2020-03-27 | 2023-12-22 | 北京百度网讯科技有限公司 | 一种因果关系的判别方法、装置、电子设备及存储介质 |
CN113553855A (zh) * | 2020-04-26 | 2021-10-26 | 阿里巴巴集团控股有限公司 | 观点角色标注方法、装置、计算机设备和介质 |
CN111723207B (zh) * | 2020-06-19 | 2022-07-08 | 思必驰科技股份有限公司 | 意图识别方法及系统 |
CN112256864B (zh) * | 2020-09-23 | 2024-05-14 | 北京捷通华声科技股份有限公司 | 多意图识别的方法、装置、电子设备及可读存储介质 |
CN112434133B (zh) * | 2020-12-02 | 2024-05-17 | 康佳集团股份有限公司 | 一种意图分类方法、装置、智能终端及存储介质 |
CN114818665B (zh) * | 2022-04-22 | 2023-05-12 | 电子科技大学 | 一种基于bert+bilstm+crf与xgboost模型的多意图识别方法和系统 |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109858030A (zh) * | 2019-02-11 | 2019-06-07 | 北京邮电大学 | 双向的意图槽值交叉相关的任务型对话理解系统及方法 |
Family Cites Families (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007141090A (ja) * | 2005-11-21 | 2007-06-07 | Fuji Xerox Co Ltd | 質問応答システム、およびデータ検索方法、並びにコンピュータ・プログラム |
KR100764174B1 (ko) * | 2006-03-03 | 2007-10-08 | 삼성전자주식회사 | 음성 대화 서비스 장치 및 방법 |
KR102175539B1 (ko) * | 2013-10-18 | 2020-11-06 | 에스케이텔레콤 주식회사 | 사용자 발화 스타일에 따른 대화형 서비스 장치 및 방법 |
CN108334496B (zh) * | 2018-01-30 | 2020-06-12 | 中国科学院自动化研究所 | 用于特定领域的人机对话理解方法与系统及相关设备 |
-
2019
- 2019-08-29 CN CN201910808700.6A patent/CN110532558B/zh active Active
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109858030A (zh) * | 2019-02-11 | 2019-06-07 | 北京邮电大学 | 双向的意图槽值交叉相关的任务型对话理解系统及方法 |
Non-Patent Citations (1)
Title |
---|
人机对话系统中意图识别方法综述;刘娇;李艳玲;林民;;计算机工程与应用(12);6-12、48 * |
Also Published As
Publication number | Publication date |
---|---|
CN110532558A (zh) | 2019-12-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110532558B (zh) | 一种基于句子结构深层解析的多意图识别方法及系统 | |
CN110334354B (zh) | 一种中文关系抽取方法 | |
WO2021233112A1 (zh) | 基于多模态机器学习的翻译方法、装置、设备及存储介质 | |
CN110188202B (zh) | 语义关系识别模型的训练方法、装置及终端 | |
CN114676234A (zh) | 一种模型训练方法及相关设备 | |
CN112101044B (zh) | 一种意图识别方法、装置及电子设备 | |
CN113987169A (zh) | 基于语义块的文本摘要生成方法、装置、设备及存储介质 | |
Hu et al. | Considering optimization of English grammar error correction based on neural network | |
CN112883737B (zh) | 基于中文命名实体识别的机器人语言指令分析方法及系统 | |
Yan et al. | Sentiment analysis of student texts using the CNN-BiGRU-AT model | |
CN111858898A (zh) | 基于人工智能的文本处理方法、装置及电子设备 | |
CN114676255A (zh) | 文本处理方法、装置、设备、存储介质及计算机程序产品 | |
CN111597816A (zh) | 一种自注意力命名实体识别方法、装置、设备及存储介质 | |
CN112036186A (zh) | 语料标注方法、装置、计算机存储介质及电子设备 | |
Lin et al. | Multi-channel word embeddings for sentiment analysis | |
CN112257432A (zh) | 一种自适应意图识别方法、装置及电子设备 | |
CN116975292A (zh) | 信息识别方法、装置、电子设备、存储介质及程序产品 | |
CN111666375A (zh) | 文本相似度的匹配方法、电子设备和计算机可读介质 | |
CN116595979A (zh) | 一种基于标签提示的命名实体识别方法、装置及介质 | |
CN111368531A (zh) | 翻译文本处理方法、装置、计算机设备和存储介质 | |
CN116662924A (zh) | 基于双通道与注意力机制的方面级多模态情感分析方法 | |
CN115860002A (zh) | 一种基于事件抽取的作战任务生成方法及系统 | |
CN113657092A (zh) | 识别标签的方法、装置、设备以及介质 | |
CN115146645A (zh) | 一种语义解析方法以及相关设备 | |
Selamat et al. | Arabic script web documents language identification using decision tree-ARTMAP model |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |