CN117975946A - 语义识别方法、装置、设备、介质和程序产品 - Google Patents
语义识别方法、装置、设备、介质和程序产品 Download PDFInfo
- Publication number
- CN117975946A CN117975946A CN202311796113.2A CN202311796113A CN117975946A CN 117975946 A CN117975946 A CN 117975946A CN 202311796113 A CN202311796113 A CN 202311796113A CN 117975946 A CN117975946 A CN 117975946A
- Authority
- CN
- China
- Prior art keywords
- word
- vector
- semantic recognition
- text information
- input text
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 50
- 239000013598 vector Substances 0.000 claims abstract description 239
- 230000011218 segmentation Effects 0.000 claims abstract description 42
- 238000004590 computer program Methods 0.000 claims abstract description 35
- 230000006870 function Effects 0.000 claims description 25
- 239000011159 matrix material Substances 0.000 claims description 23
- 230000007246 mechanism Effects 0.000 claims description 11
- 238000004458 analytical method Methods 0.000 claims description 10
- 238000002372 labelling Methods 0.000 claims description 8
- 238000012937 correction Methods 0.000 claims description 7
- 238000012545 processing Methods 0.000 description 18
- 238000010586 diagram Methods 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 230000008439 repair process Effects 0.000 description 3
- 238000013473 artificial intelligence Methods 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 2
- 238000004422 calculation algorithm Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 230000004044 response Effects 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 238000012706 support-vector machine Methods 0.000 description 2
- OKTJSMMVPCPJKN-UHFFFAOYSA-N Carbon Chemical compound [C] OKTJSMMVPCPJKN-UHFFFAOYSA-N 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 229910021389 graphene Inorganic materials 0.000 description 1
- 238000003384 imaging method Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000007477 logistic regression Methods 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
- 238000005406 washing Methods 0.000 description 1
Landscapes
- Machine Translation (AREA)
Abstract
本申请涉及一种语义识别方法、装置、计算机设备、存储介质和计算机程序产品。所述方法包括:在智能设备的语音识别功能处于唤醒状态的情况下,获取用户的语音信息;基于语音信息,获取输入文本信息;对输入文本信息进行分词处理,获取分词处理后每个词相应的初始词向量;基于输入文本信息中每个词相应的待组合词,获取每个词更新后的词向量;根据输入文本信息中每个词更新后的词向量,进行语义识别,获取语义识别结果;基于语义识别结果,控制智能设备执行相应的操作。采用本方法能够提高语义识别的准确性。
Description
技术领域
本申请涉及人工智能技术领域,特别是涉及一种语义识别方法、装置、计算机设备、存储介质和计算机程序产品。
背景技术
随着人工智能技术的发展,智能设备越来越多地被应用于人们的日常生活中。例如,智能设备可以为智能家居等,这些智能设备通常配备有语音识别功能,能够通过语音指令与用户进行交互。
然而,传统技术中的语义识别方法往往存在识别准确性不高的问题。
发明内容
基于此,有必要针对上述技术问题,提供一种能够提高语义识别的准确性的语义识别方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。
第一方面,本申请提供了一种语义识别方法。所述方法包括:
在智能设备的语音识别功能处于唤醒状态的情况下,获取用户的语音信息;
基于所述语音信息,获取输入文本信息;
对所述输入文本信息进行分词处理,获取分词处理后每个词相应的初始词向量;
基于所述输入文本信息中每个词相应的待组合词,获取每个词更新后的词向量;
根据所述输入文本信息中每个词更新后的词向量,进行语义识别,获取语义识别结果;
基于所述语义识别结果,执行相应的控制操作。
在其中一个实施例中,所述基于用户的语音信息,获取输入文本信息,包括:
基于用户的语音信息,识别出用户的声纹信息;
根据声纹信息确定用户是否具有控制智能设备的权限;
在存在用户具有控制智能设备权限的情况下,获取具有控制智能设备权限的用户的输入文本信息。
在其中一个实施例中,所述基于所述输入文本信息中每个词相应的待组合词,获取每个词更新后的词向量,包括:
获取针对智能设备的知识图谱或者共线矩阵;
基于所述知识图谱或者所述共线矩阵,确定每个词相应的候选词;
对每个词对应的初始词向量和相应候选词的词向量进行拼接,获取每个词更新后的第一词向量。
在其中一个实施例中,所述方法还包括:
基于注意力机制,获取每个词的上下文单元对每个词的权重;所述上下文单元是通过将所述输入文本信息划分为不同组合的单元所得到的;
基于所述权重,对每个词的初始词向量以及每个词的上下文单元的初始词向量,进行加权平均或向量拼接操作,获取每个词更新后的第二词向量。
在其中一个实施例中,所述方法还包括:
获取每个词相应的句法角色和语义角色;所述句法角色和所述语义角色基于对所述输入文本信息进行句法分析和语义角色标注获取;
根据每个词相应的句法角色和语义角色,确定每个词相应的组合方式,并确定每个词相应的修辞词或被修辞词中至少一项;
基于每个词相应的组合方式,将每个词的初始词向量与每个词相应的修辞词或被修辞词的初始词向量进行向量组合操作,获取每个词更新后的第三词向量。
在其中一个实施例中,所述方法还包括:
将所述第一词向量、所述第二词向量和所述第三词向量,进行向量拼接操作,获取每个词更新后的词向量。
第二方面,本申请还提供了一种语义识别装置。所述装置包括:
语音信息获取模块,用于在智能设备的语音识别功能处于唤醒状态的情况下,获取用户的语音信息;
文本信息获取模块,用于基于所述语音信息,获取输入文本信息;
初始向量获取模块,对所述输入文本信息进行分词处理,获取分词处理后每个词相应的初始词向量;
更新向量获取模块,用于基于所述输入文本信息中每个词相应的待组合词,获取每个词更新后的词向量;
识别结果获取模块,用于根据所述输入文本信息中每个词更新后的词向量,进行语义识别,获取语义识别结果;
操作执行模块,用于基于所述语义识别结果,执行相应的控制操作。
第三方面,本申请还提供了一种计算机设备。所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
在智能设备的语音识别功能处于唤醒状态的情况下,获取用户的语音信息;
基于所述语音信息,获取输入文本信息;
对所述输入文本信息进行分词处理,获取分词处理后每个词相应的初始词向量;
基于所述输入文本信息中每个词相应的待组合词,获取每个词更新后的词向量;
根据所述输入文本信息中每个词更新后的词向量,进行语义识别,获取语义识别结果;
基于所述语义识别结果,执行相应的控制操作。
第四方面,本申请还提供了一种计算机可读存储介质。所述计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
在智能设备的语音识别功能处于唤醒状态的情况下,获取用户的语音信息;
基于所述语音信息,获取输入文本信息;
对所述输入文本信息进行分词处理,获取分词处理后每个词相应的初始词向量;
基于所述输入文本信息中每个词相应的待组合词,获取每个词更新后的词向量;
根据所述输入文本信息中每个词更新后的词向量,进行语义识别,获取语义识别结果;
基于所述语义识别结果,执行相应的控制操作。
第五方面,本申请还提供了一种计算机程序产品。所述计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现以下步骤:
在智能设备的语音识别功能处于唤醒状态的情况下,获取用户的语音信息;
基于所述语音信息,获取输入文本信息;
对所述输入文本信息进行分词处理,获取分词处理后每个词相应的初始词向量;
基于所述输入文本信息中每个词相应的待组合词,获取每个词更新后的词向量;
根据所述输入文本信息中每个词更新后的词向量,进行语义识别,获取语义识别结果;
基于所述语义识别结果,执行相应的控制操作。
上述语义识别方法、装置、计算机设备、存储介质和计算机程序产品,在智能设备的语音识别功能处于唤醒状态的情况下,获取用户的语音信息;基于语音信息,获取输入文本信息;对输入文本信息进行分词处理,获取分词处理后每个词相应的初始词向量;基于输入文本信息中每个词相应的待组合词,获取每个词更新后的词向量;根据输入文本信息中每个词更新后的词向量,进行语义识别,获取语义识别结果;基于语义识别结果,执行相应的控制操作。采用本方法,通过获取用户的语音信息,并基于这些信息进行分词处理和词向量更新处理,可以更准确地识别和理解用户的意图,从而提高语义识别的准确性。
附图说明
图1为一个实施例中语义识别方法的流程示意图;
图2为一个实施例中词向量的更新的流程示意图;
图3为另一个实施例中语义识别方法的流程示意图;
图4为一个实施例中语义识别装置的结构框图;
图5为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
在一个实施例中,如图1所示,提供了一种语义识别方法,包括以下步骤:
步骤102,在智能设备的语音识别功能处于唤醒状态的情况下,获取用户的语音信息。
需要说明的是,本申请实施例提供的语义识别方法,可以应用于智能设备,也可以应用于智能设备控制平台,智能设备控制平台可以连接多个智能设备。智能设备可以为智能家居,如空调、电视、洗衣机、冰箱等,也可以是智能办公设备,例如打印机、智能座椅等。
在具体实践中,用户可以通过特定的语言控制指令进行控制智能设备开启语音识别功能,使得智能设备的语音识别功能处于唤醒状态。或者,通过智能设备配套的遥控设备或者在智能设备上的按钮,启动智能设备的语音识别功能,使得智能设备的语音识别功能处于唤醒状态。
其中,用户的语音信息可以为一个或多个用户的语言信息。具体为一定时长所获取的语言信息。
示例性地,智能设备具有语音识别功能。在智能设备的语音识别功能处于唤醒状态的情况下,可以获取用户的语音信息。
步骤104,基于所述语音信息,获取输入文本信息。
其中,输入文本信息可以通过将语音信息进行语音识别所得到的。输入文本信息可以为词组、短语或完整的句子。
示例性地,语音信息可以包括至少一个用户的语音信息,可以将语音信息进行处理,以获取需要获取的用户相应的文本信息作为输入文本信息。
步骤106,对所述输入文本信息进行分词处理,获取分词处理后每个词相应的初始词向量。
在一些实施例中,需要对输入文本信息进行预处理,预处理可以为去除标点符号、停用词、特殊字符等,以减少对后续分词和词向量计算的影响。
示例性地,可以对输入文本信息进行分词处理。具体地,可以使用分词工具对输入文本信息进行分词处理,分词处理后输入文本信息中的每个词。
示例性地,针对分词处理后每个词,获取每个词相应的初始词向量。具体地,可以使用训练好的词向量模型,对分词处理后的每个词进行转化为相应的初始词向量。在具体实践中,针对每个词相应的初始词向量,可以设定为固定长度的向量。训练好的词向量模型可以为word2vec、glove、BERT等常见的词向量模型。
步骤108,基于所述输入文本信息中每个词相应的待组合词,获取每个词更新后的词向量。
其中,待组合词可以为与词存在一定相关性的词。
在一些实施例中,针对输入文本信息中每个词,相应的待组合词可以为同义词、输入文本信息中的相关词。
示例性地,针对输入文本信息中每个词,获取每个词相应的待组合词,从而获取每个词更新后的词向量。具体地,可以将每个词相应的待组合词和每个词的初始词向量进行处理,以获取每个词更新后的词向量。
步骤110,根据所述输入文本信息中每个词更新后的词向量,进行语义识别,获取语义识别结果。
在一些实施例中,可以将输入文本信息中每个词更新后的词向量,进行整合,将整合处理后的词向量通过训练后的语义识别模型进行语义识别,获取语义识别结果。具体地,训练后的语义识别模型可以基于机器学习或深度学习模型实现,如逻辑回归、支持向量机(SVM)、神经网络等。语义识别模型的训练中,可以选定合适的损失函数,以及并使用合适的优化算法,进行优化损失函数。
在具体实践中,语义识别模型,一般基于需要识别出的语义任务设定。语义识别模型可以是一个分类器、一个匹配器、一个生成器,以适应需要识别出的语义识别任务。例如,在智能设备为空调的情况下,语义识别模型可以为生成器,以确定用户需要对智能空调进行控制的控制指令。
步骤112,基于所述语义识别结果,执行相应的控制操作。
具体地,在应用于单个智能设备的场景中,智能设备中可以部署有训练后的词向量模型和语义识别模型,从而基于语义识别模型输出的语义识别结果,执行相应的控制操作。
在应用于连接多个智能设备的智能设备控制平台的场景中,智能设备控制平台可以基于语义识别结果,确定待执行的智能设备,并控制待执行智能设备执行相应的控制操作。
在具体实践中,若应用于连接多个智能设备的智能设备控制平台的场景中,智能设备控制平台将语义识别结果解释为可执行的操作。例如,语义识别结果是“打开空调”,那么智能设备控制平台向空调发送相应的控制指令,以控制空调打开。
上述语义识别方法中,在智能设备的语音识别功能处于唤醒状态的情况下,获取用户的语音信息;基于语音信息,获取输入文本信息;对输入文本信息进行分词处理,获取分词处理后每个词相应的初始词向量;基于输入文本信息中每个词相应的待组合词,获取每个词更新后的词向量;根据输入文本信息中每个词更新后的词向量,进行语义识别,获取语义识别结果;基于语义识别结果,执行相应的控制操作。采用本方法,通过获取用户的语音信息,并基于这些信息进行分词处理和词向量更新处理,可以更准确地识别和理解用户的意图,从而提高语义识别的准确性。
在一个实施例中,步骤104,包括:
步骤1042,基于用户的语音信息,识别出用户的声纹信息。
示例性地,可以通过用户的语音信息,识别出用户的声纹信息。具体地,用户的声纹信息可以通过训练后的声纹识别模型进行识别。声纹识别模型可以是身份认证矢量(identity vector,i-vector)模型。基于时延神经网络的x-vector模型、残差网络或者其它的神经网络模型。
步骤1044,根据声纹信息确定用户是否具有控制智能设备的权限。
在具体实践中,用户的语音信息中可以存在不止一个用户所发出的语言,因此,需要进行声纹识别,以确定用户是否具有控制智能设备的权限。具体地,可以通过声纹库存储已授权用户的声纹信息。
步骤1046,在存在用户具有控制智能设备权限的情况下,获取具有控制智能设备权限的用户的输入文本信息。
示例性地,通过声纹库和声纹信息,确定存在用户具备控制智能设备权限的情况下,识别出用户相应的语音信息,以将相应语音信息,进行转化为输入文本信息。
在上述实施例中,根据声纹信息确定用户是否具有控制智能设备的权限,可以有效地保护智能设备的控制权,防止未经授权的用户对智能设备进行操作,提高智能设备使用的安全性。并且,通过获取具有控制智能设备权限的用户的输入文本信息,可以更快速地获取用户的控制指令,以提高响应速度和效率。
在一个实施例中,参考图2,示出了一个实施例中词向量的更新的流程示意图,步骤108,包括:
步骤202,获取针对智能设备的知识图谱或者共线矩阵。
其中,可以预先部署有针对智能设备的知识图谱或者共线矩阵,以通过知识图谱或者共线矩阵存储针对智能设备的文本信息。
具体地,针对智能设备的知识图谱的构建过程可以为,通过收集智能设备的数据,主要包括智能设备的功能、操作、参数、用户反馈的数据。通过使用自然语言处理技术对收集到的数据进行预处理,提取实体、关系等结构化信息,构建一个针对智能设备的知识图谱。
具体地,针对智能设备的共线矩阵,可以通过构建好的针对智能设备的知识图谱进行获取。
步骤204,基于所述知识图谱或者所述共线矩阵,确定每个词相应的候选词。
其中,每个词相应的候选词可以为基于知识图谱或者共线矩阵所获取相应的同义词或者相关词。
具体地,以知识图谱为例,可以基于知识图谱,获取每个词相应的相关联词,根据每个词的初始词向量和相关联词的词向量,进行相似度或者相关度计算,以获取预设数量的候选词。其中,相似度计算可以通过余弦相似度算法实现。获取预设数量的候选词可以根据所计算的相似度的大小,以从大至小的方式,获取预设数量的候选词。具体地,预设数量的大小可以基于实际情况进行确定,本发明在此不作限定。
步骤206,对每个词对应的初始词向量和相应候选词的词向量进行拼接,获取每个词更新后的第一词向量。
示例性地,可以对每个词对应的初始词向量和相应候选词的词向量进行拼接,获取每个词更新后的第一词向量。具体地,可以根据相应候选词的相似度大小,确定每个候选词的权重,以基于每个候选词的权值,对每个词对应的初始词向量和相应候选词的词向量进行加权平均处理。或者,可以直接将每个词对应的初始词向量和相应候选词的词向量进行向量拼接处理,以获取每个词更新后的第一词向量。
在上述实施例中,获取针对智能设备的知识图谱或共线矩阵,并基于它们确定每个词的候选词,可以丰富每个词的语义信息,从而提高语义识别的准确性。
在一个实施例中,所述方法还包括:
基于注意力机制,获取每个词的上下文单元对每个词的权重;所述上下文单元是通过将所述输入文本信息划分为不同组合的单元所得到的;
基于所述权重,对每个词的初始词向量以及每个词的上下文单元的初始词向量,进行加权平均或向量拼接操作,获取每个词更新后的第二词向量。
示例性地,可以将输入的文本信息进行划分不同的上下文单元。这些上下文单元可以为单词、短语或句子级别的不同组合。
基于注意力机制,获取每个词的上下文单元对每个词的权重。具体地,注意力机制可以基于不同的方法,通过根据输入文本中每个词所处的上下文环境,计算每个上下文单元与当前词的关联程度,得到相应的权重。
示例性地,针对每个词,根据相应的权重,对其初始词向量以及每个上下文单元的初始词向量进行加权平均或向量拼接操作。加权平均操作可以根据权重的大小,将不同上下文单元的词向量进行加权求和。而向量拼接操作则是将不同上下文单元的词向量与当前词的初始词向量进行拼接。
在上述实施例中,通过注意力机制,对输入文本的不同部分动态地调整权重,实现了通过上下文信息来区分多义词或歧义词在不同场景中具有不同含义和用法,可以更好地捕捉文本中的关键信息和语义关系,从而提高语义识别的准确性。
在一个实施例中,所述方法还包括:
获取每个词相应的句法角色和语义角色;所述句法角色和所述语义角色基于对所述输入文本信息进行句法分析和语义角色标注获取;
根据每个词相应的句法角色和语义角色,确定每个词相应的组合方式,并确定每个词相应的修辞词或被修辞词中至少一项;
基于每个词相应的组合方式,将每个词的初始词向量与每个词相应的修辞词或被修辞词的初始词向量进行向量组合操作,获取每个词更新后的第三词向量。
其中,每个词相应的句法角色和语义角色可以基于对输入文本信息进行句法分析和语义角色标注获取。具体地,可以根据输入文本信息中每个词所处的句子结构,对句子进行句法分析和语义角色标注,从而获取每个词相应的句法角色和语义角色。句法角色包括但不限于主语、谓语、宾语和定语。语义角色用于词语之间的语义关系。
示例性地,可以根据每个词相应的句法角色和语义角色,确定每个词相应的组合方式,并确定每个词相应的修辞词或被修辞词中至少一项。具体地,每个词相应的句法角色和语义角色,选择不同的组合方式,如加法、乘法、拼接、注意力等。每个词相应的修辞词或被修辞词为输入文本信息中的词。
示例性地,可以根据每个词相应的组合方式,将每个词的初始词向量与每个词相应的修辞词或被修辞词的初始词向量进行向量组合操作。具体地,在每个词相应的修辞词或被修辞词存在多个的情况下,将每个词的初始词向量分别与每一个修辞词或被修辞词相应的初始词向量进行组合,并在组合后进行向量拼接处理,以获取每个词更新后的第三词向量。
在上述实施例中,通过获取每个词的句法角色和语义角色,可以更深入地理解词语在句子中的功能和语义,从而增强对整个输入文本信息的语义理解。通过将每个词的初始词向量与相应的修辞词或被修辞词的初始词向量进行向量组合操作,可以获取每个词更新后的第三词向量,增强输入文本信息的表示能力,能够更好地处理复杂的自然语言任务,从而提高了语义识别的准确率。
在一个实施例中,所述方法还包括:
将所述第一词向量、所述第二词向量和所述第三词向量,进行向量拼接操作,获取每个词更新后的词向量。
其中,第一词向量主要反映词语的基本语义,第二词向量是通过考虑上下文信息进行更新的,第三词向量是结合句法角色和修辞信息更新的。
示例性地,还可以将第一词向量、第二词向量和第三词向量进行向量拼接处理,以获取每个词更新后的词向量。
在一些实施例中,可以基于语义识别任务的需求,从第一词向量、第二词向量以及第三词向量中任选两个词向量进行向量拼接操作。
在上述实施例中,根据将第一词向量、第二词向量和第三词向量进行向量拼接处理,实现更加全面地捕捉了词的语义信息,并且,提高语义一致性,使得每个词的更新后的词向量更加稳定和可靠,从而提高了语义识别的准确性。
为了更好地理解本发明实施例中语义识别方法的完整过程,以一完整示例加以说明,参考图3,示出了另一个实施例中语义识别方法的流程示意图,包括以下步骤:
步骤302,在智能设备的语音识别功能处于唤醒状态的情况下,获取用户的语音信息。
步骤304,基于用户的语音信息,识别出用户的声纹信息;根据声纹信息确定用户是否具有控制智能设备的权限;在存在用户具有控制智能设备权限的情况下,获取具有控制智能设备权限的用户的输入文本信息。
步骤306,获取针对智能设备的知识图谱或者共线矩阵;基于知识图谱或者共线矩阵,确定每个词相应的候选词。
步骤308,对每个词对应的初始词向量和相应候选词的词向量进行拼接,获取每个词更新后的第一词向量。
步骤310,基于注意力机制,获取每个词的上下文单元对每个词的权重。
步骤312,基于权重,对每个词的初始词向量以及每个词的上下文单元的初始词向量,进行加权平均或向量拼接操作,获取每个词更新后的第二词向量。
步骤314,获取每个词相应的句法角色和语义角色;根据每个词相应的句法角色和语义角色,确定每个词相应的组合方式,并确定每个词相应的修辞词或被修辞词中至少一项。
步骤316,基于每个词相应的组合方式,将每个词的初始词向量与每个词相应的修辞词或被修辞词的初始词向量进行向量组合操作,获取每个词更新后的第三词向量。
步骤318,将第一词向量、第二词向量和第三词向量,进行向量拼接操作,获取每个词更新后的词向量。
步骤320,根据输入文本信息中每个词更新后的词向量,进行语义识别,获取语义识别结果;基于语义识别结果,执行相应的控制操作。
本实施例中,在智能设备的语音识别功能处于唤醒状态的情况下,获取用户的语音信息;基于语音信息,获取输入文本信息;对输入文本信息进行分词处理,获取分词处理后每个词相应的初始词向量;基于输入文本信息中每个词相应的待组合词,获取每个词更新后的词向量;根据输入文本信息中每个词更新后的词向量,进行语义识别,获取语义识别结果;基于语义识别结果,执行相应的控制操作。采用本方法,通过获取用户的语音信息,并基于这些信息进行分词处理和词向量更新处理,可以更准确地识别和理解用户的意图,从而提高语义识别的准确性。
应该理解的是,虽然如上所述的各实施例所涉及的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,如上所述的各实施例所涉及的流程图中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
基于同样的发明构思,本申请实施例还提供了一种用于实现上述所涉及的语义识别方法的语义识别装置。该装置所提供的解决问题的实现方案与上述方法中所记载的实现方案相似,故下面所提供的一个或多个语义识别装置实施例中的具体限定可以参见上文中对于语义识别方法的限定,在此不再赘述。
在一个实施例中,如图4所示,提供了一种语义识别装置,包括:语音信息获取模块402、文本信息获取模块404、初始向量获取模块406、更新向量获取模块408、识别结果获取模块410和操作执行模块412,其中:
语音信息获取模块402,用于在智能设备的语音识别功能处于唤醒状态的情况下,获取用户的语音信息;
文本信息获取模块404,用于基于所述语音信息,获取输入文本信息;
初始向量获取模块406,对所述输入文本信息进行分词处理,获取分词处理后每个词相应的初始词向量;
更新向量获取模块408,用于基于所述输入文本信息中每个词相应的待组合词,获取每个词更新后的词向量;
识别结果获取模块410,用于根据所述输入文本信息中每个词更新后的词向量,进行语义识别,获取语义识别结果;
操作执行模块412,用于基于所述语义识别结果,执行相应的控制操作。
在一些实施例中,文本信息获取模块404,包括:
声纹信息识别单元,用于基于用户的语音信息,识别出用户的声纹信息;
权限确定单元,用于根据声纹信息确定用户是否具有控制智能设备的权限;
文本信息获取单元,用于在存在用户具有控制智能设备权限的情况下,获取具有控制智能设备权限的用户的输入文本信息。
在一些实施例中,更新向量获取模块408,包括:
获取针对智能设备的知识图谱或者共线矩阵;
基于所述知识图谱或者所述共线矩阵,确定每个词相应的候选词;
对每个词对应的初始词向量和相应候选词的词向量进行拼接,获取每个词更新后的第一词向量。
在一些实施例中,语义识别装置,具体还用于:基于注意力机制,获取每个词的上下文单元对每个词的权重;所述上下文单元是通过将所述输入文本信息划分为不同组合的单元所得到的;基于所述权重,对每个词的初始词向量以及每个词的上下文单元的初始词向量,进行加权平均或向量拼接操作,获取每个词更新后的第二词向量。
在一些实施例中,语义识别装置,具体还用于:获取每个词相应的句法角色和语义角色;所述句法角色和所述语义角色基于对所述输入文本信息进行句法分析和语义角色标注获取;
根据每个词相应的句法角色和语义角色,确定每个词相应的组合方式,并确定每个词相应的修辞词或被修辞词中至少一项;
基于每个词相应的组合方式,将每个词的初始词向量与每个词相应的修辞词或被修辞词的初始词向量进行向量组合操作,获取每个词更新后的第三词向量。
在一些实施例中,语义识别装置,具体还用于:
将所述第一词向量、所述第二词向量和所述第三词向量,进行向量拼接操作,获取每个词更新后的词向量。
上述语义识别装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图5所示。该计算机设备包括处理器、存储器、输入/输出接口(Input/Output,简称I/O)和通信接口。其中,处理器、存储器和输入/输出接口通过系统总线连接,通信接口通过输入/输出接口连接到系统总线。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质和内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储获取针对智能设备的知识图谱或者共线矩阵。该计算机设备的输入/输出接口用于处理器与外部设备之间交换信息。该计算机设备的通信接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种语义识别方法。
该计算机设备的显示单元用于形成视觉可见的画面,可以是显示屏、投影装置或虚拟现实成像装置。显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
本领域技术人员可以理解,图5中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现以下步骤:
在智能设备的语音识别功能处于唤醒状态的情况下,获取用户的语音信息;
基于所述语音信息,获取输入文本信息;
对所述输入文本信息进行分词处理,获取分词处理后每个词相应的初始词向量;
基于所述输入文本信息中每个词相应的待组合词,获取每个词更新后的词向量;
根据所述输入文本信息中每个词更新后的词向量,进行语义识别,获取语义识别结果;
基于所述语义识别结果,执行相应的控制操作。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
获取针对智能设备的知识图谱或者共线矩阵;
基于所述知识图谱或者所述共线矩阵,确定每个词相应的候选词;
对每个词对应的初始词向量和相应候选词的词向量进行拼接,获取每个词更新后的第一词向量。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
基于注意力机制,获取每个词的上下文单元对每个词的权重;所述上下文单元是通过将所述输入文本信息划分为不同组合的单元所得到的;
基于所述权重,对每个词的初始词向量以及每个词的上下文单元的初始词向量,进行加权平均或向量拼接操作,获取每个词更新后的第二词向量。
在一个实施例中,处理器执行计算机程序时还实现以下步骤:
获取每个词相应的句法角色和语义角色;所述句法角色和所述语义角色基于对所述输入文本信息进行句法分析和语义角色标注获取;
根据每个词相应的句法角色和语义角色,确定每个词相应的组合方式,并确定每个词相应的修辞词或被修辞词中至少一项;
基于每个词相应的组合方式,将每个词的初始词向量与每个词相应的修辞词或被修辞词的初始词向量进行向量组合操作,获取每个词更新后的第三词向量。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
在智能设备的语音识别功能处于唤醒状态的情况下,获取用户的语音信息;
基于所述语音信息,获取输入文本信息;
对所述输入文本信息进行分词处理,获取分词处理后每个词相应的初始词向量;
基于所述输入文本信息中每个词相应的待组合词,获取每个词更新后的词向量;
根据所述输入文本信息中每个词更新后的词向量,进行语义识别,获取语义识别结果;
基于所述语义识别结果,执行相应的控制操作。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
获取针对智能设备的知识图谱或者共线矩阵;
基于所述知识图谱或者所述共线矩阵,确定每个词相应的候选词;
对每个词对应的初始词向量和相应候选词的词向量进行拼接,获取每个词更新后的第一词向量。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
基于注意力机制,获取每个词的上下文单元对每个词的权重;所述上下文单元是通过将所述输入文本信息划分为不同组合的单元所得到的;
基于所述权重,对每个词的初始词向量以及每个词的上下文单元的初始词向量,进行加权平均或向量拼接操作,获取每个词更新后的第二词向量。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
获取每个词相应的句法角色和语义角色;所述句法角色和所述语义角色基于对所述输入文本信息进行句法分析和语义角色标注获取;
根据每个词相应的句法角色和语义角色,确定每个词相应的组合方式,并确定每个词相应的修辞词或被修辞词中至少一项;
基于每个词相应的组合方式,将每个词的初始词向量与每个词相应的修辞词或被修辞词的初始词向量进行向量组合操作,获取每个词更新后的第三词向量。
在一个实施例中,提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现以下步骤:
在智能设备的语音识别功能处于唤醒状态的情况下,获取用户的语音信息;
基于所述语音信息,获取输入文本信息;
对所述输入文本信息进行分词处理,获取分词处理后每个词相应的初始词向量;
基于所述输入文本信息中每个词相应的待组合词,获取每个词更新后的词向量;
根据所述输入文本信息中每个词更新后的词向量,进行语义识别,获取语义识别结果;
基于所述语义识别结果,执行相应的控制操作。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
获取针对智能设备的知识图谱或者共线矩阵;
基于所述知识图谱或者所述共线矩阵,确定每个词相应的候选词;
对每个词对应的初始词向量和相应候选词的词向量进行拼接,获取每个词更新后的第一词向量。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
基于注意力机制,获取每个词的上下文单元对每个词的权重;所述上下文单元是通过将所述输入文本信息划分为不同组合的单元所得到的;
基于所述权重,对每个词的初始词向量以及每个词的上下文单元的初始词向量,进行加权平均或向量拼接操作,获取每个词更新后的第二词向量。
在一个实施例中,计算机程序被处理器执行时还实现以下步骤:
获取每个词相应的句法角色和语义角色;所述句法角色和所述语义角色基于对所述输入文本信息进行句法分析和语义角色标注获取;
根据每个词相应的句法角色和语义角色,确定每个词相应的组合方式,并确定每个词相应的修辞词或被修辞词中至少一项;
基于每个词相应的组合方式,将每个词的初始词向量与每个词相应的修辞词或被修辞词的初始词向量进行向量组合操作,获取每个词更新后的第三词向量。
需要说明的是,本申请所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等),均为经用户授权或者经过各方充分授权的信息和数据,且相关数据的收集、使用和处理需要遵守相关地区的相关法律法规和标准。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-OnlyMemory,ROM)、磁带、软盘、闪存、光存储器、高密度嵌入式非易失性存储器、阻变存储器(ReRAM)、磁变存储器(Magnetoresistive Random Access Memory,MRAM)、铁电存储器(Ferroelectric Random Access Memory,FRAM)、相变存储器(Phase Change Memory,PCM)、石墨烯存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器等。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic RandomAccess Memory,DRAM)等。本申请所提供的各实施例中所涉及的数据库可包括关系型数据库和非关系型数据库中至少一种。非关系型数据库可包括基于区块链的分布式数据库等,不限于此。本申请所提供的各实施例中所涉及的处理器可为通用处理器、中央处理器、图形处理器、数字信号处理器、可编程逻辑器、基于量子计算的数据处理逻辑器等,不限于此。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请的保护范围应以所附权利要求为准。
Claims (10)
1.一种语义识别方法,其特征在于,所述方法包括:
在智能设备的语音识别功能处于唤醒状态的情况下,获取用户的语音信息;
基于所述语音信息,获取输入文本信息;
对所述输入文本信息进行分词处理,获取分词处理后每个词相应的初始词向量;
基于所述输入文本信息中每个词相应的待组合词,获取每个词更新后的词向量;
根据所述输入文本信息中每个词更新后的词向量,进行语义识别,获取语义识别结果;
基于所述语义识别结果,执行相应的控制操作。
2.根据权利要求1所述的方法,其特征在于,所述基于用户的语音信息,获取输入文本信息,包括:
基于用户的语音信息,识别出用户的声纹信息;
根据声纹信息确定用户是否具有控制智能设备的权限;
在存在用户具有控制智能设备权限的情况下,获取具有控制智能设备权限的用户的输入文本信息。
3.根据权利要求1所述的方法,其特征在于,所述基于所述输入文本信息中每个词相应的待组合词,获取每个词更新后的词向量,包括:
获取针对智能设备的知识图谱或者共线矩阵;
基于所述知识图谱或者所述共线矩阵,确定每个词相应的候选词;
对每个词对应的初始词向量和相应候选词的词向量进行拼接,获取每个词更新后的第一词向量。
4.根据权利要求3所述的方法,其特征在于,所述方法还包括:
基于注意力机制,获取每个词的上下文单元对每个词的权重;所述上下文单元是通过将所述输入文本信息划分为不同组合的单元所得到的;
基于所述权重,对每个词的初始词向量以及每个词的上下文单元的初始词向量,进行加权平均或向量拼接操作,获取每个词更新后的第二词向量。
5.根据权利要求4所述的方法,其特征在于,所述方法还包括:
获取每个词相应的句法角色和语义角色;所述句法角色和所述语义角色基于对所述输入文本信息进行句法分析和语义角色标注获取;
根据每个词相应的句法角色和语义角色,确定每个词相应的组合方式,并确定每个词相应的修辞词或被修辞词中至少一项;
基于每个词相应的组合方式,将每个词的初始词向量与每个词相应的修辞词或被修辞词的初始词向量进行向量组合操作,获取每个词更新后的第三词向量。
6.根据权利要求5所述的方法,其特征在于,所述方法还包括:
将所述第一词向量、所述第二词向量和所述第三词向量,进行向量拼接操作,获取每个词更新后的词向量。
7.一种语义识别装置,其特征在于,所述装置包括:
语音信息获取模块,用于在智能设备的语音识别功能处于唤醒状态的情况下,获取用户的语音信息;
文本信息获取模块,用于基于所述语音信息,获取输入文本信息;
初始向量获取模块,对所述输入文本信息进行分词处理,获取分词处理后每个词相应的初始词向量;
更新向量获取模块,用于基于所述输入文本信息中每个词相应的待组合词,获取每个词更新后的词向量;
识别结果获取模块,用于根据所述输入文本信息中每个词更新后的词向量,进行语义识别,获取语义识别结果;
操作执行模块,用于基于所述语义识别结果,执行相应的控制操作。
8.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至6中任一项所述的方法的步骤。
9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。
10.一种计算机程序产品,包括计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311796113.2A CN117975946A (zh) | 2023-12-25 | 2023-12-25 | 语义识别方法、装置、设备、介质和程序产品 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311796113.2A CN117975946A (zh) | 2023-12-25 | 2023-12-25 | 语义识别方法、装置、设备、介质和程序产品 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117975946A true CN117975946A (zh) | 2024-05-03 |
Family
ID=90862135
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311796113.2A Pending CN117975946A (zh) | 2023-12-25 | 2023-12-25 | 语义识别方法、装置、设备、介质和程序产品 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117975946A (zh) |
-
2023
- 2023-12-25 CN CN202311796113.2A patent/CN117975946A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
AU2018214675B2 (en) | Systems and methods for automatic semantic token tagging | |
US20190258713A1 (en) | Processing text using neural networks | |
CN111027327A (zh) | 机器阅读理解方法、设备、存储介质及装置 | |
CN111368993A (zh) | 一种数据处理方法及相关设备 | |
CN114021582B (zh) | 结合语音信息的口语理解方法、装置、设备及存储介质 | |
CN111858898A (zh) | 基于人工智能的文本处理方法、装置及电子设备 | |
US11250299B2 (en) | Learning representations of generalized cross-modal entailment tasks | |
CN112395887A (zh) | 对话应答方法、装置、计算机设备和存储介质 | |
CN117271759A (zh) | 文本摘要生成模型训练方法、文本摘要生成方法和装置 | |
CN111368554B (zh) | 语句处理方法、装置、计算机设备和存储介质 | |
CN115292439A (zh) | 一种数据处理方法及相关设备 | |
CN116861363A (zh) | 多模态的特征处理方法、装置、存储介质与电子设备 | |
WO2023137903A1 (zh) | 基于粗糙语义的回复语句确定方法、装置及电子设备 | |
CN116361511A (zh) | 一种复合语义的视频检索方法、装置、设备及存储介质 | |
CN116974554A (zh) | 代码数据处理方法、装置、计算机设备和存储介质 | |
CN111126049A (zh) | 对象关系预测方法、装置、终端设备及可读存储介质 | |
CN116189208A (zh) | 用于文本识别的方法、装置、设备和介质 | |
CN117975946A (zh) | 语义识别方法、装置、设备、介质和程序产品 | |
CN115510188A (zh) | 文本关键词关联方法、装置、设备及存储介质 | |
CN111967253A (zh) | 一种实体消歧方法、装置、计算机设备及存储介质 | |
CN109739970A (zh) | 信息处理方法及装置、以及电子设备 | |
US20240144664A1 (en) | Multimodal data processing | |
CN113779225B (zh) | 实体链接模型的训练方法、实体链接方法及装置 | |
CN113254635B (zh) | 数据处理方法、装置及存储介质 | |
US20220367052A1 (en) | Neural networks with feedforward spatial transformation units |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |