WO2023168838A1

WO2023168838A1 - 语句文本的识别方法和装置、存储介质及电子装置

Info

Publication number: WO2023168838A1
Application number: PCT/CN2022/096405
Authority: WO
Inventors: 刘建国; 王迪; 李昱涧
Original assignee: 青岛海尔科技有限公司; 海尔智家股份有限公司
Priority date: 2022-03-09
Filing date: 2022-05-31
Publication date: 2023-09-14
Also published as: CN114676689A

Abstract

本公开提供了一种语句文本的识别方法和装置、存储介质及电子装置，涉及智能家居技术领域，该语句文本的识别方法包括：获取智能设备采集到的语句文本作为待识别的目标语句文本；通过目标成分识别模型对所述目标语句文本进行识别，得到所述目标语句文本对应的目标成分特征；根据所述目标成分特征和所述目标语句文本，识别所述目标语句文本对应的目标意图特征，其中，所述目标意图特征用于指示所述目标语句文本对所述智能设备的操作意图。采用上述技术方案，解决了相关技术中，识别语句文本所表达意图的准确率较低等问题。

Description

语句文本的识别方法和装置、存储介质及电子装置

本公开要求于2022年3月9日提交中国专利局、申请号为202210234269.0、发明名称“语句文本的识别方法和装置、存储介质及电子装置”的中国专利申请的优先权，其全部内容通过引用结合在本公开中。

技术领域

本公开涉及智能家居技术领域，具体而言，涉及一种语句文本的识别方法和装置、存储介质及电子装置。

背景技术

在NLP(Natural Language Processing，自然语言处理)领域中，往往需要准确高效的识别出数据所表达的意图，现有技术中，往往通过将训练数据输入构建好的识别模型，将识别模型输出的预测结果作为训练数据所表达的意图。这样的实现方式，一方面，识别模型的准确性和合理性将会对预测训练数据的意图产生决定性影响，另一方面，识别模型在预测意图的时候没有结合训练数据，可能会导致识别模型识别出的意图与训练数据真实表达的意图相差甚远。

针对相关技术中，识别语句文本所表达意图的准确率较低等问题，尚未提出有效的解决方案。

发明内容

本公开实施例提供了一种语句文本的识别方法和装置、存储介质及电子装置，以至少解决相关技术中，识别语句文本所表达意图的准确率较低等问题。

根据本公开实施例的一个实施例，提供了一种语句文本的识别方法，包括：

获取智能设备采集到的语句文本作为待识别的目标语句文本；

通过目标成分识别模型对所述目标语句文本进行识别，得到所述目标语句文本对应的目标成分特征，其中，所述目标成分识别模型是使用标注了成分特征的第一文本样本对初始成分识别模型进行训练得到的，所述目标成分特征用于指示所述目标语句文本所具有的语言成分；

根据所述目标成分特征和所述目标语句文本，识别所述目标语句文本对应的目标意图特征，其中，所述目标意图特征用于指示所述目标语句文本对所述智能设备的操作意图。

在一个示例性实施例中，所述通过目标成分识别模型对所述目标语句文本进行识别，包括：

将所述目标语句文本输入所述目标成分识别模型所包括的成分标签识别层，得到所述成分标签识别层输出的多个目标文字，每个目标文字对应的成分标签和每个成分标签对应的成分标签概率，其中，所述目标语句文本包括所述多个目标文字，所述成分标签用于指示允许对应的所述每个目标文字所属于的语言成分，所述成分标签概率用于指示对应的所述每个目标文字属于对应的所述成分标签的概率；

将多个目标文字，每个目标文字对应的成分标签和每个成分标签对应的成分标签概率输入成分标签判定层，得到所述成分标签判定层输出的与所述多个目标文字一一对应的多个目标成分标签作为成分识别结果。

在一个示例性实施例中，所述将所述目标语句文本输入所述目标成分识别模型所包括的成分标签识别层，得到所述成分标签识别层输出的多个目标文字，每个目标文字对应的成分标签和每个成分标签对应的成分标签概率，包括：

将所述目标语句文本输入所述成分标签识别层所包括的预处理网络，得到所述预处理网络输出的与所述多个目标文字一一对应的多个词向量；

将所述多个词向量输入所述成分标签识别层所包括的成分标签识别网络，得到所述成分标签识别网络输出的所述多个词向量，每个词向量对应的成分标签和每个成分标签对应的成分标签概率。

在一个示例性实施例中，所述将多个目标文字，每个目标文字对应的成分标签和每个成分标签对应的成分标签概率输入成分标签判定层，得到所述成分标签判定层输出的与所述多个目标文字一一对应的多个目标成分标签作为成分识别结果，包括：

通过所述成分标签判定层从所述每个目标文字对应的成分标签中筛选出满足目标约束条件的候选成分标签，其中，所述目标约束条件为语句中对语言成分的约束条件；

通过所述成分标签判定层从所述候选成分标签中获取所对应的成分标签概率满足目标概率条件的成分标签作为所述每个目标文字所对应的目标成分标签，得到与所述多个目标文字一一对应的多个目标成分标签作为所述成分识别结果。

在一个示例性实施例中，所述根据所述目标成分特征和所述目标语句文本，识别所述目标语句文本对应的目标意图特征，包括：

通过目标意图识别模型对携带了所述目标成分特征的所述目标语句文本进行识别，其中，所述目标意图识别模型是使用标注了意图特征的携带了成分特征的第二文本样本对初始意图识别模型进行训练得到的；

获取所述目标意图识别模型输出的意图识别结果作为所述目标意图特征。

在一个示例性实施例中，所述通过目标意图识别模型对携带了所述目标成分特征的所述目标语句文本进行识别，包括：

将所述目标语句文本输入目标实体识别模型，得到所述目标实体识别模型输出的目标实体特征，其中，所述目标实体特征用于指示所述目标语句文本中所包括的实体，所述目标实体识别模型是使用标注了实体特征的第三文本样本对初始实体识别模型进行训练得到的；

将所述目标成分特征和所述目标实体特征输入所述目标意图识别模型，得到所述目标意图识别模型输出的所述意图识别结果。

在一个示例性实施例中，在所述将所述目标语句文本输入目标实体识别模型之前，所述方法还包括：

获取标注了实体特征的第三文本样本，其中，所述实体特征用于表征对所述智能设备执行的控制操作的操作信息；

使用标注了所述实体特征的所述第三文本样本对所述初始实体识别模型进行训练，得到所述目标实体识别模型。

根据本公开的另一个实施例，还提供了一种语句文本的识别装置，包括：

第一获取模块，设置为获取智能设备采集到的语句文本作为待识别的目标语句文本；

第一识别模块，设置为通过目标成分识别模型对所述目标语句文本进行识别，得到所述目标语句文本对应的目标成分特征，其中，所述目标成分识别模型是使用标注了成分特征的第一文本样本对初始成分识别模型进行训练得到的，所述目标成分特征用于指示所述目标语句文本所具有的语言成分；

第二识别模块，设置为根据所述目标成分特征和所述目标语句文本，识别所述目标语句文本对应的目标意图特征，其中，所述目标意图特征用于指示所述目标语句文本对所述智能设备的操作意图。

根据本公开实施例的又一方面，还提供了一种计算机可读的存储介质，该计算机可读的存储介质中存储有计算机程序，其中，该计算机程序被设置为运行时执行上述语句文本的识别方法。

根据本公开实施例的又一方面，还提供了一种电子装置，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其中，上述处理器通过计算机程序执行上述的语句文本的识别方法。

通过本公开，获取智能设备采集到的语句文本作为待识别的目标语句文本；通过目标成分识别模型对目标语句文本进行识别，得到目标语句文本对应的目标成分特征，其中，目标成分识别模型是使用标注了成分特征的第一文本样本对初始成分识别模型进行训练得到的，目标成分特征用于指示目标语句文本所具有的语言成分；根据目标成分特征和目标语句文本，识别目标语句文本对应的目标意图特征，其中，目标意图特征用于指示目标语句文本对智能设备的操作意图，即如果获取到智能设备采集到的语句文本作为待识别的目标语句文本，可以通过目标成分识别模型识别目标语句文本所具有的语言成分作为目标成分特征，通过将目标语句文本和目标语句文本中所具有的语言成分结合来识别目标意图特征，实现了准确地识别目标语句文本对智能设备的操作意图。采用上述技术方案，解决了相关技术中，识别语句文本所表达意图的准确率较低等问题，实现了提高识别语句文本所表达意图的准确率的技术效果。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本公开的实施例，并与说明书一起用于解释本公开的原理。

为了更清楚地说明本公开实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，对于本领域普通技术人员而言，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1是根据本公开实施例的一种语句文本的识别方法的硬件环境示意图；

图2是根据本公开实施例的一种语句文本的识别方法的流程图；

图3是根据本公开实施例的通过目标成分识别模型识别语句文本对应的成分特征的流程图；

图4是根据本公开实施例的识别语句文本的成分特征的流程图；

图5是根据本公开实施例的可选的BiLSTM模型的架构图；

图6是根据本公开实施例的一种可选的识别目标语句意图的模型架构图；

图7是根据本公开实施例的识别语句文本的语言成分的示意图；

图8是根据本公开实施例的可选的识别目标语句所具有的语言成分的模型架构图；

图9是根据本公开实施例的用户与智能音箱语音交互的场景示意图；

图10是根据本公开实施例的用户与智能电视语音交互的场景示意图；

图11是根据本公开实施例的一种语句文本的识别装置的结构框图。

具体实施方式

为了使本技术领域的人员更好地理解本公开方案，下面将结合本公开实施例中的附图，对本公开实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本公开一部分的实施例，而不是全部的实施例。基于本公开中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都应当属于本公开保护的范围。

需要说明的是，本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

根据本公开实施例的一个方面，提供了一种语句文本的识别方法。该语句文本的识别方法广泛应用于智慧家庭(Smart Home)、智能家居、智能家用设备生态、智慧住宅(Intelligence House)生态等全屋智能数字化控制应用场景。可选地，在本实施例中，上述语句文本的识别方法可以应用于如图1所示的由终端设备102和服务器104所构成的硬件环境中。图1是根据本公开实施例的一种语句文本的识别方法的硬件环境示意图，如图1所示，服务器104通过网络与终端设备102进行连接，可设置为终端或终端上安装的客户端提供服务(如应用服务等)，可在服务器上或独立于服务器设置数据库，设置为服务器104提供数据存储服务，可在服务器上或独立于服务器配置云计算和/或边缘计算服务，设置为服务器104提供数据运算服务。

上述网络可以包括但不限于以下至少之一：有线网络，无线网络。上述有线网络可以包括但不限于以下至少之一：广域网，城域网，局域网，上述无线网络可以包括但不限于以下至少之一：WIFI(Wireless Fidelity，无线保真)，蓝牙。终端设备102可以并不限定于为PC(Personal Computer，个人电脑)、手机、平板电脑、智能空调、智能烟机、智能冰箱、智能烤箱、智能炉灶、智能洗衣机、智能热水器、智能洗涤设备、智能洗碗机、智能投影设备、智能电视、智能晾衣架、智能窗帘、智能影音、智能插座、智能音响、智能音箱、智能新风设备、智能厨卫设备、智能卫浴设备、智能扫地机器人、智能擦窗机器人、智能拖地机器人、智能空气净化设备、智能蒸箱、智能微波炉、智能厨宝、智能净化器、智能饮水机、智能门锁等。

在本实施例中提供了一种语句文本的识别方法，应用于上述计算机终端，图2是根据本公开实施例的一种语句文本的识别方法的流程图，如图2所示，该流程包括如下步骤：

步骤S202，获取智能设备采集到的语句文本作为待识别的目标语句文本；

步骤S204，通过目标成分识别模型对所述目标语句文本进行识别，得到所述目标语句文本对应的目标成分特征，其中，所述目标成分识别模型是使用标注了成分特征的第一文本样本对初始成分识别模型进行训练得到的，所述目标成分特征用于指示所述目标语句文本所具有的语言成分；

步骤S206，根据所述目标成分特征和所述目标语句文本，识别所述目标语句文本对应的目标意图特征，其中，所述目标意图特征用于指示所述目标语句文本对所述智能设备的操作意图。

通过上述步骤，如果获取到智能设备采集到的语句文本作为待识别的目标语句文本，可以通过目标成分识别模型识别目标语句文本所具有的语言成分作为目标成分特征，通过将目标语句文本和目标语句文本中所具有的语言成分结合来识别目标意图特征，实现了准确地识别目标语句文本对智能设备的操作意图。采用上述技术方案，解决了相关技术中，识别语句文本所表达意图的准确率较低等问题，实现了提高识别语句文本所表达意图的准确率的技术效果。

在上述步骤S202提供的技术方案中，智能设备可以但不限于将获取到用户发出的语音指令转换为对应的语句文本，或者，将用户在智能设备上输入的文字内容转换为对应的语句文本等等，实现了可以通过多种方式获取用户想要表达的语言内容，方便用户可以采用多种方式进行操作，提升了用户的操作体验度。

可选地，在本实施例中，智能设备可以但不限于包括支持与用户进行语音交互，按照用户的指令执行对应的操作的设备等等，比如：智能设备可以但不限于包括智能空调、智能烟机、智能冰箱、智能烤箱、智能炉灶、智能洗衣机、智能热水器、智能洗涤设备、智能洗碗机、智能投影设备、智能电视、智能晾衣架、智能窗帘、智能插座、智能音响、智能音箱、智能新风设备、智能厨卫设备、智能卫浴设备、智能扫地机器人、智能擦窗机器人、智能拖地机器人、智能空气净化设备、智能蒸箱、智能微波炉、智能厨宝、智能净化器、智能饮水机、智能门锁、智能车载空调、智能雨刷、智能车载音箱、智能车载冰箱等等。

在上述步骤S204提供的技术方案中，目标成分识别模型可以但不限于用于识别语句文本所具有的语言成分作为该语句文本对应的成分特征，图3是根据本公开实施例的通过目标成分识别模型识别语句文本对应的成分特征的流程图，如图3所示，可以但不限于包括以下步骤：

步骤S301，将目标语句文本输入目标成分识别模型；

步骤S302，目标成分识别模型对目标语句文本所具有的语言成分进行识别；

步骤S303，输出目标成分识别模型识别出的目标语句文本所具有的语言成分作为目标成分特征。

可选地，在本实施例中，目标语句文本所具有的语言成分可以但不限于包括以下至少之一：主语、谓语、宾语、定语、状语、补语、主语从句、谓语从句、宾语从句、定语从句、状语从句、和补语从句等等，通过识别语句文本所具有的语言成分，实现了充分利用语句文本所包括的信息，提升了识别语句文本的准确性。

可选地，在本实施例中，可以但不限于通过以下方式获取第一文本样本：获取初始文本样本；标注初始文本样本中的每一个文本样本所具有的语言成分，得到标注了成分特征的第一文本样本。

在一个示例性实施例中，可以但不限于通过以下方式对目标语句文本进行识别：将所述目标语句文本输入所述目标成分识别模型所包括的成分标签识别层，得到所述成分标签识别层输出的多个目标文字，每个目标文字对应的成分标签和每个成分标签对应的成分标签概率，其中，所述目标语句文本包括所述多个目标文字，所述成分标签用于指示允许对应的所述每个目标文字所属于的语言成分，所述成分标签概率用于指示对应的所述每个目标文字属于对应的所述成分标签的概率；将多个目标文字，每个目标文字对应的成分标签和每个成分标签对应的成分标签概率输入成分标签判定层，得到所述成分标签判定层输出的与所述多个目标文字一一对应的多个目标成分标签作为成分识别结果。

可选地，在本实施例中，目标语句文本中的每个目标文字可以但不限于对应一个或者多个成分标签，每个成分标签都有和该成分标签对应的成分标签概率，成分标签判定层根据成分标签识别层的输出结果，输出每个目标文字一一对应的成分标签。

可选地，在本实施例中，可以但不限于通过目标成分识别模型包括的成分标签识别层和成分标签判定层来识别目标语句文本的成分特征，图4是根据本公开实施例的识别语句文本的成分特征的流程图，如图4所示，可以但不限于包括以下步骤：

步骤S401，将目标语句文本输入成分标签识别层；

步骤S402，成分标签识别层识别并输出目标语句文本中的多个目标文字，每个目标文字可能对应的成分标签和每个成分标签对应的成分标签概率；

步骤S403，将多个目标文字，每个目标文字对应的成分标签和每个成分标签对应的成分标签概率输入成分标签判定层；

步骤S404，成分标签判定层输出与每个目标文字一一对应的目标成分标签。

在一个示例性实施例中，可以但不限于通过以下方式得到成分标签识别层输出的多个目标文字，每个目标文字对应的成分标签和每个成分标签对应的成分标签概率：将所述目标语句文本输入所述成分标签识别层所包括的预处理网络，得到所述预处理网络输出的与所述多个目标文字一一对应的多个词向量；将所述多个词向量输入所述成分标签识别层所包括的成分标签识别网络，得到所述成分标签识别网络输出的所述多个词向量，每个词向量对应的成分标签和每个成分标签对应的成分标签概率。

可选地，在本实施例中，预处理网络可以但不限于用于将目标语句文本中的每个目标文字转换为与每个目标文字一一对应的词向量，预处理网络可以但不限于包括BERT(Bidirectional Encoder Representation from Transformers，双向预训练方法)模型架构的网络，或者，Roberta(A Robustly Optimized BERT Pretraining Approach，鲁棒性优化的预训练方法)模型架构的网络等等，Roberta模型具有较强的获取动态词向量的能力，在模型细节、训练策略、数据层面三方面优化了网络结构，可以快速准确地将目标语句文本的每个目标文字转换为对应的词向量，节约了将文字转换为对应的词向量的时间，提高了将文字转换为对应的词向量的效率。

可选地，在本实施例中，成分标签识别网络可以但不限于用于预测输入的多个词向量对应的成分标签和每个成分标签对应的成分标签概率，成分标签识别网络可以但不限于包括LSTM(Long Short-Term Memory，长短时记忆)模型架构的网络，或者，BiLSTM(Bi-directional Long Short-Term Memory，双向长短时记忆)模型架构的网络等等，图5是根据本公开实施例的可选的BiLSTM模型的架构图，如图5所示，BiLSTM模型在进行“EU rejects German cal”对应的成分标签预测时，可以但不限于进行利用前向预测和后向预测，通过将前向预测的结果和后向预测的结果拼接，将“EU”预测为“B-SUB”成分标签，其中，“SUB”代表着主语(SUBJECT)，将“rejects”预测为“B-PRE”成分标签，其中，“PRE”代表着谓语动词(PREDICATE)，将“German”预测为“B-ATT”，其中，“ATT”代表着定语(ATTRIBUTE)，将“call”预测为“B-OBJ”，其中，“OBJ”代表着宾语(OBJECT)，提高了预测词向量对应的成分标签的准确率，并且Bi-LSTM模型具有较强的鲁棒性，较少的受到工程特征的影响，能够稳定运行。

可选地，在本实施例中，成分标签概率可以但不限于包括未归一化的概率(即各个成分标签概率可以但不限于为大于1，或者大于或者等于0，并且小于或者等于1)，或者，归一化的概率(即各个成分标签概率可以但不限于均大于或者等于0，并且小于或者等于1)等等。

可选地，在本实施例中，成分标签识别层可以但不限于包括成分标签识别网络和成分标签概率归一化网络，或者，成分标签识别网络；成分标签概率归一化网络可以但不限于用于将成分标签识别网络输出的成分标签概率进行归一化，成分标签概率归一化网络可以但不限于包括采用Softmax(分类网络)模型架构的网络等等。

在一个示例性实施例中，可以但不限于通过以下方式得到成分识别结果：通过所述成分标签判定层从所述每个目标文字对应的成分标签中筛选出满足目标约束条件的候选成分标签，其中，所述目标约束条件为语句中对语言成分的约束条件；通过所述成分标签判定层从所述候选成分标签中获取所对应的成分标签概率满足目标概率条件的成分标签作为所述每个目标文字所对应的目标成分标签，得到与所述多个目标文字一一对应的多个目标成分标签作为所述成分识别结果。

可选地，在本实施例中，成分标签判定层可以但不限于用于输出与每个目标文字一一对应的目标成分标签，成分标签判定层可以但不限于包括采用CRF(Conditional Random Field，条件随机场)模型等等，CRF模型可以充分利用BiLSTM模型中的信息，提高了CRF输出的每个目标文字对应的目标成分标签的准确性。

可选地，在本实施例中，目标约束条件可以但不限于由成分标签判定层从目标语句文本中学习到，比如：句子的第一个单词应该是“B-label”或“O-label”而不是“I-label”，“B-label1 I-label1 I-label 2……”中，label1，label2和label3应该是同一种成分类别，“O I-label”是错误的，开头应该是“B-”而不是“I-”。通过学习这些约束，可以提高成分标签识别网络所预测出的预测标签的准确性。

可选地，在本实施例中，可以但不限于将候选成分标签中的每个目标文字可能属于的成分标签中的成分标签概率最大的成分标签作为每个目标文字的目标成分标签，或者，将目标语句文本中的多个目标文字的成分标签概率的和值最大的多个成分标签作为多个目标成分标签等等。

在上述步骤S206提供的技术方案中，可以但不限于通过结合目标成分特征和目标语句文本识别目标语句文本对智能设备的操作意图，在智能对话系统中，往往需要及时准确地识别出文本的意图，需要识别的文本可能是包含从句部分的长句，也可能是包括几个语言成分的短句，结合目标语句文本可以充分利用目标语句文本中的信息准确地识别目标语句文本的含义，结合目标语句文本所具有的语言成分和目标语句，可以准确地识别出目标语句文本的标意图特征，实现了提升识别目标语句文本对智能设备的操作意图的准确率。

在一个示例性实施例中，可以但不限于通过以下方式识别目标语句文本对应的目标意图特征：通过目标意图识别模型对携带了所述目标成分特征的所述目标语句文本进行识别，其中，所述目标意图识别模型是使用标注了意图特征的携带了成分特征的第二文本样本对初始意图识别模型进行训练得到的；获取所述目标意图识别模型输出的意图识别结果作为所述目标意图特征。

可选地，在本实施例中，可以但不限于将目标成分识别模型输出的携带有目标成分特征的目标语句文本输入目标意图识别模型，将目标意图识别模型输出的目标语句文本对智能设备的操作意图作为目标意图特征。

在一个示例性实施例中，可以但不限于通过以下方式对携带了目标成分特征的目标语句文本进行识别：将所述目标语句文本输入目标实体识别模型，得到所述目标实体识别模型输出的目标实体特征，其中，所述目标实体特征用于指示所述目标语句文本中所包括的实体，所述目标实体识别模型是使用标注了实体特征的第三文本样本对初始实体识别模型进行训练得到的；将所述目标成分特征和所述目标实体特征输入所述目标意图识别模型，得到所述目标意图识别模型输出的所述意图识别结果。

可选地，在本实施例中，可以但不限于将目标实体识别模型识别出的目标语句文本中所包括的实体作为目标实体特征，可以但不限于将目标成分特征和目标实体特征输入目标意图识别模型，将目标意图识别模型输出的意图识别结果作为目标语句文本所对应的对智能设备的操作意图，图6是根据本公开实施例的一种可选的识别目标语句意图的模型架构图，如图6所示，可以但不限于通过结合目标成分识别模型、目标实体识别模型、和目标意图识别模型来识别目标语句对智能设备的操作意图，实现了将目标语句文本所具有的语言成分和目标语句文本中所包括的实体结合进行意图识别，充分利用了目标语句文本所包括的信息，提升了识别出目标语句文本对智能设备的操作意图的准确性。

在一个示例性实施例中，可以但不限于通过以下方式得到目标实体识别模型：获取标注了实体特征的第三文本样本，其中，所述实体特征用于表征对所述智能设备执行的控制操作的操作信息；使用标注了所述实体特征的所述第三文本样本对所述初始实体识别模型进行训练，得到所述目标实体识别模型。

可选地，在本实施例中，对智能设备执行的控制操作的操作信息可以但不限于包括对智能设备执行控制操作的操作时间，操作地点，操作模式，操作设备及该设备的操作模式等等。

为了更好的理解上述语句文本的识别的过程，以下再结合可选实施例对上述语句文本的识别流程进行说明，但不用于限定本公开实施例的技术方案。

在本实施例中提供了一种语句文本的识别方法，图7是根据本公开实施例的识别语句文本的语言成分的示意图，如图7所示，该方法可以但不限于包括如下步骤：

步骤S701：进行文本数据的收集、清洗处理；

步骤S702：确定文本数据标注的成分标签和数量，成分标签可以但不限于包括以下至少之一：主语(SUB)、谓语(PRE)、宾语(OBJ)、定语(ATT)、状语(ADV，Adverbial)、补语(COM，Complement))、主语从句、谓语从句、宾语从句、定语从句、状语从句、和补语从句等等；

步骤S703：标注文本数据所具有的语言成分，可以但不限于根据确定好的标注规则，标注文本数据中各个语句文本中所具有的语言成分，得到模型训练的样本数据；

步骤S704：可以但不限于将样本数据切分为训练集、验证集和测试集，得到训练数据；

步骤S705：将训练数据输入到Roberta预训练模型进行向量化，向量化可以但不限于分为三个模块input-ids(输入数据中词语id(identification，标识)组成的张量)、segment-ids(输入数据中的句子id(标识)组成的张量)、input-mask(输入数据掩码)。对三个向量化的结果做融合得到Embedding(词向量)的输出；

步骤S706：BiLSTM模型预测每个词向量对应的成分标签和每个成分标签对应的成分标签概率，可以但不限于将Roberta预训练模型输出的多个词向量作为BiLSTM模型的输入，该输入获取的n维字向量作为BiLSTM神经网络各个时间步的输入，得到BiLSTM层的隐状态序列。BiLSTM模型学习参数的更新可以但不限于使用BPTT(Back-Propagation Through Time，时序反向传播)算法，该模型在forward(前向)和backward(后向)阶段与一般模型不同之处在于隐藏层对于所有的time step(步长)都要展开计算。

步骤S707：Softmax层对每个成分标签概率进行归一化处理，可以但不限于将BiLSTM输出的多个词向量，每个词向量对应的成分标签和每个成分标签对应的成分标签概率输入logit(逻辑)层，其中，logit层是Softmax层的输入，Softmax层输出多个词向量，每个词向量对应的成分标签和每个成分标签对应的归一化的成分标签概率；

步骤S708：CRF层输出每个词向量对应的预测成分标签，可以但不限于将Softmax层输出的多个词向量，每个词向量对应的成分标签和每个成分标签对应的归一化的成分标签概率输入CRF层，CRF层可以向最终的预测成分标签添加一些约束，以确保预测成分标签为有效的，这些约束在该CRF层训练过程中由训练数据集自动学习得到。CRF则将LSTM在每个t时刻在第i个tag(分类)上的输出作为特征函数中的点函数，使原本的CRF中引入了非线性。整体模型还是以CRF为主体的大框架，使LSTM中的信息得到充分的再利用，最终能够得到全局最优的输出序列。

步骤S709：计算预测成分标签与真实成分标签之间的损失度，经过与训练数据的真实标签进行loss(损失度)的计算，再循环进行每个epoch(时期)的迭代，通过BPTT算法不断更新神经网络节点的参数，使loss逐渐下降最终达到模型收敛状态，且模型经过优化后能保证loss较小，经过训练完成的模型具有较高的新数据的准确率。

步骤S710：在损失度小于或者等于损失度阈值的情况下，模型部署完成，在进行语句意图解析的整个流程中，将新数据传入到该模型中，即可得到预测标签，结合专家规则，完成意图的精确识别。

图8是根据本公开实施例的可选的识别目标语句所具有的语言成分的模型架构图，上述步骤S701～步骤S710可以但不限于用于如图8所示的模型架构中，可以但不限于通过构建句子成分标注规则和句子成分标签预测神经网络模型，完成高精度的语句文本的成分识别；可以但不限于使用Roberta预训练模型完成输入字词的Embedding，使得字词向量化变得简单高效，且向量化包含的信息和含义更加丰富，提升了向量化的准确性；同时利用CRF模型的状态转移矩阵，使得标签预测有效性大大提升。该模型结构提升了训练的速度和预测准确性，在意图识别领域提供了一种新的处理方式。

用户可以但不限于与智能音箱或者其它的智能设备(比如：智能窗帘，智能热水器，或者智能电视等等)进行语音交互，图9是根据本公开实施例的用户与智能音箱语音交互的场景示意图，如图9所示，用户可以但不限于在智能音箱播放音乐的过程中，表达出“声音太大了”的语音指令，可以但不限于识别出用户对智能音箱的操作意图可以但不限于包括将智能音箱播放音乐的音量调小10％(或者15％，5％等等)，那么可以但不限于响应用户的语音指令，将智能音箱播放音乐的音量调小10％。

图10是根据本公开实施例的用户与智能电视语音交互的场景示意图，如图10所示，智能电视可以但不限于为关机的状态，如果获取到用户表达出“把电视打开”的语音指令，可以但不限于识别出用户对智能电视的操作意图为控制智能电视开机，那么可以但不限于响应用户的语音指令，控制智能电视开机。

需要说明的是，在本实施例中，对智能音箱和智能电视的形状不做限定，在图9中仅以外形为圆柱形的智能音箱进行举例说明，在图10中仅以外形为矩形状的智能电视进行举例说明，智能音箱和智能电视的形状可以是任何符合生产工艺和用户需求的形状，本公开对此不做限定。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本公开的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端设备(可以是手机，计算机，服务器，或者网络设备等)执行本公开各个实施例的方法。

图11是根据本公开实施例的一种语句文本的识别装置的结构框图；如图11所示，包括：

第一获取模块1102，设置为获取智能设备采集到的语句文本作为待识别的目标语句文本；

第一识别模块1104，设置为通过目标成分识别模型对所述目标语句文本进行识别，得到所述目标语句文本对应的目标成分特征，其中，所述目标成分识别模型是使用标注了成分特征的第一文本样本对初始成分识别模型进行训练得到的，所述目标成分特征用于指示所述目标语句文本所具有的语言成分；

第二识别模块1106，设置为根据所述目标成分特征和所述目标语句文本，识别所述目标语句文本对应的目标意图特征，其中，所述目标意图特征用于指示所述目标语句文本对所述智能设备的操作意图。

通过上述实施例，如果获取到智能设备采集到的语句文本作为待识别的目标语句文本，可以通过目标成分识别模型识别目标语句文本所具有的语言成分作为目标成分特征，通过将目标语句文本和目标语句文本中所具有的语言成分结合来识别目标意图特征，实现了准确地识别目标语句文本对智能设备的操作意图。采用上述技术方案，解决了相关技术中，识别语句文本所表达意图的准确率较低等问题，实现了提高识别语句文本所表达意图的准确率的技术效果。

在一个示例性实施例中，所述第一识别模块，包括：

第一识别单元，设置为将所述目标语句文本输入所述目标成分识别模型所包括的成分标签识别层，得到所述成分标签识别层输出的多个目标文字，每个目标文字对应的成分标签和每个成分标签对应的成分标签概率，其中，所述目标语句文本包括所述多个目标文字，所述成分标签用于指示允许对应的所述每个目标文字所属于的语言成分，所述成分标签概率用于指示对应的所述每个目标文字属于对应的所述成分标签的概率；

处理单元，设置为将多个目标文字，每个目标文字对应的成分标签和每个成分标签对应的成分标签概率输入成分标签判定层，得到所述成分标签判定层输出的与所述多个目标文字一一对应的多个目标成分标签作为成分识别结果。

在一个示例性实施例中，所述第一识别单元，设置为：

在一个示例性实施例中，所述处理单元，设置为：

在一个示例性实施例中，所述第二识别模块，包括：

第二识别单元，设置为通过目标意图识别模型对携带了所述目标成分特征的所述目标语句文本进行识别，其中，所述目标意图识别模型是使用标注了意图特征的携带了成分特征的第二文本样本对初始意图识别模型进行训练得到的；

获取单元，设置为获取所述目标意图识别模型输出的意图识别结果作为所述目标意图特征。

在一个示例性实施例中，其特征在于，所述第二识别单元，设置为：

在一个示例性实施例中，其特征在于，所述装置还包括：

第二获取模块，设置为在所述将所述目标语句文本输入目标实体识别模型之前，获取标注了实体特征的第三文本样本，其中，所述实体特征用于表征对所述智能设备执行的控制操作的操作信息；

训练模块，设置为使用标注了所述实体特征的所述第三文本样本对所述初始实体识别模型进行训练，得到所述目标实体识别模型。

本公开的实施例还提供了一种存储介质，该存储介质包括存储的程序，其中，上述程序运行时执行上述任一项的方法。

可选地，在本实施例中，上述存储介质可以被设置为存储用于执行以下步骤的程序代码：

S1，获取智能设备采集到的语句文本作为待识别的目标语句文本；

S2，通过目标成分识别模型对所述目标语句文本进行识别，得到所述目标语句文本对应的目标成分特征，其中，所述目标成分识别模型是使用标注了成分特征的第一文本样本对初始成分识别模型进行训练得到的，所述目标成分特征用于指示所述目标语句文本所具有的语言成分；

S3，根据所述目标成分特征和所述目标语句文本，识别所述目标语句文本对应的目标意图特征，其中，所述目标意图特征用于指示所述目标语句文本对所述智能设备的操作意图。

本公开的实施例还提供了一种电子装置，包括存储器和处理器，该存储器中存储有计算机程序，该处理器被设置为运行计算机程序以执行上述任一项方法实施例中的步骤。

可选地，上述电子装置还可以包括传输设备以及输入输出设备，其中，该传输设备和上述处理器连接，该输入输出设备和上述处理器连接。

可选地，在本实施例中，上述处理器可以被设置为通过计算机程序执行以下步骤：

可选地，在本实施例中，上述存储介质可以包括但不限于：U盘、只读存储器(Read-Only Memory，简称为ROM)、随机存取存储器(Random Access Memory，简称为RAM)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。

可选地，本实施例中的具体示例可以参考上述实施例及可选实施方式中所描述的示例，本实施例在此不再赘述。

显然，本领域的技术人员应该明白，上述的本公开的各模块或各步骤可以用通用的计算装置来实现，它们可以集中在单个的计算装置上，或者分布在多个计算装置所组成的网络上，可选地，它们可以用计算装置可执行的程序代码来实现，从而，可以将它们存储在存储装置中由计算装置来执行，并且在某些情况下，可以以不同于此处的顺序执行所示出或描述的步骤，或者将它们分别制作成各个集成电路模块，或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样，本公开不限制于任何特定的硬件和软件结合。

以上所述仅是本公开的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本公开原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本公开的保护范围。

Claims

一种语句文本的识别方法，包括：

获取智能设备采集到的语句文本作为待识别的目标语句文本；

通过目标成分识别模型对所述目标语句文本进行识别，得到所述目标语句文本对应的目标成分特征，其中，所述目标成分识别模型是使用标注了成分特征的第一文本样本对初始成分识别模型进行训练得到的，所述目标成分特征用于指示所述目标语句文本所具有的语言成分；

根据所述目标成分特征和所述目标语句文本，识别所述目标语句文本对应的目标意图特征，其中，所述目标意图特征用于指示所述目标语句文本对所述智能设备的操作意图。
根据权利要求1所述的方法，其中，所述通过目标成分识别模型对所述目标语句文本进行识别，包括：

将所述目标语句文本输入所述目标成分识别模型所包括的成分标签识别层，得到所述成分标签识别层输出的多个目标文字，每个目标文字对应的成分标签和每个成分标签对应的成分标签概率，其中，所述目标语句文本包括所述多个目标文字，所述成分标签用于指示允许对应的所述每个目标文字所属于的语言成分，所述成分标签概率用于指示对应的所述每个目标文字属于对应的所述成分标签的概率；

将多个目标文字，每个目标文字对应的成分标签和每个成分标签对应的成分标签概率输入成分标签判定层，得到所述成分标签判定层输出的与所述多个目标文字一一对应的多个目标成分标签作为成分识别结果。
根据权利要求2所述的方法，其中，所述将所述目标语句文本输入所述目标成分识别模型所包括的成分标签识别层，得到所述成分标签识别层输出的多个目标文字，每个目标文字对应的成分标签和每个成分标签对应的成分标签概率，包括：

将所述目标语句文本输入所述成分标签识别层所包括的预处理网络，得到所述预处理网络输出的与所述多个目标文字一一对应的多个词向量；

将所述多个词向量输入所述成分标签识别层所包括的成分标签识别网络，得到所述成分标签识别网络输出的所述多个词向量，每个词向量对应的成分标签和每个成分标签对应的成分标签概率。
根据权利要求2所述的方法，其中，所述将多个目标文字，每个目标文字对应的成分标签和每个成分标签对应的成分标签概率输入成分标签判定层，得到所述成分标签判定层输出的与所述多个目标文字一一对应的多个目标成分标签作为成分识别结果，包括：

通过所述成分标签判定层从所述每个目标文字对应的成分标签中筛选出满足目标约束条件的候选成分标签，其中，所述目标约束条件为语句中对语言成分的约束条件；

通过所述成分标签判定层从所述候选成分标签中获取所对应的成分标签概率满足目标概率条件的成分标签作为所述每个目标文字所对应的目标成分标签，得到与所述多个目标文字一一对应的多个目标成分标签作为所述成分识别结果。
根据权利要求1-4任一项所述的方法，其中，所述根据所述目标成分特征和所述目标语句文本，识别所述目标语句文本对应的目标意图特征，包括：

通过目标意图识别模型对携带了所述目标成分特征的所述目标语句文本进行识别，其中，所述目标意图识别模型是使用标注了意图特征的携带了成分特征的第二文本样本对初始意图识别模型进行训练得到的；

获取所述目标意图识别模型输出的意图识别结果作为所述目标意图特征。
根据权利要求5所述的方法，其中，所述通过目标意图识别模型对携带了所述目标成分特征的所述目标语句文本进行识别，包括：

将所述目标语句文本输入目标实体识别模型，得到所述目标实体识别模型输出的目标实体特征，其中，所述目标实体特征用于指示所述目标语句文本中所包括的实体，所述目标实体识别模型是使用标注了实体特征的第三文本样本对初始实体识别模型进行训练得到的；

将所述目标成分特征和所述目标实体特征输入所述目标意图识别模型，得到所述目标意图识别模型输出的所述意图识别结果。
根据权利要求6所述的方法，其中，在所述将所述目标语句文本输入目标实体识别模型之前，所述方法还包括：

获取标注了实体特征的第三文本样本，其中，所述实体特征用于表征对所述智能设备执行的控制操作的操作信息；

使用标注了所述实体特征的所述第三文本样本对所述初始实体识别模型进行训练，得到所述目标实体识别模型。
一种语句文本的识别装置，包括：

第一获取模块，设置为获取智能设备采集到的语句文本作为待识别的目标语句文本；

第一识别模块，设置为通过目标成分识别模型对所述目标语句文本进行识别，得到所述目标语句文本对应的目标成分特征，其中，所述目标成分识别模型是使用标注了成分特征的第一文本样本对初始成分识别模型进行训练得到的，所述目标成分特征用于指示所述目标语句文本所具有的语言成分；

第二识别模块，设置为根据所述目标成分特征和所述目标语句文本，识别所述目标语句文本对应的目标意图特征，其中，所述目标意图特征用于指示所述目标语句文本对所述智能设备的操作意图。
根据权利要求8所述的装置，其中，所述第一识别模块，包括：

第一识别单元，设置为将所述目标语句文本输入所述目标成分识别模型所包括的成分标签识别层，得到所述成分标签识别层输出的多个目标文字，每个目标文字对应的成分标签和每个成分标签对应的成分标签概率，其中，所述目标语句文本包括所述多个目标文字，所述成分标签用于指示允许对应的所述每个目标文字所属于的语言成分，所述成分标签概率用于指示对应的所述每个目标文字属于对应的所述成分标签的概率；

处理单元，设置为将多个目标文字，每个目标文字对应的成分标签和每个成分标签对应的成分标签概率输入成分标签判定层，得到所述成分标签判定层输出的与所述多个目标文字一一对应的多个目标成分标签作为成分识别结果。
根据权利要求9所述的装置，其中，所述第一识别单元，设置为：

将所述目标语句文本输入所述成分标签识别层所包括的预处理网络，得到所述预处理网络输出的与所述多个目标文字一一对应的多个词向量；

将所述多个词向量输入所述成分标签识别层所包括的成分标签识别网络，得到所述成分标签识别网络输出的所述多个词向量，每个词向量对应的成分标签和每个成分标签对应的成分标签概率。
根据权利要求9所述的装置，其中，所述处理单元，设置为：

通过所述成分标签判定层从所述每个目标文字对应的成分标签中筛选出满足目标约束条件的候选成分标签，其中，所述目标约束条件为语句中对语言成分的约束条件；

通过所述成分标签判定层从所述候选成分标签中获取所对应的成分标签概率满足目标概率条件的成分标签作为所述每个目标文字所对应的目标成分标签，得到与所述多个目标文字一一对应的多个目标成分标签作为所述成分识别结果。
根据权利要求8-11任一项所述的装置，其中，所述第二识别模块，包括：

第二识别单元，设置为通过目标意图识别模型对携带了所述目标成分特征的所述目标语句文本进行识别，其中，所述目标意图识别模型是使用标注了意图特征的携带了成分特征的第二文本样本对初始意图识别模型进行训练得到的；

获取单元，设置为获取所述目标意图识别模型输出的意图识别结果作为所述目标意图特征。
根据权利要求12所述的装置，其中，所述第二识别单元，设置为：

将所述目标语句文本输入目标实体识别模型，得到所述目标实体识别模型输出的目标实体特征，其中，所述目标实体特征用于指示所述目标语句文本中所包括的实体，所述目标实体识别模型是使用标注了实体特征的第三文本样本对初始实体识别模型进行训练得到的；

将所述目标成分特征和所述目标实体特征输入所述目标意图识别模型，得到所述目标意图识别模型输出的所述意图识别结果。
根据权利要求13所述的装置，其中，所述装置还包括：

第二获取模块，设置为在所述将所述目标语句文本输入目标实体识别模型之前，获取标注了实体特征的第三文本样本，其中，所述实体特征用于表征对所述智能设备执行的控制操作的操作信息；

训练模块，设置为使用标注了所述实体特征的所述第三文本样本对所述初始实体识别模型进行训练，得到所述目标实体识别模型。
一种计算机可读的存储介质，所述计算机可读的存储介质包括存储的程序，其中，所述程序运行时执行权利要求1至7中任一项所述的方法。
一种电子装置，包括存储器和处理器，所述存储器中存储有计算机程序，所述处理器被设置为通过所述计算机程序执行权利要求1至7中任一项所述的方法。