WO2023173596A1

WO2023173596A1 - 语句文本的意图识别方法和装置、存储介质及电子装置

Info

Publication number: WO2023173596A1
Application number: PCT/CN2022/096435
Authority: WO
Inventors: 刘建国; 王迪; 李昱涧
Original assignee: 青岛海尔科技有限公司; 海尔智家股份有限公司
Priority date: 2022-03-15
Filing date: 2022-05-31
Publication date: 2023-09-21
Also published as: CN114925158A

Abstract

本公开提供了一种语句文本的意图识别方法和装置、存储介质及电子装置，涉及智能家居技术领域，该语句文本的意图识别方法包括：获取智能设备采集到的语句文本作为待识别的目标语句文本；对目标语句文本进行实体识别，得到目标实体标签，其中，目标实体标签用于表征目标语句文本对应的目标控制操作的目标操作信息，目标控制操作为目标语句文本指示对智能设备执行的控制操作；根据目标实体标签，识别目标语句文本对应的目标意图特征，其中，目标意图特征用于指示目标语句文本对智能设备的操作意图。采用上述技术方案，解决了相关技术中，识别语句文本所表达意图的准确率较低等问题。

Description

语句文本的意图识别方法和装置、存储介质及电子装置

本公开要求于2022年3月15日提交中国专利局、申请号为202210252555.X、发明名称“语句文本的意图识别方法和装置、存储介质及电子装置”的中国专利申请的优先权，其全部内容通过引用结合在本公开中。

技术领域

本公开涉及智能家居技术领域，具体而言，涉及一种语句文本的意图识别方法和装置、存储介质及电子装置。

背景技术

在NLP(Natural Language Processing，自然语言处理)领域中，往往需要及时准确地识别出数据所表达的意图，现有技术中，往往将训练数据标注为人名、机构名、地名、货币和百分比等等标签，再将标注好的训练数据输入构建好的识别模型，将识别模型输出的预测结果作为训练数据所表达的意图，而在智慧设备控制场景中，人名、机构名、地名、货币和百分比等等标签与智能设备的相关度较低，这可能会导致识别用户语言所表达的意图的准确性较低。

针对相关技术中，识别语句文本所表达意图的准确率较低等问题，尚未提出有效的解决方案。

发明内容

本公开实施例提供了一种语句文本的意图识别方法和装置、存储介质及电子装置，以至少解决相关技术中，识别语句文本所表达意图的准确率较低等问题。

根据本公开实施例的一个实施例，提供了一种语句文本的意图识别方法，包括：获取智能设备采集到的语句文本作为待识别的目标语句文本；

对所述目标语句文本进行实体识别，得到目标实体标签，其中，所述目标实体标签用于表征所述目标语句文本对应的目标控制操作的目标操作信息，所述目标控制操作为所述目标语句文本指示对所述智能设备执行的控制操作；

根据所述目标实体标签，识别所述目标语句文本对应的目标意图特征，其中，所述目标意图特征用于指示所述目标语句文本对所述智能设备的操作意图。

在一个示例性实施例中，所述对所述目标语句文本进行实体识别，得到目标实体标签，包括：

将所述目标语句文本输入目标实体识别模型，其中，所述目标实体识别模型是使用标注了实体标签的文本样本对初始实体识别模型进行训练得到的，所述实体标签包括：操作时间、操作位置、操作资源属性、操作设备、操作模式；

获取所述目标实体识别模型输出的所述目标实体标签。

在一个示例性实施例中，在所述将所述目标语句文本输入目标实体识别模型之前，所述方法还包括：

将所述文本样本输入所述初始实体识别模型，得到所述初始实体识别模型输出的初始实体标签；

将所述初始实体标签与所述文本样本所标注的实体标签输入预设的损失函数，得到损失值；

根据所述损失值对所述初始实体识别模型的模型参数进行调整，直至满足训练截止条件，得到所述目标实体识别模型。

在一个示例性实施例中，所述将所述文本样本输入所述初始实体识别模型，得到所述初始实体识别模型输出的初始实体标签包括：将所述文本样本输入初始标签预测层；将所述初始标签预测层输出的初始预测标签输入初始条件约束层，得到所述初始条件约束层输出的所述初始实体标签；其中，所述初始实体识别模型包括所述初始标签预测层和所述初始条件约束层，所述初始实体识别模型用于预测输入参数对应的预测标签和每个预测标签对应的预测概率，所述初始条件约束层用于对所述初始实体识别模型预测出的预测标签和每个预测标签对应的预测概率添加约束条件得到满足所述约束条件的实体标签；

所述根据所述损失值对所述初始实体识别模型的模型参数进行调整包括：根据所述损失值对所述初始标签预测层的预测参数和所述初始条件约束层的所述约束条件进行调整，其中，所述初始实体识别模型的模型参数包括所述预测参数和所述约束条件。

在一个示例性实施例中，所述将所述文本样本输入所述初始实体识别模型，包括：

将所述文本样本进行向量化处理，得到所述文本样本对应的文本向量；

将所述文本向量输入所述初始实体识别模型。

在一个示例性实施例中，所述根据所述目标实体标签，识别所述目标语句文本对应的目标意图特征，包括：

通过目标意图识别模型对所述目标实体标签进行识别，其中，所述目标意图识别模型是使用标注了意图特征的实体标签样本对初始意图识别模型进行训练得到的；

获取所述目标意图识别模型输出的意图识别结果作为所述目标意图特征。

在一个示例性实施例中，所述通过目标意图识别模型对所述目标实体标签进行识别，包括：

对所述目标语句文本进行语言成分解析，得到目标成分特征；

将所述目标成分特征和所述目标实体标签输入所述目标意图识别模型，得到所述目标意图识别模型输出的所述意图识别结果。

根据本公开实施例的另一个实施例，还提供了一种语句文本的意图识别装置，包括：

获取模块，设置为获取智能设备采集到的语句文本作为待识别的目标语句文本；

第一识别模块，设置为对所述目标语句文本进行实体识别，得到目标实体标签，其中，所述目标实体标签用于表征所述目标语句文本对应的目标控制操作的目标操作信息，所述目标控制操作为所述目标语句文本指示对所述智能设备执行的控制操作；

第二识别模块，设置为根据所述目标实体标签，识别所述目标语句文本对应的目标意图特征，其中，所述目标意图特征用于指示所述目标语句文本对所述智能设备的操作意图。

根据本公开实施例的又一方面，还提供了一种计算机可读的存储介质，该计算机可读的存储介质中存储有计算机程序，其中，该计算机程序被设置为运行时执行上述语句文本的意图识别方法。

根据本公开实施例的又一方面，还提供了一种电子装置，包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序，其中，上述处理器通过计算机程序执行上述的语句文本的意图识别方法。

在本公开实施例中，获取智能设备采集到的语句文本作为待识别的目标语句文本；对目标语句文本进行实体识别，得到目标实体标签，其中，目标实体标签用于表征目标语句文本对应的目标控制操作的目标操作信息，目标控制操作为目标语句文本指示对智能设备执行的控制操作；根据目标实体标签，识别目标语句文本对应的目标意图特征，其中，目标意图特征用于指示目标语句文本对智能设备的操作意图，即如果获取到待识别的目标语句文本，识别目标语句文本指示对智能设备执行的控制操作的目标操作信息作为目标实体标签，根据目标实体标签识别目标语句文本对智能设备的操作意图，通过与对智能设备的操作意图的相关性较高的目标实体标签，提升了识别目标语句文本对智能设备的操作意图的准确性。采用上述技术方案，解决了相关技术中，识别语句文本所表达意图的准确率较低等问题，实现了提升识别语句文本所表达意图的准确率的技术效果。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分，示出了符合本公开的实施例，并与说明书一起用于解释本公开的原理。

为了更清楚地说明本公开实施例或现有技术中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，对于本领域普通技术人员而言，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1是根据本公开实施例的一种语句文本的意图识别方法的硬件环境示意图；

图2是根据本公开实施例的一种语句文本的意图识别方法的流程图；

图3是根据本公开实施例的可选的BiLSTM模型的架构图；

图4是根据本公开实施例的可选的识别语句文本的意图的整体模型架构图；

图5是根据本公开实施例的识别目标语句文本的目标意图特征的流程图；

图6是根据本公开实施例的一种语句文本的意图识别方法的示意图；

图7是根据本公开实施例的可选的识别目标语句所具有的语言成分的模型架构图；

图8是根据本公开实施例的用户与智能音箱语音交互的场景示意图；

图9是根据本公开实施例的用户与智能电视语音交互的场景示意图；

图10是根据本公开实施例的一种语句文本的意图识别装置的结构框图。

具体实施方式

为了使本技术领域的人员更好地理解本公开方案，下面将结合本公开实施例中的附图，对本公开实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本公开一部分的实施例，而不是全部的实施例。基于本公开中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都应当属于本公开保护的范围。

需要说明的是，本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

根据本公开实施例的一个方面，提供了一种语句文本的意图识别方法。该语句文本的意图识别方法广泛应用于智慧家庭(Smart Home)、智能家居、智能家用设备生态、智慧住宅(Intelligence House)生态等全屋智能数字化控制应用场景。可选地，在本实施例中，上述语句文本的意图识别方法可以应用于如图1所示的由终端设备102和服务器104所构成的硬件环境中。如图1所示，服务器104通过网络与终端设备102进行连接，可设置为终端或终端上安装的客户端提供服务(如应用服务等)，可在服务器上或独立于服务器设置数据库，设置为服务器104提供数据存储服务，可在服务器上或独立于服务器配置云计算和/或边缘计算服务，设置为服务器104提供数据运算服务。

上述网络可以包括但不限于以下至少之一：有线网络，无线网络。上述有线网络可以包括但不限于以下至少之一：广域网，城域网，局域网，上述无线网络可以包括但不限于以下至少之一：WIFI(Wireless Fidelity，无线保真)，蓝牙。终端设备102可以并不限定于为PC(Personal Computer，个人电脑)、手机、平板电脑、智能空调、智能烟机、智能冰箱、智能烤箱、智能炉灶、智能洗衣机、智能热水器、智能洗涤设备、智能洗碗机、智能投影设备、智能电视、智能晾衣架、智能窗帘、智能影音、智能插座、智能音响、智能音箱、智能新风设备、智能厨卫设备、智能卫浴设备、智能扫地机器人、智能擦窗机器人、智能拖地机器人、智能空气净化设备、智能蒸箱、智能微波炉、智能厨宝、智能净化器、智能饮水机、智能门锁等。

在本实施例中提供了一种语句文本的意图识别方法，应用于上述计算机终端，图2是根据本公开实施例的一种语句文本的意图识别方法的流程图，如图2 所示，该流程包括如下步骤：

步骤S202，获取智能设备采集到的语句文本作为待识别的目标语句文本；

步骤S204，对所述目标语句文本进行实体识别，得到目标实体标签，其中，所述目标实体标签用于表征所述目标语句文本对应的目标控制操作的目标操作信息，所述目标控制操作为所述目标语句文本指示对所述智能设备执行的控制操作；

步骤S206，根据所述目标实体标签，识别所述目标语句文本对应的目标意图特征，其中，所述目标意图特征用于指示所述目标语句文本对所述智能设备的操作意图。

通过上述步骤，如果获取到待识别的目标语句文本，识别目标语句文本指示对智能设备执行的控制操作的目标操作信息作为目标实体标签，根据目标实体标签识别目标语句文本对智能设备的操作意图，通过与对智能设备的操作意图的相关性较高的目标实体标签，提升了识别目标语句文本对智能设备的操作意图的准确性。采用上述技术方案，解决了相关技术中，识别语句文本所表达意图的准确率较低等问题，实现了提升识别语句文本所表达意图的准确率的技术效果。

在上述步骤S202提供的技术方案中，智能设备可以但不限于将获取到用户发出的语音指令转换为对应的语句文本，或者，将用户在智能设备上输入的文字内容转换为对应的语句文本等等，实现了可以通过多种方式获取用户想要表达的语言内容，方便用户可以采用多种方式进行操作，提升了用户的操作体验度。

可选地，在本实施例中，智能设备可以但不限于包括支持按照用户的语音指令执行对应的操作的设备等等，比如：智能设备可以但不限于包括智能空调、智能烟机、智能冰箱、智能烤箱、智能炉灶、智能洗衣机、智能热水器、智能洗涤设备、智能洗碗机、智能投影设备、智能电视、智能晾衣架、智能窗帘、智能插座、智能音响、智能音箱、智能新风设备、智能厨卫设备、智能卫浴设备、智能扫地机器人、智能擦窗机器人、智能拖地机器人、智能空气净化设备、智能蒸箱、智能微波炉、智能厨宝、智能净化器、智能饮水机、智能门锁、智能车载空调、智能雨刷、智能车载音箱、智能车载冰箱等等。

在上述步骤S204提供的技术方案中，可以但不限于通过对目标语句文本进行实体识别，得到目标语句文本指示对智能设备执行的控制操作的目标操作信息，目标操作信息可以但不限于包括与目标语句文本指示对智能设备执行的目标控制操作相关的操作信息，可以但不限于将目标操作信息作为目标实体标签，提升了目标实体标签与目标语句文本指示对智能设备执行的控制操作的相关度。

在一个示例性实施例中，可以但不限于通过以下方式得到目标实体标签：将所述目标语句文本输入目标实体识别模型，其中，所述目标实体识别模型是使用标注了实体标签的文本样本对初始实体识别模型进行训练得到的，所述实体标签包括：操作时间、操作位置、操作资源属性、操作设备、操作模式；获取所述目标实体识别模型输出的所述目标实体标签。

可选地，在本实施例中，可以但不限于将目标语句文本输入目标实体识别模型，将目标实体识别模型输出的目标语句文本对智能设备执行的控制操作的操作时间、操作位置、操作资源属性、操作设备和操作模式等等作为目标实体标签。

可选地，在本实施例中，操作位置可以但不限于包括房间或者功能区域。房间例如为标记有卧室、客厅、书房、厨房或影音室等标签的房间；功能区域例如为标记有特定功能的室内区域，例如娱乐区、做饭区、学习区、洗衣区或穿戴区等。

可选地，在本实施例中，操作资源属性可以但不限于包括操作资源(比如：歌曲、有声读物等音频资源，以及电视剧、电影等视频资源等等操作资源)和操作资源的演绎者(比如：演唱歌曲的歌手、电影的主演等等)。

在一个示例性实施例中，可以但不限于通过以下方式得到目标实体识别模型：将所述文本样本输入所述初始实体识别模型，得到所述初始实体识别模型输出的初始实体标签；将所述初始实体标签与所述文本样本所标注的实体标签输入预设的损失函数，得到损失值；根据所述损失值对所述初始实体识别模型的模型参数进行调整，直至满足训练截止条件，得到所述目标实体识别模型。

可选地，在本实施例中，可以但不限于通过使用标注有实体标签的文本样本对初始实体识别模型进行训练，训练截止条件可以包括但不限于初始实体标签和文本样本所标注的实体标签之间的损失值小于或者等于损失值阈值，或者损失度趋于恒定，或者训练次数达到预定次数。此时初始实体识别模型收敛，可以但不限于将使得初始实体识别模型收敛的模型参数作为目标模型参数，得到目标实体识别模型。

在一个示例性实施例中，可以但不限于通过以下方式得到初始实体标签：将所述文本样本输入初始标签预测层；将所述初始标签预测层输出的初始预测标签输入初始条件约束层，得到所述初始条件约束层输出的所述初始实体标签；其中，所述初始实体识别模型包括所述初始标签预测层和所述初始条件约束层，所述初始实体识别模型用于预测输入参数对应的预测标签和每个预测标签对应的预测概率，所述初始条件约束层用于对所述初始实体识别模型预测出的预测标签和每个预测标签对应的预测概率添加约束条件得到满足所述约束条件的实体标签；

可选地，在本实施例中，初始标签预测层可以但不限于包括采用LSTM(Long Short-Term Memory，长短时记忆)模型架构的网络，或者，采用BiLSTM(Bi-directional Long Short-Term Memory，双向长短时记忆)模型架构的网络等等。图3是根据本公开实施例的可选的BiLSTM模型的架构图，如图3所示，BiLSTM模型在预测“Play loudspeaker inbedroom(播放在卧室的音箱)”对应的实体标签时，可以但不限于进行前向预测和后向预测，并将前向预测的结果和后向预测的结果拼接，将“Play”预测为“B-PAT”标签，其中，“PAT”代表着播放模式(PATTERN)，将“loudspeaker”预测为“B-DEV”标签，其中，“DEV”代表着操作资源(DEVICE)，将“in”预测为“O”标签，其中，“O”标签代表着其它(OTHER)，将“bedroom”预测为“B-ROOM”标签，其中，“ROOM”代表着操作房间，提高了预测标签与对智能设备执行的控制操作的操作信息之间的相关度，提升了预测标签的准确率，并且BiLSTM模型具有较强的鲁棒性，较少的受到工程特征的影响，能够稳定运行。

可选地，在本实施例中，文本样本中的每个文字可以但不限于对应一个或者多个预测标签，每个预测标签都有和该预测标签对应的预测概率，初始条件约束层可以但不限于对初始标签预测层的输出结果添加约束条件，输出满足约束条件的与文本样本中的每个文字一一对应的预测标签。

可选地，在本实施例中，每个预测标签对应的预测概率可以但不限于包括未归一化的概率(即预测概率可以但不限于为大于1，或者小于或者等于1并且大于或者等于0)，或者，归一化的概率(即预测概率可以但不限于大于或者等于0，并且小于或者等于1)等等。可以但不限于通过Softmax(分类网络)模型对每个预测标签对应的预测概率进行归一化处理。

可选地，在本实施例中，初始条件约束层可以但不限于包括采用CRF(Conditional Random Field，条件随机场)模型等等，CRF模型可以充分利用BiLSTM模型中的信息，提高了CRF输出的预测标签的准确性。

可选地，在本实施例中，约束条件可以但不限于初始条件约束层从文本样本中学习到，比如：句子的第一个单词应该是“B-label”或“O-label”而不是“I-label”，“B-label1 I-label1 I-label 2……”中，label1，label2和label3应该是同一种成分类别，“O I-label”是错误的，开头应该是“B-”而不是“I-”。通过学习这些约束，可以有效提高初始标签预测层所预测出的预测标签的准确性。

可选地，在本实施例中，可以但不限于包括将文本样本中的每个文字对应的多个预测标签中预测概率最大的预测标签确定为实体标签，或者，将文本样本中多个文字的预测标签对应的预测概率的和值最大的多个预测标签确定为实体标签。

在一个示例性实施例中，可以但不限于通过以下方式对初始实体识别模型的模型参数进行调整：根据所述损失值对所述初始标签预测层的预测参数和所述初始条件约束层的所述约束条件进行调整，其中，所述初始实体识别模型的模型参数包括所述预测参数和所述约束条件。

可选地，在本实施例中，可以但不限于在损失值大于损失值阈值，或者损失值未趋于恒定值的情况下，根据损失值对初始标签预测层的预测参数和初始条件约束层的约束条件进行调整。

在一个示例性实施例中，可以但不限于通过以下方式将文本样本输入初始实体识别模型：将所述文本样本进行向量化处理，得到所述文本样本对应的文本向量；将所述文本向量输入所述初始实体识别模型。

可选地，在本实施例中，可以但不限于通过BERT(Bidirectional Encoder Representation from Transformers，双向预训练方法)模型，或者，Roberta(A Robustly Optimized BERT Pretraining Approach，鲁棒性优化的预训练方法)模型等等将文本样本中的每个文字转换为与每个文字一一对应的词向量。Roberta模型具有较强的获取动态词向量的能力，在模型细节、训练策略、数据层面三方面优化了网络结构，同时Roberta模型可以快速准确地将目标语句文本的每个目标文字转换为对应的词向量，节约了将文字转换为对应的词向量的时间，提高了将文字转换为对应的词向量的效率。

在上述步骤S206提供的技术方案中，可以但不限于通过与对智能设备执行的控制操作的相关度高的目标实体标签，识别目标语句文本对智能设备执行的控制操作意图，在智慧家庭家电控制场景中，智能对话系统往往需要准确识别出用户所表达的语言对智能设备的操作意图，进而控制智能设备执行用户想要的操作，通过目标实体标签识别目标语句文本对智能设备的操作意图，实现了速度快、效果优、识别准确的意图识别。

在一个示例性实施例中，可以但不限于通过以下方式识别目标意图特征：通过目标意图识别模型对所述目标实体标签进行识别，其中，所述目标意图识别模型是使用标注了意图特征的实体标签样本对初始意图识别模型进行训练得到的；获取所述目标意图识别模型输出的意图识别结果作为所述目标意图特征。

可选地，在本实施例中，可以但不限于将目标实体识别模型输出的目标实体标签输入目标意图识别模型，目标意图识别模型识别目标实体标签对智能设备执行的控制操作的意图，目标意图识别模型输出目标实体标签所对应的目标意图特征。图4是根据本公开实施例的可选的识别语句文本的意图的整体模型架构图，如图4所示。

在一个示例性实施例中，可以但不限于通过以下方式对目标实体标签进行识别：对所述目标语句文本进行语言成分解析，得到目标成分特征；将所述目标成分特征和所述目标实体标签输入所述目标意图识别模型，得到所述目标意图识别模型输出的所述意图识别结果。

可选地，在本实施例中，目标成分特征可以但不限于包括以下至少之一：主语、谓语、宾语、定语、状语、补语、主语从句、谓语从句、宾语从句、定语从句、状语从句、和补语从句等等，通过对目标语句文本所具有的语言成分进行分析，提升了语句文本所包括的信息的利用率。

可选地，在本实施例中，可以但不限于将目标语句文本所具有的语言成分和目标实体标签结合，通过目标意图识别模型识别目标语句文本对智能设备执行的控制操作的意图，实现了充分利用语句文本所包括的信息，提升了识别目标语句文本对智能设备的操作意图的准确率。

可选地，在本实施例中，可以但不限于通过目标实体识别模型和目标意图识别模型，结合目标语句文本所具有的语言成分识别目标语句文本的目标意图特征。图5是根据本公开实施例的识别目标语句文本的目标意图特征的流程图，图5可以但不限于应用于如上述图4所示的模型架构中，如图5所示，可以但不限于包括以下步骤：

步骤S501：获取目标语句文本；

步骤S502：将目标语句文本输入目标实体识别模型；

步骤S503：目标实体识别模型识别目标语句文本所具有的实体标签，得到目标实体标签；

步骤S504：目标实体识别模型输出目标实体标签；

步骤S505：将目标实体标签输入目标意图识别模型；

步骤S506：目标意图识别模型结合目标成分特征和目标实体标签识别目标语句文本的目标意图特征；

步骤S507：目标意图识别模型输出目标意图特征。

为了更好的理解上述语句文本的意图识别的过程，以下再结合可选实施例对上述语句文本的意图识别流程进行说明，但不用于限定本公开实施例的技术方案。

在本实施例中提供了一种语句文本的意图识别方法，图6是根据本公开实施例的一种语句文本的意图识别方法的示意图，如图6所示，可以但不限于包括如下步骤：

步骤S601：进行文本数据的收集、清洗处理；

步骤S602：确定文本数据标注的实体标签和数量，实体标签可以但不限于包括以下至少之一：时间(即上述的操作时间)、房间(即上述的操作位置)、资源(即上述的操作资源属性)、歌手(即上述的操作资源属性)、设备(即上述的操作设备)和模式(即上述的操作模式)等等；

步骤S603：标注文本数据所具有的实体标签，可以但不限于根据确定好的标注规则，进行人工的标签标注，标注出文本数据各句子中的各实体词成分，得到模型训练的样本数据；

步骤S604：可以但不限于将样本数据切分为训练集、验证集和测试集，得到训练数据；

步骤S605：将训练数据输入到Roberta预训练模型进行向量化，向量化可以但不限于分为三个模块input-ids(输入数据中词语id(identification，标识)组成的张量)、segment-ids(输入数据中的句子id(标识)组成的张量)、input-mask(输入数据掩码)。对三个向量化的结果做融合得到Embedding(词向量)的输出；

步骤S606：BiLSTM模型预测每个词向量对应的实体标签和每个实体标签对应的实体标签概率，可以但不限于将Roberta预训练模型输出的多个词向量作为BiLSTM模型的输入，该输入获取的n维字向量作为BiLSTM神经网络各个时间步的输入，得到BiLSTM层的隐状态序列。BiLSTM模型学习参数的更新可以但不限于使用BPTT(Back-Propagation Through Time，时序反向传播)算法，该模型在forward(前向)和backward(后向)阶段与一般模型不同之处在于隐藏层对于所有的time step(步长)都要展开计算；

步骤S607：Softmax层对每个实体标签对应的实体标签概率进行归一化处理，可以但不限于将BiLSTM输出的多个词向量，每个词向量对应的实体标签和每个实体标签对应的实体标签概率输入logit(逻辑)层，其中，logit层是Softmax层的输入，Softmax层输出多个词向量，每个词向量对应的实体标签和每个实体标签对应的归一化的实体标签概率；

步骤S608：CRF层输出每个词向量对应的预测实体标签，可以但不限于将Softmax层输出的多个词向量，每个词向量对应的实体标签和每个实体标签对应的归一化的实体标签概率输入CRF层，CRF层可以向最终的预测实体标签添加一些约束，以确保预测实体标签为有效的，这些约束在该CRF层训练过程中由训练数据集自动学习得到。CRF则将LSTM在每个t时刻在第i个tag(分类)上的输出作为特征函数中的点函数，使原本的CRF中引入了非线性。整体模型还是以CRF为主体的大框架，使LSTM中的信息得到充分的再利用，最终能够得到全局最优的输出序列；

步骤S609：计算预测实体标签与真实实体标签之间的损失度，经过与训练数据的真实标签进行loss(损失度)的计算，再循环进行每个epoch(时期)的迭代，通过BPTT算法不断更新神经网络节点的参数，使loss逐渐下降最终达到模型收敛状态，且模型经过优化后能保证loss较小，经过训练完成的模型具有较高的新数据的准确率；

步骤S610：在损失度小于或者等于损失度阈值的情况下，模型部署完成，在进行语句意图解析的整个流程中，将新数据传入到该模型中，即可得到预测标签，结合专家规则，完成意图的精确识别。

图7是根据本公开实施例的可选的识别目标语句所具有的语言成分的模型架构图，上述步骤S601～步骤S610可以但不限于用于如图7所示的模型架构中，可以但不限于通过构建智慧家电场景命名实体标注规则和命名实体识别神经网络模型，结合语句文本所具有的语言成分来完成高准确率的意图识别；可以但不限于使用Roberta预训练模型完成输入字词的Embedding(词向量)，使得字词向量化变得简单高效，且向量化包含的信息和含义更加丰富，提升了向量化的准确性；同时利用CRF模型的状态转移矩阵，使得标签预测有效性大大提升。此外，该模型结构提升了训练的速度和预测准确性，在意图识别领域提供了一种新的处理方式。

用户可以但不限于与智能音箱或者其它的智能设备(比如：智能洗衣机，智能冰箱，或者智能台灯等等)进行语音交互，图8是根据本公开实施例的用户与智能音箱语音交互的场景示意图，如图8所示，用户可以但不限于在智能音箱播放歌曲的过程中，表达出“播放下一首”的语音指令，识别出的“播放下一首”对应的实体标签可以但不限于包括设备标签(对应着智能音箱)和模式标签(对应着下一首)，可以但不限于根据设备标签(对应着智能音箱)和模式标签(对应着下一首)，识别“播放下一首”对智能音箱的执行的控制操作的意图为控制智能音箱播放当前待播放歌曲列表中的下一首歌曲，那么可以但不限于响应用户的语音指令，控制智能音箱播放当前待播放歌曲列表中的下一首歌曲。

图9是根据本公开实施例的用户与智能电视语音交互的场景示意图，如图9所示，智能电视可以但不限于为正在播放体育新闻，如果获取到用户表达出“屏幕太亮了”的语音指令，识别出的“屏幕太亮了”对应的实体标签可以但不限于包括设备标签(对应着智能电视屏幕)和模式标签(对应着亮)，可以但不限于根据设备标签(对应着智能电视屏幕)和模式标签(对应着亮)，识别“屏幕太亮了”对智能电视执行的控制操作的意图为调低智能电视屏幕的显示亮度，那么可以但不限于响应用户的语音指令，将智能电视屏幕的显示亮度调低5％(或者10％，15％等等)。

需要说明的是，在本实施例中，对智能音箱和智能电视的形状不做限定，在图8中仅以外形为圆柱形的智能音箱进行举例说明，在图9中仅以外形为矩形状的智能电视进行举例说明，智能音箱和智能电视的形状可以是任何符合生产工艺和用户需求的形状，本公开对此不做限定。

通过以上的实施方式的描述，本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现，当然也可以通过硬件，但很多情况下前者是更佳的实施方式。基于这样的理解，本公开的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中，包括若干指令用以使得一台终端设备(可以是手机，计算机，服务器，或者网络设备等)执行本公开各个实施例的方法。

图10是根据本公开实施例的一种语句文本的意图识别装置的结构框图；如图10所示，包括：

获取模块102，设置为获取智能设备采集到的语句文本作为待识别的目标语句文本；

第一识别模块104，设置为对所述目标语句文本进行实体识别，得到目标实体标签，其中，所述目标实体标签用于表征所述目标语句文本对应的目标控制操作的目标操作信息，所述目标控制操作为所述目标语句文本指示对所述智能设备执行的控制操作；

第二识别模块106，设置为根据所述目标实体标签，识别所述目标语句文本对应的目标意图特征，其中，所述目标意图特征用于指示所述目标语句文本对所述智能设备的操作意图。

通过上述实施例，如果获取到待识别的目标语句文本，识别目标语句文本指示对智能设备执行的控制操作的目标操作信息作为目标实体标签，根据目标实体标签识别目标语句文本对智能设备的操作意图，通过与对智能设备的操作意图的相关性较高的目标实体标签，提升了识别目标语句文本对智能设备的操作意图的准确性。采用上述技术方案，解决了相关技术中，识别语句文本所表达意图的准确率较低等问题，实现了提升识别语句文本所表达意图的准确率的技术效果。

在一个示例性实施例中，所述第一识别模块，包括：

第一输入单元，设置为将所述目标语句文本输入目标实体识别模型，其中，所述目标实体识别模型是使用标注了实体标签的文本样本对初始实体识别模型进行训练得到的，所述实体标签包括：操作时间、操作位置、操作资源属性、操作设备、操作模式；

第一获取单元，设置为获取所述目标实体识别模型输出的所述目标实体标签。

在一个示例性实施例中，所述装置还包括：

第一输入模块，设置为在所述将所述目标语句文本输入目标实体识别模型之前，将所述文本样本输入所述初始实体识别模型，得到所述初始实体识别模型输出的初始实体标签；

第二输入模块，设置为将所述初始实体标签与所述文本样本所标注的实体标签输入预设的损失函数，得到损失值；

调整模块，设置为根据所述损失值对所述初始实体识别模型的模型参数进行调整，直至满足训练截止条件，得到所述目标实体识别模型。

在一个示例性实施例中，其特征在于，

所述第一输入模块，设置为：将所述文本样本输入初始标签预测层；将所述初始标签预测层输出的初始预测标签输入初始条件约束层，得到所述初始条件约束层输出的所述初始实体标签；其中，所述初始实体识别模型包括所述初始标签预测层和所述初始条件约束层，所述初始实体识别模型用于预测输入参数对应的预测标签和每个预测标签对应的预测概率，所述初始条件约束层用于对所述初始实体识别模型预测出的预测标签和每个预测标签对应的预测概率添加约束条件得到满足所述约束条件的实体标签；

所述调整模块，设置为：根据所述损失值对所述初始标签预测层的预测参数和所述初始条件约束层的所述约束条件进行调整，其中，所述初始实体识别模型的模型参数包括所述预测参数和所述约束条件。

在一个示例性实施例中，所述第一输入模块，包括：

向量化单元，设置为将所述文本样本进行向量化处理，得到所述文本样本对应的文本向量；

第二输入单元，设置为将所述文本向量输入所述初始实体识别模型。

在一个示例性实施例中，特征在于，所述第二识别模块，包括：

识别单元，设置为通过目标意图识别模型对所述目标实体标签进行识别，其中，所述目标意图识别模型是使用标注了意图特征的实体标签样本对初始意图识别模型进行训练得到的；

第二获取单元，设置为获取所述目标意图识别模型输出的意图识别结果作为所述目标意图特征。

在一个示例性实施例中，所述识别单元，设置为：

本公开的实施例还提供了一种存储介质，该存储介质包括存储的程序，其中，上述程序运行时执行上述任一项的方法。

可选地，在本实施例中，上述存储介质可以被设置为存储用于执行以下步骤的程序代码：

S1，获取智能设备采集到的语句文本作为待识别的目标语句文本；

S2，对所述目标语句文本进行实体识别，得到目标实体标签，其中，所述目标实体标签用于表征所述目标语句文本对应的目标控制操作的目标操作信息，所述目标控制操作为所述目标语句文本指示对所述智能设备执行的控制操作；

S3，根据所述目标实体标签，识别所述目标语句文本对应的目标意图特征，其中，所述目标意图特征用于指示所述目标语句文本对所述智能设备的操作意图。

本公开的实施例还提供了一种电子装置，包括存储器和处理器，该存储器中存储有计算机程序，该处理器被设置为运行计算机程序以执行上述任一项方法实施例中的步骤。

可选地，上述电子装置还可以包括传输设备以及输入输出设备，其中，该传输设备和上述处理器连接，该输入输出设备和上述处理器连接。

可选地，在本实施例中，上述处理器可以被设置为通过计算机程序执行以下步骤：

可选地，在本实施例中，上述存储介质可以包括但不限于：U盘、只读存储器(Read-Only Memory，简称为ROM)、随机存取存储器(Random Access Memory，简称为RAM)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。

可选地，本实施例中的具体示例可以参考上述实施例及可选实施方式中所描述的示例，本实施例在此不再赘述。

显然，本领域的技术人员应该明白，上述的本公开的各模块或各步骤可以用通用的计算装置来实现，它们可以集中在单个的计算装置上，或者分布在多个计算装置所组成的网络上，可选地，它们可以用计算装置可执行的程序代码来实现，从而，可以将它们存储在存储装置中由计算装置来执行，并且在某些情况下，可以以不同于此处的顺序执行所示出或描述的步骤，或者将它们分别制作成各个集成电路模块，或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样，本公开不限制于任何特定的硬件和软件结合。

以上所述仅是本公开的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本公开原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本公开的保护范围。

Claims

一种语句文本的意图识别方法，包括：

获取智能设备采集到的语句文本作为待识别的目标语句文本；

对所述目标语句文本进行实体识别，得到目标实体标签，其中，所述目标实体标签用于表征所述目标语句文本对应的目标控制操作的目标操作信息，所述目标控制操作为所述目标语句文本指示对所述智能设备执行的控制操作；

根据所述目标实体标签，识别所述目标语句文本对应的目标意图特征，其中，所述目标意图特征用于指示所述目标语句文本对所述智能设备的操作意图。
根据权利要求1所述的方法，其中，所述对所述目标语句文本进行实体识别，得到目标实体标签，包括：

将所述目标语句文本输入目标实体识别模型，其中，所述目标实体识别模型是使用标注了实体标签的文本样本对初始实体识别模型进行训练得到的，所述实体标签包括：操作时间、操作位置、操作资源属性、操作设备、操作模式；获取所述目标实体识别模型输出的所述目标实体标签。
根据权利要求2所述的方法，其中，在所述将所述目标语句文本输入目标实体识别模型之前，所述方法还包括：

将所述文本样本输入所述初始实体识别模型，得到所述初始实体识别模型输出的初始实体标签；

将所述初始实体标签与所述文本样本所标注的实体标签输入预设的损失函数，得到损失值；

根据所述损失值对所述初始实体识别模型的模型参数进行调整，直至满足训练截止条件，得到所述目标实体识别模型。
根据权利要求3所述的方法，其中，

所述将所述文本样本输入所述初始实体识别模型，得到所述初始实体识别模型输出的初始实体标签包括：将所述文本样本输入初始标签预测层；将所述初始标签预测层输出的初始预测标签输入初始条件约束层，得到所述初始条件约束层输出的所述初始实体标签；其中，所述初始实体识别模型包括所述初始标签预测层和所述初始条件约束层，所述初始实体识别模型用于预测输入参数对应的预测标签和每个预测标签对应的预测概率，所述初始条件约束层用于对所述初始实体识别模型预测出的预测标签和每个预测标签对应的预测概率添加约束条件得到满足所述约束条件的实体标签；

所述根据所述损失值对所述初始实体识别模型的模型参数进行调整包括：根据所述损失值对所述初始标签预测层的预测参数和所述初始条件约束层的所述约束条件进行调整，其中，所述初始实体识别模型的模型参数包括所述预测参数和所述约束条件。
根据权利要求3所述的方法，其中，所述将所述文本样本输入所述初始实体识别模型，包括：

将所述文本样本进行向量化处理，得到所述文本样本对应的文本向量；

将所述文本向量输入所述初始实体识别模型。
根据权利要求1-5任一项所述的方法，其中，所述根据所述目标实体标签，识别所述目标语句文本对应的目标意图特征，包括：

通过目标意图识别模型对所述目标实体标签进行识别，其中，所述目标意图识别模型是使用标注了意图特征的实体标签样本对初始意图识别模型进行训练得到的；

获取所述目标意图识别模型输出的意图识别结果作为所述目标意图特征。
根据权利要求6所述的方法，其中，所述通过目标意图识别模型对所述目标实体标签进行识别，包括：

对所述目标语句文本进行语言成分解析，得到目标成分特征；

将所述目标成分特征和所述目标实体标签输入所述目标意图识别模型，得到所述目标意图识别模型输出的所述意图识别结果。
一种语句文本的意图识别装置，包括：

获取模块，设置为获取智能设备采集到的语句文本作为待识别的目标语句文本；

第一识别模块，设置为对所述目标语句文本进行实体识别，得到目标实体标签，其中，所述目标实体标签用于表征所述目标语句文本对应的目标控制操作的目标操作信息，所述目标控制操作为所述目标语句文本指示对所述智能设备执行的控制操作；

第二识别模块，设置为根据所述目标实体标签，识别所述目标语句文本对应的目标意图特征，其中，所述目标意图特征用于指示所述目标语句文本对所述智能设备的操作意图。
根据权利要求8所述的装置，其中，所述第一识别模块，包括：

第一输入单元，设置为将所述目标语句文本输入目标实体识别模型，其中，所述目标实体识别模型是使用标注了实体标签的文本样本对初始实体识别模型进行训练得到的，所述实体标签包括：操作时间、操作位置、操作资源属性、操作设备、操作模式；

第一获取单元，设置为获取所述目标实体识别模型输出的所述目标实体标签。
根据权利要求9所述的装置，其中，所述装置还包括：

第一输入模块，设置为在所述将所述目标语句文本输入目标实体识别模型之前，将所述文本样本输入所述初始实体识别模型，得到所述初始实体识别模型输出的初始实体标签；

第二输入模块，设置为将所述初始实体标签与所述文本样本所标注的实体标签输入预设的损失函数，得到损失值；

调整模块，设置为根据所述损失值对所述初始实体识别模型的模型参数进行调整，直至满足训练截止条件，得到所述目标实体识别模型。
根据权利要求10所述的装置，其中，

所述第一输入模块，设置为：将所述文本样本输入初始标签预测层；将所述初始标签预测层输出的初始预测标签输入初始条件约束层，得到所述初始条件约束层输出的所述初始实体标签；其中，所述初始实体识别模型包括所述初始标签预测层和所述初始条件约束层，所述初始实体识别模型用于预测输入参数对应的预测标签和每个预测标签对应的预测概率，所述初始条件约束层用于对所述初始实体识别模型预测出的预测标签和每个预测标签对应的预测概率添加约束条件得到满足所述约束条件的实体标签；

所述调整模块，设置为：根据所述损失值对所述初始标签预测层的预测参数和所述初始条件约束层的所述约束条件进行调整，其中，所述初始实体识别模型的模型参数包括所述预测参数和所述约束条件。
根据权利要求10所述的装置，其中，所述第一输入模块，包括：

向量化单元，设置为将所述文本样本进行向量化处理，得到所述文本样本对应的文本向量；

第二输入单元，设置为将所述文本向量输入所述初始实体识别模型。
根据权利要求8-12任一项所述的装置，其中，所述第二识别模块，包括：

识别单元，设置为通过目标意图识别模型对所述目标实体标签进行识别，其中，所述目标意图识别模型是使用标注了意图特征的实体标签样本对初始意图识别模型进行训练得到的；

第二获取单元，设置为获取所述目标意图识别模型输出的意图识别结果作为所述目标意图特征。
根据权利要求13所述的装置，其中，所述识别单元，设置为：

对所述目标语句文本进行语言成分解析，得到目标成分特征；

将所述目标成分特征和所述目标实体标签输入所述目标意图识别模型，得到所述目标意图识别模型输出的所述意图识别结果。
一种计算机可读的存储介质，所述计算机可读的存储介质包括存储的程序，其中，所述程序运行时执行权利要求1至7中任一项所述的方法。
一种电子装置，包括存储器和处理器，所述存储器中存储有计算机程序，所述处理器被设置为通过所述计算机程序执行权利要求1至7中任一项所述的方法。