CN111046153B

CN111046153B - 一种语音助手定制方法、语音助手定制装置及智能设备

Info

Publication number: CN111046153B
Application number: CN201911111345.3A
Authority: CN
Inventors: 黄日星; 熊友军
Original assignee: Shenzhen Ubtech Technology Co ltd
Current assignee: Shenzhen Ubtech Technology Co ltd
Priority date: 2019-11-14
Filing date: 2019-11-14
Publication date: 2023-12-29
Anticipated expiration: 2039-11-14
Also published as: CN111046153A

Abstract

本申请公开了一种语音助手定制方法、语音助手定制装置、智能设备及计算机可读存储介质，其中，该方法应用于具备语音助手的智能设备，包括：读取输入的训练模板语料及训练词典，其中，每一训练词典中包含有一个以上实体词语；根据训练模板语料的语料数量确定意图识别算法；基于确定的意图识别算法及训练模板语料，对语音助手进行意图识别训练；根据各个训练词典的属性，分别确定每一训练词典所对应的实体词语识别算法；基于各个训练词典及各个训练词典所对应的实体词语识别算法，对语音助手进行实体词语识别训练；在意图识别训练及实体词语识别训练结束后，得到定制化语音助手。本方案可实现语音助手的高度定制化，能够满足不同用户的个性化需求。

Description

一种语音助手定制方法、语音助手定制装置及智能设备

技术领域

本申请属于人工智能技术领域，尤其涉及一种语音助手定制方法、语音助手定制装置、智能设备及计算机可读存储介质。

背景技术

随着当前人工智能的不断发展，用户已经可以通过智能设备所搭载的语音助手实现多项操作。已有部分厂家推出了语音助手技能平台，可实现用户对语音助手的定制化。然而，考虑到不同用户的个性化需求差异较大，现有的采用单一算法的语音助手技能平台无法兼顾到所有用户的多方面个性化需求，导致用户难以实现对语音助手的高度定制。

发明内容

有鉴于此，本申请提供了一种语音助手定制方法、语音助手定制装置、智能设备及计算机可读存储介质，可实现用户对语音助手的高度定制。

本申请的第一方面提供了一种语音助手定制方法，上述语音助手定制方法应用于具备语音助手的智能设备，上述语音定制方法包括：

读取输入的训练模板语料及训练词典，其中，每一训练词典中包含有一个以上实体词语；

根据上述训练模板语料的语料数量确定意图识别算法；

基于确定的意图识别算法及上述训练模板语料，对上述语音助手进行意图识别训练；

根据各个训练词典的属性，分别确定每一训练词典所对应的实体词语识别算法；

基于各个训练词典及各个训练词典所对应的实体词语识别算法，对上述语音助手进行实体词语识别训练；

在上述意图识别训练及上述实体词语识别训练结束后，得到基于上述训练模板语料及上述训练词典的定制化语音助手。

本申请的第二方面提供了一种语音助手定制装置，上述语音助手定制装置应用于具备语音助手的智能设备，包括：

输入数据读取单元，用于读取输入的训练模板语料及训练词典，其中，每一训练词典中包含有一个以上实体词语；

意图识别算法确定单元，用于根据所述训练模板语料的语料数量确定意图识别算法；

意图识别训练单元，用于基于确定的意图识别算法及所述训练模板语料，对所述语音助手进行意图识别训练；

实体词语识别算法确定单元，用于根据各个训练词典的属性，分别确定每一训练词典所对应的实体词语识别算法；

实体词语识别训练单元，用于基于各个训练词典及各个训练词典所对应的实体词语识别算法，对所述语音助手进行实体词语识别训练；

定制化语音助手获取单元，用于在所述意图识别训练及所述实体词语识别训练结束后，得到基于所述训练模板语料及所述训练词典的定制化语音助手。

本申请的第三方面提供了一种智能设备，上述智能设备包括存储器、处理器以及存储在上述存储器中并可在上述处理器上运行的计算机程序，上述处理器执行上述计算机程序时实现如上述第一方面的方法的步骤。

本申请的第四方面提供了一种计算机可读存储介质，上述计算机可读存储介质存储有计算机程序，上述计算机程序被处理器执行时实现如上述第一方面的方法的步骤。

本申请的第五方面提供了一种计算机程序产品，上述计算机程序产品包括计算机程序，上述计算机程序被一个或多个处理器执行时实现如上述第一方面的方法的步骤。

由上可见，在本申请方案中，该语音助手定制方法应用于具备语音助手的智能设备，在定制语音助手时，首先读取输入的训练模板语料及训练词典，其中，每一训练词典中包含有一个以上实体词语，然后根据上述训练模板语料的语料数量确定意图识别算法，基于确定的意图识别算法及上述训练模板语料，对上述语音助手进行意图识别训练；同时，还根据各个训练词典的属性，分别确定每一训练词典所对应的实体词语识别算法，基于各个训练词典及各个训练词典所对应的实体词语识别算法，对上述语音助手进行实体词语识别训练，在上述意图识别训练及上述实体词语识别训练结束后，得到基于上述训练模板语料及上述训练词典的定制化语音助手。通过本申请方案，语音助手预先集成了多种算法，并在定制时基于用户输入的训练数据的不同类型选择对应的算法对语音助手进行训练，可实现语音助手的高度定制化，能够满足不同用户的个性化需求。

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图仅仅是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动性的前提下，还可以根据这些附图获得其他的附图。

图1是本申请实施例提供的语音助手定制方法的实现流程示意图；

图2是本申请实施例提供的语音助手定制方法中，步骤102的具体实现流程示意图；

图3是本申请实施例提供的语音助手定制方法中，步骤104的具体实现流程示意图；

图4是本申请实施例提供的语音助手定制装置的结构框图；

图5是本申请实施例提供的智能设备的示意图。

具体实施方式

以下描述中，为了说明而不是为了限定，提出了诸如特定系统结构、技术之类的具体细节，以便透彻理解本申请实施例。然而，本领域的技术人员应当清楚，在没有这些具体细节的其它实施例中也可以实现本申请。在其它情况中，省略对众所周知的系统、装置、电路以及方法的详细说明，以免不必要的细节妨碍本申请的描述。

本申请实施例的一种语音助手定制方法及语音助手定制装置可应用于机器人、智能手机、平板电脑等具备语音助手功能的智能设备中，为了说明本申请上述的技术方案，下面通过具体实施例来进行说明。

实施例一

下面对本申请实施例提供的一种语音助手定制方法进行描述，请参阅图1，本申请实施例中的语音助手定制方法包括：

步骤101，读取输入的训练模板语料及训练词典；

在本申请实施例中，用户可以根据自身的需求，对语音助手进行定制。可选地，可以是在接收到用户输入的定制指令后，启动定制流程，该定制流出要求用户向智能终端输入训练模板语料及训练词典。其中，每一训练词典中包含有一个以上实体词语，实体词语指的是指代实际生活中的实物的词语，例如人名，地名，机构名等；需要注意的是，在本申请实施例中，时间也是一种实体词语。每一训练模板语料均已知意图，其中，训练模板语料指的是将一个语料中的实体词语进行了替换后所得到的语料。例如，一个语料为“去北京的航班”，“北京”为一城市名，显然属于实体词语，因而，可以以概括性词语“city”来替代实体词语“北京”，替换后所得到的语料“去city的航班”即可作为训练模板语料。其中，考虑到每一实体词语均有其所属词典，因而，可以通过语料中的实体词语的所属词典的词典名称来实现对语料中的实体词语的替换。也即，针对任一训练模板语料来说，已知该训练模板语料的意图，且该训练模板语料中的实体词语已被替换。上述训练模板语料的语料数量为一条以上，且上述训练词典的数量为一个以上，此处不对上述训练模板语料及上述训练词典的数量作出限定。在读取完上述训练模板语料及上述训练词典后，即可开始对上述语音助手进行训练，具体地，上述训练模板语料用于对上述语音助手进行意图识别训练，上述训练词典用于对语音助手进行实体词语识别训练；上述意图识别训练及实体词语识别训练可以同步进行，也可以前后进行，此处不作限定。

步骤102，根据上述训练模板语料的语料数量确定意图识别算法；

在本申请实施例中，在读取了上述训练模板语料后，可以进一步获取上述训练模板语料的语料数量，并根据该语料数量来确定本次定制过程所需要采用的意图识别算法。具体地，在上述智能设备中，可预先设置有两种不同形式的意图识别算法，分别为深度学习算法及模板算法，因而，需要在这两种不同形式的意图识别算法中，确定一种作为本次定制所采用的意图识别算法。具体地，请参阅图2，上述步骤102包括：

步骤1021，检测上述训练模板语料的语料数量是否大于预设的语料数量阈值；

其中，智能设备可预先设定一语料数量阈值，例如，预先将语料数量阈值设定为1000；则在读取完用户本次定制所输入的训练模板语料后，将训练模板语料的语料数量与该语料数量阈值进行比对，并基于比对结果确定所需要采用的意图识别算法。

步骤1022、若上述语料数量大于上述语料数量阈值，则将预设的深度学习算法确定为上述意图识别算法；

其中，当上述语料数量大于上述语料数量阈值时，认为本次定制用户所输入的语料较多，基于此，为了更好的基于较多的训练模板语料对语音助手进行训练，此处可以将预设的深度学习算法确定为本次定制所采用的意图识别算法。具体地，上述深度学习算法可以是卷积神经网络（Convolutional Neural Networks，CNN）、循环神经网络（RecurrentNeural Network，RNN）或反馈式神经网络（Hopfield Neural Networks，HNN）等，此处不作限定。

步骤1023、若上述语料数量不大于上述语料数量阈值，则将预设的模板算法确定为上述意图识别算法。

其中，当上述语料数量不大于上述语料数量阈值时，认为本次定制用户所输入的语料较少，基于此，不需要采用深度学习算法这种较为复杂的方式对语音助手进行训练，此处可以将预设的模板算法确定为本次定制所采用的意图识别算法。具体地，上述模板算法可以是词频-逆向文件频率（term frequency–inverse document frequency，TF-IDF）算法、编辑距离算法或模板匹配算法等，此处不作限定。

步骤103，基于确定的意图识别算法及上述训练模板语料，对上述语音助手进行意图识别训练；

在本申请实施例中，当确定了本次定制所采用的意图识别算法后，可以基于所确定的意图识别算法及上述训练模板语料，启动对上述语音助手的意图识别训练，以提高对用户后续所输入的句子的意图识别的准确度。

步骤104，根据各个训练词典的属性，分别确定每一训练词典所对应的实体词语识别算法；

在本申请实施例中，各个训练词典均有其固有属性，基于此，可以根据各个训练词典的固有属性来分别确定每一训练词典所对应的实体词语识别算法。具体地，请参阅图3，上述步骤104包括：

步骤1041，获取目标训练词典的输入形式；

其中，由于本申请实施例中针对每一训练词典均采用同样的流程确定其所对应的实体词语识别算法，因而，以目标训练词典为例，对如何确定该目标训练词典所对应的实体词语识别算法作出说明，其中，上述目标训练词典为输入的任一训练词典。在本申请实施例中，为了提升实体词语的丰富程度，有两种输入目标训练词典的方式。其中，第一种方式为：语音助手已经收录有多个训练词典，基于用户的勾选指令而输入相对应的目标训练词典。第二种方式为：用户自定义若干个词典，基于用户的导入指令而输入相对应的目标训练词典。

步骤1042，根据上述目标训练词典的输入形式，确定上述目标训练词典的一级类别，其中，一级类别包括系统词典及自定义词典；

在本申请实施例中，以目标训练词典的输入形式作为该目标训练词典的一级类别。具体地，一种情况下，当上述目标训练词典基于用户的勾选指令而输入时，可以确定上述目标训练词典为系统词典，例如，歌曲有上千万首，对于大部分用户来说，人工收集歌曲的名称是件困难的事情。因此对于一些通用的词典，如歌曲、歌手、电影、星座、属相、城市、国家等，语音助手已经帮用户收集完毕，用户只需要勾选即可；另一种情况下，当上述目标训练词典基于用户的导入指令而输入时，可以确定上述目标训练词典为自定义词典，例如，用户可以根据自身的需要，主动创建并设置一词典，如某医院的医生名称等，并将设置好的词典导入至语音助手中。

步骤1043，若上述目标训练词典为系统词典，则根据上述语音助手所预设的类别规则，确定上述目标训练词典在上述系统词典下的二级类别；

在本申请实施例中，语音助手在系统词典这一一级类别下，还设置有若干种不同的二级类别。仅作为示例，上述系统词典下所包括的二级类别包括有：数字类、封闭类及开放类。当然，研发人员也可以以其它方式设定类别规则，此处不作限定。为了方便理解，此处对系统词典下所包含的各个二级类别作出解释及说明：

数字类，指的是由数字所构成的实体词语，例如时间，交易金额，身份证，邮政编码及其单位等。

封闭类，指的是可以穷举的无歧义的实体词语。例如星座，一般情况下巨蟹座与巨蟹为两个均指示同一星座，因而，可以认为该词典下最多只有24个实体词语；又例如人名或城市，虽然数量较多，但无歧义，如黄小明显然为一人名，又如深圳显然为一城市的名称。

开放类，指的是数量较多，且单单从该词语本身无法区分是实体词语还是普通词语的实体词语，例如歌名或者专辑名，“如果”既可能是一首歌的歌名，又可能是一个普通词语。

在本申请实施例中，语音助手的研发人员在设置这些系统词典时，往往已经设定好了各个系统词典所属的二级类别。例如，语音助手中已经收录了星座、属相、城市、歌曲及专辑这五个系统词典，则研发人员可以根据上述数字类、封闭类和开放类的类别规则，预先设定好各个系统词典所属的二级类别，则星座属于封闭类，属相属于封闭类，城市属于封闭类，歌曲属于开放类，专辑属于开放类；也即，对于系统词典来说，其二级类别也属于其属性之一。语音助手可以在输入的训练词典为系统词典时，第一时间获知其所属二级类别。

步骤1044，若上述目标训练词典为自定义词典，则根据上述目标训练词典所包含的实体词语的词语数量，确定上述目标训练词典在上述自定义词典下的二级类别；

在本申请实施例中，语音助手在自定义词典这一一级类别下，也设置有若干种不同的二级类别。具体地，在上述自定义词典下，由于很难确定这些自定义词典中所包含的实体词语是否存在歧义，因此难以将其如系统词典那样归类为封闭类或开发类。因此，对于自定义词典来说，仅根据该目标训练词典所包含的实体词语的词语数量对其进行归类，例如，可将自定义词典的二级类别划分为大数量类及小数量类。具体地，可以通过如下方式确定上述目标训练词典在上述自定义词典下的二级类别：

A1、若上述目标训练词典为自定义词典，则获取上述目标训练词典所包含的实体词语的词语数量；

A2、检测上述词语数量是否大于预设的词语数量阈值；

A3、根据上述词语数量与上述词语数量阈值的比对结果，确定上述目标训练词典在上述自定义词典下的二级类别。

其中，当上述词语数量大于上述词语数量阈值时，可确定目标训练词典在上述自定义词典下的二级类别为大数量类；当上述词语数量不大于上述词语数量阈值时，可确定目标训练词典在上述自定义词典下的二级类别为小数量类。

步骤1045，基于上述目标训练词典的一级类别及二级类别，确定对应的实体词语识别算法。

在本申请实施例中，语音助手可预先针对实体词语识别这一方向设定多种不同的实体词语识别算法。具体地，可以设定有数字动态实体识别算法、词典树（trieTree）算法或深度学习算法，则上述步骤1045包括：

B1、若上述目标训练词典属于系统词典的数字类，则将数字动态实体识别算法确定为对应的实体词语识别算法。

其中，针对数字类来说，可使用对应的规则或正则匹配对目标训练词典进行识别。具体地，每一种不同的数字类的实体都有对应的识别方法，因而，将数字类所对应的算法称之为数字动态实体识别算法。例如，身份证号码，手机号码及日期，其均属于数字类，且其分别有不同的识别方法。具体地，以身份证号码识别为例：前五位数代表地区，有一个限定的范围；随后八位数是出生日期，该日期数字也有限定范围，所以该八位数要符合日期规则，例如，不可能出现19901332的数字；最后一位数是验证位，根据身份证前面的所有数字检测该位数字是否符合预设的身份证验证规则。又以在中国所使用的手机号码识别为例：共有十一位数字，并且前两位数是限定的，例如13、15、17、18或19等。为了更加准确的判断一串数字是否为手机号码，除了判断该十一位数字，还可以再看句子中是否出现“号码”、“电话”、“拨打”或“手机”等关键字。举个例子：“交易金额为137xxxxxxxx”，虽然这一串数字符合11位并且前两位限定，但是句子中没有关键字，因而可以判定这不是电话号码。再以日期识别，其采用的日期正则表达式可以为 “\d（年|year）\d（月|month）\d（日|day）”。因而当目标训练词典属于系统词典的数字类，将数字动态实体识别算法确定为对应的实体词语识别算法，其中，上述数字动态实体识别算法实际包含了所有数字类的实体词典的识别算法，只需在数字动态实体识别算法中，确定与上述目标训练词典相匹配的识别算法即可，也即，根据数字动态实体识别算法查询到与各个数字类的训练词典相匹配的识别算法。

B2、若上述目标训练词典属于系统词典的封闭类，或上述目标训练词典属于自定义词典的小数量类，则将词典树算法确定为对应的实体词语识别算法。

其中，词典树算法的优势主要在匹配速度上，在构建好词典树后，其匹配速度往往远快于暴力匹配的匹配速度。由于封闭类的系统词典及小数量类的自定义词典所包含的实体词语的数量通常是有限的，因而，可为其构建相对应的词典树，并将词典树算法确定为对应的实体词语识别算法。

B3、若上述目标训练词典属于系统词典的开放类，或上述目标训练词典属于自定义词典的大数量类，则将深度学习算法确定为对应的实体词语识别算法。

其中，由于开放类的系统词典及大数量类的自定义词典中所包含的实体词语较多，此时可以将深度学习算法确定为对应的实体词语识别算法。具体地，上述深度学习算法可以是长短期记忆网络（Long Short-Term Memory，LSTM）算法或双向长短期记忆网络条件随机场（Bi-directionalLong Short-Term Memory Network Conditional Random Field，Bi-LSTM-CRF）算法，此处不作限定。需要注意的是，在采用深度学习算法作为实体词语识别算法时，需要基于上述目标训练词典中所包含的各个实体词语依次构建得到若干个完整句子作为深度学习算法的训练样本。

步骤105，基于各个训练词典及各个训练词典所对应的实体词语识别算法，对上述语音助手进行实体词语识别训练；

在本申请实施例中，每一训练词典都可基于上述步骤104找到与其所对应的实体词语识别算法，在此基础上即可实现对上述语音助手进行实体词语识别训练，以提高对用户后续所输入的句子的实体识别的准确度。

步骤106，在上述意图识别训练及上述实体词语识别训练结束后，得到基于上述训练模板语料及上述训练词典的定制化语音助手。

在本申请实施例中，当上述意图识别训练及上述实体词语识别训练均结束后，所得到的语音助手即为定制化语音助手。用户可以基于该定制化语音助手进行后续操作。

可选地，在上述定制化语音助手的应用阶段，上述定制化语音助手的工作流程如下：

C1、接收输入句子；

其中，上述输入句子即为用户与智能设备正常交互时所输入的句子。

C2、基于上述定制化语音助手对上述输入句子进行实体词语识别，以得到上述输入句子所包含的一个以上实体词语及各个实体词语所属的词典；

其中，由于定制化语音助手已完成实体词语识别训练，因而，其可以自动化选择相对应的实体词语识别算法对实体词语进行识别。

C3、在上述输入句子中，将已识别的各个实体词语替换为各个实体词语所属的词典的词典名称，得到替换句子；

其中，在识别得到各个实体词语后，对输入句子的已识别的各个实体词语进行替换，得到替换句子，上述替换句子的形式与上述训练模板语料的形式相同。

C4、基于上述定制化语音助手对上述替换句子进行意图识别，以得到上述输入句子的意图。

其中，采用在定制阶段所确定的用于训练的意图识别算法进行意图识别操作，例如，若定制化语音助手在定制阶段所接收到的训练模板语料的语料数量较少，导致其定制时采用的是模板算法作为意图识别算法，则此处仍采用上述模板算法作为意图识别算法对替换句子进行意图识别；相应地，若定制化语音助手在定制阶段所接收到的训练模板语料的语料数量较多，导致其定制时采用的是深度学习算法作为意图识别算法，则此处仍采用上述深度学习算法作为意图识别算法对替换句子进行意图识别。由于替换句子与输入句子的意图一致，因而，所得到的替换句子的意图即为上述输入句子的意图。进一步地，在得到上述输入句子的意图后，可以将上述输入句子所包含的一个以上实体词语以及上述输入句子的意图传输至预设的业务模块，以触发上述智能终端基于上述输入句子输出相应反馈。

此处以具体的例子对本申请实施例作出说明：

在语音助手的定制阶段，假定用户输入了大量的训练模板语料，则选择深度学习算法作为意图识别算法，进行意图识别训练；再假定用户输入的训练词典中，导入了自定义词典，分别为医生名称词典及药品名称词典，并勾选了系统词典中的地点词典及时间词典。针对医生名称词典，其属于自定义词典，且该医生名称词典中所包包含的医生名称的数量小于预设的词语数量阈值，可确定医生名称词典为小数量类。类似地，可确定药品名称词典为大数量类。针对系统词典中，可直接确定地点词典为封闭类，时间词典为数字类。基于此，可确定医生名称为自定义词典的小数量类，使用trieTree算法；时间为系统词典的数字类，使用数字动态实体识别算法；药品名称为自定义实体的大数量类，使用深度学习算法；地点属于系统词典的封闭类，使用trieTree算法。基于上述各个训练词典及对应的实体词语识别算法，进行实体词语识别训练。

在语音助手的应用阶段，假定接收到的用户的输入句子为“能预约10月3号在深圳分院的黄小明吗”，则首先对其进行实体词语识别。具体地，采用数字动态实体识别算法识别出的实体词语为｛时间time：10月3号｝，使用trieTree算法识别出的实体词语为｛地点location：深圳｝｛医生名称doctor：黄小明｝，使用深度学习算法识别出的实体词语为｛药品名称drug：无｝，则进行实体替换后，所得到的替换句子为“能预约time在location分院的doctor吗”，再通过深度学习算法对其进行意图识别，得到意图为“预约医生”，则可以将识别得到的实体词语｛时间time：10月3号｝、｛地点location：深圳｝和｛医生名称doctor：黄小明｝，以及识别得到的意图“预约医生”一起传递给后续的业务模块，以触发业务目标基于上述实体词语及意图执行相应的操作（也即执行“预约10月3号深圳的黄小明医生”的操作）。

由上可见，通过本申请方案，语音助手预先集成了多种算法，并在定制时基于用户输入的训练数据的不同类型自动化选择对应的算法对语音助手进行训练，可实现语音助手的高度定制化，能够满足不同用户的个性化需求。

应理解，上述实施例中各步骤的序号的大小并不意味着执行顺序的先后，各过程的执行顺序应以其功能和内在逻辑确定，而不应对本申请实施例的实施过程构成任何限定。

实施例二

本申请实施例二提供了一种语音助手定制装置，上述语音助手定制装置可集成于智能设备中，如图4所示，本申请实施例中的语音助手定制装置400包括：

输入数据读取单元401，用于读取输入的训练模板语料及训练词典，其中，每一训练词典中包含有一个以上实体词语；

意图识别算法确定单元402，用于根据上述训练模板语料的语料数量确定意图识别算法；

意图识别训练单元403，用于基于确定的意图识别算法及上述训练模板语料，对上述语音助手进行意图识别训练；

实体词语识别算法确定单元404，用于根据各个训练词典的属性，分别确定每一训练词典所对应的实体词语识别算法；

实体词语识别训练单元405，用于基于各个训练词典及各个训练词典所对应的实体词语识别算法，对上述语音助手进行实体词语识别训练；

定制化语音助手获取单元406，用于在上述意图识别训练及上述实体词语识别训练结束后，得到基于上述训练模板语料及上述训练词典的定制化语音助手。

可选地，上述意图识别算法确定单元402，包括：

语料数量检测子单元，用于检测上述训练模板语料的语料数量是否大于预设的语料数量阈值；

意图识别算法第一确定子单元，用于若上述语料数量大于上述语料数量阈值，则将预设的深度学习算法确定为上述意图识别算法；

意图识别算法第二确定子单元，用于若上述语料数量不大于上述语料数量阈值，则将上述模板算法确定为上述意图识别算法。

可选地，上述意图识别算法确定单元404，包括：

输入形式获取子单元，用于获取目标训练词典的输入形式，其中，上述目标训练词典为输入的任一训练词典；

一级类别确定子单元，用于根据上述目标训练词典的输入形式，确定上述目标训练词典的一级类别，其中，一级类别包括系统词典及自定义词典；

二级类别第一确定子单元，用于若上述目标训练词典为系统词典，则根据上述语音助手所预设的类别规则，确定上述目标训练词典在上述系统词典下的二级类别；

二级类别第二确定子单元，用于若上述目标训练词典为自定义词典，则根据上述目标训练词典所包含的实体词语的词语数量，确定上述目标训练词典在上述自定义词典下的二级类别；

实体词语识别算法确定子单元，用于基于上述目标训练词典的一级类别及二级类别，确定对应的实体词语识别算法。

可选地，上述一级类别确定子单元，具体用于若上述目标训练词典基于用户的勾选指令而输入，则确定上述目标训练词典为系统词典，若上述目标训练词典基于用户的导入指令而输入，则确定上述目标训练词典为自定义词典。

可选地，上述二级类别确定子单元，包括：

词语数量获取子单元，用于若上述目标训练词典为自定义词典，则获取上述目标训练词典所包含的实体词语的词语数量；

词语数量检测子单元，用于检测上述词语数量是否大于预设的词语数量阈值；

自定义词典二级类别确定子单元，用于根据上述词语数量与上述词语数量阈值的比对结果，确定上述目标训练词典在上述自定义词典下的二级类别。

可选地，上述语音助手定制装置400还包括：

接收单元，用于接收输入句子；

实体词语识别单元，用于基于上述定制化语音助手对上述输入句子进行实体词语识别，以得到上述输入句子所包含的一个以上实体词语及各个实体词语所属的词典；

替换单元，用于在上述输入句子中，将已识别的各个实体词语替换为各个实体词语所属的词典的词典名称，得到替换句子；

意图识别单元，用于基于上述定制化语音助手对上述替换句子进行意图识别，以得到上述输入句子的意图。

可选地，上述语音助手定制装置400还包括：

传输单元，用于将上述输入句子所包含的一个以上实体词语以及上述输入句子的意图传输至预设的业务模块，以触发上述智能终端基于上述输入句子输出相应反馈。

实施例三

本申请实施例三提供了一种智能设备，请参阅图5，本申请实施例中的智能设备5包括：存储器501，一个或多个处理器502（图5中仅示出一个）及存储在存储器501上并可在处理器上运行的计算机程序。其中：存储器501用于存储软件程序以及模块，处理器502通过运行存储在存储器501的软件程序以及单元，从而执行各种功能应用以及数据处理，以获取上述预设事件对应的资源。具体地，处理器502通过运行存储在存储器501的上述计算机程序时实现以下步骤：

根据上述训练模板语料的语料数量确定意图识别算法；

假设上述为第一种可能的实施方式，则在第一种可能的实施方式作为基础而提供的第二种可能的实施方式中，上述根据上述训练模板语料的语料数量确定意图识别算法，包括：

检测上述训练模板语料的语料数量是否大于预设的语料数量阈值；

若上述语料数量大于上述语料数量阈值，则将预设的深度学习算法确定为上述意图识别算法；

若上述语料数量不大于上述语料数量阈值，则将上述模板算法确定为上述意图识别算法。

在上述第一种可能的实施方式作为基础而提供的第三种可能的实施方式中，上述根据各个训练词典的属性，分别确定每一训练词典所对应的实体词语识别算法，包括：

获取目标训练词典的输入形式，其中，上述目标训练词典为输入的任一训练词典；

根据上述目标训练词典的输入形式，确定上述目标训练词典的一级类别，其中，一级类别包括系统词典及自定义词典；

若上述目标训练词典为系统词典，则根据上述语音助手所预设的类别规则，确定上述目标训练词典在上述系统词典下的二级类别；

若上述目标训练词典为自定义词典，则根据上述目标训练词典所包含的实体词语的词语数量，确定上述目标训练词典在上述自定义词典下的二级类别；

基于上述目标训练词典的一级类别及二级类别，确定对应的实体词语识别算法。

在上述第三种可能的实施方式作为基础而提供的第四种可能的实施方式中，上述根据上述目标训练词典的输入形式，确定上述目标训练词典的一级类别，包括：

若上述目标训练词典基于用户的勾选指令而输入，则确定上述目标训练词典为系统词典；

若上述目标训练词典基于用户的导入指令而输入，则确定上述目标训练词典为自定义词典。

在上述第三种可能的实施方式作为基础而提供的第五种可能的实施方式中，上述若上述目标训练词典为自定义词典，则根据上述目标训练词典所包含的实体词语的词语数量，确定上述目标训练词典在上述自定义词典下的二级类别，包括：

若上述目标训练词典为自定义词典，则获取上述目标训练词典所包含的实体词语的词语数量；

检测上述词语数量是否大于预设的词语数量阈值；

根据上述词语数量与上述词语数量阈值的比对结果，确定上述目标训练词典在上述自定义词典下的二级类别。

在上述第一种可能的实施方式作为基础，或者上述第二种可能的实施方式作为基础，或者上述第三种可能的实施方式作为基础，或者上述第四种可能的实施方式作为基础，或者上述第五种可能的实施方式作为基础而提供的第六种可能的实施方式中，在上述得到基于上述训练模板语料及上述训练词典的定制化语音助手之后，处理器502通过运行存储在存储器501的上述计算机程序时还实现以下步骤：

接收输入句子；

基于上述定制化语音助手对上述输入句子进行实体词语识别，以得到上述输入句子所包含的一个以上实体词语及各个实体词语所属的词典；

在上述输入句子中，将已识别的各个实体词语替换为各个实体词语所属的词典的词典名称，得到替换句子；

基于上述定制化语音助手对上述替换句子进行意图识别，以得到上述输入句子的意图。

在上述第六种可能的实施方式作为基础而提供的第七种可能的实施方式中，上述根据各个待替换词语的出现概率确定目标词语，包括：

将上述输入句子所包含的一个以上实体词语以及上述输入句子的意图传输至预设的业务模块，以触发上述智能终端基于上述输入句子输出相应反馈。

应当理解，在本申请实施例中，所称处理器502可以是中央处理单元(CentralProcessing Unit，CPU)，该处理器还可以是其他通用处理器、数字信号处理器 (DigitalSignal Processor，DSP)、专用集成电路 (Application Specific Integrated Circuit，ASIC)、现成可编程门阵列 (Field-Programmable Gate Array，FPGA) 或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。

存储器501可以包括只读存储器和随机存取存储器，并向处理器502 提供指令和数据。存储器501的一部分或全部还可以包括非易失性随机存取存储器。例如，存储器501还可以存储设备类型的信息。

所属领域的技术人员可以清楚地了解到，为了描述的方便和简洁，仅以上述各功能单元、模块的划分进行举例说明，实际应用中，可以根据需要而将上述功能分配由不同的功能单元、模块完成，即将上述装置的内部结构划分成不同的功能单元或模块，以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中，上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。另外，各功能单元、模块的具体名称也只是为了便于相互区分，并不用于限制本申请的保护范围。上述系统中单元、模块的具体工作过程，可以参考前述方法实施例中的对应过程，在此不再赘述。

在上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述或记载的部分，可以参见其它实施例的相关描述。

本领域普通技术人员可以意识到，结合本文中所公开的实施例描述的各示例的单元及算法步骤，能够以电子硬件、或者外部设备软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行，取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能，但是这种实现不应认为超出本申请的范围。

在本申请所提供的实施例中，应该理解到，所揭露的装置和方法，可以通过其它的方式实现。例如，以上所描述的系统实施例仅仅是示意性的，例如，上述模块或单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口，装置或单元的间接耦合或通讯连接，可以是电性，机械或其它的形式。

上述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

上述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读存储介质中。基于这样的理解，本申请实现上述实施例方法中的全部或部分流程，也可以通过计算机程序来指令相关联的硬件来完成，上述的计算机程序可存储于一计算机可读存储介质中，该计算机程序在被处理器执行时，可实现上述各个方法实施例的步骤。其中，上述计算机程序包括计算机程序代码，上述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。上述计算机可读存储介质可以包括：能够携带上述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机可读存储器、只读存储器（ROM，Read-Only Memory）、随机存取存储器（RAM，Random Access Memory）、电载波信号、电信信号以及软件分发介质等。需要说明的是，上述计算机可读存储介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减，例如在某些司法管辖区，根据立法和专利实践，计算机可读存储介质不包括是电载波信号和电信信号。

以上上述实施例仅用以说明本申请的技术方案，而非对其限制；尽管参照前述实施例对本申请进行了详细的说明，本领域的普通技术人员应当理解：其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围，均应包含在本申请的保护范围之内。

Claims

1.一种语音助手定制方法，其特征在于，所述语音助手定制方法应用于具备语音助手的智能设备，所述语音助手定制方法包括：

读取输入的训练模板语料及训练词典，其中，每一训练词典中包含有一个以上实体词语，所述训练模板语料指的是将一个语料中的实体词语进行了替换后所得到的语料；

根据所述训练模板语料的语料数量确定意图识别算法；

基于确定的意图识别算法及所述训练模板语料，对所述语音助手进行意图识别训练；

基于各个训练词典及各个训练词典所对应的实体词语识别算法，对所述语音助手进行实体词语识别训练，其中，所述意图识别训练与所述实体词语识别训练同步进行；

在所述意图识别训练及所述实体词语识别训练结束后，得到基于所述训练模板语料及所述训练词典的定制化语音助手；

其中，所述根据所述训练模板语料的语料数量确定意图识别算法，包括：

检测所述训练模板语料的语料数量是否大于预设的语料数量阈值；

若所述语料数量大于所述语料数量阈值，则将预设的深度学习算法确定为所述意图识别算法；

若所述语料数量不大于所述语料数量阈值，则将预设的模板算法确定为所述意图识别算法；

其中，所述根据各个训练词典的属性，分别确定每一训练词典所对应的实体词语识别算法，包括：

获取目标训练词典的输入形式，其中，所述目标训练词典为输入的任一训练词典；

根据所述目标训练词典的输入形式，确定所述目标训练词典的一级类别，其中，一级类别包括系统词典及自定义词典；

若所述目标训练词典为系统词典，则根据所述语音助手所预设的类别规则，确定所述目标训练词典在所述系统词典下的二级类别；

若所述目标训练词典为自定义词典，则根据所述目标训练词典所包含的实体词语的词语数量，确定所述目标训练词典在所述自定义词典下的二级类别；

基于所述目标训练词典的一级类别及二级类别，确定对应的实体词语识别算法。

2.如权利要求1所述的语音助手定制方法，其特征在于，所述根据所述目标训练词典的输入形式，确定所述目标训练词典的一级类别，包括：

若所述目标训练词典基于用户的勾选指令而输入，则确定所述目标训练词典为系统词典；

若所述目标训练词典基于用户的导入指令而输入，则确定所述目标训练词典为自定义词典。

3.如权利要求1所述的语音助手定制方法，其特征在于，所述若所述目标训练词典为自定义词典，则根据所述目标训练词典所包含的实体词语的词语数量，确定所述目标训练词典在所述自定义词典下的二级类别，包括：

若所述目标训练词典为自定义词典，则获取所述目标训练词典所包含的实体词语的词语数量；

检测所述词语数量是否大于预设的词语数量阈值；

根据所述词语数量与所述词语数量阈值的比对结果，确定所述目标训练词典在所述自定义词典下的二级类别。

4.如权利要求1至3任一项所述的语音助手定制方法，其特征在于，在所述得到基于所述训练模板语料及所述训练词典的定制化语音助手之后，所述语音助手定制方法还包括：

接收输入句子；

基于所述定制化语音助手对所述输入句子进行实体词语识别，以得到所述输入句子所包含的一个以上实体词语及各个实体词语所属的词典；

在所述输入句子中，将已识别的各个实体词语替换为各个实体词语所属的词典的词典名称，得到替换句子；

基于所述定制化语音助手对所述替换句子进行意图识别，以得到所述输入句子的意图。

5.如权利要求4所述的语音助手定制方法，其特征在于，在所述基于所述定制化语音助手对所述替换句子进行意图识别，以得到所述输入句子的意图之后，所述语音助手定制方法还包括：

将所述输入句子所包含的一个以上实体词语以及所述输入句子的意图传输至预设的业务模块，以触发所述智能设备基于所述输入句子输出相应反馈。

6.一种语音助手定制装置，其特征在于，所述语音助手定制装置应用于具备语音助手的智能设备，所述语音助手定制装置包括：

输入数据读取单元，用于读取输入的训练模板语料及训练词典，其中，每一训练词典中包含有一个以上实体词语，所述训练模板语料指的是将一个语料中的实体词语进行了替换后所得到的语料；

定制化语音助手获取单元，用于在所述意图识别训练及所述实体词语识别训练结束后，得到基于所述训练模板语料及所述训练词典的定制化语音助手；

其中，所述意图识别训练与所述实体词语识别训练同步进行；

其中，所述意图识别算法确定单元，包括：

语料数量检测子单元，用于检测所述训练模板语料的语料数量是否大于预设的语料数量阈值；

意图识别算法第一确定子单元，用于若所述语料数量大于所述语料数量阈值，则将预设的深度学习算法确定为所述意图识别算法；

意图识别算法第二确定子单元，用于若所述语料数量不大于所述语料数量阈值，则将预设的模板算法确定为所述意图识别算法；

其中，所述实体词语识别算法确定单元，包括：

输入形式获取子单元，用于获取目标训练词典的输入形式，其中，所述目标训练词典为输入的任一训练词典；

一级类别确定子单元，用于根据所述目标训练词典的输入形式，确定所述目标训练词典的一级类别，其中，一级类别包括系统词典及自定义词典；

二级类别第一确定子单元，用于若所述目标训练词典为系统词典，则根据所述语音助手所预设的类别规则，确定所述目标训练词典在所述系统词典下的二级类别；

二级类别第二确定子单元，用于若所述目标训练词典为自定义词典，则根据所述目标训练词典所包含的实体词语的词语数量，确定所述目标训练词典在所述自定义词典下的二级类别；

实体词语识别算法确定子单元，用于基于所述目标训练词典的一级类别及二级类别，确定对应的实体词语识别算法。

7.一种智能设备，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算机程序时实现如权利要求1至5任一项所述方法的步骤。

8.一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至5任一项所述方法的步骤。