CN113377904A

CN113377904A - 行业动作识别方法、装置、电子设备及存储介质

Info

Publication number: CN113377904A
Application number: CN202110626287.9A
Authority: CN
Inventors: 苑浩; 赵志新; 庞敏辉
Original assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Current assignee: Beijing Baidu Netcom Science and Technology Co Ltd
Priority date: 2021-06-04
Filing date: 2021-06-04
Publication date: 2021-09-10
Anticipated expiration: 2041-06-04
Also published as: CN113377904B

Abstract

本公开提供了行业动作识别方法、装置、电子设备及存储介质，涉及计算机技术领域，具体涉及自然语言处理和深度学习等人工智能技术领域，具体方案为：获取输入文本；从输入文本之中提取关键词；根据关键词确定目标行业动作识别模型；根据目标行业动作识别模型对输入文本进行行业动作识别，以确定输入文本中的行业动作，其中，行业动作为依赖行业的描述意图的动作词。由此，可以实现行业动作的识别，从而为意图识别提供数据保障，进而提升了意图识别的准确率。

Description

行业动作识别方法、装置、电子设备及存储介质

技术领域

本公开涉及计算机技术领域，具体涉及自然语言处理和深度学习等人工智能技术领域，尤其涉及一种行业动作识别方法、装置、电子设备及存储介质。

背景技术

随着互联网规模不断增加，智能化地为用户提供网络服务成为了热门的趋势。在这样的趋势下，能够更好的识别出用户的意图就能够真正的了解用户想要的是什么，从而能够为用户提供更贴心的服务，使用户的体验度提升，创造出更强的市场竞争力。由此看来，对用户的操作意图的识别就尤为重要。

目前，在客服场景中，客户会配置大量的细粒度意图用于意图识别，这种意图多由动作(即，行业动作)和核心业务词组成。随着意图数量的增多，意图之间会存在重复的业务词。

发明内容

本公开提供了一种行业动作识别方法、装置、电子设备及存储介质。

根据本公开的一方面，一种行业动作识别方法，包括：

获取输入文本；

从所述输入文本之中提取关键词；

根据所述关键词确定目标行业动作识别模型；以及

根据所述目标行业动作识别模型对所述输入文本进行行业动作识别，以确定所述输入文本中的行业动作。

根据本公开的另一方面，提供了一种模型的训练方法，包括：

获取样本文本，并获取待训练的行业动作识别模型，其中，所述样本文本中包含标定的行业动作，所述行业动作为依赖行业的描述意图的动作词；

将所述样本文本输入所述行业动作识别模型以生成预测的行业动作；

根据所述预测的行业动作和所述标定的行业动作生成损失值；以及

根据所述损失值对所述行业动作识别模型进行训练，以生成训练之后的所述行业动作识别模型。

根据本公开的另一方面，提供了一种行业动作识别装置，包括：

第一获取模块，用于获取输入文本；

提取模块，用于从所述输入文本之中提取关键词；

确定模块，用于根据所述关键词确定目标行业动作识别模型；以及

识别模块，用于根据所述目标行业动作识别模型对所述输入文本进行行业动作识别，以确定所述输入文本中的行业动作。

根据本公开的另一方面，提供了一种模型的训练装置，包括：

第二获取模块，用于获取样本文本，并获取待训练的行业动作识别模型，其中，所述样本文本中包含标定的行业动作，所述行业动作为依赖行业的描述意图的动作词；

第一生成模块，用于将所述样本文本输入所述行业动作识别模型以生成预测的行业动作；

第二生成模块，用于根据所述预测的行业动作和所述标定的行业动作生成损失值；以及

第二训练模块，用于根据所述损失值对所述行业动作识别模型进行训练，以生成训练之后的所述行业动作识别模型。

根据本公开的另一方面，提供了一种电子设备，包括：

至少一个处理器；以及

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行上述一方面面或另一方面实施例所述的方法。

根据本公开的另一方面，提供了一种存储有计算机指令的非瞬时计算机可读存储介质，其上存储有计算机程序，所述计算机指令用于使所述计算机执行上述一方面或另一方面实施例所述的方法。

根据本公开的另一方面，提供了一种计算机程序产品，包括计算机程序，所述计算机程序被处理器执行时实现上述一方面或另一方面实施例所述的方法。

应当理解，本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征，也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。

附图说明

附图用于更好地理解本方案，不构成对本公开的限定。其中：

图1为本公开实施例提供的一种行业动作识别方法的流程示意图；

图2为本公开实施例提供的另一种行业动作识别方法的流程示意图；

图3为本公开实施例提供的另一种行业动作识别方法的流程示意图；

图4为本公开实施例提供的另一种行业动作识别方法的流程示意图；

图5为本公开实施例提供的另一种行业动作识别方法的流程示意图；

图6为本公开实施例提供的另一种行业动作识别方法的流程示意图；

图7为本公开实施例提供的一种模型的训练方法的流程示意图；

图8为本公开实施例提供的一种行业动作识别装置的结构示意图；

图9为本公开实施例提供的一种模型的训练装置的结构示意图；以及

图10为根据本公开实施例的方法的电子设备的框图。

具体实施方式

以下结合附图对本公开的示范性实施例做出说明，其中包括本公开实施例的各种细节以助于理解，应当将它们认为仅仅是示范性的。因此，本领域普通技术人员应当认识到，可以对这里描述的实施例做出各种改变和修改，而不会背离本公开的范围和精神。同样，为了清楚和简明，以下的描述中省略了对公知功能和结构的描述。

下面参考附图描述本公开实施例的行业动作识别的方法、装置、电子设备及存储介质。

人工智能是研究使用计算机来模拟人的某些思维过程和智能行为(如学习、推理、思考、规划等)的学科，既有硬件层面的技术领域也有软件层面的技术。人工智能硬件技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理等技术；人工智能软件技术包括计算机视觉技术、语音识别技术、自然语言处理技术以及深度学习、大数据处理技术、知识图谱技术等几大方向。

自然语言处理是计算机科学领域与人工智能领域中的一个重要方向。它研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。自然语言处理是一门融语言学、计算机科学、数学于一体的科学。

深度学习是机器学习领域中一个新的研究方向。深度学习是学习样本数据的内在规律和表示层次，这些学习过程中获得的信息对诸如文字，图像和声音等数据的解释有很大的帮助。它的最终目标是让机器能够像人一样具有分析学习能力，能够识别文字、图像和声音等数据。深度学习是一个复杂的机器学习算法，在语音和图像识别方面取得的效果，远远超过先前相关技术。

本公开实施例提供的行业动作识别方法，可以由电子设备来执行，该电子设备可为PC(Personal Computer，个人计算机)电脑、平板电脑、掌上电脑或服务器等，此处不做任何限定。

在本公开实施例中，电子设备中可以设置有处理组件、存储组件和驱动组件。可选的，该驱动组件和处理组件可以集成设置，该存储组件可以存储操作系统、应用程序或其他程序模块，该处理组件通过执行存储组件中存储的应用程序来实现本公开实施例提供的行业动作识别的方法。

图1为本公开实施例提供的一种行业动作识别方法的流程示意图。

本公开实施例的行业动作识别的方法，还可由本公开实施例提供的行业动作识别装置执行，该装置可配置于电子设备中，以实现从获取到的输入文本之中提取关键词，并根据关键词确定目标行业动作识别模型，以及根据目标行业动作识别模型对输入文本进行行业动作识别，以确定输入文本中的行业动作，从而可以实现行业动作的识别。

作为一种可能的情况，本公开实施例的行业动作识别方法还可以在服务器端执行，服务器可以为云服务器，可以在云端执行该行业动作识别方法。

如图1所示，该行业动作识别的方法，可包括：

步骤101，获取输入文本。应说明的是，该实施例中所描述的输入文本可以为中文文本，该输入文本中可以包含一个句子、一个段落或者一个篇章，比如，新闻稿件等。

在本公开实施例中，输入文本可包括用户通过语音识别输入的文本信息以及用户通过输入法输入至输入法系统的输入内容，输入法系统可以根据用户当前的输入方式，将输入内容转换为所输入文字的字词候选项，提供用户进行选择，用户可以通过多种输入手段进行文本信息的输入，例如键盘，触摸板，鼠标等，同时用户也可以选择任意的输入方式进行文本信息的输入，如拼音，五笔，笔画，手写，英文、小语种键盘等，此处不做任何限定。

作为一种可能的情况，上述的输入文本还可以包括用户通过复制粘贴获取的文本信息。

具体地，电子设备可获取用户通过输入法输入至输入法系统的输入信息(输入文本)，比如，用户通过输入法输入一段中文的文字描述。例如，“去XX湖游玩怎么驾车过去”、“如何激活信用卡”等。

步骤102，从输入文本之中提取关键词。

在本公开实施例中，可根据关键词提取模型对输入文本进行提取，以得到关键词。

具体地，电子设备在获取到输入文本后，可将该输入文本输入至关键词提取模型，从而通过该关键词提取模型提取输入文本的关键词。例如，输入文本“信用卡激活”提取的关键词可以是“信用卡”，再例如，输入文本“去XXX湖旅游如何驾车过去”提取的关键词可以是“旅游”。

需要说明的是，该实施例中所描述的关键词提取模型可以是提前训练好的，并将其预存在电子设备的存储空间中，以方便调取应用，该存储空间不仅限于基于实体的存储空间，例如，硬盘，上述存储空间还可以是连接电子设备的网络硬盘的存储空间(云存储空间)。

其中，该关键词提取模型的训练与生成均可由相关的服务器进行，该服务器可以是云端服务器，也可以是一台电脑的主机，该服务器与可执行本公开实施例提供的行业动作识别方法的电子设备之间，建立有通信连接，该通信连接可以是无线网络连接和有线网络连接的至少一种。服务器可将训练完成的关键词提取模型发送给电子设备，以便电子设备在需要时调用，从而大大减少电子设备的计算压力。

作为一种可能的情况，还可根据关键词提取算法从输入文本之中提取关键词，其中，该关键词提取算法可根据实际情况进行标定。

具体地，电子设备在获取到输入文本后，可根据关键词提取算法对该输入文本进行关键词提取，以得到该输入文本之中的关键词。

步骤103，根据关键词确定目标行业动作识别模型。

需要说明的是，该实施例中所描述的目标行业动作识别模型也可以是提前训练好的，并将其预存在电子设备的存储空间中，以方便调取应用。在本公开实施例中，电子设备的存储空间中可预存有关系表，且该关系表中可记载有关键词与目标行业动作识别模型之间的对应关系。

步骤104，根据目标行业动作识别模型对输入文本进行行业动作识别，以确定输入文本中的行业动作，其中，行业动作可为依赖行业的描述意图的动作词，例如，输入文本“如何激活信用卡”中的词“激活”。

具体地，电子设备在从输入文本之中提取到关键词之后，可从自身的存储空间中调出预存的关系表，并根据该关键词查询该关系表，以得到对应的目标行业动作识别模型，例如，关键词为“信用卡”，则确定的目标行业动作识别模型可为银行相关业务的行业动作识别模型。然后电子设备可将该输入文本输入至该目标行业动作识别模型，从而通过该目标行业动作识别模型对该输入文本进行行业动作识别，以确定该输入文本中的行业动作。

举例而言，假设输入文本为“如何激活信用卡”，则从该输入文本之中提取的关键词可为“信用卡”，根据该关键词确定的目标行业动作识别模型可为银行的行业动作识别模型，将输入文本“如何激活信用卡”输入至该银行的行业动作识别模型，从而通过该银行的行业动作识别模型对该输入文本“如何激活信用卡”进行行业动作的识别，以得到该银行的行业动作识别模型输出的行业动作，其中，该行业动作为“激活”。

在本公开实施例中，首先获取输入文本，并从输入文本之中提取关键词，以及根据关键词确定目标行业动作识别模型，最后根据目标行业动作识别模型对输入文本进行行业动作识别，以确定输入文本中的行业动作。由此，可以实现行业动作的识别，从而为意图识别提供数据保障，进而提升了意图识别的准确率。

为了清楚说明上一实施例，在本公开的一个实施例中，如图2所示，从输入文本之中提取关键词，可包括：

步骤201，对输入文本进行分词以生成多个词。

在本公开实施例中，电子设备在获取到输入文本后，可先对该输入文本进行预处理，去除该输入文本中的标点、连续的空白字符、阿拉伯数字以及表情符号、表情图片等，并将文本转化为小写，从而为后续的实体关系抽取(检测)排除掉干扰项，进而提高后关键词提取的准确性。

在本公开实施例中，电子设备可通过预设的分词算法，或通过相关的分词工具对输入文本进行分词以生成多个词，其中，预设的分词算法可根据实际情况进行标定。

步骤202，按照预设规则对多个词进行提取以得到关键词。其中，预设规则可根据实际情况进行标定。

具体地，电子设备在获取到输入文本后，可先对该输入文本进行预处理，例如，去除该输入文本中的标点、连续的空白字符、阿拉伯数字以及表情符号、表情图片等。然后电子设备可调用相关的分词工具对预处理后的输入文本进行分词，以得到多个词，例如，对输入文本“如何激活信用卡”进行分词处理，得到的多个词可为“如何、激活和信用卡”。再然后电子设备可按照预设规则对上述的多个词进行提取以得到关键词，例如，从多个词“如何、激活和信用卡”中提取出的关键词可为“信用卡”。

此外，为了减少关键词提取时的计算量，电子设备在生成多个词之后，还可以对多个词进行筛选，剔除多个词中无意义的词，比如“如何”、“我的”等词，以及语气词、数字等词，再对剩余的词进行关键词提取，从而提高关键词提取的效率。

作为一种可能的情况，电子设备的存储空间中可预存有关键词词典(关键词表)，电子设备在得到上述的多个词之后，可将该多个词中的每个词与该关键词词典之中的各个关键词进行匹配，如果匹配成功，则将该匹配成功的词作为关键词。应说明的是，该实施例中所描述的关键词词典可以是提前生产好的，并将其预存在电子设备的存储空间中，以方便调取应用。另外，该实施例中所描述的关键词可为多个。

由此，可以使提取出的关键词更加契合用户通过输入文本所要表达的行业含义，同时提高后续确定目标行业动作识别模型的准确性。

进一步地，在本公开的一个实施例中，如图3所示，根据关键词确定目标行业动作识别模型，可包括：

步骤301，以关键词为索引从预设数据库之中进行查询，以生成查询结果。其中，查询结果中可包括关键词对应的行业信息。

需要说明的是，该实施例中所描述的预设数据库中可包括多个不同行业的关键词和行业的对应关系，其中，一个行业可对应多个关键词，例如，银行行业对应的关键词可包括但不限于银行、信用卡、激活、挂失、开户、还款、汇款等；再例如，比如，一日游、周边游、旅游等关键词对应的可以是旅游行业。

具体地，电子设备在提取到关键词之后，可从电子设备的存储空间中调出预设数据库，并以关键词为索引从预设数据库之中进行查询，以查询出关键词对应的行业信息，并生成查询结果。

步骤302，根据查询结果确定目标行业动作识别模型。

需要说明的是，该实施例中所描述的目标行业动作识别模型可为分类模型，例如，文本分类模型(Text Convolutional Neural Networks，简称TextCNN)。

在本公开实施例中，上述预存在电子设备的存储空间中的关系表中还可包括行业信息与行业动作识别模型之间的对应关系。

具体地，电子设备在生成查询结果之后，可从自身的存储空间中调出预存的关系表，并根据该查询结果中的行业信息查询该关系表，以获取对应的行业动作识别模型，并将该行业动作识别模型作为目标行业动作识别模型。由此，可以准确的得到处理该输入文本的目标行业动作识别模型，从而提高行业动作识别的准确率。

作为一种可能的情况，若以关键词为索引从预设数据库之中进行查询，并没有查询到该关键词对应的行业信息，则查询结果中将不包括关键词对应的行业信息，此时电子设备可获取默认的行业动作识别模型，并将其作为目标行业动作识别模型。

在本公开的另一个实施例中，如图4，根据关键词确定目标行业动作识别模型，可包括：

步骤401，基于关键词确定目标行业类别。

在本公开实施例中，上述预存在电子设备的存储空间中的关系表中还可包括关键词与行业类别之间的对应关系。

具体地，电子设备在得到输入文本之中的关键词之后，可从自身的存储空间中调出预存的关系表，并根据该关键词查询该关系表，以获取与该关键词对应的行业类别，并该行业类别作为目标行业类别。

需要说明的是，该实施例中所描述的行业类别可包括：保险业、采矿、能源、餐饮、宾馆、电讯业、房地产、服务、服装业、公益组织、广告业、航空航天、化学、健康、保健、建筑业、教育、培训、计算机、金属冶炼、警察、消防、会计、美容、媒体、出版、木材、造纸、零售、批发、农业、旅游业、司法、律师、司机、体育运动、学术研究、演艺、医疗服务、艺术、设计、银行、金融、因特网、音乐舞蹈、邮政快递、运输业、政府机关、机械制造、咨询等。

步骤402，基于目标行业类别确定目标行业动作识别模型。

进一步地，在本公开的一个实施例中，基于目标行业类别确定目标行业动作识别模型，可包括在预设数据库中查找目标行业类别，其中，在预设数据库中不存在目标行业类别的情况下，查找预设数据库中与目标行业类别相关的第一行业类别，并确定第一行业类别对应的行业动作识别模型为目标行业动作识别模型；和/或在预设数据库中不存在目标行业类别的情况下，输出提醒消息。

需要说明的是，该实施例中所描述的预设数据库中可包括行业类别与行业动作识别模型之间的对应关系。

具体地，电子设备在得到目标行业类别之后，可从电子设备的存储空间中调出预设数据库，在预设数据库中查找该目标行业类别，如果在预设数据库中查找到该目标行业类别，则获取该目标行业类别对应的行业动作识别模型，并将其作为目标行业动作识别模型。如果在预设数据库中不存在(未查找到)该目标行业类别，则可从该预设数据库中查找与该目标行业类别(例如，律师)相关的第一行业类别(例如，司法)，并获取该第一行业类别对应的行业动作识别模型，并将其作为目标行业动作识别模型。如果在预设数据库中不存在(未查找到)该目标行业类别，则还可生成相关的提醒信息，并将其提供给用户。由此，在查找不到与输入文本直接相关的目标行业动作识别模型的时候，获取与该输入文本最近行业的行业动作识别模型作为目标行业动作识别模型，从而提高本申请的使用范围，且进一步提高行业动作识别的准确率。

进一步地，在本发明的一个实施例中，如图5所示，目标行业动作识别模型可通过以下方式生成：

步骤501，获取样本文本，其中，样本文本中包含标定的行业动作。

在本公开实施例中，获取样本文本的途径有多条，其中，可获取相关人员通过语音识别输入的文本信息以及用户通过输入法输入至输入法系统的输入内容，或者可通过一些软件收集搜索引擎输入框中的一些输入内容，而后相关人员可对将这些输入内容生成样本文本(即，对这些输入内容进行标定)。

步骤502，将样本文本输入预设行业动作识别模型以生成预测的行业动作。

需要说明的是，该实施例中所描述的预设行业动作识别模型可预存在电子设备的存储空间中，以方便调取。

步骤503，根据预测的行业动作和标定的行业动作生成损失值，并根据损失值对预设行业动作识别模型进行训练，以得到目标行业动作识别模型。

具体地，在获取到样本文本后，可将样本文本输入预设行业动作识别模型以生成预测的行业动作，并根据预测的行业动作和标定的行业动作生成损失值，以及根据损失值对该预设行业动作识别模型进行训练，并将训练后的预设行业动作识别模型作为目标行业动作识别模型，即得到目标行业动作识别模型，从而优化目标行业动作识别模型，提高识别的准确度。

为了清楚说明上一实施例，在本公开的实施例中，根据目标行业动作识别模型对输入文本进行行业动作识别，以确定输入文本中的行业动作，具体可包括将输入文本输入至目标行业动作识别模型，并通过目标行业动作识别模型检测输入文本中的行业动作，以确定输入文本中的行业动作，例如，输入文本“如何激活先用卡”中的词“激活”。

具体地，电子设备在确定目标行业动作识别模型之后，可将上述的输入文本输入至该目标行业动作识别模型，该目标行业动作识别模型检测该输入文本中的行业动作，从而确定输入文本中的行业动作。由此，通过目标行业动作识别模型进行行业动作的识别，可以提高识别的精确度，从而可以通过行业动作为意图识别增加一个纬度，提升用户意图识别准确率，缓解随着意图数量增多带来的意图缠绕问题。

进一步地，在本公开的一个实施例中，如图6所示，该行业动作识别方法，还可包括：

步骤601，若输入文本中的行业动作的识别概率小于识别概率阈值，则对输入文本进行标注以生成新样本文本。其中，识别概率阈值可根据实际情况进行标定。

需要说明的是，上述实施例中所描述的目标行业动作识别模型在对输入文本进行行业动作识别的过程中，还可生成输出的行业动作的识别概率，并可将其随着行业动作一并输出。例如，输出输入文本“如何激活先用卡”中的词“激活”和其对应的识别概率“95％”。

具体地，电子设备在确定输入文本中的行业动作之后，可获取该行业动作的识别概率，并判断该行业动作的识别概率是否小于识别概率阈值，如果是，则可对该行业动作对应的输入文本进行标注以生成新样本文本。

在本公开实施例中，可通过预设的标注算法对该行业动作对应的输入文本进行标注，以生成新样本文本。其中，预设的标注算法可根据实际情况进行标定。

需要说明的是，若经过本公开的目标行业动作识别模型得到的行业动作的识别概率是否小于识别概率阈值，则可说明该目标行业动作识别模型先前的样本文本中可能没有与该行业动作对应的输入文本相关的样本文本。

作为一种可能的情况，电子设备还可将该行业动作对应的输入文本输入到相关的标注工具中，相关人员通过操作该标注工具对该行业动作对应的输入文本进行标注，以生成新样本文本。

步骤602，当新样本文本的数量达到样本累计阈值时，根据新样本文本对目标行业动作识别模型进行加强训练。其中，样本累计阈值可根据实际情况进行标定。

具体地，电子设备在生成新样本文本之后，可将该新样本文本暂存在电子设备的存储空间中，当暂存在电子设备的存储空间中的新样本文本(目标行业动作识别模型对应的输入文本经过标注得到的样本文本)的数量达到样本累计阈值时，可根据这些新样本文本对目标行业动作识别模型进行加强训练。由此，可以提高目标行业动作识别模型的识别准确度，从而保证为意图识别提供数据的精确度，进而提升了意图识别的准确率。

图7为本公开实施例提供的一种模型的训练方法的流程示意图。

本公开实施例的模型的训练方法，还可由本公开实施例提供的模型的训练装置执行，该装置可配置于电子设备中，以实现将获取到的样本文本输入待训练的行业动作识别模型以生成预测的行业动作，并根据预测的行业动作和标定的行业动作生成损失值，以及根据损失值对待训练的行业动作识别模型进行训练，以生成训练之后的行业动作识别模型，从而能够提高行业动作识别模型的准确度。

作为一种可能的情况，本公开实施例的模型的训练方法还可以在服务器端执行，服务器可以为云服务器，可以在云端执行该模型的训练方法。

如图7所示，该模型的训练方法，可包括：

步骤701，获取样本文本，并获取待训练的行业动作识别模型，其中，样本文本中包含标定的行业动作，行业动作为依赖行业的描述意图的动作词。应说明的是，该实施例中所描述的待训练的行业动作识别模型可预存在电子设备的存储空间中，以方便调取。

步骤702，将样本文本输入行业动作识别模型以生成预测的行业动作。

步骤703，根据预测的行业动作和标定的行业动作生成损失值。

需要说明的是，该实施例中所描述的损失值可基于相关的损失值生成公式，并根据预测的行业动作和标定的行业动作生成。

步骤704，根据损失值对行业动作识别模型进行训练，以生成训练之后的行业动作识别模型。

具体地，电子设备在获取到样本文本后，可从自身的存储空间中调出(获取)待训练的行业动作识别模型，并可将样本文本输入该待训练的行业动作识别模型以生成预测的行业动作，并根据预测的行业动作和标定的行业动作生成损失值，以及根据损失值对该待训练的行业动作识别模型进行训练，以生成训练之后的行业动作识别模型，从而优化行业动作识别模型，提高识别的准确度。

根据本公开实施例的模型的训练方法，首先获取样本文本，并获取待训练的行业动作识别模型，以及将样本文本输入行业动作识别模型以生成预测的行业动作，然后根据预测的行业动作和标定的行业动作生成损失值，最后根据损失值对行业动作识别模型进行训练，以生成训练之后的行业动作识别模型。由此，能够提高行业动作识别模型的准确度。

图8为本公开实施例提供的一种行业动作识别装置的结构示意图。

本公开实施例的行业动作识别的装置，可配置于电子设备中，以实现从获取到的输入文本之中提取关键词，并根据关键词确定目标行业动作识别模型，以及根据目标行业动作识别模型对输入文本进行行业动作识别，以确定输入文本中的行业动作，从而可以实现行业动作的识别。

如图8所示，该行业动作识别的装置800，可包括：第一获取模块810、提取模块820、确定模块830和识别模块840。

其中，第一获取模块810用于获取输入文本。应说明的是，该实施例中所描述的输入文本可以为中文文本，该输入文本中可以包含一个句子、一个段落或者一个篇章，比如，新闻稿件等。

具体地，第一获取模块810可获取用户通过输入法输入至输入法系统的输入信息(输入文本)，比如，用户通过输入法输入一段中文的文字描述。例如，“去XX湖游玩怎么驾车过去”、“如何激活信用卡”等。

提取模块820用于从输入文本之中提取关键词。

具体地，在第一获取模块810获取到输入文本后，提取模块820可将该输入文本输入至关键词提取模型，从而通过该关键词提取模型提取输入文本的关键词。例如，输入文本“信用卡激活”提取的关键词可以是“信用卡”，再例如，输入文本“去XXX湖旅游如何驾车过去”提取的关键词可以是“旅游”。

其中，该关键词提取模型的训练与生成均可由相关的服务器进行，该服务器可以是云端服务器，也可以是一台电脑的主机，该服务器与可配置本公开实施例提供的行业动作识别装置的电子设备之间，建立有通信连接，该通信连接可以是无线网络连接和有线网络连接的至少一种。服务器可将训练完成的关键词提取模型发送给电子设备，以便电子设备在需要时调用，从而大大减少电子设备的计算压力。

具体地，在第一获取模块810获取到输入文本后，提取模块820可根据关键词提取算法对该输入文本进行关键词提取，以得到该输入文本之中的关键词。

确定模块830用于根据关键词确定目标行业动作识别模型。

识别模块840用于根据目标行业动作识别模型对输入文本进行行业动作识别，以确定输入文本中的行业动作，其中，行业动作可为依赖行业的描述意图的动作词，例如，输入文本“如何激活先用卡”中的词“激活”。

具体地，在提取模块820从输入文本之中提取到关键词之后，确定模块830可从电子设备的存储空间中调出预存的关系表，并根据该关键词查询该关系表，以得到对应的目标行业动作识别模型，例如，关键词为“信用卡”，则确定的目标行业动作识别模型可为银行相关业务的行业动作识别模型。然后识别模块840可将该输入文本输入至该目标行业动作识别模型，从而通过该目标行业动作识别模型对该输入文本进行行业动作识别，以确定该输入文本中的行业动作。

在本公开实施例中，首先通过获取模块获取输入文本，并通过提取模块，从输入文本之中提取关键词，以及通过确定模块根据关键词确定目标行业动作识别模型，而后通过识别模块根据目标行业动作识别模型对输入文本进行行业动作识别，以确定输入文本中的行业动作。由此，可以实现行业动作的识别，从而为意图识别提供数据保障，进而提升了意图识别的准确率。

在本公开的一个实施例中，提取模块820还用于：对输入文本进行分词以生成多个词；按照预设规则对多个词进行提取以得到关键词。

在本公开的一个实施例中，确定模块830具体用于：以关键词为索引从预设数据库之中进行查询，以生成查询结果；根据查询结果确定目标行业动作识别模型。

在本公开的一个实施例中，如图8所示，确定模块830，可包括：第一确定单元831和第二确定单元832。

其中，第一确定单元831用于基于关键词确定目标行业类别。

第二确定单元832用于基于目标行业类别确定目标行业动作识别模型。

在本公开的一个实施例中，第二确定单元，还用于：在预设数据库中查找目标行业类别；在预设数据库中不存在目标行业类别的情况下，查找预设数据库中与目标行业类别相关的第一行业类别，并确定第一行业类别对应的行业动作识别模型为目标行业动作识别模型；和/或在预设数据库中不存在目标行业类别的情况下，输出提醒消息。

在本公开的一个实施例中，如图8所示，该行业动作识别的装置800还可包括第一训练模块850，其中，第一训练模块850用于通过以下方式生成预设行业动作识别模型：获取样本文本，其中，样本文本中包含标定的行业动作；将样本文本输入目标行业动作识别模型以生成预测的行业动作；根据预测的行业动作和标定的行业动作生成损失值，并根据损失值对预设行业动作识别模型进行训练，以得到所述目标行业动作识别模型。

在本公开的一个实施例中，识别模块840还用于：若输入文本中的行业动作的识别概率小于识别概率阈值，则对输入文本进行标注以生成新样本文本；当新样本文本的数量达到样本累计阈值时，根据新样本文本对目标行业动作识别模型进行加强训练。

需要说明的是，前述对行业动作识别方法实施例的解释说明也适用于该实施例的行业动作识别装置，此处不再赘述。

本公开实施例的行业动作识别装置，首先通过第一获取模块获取输入文本，并通过提取模块，从输入文本之中提取关键词，以及通过确定模块根据关键词确定目标行业动作识别模型，而后通过识别模块根据目标行业动作识别模型对输入文本进行行业动作识别，以确定输入文本中的行业动作。由此，可以实现行业动作的识别，从而为意图识别提供数据保障，进而提升了意图识别的准确率。

图9为本公开实施例提供的一种模型的训练装置的结构示意图。

本公开实施例的模型的训练装置，可配置于电子设备中，以实现将获取到的样本文本输入待训练的行业动作识别模型以生成预测的行业动作，并根据预测的行业动作和标定的行业动作生成损失值，以及根据损失值对待训练的行业动作识别模型进行训练，以生成训练之后的行业动作识别模型，从而能够提高行业动作识别模型的准确度。

如图9所示，该模型的训练装置900，可包括：第二获取模块910、第一生成模块920、第二生成模块930和第二训练模块940。

其中，第二获取模块910用于获取样本文本，并获取待训练的行业动作识别模型，其中，样本文本中包含标定的行业动作，行业动作为依赖行业的描述意图的动作词。应说明的是，该实施例中所描述的待训练的行业动作识别模型可预存在电子设备的存储空间中，以方便调取。

在本公开实施例中，第二获取模块910获取样本文本的途径有多条，其中，可获取相关人员通过语音识别输入的文本信息以及用户通过输入法输入至输入法系统的输入内容，或者可通过一些软件收集搜索引擎输入框中的一些输入内容，而后相关人员可对将这些输入内容生成样本文本(即，对这些输入内容进行标定)。

第一生成模块920用于将样本文本输入行业动作识别模型以生成预测的行业动作。

第二生成模块930用于根据预测的行业动作和标定的行业动作生成损失值。

第二训练模块940用于根据损失值对行业动作识别模型进行训练，以生成训练之后的行业动作识别模型。

具体地，在第二获取模块910获取到样本文本后，可从自身的存储空间中调出(获取)待训练的行业动作识别模型，然后第一生成模块920可将样本文本输入该待训练的行业动作识别模型以生成预测的行业动作，再然后第二生成模块930可根据预测的行业动作和标定的行业动作生成损失值，最后第二训练模块940可根据该损失值对该待训练的行业动作识别模型进行训练，以生成训练之后的行业动作识别模型，从而优化行业动作识别模型，提高识别的准确度。

需要说明的是，前述对行业动作识别模型的训练方法实施例的解释说明也适用于该实施例的行业动作识别模型的训练装置，此处不再赘述。

本公开实施例的模型的训练装置，首先通过获取模块获取样本文本，并获取待训练的行业动作识别模型，然后通过第一生成模块将样本文本输入行业动作识别模型以生成预测的行业动作，并通过第二生成模块根据预测的行业动作和标定的行业动作生成损失值，最后通过训练模块根据损失值对行业动作识别模型进行训练，以生成训练之后的行业动作识别模型。由此，能够提高行业动作识别模型的准确度。

根据本公开的实施例，本公开还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。

图10示出了可以用来实施本公开的实施例的示例电子设备1000的示意性框图。电子设备旨在表示各种形式的数字计算机，诸如，膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置，诸如，个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例，并且不意在限制本文中描述的和/或者要求的本公开的实现。

如图10所示，设备1000包括计算单元1001，其可以根据存储在只读存储器(ROM)1002中的计算机程序或者从存储单元1008加载到随机访问存储器(RAM)1003中的计算机程序，来执行各种适当的动作和处理。在RAM 1003中，还可存储设备1000操作所需的各种程序和数据。计算单元1001、ROM1002以及RAM1003通过总线1004彼此相连。输入/输出(I/O)接口1005也连接至总线1004。

设备1000中的多个部件连接至I/O接口1005，包括：输入单元1006，例如键盘、鼠标等；输出单元1007，例如各种类型的显示器、扬声器等；存储单元1008，例如磁盘、光盘等；以及通信单元1009，例如网卡、调制解调器、无线通信收发机等。通信单元1009允许设备1000通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。

计算单元1001可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元1001的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元1001执行上文所描述的各个方法和处理，例如行业动作识别方法和模型的训练方法。例如，在一些实施例中，行业动作识别方法和模型的训练方法可被实现为计算机软件程序，其被有形地包含于机器可读介质，例如存储单元1008。在一些实施例中，计算机程序的部分或者全部可以经由ROM 1002和/或通信单元1009而被载入和/或安装到设备1000上。当计算机程序加载到RAM 1003并由计算单元1001执行时，可以执行上文描述的行业动作识别方法和模型的训练方法的一个或多个步骤。备选地，在其他实施例中，计算单元1001可以通过其他任何适当的方式(例如，借助于固件)而被配置为执行行业动作识别方法和模型的训练方法。

本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括：实施在一个或者多个计算机程序中，该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释，该可编程处理器可以是专用或者通用可编程处理器，可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令，并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。

用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器，使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行，作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。

在本公开的上下文中，机器可读介质可以是有形的介质，其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备，或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。

为了提供与用户的交互，可以在计算机上实施此处描述的系统和技术，该计算机具有：用于向用户显示信息的显示装置(例如，CRT(阴极射线管)或者LCD(液晶显示器)监视器)；以及键盘和指向装置(例如，鼠标或者轨迹球)，用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互；例如，提供给用户的反馈可以是任何形式的传感反馈(例如，视觉反馈、听觉反馈、或者触觉反馈)；并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。

可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如，作为数据服务器)、或者包括中间件部件的计算系统(例如，应用服务器)、或者包括前端部件的计算系统(例如，具有图形用户界面或者网络浏览器的用户计算机，用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如，通信网络)来将系统的部件相互连接。通信网络的示例包括：局域网(LAN)、广域网(WAN)、互联网和区块链网络。

计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器，又称为云计算服务器或云主机，是云计算服务体系中的一项主机产品，以解决了传统物理主机与VPS服务("Virtual Private Server"，或简称"VPS")中，存在的管理难度大，业务扩展性弱的缺陷。服务器也可以为分布式系统的服务器，或者是结合了区块链的服务器。

应该理解，可以使用上面所示的各种形式的流程，重新排序、增加或删除步骤。例如，本公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行，只要能够实现本公开公开的技术方案所期望的结果，本文在此不进行限制。

上述具体实施方式，并不构成对本公开保护范围的限制。本领域技术人员应该明白的是，根据设计要求和其他因素，可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等，均应包含在本公开保护范围之内。

Claims

1.一种行业动作识别方法，包括：

获取输入文本；

从所述输入文本之中提取关键词；

根据所述关键词确定目标行业动作识别模型；以及

根据所述目标行业动作识别模型对所述输入文本进行行业动作识别，以确定所述输入文本中的行业动作，其中，所述行业动作为依赖行业的描述意图的动作词。

2.根据权利要求1所述的方法，其中，所述从所述输入文本之中提取关键词，包括：

对所述输入文本进行分词以生成多个词；

按照预设规则对所述多个词进行提取以得到所述关键词。

3.根据权利要求1所述的方法，其中，根据所述关键词确定目标行业动作识别模型，包括：

以所述关键词为索引从预设数据库之中进行查询，以生成查询结果；

根据所述查询结果确定所述目标行业动作识别模型。

4.根据权利要求1所述的方法，其中，根据所述关键词确定目标行业动作识别模型，包括：

基于所述关键词确定目标行业类别；

基于所述目标行业类别确定所述目标行业动作识别模型。

5.根据权利要求4所述的方法，其中，所述基于所述目标行业类别确定所述目标行业动作识别模型，包括：

在预设数据库中查找所述目标行业类别；

在所述预设数据库中不存在所述目标行业类别的情况下，查找所述预设数据库中与所述目标行业类别相关的第一行业类别，并确定所述第一行业类别对应的行业动作识别模型为所述目标行业动作识别模型；和/或

在所述预设数据库中不存在所述目标行业类别的情况下，输出提醒消息。

6.根据权利要求1所述的方法，其中，所述目标行业动作识别模型通过以下方式生成：

获取样本文本，其中，所述样本文本中包含标定的行业动作；

将所述样本文本输入预设行业动作识别模型以生成预测的行业动作；

根据所述预测的行业动作和所述标定的行业动作生成损失值，并根据所述损失值对所述预设行业动作识别模型进行训练，以得到所述目标行业动作识别模型。

7.根据权利要求1所述的方法，还包括：

若所述输入文本中的行业动作的识别概率小于识别概率阈值，则对所述输入文本进行标注以生成新样本文本；

当所述新样本文本的数量达到样本累计阈值时，根据所述新样本文本对所述目标行业动作识别模型进行加强训练。

8.一种模型的训练方法，包括：

9.一种行业动作识别装置，包括：

第一获取模块，用于获取输入文本；

提取模块，用于从所述输入文本之中提取关键词；

识别模块，用于根据所述目标行业动作识别模型对所述输入文本进行行业动作识别，以确定所述输入文本中的行业动作，其中，所述行业动作为依赖行业的描述意图的动作词。

10.根据权利要求9所述的装置，其中，所述提取模块，还用于：

对所述输入文本进行分词以生成多个词；

按照预设规则对所述多个词进行提取以得到所述关键词。

11.根据权利要求9所述的装置，其中，所述确定模块，还用于：

根据所述查询结果确定所述目标行业动作识别模型。

12.根据权利要求9所述的装置，其中，所述确定模块，包括：

第一确定单元，用于基于所述关键词确定目标行业类别；

第二确定单元，用于基于所述目标行业类别确定所述目标行业动作识别模型。

13.根据权利要求12所述的装置，其中，所述第二确定单元，还用于：

在预设数据库中查找所述目标行业类别；

14.根据权利要求9所述的装置，还包括：

第一训练模块，用于通过以下方式生成所述目标行业动作识别模型：

15.根据权利要求9所述的装置，其中，所述识别模块，还用于：

16.一种模型的训练装置，包括：

17.一种电子设备，包括：

至少一个处理器；以及

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够执行权利要求1-7中任一项或权利要求8所述的方法。

18.一种存储有计算机指令的非瞬时计算机可读存储介质，其中，所述计算机指令用于使所述计算机执行根据权利要求1-7中任一项或权利要求8所述的方法。

19.一种计算机程序产品，包括计算机程序，所述计算机程序在被处理器执行时实现根据权利要求1-7中任一项或权利要求8所述的方法。