CN113723099A - 模型训练方法、用户意图识别方法、装置和计算机设备 - Google Patents
模型训练方法、用户意图识别方法、装置和计算机设备 Download PDFInfo
- Publication number
- CN113723099A CN113723099A CN202111046825.3A CN202111046825A CN113723099A CN 113723099 A CN113723099 A CN 113723099A CN 202111046825 A CN202111046825 A CN 202111046825A CN 113723099 A CN113723099 A CN 113723099A
- Authority
- CN
- China
- Prior art keywords
- user intention
- data
- user
- server
- intention
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 55
- 238000012549 training Methods 0.000 title claims abstract description 33
- 230000006870 function Effects 0.000 claims description 17
- 238000012545 processing Methods 0.000 claims description 8
- 238000004590 computer program Methods 0.000 claims description 4
- 230000008569 process Effects 0.000 description 9
- 230000006872 improvement Effects 0.000 description 8
- 238000010586 diagram Methods 0.000 description 6
- 238000010801 machine learning Methods 0.000 description 5
- 238000012546 transfer Methods 0.000 description 4
- 238000011478 gradient descent method Methods 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000012423 maintenance Methods 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 238000007476 Maximum Likelihood Methods 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000007477 logistic regression Methods 0.000 description 1
- 230000005055 memory storage Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Software Systems (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
本说明书实施例公开了一种模型训练方法、用户意图识别方法、装置和计算机设备。所述用户意图识别方法包括:接收终端设备发来的待识别数据;将待识别数据输入至用户意图识别模型,得到至少一个用户意图;向终端设备反馈至少一个用户意图。本说明书实施例可以提高用户意图识别的效率和准确程度。
Description
技术领域
本说明书实施例涉及计算机技术领域,特别涉及一种模型训练方法、用户意图识别方法、装置和计算机设备。
背景技术
用户意图可以是指用户想要表达的意愿或者想要达到的目的。在一些场景中,需要根据用户输入的数据识别用户意图,以便准确地为用户提供相应的服务。
在相关技术中,可以采用预先设置的规则来识别用户意图。例如,当用户输入的一句话中包含某些关键词时,则表明用户是相应的某种意图。然而,规则是需要维护和扩展的。人工对规则的维护和扩展需要耗费一定的时间,成本高效率低,无法适应互联网快速变化的趋势。另外,采用预先设置的规则来识别用户意图,会造成用户意图识别的准确率不高。
发明内容
本说明书实施例提供一种模型训练方法、用户意图识别方法、装置和计算机设备,以提高用户意图识别的效率和准确程度。本说明书实施例的技术方案如下。
本说明书实施例的第一方面,提供了一种模型训练方法,包括:
获取多种业务场景下的语料数据;
根据业务场景实现的功能,为语料数据设置用户意图标签;
根据语料数据和用户意图标签,对用户意图识别模型进行训练。
本说明书实施例的第二方面,提供了一种用户意图识别方法,包括:
接收终端设备发来的待识别数据;
将待识别数据输入至用户意图识别模型,得到至少一个用户意图;
向终端设备反馈至少一个用户意图。
本说明书实施例的第三方面,提供了一种用户意图识别方法,包括:
获取待识别数据;
向服务器发送待识别数据,以便服务器将所述待识别数据输入至用户意图识别模型,得到至少一个用户意图;
接收服务器反馈的至少一个用户意图;
显示所述至少一个用户意图。
本说明书实施例的第四方面,提供了一种模型训练装置,包括:
获取单元,用于获取多种业务场景下的语料数据;
设置单元,用于根据业务场景实现的功能,为语料数据设置用户意图标签;
训练单元,用于根据语料数据和用户意图标签,对用户意图识别模型进行训练。
本说明书实施例的第五方面,提供了一种用户意图识别装置,包括:
接收单元,用于接收终端设备发来的待识别数据;
输入单元,用于将待识别数据输入至用户意图识别模型,得到至少一个用户意图;
反馈单元,用于向终端设备反馈至少一个用户意图。
本说明书实施例的第六方面,提供了一种用户意图识别装置,包括:
获取单元,用于获取待识别数据;
发送单元,用于向服务器发送待识别数据,以便服务器将所述待识别数据输入至用户意图识别模型,得到至少一个用户意图;
接收单元,用于接收服务器反馈的至少一个用户意图;
显示单元,用于显示所述至少一个用户意图。
本说明书实施例的第七方面,提供了一种计算机设备,包括:
存储器、处理器及存储在存储器上的计算机程序,所述处理器执行所述计算机程序以实现如第一方面、第二方面或者第三方面所述方法的步骤。
本说明书实施例提供的技术方案,可以利用用户意图识别模型识别用户意图,提高了用户意图识别的效率和准确程度。
附图说明
为了更清楚地说明本说明书实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,下面描述中的附图仅仅是本说明书中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1为本说明书实施例中用户意图识别过程的示意图;
图2为本说明书实施例中模型训练方法的流程示意图;
图3为本说明书实施例中用户意图识别模型的结构示意图;
图4为本说明书实施例中用户意图识别方法的流程示意图;
图5为本说明书实施例中用户意图识别方法的流程示意图;
图6为本说明书实施例中模型训练装置的结构示意图;
图7为本说明书实施例中用户意图识别装置的结构示意图;
图8为本说明书实施例中用户意图识别装置的结构示意图;
图9为本说明书实施例中计算机设备的结构示意图。
具体实施方式
下面将结合本说明书实施例中的附图,对本说明书实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本说明书一部分实施例,而不是全部的实施例。基于本说明书中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本说明书保护的范围。
本说明书实施例提供一种数据处理系统。所述数据处理系统可以包括终端设备和服务器。所述终端设备可以为面向用户的设备。所述终端设备可以为智能手机、平板电子设备、便携式计算机、个人数字助理、车载设备、个人计算机、或者智能穿戴设备等。所述服务器可以为面向后台的服务器。所述服务器可以为一个服务器,或者,还可以为包括多个服务器的服务器集群。所述服务器可以基于HTTP、TCP/IP或FTP等协议与终端设备进行数据交互。
本说明书实施例提供一种模型训练方法。所述模型训练方法可以应用于所述服务器。当然,所述模型训练方法也可以应用于除所述服务器以外的其它计算机设备。
请参阅图1和图2,所述模型训练方法可以包括以下步骤。
步骤S21:获取多种业务场景下的语料数据。
在一些实施例中,所述语料数据可以包括文本数据。所述语料数据可以包括多种语种的语料数据,例如,中文语料数据、英文语料数据等。所述语料数据可以为字符、单词、词组、句子、或者多个句子构成的段落等。所述业务场景包括金融领域的业务场景,所述语料数据包括金融领域的语料数据。例如,所述语料数据可以包括“查询信用卡办卡进度”、“你好,明细查询只能查询近六个月的吗”、“贷款进度查询”、“查询余额”等。所述业务场景可以包括“信用卡办卡进度查询”、“余额查询”、“宽限期查询”等。当然,所述业务场景还可以包括其它领域的业务场景,所述语料数据还可以包括其它领域的语料数据。
在一些实施例中,所述语料数据包括以下至少之一:银行用户的高频语句或词汇、机器学习模型生成语料数据、开发人员自行编写的语料数据。所述机器学习模型可以包括语言模型(Language Model)、生成式对抗网络(Generative Adversarial Networks,GAN)等。具体的,可以采用以下一种或多种方式的结合来获取语料数据:采集银行用户的高频语句或词汇作为语料数据、利用机器学习模型生成语料数据、接收开发人员输入的自行编写的语料数据。
步骤S23:根据业务场景实现的功能,为语料数据设置用户意图标签。
在一些实施例中,所述意图标签可以用于表示语料数据的用户意图。所述用户意图可以指用户想要表达的意愿或者想要达到的目的。例如,所述意图标签可以包括credit、remit等。意图标签credit用于表示查询信用卡的办卡进度,意图标签remit用于表示查询转账的款项。
在一些实施例中,不同的业务场景可以实现不同的功能。业务场景实现的功能可以包括在业务场景下向用户提供的服务。由于表达方式的不同,每种业务场景下可以具有多个语料数据,所述多个语料数据表达相同的用户意图,以期望提供相同的服务。为此,针对每种业务场景下的语料数据,可以根据该业务场景实现的功能,为语料数据设置用户意图标签。这样,相同业务场景下的语料数据可以具有相同的用户意图标签,不同业务场景下的语料数据可以具有不同的用户意图标签。例如,业务场景“查询信用卡办卡进度”下语料数据的用户意图标签可以为credit。值得说明的是,每种业务场景下可以具有用于提供服务的页面数据。每种业务场景可以对应有用户意图标签。这样,每个用户意图标签可以对应有页面数据。
在一些实施例中,标注人员可以根据业务场景实现的功能,为语料数据设置用户意图标签。可以接收标注人员为语料数据设置的用户意图标签。或者,还可以将语料数据输入至机器学习模型,使机器学习模型根据业务场景实现的功能,为语料数据设置用户意图标签。
在一些实施例中,可以对每种业务场景下的语料数据进行预处理;可以为预处理后的语料数据设置用户意图标签。所述预处理可以包括:去除没有表达实际意义的语料数据、去除重复的语料数据、对语料数据中的停用词进行删除。所述没有表达实际意义的语料数据可以包括“我要转3账”、“我1转账”等。所述停用词可以包括不再使用的词语。
步骤S25:根据语料数据和用户意图标签,对用户意图识别模型进行训练。
在一些实施例中,所述意图识别模型可以用于识别用户意图。所述意图识别模型可以包括神经网络模型、逻辑回归模型等。请参阅图3,所述意图识别模型可以包括输入层、隐藏层和输出层。所述输入层可以用于根据输入生成向量表示。所述向量表示可以用于表示输入的语义。所述隐藏层可以用于对向量表示进行处理。例如,所述输入可以包括语料数据,所述语料数据可以包括句子,所述输入层用于生成句子中各个词语的向量表示,所述隐藏层用于对各个词语的向量表示求取平均值。所述输出层可以用于根据处理后的向量表示生成输出。
在一些实施例中,可以根据语料数据和用户意图标签,通过多次迭代,对用户意图识别模型进行训练。可以采用梯度下降法对用户意图识别模型进行训练。例如,梯度下降法的部分伪代码可以如下所示:
所述意图识别模型包括输入层、隐藏层和输出层。在采用梯度下降法对用户意图识别模型进行训练的过程中,所述隐藏层的功能是对句子中各个词语的向量表示求取平均值,再通过之后的损失函数,实现随机梯度下降。相关的计算公式如下:
输出参数,w输出+=hidden×(label-sigmoid(w输出i×hidden)×lr;
隐藏梯度,grad+=w输出i×(label-sigmoid(w输出i×hidden)×lr。
所述输出层可以有softmax、层次softmax和负采样等三种优化方式。其中,负采样是通过哈夫曼树构造算法,相关计算公式如下:
当然,还可以采用其它方式(例如,牛顿法)对用户意图识别模型进行训练。
在一些实施例中,所述用户意图识别模型可以包括一个或多个超参数。所述超参数是模型在开始学习过程之前设置的参数,而不是在训练过程中学习到的参数。所述超参数可以包括学习率(Learning Rate)、词向量维度、N元语法、桶数量、训练次数、损失函数、并行的线程数等。其中,所述学习率可以用于控制模型的学习的速度。所述学习率可以使模型经过输入最佳地匹配输出。N元语法可以指语料数据中连续出现的N个语词。例如,如果一句话中有m个字。当设置该参数为n时,则可以认为这句话共有从第一个字到第(m-n+1)个字、从第二个字到(m-n+2)个字直到从第(m-n+1)个字到第m个字,共(m-n+1)个词语。
这样,可以根据语料数据的特征,设置用户意图识别模型的超参数;可以根据语料数据和用户意图标签,对设置了超参数后的用户意图识别模型进行训练。例如,可以根据语料数据的字数(例如各业务场景下语料数据的平均字数或者最大字数等),设置N元语法中N的取值。另举一例,可以根据各业务场景下语料数据的数量,设置学习率、并行的线程数等。
本说明书实施例的模型训练方法,可以获取多种业务场景下的语料数据;可以根据业务场景实现的功能,为语料数据设置用户意图标签;可以根据语料数据和用户意图标签,对用户意图识别模型进行训练。从而为利用用户意图识别模型识别用户意图提供了基础。
请参阅图1和图4。本说明书实施例提供一种用户意图识别方法。所述用户意图识别方法可以应用于所述服务器。所述用户意图识别方法可以包括以下步骤。
步骤S41:接收终端设备发来的待识别数据。
在一些实施例中,所述待识别数据可以为金融领域的待识别数据。所述待识别数据可以包括文本数据。例如,所述待识别数据可以为单词、词组、或者句子等。所述终端设备可以获取待识别数据;可以向服务器发送所述待识别数据。所述服务器可以接收待识别数据。
所述终端设备可以接收用户(例如银行用户)输入的待识别数据。例如,所述待识别数据可以包括文本数据。用户可以在终端设备输入文本数据。所述终端设备可以接收用户输入的文本数据。或者,用户可以在终端设备输入语音数据。所述终端设备可以接收用户输入的语音数据,可以将所述语音数据转换为文本数据。或者,用户可以在终端设备输入图像数据。所述终端设备可以接收用户输入的图像数据,可以将所述图像数据转换为文本数据。当然,所述终端设备还可以读取在本地存储的待识别数据。
步骤S43:将待识别数据输入至用户意图识别模型,得到至少一个用户意图。
在一些实施例中,所述用户意图识别模型可以采用图2对应的模型训练方法训练得到。
在一些实施例中,所述服务器可以将待识别数据输入至用户意图识别模型,得到至少一个用户意图。具体的,所述服务器可以将待识别数据输入至用户意图识别模型,得到所述用户意图识别模型输出的一个或多个用户意图。或者,所述服务器可以将待识别数据输入至用户意图识别模型,得到所述用户意图识别模型输出的一个或多个用户意图标签;可以获取所述一个或多个用户意图标签对应的用户意图。例如,所述服务器可以将待识别数据“信用卡”输入至用户意图识别模型,得到所述用户意图识别模型输出的“credit”、“remit”、“unsupport”等3个用户意图标签;可以获取用户意图标签“credit”对应的用户意图“查询信用卡的办卡进度”;可以获取用户意图标签“remit”对应的用户意图“查询转账的款项”;可以获取用户意图标签“unsupport”对应的用户意图“不支持”。
步骤S45:向终端设备反馈至少一个用户意图。
在一些实施例中,所述服务器可以向终端设备反馈所述至少一个用户意图。所述终端设备可以接收所述至少一个用户意图;可以显示所述至少一个用户意图。
值得说明的是,所述服务器可以将待识别数据输入至用户意图识别模型,得到用户意图识别模型输出的一个或多个用户意图;可以向终端设备反馈用户意图识别模型输出的全部用户意图。当然,所述用户意图识别模型还可以输出所述一个或多个用户意图中每个用户意图对应的可信度评分。这样,所述服务器可以从用户意图识别模型输出的一个或多个用户意图中选择可信度评分较高的部分用户意图;可以向终端设备反馈选择的用户意图。
所述服务器可以将待识别数据输入至用户意图识别模型,得到所述用户意图识别模型输出的一个或多个用户意图标签;可以获取全部用户意图标签对应的用户意图;可以向终端设备反馈获取的用户意图。当然,所述用户意图识别模型还可以输出所述一个或多个用户意图标签中每个用户意图标签对应的可信度评分。这样,所述服务器可以从用户意图识别模型输出的一个或多个用户意图标签中选择可信度评分较高的部分用户意图标签;可以获取选择的用户意图标签对应的用户意图;可以向终端设备反馈获取的用户意图。
在一些实施例中,用户可以在终端设备显示的至少一个用户意图中进行选择。所述终端设备可以获取用户选择的目标用户意图;可以向所述服务器发送所述目标用户意图。所述服务器可以接收所述目标用户意图;可以获取与所述目标用户意图相匹配的页面数据;可以向所述终端设备反馈页面数据。所述终端设备可以接收所述页面数据;可以根据所述页面数据显示页面。所述页面可以用于向用户提供与所述目标用户意图相匹配的服务。
所述至少一个用户意图的数量可以为一个。用户在终端设备显示的至少一个用户意图中进行选择,可以理解为:用户将终端设备显示的一个用户意图确定为目标用户意图。所述至少一个用户意图的数量还可以为多个。用户在终端设备显示的至少一个用户意图中进行选择,可以理解为:用户从终端设备显示的多个用户意图中选择一个用户意图作为目标用户意图。
每种业务场景下可以具有用于提供服务的页面数据。每种业务场景可以对应有用户意图标签。所述用户意图标签可以用于表示用户意图。如此,所述服务器可以获取所述目标用户意图对应的业务场景;可以获取所述业务场景下的页面数据。
本说明书实施例的用户意图识别方法,可以利用用户意图识别模型识别用户意图,提高了用户意图识别的效率和准确程度。
请参阅图1和图5。本说明书实施例提供一种用户意图识别方法。所述用户意图识别方法可以应用于所述终端设备。所述用户意图识别方法可以包括以下步骤。
步骤S51:获取待识别数据。
在一些实施例中,所述待识别数据可以包括金融领域的待识别数据。所述待识别数据可以包括文本数据。例如,所述待识别数据可以为单词、词组、或者句子等。具体的,所述终端设备可以接收用户输入的待识别数据。例如,所述待识别数据可以包括文本数据。用户可以在终端设备输入文本数据。所述终端设备可以接收用户输入的文本数据。或者,用户可以在终端设备输入语音数据。所述终端设备可以接收用户输入的语音数据,可以将所述语音数据转换为文本数据。或者,用户可以在终端设备输入图像数据。所述终端设备可以接收用户输入的图像数据,可以将所述图像数据转换为文本数据。当然,所述终端设备还可以读取在本地存储的待识别数据。
步骤S53:向服务器发送待识别数据,以便服务器将所述待识别数据输入至用户意图识别模型,得到至少一个用户意图。
在一些实施例中,所述终端设备可以向服务器发送所述待识别数据。所述服务器可以接收所述待识别数据;可以将待识别数据输入至用户意图识别模型,得到至少一个用户意图;可以向终端设备反馈所述至少一个用户意图。具体过程可以参见图4对应的实施例。
步骤S55:接收服务器反馈的至少一个用户意图。
步骤S57:显示所述至少一个用户意图。
在一些实施例中,所述终端设备可以接收所述至少一个用户意图;可以显示所述至少一个用户意图,以供用户选择。
在一些实施例中,用户可以在终端设备显示的至少一个用户意图中进行选择。所述终端设备可以获取用户选择的目标用户意图;可以向所述服务器发送所述目标用户意图。所述服务器可以接收所述目标用户意图;可以获取与所述目标用户意图相匹配的页面数据;可以向所述终端设备反馈页面数据。所述终端设备可以接收所述页面数据;可以根据所述页面数据显示页面。所述页面可以用于向用户提供与所述目标用户意图相匹配的服务。
本说明书实施例的用户意图识别方法,可以利用用户意图识别模型识别用户意图,提高了用户意图识别的效率和准确程度。
本说明书实施例还提供一种模型训练装置。
请参阅图6,所述模型训练装置可以应用于服务器,可以包括以下单元。
获取单元61,用于获取多种业务场景下的语料数据;
设置单元63,用于根据业务场景实现的功能,为语料数据设置用户意图标签;
训练单元65,用于根据语料数据和用户意图标签,对用户意图识别模型进行训练。
本说明书实施例还提供一种用户意图识别装置。
请参阅图7,所述用户意图识别装置可以应用于服务器,可以包括以下单元。
接收单元71,用于接收终端设备发来的待识别数据;
输入单元73,用于将待识别数据输入至用户意图识别模型,得到至少一个用户意图;
反馈单元75,用于向终端设备反馈至少一个用户意图。
本说明书实施例还提供一种用户意图识别装置。
请参阅图8,所述用户意图识别装置可以应用于终端设备,可以包括以下单元。
获取单元81,用于获取待识别数据;
发送单元83,用于向服务器发送待识别数据,以便服务器将所述待识别数据输入至用户意图识别模型,得到至少一个用户意图;
接收单元85,用于接收服务器反馈的至少一个用户意图;
显示单元87,用于显示所述至少一个用户意图。
请参阅图9,本说明书实施例还提供一种计算机设备。
所述计算机设备可以包括存储器和处理器。
在本实施例中,所述存储器包括但不限于动态随机存取存储器(Dynamic RandomAccess Memory,DRAM)和静态随机存取存储器(Static Random Access Memory,SRAM)等。所述存储器可以用于存储计算机指令。
在本实施例中,所述处理器可以按任何适当的方式实现。例如,所述处理器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application SpecificIntegrated Circuit,ASIC)、可编程逻辑控制器和嵌入微控制器的形式等等。所述处理器可以用于执行所述计算机指令以实现图2、图4或者图5所对应的实施例。
需要说明的是,本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同或相似的部分互相参见即可,每个实施例重点说明的都是与其它实施例的不同之处。尤其,对于装置实施例和计算机设备实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。另外,可以理解的是,本领域技术人员在阅读本说明书文件之后,可以无需创造性劳动想到将本说明书列举的部分或全部实施例进行任意组合,这些组合也在本说明书公开和保护的范围内。
在20世纪90年代,对于一个技术的改进可以很明显地区分是硬件上的改进(例如,对二极管、晶体管、开关等电路结构的改进)还是软件上的改进(对于方法流程的改进)。然而,随着技术的发展,当今的很多方法流程的改进已经可以视为硬件电路结构的直接改进。设计人员几乎都通过将改进的方法流程编程到硬件电路中来得到相应的硬件电路结构。因此,不能说一个方法流程的改进就不能用硬件实体模块来实现。例如,可编程逻辑器件(Programmable Logic Device,PLD)(例如现场可编程门阵列(Field Programmable GateArray,FPGA))就是这样一种集成电路,其逻辑功能由用户对器件编程来确定。由设计人员自行编程来把一个数字系统“集成”在一片PLD上,而不需要请芯片制造厂商来设计和制作专用的集成电路芯片。而且,如今,取代手工地制作集成电路芯片,这种编程也多半改用“逻辑编译器(logic compiler)”软件来实现,它与程序开发撰写时所用的软件编译器相类似,而要编译之前的原始代码也得用特定的编程语言来撰写,此称之为硬件描述语言(Hardware Description Language,HDL),而HDL也并非仅有一种,而是有许多种,如ABEL(Advanced Boolean Expression Language)、AHDL(Altera Hardware DescriptionLanguage)、Confluence、CUPL(Cornell University Programming Language)、HDCal、JHDL(Java Hardware Description Language)、Lava、Lola、MyHDL、PALASM、RHDL(RubyHardware Description Language)等,目前最普遍使用的是VHDL(Very-High-SpeedIntegrated Circuit Hardware Description Language)与Verilog。本领域技术人员也应该清楚,只需要将方法流程用上述几种硬件描述语言稍作逻辑编程并编程到集成电路中,就可以很容易得到实现该逻辑方法流程的硬件电路。
上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的,计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。
通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到本说明书可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本说明书的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本说明书各个实施例或者实施例的某些部分所述的方法。
本说明书可用于众多通用或专用的计算机系统环境或配置中。例如:个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器系统、基于微处理器的系统、置顶盒、可编程的消费电子设备、网络PC、小型计算机、大型计算机、包括以上任何系统或设备的分布式计算环境等等。
本说明书可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本说明书,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
虽然通过实施例描绘了本说明书,本领域普通技术人员知道,本说明书有许多变形和变化而不脱离本说明书的精神,希望所附的权利要求包括这些变形和变化而不脱离本说明书的精神。
Claims (11)
1.一种模型训练方法,包括:
获取多种业务场景下的语料数据;
根据业务场景实现的功能,为语料数据设置用户意图标签;
根据语料数据和用户意图标签,对用户意图识别模型进行训练。
2.如权利要求1所述的方法,在对用户意图识别模型进行训练之前,还包括:
根据语料数据的特征,设置用户意图识别模型的超参数;
所述对用户意图识别模型进行训练,包括:
根据语料数据和用户意图标签,对设置了超参数后的用户意图识别模型进行训练。
3.一种用户意图识别方法,包括:
接收终端设备发来的待识别数据;
将待识别数据输入至用户意图识别模型,得到至少一个用户意图;
向终端设备反馈至少一个用户意图。
4.如权利要求3所述的方法,还包括:
接收终端设备发来的目标用户意图,所述目标用户意图从至少一个用户意图选择得到;
获取与目标用户意图相匹配的页面数据;
向终端设备反馈页面数据,以便终端设备根据所述页面数据显示页面。
5.如权利要求4所述的方法,所述获取与目标用户意图相匹配的页面数据,包括:
获取目标用户意图对应的业务场景;
获取所述业务场景下的页面数据。
6.一种用户意图识别方法,包括:
获取待识别数据;
向服务器发送待识别数据,以便服务器将所述待识别数据输入至用户意图识别模型,得到至少一个用户意图;
接收服务器反馈的至少一个用户意图;
显示所述至少一个用户意图。
7.如权利要求6所述的方法,还包括:
获取用户从至少一个用户意图中选择的目标用户意图;
向服务器发送目标用户意图,以便服务器获取与目标用户意图相匹配的页面数据;
接收服务器反馈的页面数据;
根据页面数据显示页面。
8.一种模型训练装置,包括:
获取单元,用于获取多种业务场景下的语料数据;
设置单元,用于根据业务场景实现的功能,为语料数据设置用户意图标签;
训练单元,用于根据语料数据和用户意图标签,对用户意图识别模型进行训练。
9.一种用户意图识别装置,包括:
接收单元,用于接收终端设备发来的待识别数据;
输入单元,用于将待识别数据输入至用户意图识别模型,得到至少一个用户意图;
反馈单元,用于向终端设备反馈至少一个用户意图。
10.一种用户意图识别装置,包括:
获取单元,用于获取待识别数据;
发送单元,用于向服务器发送待识别数据,以便服务器将所述待识别数据输入至用户意图识别模型,得到至少一个用户意图;
接收单元,用于接收服务器反馈的至少一个用户意图;
显示单元,用于显示所述至少一个用户意图。
11.一种计算机设备,包括:
存储器、处理器及存储在存储器上的计算机程序,所述处理器执行所述计算机程序以实现权利要求1-7中任一项方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111046825.3A CN113723099A (zh) | 2021-09-07 | 2021-09-07 | 模型训练方法、用户意图识别方法、装置和计算机设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111046825.3A CN113723099A (zh) | 2021-09-07 | 2021-09-07 | 模型训练方法、用户意图识别方法、装置和计算机设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113723099A true CN113723099A (zh) | 2021-11-30 |
Family
ID=78682485
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111046825.3A Pending CN113723099A (zh) | 2021-09-07 | 2021-09-07 | 模型训练方法、用户意图识别方法、装置和计算机设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113723099A (zh) |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109508376A (zh) * | 2018-11-23 | 2019-03-22 | 四川长虹电器股份有限公司 | 可在线纠错更新的意图识别方法及装置 |
CN110399465A (zh) * | 2019-07-30 | 2019-11-01 | 北京百度网讯科技有限公司 | 用于处理信息的方法和装置 |
CN112036550A (zh) * | 2020-09-04 | 2020-12-04 | 平安科技(深圳)有限公司 | 基于人工智能的客户意图识别方法、装置、计算机设备 |
-
2021
- 2021-09-07 CN CN202111046825.3A patent/CN113723099A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN109508376A (zh) * | 2018-11-23 | 2019-03-22 | 四川长虹电器股份有限公司 | 可在线纠错更新的意图识别方法及装置 |
CN110399465A (zh) * | 2019-07-30 | 2019-11-01 | 北京百度网讯科技有限公司 | 用于处理信息的方法和装置 |
CN112036550A (zh) * | 2020-09-04 | 2020-12-04 | 平安科技(深圳)有限公司 | 基于人工智能的客户意图识别方法、装置、计算机设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
RU2678716C1 (ru) | Использование автоэнкодеров для обучения классификаторов текстов на естественном языке | |
WO2020232861A1 (zh) | 命名实体识别方法、电子装置及存储介质 | |
US8972408B1 (en) | Methods, systems, and articles of manufacture for addressing popular topics in a social sphere | |
JP5604435B2 (ja) | 翻字のための機械学習 | |
EP3926531A1 (en) | Method and system for visio-linguistic understanding using contextual language model reasoners | |
CN112330455B (zh) | 用于推送信息的方法、装置、设备以及存储介质 | |
CN110580335A (zh) | 用户意图的确定方法及装置 | |
WO2019217096A1 (en) | System and method for automatically responding to user requests | |
CN111459977B (zh) | 自然语言查询的转换 | |
CN104899322A (zh) | 搜索引擎及其实现方法 | |
US11238050B2 (en) | Method and apparatus for determining response for user input data, and medium | |
US11651015B2 (en) | Method and apparatus for presenting information | |
CN111930623B (zh) | 一种测试案例构建方法、装置及电子设备 | |
CN111783471B (zh) | 自然语言的语义识别方法、装置、设备及存储介质 | |
WO2020147409A1 (zh) | 一种文本分类方法、装置、计算机设备及存储介质 | |
CN112749300B (zh) | 用于视频分类的方法、装置、设备、存储介质和程序产品 | |
CN110678882A (zh) | 使用机器学习从电子文档选择回答跨距 | |
JP2022145623A (ja) | ヒント情報を提示する方法及び装置並びにコンピュータプログラム | |
US20220165257A1 (en) | Neural sentence generator for virtual assistants | |
CN112464927B (zh) | 一种信息提取方法、装置及系统 | |
CN112528653B (zh) | 短文本实体识别方法和系统 | |
CN112579733A (zh) | 规则匹配方法、规则匹配装置、存储介质及电子设备 | |
CN114995903B (zh) | 一种基于预训练语言模型的类别标签识别方法及装置 | |
CN113761923A (zh) | 命名实体识别方法、装置、电子设备及存储介质 | |
CN114218945A (zh) | 实体识别方法、装置、服务器及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |