CN113127602B - 一种意图识别方法及装置 - Google Patents
一种意图识别方法及装置 Download PDFInfo
- Publication number
- CN113127602B CN113127602B CN202110482962.5A CN202110482962A CN113127602B CN 113127602 B CN113127602 B CN 113127602B CN 202110482962 A CN202110482962 A CN 202110482962A CN 113127602 B CN113127602 B CN 113127602B
- Authority
- CN
- China
- Prior art keywords
- category
- sentence
- sub
- intention
- confidence value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 46
- 238000010586 diagram Methods 0.000 description 10
- HVCNNTAUBZIYCG-UHFFFAOYSA-N ethyl 2-[4-[(6-chloro-1,3-benzothiazol-2-yl)oxy]phenoxy]propanoate Chemical compound C1=CC(OC(C)C(=O)OCC)=CC=C1OC1=NC2=CC=C(Cl)C=C2S1 HVCNNTAUBZIYCG-UHFFFAOYSA-N 0.000 description 9
- 238000000605 extraction Methods 0.000 description 9
- 239000000284 extract Substances 0.000 description 8
- 238000006243 chemical reaction Methods 0.000 description 7
- 238000006073 displacement reaction Methods 0.000 description 6
- 230000008859 change Effects 0.000 description 5
- 230000006870 function Effects 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 238000004590 computer program Methods 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 230000001960 triggered effect Effects 0.000 description 2
- 241001492658 Cyanea koolauensis Species 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000004321 preservation Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 238000012216 screening Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3344—Query execution using natural language analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/332—Query formulation
- G06F16/3329—Natural language query formulation or dialogue systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/35—Clustering; Classification
- G06F16/353—Clustering; Classification into predefined classes
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- Mathematical Physics (AREA)
- Computational Linguistics (AREA)
- Human Computer Interaction (AREA)
- Machine Translation (AREA)
Abstract
本申请提供了一种意图识别方法及装置,该方法包括:使用预设模型对同一句子预测M次;将每次预测获得的意图类别信心值Pi和无意图类别的信心值TH比较,保留Pi>TH的意图类别;将所述保留的意图类别信心值进行调分,获得信心分数。本申请上述实施例提供的技术方案,可以解决无法精准识别长句子中所包含的多个意图的问题。
Description
技术领域
本申请涉及人工智能领域,特别涉及一种意图识别方法及装置。
背景技术
在人机对话的过程中,输入至机器的句子往往会包含长句子,而长句子往往会包含多个意图。因此,长句子容易造成机器学习模型不能判断出句子中所有的意图,最终导致句子经过机器学习模型预测所输出的意图类别不完整。在这种情况下,机器无法精准识别出长句子中的意图,进而无法根据句子中的意图进行相应的对话,即使可以对话,但出现错误的可能性也极大。
发明内容
有鉴于此,本申请实施例提供了一种意图识别方法,可以解决无法精准识别长句子中所包含的多个意图的问题。
本申请实施例提供的了一种意图识别方法,包括:使用预设模型对同一句子预测M次;将每次预测获得的意图类别信心值Pi和无意图类别的信心值TH比较,保留Pi>TH的意图类别;将所述保留的意图类别信心值进行调分,获得信心分数。
在一个实施例中,所述使用预设模型对同一句子预测M次之前,包括:将用户输入的语料和无意图语料一同训练,获得所述预设模型;其中,所述无意图语料为在用户人机对话的历史日志中随机抽取的无意图的句子;所述预设模型的输出为意图类别和无意图类别的信心值,所述信心值为意图类别和无意图类别的机率分布。
在一个实施例中,所述预设模型每次预测获得的Pi与TH之和为1。
在一个实施例中,所述使用预设模型对同一句子预测M次,包括:抽取所述句子中长度为N的子字串,共抽取M次;使用所述预设模型分别对所述子字串进行预测。
在一个实施例中,所述抽取所述句子中长度为N的子字串,共抽取M次,包括:抽取所述句子中第一个字到第N个字作为第一子字串;位移W个字,抽取所述句子中第W个字到第N+W个字作为第二子字串,重复该步骤直至子字串的长度小于等于N,该子字串为第M子字串。
在一个实施例中,所述将所述保留的意图类别信心值进行调分,获得信心分数,包括:将所述保留的意图类别的信心值转化成与平均信心值的倍数差距Qi;对Qi进行调分,获得信心分数F(Qi)。
在一个实施例中,所述Qi=(Pi-1/Ki)*Ki,其中,Ki为每次预测获得的意图类别和无意图类别的类别总数。
在一个实施例中,所述F(Qi)=1/(1+e-Qi/2),其中,e为自然常数。
在一个实施例中,所述将所述保留的意图类别信心值进行调分,获得信心分数之后,包括:当所述保留的意图类别中存在相同意图类别时,保留信心分数高的意图类别。
本申请实施例提供了一种意图识别装置,包括:预测模块,用于使用预设模型对同一句子预测M次;比较模块,用于将每次预测获得的意图类别信心值Pi和无意图类别的信心值TH比较,保留Pi>TH的意图类别;调分模块,用于将所述保留的意图类别信心值进行调分,获得信心分数。
本申请上述实施例提供的技术方案,通过使用适当的预设模型对长句子进行多次预测,剔除信心值低于无意图类别的意图,保留下的意图类别可以完整体现出长句子所包含的意图。同时,通过对保留下来的意图类别信心值进行调分,经过调分后的信心值能够适当反映出各意图类别信心值的差异,有利于人机对话系统中机器能更精准的出话,提高机器的智能程度。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例中所需要使用的附图作简单地介绍。显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。通过附图所示,本申请的上述及其它目的、特征和优势将更加清晰。在全部附图中相同的附图标记指示相同的部分。并未刻意按实际尺寸等比例缩放绘制附图,重点在于示出本申请的主旨。
图1为本申请实施例提供的模型训练方法的流程示意图;
图2为本申请另一实施例提供的模型训练方法的流程示意图;
图3为本申请另一实施例提供的模型训练方法的流程示意图;
图4为本申请实施例提供的模型训练装置的框图。
图5为本申请实施例提供的电子设备的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行描述。
相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
在人机对话的真实系统中,在用户和机器对话的过程里,用户输入长句子的可能性很大,用户会在一个句子中表达多个意图。如果按通常的方式,通过模型预测出长句子的意图,极有可能导致部分意图类别无法被预测到。
另外,人机对话的真实系统中一般会设定信心阈值,只有信心值达到信心阈值的意图才会作为模型预测的结果输出,这样那些不能体现用户真实意图的意图类别可被剔除。但是,由于长句子往往包含多个意图,就导致预测的信心值容易过低,并且各个意图的信心值直接差异很小,导致真实场景下无法确定合适的信心阈值。
基于上述情况,对于用户输入的长句子,由于无法准确的预测其中包含的意图,机器就无法给出精准的应答,整个人机对话系统智能程度较低。
为了解决上述问题,需要改变模型对句子预测的方式,并且对预测结果进行调分。本申请实施例提供了一种意图识别方法、装置、电子设备及计算机可读存储介质,以实现精准的获得用户在长句子中所表达的意图类别,同时为后续机器出话提供了更加适当的意图类别信心分数。该技术可采用相应的软件、硬件以及软硬结合的方式实现。以下对本申请实施例进行详细介绍。
请参阅图1,本申请实施例提供一种应用于电子设备的意图识别方法,该方法包括:
步骤S101:使用预设模型对同一句子预测M次。
在本申请实施例中,电子设备可以是机器人,用户与机器人的对话过程中,用户会向机器人输入大量的句子,句子中有长句子和短句子。当机器人收到用户输入的句子后,会识别句子中所包含的用户的意图,并根据这些意图及其信心值触发后续的机器人服务。当机器人收到用户的句子后,首先会确定句子的长度,当句子长度小于N时,此时表明收到句子是短句,机器人使用预设模型对收到的句子预测一次。当句子长度大于N时,此时表明收到的句子是长句子,机器人使用预设模型对收到的句子预测M次。通过多次预测同一个长句子,可以尽可能的将句子中的意图预测完整。
上述预测模型可以通过用户输入的语料和无意图语料一同训练得到,用户输入的语料可以是人工撰写或人工标注所得到的,这样可以保证用户输入的语料绝大部分都是有意图的,无意图语料可以从用户和机器人对话的历史日志中随机抽取的无意图的句子,用户输入的语料抽取的数量例如可以是无意图语料的2倍。训练得到的预测模型的输出可以是各个意图类别的信心值和无意图类别的出现机率分布,各个意图类别信心值可以是意图类别的出现机率,无意图类别信心值可以是无意图类别的出现机率。预测模型每进行一次预测所输出的所有信心值之和为1。
当机器人收到的句子长度大于N时,机器人将抽取句子中长度为N的子字串,共抽取M次,对于抽取得到的子字串均使用预设模型进行预测。对于抽取子字串的规则,可以是按照句子的前后顺序随机抽取长度为N的子字串,并且预设M的数值。抽取的规则也可以是按照一定的顺序进行抽取,例如,抽取句子中的第一个字到第N个字作为第一字串,然后位移W个字,抽取句子中第W个字到第N+W个字作为第二子字串。继续位移W个字,抽取句子中第2W个字到第N+2W个字作为第三子字串。不断重复位移和抽取,直至所要抽取的子字串的长度小于等于N时,停止位移和抽取,此时,该长度小于等于N的子字串就是第M个子字串。
在一个实施例中,上述每个子字串的长度N可以是预设模型所有训练语料长度的平均数取整后的数值,上述W可以是[N/2]([]表示取整)。
通过上述步骤,在预测一个长句子的意图时,可以选择预设一个适当的模型,模型需要多次对同一个长句子的子字串进行预测,并且子字串的确定可以采用一定的抽取规则,这样的方式可以使得一个长句子的完整意图均被预测出来。
步骤S102:将每次预测获得的意图类别信心值Pi和无意图类别的信心值TH比较,保留Pi>TH的意图类别。
在本申请实施例中,对于用户输入的大于N的长句子,会使用预测模型预测M次,每一次预测都会获得若干个意图类别和一个无意图类别,并且还能预测获得若干个意图类别所对应的信心值Pi,以及无意图类别所对应的信心值TH。将所有的Pi逐一与TH进行比较,当Pi≤TH时,将这些Pi所对应的意图类别剔除,只留下Pi>TH的意图类别。通过上述筛选,可以剔除与用户输入的长句子不相关的意图类别,使得预测的结果更加准确。
步骤S103:将所述保留的意图类别信心值进行调分,获得信心分数。
在本申请实施例中,机器人可以将保留下来的意图类别信心值分别转化成Qi,转化的具体公式为Qi=(Pi-1/Ki)*Ki。其中,Ki是每次预测获得的意图类别的数量和无意图别类的数量之和。通过上述转化,信心值就调整成了与平均信心值的倍数差距,这能够适当的反应出各个意图类别的信心值之间的差异。在一个实施例中,机器人还可以对Qi进行调分,具体的调分公式为F(Qi)=1/(1+e-Qi/2),其中,e为自然常数。经过调分之后,所获得的F(Qi)就是信心分数。经过转化和调分之后,各个意图的信心值转变成了信心分数,信心分数相较于信心值会变大,并且信心分数能够适当的反应出各类意图之间的差异。在人机对话的真实系统中,可以较容易的设置信心阈值,通过信心阈值剔除那些不能体现用户真实意图的意图类别。这样机器可以进一步精准的获得用户在长句子中所表达的意图,并根据这些意图及其信心分数触发后续服务,机器人的智能程度将提高,人机对话系统的用户体验就可大幅提升。
当然,上述保留下来的意图类别中仍有可能存在相同的情况,在此情况下,机器人会将信心分数高的意图类别保留下来。同时,还可以将信心分数转化为百分制。经过上述一系列的预测、比较和调分,机器人就可以获得用户输入的长句子中包含的所有意图和这些意图的信心分数,而这些意图和信心分数也会作为机器人提供后续服务的依据。
通过上述步骤101-103,可以使用适当的模型对长句子进行多次预测,将预测获得的信心值大于无意图类别信心值的意图类别保留,并且将保留下来的意图类别信心分数进行调分,最终获得数值较大并且各个意图类别间差异较大的信心分数。这样,针对于人机对话过程中用户输入的长句子可以很好的识别出长句子中包含的意图。同时,在真实的人机对话系统中,可以容易的设置信心阈值,不会因为信心阈值而导致错误的剔除或保留长句子中所包含的意图。最终,机器人对用户输入的长句子中的意图可以进行精准的识别,机器人出话效果好,智能程度高,用户体验佳。
请参阅图2,本申请实施例提供一种应用于电子设备的意图识别方法,该方法具体包括:
步骤S201:使用用户输入的语料和无意图语料进行训练,获得预设模型。
在本申请实施例中,用户和机器人对话的历史日志中包含如下:
机器人在历史日志中随机抽取用户输入的语料,具体如下:
意图 | 句子 |
订机票 | 帮我订上海到北京的机票一张 |
查机票 | 查一下明天下午深圳到上海的机票,要商务舱 |
说笑话 | 说个笑话来听 |
查天气 | 明天天气如何 |
查时间 | 现在几点几分 |
机器人在历史日志中随机抽取无意图的句子,具体如下:
意图 | 句子 |
无意图 | 你好呀 |
无意图 | 哈哈你真逗 |
将上述抽取出的语料一起进行训练,获得预设模型。
步骤S202:接收用户输入的句子″我想知道现在几点还有明天会下雨吗″。
在本申请实施例中,机器人首先计算用来获得预设模型语料(包括有意图的和无意图的)的平均长度(13+20+6+6+6+3+5)/7,取整后为8。然后,统计用户输入的句子的长度,具体为16个字。用户输入的句子长度比用来获得预设模型语料的平均长度要长,因此,确认此时用户输入的句子为长句。
步骤S203:抽取用户输入的句子中的子字串,使用预设模型对子字串进行预测。
在本申请实施例中,机器人会按规则抽取用户输入的句子,形成子字串。抽取规则为:抽取的子字串的长度为用来获得预设模型语料的平均长度,位移的长度为子字串长度的一半。具体为:抽取句子中的第1个字到第8个字作为第一字串,然后位移4个字,抽取句子中第4个字到第12个字作为第二子字串。继续位移4个字,抽取句子中第8个字到第16个字作为第三子字串。获得的三个子字串如下:
第一子字串:我想知道现在几点
第二子字串:现在几点还有明天
第三子字串:还有明天会下雨吗
在获得了子字串后,预设模型将分别对三个子字串进行预测,共计预测3次,具体可以获得如下的出现机率分布,每个出现机率也即信心值:
第一子字串:查时间0.5、无意图0.3、订机票0.05、查机票0.05、说笑话0.05、查天气0.05
第二子字串:查时间0.3、无意图0.3、订机票0.1、查机票0.1、说笑话0.1、查天气0.1
第三子字串:查天气0.4、无意图0.35、订机票0.05、查机票0.05、说笑话0.05、查时间0.1
步骤S204:将每个子字串中信心值大于无意图类别信心值的意图类别保留。
在本申请实施例中,针对步骤S203中的预测结果,机器人将会对比每个子字串中意图类别信心值与无意图类别信心值的大小,对于那些信心值小于或等于无意图类别信心值的意图类别做剔除处理。经过处理后,每个子字串保留下如下意图类别及其信心值:
第一子字串:查时间0.5
第二子字串:(无)
第三子字串:查天气0.4
步骤S205:将保留的意图类别信心值进行转化和调分,获得信心分数。
在本申请实施例中,机器人在经过预测和比较后,会对保留下来的意图类别信心值进行转化,转化为与平均信心值的倍数差距Qi,转化的公式为:Qi=(Pi-1/Ki)*Ki,其中,Ki是每次预测获得的意图类别的数量和无意图别类的数量之和,在本实施例中,每个子字串的Ki均为6。
信心值转为与平均分数的倍数差距的具体情况如下:
第一子字串:查时间0.5,变为Q1=(0.5-1/6)*6=2.0
第三子字串:查天气0.4,变为Q3=(0.4-1/6)*6=1.4
信心值转化后的Qi还需要进行调分,获得信心分数F(Qi),调分的公式为F(Qi)=1/(1+e-Qi/2),具体情况如下:
第一子字串:查时间Q1=2.0,F(Q1)=F(2.0)=0.7310
第三子字串:查天气Q3=1.4,F(Q3)=F(1.4)=0.6681
最后,将保留下来的意图类别的信心分数转为100分制,则可以看到对于用户输入的句子″我想知道现在几点还有明天会下雨吗″,机器人可以预测出:查天气73.1分、查天气66.8分。
通过这种对同一个句子进行多次预测并进行调分方法,在人机对话中,机器可以识别出长句子中用户所要表达的完整的意图,同时,机器还会对所识别出的意图进行调分后,这对于后续机器人出话有很大帮助,可提高整个人机对话系统的智能程度。
请参阅图3,本申请实施例提供一种应用于电子设备的意图识别方法,该方法具体包括:
步骤S301:使用用户输入的语料和无意图语料进行训练,获得预设模型。
在本申请实施例中,用户和机器人对话的历史日志中包含如下:
机器人在历史日志中随机抽取用户输入的语料,具体如下:
意图 | 句子 |
订机票 | 帮我订上海到北京的机票一张 |
查机票 | 查一下明天下午深圳到上海的机票,要商务舱 |
说笑话 | 说个笑话来听 |
查天气 | 明天天气如何 |
查时间 | 现在几点几分 |
查时间 | 现在是纽约时间几点呀 |
机器人在历史日志中随机抽取无意图的句子,具体如下:
将上述抽取出的语料一起进行训练,获得预设模型。
步骤S302:接收用户输入的句子″我下个月放了长假帮我查上海到波士顿的机票,对了波士顿现在几点,我要打个电话给阿姨″。
在本申请实施例中,机器人首先计算用来获得预设模型语料(包括有意图的和无意图的)的平均长度(13+20+6+6+6+9+9+11+11)/9,取整后为10。然后,统计用户输入的句子的长度,具体为40个字。用户输入的句子长度比用来获得预设模型语料的平均长度要长,因此,确认此时用户输入的句子为长句。
步骤303:抽取用户输入的句子中的子字串,使用预设模型对子字串进行预测。
在本申请实施例中,机器人会按规则抽取用户输入的句子,形成子字串。抽取规则为:抽取的子字串的长度为用来获得预设模型语料的平均长度,位移的长度为子字串长度的一半。具体为:抽取句子中的第1个字到第10个字作为第一字串,然后位移5个字,抽取句子中第5个字到第15个字作为第二子字串。继续位移5个字,抽取句子中第10个字到第20个字作为第三子字串。不断重复位移和抽取,直至所要抽取的子字串的长度小于等于10时,停止位移和抽取,此时,该长度小于等于10的子字串就是最后一个子字串。获得的八个子字串如下:
第一子字串:我下个月放了长假帮我
第二子字串:了长假帮我查上海到波
第三子字串:查上海到波士顿的机票
第四子字串:士顿的机票,对了波士
第五子字串:,对了波士顿现在几点
第六子字串:顿现在几点,我要打个
第七子字串:,我要打个电话给阿姨
第八子字串:电话给阿姨
在获得了子字串后,预设模型将分别对八个子字串进行预测,共计预测8次,具体可以获得如下的出现机率分布,每个出现机率也即信心值:
第一子字串:无意图0.8、查时间0.04、订机票0.04、查机票0.04、说笑话0.04、查天气0.04
第二子字串:无意图0.45、查机票0.45、查时间0.03、订机票0.03、说笑话0.03、查天气0.01
第三子字串:查机票0.7、无意图0.15、订机票0.1、查天气0.02分、说笑话0.02、查时间0.01
第四子字串:查机票0.45、无意图0.35、订机票0.1、查天气0.04、说笑话0.03、查时间0.03
第五子字串:查时间0.8、无意图0.1、查天气0.03、订机票0.03、查机票0.03、说笑话0.01
第六子字串:查时间0.4、无意图0.3、订机票0.1、查机票0.1、查天气0.05、说笑话0.05
第七子字串:无意图0.45、查时间0.45、查机票0.03、订机票0.03、说笑话0.03、查天气0.01
第八子字串:无意图0.8、查时间0.04、订机票0.04、查机票0.04、说笑话0.04、查天气0.04
步骤S304:将每个子字串中信心值大于无意图类别信心值的意图类别保留。
在本申请实施例中,针对步骤S303中的预测结果,机器人将会对比每个子字串中意图类别信心值与无意图类别信心值的大小,对于那些信心值小于或等于无意图类别信心值的意图类别做剔除处理。经过处理后,每个子字串保留下如下意图类别及其信心值:
第一子字串:(无)
第二子字串:(无)
第三子字串:查机票0.7
第四子字串:查机票0.45
第五子字串:查时间0.8
第六子字串:查时间0.4
第七子字串:(无)
第八子字串:(无)
步骤S305:将保留的意图类别信心值进行转化和调分,获得信心分数。
在本申请实施例中,机器人在经过预测和比较后,会对保留下来的意图类别信心值进行转化,转化为与平均信心值的倍数差距Qi,转化的公式为:Qi=(Pi-1/Ki)*Ki,其中,Ki是每次预测获得的意图类别的数量和无意图别类的数量之和,在本实施例中,每个子字串的Ki均为6。
信心值转为与平均分数的倍数差距的具体情况如下:
第三子字串:查机票0.7,变为Q3=(0.7-1/6)*6=3.2
第四子字串:查机票0.45,变为Q4=(0.45-1/6)*6=1.7
第五子字串:查时间0.8,变为Q5=(0.8-1/6)*6=3.8
第六子字串:查时间0.4,变为Q6=(0.4-1/6)*6=1.4
信心值转化后的Qi还需要进行调分,获得信心分数F(Qi),调分的公式为F(Qi)=1/(1+e-Qi/2),具体情况如下:
第三子字串:查机票Q3=3.2,F(Q3)=F(3.2)=0.8320
第四子字串:查机票Q4=1.7,F(Q4)=F(1.7)=0.7005
第五子字串:查时间Q5=3.8,F(Q5)=F(3.8)=0.8698
第六子字串:查时间Q6=1.4,F(Q6)=F(1.4)=0.6681
步骤S306:当保留的意图类别存在相同的类别时,保留信心分数较高的意图类别。
在本申请实施例中,查机票和查时间的意图类别分别有两个,因此,机器人会将信心分数较低的剔除,具体情况如下:
第三子字串:查机票Q3=3.2,F(Q3)=F(3.2)=0.8320
第五子字串:查时间Q5=3.8,F(Q5)=F(3.8)=0.8698
最后,将最终保留下来的意图类别的信心分数转为100分制,则可以看到对于用户输入的句子″我下个月放了长假帮我查上海到波士顿的机票,对了波士顿现在几点,我要打个电话给阿姨″,机器人可以预测出:查机票83.2分、查时间86.98分。
通过这种对同一个句子进行多次预测并进行调分方法,在人机对话中,机器可以识别出长句子中用户所要表达的完整的意图,同时,机器还会对所识别出的意图进行调分后,这对于后续机器人出话有很大帮助,可提高整个人机对话系统的智能程度。
请参阅图4,本申请实施例提供一种意图识别装置,该装置包括:预测模块401、比较模块402和调分模块403。
预测模块401,用于使用预设模型对同一句子预测M次。
比较模块402,用于将每次预测获得的意图类别信心值Pi和无意图类别的信心值TH比较,保留Pi>TH的意图类别。
调分模块403,用于将所述保留的意图类别信心值进行调分,获得信心分数。
在一实施例中,该装置还包括训练模块404,用于将用户输入的语料和无意图语料一同训练,获得所述预设模型。其中,无意图语料为在用户人机对话的历史日志中随机抽取的无意图的句子;预设模型的输出为意图类别和无意图类别的出现机率分布,Pi为意图类别的出现机率,TH为无意图类别的出现机率。
在一实施例中,预设模型每次预测获得的Pi与TH之和为1。
在一实施例中,上述预测模块401,用于抽取所述句子中长度为N的子字串,共抽取M次;使用所述预设模型分别对所述子字串进行预测。。
在一实施例中,上述预测模块401,用于抽取所述句子中第一个字到第N个字作为第一子字串;位移W个字,抽取所述句子中第W个字到第N+W个字作为第二子字串,重复该步骤直至子字串的长度小于等于N,该子字串为第M子字串。
在一实施例中,上述调分模块403,用于将所述保留的意图类别的信心值转化成与平均信心值的倍数差距Qi;对Qi进行调分,获得信心分数F(Qi)。
在一实施例中,上述Qi=(Pi-1/Ki)*Ki,其中,Ki为每次预测获得的意图类别和无意图类别的类别总数。
在一实施例中,上述F(Qi)=1/(1+e-Qi/2),其中,e为自然常数。
上述装置中各个模块的功能和作用的实现过程具体详见上述模型训练方法中对应步骤的实现过程,在此不再赘述。
请参阅图5,本申请实施例提供一种电子设备,该电子设备500包括处理器501,以及用于存储处理器501可执行指令的存储器502。其中,上述处理器501被配置为执行上述任一实施例中的意图识别方法。
处理器501可以是一种集成电路芯片,具有信号处理能力。上述处理器501可以是通用处理器,包括中央处理器(Central Processing Unit,简称CPU)、网络处理器(NetworkProcessor,简称NP)等;还可以是数字信号处理器(DSP)、专用集成电路(ASIC)、现成可编程门阵列(FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。其可以实现或者执行本申请实施例中公开的各方法、步骤及逻辑框图。
存储器502可以由任何类型的易失性或非易失性存储设备或者它们的组合实现,如静态随机存取存储器(Static Random Access Memory,简称SRAM),电可擦除可编程只读存储器(Electrically Erasable Programmable Read-Only Memory,简称EEPROM),可擦除可编程只读存储器(Erasable Programmable Read Only Memory,简称EPROM),可编程只读存储器(Programmable Red-Only Memory,简称PROM),只读存储器(Read-Only Memory,简称ROM),磁存储器,快闪存储器,磁盘或光盘。存储器502中还存储有一个或多个模块,分别借由该一个或多个处理器501执行,以完成上述任一实施例中的意图识别方法步骤。
本申请实施例还提供了一种计算机可读存储介质,上述存储介质存储有计算机程序,上述计算机程序可由处理器501执行以完成上述任一实施例中的意图识别方法。
在本申请所提供的几个实施例中,所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本申请的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
另外,在本申请各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
Claims (5)
1.一种意图识别方法,其特征在于,包括:
使用预设模型对同一句子预测M次,包括:抽取所述句子中长度为N的子字串,共抽取M次;使用所述预设模型分别对所述子字串进行预测;其中,所述抽取所述句子中长度为N的子字串,共抽取M次,包括:抽取所述句子中第一个字到第N个字作为第一子字串;位移W个字,抽取所述句子中第W个字到第N+W个字作为第二子字串,重复该步骤直至子字串的长度小于等于N,该子字串为第M子字串;
将每次预测获得的意图类别信心值Pi和无意图类别的信心值TH比较,保留Pi>TH的意图类别;
将所述保留的意图类别信心值进行调分,获得信心分数,包括:将所述保留的意图类别的信心值转化成与平均信心值的倍数差距Qi;对Qi进行调分,获得信心分数F(Qi),其中,所述Qi=(Pi-1/Ki)*Ki,其中,Ki为每次预测获得的意图类别和无意图类别的类别总数,所述F(Qi)=1/(1+e-Qi/2),其中,e为自然常数。
2.根据权利要求1所述的方法,其特征在于,所述使用预设模型对同一句子预测M次之前,包括:
将用户输入的语料和无意图语料一同训练,获得所述预设模型;
其中,所述无意图语料为在用户人机对话的历史日志中随机抽取的无意图的句子;所述预设模型的输出为意图类别和无意图类别的出现机率分布,所述Pi为意图类别的出现机率,所述TH为无意图类别的出现机率。
3.根据权利要求1或2所述的方法,其特征在于,所述预设模型每次预测获得的Pi与TH之和为1。
4.根据权利要求1中所述的方法,其特征在于,所述将所述保留的意图类别信心值进行调分,获得信心分数之后,包括:
当所述保留的意图类别中存在相同意图类别时,保留信心分数高的意图类别。
5.一种意图识别装置,其特征在于,包括:
预测模块,用于使用预设模型对同一句子预测M次,包括:抽取所述句子中长度为N的子字串,共抽取M次;使用所述预设模型分别对所述子字串进行预测;其中,所述抽取所述句子中长度为N的子字串,共抽取M次,包括:抽取所述句子中第一个字到第N个字作为第一子字串;位移W个字,抽取所述句子中第W个字到第N+W个字作为第二子字串,重复该步骤直至子字串的长度小于等于N,该子字串为第M子字串;
比较模块,用于将每次预测获得的意图类别信心值Pi和无意图类别的信心值TH比较,保留Pi>TH的意图类别;
调分模块,用于将所述保留的意图类别信心值进行调分,获得信心分数,包括:将所述保留的意图类别的信心值转化成与平均信心值的倍数差距Qi;对Qi进行调分,获得信心分数F(Qi),其中,所述Qi=(Pi-1/Ki)*Ki,其中,Ki为每次预测获得的意图类别和无意图类别的类别总数,所述F(Qi)=1/(1+e-Qi/2),其中,e为自然常数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110482962.5A CN113127602B (zh) | 2021-04-30 | 2021-04-30 | 一种意图识别方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110482962.5A CN113127602B (zh) | 2021-04-30 | 2021-04-30 | 一种意图识别方法及装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113127602A CN113127602A (zh) | 2021-07-16 |
CN113127602B true CN113127602B (zh) | 2023-05-26 |
Family
ID=76780679
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110482962.5A Active CN113127602B (zh) | 2021-04-30 | 2021-04-30 | 一种意图识别方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113127602B (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1421846A (zh) * | 2001-11-28 | 2003-06-04 | 财团法人工业技术研究院 | 语音识别系统 |
WO2017024884A1 (zh) * | 2015-08-07 | 2017-02-16 | 广州神马移动信息科技有限公司 | 一种搜索意图识别方法及装置 |
CN110717026A (zh) * | 2019-10-08 | 2020-01-21 | 腾讯科技(深圳)有限公司 | 一种文本信息识别的方法、人机对话的方法及相关装置 |
WO2020143844A1 (zh) * | 2019-01-10 | 2020-07-16 | 深圳Tcl新技术有限公司 | 意图分析方法、装置、显示终端及计算机可读存储介质 |
CN111597320A (zh) * | 2020-05-26 | 2020-08-28 | 成都晓多科技有限公司 | 基于层次分类的意图识别装置、方法、设备及存储介质 |
CN111930854A (zh) * | 2020-10-10 | 2020-11-13 | 北京福佑多多信息技术有限公司 | 意图预测的方法及装置 |
Family Cites Families (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2015143639A1 (en) * | 2014-03-26 | 2015-10-01 | Microsoft Technology Licensing, Llc | Client intent in integrated search environment |
US11144726B2 (en) * | 2019-02-14 | 2021-10-12 | Wipro Limited | Method and system for identifying user intent from user statements |
-
2021
- 2021-04-30 CN CN202110482962.5A patent/CN113127602B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1421846A (zh) * | 2001-11-28 | 2003-06-04 | 财团法人工业技术研究院 | 语音识别系统 |
WO2017024884A1 (zh) * | 2015-08-07 | 2017-02-16 | 广州神马移动信息科技有限公司 | 一种搜索意图识别方法及装置 |
WO2020143844A1 (zh) * | 2019-01-10 | 2020-07-16 | 深圳Tcl新技术有限公司 | 意图分析方法、装置、显示终端及计算机可读存储介质 |
CN110717026A (zh) * | 2019-10-08 | 2020-01-21 | 腾讯科技(深圳)有限公司 | 一种文本信息识别的方法、人机对话的方法及相关装置 |
CN111597320A (zh) * | 2020-05-26 | 2020-08-28 | 成都晓多科技有限公司 | 基于层次分类的意图识别装置、方法、设备及存储介质 |
CN111930854A (zh) * | 2020-10-10 | 2020-11-13 | 北京福佑多多信息技术有限公司 | 意图预测的方法及装置 |
Non-Patent Citations (2)
Title |
---|
Sarcasmometer using sentiment analysis and topic modeling;Namrata Bhan;《2017 International Conference on Advances in Computing, Communication and Control (ICAC3)》;20180319;第1-6页 * |
端到端对话系统意图语义槽联合识别研究综述;王堃等;《计算机工程与应用》;20200611(第14期);第14-25页 * |
Also Published As
Publication number | Publication date |
---|---|
CN113127602A (zh) | 2021-07-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Baevski et al. | Effectiveness of self-supervised pre-training for speech recognition | |
CN102324233B (zh) | 汉语语音识别中重复出现词识别错误的自动修正方法 | |
CN108428447B (zh) | 一种语音意图识别方法及装置 | |
Hakkani-Tür et al. | Beyond ASR 1-best: Using word confusion networks in spoken language understanding | |
WO2022121251A1 (zh) | 文本处理模型训练方法、装置、计算机设备和存储介质 | |
CN110189749A (zh) | 语音关键词自动识别方法 | |
CN110648659B (zh) | 基于多任务模型的语音识别与关键词检测装置和方法 | |
US20090055176A1 (en) | Method and System of Optimal Selection Strategy for Statistical Classifications | |
US8019594B2 (en) | Method and apparatus for progressively selecting features from a large feature space in statistical modeling | |
US20170061958A1 (en) | Method and apparatus for improving a neural network language model, and speech recognition method and apparatus | |
CN111145729A (zh) | 语音识别模型训练方法、系统、移动终端及存储介质 | |
US20180068652A1 (en) | Apparatus and method for training a neural network language model, speech recognition apparatus and method | |
CN112580346B (zh) | 事件抽取方法、装置、计算机设备和存储介质 | |
CN107797987A (zh) | 一种基于Bi‑LSTM‑CNN的混合语料命名实体识别方法 | |
US10916254B2 (en) | Systems, apparatuses, and methods for speaker verification using artificial neural networks | |
US20220067280A1 (en) | Multi-token embedding and classifier for masked language models | |
Jung et al. | Spell my name: keyword boosted speech recognition | |
CN110837730B (zh) | 一种未知实体词汇的确定方法及装置 | |
JP2021096847A (ja) | ユーザの発言に基づくマルチメディア推奨 | |
CN115312033A (zh) | 基于人工智能的语音情感识别方法、装置、设备及介质 | |
CN113793599B (zh) | 语音识别模型的训练方法和语音识别方法及装置 | |
US20210158804A1 (en) | System and method to improve performance of a speech recognition system by measuring amount of confusion between words | |
CN113177405B (zh) | 基于bert的数据纠错方法、装置、设备及存储介质 | |
US7010486B2 (en) | Speech recognition system, training arrangement and method of calculating iteration values for free parameters of a maximum-entropy speech model | |
CN113127602B (zh) | 一种意图识别方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |