CN110136699A - 一种基于文本相似度的意图识别方法 - Google Patents
一种基于文本相似度的意图识别方法 Download PDFInfo
- Publication number
- CN110136699A CN110136699A CN201910617459.9A CN201910617459A CN110136699A CN 110136699 A CN110136699 A CN 110136699A CN 201910617459 A CN201910617459 A CN 201910617459A CN 110136699 A CN110136699 A CN 110136699A
- Authority
- CN
- China
- Prior art keywords
- text
- similarity
- intention assessment
- word
- sequence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 22
- 238000013135 deep learning Methods 0.000 claims abstract description 10
- 238000004364 calculation method Methods 0.000 claims description 5
- 238000005259 measurement Methods 0.000 abstract description 2
- 230000007704 transition Effects 0.000 abstract description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/10—Speech classification or search using distance or distortion measures between unknown speech and reference templates
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/1822—Parsing for meaning understanding
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Data Mining & Analysis (AREA)
- Life Sciences & Earth Sciences (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种基于文本相似度的意图识别方法,解决了ASR转为文本出现错误时产生的意图识别的错误问题,其技术方案要点是通过文本相似度算法来对用户语音进行识别,避免ASR在语音转为文本的过程中出现错误转换的问题。采用相似度算法来进行意图识别,从而提高意图识别的准确率。同时,若通过相似度算法识别失败,则将用户语音输入到深度学习网络训练的意图识别模型进行识别,进一步提高意图识别的准确率。
Description
技术领域
本公开涉及智能识别领域,尤其涉及一种基于文本相似度的意图识别方法。
背景技术
目前,在智能对话领域,意图识别一般是单一的将语音信号通过ASR技术转成文本,而ASR转为文本存在一定的错误率,再对错误的文本进行单纯的文本识别会使意图识别的错误率大大提高。现有技术中,使用深度学习网络训练的模型来识别意图的方法非常之多,但这种意图识别方法略为单一,识别的准确率有待进一步提高。
发明内容
本公开的目的是提供一种基于文本相似度的意图识别方法,解决通过ASR转为文本存在错误而导致的意图识别错误的问题。
本公开的上述技术目的是通过以下技术方案得以实现的:
一种基于文本相似度的意图识别方法,包括:
预定义意图类别,获取话术文本数据,将所述话术文本数据与所述意图类别进行相似度计算得到意图识别知识库;
将用户语音转成用户问题文本,将所述用户问题文本与所述意图识别知识库进行相似度计算,得到意图识别结果;
其中,所述相似度计算方法包括基于字符的相似度算法和基于词向量的相似度算法。
进一步地,所述基于字符的相似度算法为基于编辑距离的相似度算法,包括:
,其中q为所述用户问题文本,S为所述意图识别知识库中的句子,为q与S之间的最小编辑距离,len(q)为所述用户问题文本的文本长度,len(S)为所述意图识别知识库中句子的字符长度。
进一步地,所述基于字符的相似度算法为基于相同词典的相似度算法,包括:
,其中,为所述用户问题文本q分词之后的序列,为所述意图识别知识库中的句子S分词之后的序列,为序列qw中词的个数,len(Su)为序列Su中词的个数,为序列qw中与序列Su中词义相同的词的个数。
进一步地,所述相似度计算结果为:
;
当时,得到所述意图识别结果,其中。
进一步地,当且时,转到所述基于词向量的相似度算法进行意图识别,否则转到意图识别模型进行意图识别。
进一步地,所述基于词向量的相似度算法为:
为所述用户问题文本q分词之后的序列,为所述意图识别知识库中的句子S分词之后的序列,;
所述q的向量Vq为:;其中,lq为所述q中词的个数,Wi为所述q中的词,Vqwi为所述Wi的向量值,W为权重,所述qwi的词性为动词或名词时,;所述qwi的词性为时间或方位时,;
所述S的向量Vs为:;其中,ls为所述S中词的个数,ui为所述S中的词,Vsui为所述ui的向量值,u为权重,所述Sui的词性为动词或名词时,;所述Sui的词性为时间或方位时,;
则所述q与所述S的相似度为:,当所述时,得到所述意图识别结果,其中,。
进一步地,所述。
进一步地,当所述意图识别失败时,将所述用户问题文本q投入到意图识别模型中进行识别,获取意图识别结果,所述意图识别模型由深度学习网络训练而成。
综上所述,本公开的有益效果在于:通过文本相似度算法来对用户语音进行识别,避免ASR在语音转为文本的过程中出现错误转换的问题。采用相似度算法来进行意图识别,从而提高意图识别的准确率。同时,若通过相似度算法识别失败,则将用户语音输入到深度学习网络训练的意图识别模型进行识别,进一步提高意图识别的准确率。
附图说明
图1为基于文本相似度的意图识别流程图;
图2为相似度算法与深度学习网络结合的意图识别流程图。
具体实施方式
以下结合附图对本公开作进一步详细说明。
本公开的工作原理为:预定义意图类别,比如定义有“同行”、“在忙”、“问姓名”等意图类别,然后获取话术文本数据,然后将话术文本数据与预
表1
定义的意图类别进行相似度计算,得到意图识别知识库,表1即为意图类别与意图识别知识库文本对应的列表。最后采用意图识别知识库对用户语音进行相似度识别。
本公开用到的相似度算法包括基于字符的相似度算法和基于词向量的相似度算法,其中基于字符的相似度算法包括基于编辑距离的相似度算法和基于相同词典的相似度算法,使用相似度算法的意图识别过程如图1所示。
基于编辑距离的相似度算法主要为:
,其中q为用户问题文本,S为意图识别知识库中的句子,为q与s之间的最小编辑距离,len(q)为用户问题文本的文本长度,len(s)为意图识别知识库中句子的字符长度。
基于相同词典的相似度算法为:
,其中,为用户问题文本q分词之后的序列,为意图识别知识库中的句子S分词之后的序列,为序列qw中词的个数,len(su)为序列Su中词的个数,为序列qw中与序列Su中词义相同的词的个数。
则融合上述两种基于字符的相似度算法可以得到意图识别的结果为:。当且时,意图识别成功;当且时,转到基于词向量的相似度算法进行意图识别,否则转到意图识别模型进行意图识别。
和为根据相似度算法预设的阈值。
使用基于字符的相似度算法意图识别失败后,则转为使用基于词向量的相似度算法,主要为:
为用户问题文本q分词之后的序列,为意图识别知识库中的句子S分词之后的序列,;
则q的向量Vq为:;其中,lq为q中词的个数,Wi为所述q中的词,Vqwi为Wi的向量值,W为权重,qwi的词性为动词或名词时,;所述qwi的词性为时间或方位时,;
同样S的向量VS为:;其中,lS为S中词的个数,ui为S中的词,Vsui为ui的向量值,u为权重,Sui的词性为动词或名词时,;Sui的词性为时间或方位时,;
则q与S的相似度为:,当时,得到意图识别结果,其中,。
作为具体实施例之一地,。
若使用基于词向量的相似度算法的意图识别失败,则将用户问题文本q投入到意图识别模型中进行识别,获取意图识别结果,本公开使用的意图识别模型由深度学习网络训练而成,如图2所示。
本公开在信用卡行业利用已经标注的数据集,包含训练集数据137737条,测试集数据11392条,意图类别数为55,训练的深度学习网络意图识别模型的准确率为79.97%,加上相似度计算后准确率提升到81.56%。
在贷款行业,利用已经标注的数据集,包含训练集数据310556条,测试集数据22967条,意图类别数为51,训练的深度学习网络意图识别模型的准确率为92.10%,加上相似度计算后准确率提升到93.24%,如表2所示。
领域 | 训练集个数 | 测试集个数 | 意图类别个数 | 深度学习网络意图识别模型准确率 | 深度学习网络意图识别模型加上相似度计算准确率 |
信用卡 | 137737 | 11392 | 55 | 79.97% | 81.56% |
贷款 | 310556 | 22967 | 51 | 92.10% | 93.24% |
表2
以上为本公开示范性实施例,本公开的保护范围由权利要求书及其等效物限定。
Claims (8)
1.一种基于文本相似度的意图识别方法,其特征在于,包括:
预定义意图类别,获取话术文本数据,将所述话术文本数据与所述意图类别进行相似度计算得到意图识别知识库;
将用户语音转成用户问题文本,将所述用户问题文本与所述意图识别知识库进行相似度计算,得到意图识别结果;
其中,所述相似度计算方法包括基于字符的相似度算法和基于词向量的相似度算法。
2.如权利要求1所述的基于文本相似度的意图识别方法,其特征在于,所述基于字符的相似度算法为基于编辑距离的相似度算法,包括:
,其中q为所述用户问题文本,S为所述意图识别知识库中的句子,为q与S之间的最小编辑距离,len(q)为所述用户问题文本的文本长度,len(q)为所述意图识别知识库中句子的字符长度。
3.如权利要求2所述的基于文本相似度的意图识别方法,其特征在于,所述基于字符的相似度算法为基于相同词典的相似度算法,包括:
,其中,为所述用户问题文本q分词之后的序列,为所述意图识别知识库中的句子S分词之后的序列,为序列qW中词的个数,len(Su)为序列Su中词的个数,为序列qW中与序列Su中词义相同的词的个数。
4.如权利要求3所述的基于文本相似度的意图识别方法,其特征在于,所述相似度计算结果为:;当时,得到所述意图识别结果,其中。
5.如权利要求4所述的基于文本相似度的意图识别方法,其特征在于,当
且时,转到所述基于词向量的相似度算法进行意图识别,否则转到意图识别模型进行意图识别。
6.如权利要求5所述的基于文本相似度的意图识别方法,其特征在于,所述基于词向量的相似度算法为:
为所述用户问题文本q分词之后的序列,为所述意图识别知识库中的句子S分词之后的序列,;
所述q的向量Vq为:;其中,lq为所述q中词的个数,Wi为所述q中的词,VqWi为所述Wi的向量值,W为权重,所述qWi的词性为动词或名词时,;所述qWi的词性为时间或方位时,;
所述S的向量VS为:;其中,lS为所述S中词的个数,ui为所述S中的词,VSui为所述ui的向量值,u为权重,所述Sui的词性为动词或名词时,;所述Sui的词性为时间或方位时,;
则所述q与所述S的相似度为:,当所述时,得到所述意图识别结果,其中,。
7.如权利要求6所述的基于文本相似度的意图识别方法,其特征在于,所述。
8.如权利要求6所述的基于文本相似度的意图识别方法,其特征在于,当所述意图识别失败时,将所述用户问题文本q投入到意图识别模型中进行识别,获取意图识别结果,所述意图识别模型由深度学习网络训练而成。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910617459.9A CN110136699A (zh) | 2019-07-10 | 2019-07-10 | 一种基于文本相似度的意图识别方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910617459.9A CN110136699A (zh) | 2019-07-10 | 2019-07-10 | 一种基于文本相似度的意图识别方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110136699A true CN110136699A (zh) | 2019-08-16 |
Family
ID=67566663
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910617459.9A Pending CN110136699A (zh) | 2019-07-10 | 2019-07-10 | 一种基于文本相似度的意图识别方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110136699A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111737453A (zh) * | 2020-05-29 | 2020-10-02 | 南京硅基智能科技有限公司 | 一种基于无监督的多模型融合抽取式文本摘要方法 |
CN112699663A (zh) * | 2021-01-07 | 2021-04-23 | 中通天鸿(北京)通信科技股份有限公司 | 一种基于多种算法结合的语义理解系统 |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001273293A (ja) * | 2000-03-23 | 2001-10-05 | Nippon Telegr & Teleph Corp <Ntt> | 単語推定方法及び装置及び単語推定プログラムを格納した記録媒体 |
CN103455535A (zh) * | 2013-05-08 | 2013-12-18 | 深圳市明唐通信有限公司 | 基于历史咨询数据构建知识库的方法 |
CN106489148A (zh) * | 2016-06-29 | 2017-03-08 | 深圳狗尾草智能科技有限公司 | 一种基于用户画像的意图场景识别方法及系统 |
CN109325106A (zh) * | 2018-07-31 | 2019-02-12 | 厦门快商通信息技术有限公司 | 一种医美聊天机器人意图识别方法及装置 |
CN109657232A (zh) * | 2018-11-16 | 2019-04-19 | 北京九狐时代智能科技有限公司 | 一种意图识别方法 |
-
2019
- 2019-07-10 CN CN201910617459.9A patent/CN110136699A/zh active Pending
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001273293A (ja) * | 2000-03-23 | 2001-10-05 | Nippon Telegr & Teleph Corp <Ntt> | 単語推定方法及び装置及び単語推定プログラムを格納した記録媒体 |
CN103455535A (zh) * | 2013-05-08 | 2013-12-18 | 深圳市明唐通信有限公司 | 基于历史咨询数据构建知识库的方法 |
CN106489148A (zh) * | 2016-06-29 | 2017-03-08 | 深圳狗尾草智能科技有限公司 | 一种基于用户画像的意图场景识别方法及系统 |
CN109325106A (zh) * | 2018-07-31 | 2019-02-12 | 厦门快商通信息技术有限公司 | 一种医美聊天机器人意图识别方法及装置 |
CN109657232A (zh) * | 2018-11-16 | 2019-04-19 | 北京九狐时代智能科技有限公司 | 一种意图识别方法 |
Non-Patent Citations (3)
Title |
---|
刘佳雯: "语句相似度匹配在自动问答系统中的应用与实现", 《中国优秀硕士论文》 * |
苏秀芝: "基于标题与文本相似度的网页正文提取算法", 《科技创新与应用》 * |
郭胜国 等: "基于词向量的句子相似度计算及其应用研究", 《现代电子技术》 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111737453A (zh) * | 2020-05-29 | 2020-10-02 | 南京硅基智能科技有限公司 | 一种基于无监督的多模型融合抽取式文本摘要方法 |
CN111737453B (zh) * | 2020-05-29 | 2024-04-02 | 南京硅基智能科技有限公司 | 一种基于无监督的多模型融合抽取式文本摘要方法 |
CN112699663A (zh) * | 2021-01-07 | 2021-04-23 | 中通天鸿(北京)通信科技股份有限公司 | 一种基于多种算法结合的语义理解系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107480143B (zh) | 基于上下文相关性的对话话题分割方法和系统 | |
US9201862B2 (en) | Method for symbolic correction in human-machine interfaces | |
CN107451121A (zh) | 一种语音识别方法及其装置 | |
CN106776538A (zh) | 企业非标准格式文档的信息提取方法 | |
CN107305541A (zh) | 语音识别文本分段方法及装置 | |
CN105679316A (zh) | 一种基于深度神经网络的语音关键词识别方法及装置 | |
CN103761975A (zh) | 一种口语评测方法及装置 | |
CN103474061A (zh) | 基于分类器融合的汉语方言自动辨识方法 | |
CN112992125B (zh) | 一种语音识别方法、装置、电子设备、可读存储介质 | |
CN107564528B (zh) | 一种语音识别文本与命令词文本匹配的方法及设备 | |
CN113190602B (zh) | 融合字词特征与深度学习的事件联合抽取方法 | |
CN108304377A (zh) | 一种长尾词的提取方法及相关装置 | |
CN110136699A (zh) | 一种基于文本相似度的意图识别方法 | |
CN109147766B (zh) | 基于端到端深度学习模型的语音识别方法及系统 | |
CN110415725A (zh) | 使用第一语言数据评估第二语言发音质量的方法及系统 | |
Kumar et al. | Significance of GMM-UBM based modelling for Indian language identification | |
CN105183716B (zh) | 一种基于抽象语义的智能交互方法 | |
CN111128128A (zh) | 一种基于互补模型评分融合的语音关键词检测方法 | |
Irtza et al. | A hierarchical framework for language identification | |
CN103678318A (zh) | 多词单元提取方法和设备及人工神经网络训练方法和设备 | |
CN101876985B (zh) | 基于混合模型的web文本情感主题识别方法 | |
WO2020209957A1 (en) | Automated speech recognition confidence classifier | |
CN107797986A (zh) | 一种基于lstm‑cnn的混合语料分词方法 | |
CN110192250B (zh) | 估计语音中的符号序列的方法和系统 | |
Bianne-Bernard et al. | Variable length and context-dependent HMM letter form models for Arabic handwritten word recognition |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20190816 |
|
RJ01 | Rejection of invention patent application after publication |