CN101086843A - 一种应用于语音问答系统中的句子相似度识别方法 - Google Patents

一种应用于语音问答系统中的句子相似度识别方法 Download PDF

Info

Publication number
CN101086843A
CN101086843A CNA2006100121317A CN200610012131A CN101086843A CN 101086843 A CN101086843 A CN 101086843A CN A2006100121317 A CNA2006100121317 A CN A2006100121317A CN 200610012131 A CN200610012131 A CN 200610012131A CN 101086843 A CN101086843 A CN 101086843A
Authority
CN
China
Prior art keywords
keyword
sentence
similarity
identification result
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA2006100121317A
Other languages
English (en)
Inventor
李成荣
高倩倩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Institute of Automation of Chinese Academy of Science
Original Assignee
Institute of Automation of Chinese Academy of Science
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Institute of Automation of Chinese Academy of Science filed Critical Institute of Automation of Chinese Academy of Science
Priority to CNA2006100121317A priority Critical patent/CN101086843A/zh
Publication of CN101086843A publication Critical patent/CN101086843A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开一种应用于语音问答系统中的句子相似度识别方法,尤其是一种考虑了口语特点和语音识别结果准确性的句子相似度识别方法,它包括首先用关键词组合表示常问问题知识库中的问题,然后在语音识别结果中提取出关键词,与常问问题知识库中的问题匹配得到候选问题集,最后用句子相似度计算公式确定与该识别结果匹配的问题的步骤。本发明解决了背景技术语音问答系统中用户语音输入具有口语特点和语音识别结果并非完全正确的问题,通过使用本发明关键词组合的方式表示问题,以及应用恰当的句子相似度计算公式,使得在语音识别结果不是完全正确的情况下仍然能够得到比较准确的句子相似度值,能够较为准确地得到用户意图。

Description

一种应用于语音问答系统中的句子相似度识别方法
技术领域
本发明属于属于计算机技术领域,涉及语音问答系统,尤其涉及一种应用于语音问答系统中的句子相似度识别方法,特别是一种考虑了口语特点和语音识别结果准确性的句子相似度识别方法。
背景技术
句子相似度的计算是自动问答系统中一个重要的理论基础。在基于常问问题集(Frequently-Asked Question,简称FAQ)的问答系统中,FAQ知识库作为自动问答系统的一个组成部分,它把用户经常提问的问题和相关答案保存起来。对于用户输入的问题,首先在FAQ知识库中查找答案,如果能够找到相应的问题,就直接将问题所对应的答案返回给用户。其中关键在于计算用户查询和FAQ知识库中问题的相似度,从而找到FAQ知识库中与用户查询最为相似的问题,这是一个句子相似度计算的过程。
随着语音识别技术的成熟,用语音作为人机交互的手段成为可能,于是出现了语音问答系统。它和一般的问答系统相比有两个突出的特点:(1)语音输入的句子具有口语特点;(2)用户的输入经过语音识别后结果不是百分之百准确,并且语音识别率与周围环境有关,当噪声较大时识别率会显著下降。由于传统的句子相似度计算方法是针对准确的文字输入,没有考虑到以上两个特点,所以有必要设计一种专门针对语音问答系统的句子相似度计算方法。
发明内容
为了解决上述背景技术的问题,本发明的目的在于:考虑了语音问答系统中用户语音输入口语化这一特征,使得对于口语化的句子仍然能够得到比较准确的句子相似度值,为此,本发明提供一种应用于语音问答系统中句子相似度的识别方法。
本发明的又一目的在于提供一种应用于语音问答系统中的句子相似度识别方法,它考虑了语音问答系统中语音识别结果不是百分之百准确这一事实,使得在语音识别结果不是完全正确的情况下仍然能够得到比较准确的句子相似度值。
本发明的目的是这样实现的:
一种应用于语音问答系统中的句子相似度识别方法,它包括首先用关键词组合表示FAQ知识库中的问题,然后在语音识别结果中提取出关键词,与FAQ知识库中的问题匹配得到候选问题集,最后用句子相似度计算公式确定句子相似度与该语音识别结果匹配的问题。
所述的用关键词组合表示FAQ知识库中的问题是指:从FAQ知识库的问题中提取出最能表达该句意义的一个或者几个词作为关键词,用这些词的组合表示常问问题集知识库中的这一问题。本发明的方法考虑到:
(1)口语表达比较随意,经常会在句子中添加一些没有意义的口语词,这些词对于句子意义的理解没有太大的作用;
(2)人类在用语音交流的过程中,并不需要将每一个字都听得很清楚,而只需要听懂句子中最关键的词,就可以理解整句话的意思,所以在很多情况下只要分析语音识别结果中的关键词就可以确定用户的意图,除关键词以外的其它部分识别错误并不会严重影响对于用户意图的判断。
所述的从语音识别结果中提取出关键词,与FAQ知识库中的问题匹配得到候选问题集是指:设置语音识别结果中共有n个关键词为W1,W2,…,Wn,FAQ知识库中共有m个问题,第i(1≤i≤m)个问题含有ni个关键词为Q1,Q2,…,Qni;从语音识别结果的关键词组合中任选k(1≤k≤n)个词组成序列为Wm1,Wm2,…,Wmj,Wmj+1,…,Wmk,其中1≤j≤k-1,mjm+1,1≤mj≤n,如果该词序列与第i(1≤i≤m)个问题中的关键词组合序列相同,则把第i个问题认为是与用户当前输入语句相匹配的句子之一,将其加入候选问题集。
所述的用句子相似度计算公式确定与该识别结果匹配的问句是指:计算语音识别结果与候选问题集中各个问题的相似度,取出最大相似度值所对应的问题,认为是与该语音识别结果匹配的问题;计算句子相似度的公式如下:
设置语音识别结果W中共有n个关键词(W1、W2、…、Wn),候选问题集中某个问题Q含有k关键词,从识别结果W中取出k(1≤k≤n)个词组成的序列(Wm1,Wm2,…,Wmj,Wmj+1,…,Wmk),其中(1≤j≤k-1,mj<mj+1,1≤mj≤n),与问题Q匹配,则语音识别结果W与问题Q的相似度如下:
Similarity ( W , Q ) = 0.7 ( k - 0.75 Σ j = 1 k - 1 ( m j + 1 - m j - 1 ) ) / n + 0.3 Σ j = 1 k m j / Σ m = n - k + 1 n m
这一相似度计算公式遵循以下三条原则:
(1)“向后”原则:
“向后”原则是指:如果语音识别结果同时与多个问题匹配,此时优先选择与语音识别结果中比较靠后的关键词组合匹配的问题。
主要考虑到以下两种情形:
人们在用口语表达的过程中,因为是边想边说,所以难免会有表达错误或者突然改变意图的时候,此时就可能会出现用语句后面的部分来纠正或替代前面部分的情形。
例如:你多大,哦不,你叫什么?
有一些问句较长,多数情况下,句子的重点是在语句中比较靠后的部分。
例如:你好,你叫什么名字?
(2)“偏多”原则
“偏多”原则是指:包含关键词较多的问题要优先于包含关键词较少的问题。因为包含关键词较多的问题能够更准确的确定用户的意图。
(3)“紧凑”原则
“紧凑”原则是指:在语音识别结果的关键词序列中,词间距离较近的关键词组合所匹配的问题要优先于距离较远的关键词组合所匹配的问题。这里的词间距离是指关键词在语音识别结果中所处的位置。
例如“你好叫什么名字”中,“你好”和“叫什么”之间的距离比“你好”和“名字”之间的距离要近。
设计这一原则是因为,当关键词之间相距过远时,由于它们之间还有别的关键词,所以有时虽然它们的组合能够与某一问题匹配,但是实际上并不是表达该问题所指的意图。另外考虑到语音识别的正确率不是百分之百,可能某一语音识别错误的关键词与距离较远的其它一个或几个关键词组合之后,与系统中某一问题匹配,此时应该对这些候选的问题赋予较低的置信度。
公式中前半部分 0.7 ( k - 0.75 Σ j = 1 k - 1 ( m j + 1 - m j - 1 ) ) / n 体现了“偏多”原则“紧凑”原则,词间距离越小, Σ j = 1 k - 1 ( m j + 1 - m j - 1 ) 就越小,该公式取值越大,问题中包括的关键词数目越多,k值就越大,该公式取值越大。当语音识别结果W中n个关键词正好与问题Q相匹配时,k=n, Σ j = 1 k - 1 ( m j + 1 - m j - 1 ) = 0 , 0.7 ( k - 0.75 Σ j = 1 k - 1 ( m j + 1 - m j - 1 ) ) / n 取得最大值0.7;公式中后半部分 0.3 Σ j = 1 k m j / Σ m = n - k + 1 n m 主要体现了“向后”原则,语音识别结果W中与问题Q相匹配的关键词越靠后, Σ j = 1 k m j 的值就越大,公式取值越大,当语音识别结果中最后k个连续的关键词组成的序列与问题Q相匹配时, Σ j = 1 k m j = Σ m = n - k + 1 n m , 0.3 Σ j = 1 k m j / Σ m = n - k + 1 n m 取得最大值0.3。
从本发明的上述技术方案分析可知,这种应用于语音问答系统中的句子相似度计算方法,解决了背景技术语音问答系统中用户语音输入具有口语特点和语音识别结果并非完全正确这一事实,通过使用本发明关键词组合的方式表示问题,以及应用恰当的句子相似度计算公式,使得在语音识别结果不是完全正确的情况下仍然能够得到比较准确的句子相似度值,能够较为准确地得到用户意图。
附图说明
通过以下结合附图的详细描述,本发明的上述和其它方面、特征和优点将变得更加显而易见。
图1是本发明一种应用于语音问答系统中的句子相似度识别方法示意图
具体实施方式
下面对本发明作具体说明。应该指出,所描述的实施例仅仅是为说明的目的,而不是对本发明的限制。
本发明可在普通计算机上实现。在应用本发明前,需要先将输入的语音经过语音识别算法得到语音识别结果。
本发明的实现可以分为以下几个步骤:
步骤S1:利用计算机从FAQ知识库的问题中提取出最能表达该句意义的一个或者几个词作为关键词,用这些词的组合表示这一问题:
例如:对于问题“请问你叫什么名字”,可以选取“叫什么”和“名字”作为关键词,用关键词组合“叫什么名字”来表示问题“请问你叫什么名字”。
步骤S2:利用计算机从语音识别结果中提取出关键词,与FAQ知识库中的问题匹配得到候选问题集。具体方法如下:
设语音识别结果中共有n个关键词(W1,W2,…,Wn),FAQ知识库中共有m个问题,第i(1≤i≤m)个问题含有ni个关键词(Q1,Q2,…,Qni)。从语音识别结果的关键词组合中任选k(1≤k≤n)个词组成序列(Wm1,Wm2,…,Wmj,Wmj+1,…,Wmk),其中(1≤j≤k-1,mj<mj+1,1≤mj≤n),如果该词序列与第i(1≤i≤m)个问题中的关键词组合序列相同,则把第i个问题认为是与用户当前输入语句相匹配的句子之一,将其加入候选问题集。
步骤S3:利用计算机计算语音识别结果与候选问题集中各个句子的相似度,取出最大的相似度值所对应的问题,认为是与该语音识别结果匹配的问题。
计算句子相似度的公式如下:
设语音识别结果W中共有n个关键词(W1、W2、…、Wn),候选问题集中某个问题Q含有k个关键词,从语音识别结果W中取出k(1≤k≤n)个词组成的序列(Wm1,Wm2,…,Wmj,Wmj+1,…,Wmk),其中(1≤j≤k-1,mj<mj+1,1≤mj≤n),与问句Q匹配,则语音识别结果W与问句Q的相似度计算公式如下:
Similarity ( W , Q ) = 0.7 ( k - 0.75 Σ j = 1 k - 1 ( m j + 1 - m j - 1 ) ) / n + 0.3 Σ j = 1 k m j / Σ m = n - k + 1 n m
具体实施例为:
例1:
用户输入:你好,那个请问你叫什么名字呀?
语音识别结果:你好是吗请问你叫什么名字
步骤S1:涉及到三个FAQ知识库中的问题:“你好”、“你叫什么”、“请问你叫什么名字”,它们分别用关键词组合“你好”、“叫什么”、“叫什么名字”来表示;
步骤S2:从语音识别结果中提取关键词,得到关键词组合:“你好叫什么名字”,此时,n=3,W1=你好,W2=叫什么,W3=名字,
当k=1时,序列一:你好  m1=1
序列二:叫什么  m1=2
序列三:名字    m1=3
当k=2时,
序列四:你好叫什么    m1=1,m2=2
序列五:你好名字      m1=1,m2=3
序列六:叫什么名字    m1=2,m2=3
当k=3时,
序列七:你好叫什么名字    m1=1,m2=2,m3=3
按照上述方法可以找到三个问题作为候选。其中序列一与问题一相匹配,序列二与问句二相匹配,序列六与问题三相匹配。
问题一:“你好”
问题二:“叫什么”
问题三:“叫什么名字”
步骤S3:计算句子相似度。
问题一:  n=3,k=1,m2=1;Similarity(W,Q)=0.333
问题二:  n=3,k=1,m1=2;Similarity(W,Q)=0.433
问题三:  n=3,k=2,m1=2,m2=3;Similarity(W,Q)=0.767
因为问题三对应的相似度值最大,所以就认为问题三与用户意图相匹配。从例1可以看出,通过使用该种相似度计算方法,忽略了口语中的“那个”这一没有意义的词,语音识别结果中错误的部分“是吗”没有对用户意图的判断造成影响,根据“向后”原则准确的理解了用户的意图。
例2:
用户输入:什么时候你出生的
语音识别结果:什么时候本事出生的
步骤S1:涉及到两个FAQ知识库中的问题:“你有什么本事”、“你是什么时候出生的”,它们分别用关键词组合“本事”、“时候出生”来表示;
步骤S2:从语音识别结果中提取关键词,得到关键词组合:“时候本事出生”,此时,n=3,W1=时候,W2=本事,W2=出生
当k=1时,
序列一:时候  m1=1
序列二:本事  m1=2
序列三:出生  m1=3
当k=2时,
序列四:时候  本事  m1=1,m2=2
序列五:时候  出生  m1=1,m2=3
序列六:本事  出生  m1=2,m2=3
当k=3时,
序列七:时候本事  出生  m1=1,m2=2,m3=3
按照上述方法可以找到两个问句作为候选。其中序列二与问题一相匹配,序列五与问题二相匹配。
问题一:“本事”
问题二:“时候  出生”
步骤S3:计算句子相似度。
问题一:  n=3,k=1,m1=2;Similarity(W,Q)=0.433
问题二:  n=3,k=2,m1=1,m2=3;Similarity(W,Q)=0.532
因为问题二对应的相似度值最大,所以就认为问题二与用户意图相匹配。从例2可以看出,通过使用该种相似度计算方法,语音识别结果中错误的部分“本事”没有对用户意图的判断造成影响,根据“偏多”原则准确的理解了用户的意图。
上面描述是用于实现本发明及其实施例,本领域普通技术人员可以根据实际情况确定多种实现方法,因此,本发明的范围不应由该描述来限定。本领域的技术人员应该理解,在不脱离本发明的范围的任何修改或局部替换,均属于本发明权利要求来限定的范围。

Claims (5)

1、一种应用于语音问答系统中的句子相似度识别方法,其特征在于:所述方法包括如下步骤:
步骤a:用关键词组合表示常问问题集知识库中的问题;
步骤b:在语音识别结果中提取出关键词,与常问问题集知识库中的问题匹配得到候选问题集;
步骤c:用句子相似度计算公式确定句子相似度与语音识别结果匹配的问题。
2、根据权利要求1所述的应用于语音问答系统中的句子相似度识别方法,其特征在于,所述步骤a的具体步骤如下:从常问问题集知识库的问题中提取出最能表达该句意义的一个或者几个词作为关键词,用这些词的组合表示常问问题集知识库中的问题。
3、根据权利要求1所述的应用于语音问答系统中的句子相似度识别方法,其特征在于,所述步骤b确定候选问题集的具体步骤如下:
设置语音识别结果中有n个关键词为W1,W2,...,Wn
常问问题集知识库中有m个问题,第i个问题含有ni个关键词为Q1,Q2,...,Qni,其中1≤i≤m;
从语音识别结果的关键词组合中任选k个词组成序列为Wm1,Wm2,...,Wmj,Wmj+1,...,Wmk,其中1≤k≤n,1≤j≤k-1,mj<mj+1,1≤mj≤n;
如果该词序列与第i个问题中的关键词组合序列相同,则把第i个问题认为是与用户当前输入语句相匹配的句子之一,将其加入候选问题集。
4、根据权利要求1所述的应用于语音问答系统中的句子相似度识别方法,其特征在于:所述步骤c的具体步骤如下:根据句子相似度计算公式计算语音识别结果与候选问题集中各个句子的相似度,取出最大相似度值所对应的问题,认为是与该语音识别结果匹配的问题。
5、根据权利要求1和4所述的应用于语音问答系统中的句子相似度识别方法,其特征在于:所述句子相似度计算步骤如下:
设置语音识别结果W中有n个关键词为W1、W2、...、wn,候选问题集中某个问题Q含有k个关键词,从语音识别结果W中取出k个词组成的序列为Wm1,Wm2,...,Wmj,Wmj+1,...,Wmk,与问题Q的问句匹配,其中1≤k≤n,1≤j≤k-1,mj<mj+1,1≤mj≤n,则语音识别结果W与问题Q的问句相似度计算公式如下:
Similarity ( W , Q ) = 0.7 ( k - 0.75 Σ j = 1 k - 1 ( m j + 1 - m j - 1 ) ) / n + 0.3 Σ j = 1 k m j / Σ m = n - k + 1 n m .
CNA2006100121317A 2006-06-07 2006-06-07 一种应用于语音问答系统中的句子相似度识别方法 Pending CN101086843A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CNA2006100121317A CN101086843A (zh) 2006-06-07 2006-06-07 一种应用于语音问答系统中的句子相似度识别方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CNA2006100121317A CN101086843A (zh) 2006-06-07 2006-06-07 一种应用于语音问答系统中的句子相似度识别方法

Publications (1)

Publication Number Publication Date
CN101086843A true CN101086843A (zh) 2007-12-12

Family

ID=38937761

Family Applications (1)

Application Number Title Priority Date Filing Date
CNA2006100121317A Pending CN101086843A (zh) 2006-06-07 2006-06-07 一种应用于语音问答系统中的句子相似度识别方法

Country Status (1)

Country Link
CN (1) CN101086843A (zh)

Cited By (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104050256A (zh) * 2014-06-13 2014-09-17 西安蒜泥电子科技有限责任公司 基于主动学习的问答方法及采用该方法的问答系统
CN104221012A (zh) * 2012-03-13 2014-12-17 三菱电机株式会社 文档搜索装置和文档搜索方法
CN104424290A (zh) * 2013-09-02 2015-03-18 佳能株式会社 基于语音的问答系统和用于交互式语音系统的方法
CN104462085A (zh) * 2013-09-12 2015-03-25 腾讯科技(深圳)有限公司 检索关键词纠错方法及装置
CN104572868A (zh) * 2014-12-18 2015-04-29 清华大学 基于问答系统的信息匹配的方法和装置
CN104751856A (zh) * 2013-12-31 2015-07-01 中国移动通信集团公司 一种语音语句识别方法及装置
CN105095444A (zh) * 2015-07-24 2015-11-25 百度在线网络技术(北京)有限公司 信息获取方法和装置
CN105374248A (zh) * 2015-11-30 2016-03-02 广东小天才科技有限公司 一种纠正读音的方法、装置和系统
CN105677636A (zh) * 2015-12-30 2016-06-15 上海智臻智能网络科技股份有限公司 智能问答系统的信息处理方法及信息处理装置
CN106294751A (zh) * 2016-08-10 2017-01-04 依据数据(湖南)科技有限公司 基于关键词网络相关性分析的异常检查报告自动识别方法
CN106844587A (zh) * 2017-01-11 2017-06-13 北京光年无限科技有限公司 一种用于对话交互系统的数据处理方法及装置
CN107193883A (zh) * 2017-04-27 2017-09-22 北京拓尔思信息技术股份有限公司 一种数据处理方法和系统
CN108984778A (zh) * 2018-07-25 2018-12-11 南京瓦尔基里网络科技有限公司 一种智能交互自动问答系统以及自我学习方法
CN109102809A (zh) * 2018-06-22 2018-12-28 北京光年无限科技有限公司 一种用于智能机器人的对话方法及系统
CN109388695A (zh) * 2018-09-27 2019-02-26 深圳前海微众银行股份有限公司 用户意图识别方法、设备及计算机可读存储介质
CN110069614A (zh) * 2019-04-28 2019-07-30 北京车薄荷科技有限公司 一种问答交互方法及装置
CN110111784A (zh) * 2019-04-11 2019-08-09 苏宁云计算有限公司 一种夜间无人店的顾客远程协助的处理方法及系统
CN111930920A (zh) * 2020-09-30 2020-11-13 恒生电子股份有限公司 基于知识增强处理的faq相似度计算方法、装置及电子设备
CN112559769A (zh) * 2020-12-15 2021-03-26 上海钛米机器人股份有限公司 问答数据库的生成方法和装置
CN112885348A (zh) * 2021-01-25 2021-06-01 广州中汇信息科技有限公司 结合ai智能语音电销方法
CN115329883A (zh) * 2022-08-22 2022-11-11 桂林电子科技大学 一种语义相似度处理方法、装置、系统以及存储介质

Cited By (31)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104221012A (zh) * 2012-03-13 2014-12-17 三菱电机株式会社 文档搜索装置和文档搜索方法
CN104424290A (zh) * 2013-09-02 2015-03-18 佳能株式会社 基于语音的问答系统和用于交互式语音系统的方法
CN104462085A (zh) * 2013-09-12 2015-03-25 腾讯科技(深圳)有限公司 检索关键词纠错方法及装置
CN104462085B (zh) * 2013-09-12 2019-04-12 腾讯科技(深圳)有限公司 检索关键词纠错方法及装置
CN104751856A (zh) * 2013-12-31 2015-07-01 中国移动通信集团公司 一种语音语句识别方法及装置
CN104751856B (zh) * 2013-12-31 2017-12-22 中国移动通信集团公司 一种语音语句识别方法及装置
CN104050256A (zh) * 2014-06-13 2014-09-17 西安蒜泥电子科技有限责任公司 基于主动学习的问答方法及采用该方法的问答系统
CN104050256B (zh) * 2014-06-13 2017-05-24 西安蒜泥电子科技有限责任公司 基于主动学习的问答方法及采用该方法的问答系统
CN104572868B (zh) * 2014-12-18 2017-11-03 清华大学 基于问答系统的信息匹配的方法和装置
CN104572868A (zh) * 2014-12-18 2015-04-29 清华大学 基于问答系统的信息匹配的方法和装置
CN105095444A (zh) * 2015-07-24 2015-11-25 百度在线网络技术(北京)有限公司 信息获取方法和装置
CN105374248A (zh) * 2015-11-30 2016-03-02 广东小天才科技有限公司 一种纠正读音的方法、装置和系统
CN105374248B (zh) * 2015-11-30 2018-12-04 广东小天才科技有限公司 一种纠正读音的方法、装置和系统
CN105677636A (zh) * 2015-12-30 2016-06-15 上海智臻智能网络科技股份有限公司 智能问答系统的信息处理方法及信息处理装置
CN106294751A (zh) * 2016-08-10 2017-01-04 依据数据(湖南)科技有限公司 基于关键词网络相关性分析的异常检查报告自动识别方法
CN106294751B (zh) * 2016-08-10 2019-05-17 依据数据(湖南)科技有限公司 基于关键词网络相关性分析的异常检查报告自动识别方法
CN106844587A (zh) * 2017-01-11 2017-06-13 北京光年无限科技有限公司 一种用于对话交互系统的数据处理方法及装置
CN106844587B (zh) * 2017-01-11 2019-11-08 北京光年无限科技有限公司 一种用于对话交互系统的数据处理方法及装置
CN107193883B (zh) * 2017-04-27 2020-06-02 北京拓尔思信息技术股份有限公司 一种数据处理方法和系统
CN107193883A (zh) * 2017-04-27 2017-09-22 北京拓尔思信息技术股份有限公司 一种数据处理方法和系统
CN109102809A (zh) * 2018-06-22 2018-12-28 北京光年无限科技有限公司 一种用于智能机器人的对话方法及系统
CN108984778A (zh) * 2018-07-25 2018-12-11 南京瓦尔基里网络科技有限公司 一种智能交互自动问答系统以及自我学习方法
CN109388695A (zh) * 2018-09-27 2019-02-26 深圳前海微众银行股份有限公司 用户意图识别方法、设备及计算机可读存储介质
CN110111784A (zh) * 2019-04-11 2019-08-09 苏宁云计算有限公司 一种夜间无人店的顾客远程协助的处理方法及系统
CN110069614A (zh) * 2019-04-28 2019-07-30 北京车薄荷科技有限公司 一种问答交互方法及装置
CN111930920A (zh) * 2020-09-30 2020-11-13 恒生电子股份有限公司 基于知识增强处理的faq相似度计算方法、装置及电子设备
CN112559769A (zh) * 2020-12-15 2021-03-26 上海钛米机器人股份有限公司 问答数据库的生成方法和装置
CN112559769B (zh) * 2020-12-15 2024-04-16 上海钛米机器人股份有限公司 问答数据库的生成方法和装置
CN112885348A (zh) * 2021-01-25 2021-06-01 广州中汇信息科技有限公司 结合ai智能语音电销方法
CN112885348B (zh) * 2021-01-25 2024-03-08 广州中汇信息科技有限公司 结合ai智能语音电销方法
CN115329883A (zh) * 2022-08-22 2022-11-11 桂林电子科技大学 一种语义相似度处理方法、装置、系统以及存储介质

Similar Documents

Publication Publication Date Title
CN101086843A (zh) 一种应用于语音问答系统中的句子相似度识别方法
Chen et al. Character identification on multiparty conversation: Identifying mentions of characters in tv shows
US7603277B2 (en) Speech recognition device using statistical language model
JP5653709B2 (ja) 質問応答システム
Tinwala et al. Eyes-free text entry with error correction on touchscreen mobile devices
CN100514446C (zh) 一种基于语音识别及语音分析的发音评估方法
JP2016051179A (ja) 音声認識方法、音声評価方法、音声認識システム及び音声評価システム
CN105741831A (zh) 一种基于语法分析的口语评测方法和系统
US8000964B2 (en) Method of constructing model of recognizing english pronunciation variation
CN109271524B (zh) 知识库问答系统中的实体链接方法
Chen et al. Characterizing phonetic transformations and acoustic differences across English dialects
CN102246169A (zh) 为搜索词分配指标权重
CN104199825A (zh) 一种信息查询方法和系统
Walker 20 Variation analysis
Ali et al. WERd: Using social text spelling variants for evaluating dialectal speech recognition
KR102109866B1 (ko) 합성곱 신경망에 의한 발화 임베딩을 사용한 유사도 측정 기반의 채팅 말뭉치 확장을 위한 장치 및 방법
JP2020064370A (ja) 文章記号挿入装置及びその方法
Louw et al. Speaker specific phrase break modeling with conditional random fields for text-to-speech
CN110033778B (zh) 一种说谎状态实时识别修正系统
CN103827962B (zh) 声音识别装置
González et al. An illustrated methodology for evaluating ASR systems
JP2020064630A (ja) 文章記号挿入装置及びその方法
JP2006209173A (ja) 係り受け構造解析装置及びコンピュータプログラム
CN115019777B (zh) 一种在线学习语音识别应答装置及方法
CN117743556B (zh) 一种基于知识库的多轮问答意图识别方法及装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Open date: 20071212