CN105468582B - 一种基于人机交互的数字串的纠正方法及装置 - Google Patents

一种基于人机交互的数字串的纠正方法及装置 Download PDF

Info

Publication number
CN105468582B
CN105468582B CN201510796507.7A CN201510796507A CN105468582B CN 105468582 B CN105468582 B CN 105468582B CN 201510796507 A CN201510796507 A CN 201510796507A CN 105468582 B CN105468582 B CN 105468582B
Authority
CN
China
Prior art keywords
mrow
msub
mtd
mtr
string
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201510796507.7A
Other languages
English (en)
Other versions
CN105468582A (zh
Inventor
俞凯
周伟达
樊帅
梅微星
常成
郑达
陈露
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sipic Technology Co Ltd
Original Assignee
Suzhou Speech Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Suzhou Speech Information Technology Co Ltd filed Critical Suzhou Speech Information Technology Co Ltd
Priority to CN201510796507.7A priority Critical patent/CN105468582B/zh
Publication of CN105468582A publication Critical patent/CN105468582A/zh
Application granted granted Critical
Publication of CN105468582B publication Critical patent/CN105468582B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Physics & Mathematics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Medicines Containing Antibodies Or Antigens For Use As Internal Diagnostic Agents (AREA)
  • Machine Translation (AREA)

Abstract

本发明公开了一种人机交互的数字串的纠正方法及装置,该方法包括:接收用户输入的语义,并解析所述语义对应的字符串;根据对话历史对语义进行预处理,判断语义是否为纠正数字串中的错误指令,当判定结果为是时,采用编辑距离算法找出要被纠正的数字串S中与纠正子串T最相似的一段并进行替换,通过多轮交互对数字串的语音识别错误进行纠正,并对字符串进行替换;根据预处理后的语义更新字符串,并回复用户。通过多轮对话交互对数字串的语音识别错误进行纠正,实现了用户自身可对识别错误的纠正,尤其是对数字串的纠正;通过使删除、插入、替换拥有不同的惩罚值,提升了人机交互中语音识别的正确率,同时,有效地增加了用户体验。

Description

一种基于人机交互的数字串的纠正方法及装置
技术领域
本发明涉及人机交互领域,特别涉及一种基于人机交互的数字串的纠正方法及装置。
背景技术
近年来移动互联网及物联网飞速发展,语音交互因其方便、快捷、自然的特点在人机交互中扮演着越来越重要的角色。但是在实际场景下,由于环境噪音、说话人口音等的影响,完全正确的识别用户所说的每一个字是十分困难的。当用户所说的是一串有特殊含义的数字(例如电话号码)时,能够准确地识别每一个数字就显得尤为重要。
如何对数字串语音识别的错误进行纠正,近年有一些这方面的研究,比如语音识别错误的纠正方法及装置发明内容、一种对语音识别后文本进行检错并纠错的方法。但是这些方法一般从语音识别自身的角度,即以语音识别模型及语言模型为基础,或者结合领域内知识库对错误的语音识别结果进行纠正。这些方法虽然能对特定情况下语音识别错误有一定的纠正效果,但是对数字串的语音识别错误纠正能力有限,同时没有考虑到用户自身可能会对识别错误进行纠正。
发明内容
针对现有技术中的缺陷,本发明提供了一种基于人机交互的数字串的纠正方法及装置,
所述方法包括:接收用户输入的语义,并解析所述语义对应的字符串;
根据对话历史对所述语义进行预处理,判断所述语义是否为纠正所述数字串中的错误指令,当判定结果为是时,采用编辑距离算法找出要被纠正的数字串S中与纠正子串T最相似的一段并进行替换,通过多轮交互对所述数字串的语音识别错误进行纠正,并对所述字符串进行替换;
根据所述预处理后的语义更新所述字符串,并回复用户。
具体地,所述采用编辑距离算法找出要被纠正的数字串S中与纠正子串T最相似的一段并进行替换包括:
通过如下动态规划转移方程递归计算
其中,表示ai和bj不等时为1,否则为0,S中子串与T串的最小编辑距离为disS,T,disS,T(i,O)=0leva,b(i,j)为字符串a的前i个字符和字符串b的前j个字符之间的最小编辑距离;
利用与所述编辑距离相同的动态规划,算出所述字符串S的所有连续后缀子串与所述T串的最小编辑距离d1;
根据所述连续后缀子串的所有连续前缀子串与所述T串算出最小编辑距离d,即所述字符串S的子串与串T的最小编辑距离为d时表示所述数字串S的子串与T串为最相似的连续子串。
具体地,采用编辑距离算法找出要被纠正的数字串S中与纠正子串T最相似的一段并进行替换还包括:
其中,MATHCH、INSERT_MID、INSERT_HEAD、INSERT_TAIL、SUBSTITUTE_MID、SUBSTITUTE_HEAD、SUBSTITUDE_TAIL和DELETE分别为相同、插入中间、插入头部、插入尾部、替换中间、替换头部、替换尾部,且拥有不同的惩罚值。
优选地,所述数字串对应唯一的置信度。
所述数字串为电话号码时,判断所述电话号码的合法性,若所述电话号码合法,则纠正所述数字串;否则,依据顺序排列的不同惩罚值,依次执行编辑距离算法,直到找到合法的电话号码。
通过多轮对话交互对数字串的语音识别错误进行纠正,实现了用户自身可对识别错误的纠正,尤其是对数字串的纠正;通过使删除、插入、替换拥有不同的惩罚值,提升了人机交互中语音识别的正确率,同时,有效地增加了用户体验。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1为本发明一实施例提供的基于人机交互的数字串的纠正方法的流程示意图;
图2为本发明一实施例提供的基于人机交互的数字串的纠正装置的结构示意图;
图3为本发明一实施例提供的基于人机交互的数字串的纠正装置的结构示意图。
具体实施方式
为了解决现有技术中对数字串的语音识别错误纠正能力有限,同时缺乏考虑到用户自身可能会对识别错误进行纠正。本发明提出了一种基于人机交互的数字串的纠正方法及装置。。
图1示出了本发明一实施例提供的基于人机交互的数字串的纠正方法的流程示意图,如图1所示,该方法包括以下步骤:
S101、接收用户输入的语义,并解析所述语义对应的字符串。
S102、根据对话历史对所述语义进行预处理,判断所述语义是否为纠正所述数字串中的错误指令,当判定结果为是时,采用编辑距离算法找出要被纠正的数字串S中与纠正子串T最相似的一段并进行替换,通过多轮交互对所述数字串的语音识别错误进行纠正,并对所述字符串进行替换。
具体地,所述采用编辑距离算法找出要被纠正的数字串S中与纠正子串T最相似的一段并进行替换包括:
通过如下动态规划转移方程递归计算
其中,表示ai和bj不等时为1,否则为0,S中子串与T串的最小编辑距离为disS,T,disS,T(i,0)=0,leva,b(i,j)为字符串a的前i个字符和字符串b的前j个字符之间的最小编辑距离;
利用与所述编辑距离相同的动态规划,算出所述字符串S的所有连续后缀子串与所述T串的最小编辑距离d1
根据所述连续后缀子串的所有连续前缀子串与所述T串算出最小编辑距离d,即所述字符串S的子串与串T的最小编辑距离为d时表示所述数字串S的子串与T串为最相似的连续子串。
优选地,所述采用编辑距离算法找出要被纠正的数字串S中与纠正子串T最相似的一段并进行替换还包括:
其中,MATHCH、INSERT_MID、INSERT_HEAD、INSERT_TAIL、SUBSTITUTE_MID、SUBSTITUTE_HEAD、SUBSTITUDE_TAIL和DELETE分别为相同、插入中间、插入头部、插入尾部、替换中间、替换头部、替换尾部、删除,且拥有不同的惩罚值。
优选地,所述数字串对应唯一的置信度,即每个数字串对应一个该数字串可能性的置信度。
具体地,所述数字串为电话号码时,判断所述电话号码的合法性,若所述电话号码合法,则纠正所述数字串;否则,依据顺序排列的不同惩罚值,依次执行编辑距离算法,直到找到合法的电话号码。
当S是具有特殊功能的字符串时,例如电话号码,我们可以对上述过程进行进一步完善。首先要有一个电话号码合法性的程序,假如叫它verify,当号码合法时,返回True,否则返回False。有了这个验证程序,一个简单地策略是:判断由上述算法生成的电话号码是否合法,仅在合法的情况下进行修改,否则不更改。
可选地,我们可以设计多套惩罚值集合,并且给定它们的顺序,称为PENALTY_SET。然后,用不同PENALTY_SET得到多个纠正结果,分别通过verify函数,取第一个合法的电话号码当作纠正结果。
S103、根据所述预处理后的语义更新所述字符串,并回复用户。
根据预处理后的语义进行状态更新和决定给用户的回复,之后将系统的回复转化为语音播放给用户,其中,首先将语义回复转换为自然文本,然后将自然文本转换为声音播放给用户。用户可以继续对话直到对话结束为止。
图2是本发明一实施例提供的基于人机交互的数字串的纠正装置的结构示意图:
输入模块21,用于接收用户输入的语义,并解析所述语义对应的字符串。
控制模块22,用于根据对话历史对所述语义进行预处理,判断所述语义是否为纠正所述数字串中的错误指令,当判定结果为是时,采用编辑距离算法找出要被纠正的数字串S中与纠正子串T最相似的一段并进行替换;通过多轮交互对所述数字串的语音识别错误进行纠正,并对所述字符串进行替换;
具体地,采用编辑距离算法找出要被纠正的数字串S中与纠正子串T最相似的一段并进行替换包括:
通过如下动态规划转移方程递归计算
其中,表示ai和bj不等时为1,否则为0,S中子串与T串的最小编辑距离为disS,T,disS,T(i,0)=0,leva,b(i,j)为字符串a的前i个字符和字符串b的前j个字符之间的最小编辑距离;
利用与所述编辑距离相同的动态规划,算出所述字符串S的所有连续后缀子串与所述T串的最小编辑距离d1
根据所述连续后缀子串的所有连续前缀子串与所述T串算出最小编辑距离d,即所述字符串S的子串与串T的最小编辑距离为d时表示所述数字串S的子串与T串为最相似的连续子串。
优选地,采用编辑距离算法找出要被纠正的数字串S中与纠正子串T最相似的一段并进行替换还包括:
其中,MATHCH、INSERT_MID、INSERT_HEAD、INSERT_TAIL、SUBSTITUTE_MID、SUBSTITUTE_HEAD、SUBSTITUDE_TAIL和DELETE分别为相同、插入中间、插入头部、插入尾部、替换中间、替换头部、替换尾部、删除,且拥有不同的惩罚值。
具体地,数字串对应唯一的置信度。
具体地,数字串为电话号码时,判断所述电话号码的合法性,若所述电话号码合法,则纠正所述数字串;否则,依据顺序排列的不同惩罚值,依次执行编辑距离算法,直到找到合法的电话号码。
输出模块23,用于根据所述预处理后的语义更新所述字符串,并回复用户。
根据预处理后的语义进行状态更新和决定给用户的回复,之后将系统的回复转化为语音播放给用户,其中,首先将语义回复转换为自然文本,然后将自然文本转换为声音播放给用户。用户可以继续对话直到对话结束为止。
下面将对本发明的实施方式结合拨打电话号码的具体实例作进一步的详细描述(如图3所示)。
在此实例中,惩罚值集合PENALTY_SET包含两种惩罚值A和B,按顺序依次为:
假设在对话开始的时候,用户说“请拨打18377830989”,声音经过输入模块后得到包含2个候选语义的列表:一个表示电话号码是“18371830989”,可能性为0.7;另一个表示电话号码是“13371830989”,可能性是0.3。控制模块的对话状态跟踪部分根据此语义列表更新对话状态,得到新的系统状态,即用户想拨打的电话号码有两种可能的取值:一个是“18371830989”,置信度是0.7;另一个是“13371830989”,置信度是0.3,控制模块的对话决策部分然后根据此状态生成确认置信度最大的电话号码(即“18371830989”)的语义动作,输出模块将其转化为自然语言“你要拨打电话号码18371830989吗?”并合成语音播放给用户。
此时,用户发现系统说的号码有误,对系统说“是783”,声音经过输入模块后得到一个候选的语义,即将电话号码的某一部分改为“783”,置信度为1.0。在将此语义传到控制模块之前,需要利用纠正算法对此找出电话号码(即“18371830989”)要替换为“783”的部分,从而得到纠正后的电话号码。
纠正算法首先在惩罚值是A的条件下,将“18371830989”中第一个“183”替换为“783”即得到“78371830989”,电话号码合法性的程序verify发现此号码不是合法号码,将此纠正救过舍去,继续在惩罚值是B的条件下,将“18371830989”中的第二个“183”更改为“783”,即得到“18377830989”,verify判断此号码为合法号码,予以保留。经过此过程,用户的原始的语义转换为:电话号码是“18377830989”,置信度是1.0。控制模块中对话状态跟踪器根据此语义及上一轮的对话状态更新此对话状态,得到新的系统状态,即用户想拨打的电话号码有三种可能的取值:一个是“18377830989”,置信度是0.6,一个是“18371830989”,置信度是0.3;另一个是“13371830989”,置信度是0.1。控制模块的对话决策部分然后根据此状态生成确认置信度最大的电话号码(即“18377830989”)的语义动作,输出模块将其转化为自然语言“你要拨打电话号码18377830989吗?”并合成语音播放给用户。用户发现系统确认的号码正确,回答“是的”,整个对话结束。
通过多轮对话交互对数字串的语音识别错误进行纠正,实现了用户自身可对识别错误的纠正,尤其是对数字串的纠正;通过使删除、插入、替换拥有不同的惩罚值,提升了人机交互中语音识别的正确率,同时,有效地增加了用户体验。
尽管已描述了本申请的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本申请范围的所有变更和修改。
显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的精神和范围。这样,倘若本申请的这些修改和变型属于本申请权利要求及其等同技术的范围之内,则本申请也意图包含这些改动和变型在内。

Claims (8)

1.一种基于人机交互的数字串的纠正方法,其特征在于,所述方法包括:
接收用户输入的语义,并解析所述语义对应的字符串;
根据对话历史对所述语义进行预处理,判断所述语义是否为纠正所述字符串中的错误指令,当判定结果为是时,采用编辑距离算法找出要被纠正的数字串S中与纠正子串T最相似的一段并进行替换,通过多轮交互对所述数字串的语音识别错误进行纠正,并对所述字符串进行替换;
根据所述预处理后的语义更新所述字符串,并回复用户;
所述采用编辑距离算法找出要被纠正的数字串S中与纠正子串T最相似的一段并进行替换包括:
通过如下动态规划转移方程递归计算
<mrow> <msub> <mi>lev</mi> <mrow> <mi>a</mi> <mo>,</mo> <mi>b</mi> </mrow> </msub> <mrow> <mo>(</mo> <mi>i</mi> <mo>,</mo> <mi>j</mi> <mo>)</mo> </mrow> <mo>=</mo> <mfenced open = "{" close = ""> <mtable> <mtr> <mtd> <mrow> <mi>max</mi> <mrow> <mo>(</mo> <mi>i</mi> <mo>,</mo> <mi>j</mi> <mo>)</mo> </mrow> </mrow> </mtd> <mtd> <mrow> <mi>i</mi> <mi>f</mi> <mi> </mi> <mi>min</mi> <mrow> <mo>(</mo> <mi>i</mi> <mo>,</mo> <mi>j</mi> <mo>)</mo> </mrow> <mo>=</mo> <mn>0</mn> <mo>,</mo> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <mi>min</mi> <mfenced open = "{" close = ""> <mtable> <mtr> <mtd> <mrow> <msub> <mi>lev</mi> <mrow> <mi>a</mi> <mo>,</mo> <mi>b</mi> </mrow> </msub> <mrow> <mo>(</mo> <mi>i</mi> <mo>-</mo> <mn>1</mn> <mo>,</mo> <mi>j</mi> <mo>)</mo> </mrow> <mo>+</mo> <mn>1</mn> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <msub> <mi>lev</mi> <mrow> <mi>a</mi> <mo>,</mo> <mi>b</mi> </mrow> </msub> <mrow> <mo>(</mo> <mi>i</mi> <mo>,</mo> <mi>j</mi> <mo>-</mo> <mn>1</mn> <mo>)</mo> </mrow> <mo>+</mo> <mn>1</mn> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <msub> <mi>lev</mi> <mrow> <mi>a</mi> <mo>,</mo> <mi>b</mi> </mrow> </msub> <mrow> <mo>(</mo> <mi>i</mi> <mo>-</mo> <mn>1</mn> <mo>,</mo> <mi>j</mi> <mo>-</mo> <mn>1</mn> <mo>)</mo> </mrow> <mo>+</mo> <msub> <mn>1</mn> <mrow> <mo>(</mo> <msub> <mi>a</mi> <mi>i</mi> </msub> <mo>&amp;NotEqual;</mo> <msub> <mi>b</mi> <mi>j</mi> </msub> <mo>)</mo> </mrow> </msub> </mrow> </mtd> </mtr> </mtable> </mfenced> </mrow> </mtd> <mtd> <mrow> <mi>o</mi> <mi>t</mi> <mi>h</mi> <mi>e</mi> <mi>r</mi> <mi>w</mi> <mi>i</mi> <mi>s</mi> <mi>e</mi> <mo>.</mo> </mrow> </mtd> </mtr> </mtable> </mfenced> </mrow>
其中,表示ai和bj不等时为1,否则为0,S中子串与T串的最小编辑距离为disS,T,disS,T(i,0)=0,leva,b(i,j)为字符串a的前i个字符和字符串b的前j个字符之间的最小编辑距离;
利用与所述编辑距离相同的动态规划,算出所述字符串S的所有连续后缀子串与所述T串的最小编辑距离d1
根据所述连续后缀子串的所有连续前缀子串与所述T串算出最小编辑距离d,即所述字符串S的子串与串T的最小编辑距离为d时表示所述数字串S的子串与T串为最相似的连续子串。
2.根据权利要求1所述的方法,其特征在于,所述采用编辑距离算法找出要被纠正的数字串S中与纠正子串T最相似的一段并进行替换还包括:
<mfenced open = "" close = ""> <mtable> <mtr> <mtd> <mrow> <msub> <mi>dis</mi> <mrow> <mi>S</mi> <mo>,</mo> <mi>T</mi> </mrow> </msub> <mrow> <mo>(</mo> <mi>i</mi> <mo>,</mo> <mi>j</mi> <mo>)</mo> </mrow> <mo>=</mo> </mrow> </mtd> </mtr> <mtr> <mtd> <mfenced open = "{" close = ""> <mtable> <mtr> <mtd> <mn>0</mn> </mtd> <mtd> <mrow> <mi>i</mi> <mi>f</mi> <mi> </mi> <mi>j</mi> <mo>=</mo> <mn>0</mn> <mo>,</mo> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <mo>(</mo> <mi>i</mi> <mo>-</mo> <mn>1</mn> <mo>)</mo> <mo>&amp;times;</mo> <mi>I</mi> <mi>N</mi> <mi>S</mi> <mi>E</mi> <mi>R</mi> <mi>T</mi> <mo>_</mo> <mi>M</mi> <mi>I</mi> <mi>D</mi> <mo>+</mo> <mi>I</mi> <mi>N</mi> <mi>S</mi> <mi>E</mi> <mi>R</mi> <mi>T</mi> <mo>_</mo> <mi>H</mi> <mi>E</mi> <mi>A</mi> <mi>D</mi> </mrow> </mtd> <mtd> <mrow> <mi>i</mi> <mi>f</mi> <mi> </mi> <mi>i</mi> <mo>=</mo> <mn>0</mn> <mi>a</mi> <mi>n</mi> <mi>d</mi> <mi> </mi> <mi>j</mi> <mo>&gt;</mo> <mn>0</mn> <mo>,</mo> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <mi>min</mi> <mfenced open = "{" close = ""> <mtable> <mtr> <mtd> <mrow> <msub> <mi>dis</mi> <mrow> <mi>S</mi> <mo>,</mo> <mi>T</mi> </mrow> </msub> <mrow> <mo>(</mo> <mi>i</mi> <mo>-</mo> <mn>1</mn> <mo>,</mo> <mi>j</mi> <mo>)</mo> </mrow> <mo>+</mo> <mi>D</mi> <mi>E</mi> <mi>L</mi> <mi>E</mi> <mi>T</mi> <mi>E</mi> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <msub> <mi>dis</mi> <mrow> <mi>S</mi> <mo>,</mo> <mi>T</mi> </mrow> </msub> <mrow> <mo>(</mo> <mi>i</mi> <mo>,</mo> <mi>j</mi> <mo>-</mo> <mn>1</mn> <mo>)</mo> </mrow> <mo>+</mo> <mi>I</mi> <mi>N</mi> <mi>S</mi> <mi>E</mi> <mi>R</mi> <mi>T</mi> <mo>_</mo> <mi>H</mi> <mi>E</mi> <mi>A</mi> <mi>D</mi> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <msub> <mi>dis</mi> <mrow> <mi>S</mi> <mo>,</mo> <mi>T</mi> </mrow> </msub> <mrow> <mo>(</mo> <mi>i</mi> <mo>-</mo> <mn>1</mn> <mo>,</mo> <mi>j</mi> <mo>-</mo> <mn>1</mn> <mo>)</mo> </mrow> <mo>+</mo> <msub> <mn>1</mn> <mrow> <mo>(</mo> <msub> <mi>a</mi> <mi>i</mi> </msub> <mo>&amp;NotEqual;</mo> <msub> <mi>b</mi> <mi>j</mi> </msub> <mo>)</mo> </mrow> </msub> <mo>&amp;times;</mo> <mi>S</mi> <mi>U</mi> <mi>B</mi> <mi>S</mi> <mi>T</mi> <mi>I</mi> <mi>T</mi> <mi>U</mi> <mi>T</mi> <mi>E</mi> <mo>_</mo> <mi>H</mi> <mi>E</mi> <mi>A</mi> <mi>D</mi> <mo>+</mo> <msub> <mn>1</mn> <mrow> <mo>(</mo> <msub> <mi>a</mi> <mi>i</mi> </msub> <mo>&amp;NotEqual;</mo> <msub> <mi>b</mi> <mi>j</mi> </msub> <mo>)</mo> </mrow> </msub> <mo>&amp;times;</mo> <mi>M</mi> <mi>A</mi> <mi>T</mi> <mi>C</mi> <mi>H</mi> </mrow> </mtd> </mtr> </mtable> </mfenced> </mrow> </mtd> <mtd> <mrow> <mi>i</mi> <mi>f</mi> <mi> </mi> <mi>j</mi> <mo>=</mo> <mn>1</mn> <mo>,</mo> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <mi>min</mi> <mfenced open = "{" close = ""> <mtable> <mtr> <mtd> <mrow> <msub> <mi>dis</mi> <mrow> <mi>S</mi> <mo>,</mo> <mi>T</mi> </mrow> </msub> <mrow> <mo>(</mo> <mi>i</mi> <mo>-</mo> <mn>1</mn> <mo>,</mo> <mi>j</mi> <mo>)</mo> </mrow> <mo>+</mo> <mi>D</mi> <mi>E</mi> <mi>L</mi> <mi>E</mi> <mi>T</mi> <mi>E</mi> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <msub> <mi>dis</mi> <mrow> <mi>S</mi> <mo>,</mo> <mi>T</mi> </mrow> </msub> <mrow> <mo>(</mo> <mi>i</mi> <mo>,</mo> <mi>j</mi> <mo>-</mo> <mn>1</mn> <mo>)</mo> </mrow> <mo>+</mo> <mi>I</mi> <mi>N</mi> <mi>S</mi> <mi>E</mi> <mi>R</mi> <mi>T</mi> <mo>_</mo> <mi>M</mi> <mi>I</mi> <mi>D</mi> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <msub> <mi>dis</mi> <mrow> <mi>S</mi> <mo>,</mo> <mi>T</mi> </mrow> </msub> <mrow> <mo>(</mo> <mi>i</mi> <mo>-</mo> <mn>1</mn> <mo>,</mo> <mi>j</mi> <mo>-</mo> <mn>1</mn> <mo>)</mo> </mrow> <mo>+</mo> <msub> <mn>1</mn> <mrow> <mo>(</mo> <msub> <mi>a</mi> <mi>i</mi> </msub> <mo>&amp;NotEqual;</mo> <msub> <mi>b</mi> <mi>j</mi> </msub> <mo>)</mo> </mrow> </msub> <mo>&amp;times;</mo> <mi>S</mi> <mi>U</mi> <mi>B</mi> <mi>S</mi> <mi>T</mi> <mi>I</mi> <mi>T</mi> <mi>U</mi> <mi>T</mi> <mi>E</mi> <mo>_</mo> <mi>M</mi> <mi>I</mi> <mi>D</mi> <mo>+</mo> <msub> <mn>1</mn> <mrow> <mo>(</mo> <msub> <mi>a</mi> <mi>i</mi> </msub> <mo>&amp;NotEqual;</mo> <msub> <mi>b</mi> <mi>j</mi> </msub> <mo>)</mo> </mrow> </msub> <mo>&amp;times;</mo> <mi>M</mi> <mi>A</mi> <mi>T</mi> <mi>C</mi> <mi>H</mi> </mrow> </mtd> </mtr> </mtable> </mfenced> </mrow> </mtd> <mtd> <mrow> <mi>i</mi> <mi>f</mi> <mn>1</mn> <mo>&lt;</mo> <mi>j</mi> <mo>&lt;</mo> <mrow> <mo>|</mo> <mi>T</mi> <mo>|</mo> </mrow> <mo>,</mo> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <mi>min</mi> <mfenced open = "{" close = ""> <mtable> <mtr> <mtd> <mrow> <msub> <mi>dis</mi> <mrow> <mi>S</mi> <mo>,</mo> <mi>T</mi> </mrow> </msub> <mrow> <mo>(</mo> <mi>i</mi> <mo>-</mo> <mn>1</mn> <mo>,</mo> <mi>j</mi> <mo>)</mo> </mrow> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <msub> <mi>dis</mi> <mrow> <mi>S</mi> <mo>,</mo> <mi>T</mi> </mrow> </msub> <mrow> <mo>(</mo> <mi>i</mi> <mo>,</mo> <mi>j</mi> <mo>-</mo> <mn>1</mn> <mo>)</mo> </mrow> <mo>+</mo> <mi>I</mi> <mi>N</mi> <mi>S</mi> <mi>E</mi> <mi>R</mi> <mi>T</mi> <mo>_</mo> <mi>T</mi> <mi>A</mi> <mi>I</mi> <mi>L</mi> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <msub> <mi>dis</mi> <mrow> <mi>S</mi> <mo>,</mo> <mi>T</mi> </mrow> </msub> <mrow> <mo>(</mo> <mi>i</mi> <mo>-</mo> <mn>1</mn> <mo>,</mo> <mi>j</mi> <mo>-</mo> <mn>1</mn> <mo>)</mo> </mrow> <mo>+</mo> <msub> <mn>1</mn> <mrow> <mo>(</mo> <msub> <mi>a</mi> <mi>i</mi> </msub> <mo>&amp;NotEqual;</mo> <msub> <mi>b</mi> <mi>j</mi> </msub> <mo>)</mo> </mrow> </msub> <mo>&amp;times;</mo> <mi>S</mi> <mi>U</mi> <mi>B</mi> <mi>S</mi> <mi>T</mi> <mi>I</mi> <mi>T</mi> <mi>U</mi> <mi>T</mi> <mi>E</mi> <mo>_</mo> <mi>T</mi> <mi>A</mi> <mi>I</mi> <mi>L</mi> <mo>+</mo> <msub> <mn>1</mn> <mrow> <mo>(</mo> <msub> <mi>a</mi> <mi>i</mi> </msub> <mo>&amp;NotEqual;</mo> <msub> <mi>b</mi> <mi>j</mi> </msub> <mo>)</mo> </mrow> </msub> <mo>&amp;times;</mo> <mi>M</mi> <mi>A</mi> <mi>T</mi> <mi>C</mi> <mi>H</mi> </mrow> </mtd> </mtr> </mtable> </mfenced> </mrow> </mtd> <mtd> <mrow> <mi>i</mi> <mi>f</mi> <mi> </mi> <mi>j</mi> <mo>=</mo> <mrow> <mo>|</mo> <mi>T</mi> <mo>|</mo> </mrow> <mo>.</mo> </mrow> </mtd> </mtr> </mtable> </mfenced> </mtd> </mtr> </mtable> </mfenced>
其中,MATHCH、INSERT_MID、INSERT_HEAD、INSERT_TAIL、SUBSTITUTE_MID、SUBSTITUTE_HEAD、SUBSTITUDE_TAIL和DELETE分别为相同、插入中间、插入头部、插入尾部、替换中间、替换头部、替换尾部、删除,且拥有不同的惩罚值。
3.根据权利要求1所述的方法,其特征在于,所述数字串对应唯一的置信度。
4.根据权利要求1所述的方法,其特征在于,所述数字串为电话号码时,判断所述电话号码的合法性,若所述电话号码合法,则纠正所述数字串;否则,依据顺序排列的不同惩罚值,依次执行编辑距离算法,直到找到合法的电话号码。
5.一种基于人机交互的数字串的纠正装置,其特征在于,所述装置包括:
输入模块,用于接收用户输入的语义,并解析所述语义对应的字符串;
控制模块,用于根据对话历史对所述语义进行预处理,判断所述语义是否为纠正所述数字串中的错误指令,当判定结果为是时,采用编辑距离算法找出要被纠正的数字串S中与纠正子串T最相似的一段并进行替换;通过多轮交互对所述数字串的语音识别错误进行纠正,并对所述字符串进行替换;
输出模块,用于根据所述预处理后的语义更新所述字符串,并回复用户;
所述采用编辑距离算法找出要被纠正的数字串S中与纠正子串T最相似的一段并进行替换包括:
通过如下动态规划转移方程递归计算
<mrow> <msub> <mi>lev</mi> <mrow> <mi>a</mi> <mo>,</mo> <mi>b</mi> </mrow> </msub> <mrow> <mo>(</mo> <mi>i</mi> <mo>,</mo> <mi>j</mi> <mo>)</mo> </mrow> <mo>=</mo> <mfenced open = "{" close = ""> <mtable> <mtr> <mtd> <mrow> <mi>max</mi> <mrow> <mo>(</mo> <mi>i</mi> <mo>,</mo> <mi>j</mi> <mo>)</mo> </mrow> </mrow> </mtd> <mtd> <mrow> <mi>i</mi> <mi>f</mi> <mi> </mi> <mi>min</mi> <mrow> <mo>(</mo> <mi>i</mi> <mo>,</mo> <mi>j</mi> <mo>)</mo> </mrow> <mo>=</mo> <mn>0</mn> <mo>,</mo> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <mi>min</mi> <mfenced open = "{" close = ""> <mtable> <mtr> <mtd> <mrow> <msub> <mi>lev</mi> <mrow> <mi>a</mi> <mo>,</mo> <mi>b</mi> </mrow> </msub> <mrow> <mo>(</mo> <mi>i</mi> <mo>-</mo> <mn>1</mn> <mo>,</mo> <mi>j</mi> <mo>)</mo> </mrow> <mo>+</mo> <mn>1</mn> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <msub> <mi>lev</mi> <mrow> <mi>a</mi> <mo>,</mo> <mi>b</mi> </mrow> </msub> <mrow> <mo>(</mo> <mi>i</mi> <mo>,</mo> <mi>j</mi> <mo>-</mo> <mn>1</mn> <mo>)</mo> </mrow> <mo>+</mo> <mn>1</mn> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <msub> <mi>lev</mi> <mrow> <mi>a</mi> <mo>,</mo> <mi>b</mi> </mrow> </msub> <mrow> <mo>(</mo> <mi>i</mi> <mo>-</mo> <mn>1</mn> <mo>,</mo> <mi>j</mi> <mo>-</mo> <mn>1</mn> <mo>)</mo> </mrow> <mo>+</mo> <msub> <mn>1</mn> <mrow> <mo>(</mo> <msub> <mi>a</mi> <mi>i</mi> </msub> <mo>&amp;NotEqual;</mo> <msub> <mi>b</mi> <mi>j</mi> </msub> <mo>)</mo> </mrow> </msub> </mrow> </mtd> </mtr> </mtable> </mfenced> </mrow> </mtd> <mtd> <mrow> <mi>o</mi> <mi>t</mi> <mi>h</mi> <mi>e</mi> <mi>r</mi> <mi>w</mi> <mi>i</mi> <mi>s</mi> <mi>e</mi> <mo>.</mo> </mrow> </mtd> </mtr> </mtable> </mfenced> </mrow>
其中,表示ai和bj不等时为1,否则为0,S中子串与T串的最小编辑距离为disS,T,disS,T(i,0)=0,leva,b(i,j)为字符串a的前i个字符和字符串b的前j个字符之间的最小编辑距离;
利用与所述编辑距离相同的动态规划,算出所述字符串S的所有连续后缀子串与所述T串的最小编辑距离d1
根据所述连续后缀子串的所有连续前缀子串与所述T串算出最小编辑距离d,即所述字符串S的子串与串T的最小编辑距离为d时表示所述数字串S的子串与T串为最相似的连续子串。
6.根据权利要求5所述的装置,其特征在于,所述采用编辑距离算法找出要被纠正的数字串S中与纠正子串T最相似的一段并进行替换还包括:
<mfenced open = "" close = ""> <mtable> <mtr> <mtd> <mrow> <msub> <mi>dis</mi> <mrow> <mi>S</mi> <mo>,</mo> <mi>T</mi> </mrow> </msub> <mrow> <mo>(</mo> <mi>i</mi> <mo>,</mo> <mi>j</mi> <mo>)</mo> </mrow> <mo>=</mo> </mrow> </mtd> </mtr> <mtr> <mtd> <mfenced open = "{" close = ""> <mtable> <mtr> <mtd> <mn>0</mn> </mtd> <mtd> <mrow> <mi>i</mi> <mi>f</mi> <mi> </mi> <mi>j</mi> <mo>=</mo> <mn>0</mn> <mo>,</mo> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <mo>(</mo> <mi>i</mi> <mo>-</mo> <mn>1</mn> <mo>)</mo> <mo>&amp;times;</mo> <mi>I</mi> <mi>N</mi> <mi>S</mi> <mi>E</mi> <mi>R</mi> <mi>T</mi> <mo>_</mo> <mi>M</mi> <mi>I</mi> <mi>D</mi> <mo>+</mo> <mi>I</mi> <mi>N</mi> <mi>S</mi> <mi>E</mi> <mi>R</mi> <mi>T</mi> <mo>_</mo> <mi>H</mi> <mi>E</mi> <mi>A</mi> <mi>D</mi> </mrow> </mtd> <mtd> <mrow> <mi>i</mi> <mi>f</mi> <mi> </mi> <mi>i</mi> <mo>=</mo> <mn>0</mn> <mi>a</mi> <mi>n</mi> <mi>d</mi> <mi> </mi> <mi>j</mi> <mo>&gt;</mo> <mn>0</mn> <mo>,</mo> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <mi>min</mi> <mfenced open = "{" close = ""> <mtable> <mtr> <mtd> <mrow> <msub> <mi>dis</mi> <mrow> <mi>S</mi> <mo>,</mo> <mi>T</mi> </mrow> </msub> <mrow> <mo>(</mo> <mi>i</mi> <mo>-</mo> <mn>1</mn> <mo>,</mo> <mi>j</mi> <mo>)</mo> </mrow> <mo>+</mo> <mi>D</mi> <mi>E</mi> <mi>L</mi> <mi>E</mi> <mi>T</mi> <mi>E</mi> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <msub> <mi>dis</mi> <mrow> <mi>S</mi> <mo>,</mo> <mi>T</mi> </mrow> </msub> <mrow> <mo>(</mo> <mi>i</mi> <mo>,</mo> <mi>j</mi> <mo>-</mo> <mn>1</mn> <mo>)</mo> </mrow> <mo>+</mo> <mi>I</mi> <mi>N</mi> <mi>S</mi> <mi>E</mi> <mi>R</mi> <mi>T</mi> <mo>_</mo> <mi>H</mi> <mi>E</mi> <mi>A</mi> <mi>D</mi> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <msub> <mi>dis</mi> <mrow> <mi>S</mi> <mo>,</mo> <mi>T</mi> </mrow> </msub> <mrow> <mo>(</mo> <mi>i</mi> <mo>-</mo> <mn>1</mn> <mo>,</mo> <mi>j</mi> <mo>-</mo> <mn>1</mn> <mo>)</mo> </mrow> <mo>+</mo> <msub> <mn>1</mn> <mrow> <mo>(</mo> <msub> <mi>a</mi> <mi>i</mi> </msub> <mo>&amp;NotEqual;</mo> <msub> <mi>b</mi> <mi>j</mi> </msub> <mo>)</mo> </mrow> </msub> <mo>&amp;times;</mo> <mi>S</mi> <mi>U</mi> <mi>B</mi> <mi>S</mi> <mi>T</mi> <mi>I</mi> <mi>T</mi> <mi>U</mi> <mi>T</mi> <mi>E</mi> <mo>_</mo> <mi>H</mi> <mi>E</mi> <mi>A</mi> <mi>D</mi> <mo>+</mo> <msub> <mn>1</mn> <mrow> <mo>(</mo> <msub> <mi>a</mi> <mi>i</mi> </msub> <mo>&amp;NotEqual;</mo> <msub> <mi>b</mi> <mi>j</mi> </msub> <mo>)</mo> </mrow> </msub> <mo>&amp;times;</mo> <mi>M</mi> <mi>A</mi> <mi>T</mi> <mi>C</mi> <mi>H</mi> </mrow> </mtd> </mtr> </mtable> </mfenced> </mrow> </mtd> <mtd> <mrow> <mi>i</mi> <mi>f</mi> <mi> </mi> <mi>j</mi> <mo>=</mo> <mn>1</mn> <mo>,</mo> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <mi>min</mi> <mfenced open = "{" close = ""> <mtable> <mtr> <mtd> <mrow> <msub> <mi>dis</mi> <mrow> <mi>S</mi> <mo>,</mo> <mi>T</mi> </mrow> </msub> <mrow> <mo>(</mo> <mi>i</mi> <mo>-</mo> <mn>1</mn> <mo>,</mo> <mi>j</mi> <mo>)</mo> </mrow> <mo>+</mo> <mi>D</mi> <mi>E</mi> <mi>L</mi> <mi>E</mi> <mi>T</mi> <mi>E</mi> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <msub> <mi>dis</mi> <mrow> <mi>S</mi> <mo>,</mo> <mi>T</mi> </mrow> </msub> <mrow> <mo>(</mo> <mi>i</mi> <mo>,</mo> <mi>j</mi> <mo>-</mo> <mn>1</mn> <mo>)</mo> </mrow> <mo>+</mo> <mi>I</mi> <mi>N</mi> <mi>S</mi> <mi>E</mi> <mi>R</mi> <mi>T</mi> <mo>_</mo> <mi>M</mi> <mi>I</mi> <mi>D</mi> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <msub> <mi>dis</mi> <mrow> <mi>S</mi> <mo>,</mo> <mi>T</mi> </mrow> </msub> <mrow> <mo>(</mo> <mi>i</mi> <mo>-</mo> <mn>1</mn> <mo>,</mo> <mi>j</mi> <mo>-</mo> <mn>1</mn> <mo>)</mo> </mrow> <mo>+</mo> <msub> <mn>1</mn> <mrow> <mo>(</mo> <msub> <mi>a</mi> <mi>i</mi> </msub> <mo>&amp;NotEqual;</mo> <msub> <mi>b</mi> <mi>j</mi> </msub> <mo>)</mo> </mrow> </msub> <mo>&amp;times;</mo> <mi>S</mi> <mi>U</mi> <mi>B</mi> <mi>S</mi> <mi>T</mi> <mi>I</mi> <mi>T</mi> <mi>U</mi> <mi>T</mi> <mi>E</mi> <mo>_</mo> <mi>M</mi> <mi>I</mi> <mi>D</mi> <mo>+</mo> <msub> <mn>1</mn> <mrow> <mo>(</mo> <msub> <mi>a</mi> <mi>i</mi> </msub> <mo>&amp;NotEqual;</mo> <msub> <mi>b</mi> <mi>j</mi> </msub> <mo>)</mo> </mrow> </msub> <mo>&amp;times;</mo> <mi>M</mi> <mi>A</mi> <mi>T</mi> <mi>C</mi> <mi>H</mi> </mrow> </mtd> </mtr> </mtable> </mfenced> </mrow> </mtd> <mtd> <mrow> <mi>i</mi> <mi>f</mi> <mn>1</mn> <mo>&lt;</mo> <mi>j</mi> <mo>&lt;</mo> <mrow> <mo>|</mo> <mi>T</mi> <mo>|</mo> </mrow> <mo>,</mo> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <mi>min</mi> <mfenced open = "{" close = ""> <mtable> <mtr> <mtd> <mrow> <msub> <mi>dis</mi> <mrow> <mi>S</mi> <mo>,</mo> <mi>T</mi> </mrow> </msub> <mrow> <mo>(</mo> <mi>i</mi> <mo>-</mo> <mn>1</mn> <mo>,</mo> <mi>j</mi> <mo>)</mo> </mrow> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <msub> <mi>dis</mi> <mrow> <mi>S</mi> <mo>,</mo> <mi>T</mi> </mrow> </msub> <mrow> <mo>(</mo> <mi>i</mi> <mo>,</mo> <mi>j</mi> <mo>-</mo> <mn>1</mn> <mo>)</mo> </mrow> <mo>+</mo> <mi>I</mi> <mi>N</mi> <mi>S</mi> <mi>E</mi> <mi>R</mi> <mi>T</mi> <mo>_</mo> <mi>T</mi> <mi>A</mi> <mi>I</mi> <mi>L</mi> </mrow> </mtd> </mtr> <mtr> <mtd> <mrow> <msub> <mi>dis</mi> <mrow> <mi>S</mi> <mo>,</mo> <mi>T</mi> </mrow> </msub> <mrow> <mo>(</mo> <mi>i</mi> <mo>-</mo> <mn>1</mn> <mo>,</mo> <mi>j</mi> <mo>-</mo> <mn>1</mn> <mo>)</mo> </mrow> <mo>+</mo> <msub> <mn>1</mn> <mrow> <mo>(</mo> <msub> <mi>a</mi> <mi>i</mi> </msub> <mo>&amp;NotEqual;</mo> <msub> <mi>b</mi> <mi>j</mi> </msub> <mo>)</mo> </mrow> </msub> <mo>&amp;times;</mo> <mi>S</mi> <mi>U</mi> <mi>B</mi> <mi>S</mi> <mi>T</mi> <mi>I</mi> <mi>T</mi> <mi>U</mi> <mi>T</mi> <mi>E</mi> <mo>_</mo> <mi>T</mi> <mi>A</mi> <mi>I</mi> <mi>L</mi> <mo>+</mo> <msub> <mn>1</mn> <mrow> <mo>(</mo> <msub> <mi>a</mi> <mi>i</mi> </msub> <mo>&amp;NotEqual;</mo> <msub> <mi>b</mi> <mi>j</mi> </msub> <mo>)</mo> </mrow> </msub> <mo>&amp;times;</mo> <mi>M</mi> <mi>A</mi> <mi>T</mi> <mi>C</mi> <mi>H</mi> </mrow> </mtd> </mtr> </mtable> </mfenced> </mrow> </mtd> <mtd> <mrow> <mi>i</mi> <mi>f</mi> <mi> </mi> <mi>j</mi> <mo>=</mo> <mrow> <mo>|</mo> <mi>T</mi> <mo>|</mo> </mrow> <mo>.</mo> </mrow> </mtd> </mtr> </mtable> </mfenced> </mtd> </mtr> </mtable> </mfenced>
其中,MATHCH、INSERT_MID、INSERT_HEAD、INSERT_TAIL、SUBSTITUTE_MID、SUBSTITUTE_HEAD、SUBSTITUDE_TAIL和DELETE分别为相同、插入中间、插入头部、插入尾部、替换中间、替换头部、替换尾部、删除,且拥有不同的惩罚值。
7.根据权利要求5所述的装置,其特征在于,所述数字串对应唯一的置信度。
8.根据权利要求5所述的装置,其特征在于,所述数字串为电话号码时,判断所述电话号码的合法性,若所述电话号码合法,则纠正所述数字串;否则,依据顺序排列的不同惩罚值,依次执行编辑距离算法,直到找到合法的电话号码。
CN201510796507.7A 2015-11-18 2015-11-18 一种基于人机交互的数字串的纠正方法及装置 Active CN105468582B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510796507.7A CN105468582B (zh) 2015-11-18 2015-11-18 一种基于人机交互的数字串的纠正方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510796507.7A CN105468582B (zh) 2015-11-18 2015-11-18 一种基于人机交互的数字串的纠正方法及装置

Publications (2)

Publication Number Publication Date
CN105468582A CN105468582A (zh) 2016-04-06
CN105468582B true CN105468582B (zh) 2018-03-02

Family

ID=55606298

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510796507.7A Active CN105468582B (zh) 2015-11-18 2015-11-18 一种基于人机交互的数字串的纠正方法及装置

Country Status (1)

Country Link
CN (1) CN105468582B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107659847B (zh) * 2016-09-22 2019-10-15 腾讯科技(北京)有限公司 语音互动方法和装置
CN107463601B (zh) 2017-06-13 2021-02-12 北京百度网讯科技有限公司 基于人工智能的对话理解系统构建方法、装置、设备及计算机可读存储介质
CN108877792B (zh) * 2018-05-30 2023-10-24 北京百度网讯科技有限公司 用于处理语音对话的方法、装置、电子设备以及计算机可读存储介质
CN109783621B (zh) * 2018-12-17 2021-10-08 北京百度网讯科技有限公司 对话生成方法、装置及设备
CN109949803B (zh) * 2019-02-11 2020-01-31 特斯联(北京)科技有限公司 基于语义指令智能识别的建筑服务设施控制方法及系统
CN115470325B (zh) * 2021-06-10 2024-05-10 腾讯科技(深圳)有限公司 消息回复方法、装置及设备
CN113408637A (zh) * 2021-06-30 2021-09-17 贵州电网有限责任公司 一种基于相似度算法的操作票匹配方法

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1299503A (zh) * 1998-12-29 2001-06-13 皇家菲利浦电子有限公司 适用于自动语音识别系统的n最佳列表的基于知识的策略
CN101295293A (zh) * 2007-04-29 2008-10-29 摩托罗拉公司 用于对表意字符的输入字符串进行自动纠错的方法
CN102156551A (zh) * 2011-03-30 2011-08-17 北京搜狗科技发展有限公司 一种字词输入的纠错方法及系统
US8798250B1 (en) * 2013-02-11 2014-08-05 Blackberry Limited Autocorrect for phone numbers
EP2765761A1 (en) * 2013-02-11 2014-08-13 BlackBerry Limited Autocorrect for telephone numbers

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1299503A (zh) * 1998-12-29 2001-06-13 皇家菲利浦电子有限公司 适用于自动语音识别系统的n最佳列表的基于知识的策略
CN101295293A (zh) * 2007-04-29 2008-10-29 摩托罗拉公司 用于对表意字符的输入字符串进行自动纠错的方法
CN102156551A (zh) * 2011-03-30 2011-08-17 北京搜狗科技发展有限公司 一种字词输入的纠错方法及系统
US8798250B1 (en) * 2013-02-11 2014-08-05 Blackberry Limited Autocorrect for phone numbers
EP2765761A1 (en) * 2013-02-11 2014-08-13 BlackBerry Limited Autocorrect for telephone numbers

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
密度惩罚支持向量数据描述;张莉 等;《模式识别与人工智能》;20140227;第27卷(第2期);第160-165页 *

Also Published As

Publication number Publication date
CN105468582A (zh) 2016-04-06

Similar Documents

Publication Publication Date Title
CN105468582B (zh) 一种基于人机交互的数字串的纠正方法及装置
EP4068280A1 (en) Speech recognition error correction method, related devices, and readable storage medium
US8738375B2 (en) System and method for optimizing speech recognition and natural language parameters with user feedback
CN108564953B (zh) 一种语音识别文本的标点处理方法及装置
CN103474069B (zh) 用于融合多个语音识别系统的识别结果的方法及系统
US20120215539A1 (en) Hybridized client-server speech recognition
US10395647B2 (en) System and method for natural language processing
US9396725B2 (en) System and method for optimizing speech recognition and natural language parameters with user feedback
CN101183525A (zh) 用于自动语音识别系统的自适应语境
CN107239547B (zh) 用于语音点歌的语音纠错方法、终端及存储介质
CN105282332B (zh) 语音拨号方法及装置
CN111292740A (zh) 语音辨识系统及其方法、与电脑程序产品
JP2000122687A (ja) 言語モデルを更新する方法
CN111539199B (zh) 文本的纠错方法、装置、终端、及存储介质
CN110164416B (zh) 一种语音识别方法及其装置、设备和存储介质
CN110798733A (zh) 一种字幕生成方法、装置及计算机存储介质、电子设备
JP2010256498A (ja) 変換モデル生成装置、音声認識結果変換システム、方法およびプログラム
CN111462748A (zh) 语音识别处理方法、装置、电子设备及存储介质
CN105632495A (zh) 语音识别方法和装置
CN102866783B (zh) 一种拼音流切分方法和系统
JP2018045594A (ja) 文章生成装置および文章生成方法
KR20120052591A (ko) 연속어 음성인식 시스템에서 오류수정 장치 및 방법
US20060136195A1 (en) Text grouping for disambiguation in a speech application
EP4254400A1 (en) Method and device for determining user intent
Eide Automatic modeling of pronunciation variations.

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP03 Change of name, title or address
CP03 Change of name, title or address

Address after: 215123 building 14, Tengfei Innovation Park, 388 Xinping street, Suzhou Industrial Park, Suzhou City, Jiangsu Province

Patentee after: Sipic Technology Co.,Ltd.

Address before: 215123 room 703, building 9, 328 Xinghu street, Suzhou Industrial Park, Jiangsu Province

Patentee before: AI SPEECH Co.,Ltd.

PE01 Entry into force of the registration of the contract for pledge of patent right
PE01 Entry into force of the registration of the contract for pledge of patent right

Denomination of invention: A Method and Device for Correcting Digital Strings Based on Human Machine Interaction

Effective date of registration: 20230726

Granted publication date: 20180302

Pledgee: CITIC Bank Limited by Share Ltd. Suzhou branch

Pledgor: Sipic Technology Co.,Ltd.

Registration number: Y2023980049433