CN103366741B - 语音输入纠错方法及系统 - Google Patents

语音输入纠错方法及系统 Download PDF

Info

Publication number
CN103366741B
CN103366741B CN201210101294.8A CN201210101294A CN103366741B CN 103366741 B CN103366741 B CN 103366741B CN 201210101294 A CN201210101294 A CN 201210101294A CN 103366741 B CN103366741 B CN 103366741B
Authority
CN
China
Prior art keywords
content
modified
voice
text
identification
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201210101294.8A
Other languages
English (en)
Other versions
CN103366741A (zh
Inventor
蔡洪滨
李曜
陈良军
何昕
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
SHANGHAI GEAK ELECTRONICS Co.,Ltd.
Original Assignee
SHANGHAI GUOKE ELECTRONIC CO Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by SHANGHAI GUOKE ELECTRONIC CO Ltd filed Critical SHANGHAI GUOKE ELECTRONIC CO Ltd
Priority to CN201210101294.8A priority Critical patent/CN103366741B/zh
Publication of CN103366741A publication Critical patent/CN103366741A/zh
Application granted granted Critical
Publication of CN103366741B publication Critical patent/CN103366741B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Telephonic Communication Services (AREA)
  • Machine Translation (AREA)

Abstract

本发明涉及一种语音输入纠错方法及系统,所述方法包括:将输入的语音转化成识别文本和识别网络;根据所述识别网络生成词汇网络;获取所述识别文本中待修正内容;以及获取修改备选项替换或重录指令,若为修改备选项替换指令,则根据所述词汇网络生成对应于所述待修正内容的修改备选项,并从所述修改备选项中选择正确内容替换所述待修正内容;若为重录指令,则重新获取对应于所述待修正内容的语音并修正所述待修正内容,本发明不仅可以提供修改备选项以修改所述识别文本中的出错部分,也可通过重录部分语音来修改所述识别文本中的出错部分。

Description

语音输入纠错方法及系统
技术领域
本发明属于语音识别领域,特别涉及一种语音输入纠错方法及系统。
背景技术
语音输入是通过语音识别将人说话的内容转换为文本的一种输入方式。由于在实际应用中,语音识别面对的环境十分复杂,需要处理各种不同领域的说话内容,识别性能很难达到百分之百,所以对于文本准确性要求较高的应用而言,识别结果文本的修改显得格外重要,目前常见的语音输入纠错方法包括:用户自行编辑文本;用户通过移动光标选择有错误的文本以获得候选;用户通过整句重说的方式进行纠错等,这些方法通常会使用户感到明显的不流畅感。
因此,目前亟需一种方便流畅的修改方法以提高输入效率,从而提升用户体验。
发明内容
本发明的目的在于提供一种语音输入纠错方法及系统,不仅可以提供修改备选项以修改所述识别文本中的出错部分,也可通过重录部分语音来修改所述识别文本中的出错部分。
为解决上述问题,本发明提供一种语音输入纠错方法,包括:
将输入的语音转化成识别文本和识别网络;
根据所述识别网络生成词汇网络;
获取所述识别文本中待修正内容;以及
获取修改备选项替换或重录指令,若为修改备选项替换指令,则根据所述词汇网络生成对应于所述待修正内容的修改备选项,并从所述修改备选项中选择正确内容替换所述待修正内容;若为重录指令,则重新获取对应于所述待修正内容的语音并修正所述待修正内容。
进一步的,在上述方法中,通过触摸控制操作获取所述识别文本中待修正内容、获取修改备选项替换或重录指令、从所述修改备选项中选择正确内容替换所述待修正内容以及重新获取对应于所述待修正内容的语音并修正所述待修正内容。
进一步的,在上述方法中,通过预设的自适应声学模型和自然语言模型将输入的语音转化成识别文本和识别网络。
进一步的,在上述方法中,所述重新获取对应于所述待修正内容的语音并修正所述待修正内容的步骤包括:重新获取对应于所述待修正内容的语音并将所述重新获取的语音转化为新的识别文本和新的识别网络,根据所述新的识别文本或新的识别网络修正所述待修正内容。
进一步的,在上述方法中,根据所述待修正内容在所述识别文本中的上下文信息将所述重新获取的语音转化为新的识别文本和新的识别网络。
进一步的,在上述方法中,所述根据所述新的识别文本和新的识别网络修正所述待修正内容的步骤包括:
判断所述新的识别文本是否正确;
若正确,则将所述新的识别文本替换所述待修正内容;
若不正确,根据所述新的识别网络生成新的词汇网络,并获取修改备选项替换或重录指令,若为修改备选项替换指令,则根据所述新的词汇网络生成对应于所述待修正内容的新的修改备选项,并从所述新的修改备选项中选择正确内容替换所述待修正内容;若为重录指令,则重新获取对应于所述待修正内容的语音并修正所述待修正内容。
进一步的,在上述方法中,所述识别网络包括对应所述语音的最佳文本序列和候选文本序列。
进一步的,在上述方法中,所述识别文本为所述最佳文本序列。
进一步的,在上述方法中,所述词汇网络包括根据所述最佳文本序列和候选文本序列生成的多个基本的词汇单元。
进一步的,在上述方法中,所述候选文本序列的词汇单元与所述最佳文本序列的词汇单元一一对应。
根据本发明的另一面,提供一种语音输入纠错系统,包括:
识别引擎模块,用于将输入的语音转化成识别文本和识别网络;以及
修正模块,用于根据所述识别网络生成词汇网络,获取所述识别文本中待修正内容,并获取修改备选项替换或重录指令;若为修改备选项替换指令,则根据所述词汇网络生成对应于所述待修正内容的修改备选项,并从所述修改备选项中选择正确内容替换所述待修正内容;若为重录指令,则重新获取对应于所述待修正内容的语音并修正所述待修正内容。
进一步的,在上述系统中,识别引擎模块包括:
声学模型单元,用于预设自适应声学模型;
语言模型单元,用于预设自然语言模型;
转化单元,用于通过所述自适应声学模型和自然语言模型将输入的语音转化成识别文本和识别网络或将重新获取的语音转化成新的识别文本和新的识别网络。
进一步的,在上述系统中,所述修正模块包括:
词汇网络单元,用于根据所述识别网络生成词汇网络或根据所述新的识别网络生成新的词汇网络;
修正定位单元,用于获取所述识别文本中待修正内容;
候选单元,用于根据所述词汇网络生成对应于所述待修正内容的修改备选项或根据所述新的词汇网络生成对应于所述待修正内容的新的修改备选项;
第一判断单元,用于获取修改备选项替换或重录指令,若为修改备选项替换指令,则通知替换单元处理,若为重录指令,则通知重录单元处理;
替换单元,用于从所述修改备选项或新的修改备选项中选择正确内容替换所述待修正内容,以及用于将所述新的识别文本替换所述待修正内容;
重录单元,用于重新获取对应于所述待修正内容的语音并发送到所述识别引擎模块处理。
进一步的,在上述系统中,所述修正模块还包括第二判断单元,用于判断所述新的识别文本是否正确,若正确,则通知所述替换单元处理;若不正确,则通知重录单元处理。
与现有技术相比,本发明通过将输入的语音转化成识别文本和识别网络,然后根据所述识别网络生成词汇网络,再获取所述识别文本中待修正内容,进而获取修改备选项替换或重录指令,若为修改备选项替换指令,则根据所述词汇网络生成对应于所述待修正内容的修改备选项,并从所述修改备选项中选择正确内容替换所述待修正内容;若为重录指令,则重新获取对应于所述待修正内容的语音并修正所述待修正内容,这样不仅可以提供修改备选项以修改所述识别文本中的出错部分,也可通过重录部分语音来修改所述识别文本中的出错部分。
另外,通过触摸控制操作获取所述识别文本中待修正内容、获取修改备选项替换或重录指令、从所述修改备选项中选择正确内容替换所述待修正内容以及重新获取对应于所述待修正内容的语音并修正所述待修正内容,用户只需要在设备的触摸屏上进行划动,即可选定需要进行纠错的识别文本,同时弹出修改备选项及重新录音的按键,使用户可以快速选择正确的输入文本,或只需要重新说被识别错的部分文本即可进行纠错,使纠错速度比现有技术更高,操作更方便。
此外,通过根据所述待修正内容在所述识别文本中的上下文信息将所述重新获取的语音转化为新的识别文本和新的识别网络,能够将原有的上下文引入第二次语音识别过程中以提高识别可靠性。
附图说明
图1是本发明实施例的语音输入纠错方法的流程图;
图2是本发明实施例的识别文本展示界面图;
图3是本发明实施例的识别文本纠错界面图;
图4是本发明实施例的语音输入纠错实现图;
图5是本发明实施例的语音输入纠错系统的功能模块图。
具体实施方式
为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
如图1~4所示,本发明提供一种语音输入纠错方法,包括:
步骤S1,将输入的语音转化成识别文本和识别网络,具体的,可通过预设的自适应声学模型和自然语言模型将输入的语音转化成识别文本和识别网络,所述识别网络可包括对应所述语音的最佳文本序列和候选文本序列,可选的,所述识别文本为所述最佳文本序列,例如一输入语音转化成的识别网络如下:
今天下雨所以我不出门了
今天不下雨所以我不出门了
今天下雨所以我不想出门了
其中,可将第一句“今天下雨以我不出门了”作为所述最佳文本序列和所述识别文本,第二句“今天不下雨所以我不出门了”和第三句“今天下雨所以我不想出门了”作为所述候选文本序列;
步骤S2,根据所述识别网络生成词汇网络,具体的,所述词汇网络包括根据所述最佳文本序列和候选文本序列生成的多个基本的词汇单元,所述候选文本序列的词汇单元与所述最佳文本序列的词汇单元一一对应,即利用语音识别产生的所述识别网络,将用户的输入语音识别成一个个基本的词汇单元,并通过动态匹配方法,将若干个候选文本序列中的每个词汇单元都一一对应到最佳候选序列中的一个词汇单元上,例如,上述三个句子生成的词汇网络如下:
今天|下雨|所以|我|不|出门|了
今天|不下雨|所以|我|不|出门|了
今天|下雨|所以|我|不想|出门|了
其中,上述词汇网络中用竖线隔开是就是一个个词汇单元,最佳文本序列(第一句)里的“下雨”词汇单元与候选句(第二句和第三句)里的“不下雨”和“下雨”对应;
步骤S3,获取所述识别文本中待修正内容,具体的,可通过触摸控制操作获取所述识别文本中待修正内容,例如:
用户启动语音输入,说“我女儿三岁了,她喜欢玩拼图游戏”;
在如图2所示的界面上所述识别文本显示为:“我女儿三岁了,他喜欢玩平图游戏”;
用户想修改“他”为“她”,可用手指或手写笔在“他”字上面轻轻滑动,如图线条21表示用户手指(或手写笔)在屏幕上滑动轨迹;
步骤S4,获取修改备选项替换或重录指令,若为修改备选项替换指令,则执行步骤S5;若为重录指令,则执行步骤S6,具体的,通过检测上述步骤S3中滑动轨迹,确定哪部分识别文本需要纠错,可通过触摸控制操作获取修改备选项替换或重录指令,如可相应弹出修改备选项和重新录音按键以供用户选择进入;
步骤S5,根据所述词汇网络生成对应于所述待修正内容的修改备选项,并从所述修改备选项中选择正确内容替换所述待修正内容,具体的,所述修改备选项可为若干词汇单元,即与所述最佳文本序列中所述待修正内容的词汇单元一一对应的所述候选文本序列的词汇单元,用户在进行修改时,只能看到最佳文本序列,用户可以充分利用触摸屏的特点进行触控修改,当确定所述识别文本中待修正内容后,基于上述识别网络生成的一一对应的词汇网络,如上述“今天|下雨|所以|我|不|出门|了”的例子中,当需要修改“下雨”这个词时,可根据词汇网络为用户提供“不下雨”作为修改备选项供用户选择为正确内容替换所述待修正内容,具体可通过触摸控制操作从所述修改备选项中选择正确内容替换所述待修正内容,又如上述“我女儿三岁了,他喜欢玩平图游戏”的例子中“他”错误的情况下,可在如图3所示的纠错界面上自动弹出一个有“她”和“它”字的菜单31作为修改备选项供用户选择;
步骤S6,重新获取对应于所述待修正内容的语音并修正所述待修正内容,具体的,可通过触摸控制操作重新获取对应于所述待修正内容的语音并修正所述待修正内容,本步骤是先将所述重新获取的语音转化为新的识别文本和新的识别网络,然后根据所述新的识别文本或新的识别网络修正所述待修正内容,可选的,本步骤中可以根据所述待修正内容在所述识别文本中的上下文信息将所述重新获取的语音转化为新的识别文本和新的识别网络,即用户如果发现提供的修改备选项中没有所需要的正确识别结果时,也可以发出重录指令如点击识别键,重新说一遍识别不正确的部分,识别系统将根据上一遍识别结果的上下文信息,把本次识别的识别网络限制在较小的范围内,从而提高识别精度,获得更可靠的识别结果,例如上述例子的“我女儿三岁了,他喜欢玩平图游戏”中“他”错误的情况下,当修改备选项中没有正确的内容可以替换待修正内容时,用户可以在如图3所示的纠错界面上点击录音键32重新说一个“她”字,根据重新输入的语音本步骤会在原有的上下文将被引入第二次识别的基础上重新给出修改备选项,提高识别可靠性,本步骤可具体包括:
步骤S61,重新获取对应于所述待修正内容的语音并将所述重新获取的语音转化为新的识别文本和新的识别网络;
步骤S62,判断所述新的识别文本是否正确,若正确,则执行步骤S63;若不正确,则执行步骤S64~步骤S65,并根据步骤S65的判断结果执行步骤S66或重新从步骤S61开始执行;
步骤S63,将所述新的识别文本替换所述待修正内容;
步骤S64,根据所述新的识别网络生成新的词汇网络;
步骤S65,获取修改备选项替换指令或重录指令,若为修改备选项替换指令,则执行步骤S66,若为重录指令,则重新从步骤S61开始执行;
步骤S66,根据所述新的词汇网络生成对应于所述待修正内容的新的修改备选项,并从所述新的修改备选项中选择正确内容替换所述待修正内容。
详细的,如图4所示,本方法的实现原理为识别引擎通过自适应声学模型和自己语言模型对输入语音进行识别生成识别文本和识别网络,然后根据所述识别网络生成所述词汇网络和上下文信息,在确定需要纠错的文本之后,可根据所词汇网络生成需要纠错的文本的修改备选项,以供用户选择来替换需要纠错的文本,或根据上下文信息对需要纠错的文本进行重新录音来替换需要纠错的文本。
本发明提供了一种语音输入结果的补充修改方法,可利用连续语音识别产生的词汇网络,并结合自然语言处理技术,实现对用户输入的快速纠正,另外,本发明还结合了触摸控制对识别文本进行纠错,用户只需要在触摸屏上进行划动,即可选定需要进行纠错的文本,同时弹出如修改备选项及重新录音的按键,使用户可以快速选择正确的输入文本,或只需要重新说被识别错的部分文本即可进行纠错,纠错速度比现有方法更高,操作更方便。
如图5所示,本发明还提供另一种语音输入纠错系统,包括识别引擎模块51和修正模块52。
识别引擎模块51用于将输入的语音转化成识别文本和识别网络,具体的,所述识别引擎模块51包括声学模型单元511、语言模型单元512和转化单元513,
声学模型单元511用于预设自适应声学模型。
语言模型单元512用于预设自然语言模型。
转化单元513用于通过所述自适应声学模型和自然语言模型将输入的语音转化成识别文本和识别网络或将重新获取的语音转化成新的识别文本和新的识别网络,具体的,可根据所述待修正内容在所述识别文本中的上下文信息将所述重新获取的语音转化为新的识别文本和新的识别网络,能够将原有的上下文引入第二次语音识别过程中以提高识别可靠性。
修正模块52用于根据所述识别网络生成词汇网络,获取所述识别文本中待修正内容,并获取修改备选项替换或重录指令;若为修改备选项替换指令,则根据所述词汇网络生成对应于所述待修正内容的修改备选项,并从所述修改备选项中选择正确内容替换所述待修正内容;若为重录指令,则重新获取对应于所述待修正内容的语音并修正所述待修正内容,这样不仅可以提供修改备选项以修改所述识别文本中的出错部分,也可通过重录部分语音来修改所述识别文本中的出错部分,具体的,所述修正模块52包括词汇网络单元521、修正定位单元522、候选单元523、第一判断单元524、替换单元525重录单元526和第二判断单元527,
词汇网络单元521用于根据所述识别网络生成词汇网络或根据所述新的识别网络生成新的词汇网络。
修正定位单元522用于获取所述识别文本中待修正内容,具体的,可通过触摸控制操作获取所述识别文本中待修正内容。
候选单元523用于根据所述词汇网络生成对应于所述待修正内容的修改备选项或根据所述新的词汇网络生成对应于所述待修正内容的新的修改备选项。
第一判断单元524用于获取修改备选项替换或重录指令,若为修改备选项替换指令,则通知替换单元525处理,若为重录指令,则通知重录单元526处理,具体的,可以通过触摸控制操作获取修改备选项替换或重录指令,这样用户只需要在设备的触摸屏上进行划动,即可选定需要进行纠错的识别文本,同时弹出修改备选项及重新录音的按键,使用户可以快速选择正确的输入文本,或只需要重新说被识别错的部分文本即可进行纠错,使纠错速度比现有技术更高,操作更方便。
替换单元525用于从所述修改备选项或新的修改备选项中选择正确内容替换所述待修正内容,以及用于将所述新的识别文本替换所述待修正内容,具体的可通过触摸控制操作从所述修改备选项或新的修改备选项中选择正确内容替换所述待修正内容,以及将所述新的识别文本替换所述待修正内容。
重录单元526用于重新获取对应于所述待修正内容的语音并发送到所述识别引擎模块51处理,具体的,可通过触摸控制操作重新获取对应于所述待修正内容的语音并发送到所述识别引擎模块51处理。
第二判断单元527用于判断所述新的识别文本是否正确,若正确,则通知所述替换单元525处理;若不正确,则通知重录单元526处理。
本发明通过将输入的语音转化成识别文本和识别网络,然后根据所述识别网络生成词汇网络,再获取所述识别文本中待修正内容,进而获取修改备选项替换或重录指令,若为修改备选项替换指令,则根据所述词汇网络生成对应于所述待修正内容的修改备选项,并从所述修改备选项中选择正确内容替换所述待修正内容;若为重录指令,则重新获取对应于所述待修正内容的语音并修正所述待修正内容,这样不仅可以提供修改备选项以修改所述识别文本中的出错部分,也可通过重录部分语音来修改所述识别文本中的出错部分。
另外,通过触摸控制操作获取所述识别文本中待修正内容、获取修改备选项替换或重录指令、从所述修改备选项中选择正确内容替换所述待修正内容以及重新获取对应于所述待修正内容的语音并修正所述待修正内容,用户只需要在设备的触摸屏上进行划动,即可选定需要进行纠错的识别文本,同时弹出修改备选项及重新录音的按键,使用户可以快速选择正确的输入文本,或只需要重新说被识别错的部分文本即可进行纠错,使纠错速度比现有技术更高,操作更方便。
此外,通过根据所述待修正内容在所述识别文本中的上下文信息将所述重新获取的语音转化为新的识别文本和新的识别网络,能够将原有的上下文引入第二次语音识别过程中以提高识别可靠性。
本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统而言,由于与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
显然,本领域的技术人员可以对发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包括这些改动和变型在内。

Claims (12)

1.一种语音输入纠错方法,其特征在于,包括:
将输入的语音转化成识别文本和识别网络;
根据所述识别网络生成词汇网络;
获取所述识别文本中待修正内容;以及
获取修改备选项替换或重录指令,若为修改备选项替换指令,则根据所述词汇网络生成对应于所述待修正内容的修改备选项,并从所述修改备选项中选择正确内容替换所述待修正内容;若为重录指令,则重新获取对应于所述待修正内容的语音,并根据所述待修正内容在所述识别文本中的上下文信息将所述重新获取的语音转化为新的识别文本和新的识别网络,根据所述新的识别文本或新的识别网络修正所述待修正内容。
2.如权利要求1所述的语音输入纠错方法,其特征在于,通过触摸控制操作获取所述识别文本中待修正内容、获取修改备选项替换或重录指令、从所述修改备选项中选择正确内容替换所述待修正内容以及重新获取对应于所述待修正内容的语音并修正所述待修正内容。
3.如权利要求1所述的语音输入纠错方法,其特征在于,通过预设的自适应声学模型和自然语言模型将输入的语音转化成识别文本和识别网络。
4.如权利要求1所述的语音输入纠错方法,其特征在于,所述根据所述新的识别文本和新的识别网络修正所述待修正内容的步骤包括:
判断所述新的识别文本是否正确;
若正确,则将所述新的识别文本替换所述待修正内容;
若不正确,根据所述新的识别网络生成新的词汇网络,并获取修改备选项替换或重录指令,若为修改备选项替换指令,则根据所述新的词汇网络生成对应于所述待修正内容的新的修改备选项,并从所述新的修改备选项中选择正确内容替换所述待修正内容;若为重录指令,则重新获取对应于所述待修正内容的语音并修正所述待修正内容。
5.如权利要求1所述的语音输入纠错方法,其特征在于,所述识别网络包括对应所述语音的最佳文本序列和候选文本序列。
6.如权利要求5所述的语音输入纠错方法,其特征在于,所述识别文本为所述最佳文本序列。
7.如权利要求6所述的语音输入纠错方法,其特征在于,所述词汇网络包括根据所述最佳文本序列和候选文本序列生成的多个基本的词汇单元。
8.如权利要求7所述的语音输入纠错方法,其特征在于,所述候选文本序列的词汇单元与所述最佳文本序列的词汇单元对应。
9.一种语音输入纠错系统,其特征在于,包括:
识别引擎模块,用于将输入的语音转化成识别文本和识别网络;以及
修正模块,用于根据所述识别网络生成词汇网络,获取所述识别文本中待修正内容,并获取修改备选项替换或重录指令;若为修改备选项替换指令,则根据所述词汇网络生成对应于所述待修正内容的修改备选项,并从所述修改备选项中选择正确内容替换所述待修正内容;若为重录指令,则重新获取对应于所述待修正内容的语音,并根据所述待修正内容在所述识别文本中的上下文信息将所述重新获取的语音转化为新的识别文本和新的识别网络,根据所述新的识别文本或新的识别网络修正所述待修正内容。
10.如权利要求9所述的语音输入纠错系统,其特征在于,识别引擎模块包括:
声学模型单元,用于预设自适应声学模型;
语言模型单元,用于预设自然语言模型;
转化单元,用于通过所述自适应声学模型和自然语言模型将输入的语音转化成识别文本和识别网络或将重新获取的语音转化成新的识别文本和新的识别网络。
11.如权利要求10所述的语音输入纠错系统,其特征在于,所述修正模块包括:
词汇网络单元,用于根据所述识别网络生成词汇网络或根据所述新的识别网络生成新的词汇网络;
修正定位单元,用于获取所述识别文本中待修正内容;
候选单元,用于根据所述词汇网络生成对应于所述待修正内容的修改备选项或根据所述新的词汇网络生成对应于所述待修正内容的新的修改备选项;
第一判断单元,用于获取修改备选项替换或重录指令,若为修改备选项替换指令,则通知替换单元处理,若为重录指令,则通知重录单元处理;
替换单元,用于从所述修改备选项或新的修改备选项中选择正确内容替换所述待修正内容,以及用于将所述新的识别文本替换所述待修正内容;
重录单元,用于重新获取对应于所述待修正内容的语音并发送到所述识别引擎模块处理。
12.如权利要求11所述的语音输入纠错系统,其特征在于,所述修正模块还包括第二判断单元,用于判断所述新的识别文本是否正确,若正确,则通知所述替换单元处理;若不正确,则通知重录单元处理。
CN201210101294.8A 2012-03-31 2012-03-31 语音输入纠错方法及系统 Active CN103366741B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210101294.8A CN103366741B (zh) 2012-03-31 2012-03-31 语音输入纠错方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210101294.8A CN103366741B (zh) 2012-03-31 2012-03-31 语音输入纠错方法及系统

Publications (2)

Publication Number Publication Date
CN103366741A CN103366741A (zh) 2013-10-23
CN103366741B true CN103366741B (zh) 2019-05-17

Family

ID=49367942

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210101294.8A Active CN103366741B (zh) 2012-03-31 2012-03-31 语音输入纠错方法及系统

Country Status (1)

Country Link
CN (1) CN103366741B (zh)

Families Citing this family (84)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9318108B2 (en) 2010-01-18 2016-04-19 Apple Inc. Intelligent automated assistant
US8977255B2 (en) 2007-04-03 2015-03-10 Apple Inc. Method and system for operating a multi-function portable electronic device using voice-activation
US8676904B2 (en) 2008-10-02 2014-03-18 Apple Inc. Electronic devices with voice command and contextual data processing capabilities
US20120309363A1 (en) 2011-06-03 2012-12-06 Apple Inc. Triggering notifications associated with tasks items that represent tasks to perform
US10417037B2 (en) 2012-05-15 2019-09-17 Apple Inc. Systems and methods for integrating third party services with a digital assistant
EP3809407A1 (en) 2013-02-07 2021-04-21 Apple Inc. Voice trigger for a digital assistant
US10652394B2 (en) 2013-03-14 2020-05-12 Apple Inc. System and method for processing voicemail
US10748529B1 (en) 2013-03-15 2020-08-18 Apple Inc. Voice activated device for use with a voice-based digital assistant
US10176167B2 (en) 2013-06-09 2019-01-08 Apple Inc. System and method for inferring user intent from speech inputs
CN103645876B (zh) * 2013-12-06 2017-01-18 百度在线网络技术(北京)有限公司 语音输入方法和装置
CN103699359B (zh) * 2013-12-23 2017-12-29 华为技术有限公司 一种语音命令的校正方法、校正系统和电子设备
CN103760990B (zh) * 2014-01-09 2017-08-04 广东欧珀移动通信有限公司 一种拼音输入方法及装置
US10170123B2 (en) 2014-05-30 2019-01-01 Apple Inc. Intelligent assistant for home automation
US9966065B2 (en) 2014-05-30 2018-05-08 Apple Inc. Multi-command single utterance input method
US9715875B2 (en) 2014-05-30 2017-07-25 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
US9338493B2 (en) 2014-06-30 2016-05-10 Apple Inc. Intelligent automated assistant for TV user interactions
CN105446572A (zh) * 2014-08-13 2016-03-30 阿里巴巴集团控股有限公司 一种用于屏幕显示设备的文字编辑方法及装置
US10446141B2 (en) * 2014-08-28 2019-10-15 Apple Inc. Automatic speech recognition based on user feedback
CN105374356B (zh) * 2014-08-29 2019-07-30 株式会社理光 语音识别方法、语音评分方法、语音识别系统及语音评分系统
CN104217039B (zh) * 2014-10-10 2017-12-29 浙江完美在线网络科技有限公司 一种将电话对话实时记录并转化陈述句的方法和系统
CN105786204A (zh) * 2014-12-26 2016-07-20 联想(北京)有限公司 信息处理方法和电子设备
CN105869632A (zh) * 2015-01-22 2016-08-17 北京三星通信技术研究有限公司 基于语音识别的文本修订方法和装置
US9886953B2 (en) 2015-03-08 2018-02-06 Apple Inc. Virtual assistant activation
US10200824B2 (en) 2015-05-27 2019-02-05 Apple Inc. Systems and methods for proactively identifying and surfacing relevant content on a touch-sensitive device
US20160378747A1 (en) 2015-06-29 2016-12-29 Apple Inc. Virtual assistant for media playback
CN105047198B (zh) * 2015-08-24 2020-09-22 百度在线网络技术(北京)有限公司 语音纠错处理方法及装置
CN105206260B (zh) * 2015-08-31 2016-09-28 努比亚技术有限公司 一种终端语音播报方法、装置及终端语音操作方法
US10671428B2 (en) 2015-09-08 2020-06-02 Apple Inc. Distributed personal assistant
US10740384B2 (en) 2015-09-08 2020-08-11 Apple Inc. Intelligent automated assistant for media search and playback
US10747498B2 (en) 2015-09-08 2020-08-18 Apple Inc. Zero latency digital assistant
US10331312B2 (en) 2015-09-08 2019-06-25 Apple Inc. Intelligent automated assistant in a media environment
US9787819B2 (en) * 2015-09-18 2017-10-10 Microsoft Technology Licensing, Llc Transcription of spoken communications
US10691473B2 (en) 2015-11-06 2020-06-23 Apple Inc. Intelligent automated assistant in a messaging environment
US10956666B2 (en) 2015-11-09 2021-03-23 Apple Inc. Unconventional virtual assistant interactions
CN105468468B (zh) * 2015-12-02 2018-07-27 北京光年无限科技有限公司 面向问答系统的数据纠错方法及装置
US10223066B2 (en) 2015-12-23 2019-03-05 Apple Inc. Proactive assistance based on dialog communication between devices
US10255913B2 (en) * 2016-02-17 2019-04-09 GM Global Technology Operations LLC Automatic speech recognition for disfluent speech
CN107229627B (zh) * 2016-03-24 2020-12-22 华为技术有限公司 一种文本处理方法、装置及计算设备
CN105869642B (zh) * 2016-03-25 2019-09-20 海信集团有限公司 一种语音文本的纠错方法及装置
CN106098060B (zh) * 2016-05-19 2020-01-31 北京搜狗科技发展有限公司 语音的纠错处理方法和装置、用于语音的纠错处理的装置
US10586535B2 (en) 2016-06-10 2020-03-10 Apple Inc. Intelligent digital assistant in a multi-tasking environment
DK201670540A1 (en) 2016-06-11 2018-01-08 Apple Inc Application integration with a digital assistant
DK179415B1 (en) 2016-06-11 2018-06-14 Apple Inc Intelligent device arbitration and control
CN106328145B (zh) * 2016-08-19 2019-10-11 北京云知声信息技术有限公司 语音修正方法及装置
CN106448675B (zh) * 2016-10-21 2020-05-01 科大讯飞股份有限公司 识别文本修正方法及系统
CN106710597B (zh) * 2017-01-04 2020-12-11 广东小天才科技有限公司 语音数据的录音方法及装置
DK180048B1 (en) 2017-05-11 2020-02-04 Apple Inc. MAINTAINING THE DATA PROTECTION OF PERSONAL INFORMATION
US10726832B2 (en) 2017-05-11 2020-07-28 Apple Inc. Maintaining privacy of personal information
DK201770429A1 (en) 2017-05-12 2018-12-14 Apple Inc. LOW-LATENCY INTELLIGENT AUTOMATED ASSISTANT
DK179745B1 (en) 2017-05-12 2019-05-01 Apple Inc. SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT
DK179496B1 (en) 2017-05-12 2019-01-15 Apple Inc. USER-SPECIFIC Acoustic Models
US10303715B2 (en) 2017-05-16 2019-05-28 Apple Inc. Intelligent automated assistant for media exploration
US20180336892A1 (en) 2017-05-16 2018-11-22 Apple Inc. Detecting a trigger of a digital assistant
CN107316639A (zh) * 2017-05-19 2017-11-03 北京新美互通科技有限公司 一种基于语音识别的信息输入方法及装置,电子设备
CN107220228B (zh) * 2017-06-13 2019-08-16 深圳市鹰硕技术有限公司 一种教学录播数据修正装置
CN107368278B (zh) * 2017-06-30 2021-07-30 北京小米移动软件有限公司 信息处理方法及装置
CN107678561A (zh) 2017-09-29 2018-02-09 百度在线网络技术(北京)有限公司 基于人工智能的语音输入纠错方法及装置
US10818288B2 (en) 2018-03-26 2020-10-27 Apple Inc. Natural assistant interaction
CN108664199A (zh) * 2018-05-07 2018-10-16 平安普惠企业管理有限公司 表单填写方法、装置、设备及计算机可读存储介质
US10928918B2 (en) 2018-05-07 2021-02-23 Apple Inc. Raise to speak
US11145294B2 (en) 2018-05-07 2021-10-12 Apple Inc. Intelligent automated assistant for delivering content from user experiences
DK179822B1 (da) 2018-06-01 2019-07-12 Apple Inc. Voice interaction at a primary device to access call functionality of a companion device
US10892996B2 (en) 2018-06-01 2021-01-12 Apple Inc. Variable latency device coordination
DK180639B1 (en) 2018-06-01 2021-11-04 Apple Inc DISABILITY OF ATTENTION-ATTENTIVE VIRTUAL ASSISTANT
US11462215B2 (en) 2018-09-28 2022-10-04 Apple Inc. Multi-modal inputs for voice commands
CN109275009B (zh) * 2018-09-29 2021-10-19 安徽听见科技有限公司 一种控制音频与文本同步的方法及装置
CN109922371B (zh) * 2019-03-11 2021-07-09 海信视像科技股份有限公司 自然语言处理方法、设备及存储介质
US11348573B2 (en) 2019-03-18 2022-05-31 Apple Inc. Multimodality in digital assistant systems
DK201970509A1 (en) 2019-05-06 2021-01-15 Apple Inc Spoken notifications
US11307752B2 (en) 2019-05-06 2022-04-19 Apple Inc. User configurable task triggers
US11140099B2 (en) 2019-05-21 2021-10-05 Apple Inc. Providing message response suggestions
DK201970511A1 (en) 2019-05-31 2021-02-15 Apple Inc Voice identification in digital assistant systems
DK180129B1 (en) 2019-05-31 2020-06-02 Apple Inc. USER ACTIVITY SHORTCUT SUGGESTIONS
US11468890B2 (en) 2019-06-01 2022-10-11 Apple Inc. Methods and user interfaces for voice-based control of electronic devices
CN110288990B (zh) * 2019-06-12 2021-07-20 深圳康佳电子科技有限公司 一种语音控制优化方法、存储介质及智能终端
CN112487219A (zh) * 2019-09-12 2021-03-12 西安诺瓦星云科技股份有限公司 节目编辑方法、装置及系统和计算机可读存储介质
CN110827815B (zh) * 2019-11-07 2022-07-15 深圳传音控股股份有限公司 一种语音识别方法、终端、系统以及计算机存储介质
CN110956959B (zh) * 2019-11-25 2023-07-25 科大讯飞股份有限公司 语音识别纠错方法、相关设备及可读存储介质
US11061543B1 (en) 2020-05-11 2021-07-13 Apple Inc. Providing relevant data items based on context
US11038934B1 (en) 2020-05-11 2021-06-15 Apple Inc. Digital assistant hardware abstraction
US11755276B2 (en) 2020-05-12 2023-09-12 Apple Inc. Reducing description length based on confidence
US11490204B2 (en) 2020-07-20 2022-11-01 Apple Inc. Multi-device audio adjustment coordination
US11438683B2 (en) 2020-07-21 2022-09-06 Apple Inc. User identification using headphones
CN112951238A (zh) * 2021-03-19 2021-06-11 河南蜂云科技发展有限公司 一种基于语音处理的科技法庭智能管理方法、系统及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1601548A (zh) * 2003-09-23 2005-03-30 摩托罗拉公司 用于提供文本消息的方法和装置
CN1779781A (zh) * 2004-11-24 2006-05-31 微软公司 字符的受控处理
CN1991743A (zh) * 2005-12-30 2007-07-04 西门子(中国)有限公司 一种语音输入法方法及其装置
CN101593076A (zh) * 2008-05-28 2009-12-02 Lg电子株式会社 移动终端和用于修正其文本的方法

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8019602B2 (en) * 2004-01-20 2011-09-13 Microsoft Corporation Automatic speech recognition learning using user corrections
EP2183685A4 (en) * 2007-08-01 2012-08-08 Ginger Software Inc AUTOMATIC CONTEXT-RELATED LANGUAGE CORRECTION AND EXPANSION USING AN INTERNET CORP

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1601548A (zh) * 2003-09-23 2005-03-30 摩托罗拉公司 用于提供文本消息的方法和装置
CN1779781A (zh) * 2004-11-24 2006-05-31 微软公司 字符的受控处理
CN1991743A (zh) * 2005-12-30 2007-07-04 西门子(中国)有限公司 一种语音输入法方法及其装置
CN101593076A (zh) * 2008-05-28 2009-12-02 Lg电子株式会社 移动终端和用于修正其文本的方法

Also Published As

Publication number Publication date
CN103366741A (zh) 2013-10-23

Similar Documents

Publication Publication Date Title
CN103366741B (zh) 语音输入纠错方法及系统
US10126936B2 (en) Typing assistance for editing
US11062090B2 (en) Method and apparatus for mining general text content, server, and storage medium
US8290772B1 (en) Interactive text editing
CN105283914B (zh) 用于识别语音的系统和方法
US8738375B2 (en) System and method for optimizing speech recognition and natural language parameters with user feedback
EP2339576B1 (en) Multi-modal input on an electronic device
US9569231B2 (en) Device, system, and method for providing interactive guidance with execution of operations
JP2018036621A (ja) 情報入力方法および装置
CN104850542B (zh) 非可听语音输入校正
KR102256705B1 (ko) 수정된 용어들을 사용하는 음향 모델 트레이닝
TW201510774A (zh) 以語音辨識來選擇控制客體的裝置及方法
CN108763552A (zh) 一种基于家教机的学习方法及家教机
CN109616101B (zh) 声学模型训练方法、装置、计算机设备和可读存储介质
CN102193646A (zh) 人名候选词的生成方法及装置
CN107850950A (zh) 基于时间的分词
WO2019026716A1 (ja) 情報処理装置、及び情報処理方法
CN106156022A (zh) 一种信息处理方法及电子设备
US20230409677A1 (en) Generating cross-domain guidance for navigating hci's
CN112148285B (zh) 一种界面设计方法、装置、电子设备及存储介质
JP6147387B1 (ja) 音声翻訳システム、その制御方法および音声翻訳プログラム
TWI480841B (zh) 具情景記憶功能的詞彙記錄系統及其方法
CN102981769B (zh) 映射式触控输入系统及方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
ASS Succession or assignment of patent right

Owner name: SHANGHAI GUOKE ELECTRONIC CO., LTD.

Free format text: FORMER OWNER: SHENGYUE INFORMATION TECHNOLOGY (SHANGHAI) CO., LTD.

Effective date: 20140210

TA01 Transfer of patent application right

Effective date of registration: 20140210

Address after: 201203 Shanghai Guo Shou Jing Road, Zhangjiang hi tech Park No. 356 building 3 room 127

Applicant after: Shanghai Guoke Electronic Co., Ltd.

Address before: 201203 Shanghai Guo Shou Jing Road, Zhangjiang High Tech Park of Pudong New Area No. 356 building 3 Room 102

Applicant before: Shengle Information Technology (Shanghai) Co., Ltd.

TA01 Transfer of patent application right
EXSB Decision made by sipo to initiate substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CP03 Change of name, title or address

Address after: Room 127, building 3, 356 GuoShouJing Road, Zhangjiang High Tech Park, Pudong New Area, Shanghai 201204

Patentee after: SHANGHAI GEAK ELECTRONICS Co.,Ltd.

Address before: Room 127, building 3, 356 GuoShouJing Road, Zhangjiang hi tech park, Shanghai, 201203

Patentee before: Shanghai Nutshell Electronics Co.,Ltd.

CP03 Change of name, title or address