CN103456296A - 提供语音识别功能的方法及其电子设备 - Google Patents
提供语音识别功能的方法及其电子设备 Download PDFInfo
- Publication number
- CN103456296A CN103456296A CN2013102054976A CN201310205497A CN103456296A CN 103456296 A CN103456296 A CN 103456296A CN 2013102054976 A CN2013102054976 A CN 2013102054976A CN 201310205497 A CN201310205497 A CN 201310205497A CN 103456296 A CN103456296 A CN 103456296A
- Authority
- CN
- China
- Prior art keywords
- instruction
- list
- phonetic order
- predict command
- input
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 56
- 238000012937 correction Methods 0.000 claims abstract description 41
- 230000008569 process Effects 0.000 claims description 23
- 238000004458 analytical method Methods 0.000 claims description 14
- 230000001915 proofreading effect Effects 0.000 claims description 13
- 230000008878 coupling Effects 0.000 claims description 11
- 238000010168 coupling process Methods 0.000 claims description 11
- 238000005859 coupling reaction Methods 0.000 claims description 11
- 238000012545 processing Methods 0.000 claims description 5
- 238000004590 computer program Methods 0.000 claims description 2
- 230000006870 function Effects 0.000 description 69
- 238000004891 communication Methods 0.000 description 13
- 230000005540 biological transmission Effects 0.000 description 11
- 238000011084 recovery Methods 0.000 description 10
- 238000010586 diagram Methods 0.000 description 6
- 238000003860 storage Methods 0.000 description 6
- 238000013500 data storage Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 230000004044 response Effects 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 238000007726 management method Methods 0.000 description 3
- 210000000352 storage cell Anatomy 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 230000015654 memory Effects 0.000 description 2
- 230000005055 memory storage Effects 0.000 description 2
- 230000002093 peripheral effect Effects 0.000 description 2
- 230000004913 activation Effects 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 238000009966 trimming Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/10—Speech classification or search using distance or distortion measures between unknown speech and reference templates
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/06—Creation of reference templates; Training of speech recognition systems, e.g. adaptation to the characteristics of the speaker's voice
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/221—Announcement of recognition results
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/226—Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics
- G10L2015/227—Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics of the speaker; Human-factor methodology
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Artificial Intelligence (AREA)
- User Interface Of Digital Computer (AREA)
- Navigation (AREA)
- Image Processing (AREA)
Abstract
本发明提供了一种用于提供语音识别功能的方法和电子设备。所述方法在电子设备中提供语音识别功能,包括:当输入语音指令,输出预测指令的列表,所述预测指令是与输入语音指令相似的候选指令;当输入用于校正输出候选指令的校正指令时,更新预测指令的列表;如果校正指令与更新的预测指令列表中相似度高的指令匹配,执行与语音指令对应的语音识别功能。
Description
技术领域
本发明涉及提供语音识别功能的电子设备和方法。更详细地,本发明涉及电子设备中通过用户的语音来校正错误识别的语音指令的装置和方法。
背景技术
由于此类多媒体设备易于携带,便携电子设备已成为现代人的必需品,并已发展到提供比如语音和视频呼叫功能、信息输入和输出功能以及数据存储功能等多种服务。
例如,电子设备已发展成能够提供电话簿,游戏,短消息,电子邮件(e-mail)消息,早晨叫醒呼叫,MPEG-1音频层(MP3)播放器,数字摄像机,无线互联网服务等的多媒体设备。
此外,在最近几年,已经推出了使用语音识别技术的电子设备。语音识别技术源自输入存在电话簿中存储的名字并创建呼叫的功能和语音到文本(STT)功能等,能够应用于电子设备语音识别技术已不断增长,并为进一步控制电子设备的操作提供了可能。
例如,电子设备可以感测用户的语音指令并激活文本消息功能,日程安排功能,摄像机功能等。这是由于电子设备可以识别用户的指令以用于功能控制。
然而,最近,语音识别性能已改善,使得除了允许用于功能激活的指令之外,还允许对相应功能的细节控制。
作为示例,描述文本消息功能。用户能够使用语音指令在输入消息内容后指定文本消息的接收方。
在分析从用户接收到的语音指令后,电子设备以文本形式提供分析结果的列表,以便执行文本消息功能。在一个实施例中,电子设备在分析结果列表中包括与所分析的指令相似的指令,并输出最终列表。从最终输出列表中,用户通过触摸输入或按键输入选择针对他/她打算执行的功能的指令。输出列表是如下列表:包括电子设备准确识别的指令,也可能包括电子设备错误识别的指令。
在使用文本形式的分析结果的情况下,用户可以直接选择用于所需功能的指令,并可以准确且快速地执行所需功能。然而,这不是基于语音识别来执行指令选择过程,所以无法满足希望通过语音识别控制电子设备的用户的需求。
因此,需要一种系统和方法,针对在电子设备中通过用户的语音来校正错误识别的指令的装置和方法。
以上信息作为背景信息提供,仅帮助本公开的理解。对于上述任何内容是否可作为关于本发明的现有技术没有任何判定也没有任何断言。
发明内容
本发明的方面在于解决至少上述问题和/或缺点并提供至少以下优点。因此,本发明的一方面是提供电子设备中改善语音识别功能的性能的装置和方法。
本发明的另一方面是提供电子设备中通过用户的语音指令校正错误识别的指令的装置和方法。
本发明的又一方面是提供电子设备中当感测到指令校正请求时更新指令识别结果的装置和方法。
以上方面通过提供用于提供语音识别功能的方法及其电子设备来实现。
根据本发明的一方面,提供了一种在电子设备中提供语音识别功能的方法。所述方法包括:如果输入语音指令,输出预测指令的列表,所述预测指令是与输入的语音指令相似的候选指令;当输入用于校正所输出的候选指令的校正指令时,更新预测指令列表;以及如果校正指令与更新的预测指令列表中相似度高的指令匹配,执行与语音指令相对应的语音识别功能。
创建和输出预测指令的列表可以进一步包括:从预测指令的列表中定义和输出与输入的语音指令相似度高的候选指令。
更新预测指令列表可以进一步包括:从预测指令列表所包括的候选指令的列表中,删除与输入的语音指令相似度高的候选指令,并更新先前创建的预测指令列表;和在更新的预测指令列表中,定义并输出与输入的语音指令相似度高的候选指令。
在电子设备中提供语音识别功能的方法可以包括:请求重新输入所输入的语音指令中错误识别的指令;和创建预测指令的列表,所述预测指令是与重新输入的指令相似的候选指令。
错误识别的指令可以按照音频形式、文本形式和标记(marking)中的至少一种输出。
创建预测指令的列表包括:按照与输入的语音指令的相似度的顺序整理候选指令。
根据本发明的另一方面,提供一种提供语音识别功能的电子设备。所述设备包括:音频处理器,用于处理语音指令以用于功能执行;显示单元,用于输出来自语音指令处理的分析结果;至少一个处理器,用于执行计算机程序;存储器,用于存储数据和指令;和至少一个程序,存储在存储器中,并配置成由所述至少一个处理器执行。当输入语音指令时,所述至少一个程序创建并输出预测指令的列表,所述预测指令是与输入的语音指令相似的候选指令,当输入用于校正输出的候选指令的校正指令时,更新预测指令列表,并且如果校正指令与更新的预测指令列表中相似度高的指令匹配,执行与语音指令相对应的语音识别功能。
程序可以包括进行如下处理的指令:创建预测指令列表,并在预测指令列表中定义和输出与输入的语音指令相似度高的候选指令。
程序可以包括进行如下处理的指令:通过在预测指令列表包括的候选指令的列表中删除与输入的语音指令相似度高的候选指令,更新先前创建的预测指令列表,并在更新的候选指令列表中定义和输出与输入的语音指令相似度高的候选指令,来更新预测指令列表。
程序可以包括进行如下处理的指令:请求重新输入所输入的语音指令中错误识别的指令,并创建预测指令的列表,所述预测指令是与重新输入的指令相似的候选指令。
程序可以进行处理以便以音频形式、文本形式和标记中的至少一种输出错误识别的指令。
程序可以包括指令,用于按照与输入的语音指令的相似度的顺序整理候选指令,并创建预测指令列表。
根据本发明的再一方面,提供了一种计算机可读存储介质,存储至少一个程序。所述程序包括操作电子设备以执行如下操作的指令:如果输入语音指令,输出预测指令的列表,所述预测指令是与输入的语音指令相似的候选指令;每当输入用于校正所输出的候选指令的校正指令时,更新预测指令列表;以及如果校正指令与更新的预测指令列表中的相似度高的指令匹配,在电子设备执行语音指令时,执行与语音指令相对应的语音识别功能。
根据本发明又一方面,提供了一种在电子设备中管理输入语音指令的方法。所述方法包括:接收来自用户的输入语音指令;创建与输入语音指令相似的候选指令的列表;输出候选指令的列表;以及基于用户从候选指令列表中选择一个候选指令,执行与语音指令相对应的语音识别功能。
以下详细描述结合附图公开了本发明的示例实施例,通过以下详细描述,本领域技术人员将更清楚本发明的其他方面、优点和突出的特征。
附图说明
结合附图,根据以下详细描述,本发明的特定示例实施例的上述和其他方面、特征以及优点将更清楚,附图中:
图1是根据本发明示例性实施例示出了提供语音识别功能的电子设备的结构的框图;
图2是根据本发明示例性实施例示出了在电子设备中提供语音识别功能的过程的流程图;
图3是根据本发明示例性实施例示出了在电子设备中更新预测指令列表的过程的流程图;
图4A至C是根据本发明示例性实施例示出了在电子设备中提供语音识别功能的屏幕的图;和
图5A至D是根据本发明示例性实施例示出了在电子设备中提供语音识别功能的屏幕的图。
贯穿附图,应注意相似的参考号数用于表示相同或相似的元素、特征和结构。
具体实施方式
提供了参照附图的以下描述来帮助本领域技术人员全面理解权利要求及其等同物定义的本发明示例实施例。以下描述包括多种特定细节来帮助本领域技术人员理解,但是这些特定细节应该视为仅仅是为了说明目的的示例,而不限制要求保护的发明的范围。因此,本领域技术人员会认识到可以在不背离本发明范围和精神的前提下对本文所述实施例进行多种改变和修改。此外,为了清楚和简要目的省略对公知功能和结构的描述。
以下描述和权利要求中使用的术语和词语不限于字面含义,而是发明人仅用于达到对本发明的清楚和一致理解。因此,本领域技术人员可以理解,本发明实施例的以下描述仅用于说明目的,而不是要限制权利要求及其等同物限定的本发明。
此外,应该理解,除非文中明确指出,否则单数形式的“一”、“一种”和“该”还旨在包括复数形式。因此,例如,对于“一组件表面”的引述包括对于一个或多个这种表面的引述。
以下,本发明描述一种通过用户的语音指令校正错误识别的指令的装置和方法,从而在电子设备中改善语音识别功能的性能。
此外,电子设备可以是如便携终端,移动电话,媒体播放器,平板电脑,手持计算机,或个人数字助理(PDA)等设备。此外,电子设备可以是任何便携电子设备,包括具有在上述设备中两个或更多功能的结合的设备。
图1是根据本发明示例性实施例示出了提供语音识别功能的电子设备的结构的框图。
参阅图1,电子设备100包括存储器110,处理器单元120,音频处理器130,通信系统140,输入/输出控制器150,触摸屏160以及输入装置170。在下文中,可以设置多个存储器110和通信系统140。
下面描述每个组成元件。
存储器110包括程序存储单元111和数据存储单元112。程序存储单元111存储用于控制电子设备100的操作的程序。数据存储单元112存储在程序执行期间产生的数据。例如,数据存储单元112可以存储多种可更新的维护数据,例如,电话簿,外发消息以及接收消息,以及用于用户语音识别的预测指令。此处,预测指令可以表示能够从用户的语音指令推断出的指令。
此外,程序存储单元111可以包括操作系统(OS)程序113,语音识别程序114,指令分析程序115以及至少一个应用116。此处,包括在程序存储单元111中的程序可以是一组指令,可以表达为指令集。
操作程序113包括用于控制一般系统操作的多种软件组成元件。一般系统操作的控制可以包括存储器控制和管理,存储硬件(设备)控制和管理,功率控制和管理等。该OS程序113甚至可以执行在多种硬件(即设备)和软件组成元件(模块)之间进行顺畅通信的功能。
语音识别程序114可以包括至少一个或多个用于进行处理以识别用户的语音和用于进行处理以根据识别的用户语音控制电子设备的功能的软件组成元件。在示例性实施例中,语音识别程序114使用从用户输入的语音指令,执行摄像机功能、文本消息功能,日程安排功能以及浏览器功能中的至少任意一种。
此外,根据本发明示例性实施例,语音识别程序114识别用户的语音,提供预测指令,并响应于语音指令校正请求,更新且提供预测指令。在示例性实施例中,语音识别程序114可以通过分析先前的指令和响应于指令校正请求而重新识别的指令,来识别校正指令,并可以获取并且提供针对所识别的校正指令的预测指令。在这种情况下,语音识别程序114可以进行处理,以从针对校正指令的预测指令中删除先前提供的预测指令,因此增强指令识别的准确性。
也就是,语音识别程序114可以进行处理,以便感测用于语音功能执行的用户的语音指令,并可以通过相继的用户语音指令来校正错误识别的指令。
例如,如果语音识别程序114识别来自用户的语音指令“给珍妮发送消息”,电子设备可能对于指令“发送消息”具有高识别率,但对于指令“珍妮”可能具有低识别率,珍妮是接收方。因此,语音识别程序114可能向用户提供针对低识别率指令“珍妮”的预测指令“Johnny”,“Jane”,“Jenny”等。此处,预测指令可以是与用户输入的语音指令相似的候选指令。
在示例性实施例中,语音识别程序114可以按照所确定与用户的语音指令的相似的指令的顺序列出预测指令(比如,按照以相似度水平最高指令开始的顺序)。
接下来,在将预测指令提供给用户后,语音识别程序114可以比较重新输入的语音指令和预测指令列表中的优先预测指令,如果重新输入的语音指令与预测指令列表中的优先预测指令匹配,则执行与重新输入的语音指令对应的功能。
相反,如果重新输入的语音指令与预测指令列表中的优先预测指令不匹配,语音识别程序114可以创建预测指令列表,其中删除了优先指令。也就是,语音识别程序114可以从预测指令列表“Johnny”,“Jane”和“Jenny”中删除优先指令“Johnny”,并可以将预测指令列表“Johnny”,“Jane”和“Jenny”更新为预测指令列表“Jane”和“Jenny”。指令分析程序115包括至少一个或多个用于分析从用户输入的语音指令的软件组成元件。
在示例性实施例中,指令分析程序115可以执行用于分析用户语音指令以进行功能执行和向处理器单元120提供分析结果的功能。在本发明示例性实施例中,指令分析程序115可以确定针对先前识别的语音指令的校正指令。这是为了确定先前识别的语音指令中错误识别的指令。指令分析程序115可以通过比较先前识别的语音指令和重新识别的语音指令,来识别用户想要校正的指令。此外,指令分析程序115可以通过识别在用于指令校正的词后输入的指令来识别用户想要校正的指令。
应用116可以包括用于安装在电子设备100内的至少一个应用的软件组成元件。
处理器单元120可以包括至少一个处理器122和接口124。此处,处理器122和接口124可以集成为至少一个集成电路,或作为分离的组成元件实现。
接口124可以执行存储器接口的角色,用于控制处理器122和存储器110的访问。
此外,接口124可以执行外围接口的角色,用于控制电子设备100的输入/输出外围设备和电子设备100的处理器122之间的连接。
处理器122使用至少一个软件程序控制电子设备100,以提供语音识别功能。在示例性实施例中,处理器122控制以执行存储在存储器110上的至少一个程序,并提供与所执行程序对应的语音识别功能。例如,处理器122可以包括语音识别处理器,用于识别用户的语音指令并提供与所识别的语音指令对应的预测指令。也就是,电子设备100的语音识别功能可以使用软件(如存储在存储器110中的程序)或硬件(如语音识别处理器)来执行。
音频处理器130提供用户和电子设备100之间通过扬声器131和麦克风132的音频接口,并接收旨在执行语音识别功能的语音指令的输入。
通信系统140执行用于电子设备100的语音通信以及数据通信的通信功能。在示例性实施例中,通信系统140可以划分为支持不同通信网络的多个通信子模块。例如,通信网络包括但不限于,全球移动通信系统(GSM)网络,增强数据GSM环境(EDGE)网络,码分多址(CDMA)网络,无线码分多址(W-CDMA)网络,长期演进(LTE)网络,正交频分多址(OFDMA)网络,无线局域网(WLAN),蓝牙网络以及近场通信(NFC)等待。
输入/输出控制器150提供在输入输出设备(如触摸屏160,输入设备170等)和接口124之间的接口。
触摸屏160是输入输出设备,执行信息的输出和信息的输入,可以包括触摸输入单元161和显示单元162。
触摸输入单元161通过输入输出控制器150向处理单元120提供触摸信息,触摸信息是通过触摸面板感测的。在示例性实施例中,触摸输入单元161可以将触摸信息改变成指令结构,如触摸_向下,触摸_移动,和/或触摸_向上,并向处理器单元120提供这些指令结构。
显示单元162可以显示电子设备100的状态信息,用户输入的字符,运动图像,静止图像等。在示例性实施例中,显示单元162可以显示语音识别结果,预测指令,和/或语音识别过程。
输入设备170通过输入输出控制器150向处理单元120提供由用户的选择产生的输入数据。在示例性实施例中,输入设备170构造为只包括用于电子设备100的控制的控制按钮。备选地,输入设备170可以构造为用于接收来自用户的输入数据的键盘。
尽管未示出,电子设备100还可以包括提供补充功能的组成元件,例如用于图像或视频摄取的摄像机模块,用于广播接收的广播接收模块,数字声音回放模块(如MP3模块),用于局域无线通信的局域无线通信模块,用于接近感测的接近感测模块等,包括用于其操作的软件。
图2根据本发明示例性实施例示出了在电子设备中提供语音识别功能的过程的流程图。
参阅图2,首先,在步骤201,电子设备进入语音识别模式。此处,语音识别模式是指根据用户的语音指令控制电子设备的功能的模式。通常,电子设备可以通过语音识别模式激活文本消息功能,日程安排功能,摄像机功能等。在示例性实施例中,电子设备通过语音识别模式可以执行用于提供对用户语音的响应的对话功能。此外,电子设备可以通过语音识别模式在接收到消息内容的输入后向特定用户发送文本消息。
电子设备然后进行到步骤203,接收来自用户的语音指令的输入。接着,电子设备进行到步骤205,执行分析所接收语音指令的过程。
此处,分析所接收语音指令的过程可以是识别如下指令的过程:所述指令用于区分从用户提供的语音指令的词和句,并利用区分的词或句来控制电子设备的功能。
接下来,电子设备进行到步骤207,获取针对所分析语音指令的预测指令。此后,电子设备进行到步骤209,确定所获取的预测指令的优先级。此处,预测指令是用户的语音指令的初步确定结果,表示与用户的语音指令相似的指令。此外,预测指令的优先级是按照提供给用户预测指令的顺序设定的。优先级越高,预测指令与用户的所分析语音指令匹配的可能性就越高。
例如,如果识别来自用户的语音指令“给Jenny发送消息”,电子设备可以针对所识别的语音指令“给Jenny发送消息”,获取预测指令“给Jane发送消息”,“给Johnny发送消息”以及“给Jenny发送消息”。
接着,电子设备进行到步骤211,输出预测指令的优先级列表。此后,电子设备进行步骤到213,确定是否识别到来自用户的指令执行请求。也就是,在电子设备输出预测指令优先级列表的状态下,电子设备确定是否识别到用于执行预测指令的输出列表中至少一个预测指令的用户语音。步骤213可以是如下过程:因为电子设备判断无法识别到语音指令,所以用户重新输入语音指令。
根据本发明的另一示例性实施例,在电子设备在步骤211仅输出最高优先级的预测指令的状态下,电子设备可以确定是否识别到用于执行所输出预测指令的用户语音。
如果在步骤213中确定电子设备没有准确识别出指令执行请求,电子设备进行到步骤217,接收来自用户的语音指令的重新输入。在此之后,电子设备进行到步骤219,执行更新预测指令列表的过程。此处,更新预测指令列表的过程是更新先前提供的预测指令以与从用户重新输入的语音指令适合的过程的。这是为了解决如下问题:因为已错误识别了从用户提供的语音指令的电子设备对于错误识别的语音指令无法提供预测指令,所以电子设备无法提供语音识别功能。作为其示例,电子设备可以在先前的预测指令列表中删除具有高优先级的预测指令,可以将先前的预测指令列表更新为新的预测指令列表,向用户提供新的预测指令列表,从而提高用户的语音指令的识别率。例如,如果在先前提供的预测指令“给Jane发送消息”、“给Johnny发送消息”以及“给Jenny发送消息”中,“给Jane发送消息”的优先级高,电子设备将先前提供的预测指令“给Jane发送消息”、“给Johnny发送消息”以及“给Jenny发送消息”更新为预测指令“给Johnny发送消息”以及“给Jenny发送消息”。
在步骤219中更新预测指令列表之后,电子设备进行到步骤213,确定是否识别到来自用户的指令执行请求。如果电子设备没有识别到所述指令执行请求,换言之,如果电子设备接收来自用户的语音指令的重新输入,电子设备从预测指令列表中删除先前提供的预测指令,然后提供下一优先级的预测指令。
相反,如果在步骤213中确定电子设备准确识别到来自用户的指令执行请求,电子设备进行到步骤215,执行与语音指令相对应的功能。
也就是,在电子设备输入语音指令后,根据本发明的电子设备甚至可以通过用户语音的输入来执行针对语音指令的选择过程和校正过程。
在此之后,电子设备终止本发明的算法。
图3是根据本发明示例性实施例示出了在电子设备中更新预测指令列表的过程的流程图。
参考图3,假设电子设备识别出来自用户的语音指令“给Jenny发送消息”,获取预测指令,预测指令包括“给Jane发送消息”,“给Johnny发送消息”以及“给Jenny发送消息”,在预测指令“给Jane发送消息”,“给Johnny发送消息”以及“给Jenny发送消息”中确定“给Jane发送消息”与从用户识别到的语音指令“给Jenny发送消息”最相似。此外,更新预测指令列表的过程是指电子设备由于无法准确识别用户的语音指令而更新候选指令列表的过程。
首先,在步骤301,电子设备接收语音指令的重新输入。在此之后,电子设备进行到步骤303,使用在步骤301中重新输入的语音指令来确定用户想要校正的指令。此处,校正指令是在先前输入的语音指令中用户想要校正的那个部分,可以是词或句的一部分或整个词或句。
在示例性实施例中,电子设备将重新输入的指令与先前识别的指令比较,然后确定用户想要校正重新输入的指令和先前识别的指令的不同部分。在示例性实施例中,如果电子设备在接收到从用户输入的“给Jenny发送消息”之后,接收到指令“给XXX发送消息”的重新输入,则电子设备可以识别出用户想要校正的指令(即,校正指令)不是用于功能执行的指令(“发送消息”),而是针对接收方的指令(“给XXX”)。在这种情况中表达“给XXX”就是表达电子设备没有准确识别针对接收方的指令。
此外,电子设备可以从用户与用于通知校正的指令一起接收校正指令(比如,“更换接收方Jenny”)的输入。
另外,电子设备可以从用户仅接收用户想要校正的指令(如,“Jenny”)的重新输入。
接下来,电子设备进行到步骤305,并获取针对校正指令的预测指令。在此之后,电子设备进行到步骤307,从所获取的预测指令中删除先前使用的预测指令。在示例性实施例中,电子设备可以删除“给Jane发送消息”,这个指令是在预测指令“给Jane发送消息”,“给Johnny发送消息”以及“给Jenny发送消息”的列表中,确定为与用户的语音指令“给Jenny发送消息”最相似的指令。
接着,电子设备进行到步骤309,并确定预测指令的优先级顺序。在此之后,电子设备进行到步骤311,输出预测指令优先级列表。
也就是,电子设备利用从用户重新输入的指令来确定已被错误识别的指令,从预测指令列表中移除错误识别的指令,从而提供了语音识别成功率。
在此之后,电子设备终止本发明的算法。
与图2或图3相对应的操作可以通过存储在电子设备的存储器中的程序或在电子设备中提供的至少一个或多个处理器实现。
图4A到4C是根据本发明示例性实施例示出了在电子设备中提供语音识别功能的屏幕的图。
参阅图4A,电子设备进入用于接收用户的语音指令的输入的语音识别模式401,并识别由用户产生的语音指令403。
更具体地,电子设备识别“给Jane发送信息”,这是用户产生的语音指令403。
识别出上述用户的语音指令的电子设备输出关于语音指令403的识别结果。在示例性实施例中,电子设备输出多个预测指令作为关于语音指令403的初步预测结果。预测指令是能够从用户的语音指令403推测出的指令,表示从先前存储的指令中选择的、确定为与用户的语音指令403相似的指令。
参阅图4B,电子设备输出针对从用户输入的语音指令403“给Jane发送消息”的预测指令405,比如“给Jenny发送消息”,“给Johnny发送消息”以及“给Jane发送消息”。这意味着由于电子设备无法清楚识别“Jane”,电子设备在“Jenny”,“Johnny”和“Jane”中产生至少任意一个指令。
参阅图4C,电子设备的用户在输出预测指令中选择407与语音指令403匹配的预测指令,然后执行与所选预测指令相对应的功能。也就是,通过触摸输入或按键输入,电子设备的用户选择针对用户打算执行的功能的预测指令。
图4c示出了通过触摸输入,电子设备的用户在图4B的输出预测指令405中选择407与用户产生的语音指令403匹配的预测指令“给Jane发送消息”。
图5A至5D是根据本发明示例性实施例示出了在电子设备中提供语音识别功能的屏幕的图。
参阅图5A,电子设备进入用于接收用户语音指令503的输入的语音识别模式501,然后识别由用户产生的语音指令。
更具体地,电子设备识别用户产生的语音指令503“给Jane发送消息”。
识别出上述用户的语音指令的电子设备输出关于语音指令503的识别结果。在示例性实施例中,电子设备获取多个预测指令作为关于输入语音指令的初步预测结果,然后输出最高优先级的预测指令。此处,预测指令是能够从用户的语音指令503推测出的指令,表示在先前存储的指令中确定为与用户的语音指令503相似的指令。
参见图5B,电子设备获取509针对用户输入的语音指令503“给Jane发送消息”的预测指令,如“给Jenny发送消息”,“给Johnny发送消息”以及“给Jane发送消息”,然后输出506确定为具有最高优先级的预测指令“给Jenny发送消息”。
在示例性实施例中,电子设备可以标记出507无法清楚识别的指令“Jenny”,并允许用户针对错误识别的部分“Jenny”重新输入校正指令。
相应地,电子设备的用户请求校正错误识别的指令“Jenny”。
在示例性实施例中,电子设备可以仅接收校正请求,而不是接收指令的重新输入。在这种情况下,电子设备可以重新获取针对被标记为无法清楚识别的指令部分的预测指令,并向用户提供重新获取的预测指令。
在另一示例性实施例中,电子设备可以一并接收指令的重新输入以及校正请求。在这种情况下,电子设备可以重新获取针对重新输入的指令的预测指令,并向用户提供重新获取的预测指令。
参阅图5C,电子设备识别出“Jane”是从用户产生的校正指令511。在示例性实施例中,针对校正指令“Jane”,电子设备获取517预测指令“给Johnny发送消息”以及“给Jane发送消息”,然后输出513确定为具有较高优先级的预测指令“给Johnny发送信息”。此时,电子设备可以从先前的预测指令509“给Jenny发送消息”,“给Johnny发送消息”以及“给Jane发送消息”中去除先前使用的预测指令(即,在校正指令511输入前提供给用户的预测指令“给Jenny发送信息”),从而提高语音识别成功率。也就是,电子设备可以将预测指令509“给Jenny发送消息”,“给Johnny发送消息”以及“给Jane发送消息”更新为预测指令517“给Johnny发送消息”以及“给Jane发送消息”。这是从在先前的预测指令509“给Jenny发送消息”,“给Johnny发送消息”以及“给Jane发送消息”中删除优先级最高的针对“Jenny”的预测指令“给Jenny发送消息”。
在示例性实施例中,电子设备可以标记出515无法清楚识别的指令“Johnny”,并允许用户重新输入针对错误识别部分“Johnny”的校正指令“Jane”。
参阅图5D,在提供针对校正指令511的预测指令“给Johnny发送消息”的状态下,电子设备接收作为校正指令519的“Jane”的重新输入。在示例性实施例中,电子设备获取并输出521预测指令列表,所述预测指令列表反映了从针对校正指令511的预测指令“给Johnny发送消息”以及“给Jane发送消息”中删除了先前提供的预测指令“给Johnny发送信息”。
也就是,每当输入校正指令时,电子设备可以删除先前使用的预测指令,并可以更新预测指令,从而校正错误识别的指令。如果确定有错误识别的指令,电子设备可以标记出523指令的错误识别的部分,并允许用户重新输入针对错误识别部分的校正指令。
此外,电子设备可以以音频形式提供被确定为错误识别的语音指令,随后允许用户校正错误识别的语音指令。
在示例性实施例中,如果电子设备识别语音指令“给Jane发送消息”,并确定错误识别了“Jane”,电子设备可以通过以音频形式输出“Jane?”来校正错误识别的语音指令,然后允许用户响应于此而重新输入“Jane”。
与图5A至5D相对应的操作可以通过存储在电子设备的存储器中的程序或在电子设备内提供的至少一个或多个处理器来实现。
在示例性实施例中,根据本发明的电子设备执行如下处理:如果输入语音指令,创建和输出预测指令的列表,所述预测指令是与输入的语音指令相似的候选指令,然后每当输入用于校正所输出的候选指令的校对指令时,设备更新预测指令列表。接着,如果校正指令与更新的预测指令列表中相似度高的指令匹配,设备执行与语音指令相对应的语音识别功能。
因此,如果电子设备错误识别了用户的语音指令,可以接收错误识别的语音指令的重新输入。电子设备可以使用存储在电子设备存储器中的程序执行如上操作。
此外,根据本发明,电子设备包括:如果输入语音指令则创建和输出预测指令列表的装置,所述预测指令是与输入语音指令相似的候选指令;每当输入用于校正所输出的候选指令的校正指令时更新预测指令列表的装置;以及如果校正指令与更新的预测指令列表中的相似度高的指令匹配则执行与语音指令相对应的语音识别功能的装置。
这些装置各自都可以构建成分离的硬件或可以构建为一个硬件。
应该认识到,可以以硬件、软件或硬件和软件组合的形式实现根据权利要求和说明书中描述的本发明示例性实施例。在非临时计算机可读存储介质中可以存储任何这样的软件。计算机可读存储介质存储一个或多个程序(包括软件模块),所述一个或多个程序包括指令,所述指令在通过电子设备中的一个或多个处理器执行时引起电子设备执行本发明的方法。任何这样的软件可以易失性存储或非易失性存储的形式存储,例如ROM等存储装置,不管是否是可擦除的或可重写的,或者是以例如RAM、存储芯片、器件或集成电路等存储器的形式存储,或存储在例如CD、DVD、磁盘或磁带等光或磁可读介质上。应该认识到存储装置或存储介质是适于存储程序或多个程序的机器可读非暂时存储的具体实施方式,所述程序或多个程序包括在被执行时实施本发明实施例的指令。相应地,示例性实施例提供包括实施装置的编码的程序或任一本详述和存储所述软件的机器可读贮存器的权利要求中所述方法。
如上所述,本发明示例性实施例提供一种通过用户的语音校正错误识别的指令的电子设备,能够允许用户仅通过语音指令来控制多个功能。
尽管参考本发明的特定示例实施例示出和描述了本发明,然而本领域技术人员将理解,在不脱离由所附权利要求及其等价物限定的本发明的精神和范围的前提下,可以对本发明进行各种形式和细节上的改变。
Claims (17)
1.一种在电子设备中提供语音识别功能的方法,所述方法包括:
当输入语音指令时,输出预测指令的列表,所述预测指令是与输入的语音指令相似的候选指令;
当输入用于校正所输出的候选指令的校正指令时,更新预测指令列表;以及
如果校正指令与更新的预测指令列表中相似度高的指令匹配,执行与语音指令相对应的语音识别功能。
2.根据权利要求1所述的方法,其中输出预测指令的列表进一步包括:从预测指令的列表中定义和输出与输入的语音指令相似度高的候选指令。
3.根据权利要求1所述的方法,其中更新预测指令列表进一步包括:
从预测指令列表所包括的候选指令的列表中,删除与输入的语音指令相似度高的候选指令,并更新先前创建的预测指令列表;和
在更新的预测指令列表中,定义并输出与输入的语音指令相似度高的候选指令。
4.根据权利要求1所述的方法,还包括:
请求重新输入所输入的语音指令中错误识别的指令;和
创建预测指令的列表,所述预测指令是与重新输入的指令相似的候选指令。
5.根据权利要求4所述的方法,其中错误识别的指令以音频形式、文本形式和标记中的至少一种输出。
6.根据权利要求1所述的方法,其中输出预测指令的列表包括:按照与输入的语音指令的相似度的顺序整理候选指令。
7.一种提供语音识别功能的电子设备,所述设备包括:
音频处理器,用于处理语音指令以用于功能执行;
显示单元,用于输出来自语音指令处理的分析结果;
至少一个处理器,用于执行计算机程序;
存储器,用于存储数据和指令;和
至少一个程序,存储在存储器中,并配置成由所述至少一个处理器执行;
其中,当输入语音指令时,所述至少一个程序输出预测指令的列表,所述预测指令是与输入的语音指令相似的候选指令,当输入用于校正输出的候选指令的校正指令时,更新预测指令列表,并且如果校正指令与更新的预测指令列表中相似度高的指令匹配,执行与语音指令相对应的语音识别功能。
8.根据权利要求7所述的设备,其中程序包括进行如下处理的指令:创建预测指令列表,并在预测指令列表中定义和输出与输入的语音指令相似度高的候选指令。
9.根据权利要求7所述的设备,其中程序包括进行如下处理的指令:通过在预测指令列表包括的候选指令的列表中删除与输入的语音指令相似度高的候选指令,更新先前创建的预测指令列表,并在更新的候选指令列表中定义和输出与输入的语音指令相似度高的候选指令,来更新预测指令列表。
10.根据权利要求7所述的设备,其中程序包括进行如下处理的指令:请求重新输入所输入的语音指令中错误识别的指令,并创建预测指令的列表,所述预测指令是与重新输入的指令相似的候选指令。
11.根据权利要求10所述的设备,其中程序进行处理以便以音频形式、文本形式和标记中的至少一种输出错误识别的指令。
12.根据权利要求7所述的设备,其中程序包括指令,用于按照与输入的语音指令的相似度的顺序整理候选指令,并创建预测指令列表。
13.一种计算机可读存储介质,存储至少一个程序,所述程序包括当由电子设备执行时允许电子设备执行权利要求1所述方法的指令。
14.一种在电子设备中管理输入语音指令的方法,所述方法包括:
接收来自用户的输入语音指令;
创建与输入语音指令相似的候选指令的列表;
输出候选指令的列表;以及
基于用户从候选指令列表中选择一个候选指令,执行与语音指令相对应的语音识别功能。
15.根据权利要求14所述的方法,还包括:当输入用于校正输出的候选指令的校正指令时,更新候选指令的列表。
16.根据权利要求15所述的方法,其中更新候选指令的列表还包括:删除与输入语音指令相似度最高的候选指令,输出新的候选指令列表,所述新的候选指令列表具有与输入语音指令的相似度次高的候选指令。
17.根据权利要求14所述的方法,还包括:
请求重新输入在所述输入语音指令中错误识别的指令;和
创建与重新输入的指令相似的候选指令的列表。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR10-2012-0058125 | 2012-05-31 | ||
KR1020120058125A KR20130135410A (ko) | 2012-05-31 | 2012-05-31 | 음성 인식 기능을 제공하는 방법 및 그 전자 장치 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN103456296A true CN103456296A (zh) | 2013-12-18 |
Family
ID=48625744
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2013102054976A Pending CN103456296A (zh) | 2012-05-31 | 2013-05-29 | 提供语音识别功能的方法及其电子设备 |
Country Status (4)
Country | Link |
---|---|
US (1) | US20130325469A1 (zh) |
EP (1) | EP2677518A3 (zh) |
KR (1) | KR20130135410A (zh) |
CN (1) | CN103456296A (zh) |
Cited By (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103944983A (zh) * | 2014-04-14 | 2014-07-23 | 美的集团股份有限公司 | 语音控制指令纠错方法和系统 |
WO2016045468A1 (zh) * | 2014-09-22 | 2016-03-31 | 中兴通讯股份有限公司 | 一种语音输入控制的方法、装置及终端 |
CN105825848A (zh) * | 2015-01-08 | 2016-08-03 | 宇龙计算机通信科技(深圳)有限公司 | 一种语音识别方法、装置及终端 |
CN106155321A (zh) * | 2016-06-30 | 2016-11-23 | 联想(北京)有限公司 | 一种控制方法及电子设备 |
CN106992001A (zh) * | 2017-03-29 | 2017-07-28 | 百度在线网络技术(北京)有限公司 | 语音指令的处理方法、装置和系统 |
CN108257601A (zh) * | 2017-11-06 | 2018-07-06 | 广州市动景计算机科技有限公司 | 用于语音识别文本的方法、设备、客户端装置及电子设备 |
CN108428451A (zh) * | 2018-03-12 | 2018-08-21 | 联想(北京)有限公司 | 语音控制方法、电子设备和语音控制系统 |
CN110570867A (zh) * | 2019-09-12 | 2019-12-13 | 安信通科技(澳门)有限公司 | 一种本地新增语料的语音处理方法及系统 |
CN110675866A (zh) * | 2014-04-22 | 2020-01-10 | 纳宝株式会社 | 用于改进至少一个语义单元集合的方法、设备及计算机可读记录介质 |
CN110808051A (zh) * | 2019-10-30 | 2020-02-18 | 腾讯科技(深圳)有限公司 | 一种技能选取的方法以及相关装置 |
CN111033610A (zh) * | 2017-10-17 | 2020-04-17 | 三星电子株式会社 | 电子装置及语音识别方法 |
WO2021128967A1 (zh) * | 2019-12-24 | 2021-07-01 | 深圳Tcl数字技术有限公司 | 语音识别修正方法、装置和存储介质 |
WO2021238737A1 (zh) * | 2020-05-26 | 2021-12-02 | 索尼集团公司 | 物联网中的操作电子设备、管理电子设备和通信方法 |
CN110808051B (zh) * | 2019-10-30 | 2024-06-04 | 腾讯科技(深圳)有限公司 | 一种技能选取的方法以及相关装置 |
Families Citing this family (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE112015001468T5 (de) | 2014-03-27 | 2016-12-15 | Sony Corporation | Elektronische Vorrichtung und Verfahren zum Identifizieren von Eingabebefehlen eines Benutzers |
EP3131093B1 (en) * | 2014-04-08 | 2021-05-12 | Sony Corporation | Information processing device, information processing method, and program |
KR101651909B1 (ko) * | 2014-04-22 | 2016-08-29 | 주식회사 큐키 | 음성 인식 텍스트 수정 방법 및 이 방법을 구현한 장치 |
US9915965B2 (en) * | 2015-03-16 | 2018-03-13 | The Florida International University Board Of Trustees | Flexible, secure energy management system |
CN105355195A (zh) * | 2015-09-25 | 2016-02-24 | 小米科技有限责任公司 | 音频识别方法及装置 |
KR102091684B1 (ko) * | 2015-10-08 | 2020-03-23 | 네이버 주식회사 | 음성 인식 텍스트 수정 방법 및 이 방법을 구현한 장치 |
KR102068182B1 (ko) | 2017-04-21 | 2020-01-20 | 엘지전자 주식회사 | 음성 인식 장치, 및 음성 인식 시스템 |
KR102392297B1 (ko) * | 2017-04-24 | 2022-05-02 | 엘지전자 주식회사 | 전자기기 |
CN107346228B (zh) * | 2017-07-04 | 2021-07-16 | 联想(北京)有限公司 | 电子设备的语音处理方法及系统 |
KR102441067B1 (ko) * | 2017-10-12 | 2022-09-06 | 현대자동차주식회사 | 차량의 사용자 입력 처리 장치 및 사용자 입력 처리 방법 |
CN108965584A (zh) * | 2018-06-21 | 2018-12-07 | 北京百度网讯科技有限公司 | 一种语音信息的处理方法、装置、终端和存储介质 |
CN112397060B (zh) * | 2019-07-31 | 2024-02-23 | 北京声智科技有限公司 | 一种语音指令处理方法、系统、设备及介质 |
WO2023090667A1 (ko) * | 2021-11-17 | 2023-05-25 | 삼성전자 주식회사 | 발화 기반 퀵 커맨드 재구성 방법 및 이를 위한 전자 장치 |
US20230252995A1 (en) * | 2022-02-08 | 2023-08-10 | Google Llc | Altering a candidate text representation, of spoken input, based on further spoken input |
CN115440212A (zh) * | 2022-06-30 | 2022-12-06 | 北京罗克维尔斯科技有限公司 | 语音控制方法、装置、电子设备、车辆和存储介质 |
CN117275474B (zh) * | 2023-08-15 | 2024-03-22 | 江苏华流仪表有限公司 | 一种基于智能语音识别的仪表数据管理系统及方法 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6064959A (en) * | 1997-03-28 | 2000-05-16 | Dragon Systems, Inc. | Error correction in speech recognition |
CN1282072A (zh) * | 1999-07-27 | 2001-01-31 | 国际商业机器公司 | 对语音识别结果中的错误进行校正的方法和语音识别系统 |
US6314397B1 (en) * | 1999-04-13 | 2001-11-06 | International Business Machines Corp. | Method and apparatus for propagating corrections in speech recognition software |
US6327566B1 (en) * | 1999-06-16 | 2001-12-04 | International Business Machines Corporation | Method and apparatus for correcting misinterpreted voice commands in a speech recognition system |
CN1335571A (zh) * | 2000-06-23 | 2002-02-13 | 微软公司 | 一种从一个由随机输入方法产生的候选列表中进行过滤和选择的方法和系统 |
US6505155B1 (en) * | 1999-05-06 | 2003-01-07 | International Business Machines Corporation | Method and system for automatically adjusting prompt feedback based on predicted recognition accuracy |
EP1562178A1 (en) * | 2004-02-05 | 2005-08-10 | Avaya Technology Corp. | Recognition results postprocessor for use in voice recognition systems |
US20100179812A1 (en) * | 2009-01-14 | 2010-07-15 | Samsung Electronics Co., Ltd. | Signal processing apparatus and method of recognizing a voice command thereof |
CN102141889A (zh) * | 2010-02-12 | 2011-08-03 | 微软公司 | 用于编辑的打字辅助 |
US20110301955A1 (en) * | 2010-06-07 | 2011-12-08 | Google Inc. | Predicting and Learning Carrier Phrases for Speech Input |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5255386A (en) * | 1990-02-08 | 1993-10-19 | International Business Machines Corporation | Method and apparatus for intelligent help that matches the semantic similarity of the inferred intent of query or command to a best-fit predefined command intent |
US5386494A (en) * | 1991-12-06 | 1995-01-31 | Apple Computer, Inc. | Method and apparatus for controlling a speech recognition function using a cursor control device |
US5712957A (en) * | 1995-09-08 | 1998-01-27 | Carnegie Mellon University | Locating and correcting erroneously recognized portions of utterances by rescoring based on two n-best lists |
JP3402100B2 (ja) * | 1996-12-27 | 2003-04-28 | カシオ計算機株式会社 | 音声制御ホスト装置 |
US6581033B1 (en) * | 1999-10-19 | 2003-06-17 | Microsoft Corporation | System and method for correction of speech recognition mode errors |
CN1215457C (zh) * | 2001-02-01 | 2005-08-17 | 松下电器产业株式会社 | 语句识别装置和方法 |
US6839667B2 (en) * | 2001-05-16 | 2005-01-04 | International Business Machines Corporation | Method of speech recognition by presenting N-best word candidates |
KR100605959B1 (ko) * | 2004-06-21 | 2006-08-02 | 삼성전자주식회사 | 음성을 이용한 번호입력방법 |
US7747437B2 (en) * | 2004-12-16 | 2010-06-29 | Nuance Communications, Inc. | N-best list rescoring in speech recognition |
US7941316B2 (en) * | 2005-10-28 | 2011-05-10 | Microsoft Corporation | Combined speech and alternate input modality to a mobile device |
US8055502B2 (en) * | 2006-11-28 | 2011-11-08 | General Motors Llc | Voice dialing using a rejection reference |
JP2011503729A (ja) * | 2007-11-07 | 2011-01-27 | スキニット | プリントコンテントのカスタマイズ |
KR101828273B1 (ko) * | 2011-01-04 | 2018-02-14 | 삼성전자주식회사 | 결합기반의 음성명령 인식 장치 및 그 방법 |
US8762156B2 (en) * | 2011-09-28 | 2014-06-24 | Apple Inc. | Speech recognition repair using contextual information |
-
2012
- 2012-05-31 KR KR1020120058125A patent/KR20130135410A/ko not_active Application Discontinuation
-
2013
- 2013-05-24 US US13/902,138 patent/US20130325469A1/en not_active Abandoned
- 2013-05-29 CN CN2013102054976A patent/CN103456296A/zh active Pending
- 2013-05-30 EP EP13169877.1A patent/EP2677518A3/en not_active Ceased
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6064959A (en) * | 1997-03-28 | 2000-05-16 | Dragon Systems, Inc. | Error correction in speech recognition |
US6314397B1 (en) * | 1999-04-13 | 2001-11-06 | International Business Machines Corp. | Method and apparatus for propagating corrections in speech recognition software |
US6505155B1 (en) * | 1999-05-06 | 2003-01-07 | International Business Machines Corporation | Method and system for automatically adjusting prompt feedback based on predicted recognition accuracy |
US6327566B1 (en) * | 1999-06-16 | 2001-12-04 | International Business Machines Corporation | Method and apparatus for correcting misinterpreted voice commands in a speech recognition system |
CN1282072A (zh) * | 1999-07-27 | 2001-01-31 | 国际商业机器公司 | 对语音识别结果中的错误进行校正的方法和语音识别系统 |
CN1335571A (zh) * | 2000-06-23 | 2002-02-13 | 微软公司 | 一种从一个由随机输入方法产生的候选列表中进行过滤和选择的方法和系统 |
EP1562178A1 (en) * | 2004-02-05 | 2005-08-10 | Avaya Technology Corp. | Recognition results postprocessor for use in voice recognition systems |
US20100179812A1 (en) * | 2009-01-14 | 2010-07-15 | Samsung Electronics Co., Ltd. | Signal processing apparatus and method of recognizing a voice command thereof |
CN102141889A (zh) * | 2010-02-12 | 2011-08-03 | 微软公司 | 用于编辑的打字辅助 |
US20110301955A1 (en) * | 2010-06-07 | 2011-12-08 | Google Inc. | Predicting and Learning Carrier Phrases for Speech Input |
Cited By (18)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103944983B (zh) * | 2014-04-14 | 2017-09-29 | 广东美的制冷设备有限公司 | 语音控制指令纠错方法和系统 |
CN103944983A (zh) * | 2014-04-14 | 2014-07-23 | 美的集团股份有限公司 | 语音控制指令纠错方法和系统 |
CN110675866B (zh) * | 2014-04-22 | 2023-09-29 | 纳宝株式会社 | 用于改进至少一个语义单元集合的方法、设备及计算机可读记录介质 |
CN110675866A (zh) * | 2014-04-22 | 2020-01-10 | 纳宝株式会社 | 用于改进至少一个语义单元集合的方法、设备及计算机可读记录介质 |
WO2016045468A1 (zh) * | 2014-09-22 | 2016-03-31 | 中兴通讯股份有限公司 | 一种语音输入控制的方法、装置及终端 |
CN105825848A (zh) * | 2015-01-08 | 2016-08-03 | 宇龙计算机通信科技(深圳)有限公司 | 一种语音识别方法、装置及终端 |
CN106155321A (zh) * | 2016-06-30 | 2016-11-23 | 联想(北京)有限公司 | 一种控制方法及电子设备 |
CN106992001A (zh) * | 2017-03-29 | 2017-07-28 | 百度在线网络技术(北京)有限公司 | 语音指令的处理方法、装置和系统 |
CN111033610A (zh) * | 2017-10-17 | 2020-04-17 | 三星电子株式会社 | 电子装置及语音识别方法 |
CN111033610B (zh) * | 2017-10-17 | 2023-10-27 | 三星电子株式会社 | 电子装置及语音识别方法 |
CN108257601A (zh) * | 2017-11-06 | 2018-07-06 | 广州市动景计算机科技有限公司 | 用于语音识别文本的方法、设备、客户端装置及电子设备 |
CN108428451B (zh) * | 2018-03-12 | 2021-05-18 | 联想(北京)有限公司 | 语音控制方法、电子设备和语音控制系统 |
CN108428451A (zh) * | 2018-03-12 | 2018-08-21 | 联想(北京)有限公司 | 语音控制方法、电子设备和语音控制系统 |
CN110570867A (zh) * | 2019-09-12 | 2019-12-13 | 安信通科技(澳门)有限公司 | 一种本地新增语料的语音处理方法及系统 |
CN110808051A (zh) * | 2019-10-30 | 2020-02-18 | 腾讯科技(深圳)有限公司 | 一种技能选取的方法以及相关装置 |
CN110808051B (zh) * | 2019-10-30 | 2024-06-04 | 腾讯科技(深圳)有限公司 | 一种技能选取的方法以及相关装置 |
WO2021128967A1 (zh) * | 2019-12-24 | 2021-07-01 | 深圳Tcl数字技术有限公司 | 语音识别修正方法、装置和存储介质 |
WO2021238737A1 (zh) * | 2020-05-26 | 2021-12-02 | 索尼集团公司 | 物联网中的操作电子设备、管理电子设备和通信方法 |
Also Published As
Publication number | Publication date |
---|---|
EP2677518A2 (en) | 2013-12-25 |
EP2677518A3 (en) | 2015-03-11 |
US20130325469A1 (en) | 2013-12-05 |
KR20130135410A (ko) | 2013-12-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN103456296A (zh) | 提供语音识别功能的方法及其电子设备 | |
CN104951335B (zh) | 应用程序安装包的处理方法及装置 | |
CN108958844B (zh) | 一种应用程序的控制方法及终端 | |
EP3171270A1 (en) | Method and device for information push | |
EP2523188A1 (en) | Speech recognition system and method based on word-level candidate generation | |
RU2706951C2 (ru) | Способ и устройство для обеспечения графического интерфейса пользователя | |
CN110018858B (zh) | 一种基于语音控制的应用管理方法、装置 | |
KR20130082339A (ko) | 음성 인식을 사용하여 사용자 기능을 수행하는 방법 및 장치 | |
KR20210134675A (ko) | 사용자 시연을 통하여 명령들을 학습하고 실행 가능하게 하기 위한 방법 및 시스템 | |
EP2879046A1 (en) | Voice-assisted editing method and device for terminal | |
CN103841268A (zh) | 信息处理方法和信息处理装置 | |
CN103558964A (zh) | 电子设备中的多层次话音反馈 | |
CN103456298A (zh) | 提供语音识别服务的方法及其电子装置 | |
US20180124212A1 (en) | Downloading an application to an apparatus | |
CN111801731B (zh) | 语音控制方法、语音控制装置以及计算机可执行非易失性存储介质 | |
CN104809174A (zh) | 一种终端应用的打开方法 | |
CN111933134A (zh) | 人机交互的方法及装置、电子设备、存储介质 | |
JP2021099874A (ja) | 複数ターン会話におけるパブリックシナリオ会話のバックトラッキング方法及び装置、電子機器、記憶媒体並びにコンピュータプログラム | |
CN104111728A (zh) | 基于操作手势的语音指令输入方法及电子设备 | |
CN103116483A (zh) | 一种调用微博的方法、装置及终端 | |
KR20130071136A (ko) | 사용자 디바이스에서 단축번호 제공 방법 및 장치 | |
CN103632665A (zh) | 一种语音识别方法及电子设备 | |
WO2023137909A1 (zh) | 应用程序编译和运行方法及装置、存储介质 | |
KR101379405B1 (ko) | 키워드 음성 인식을 통해 관련 어플리케이션을 실행시키는 음성 통화 처리 방법 및 이를 실행하는 모바일 단말 | |
CN105242865A (zh) | 输入处理方法、输入处理装置以及包括该装置的移动终端 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20131218 |