CN103943103B - 电子设备及其语音处理方法 - Google Patents

电子设备及其语音处理方法 Download PDF

Info

Publication number
CN103943103B
CN103943103B CN201410029493.1A CN201410029493A CN103943103B CN 103943103 B CN103943103 B CN 103943103B CN 201410029493 A CN201410029493 A CN 201410029493A CN 103943103 B CN103943103 B CN 103943103B
Authority
CN
China
Prior art keywords
user
instruction
speech
user speech
function
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201410029493.1A
Other languages
English (en)
Other versions
CN103943103A (zh
Inventor
李周瑛
朴相信
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Samsung Electronics Co Ltd
Original Assignee
Samsung Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Samsung Electronics Co Ltd filed Critical Samsung Electronics Co Ltd
Publication of CN103943103A publication Critical patent/CN103943103A/zh
Application granted granted Critical
Publication of CN103943103B publication Critical patent/CN103943103B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/30Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/02Feature extraction for speech recognition; Selection of recognition unit
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command

Abstract

提供了一种电子设备及其语音处理方法。提供涉及一种电子设备和及其语音处理方法的设备和方法。更具体地,所述设备和方法涉及一种能够识别用户语音的电子设备以及所述设备的语音处理方法。所述电子设备包括:语音识别器,被构造为识别用户语音;存储器,被构造为具有预先存储的指令;功能执行器,执行预定功能;控制器,被构造为响应于与指令相应的用户语音被输入,响应于所述指令来控制功能执行器执行功能,并响应于用于执行功能的对话语音和预设的对话选择信号被用户输入,控制功能执行器根据外部服务器分析用户语音的结果来执行功能。

Description

电子设备及其语音处理方法
技术领域
与示例性实施例一致的设备和方法涉及一种电子设备及其语音处理方法。更具体地讲,示例性实施例涉及一种能够识别用户的语音的电子设备及其语音处理方法。
背景技术
除了音频/视频(AV)设备(诸如蓝光光盘(BD)/数字多功能盘(DVD)播放器以及电视机)的最近的各种功能,使用麦克风进行语音识别以控制设备的功能已经被使用,超越了利用现有的远程控制器的输入方法。
语音识别方法包括识别预先存储的指令的语音命令处理方法,以及不识别预先存储的指令而识别语音的处理对话语音的方法。例如,为了调高电子设备的音量,可通过预先存储的指令“音量升高”或通过处理语音“增加音量”的对话语音识别来控制电子设备的音量,其中,语音“增加音量”具有与“音量升高”相同的含义但未被存储。在对话语音识别的情况下,外部语音识别服务器用来分析用户的语音并确定该语音的含义。
这两种语音识别系统目前使用在语音识别服务器中分析用户的口语语音的方法。已经确定是否存在命令模式处理。响应于与预先存储的指令相应的口语语音,相关功能被执行;否则,所述口语语音由对话模式处理来处理。
在前述方法中,当用户讲对话语音时,口语语音必须无条件地经历命令模式处理和对话模式处理两者。然而,这引起关于在执行命令模式处理和对话模式处理两者所花费的时间的问题,以及关于操作该系统的低效率的问题,其中,在操作该系统时,指令处理被浪费地执行。
发明内容
一个或多个示例性实施例可提供一种电子设备和考虑到用户语音的识别来处理所述电子设备的语音处理方法的方法,其中,时间延迟被降低并且设备的效率被提高。
此外,另一示例性实施例提供一种电子设备和处理语音的方法,其中,考虑到用户语音的识别,可引起并增强用户体验。
通过提供以下电子设备可实现本公开的上述和/或其他方面,所述电子设备包括:语音识别器,被构造为识别用户语音;存储器,被构造为预先存储指令;功能执行器,被构造为执行预定功能;控制器,被构造为响应于与指令相应的用户语音被输入,响应于所述指令控制功能执行器执行功能,并被构造为响应于用于执行功能的对话语音和预设的对话选择信号被用户输入,根据外部服务器分析用户语音的结果控制功能执行器执行功能。
根据另一示例性实施例的一方面,对话选择信号可包括用户语音信号。
根据另一示例性实施例的一方面,电子设备还可包括被构造为包括开关按钮的用户输入装置。
可通过提供以下电子设备来实现本示例性实施例的以上和/或其他方面,所述电子设备包括:语音识别器,被构造为识别用户语音;存储器,被构造为预先存储指令;功能执行器,被构造为执行预定功能;控制器,被构造为基于由用户输入的处理选择信号,通过指令处理和对话处理中的一个来处理用户语音,并被构造为控制功能执行器执行与处理的用户语音相应的功能,其中,在指令处理中,根据与用户语音相应的指令来执行功能,在对话处理中,根据外部服务器分析用户语音的结果来执行功能。
根据另一示例性实施例的一方面,所述处理选择信号可包括用于选择指令处理和对话处理中的一个的用户语音信号。
根据另一示例性实施例的一方面,语音识别器被构造为从用户顺序地接收与处理选择信号相应的用户语音以及用于执行功能的用户语音。
通过提供包括预先存储指令的存储器的电子设备的语音处理方法来实现示例性实施例的上述和/或其他方面,所述方法包括:识别用户语音;确定预设的对话选择信号是否被输入;响应于确定对话选择信号被输入,根据外部服务器分析识别的用户语音的结果来执行预定功能,并且响应于确定对话选择信号没有被输入,响应于与用户语音相应的指令来执行功能。
根据另一示例性实施例的一方面,在选择对话处理时,对话选择信号可包括用户语音信号。
另一示例性实施例可提供电子设备,所述电子设备包括:功能执行器,被构造为执行预定功能;控制器,被构造为响应于与指令相应的用户语音被输入,响应于接收到的所述指令来控制功能执行器执行功能,并响应于用于执行功能的对话语音和预设的对话选择信号被用户输入,控制功能执行器根据外部服务器分析用户语音的结果来执行功能。
电子设备还可包括:语音识别器,被构造为识别用户语音;存储器,被构造为具有预先存储的指令。对话选择信号可包括用户语音信号。
电子设备还可包括包含有开关按钮的用户输入装置,其中,对话选择信号通过开关按钮来产生。
附图说明
从结合附图进行的示例性实施例的以下描述,以上和/或其他方面将变得明显和更容易理解,其中:
图1是根据示例性实施例的电子设备的控制框图;
图2是根据示例性实施例的解释控制电子设备的方法的控制流程图;
图3是根据另一示例性实施例的解释控制电子设备的方法的控制流程图;
图4是根据示例性实施例的电子设备的控制框图。
具体实施方式
下面,将参照附图详细地描述示例性实施例,以便容易被具有本领域普通知识的人理解。所述示例性实施例可以以各种形式被实现,而不受限于在此阐述的实施例。为了清楚,省略公知部分的描述,并且相同的附图标号始终指示相同的元件。
图1是根据示例性实施例的电子设备的控制框图。在此示例性实施例中,电子设备1可包括电视机、计算机系统、机顶盒、蓝光光盘(BD)播放器、数字多功能盘(DVD)播放器、MP3播放器、可再现音频和图像文件的音频/视频(AV)装置等。电子设备1可被实现为个人数字助理(PDA)、膝上型计算机、家用或移动电话等,或可被实现为家用电器(诸如洗衣机和微波炉)。在此示例性实施例中,电子设备1可识别用户语音,并根据用户语音执行各种功能。为此,电子设备1包括语音识别器10、存储器20、功能执行器30和控制器40。
语音识别器10包括接收用户语音或各种声音的麦克风。语音识别器10响应于接收到用户语音而从接收到的声音提取用户语音,并将提取到的用户语音转换为可由电子设备1处理的机器语言,从而确定提取到的用户语音的含义。此外,响应于识别的语音是用于基于语音识别执行功能,语音识别器10将与所述语音相关的信息发送到控制器40。
根据另一示例性实施例,电子设备1可仅包括用于接收语音的麦克风,并可通过外部服务器确定用户语音,所述外部服务器通过分析接收到的声音来提取语音并确定所述语音的含义。
存储器20存储用于基于用户语音执行电子设备1的各种功能的指令。响应于电子设备1的功能通过基于除了根据使用按键、按钮或触摸传感器的用户的控制的输入之外的语音输入被执行,预先存储可用于执行所述功能的被预先设置的指令。例如,响应于电子设备1为电视机,可将诸如“音量升高”、“音量降低”、“频道改变”、“记录开始”等的指令存储在存储器20中。响应于识别出的用户语音与存储在存储器20中的指令匹配,控制器40根据所述指令执行电子设备1的功能。因此,响应于接收到与存储在存储器20中的指令匹配的用户语音,确定语音识别处理的控制器40执行作为指令处理的功能。在指令处理的情况下,响应于接收到的用户语音与存储的指令匹配或具有和与存储的指令相应的语音相同或类似的含义,控制器40根据所述用户语音不执行任何功能。
用户可直接将各种指令输入到存储器20,或可改变或删除指令。存储经常使用的指令,使得可快速并迅速地执行功能。
功能执行器30象征性地表示与可由电子设备1执行的各种功能相应的执行器。功能执行器30可包括用于执行各种功能所需的硬件或软件,并且所述功能可不通过用户语音来执行而通过用户的直接控制来执行。
控制器40响应于从语音识别器10接收到用户语音的识别结果,来控制用户语音以进行指令处理和对话处理中的一个,从而操作功能执行器30。在对话处理中,响应于用户语音不与存储在存储器20中的指令匹配,用户语音被发送到外部服务器2并被处理,以基于来自服务器2的分析结果执行功能。例如,响应于用户输入诸如“你可以调高音量吗?”或“大点声”的语音(具有与存储的“音量升高”类似的含义)而不是“音量升高”,控制器40将识别的用户语音发送到服务器2,允许服务器2确定所述语音的含义,并从服务器2接收确定的结果。服务器2确定用户语音,并将与在存储的指令中的一个指令相关的信息或与用于执行功能的算法相关的信息发送到电子设备1。
在本示例性实施例中,控制器40根据由用户输入的预设的对话选择信号来使用指令处理和对话处理中的一个以处理用户语音。也就是说,响应于用户输入用于通过对话处理来处理语音的对话选择信号,控制器40通过对话处理来处理用户语音。另一方面,响应于对话选择信号没有被输入,可通过指令处理来处理用户语音。
例如,响应于用户输入“对话”的语音以及用于执行功能的语音,控制器40将用于执行功能的语音发送到服务器2,进而从服务器接收分析结果。在此情况下,对话选择信号是用于选择对话处理的用户语音。响应于对话选择信号是用户语音,用户可根据他/她的个人喜好设置各种对话选择信号。因此,通过麦克风输入语音并将其存储,使得可提高电子设备1的可用性,并且用户可积累他/她使用电子设备1的经验。
众所周知,当用户输入语音时,通过指令处理来处理他/她的语音。此时,响应于用户语音与存储的指令不匹配,通过对话处理再次处理所述语音。在已知的控制下,即使响应于用户语音与指令不匹配,指令处理也必须被浪费地实现,因此在响应于用户语音和无用的控制使机械效率恶化时,时间被延迟。
在本示例性实施例中,如果他/她想通过对话处理来处理他/她的将被处理的语音,则用户可输入用于选择处理的信号和用于命令的语音。因此,电子设备1可更快速有效地响应于用户的命令。另外,即使用户没有逐个记住存储在存储器20中的多个指令,也可使用各种言辞,以执行用户期望的功能。
响应于用户仅输入用于执行功能的语音而不输入对话选择信号,控制器40根据指令处理来处理用户语音。此时,响应于由用户输入的语音与存储的指令不匹配,控制器40切换到对话处理并处理用户语音。这是因为即使用户不输入对话选择信号,也会根据用户的意图来实现功能。
根据另一示例性实施例,控制器40存储由对话处理所处理的用户语音的历史和记录。响应于特定语音被重复输入,所述历史和记录可被存储在存储器20中。在功能通过存储在存储器20中的指令被执行的情况下,这种情况比使用外部服务器2来执行所述功能的情况要快。因此,存储用户语音模式,以便引起指令处理而不是对话处理。在此情况下,控制器40可通过图形用户界面(GUI)等来通知用户:由用户经常使用的指令不是通过对话处理而是通过指令处理被处理。
图2是根据示例性实施例的解释控制电子设备的方法的控制流程图。参照图2,根据示例性实施例的电子设备的语音处理方法如下所示。
电子设备1从用户接收用于执行功能的用户语音并识别该语音(S10)。
将由语音识别器10识别的用户语音发送到控制器40,然后控制器40确定所述用户语音是否涉及预设的对话选择信号,即,对话选择信号是否被输入(S20)。
结果,响应于确定对话选择信号被输入,控制器40确定对话处理被选择;请求服务器2对识别的用户语音进行分析;根据从服务器2接收到的分析结果来执行电子设备1的功能(S30)。
另一方面,响应于确定对话选择信号没有被输入,控制器40确定指令处理被选择;并根据与用户语音匹配的指令来执行电子设备1的功能(S40)。
图3是根据另一示例性实施例的解释控制电子设备的方法的控制流程图。在此示例性实施例中,控制器40基于用于选择对话处理或指令处理的选择信号使用指令处理和对话处理中的一个,以便处理用户语音,其中,所述指令处理根据来自服务器2的与用户语音匹配的指令来执行功能,所述对话处理根据用户语音的分析结果来执行功能;并且控制器40控制功能执行器30执行与处理的用户语音相应的功能。也就是说,根据示例性实施例的电子设备1从用户接收选择信号,以明确地选择指令处理或对话处理。
如图3所示,根据示例性实施例,用户将用于选择处理的处理选择信号与用于执行功能的语音一起输入到电子设备1(S11)。所述处理选择信号可包括用于选择指令处理和对话处理中的一个的用户语音。在此情况下,语音识别器10顺序地接收用于选择处理的用户语音和用于执行功能的用户语音。
控制器40确定由用户输入的处理选择信号是对话选择信号还是指令选择信号(S21)。
结果,如图2的S30中所示,响应于处理选择信号是对话选择信号,控制器40通过服务器2分析识别出的用户语音,并根据分析结果执行电子设备1的功能(S30)。
同样地,响应于处理选择信号不是对话选择信号而是指令选择信号,控制器40确定指令处理被选择,并根据与用户语音匹配的指令来执行电子设备1的功能(S40)。
图4是根据示例性实施例的电子设备的控制框图。如图所示,在此实施例中的电子设备1还包括用户输入装置50。用户输入装置50可包括开关按钮51,并还可包括触摸传感器(诸如触摸板)。用户可控制开关按钮51来产生对话选择信号或处理选择信号。也就是说,用户可使用开关按钮51来选择用于用户语音识别的处理。响应于用户想要通过他/她的语音来执行电子设备1的功能,他/她可激活或去激活开关按钮51,从而选择指令处理和对话处理中的一个。可选地,另外,当开关按钮51被激活时可设置用户的喜好处理,因此,方便用户通过他/她的语音来执行功能。
虽然已经示出并描述了一些示例性实施例,但是本领域的技术人员将理解,在不脱离本发明的原则和精神的情况下,可在这些示例性实施例中进行改变,其中,本发明的范围由权利要求及其等同物来限定。

Claims (6)

1.一种电子设备,包括:
语音识别器,被构造为识别用户语音;
存储器,被构造为存储多个指令;
控制器,被构造为:
确定用户语音是否包括指示选择对话处理的语音部分,
响应于确定用户语音不包括指示选择对话处理的语音部分,执行指令处理以根据用户语音执行与存储器中存储的多个指令中的一个指令相应的功能,
响应于确定用户语音包括指示选择对话处理的语音部分,执行对话处理以将用户语音发送到分析用户语音的外部服务器并且根据外部服务器的分析结果来执行功能。
2.如权利要求1所述的电子设备,其中,语音识别器顺序地接收来自用户的用于选择对话处理的语音部分和用于执行功能的语音部分。
3.如权利要求1所述的电子设备,还包括包含有开关按钮的用户输入装置,
其中,对话处理通过所述开关按钮来选择的。
4.一种包括被构造为存储指令的存储器的电子设备的语音处理方法,所述方法包括:
识别用户语音;
确定用户语音是否包括指示选择对话处理的语音部分;
响应于确定用户语音包括指示选择对话处理的语音部分,执行对话处理以根据外部服务器分析识别的用户语音的结果来执行预定功能,并且
响应于确定用户语音不包括指示选择对话处理的语音部分,执行指令处理以响应于与用户语音相应的指令来执行功能。
5.如权利要求4所述的方法,其中,用户语音包括来自用户的用于选择对话处理的语音部分和用于执行功能的语音部分。
6.如权利要求4所述的方法,其中,所述电子设备包括包含开关按钮的用户输入装置,
其中,对话处理是通过所述开关按钮来选择的。
CN201410029493.1A 2013-01-22 2014-01-22 电子设备及其语音处理方法 Active CN103943103B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
KR1020130007032A KR102112742B1 (ko) 2013-01-22 2013-01-22 전자장치 및 그 음성 처리 방법
KR10-2013-0007032 2013-01-22

Publications (2)

Publication Number Publication Date
CN103943103A CN103943103A (zh) 2014-07-23
CN103943103B true CN103943103B (zh) 2019-05-28

Family

ID=49518683

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201410029493.1A Active CN103943103B (zh) 2013-01-22 2014-01-22 电子设备及其语音处理方法

Country Status (4)

Country Link
US (1) US9830911B2 (zh)
EP (1) EP2757557B1 (zh)
KR (1) KR102112742B1 (zh)
CN (1) CN103943103B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102112742B1 (ko) * 2013-01-22 2020-05-19 삼성전자주식회사 전자장치 및 그 음성 처리 방법
KR102420567B1 (ko) * 2017-12-19 2022-07-13 삼성전자주식회사 음성 인식 장치 및 방법
CN109195073A (zh) * 2018-08-03 2019-01-11 努比亚技术有限公司 一种麦克风、音频处理方法、终端及计算机可读存储介质

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1408173A (zh) * 1999-10-05 2003-04-02 约莫拜尔公司 用于基于语音识别的信息信号提供的方法和设备

Family Cites Families (59)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
IT1156544B (it) * 1982-11-08 1987-02-04 Olivetti & Co Spa Metodo ed apparecchiatura di riconoscimento fonetico di parole
US4827520A (en) * 1987-01-16 1989-05-02 Prince Corporation Voice actuated control system for use in a vehicle
US5748841A (en) * 1994-02-25 1998-05-05 Morin; Philippe Supervised contextual language acquisition system
JP2002116797A (ja) * 2000-10-11 2002-04-19 Canon Inc 音声処理装置、音声処理方法及び記憶媒体
US7174299B2 (en) * 1995-08-18 2007-02-06 Canon Kabushiki Kaisha Speech recognition system, speech recognition apparatus, and speech recognition method
US5917891A (en) * 1996-10-07 1999-06-29 Northern Telecom, Limited Voice-dialing system using adaptive model of calling behavior
US6385573B1 (en) * 1998-08-24 2002-05-07 Conexant Systems, Inc. Adaptive tilt compensation for synthesized speech residual
US6513006B2 (en) * 1999-08-26 2003-01-28 Matsushita Electronic Industrial Co., Ltd. Automatic control of household activity using speech recognition and natural language
US7027991B2 (en) * 1999-08-30 2006-04-11 Agilent Technologies, Inc. Voice-responsive command and control system and methodology for use in a signal measurement system
AU8030300A (en) * 1999-10-19 2001-04-30 Sony Electronics Inc. Natural language interface control system
JP3471686B2 (ja) * 1999-11-26 2003-12-02 松下電器産業株式会社 動作制御方法およびその装置
US6513009B1 (en) * 1999-12-14 2003-01-28 International Business Machines Corporation Scalable low resource dialog manager
US7120234B1 (en) * 1999-12-29 2006-10-10 Bellsouth Intellectual Property Corp. Integrated tone-based and voice-based telephone user interface
US6560576B1 (en) * 2000-04-25 2003-05-06 Nuance Communications Method and apparatus for providing active help to a user of a voice-enabled application
US6757365B1 (en) * 2000-10-16 2004-06-29 Tellme Networks, Inc. Instant messaging via telephone interfaces
WO2002037471A2 (en) * 2000-11-03 2002-05-10 Zoesis, Inc. Interactive character system
US7203651B2 (en) * 2000-12-07 2007-04-10 Art-Advanced Recognition Technologies, Ltd. Voice control system with multiple voice recognition engines
GB2372864B (en) * 2001-02-28 2005-09-07 Vox Generation Ltd Spoken language interface
US6738743B2 (en) * 2001-03-28 2004-05-18 Intel Corporation Unified client-server distributed architectures for spoken dialogue systems
AU2002314933A1 (en) * 2001-05-30 2002-12-09 Cameronsound, Inc. Language independent and voice operated information management system
US7369997B2 (en) * 2001-08-01 2008-05-06 Microsoft Corporation Controlling speech recognition functionality in a computing device
US6996528B2 (en) * 2001-08-03 2006-02-07 Matsushita Electric Industrial Co., Ltd. Method for efficient, safe and reliable data entry by voice under adverse conditions
FR2829896B1 (fr) * 2001-09-14 2003-12-19 Radiotelephone Sfr Procede de navigation adaptative dans un systeme vocal interactif et utilisation du systeme
US6721633B2 (en) * 2001-09-28 2004-04-13 Robert Bosch Gmbh Method and device for interfacing a driver information system using a voice portal server
US7290207B2 (en) * 2002-07-03 2007-10-30 Bbn Technologies Corp. Systems and methods for providing multimedia information management
US7133828B2 (en) * 2002-10-18 2006-11-07 Ser Solutions, Inc. Methods and apparatus for audio data analysis and data mining using speech recognition
US6834265B2 (en) * 2002-12-13 2004-12-21 Motorola, Inc. Method and apparatus for selective speech recognition
US7197331B2 (en) * 2002-12-30 2007-03-27 Motorola, Inc. Method and apparatus for selective distributed speech recognition
US7076428B2 (en) * 2002-12-30 2006-07-11 Motorola, Inc. Method and apparatus for selective distributed speech recognition
US20040230637A1 (en) * 2003-04-29 2004-11-18 Microsoft Corporation Application controls for speech enabled recognition
US7720683B1 (en) * 2003-06-13 2010-05-18 Sensory, Inc. Method and apparatus of specifying and performing speech recognition operations
US8055713B2 (en) * 2003-11-17 2011-11-08 Hewlett-Packard Development Company, L.P. Email application with user voice interface
US20050177373A1 (en) * 2004-02-05 2005-08-11 Avaya Technology Corp. Methods and apparatus for providing context and experience sensitive help in voice applications
US20120253823A1 (en) * 2004-09-10 2012-10-04 Thomas Barton Schalk Hybrid Dialog Speech Recognition for In-Vehicle Automated Interaction and In-Vehicle Interfaces Requiring Minimal Driver Processing
TWI297123B (en) * 2004-12-29 2008-05-21 Delta Electronics Inc Interactive entertainment center
US7826945B2 (en) * 2005-07-01 2010-11-02 You Zhang Automobile speech-recognition interface
US7640160B2 (en) * 2005-08-05 2009-12-29 Voicebox Technologies, Inc. Systems and methods for responding to natural language speech utterance
CA2620931A1 (en) * 2005-09-01 2007-03-08 Vishal Dhawan Voice application network platform
US8688451B2 (en) * 2006-05-11 2014-04-01 General Motors Llc Distinguishing out-of-vocabulary speech from in-vocabulary speech
US8880402B2 (en) * 2006-10-28 2014-11-04 General Motors Llc Automatically adapting user guidance in automated speech recognition
US8032383B1 (en) * 2007-05-04 2011-10-04 Foneweb, Inc. Speech controlled services and devices using internet
US8099289B2 (en) * 2008-02-13 2012-01-17 Sensory, Inc. Voice interface and search for electronic devices including bluetooth headsets and remote systems
US20090282371A1 (en) * 2008-05-07 2009-11-12 Carrot Medical Llc Integration system for medical instruments with remote control
US7933777B2 (en) * 2008-08-29 2011-04-26 Multimodal Technologies, Inc. Hybrid speech recognition
TWI420433B (zh) 2009-02-27 2013-12-21 Ind Tech Res Inst 語音互動系統與方法
US9842591B2 (en) * 2010-05-19 2017-12-12 Sanofi-Aventis Deutschland Gmbh Methods and systems for modifying operational data of an interaction process or of a process for determining an instruction
JP5771002B2 (ja) * 2010-12-22 2015-08-26 株式会社東芝 音声認識装置、音声認識方法および音声認識装置を搭載したテレビ受像機
KR101828273B1 (ko) * 2011-01-04 2018-02-14 삼성전자주식회사 결합기반의 음성명령 인식 장치 및 그 방법
US9183843B2 (en) * 2011-01-07 2015-11-10 Nuance Communications, Inc. Configurable speech recognition system using multiple recognizers
US10230346B2 (en) * 2011-01-10 2019-03-12 Zhinian Jing Acoustic voice activity detection
US8954329B2 (en) * 2011-05-23 2015-02-10 Nuance Communications, Inc. Methods and apparatus for acoustic disambiguation by insertion of disambiguating textual information
US9117449B2 (en) * 2012-04-26 2015-08-25 Nuance Communications, Inc. Embedded system for construction of small footprint speech recognition with user-definable constraints
FR2996399B3 (fr) * 2012-09-28 2015-05-15 Samsung Electronics Co Ltd Appareil de traitement d'image et procede de commande de celui-ci et systeme de traitement d'image
EP2904608B1 (en) * 2012-10-04 2017-05-03 Nuance Communications, Inc. Improved hybrid controller for asr
KR101284594B1 (ko) * 2012-10-26 2013-07-10 삼성전자주식회사 영상처리장치 및 그 제어방법, 영상처리 시스템
KR20140054643A (ko) * 2012-10-29 2014-05-09 삼성전자주식회사 음성인식장치 및 음성인식방법
KR102019719B1 (ko) * 2013-01-17 2019-09-09 삼성전자 주식회사 영상처리장치 및 그 제어방법, 영상처리 시스템
KR102112742B1 (ko) * 2013-01-22 2020-05-19 삼성전자주식회사 전자장치 및 그 음성 처리 방법
KR101456974B1 (ko) * 2013-05-21 2014-10-31 삼성전자 주식회사 사용자 단말기, 음성인식 서버 및 음성인식 가이드 방법

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1408173A (zh) * 1999-10-05 2003-04-02 约莫拜尔公司 用于基于语音识别的信息信号提供的方法和设备

Also Published As

Publication number Publication date
EP2757557B1 (en) 2016-12-28
KR102112742B1 (ko) 2020-05-19
US20140207470A1 (en) 2014-07-24
US9830911B2 (en) 2017-11-28
EP2757557A1 (en) 2014-07-23
CN103943103A (zh) 2014-07-23
KR20140094330A (ko) 2014-07-30

Similar Documents

Publication Publication Date Title
CN105027574B (zh) 在语音识别系统中控制显示装置的显示装置和方法
CN106658129B (zh) 基于情绪的终端控制方法、装置及终端
EP3039531B1 (en) Display apparatus and controlling method thereof
KR102246900B1 (ko) 전자 장치 및 이의 음성 인식 방법
CN105690385B (zh) 基于智能机器人的应用调用方法与装置
KR102245747B1 (ko) 사용자 명령어 등록을 위한 디스플레이 장치 및 방법
US10049665B2 (en) Voice recognition method and apparatus using video recognition
CN107153499A (zh) 交互式白板设备的语音控制
US9218052B2 (en) Framework for voice controlling applications
CN108352159A (zh) 用于识别语音的电子设备和方法
KR102009316B1 (ko) 대화형 서버, 디스플레이 장치 및 그 제어 방법
WO2014086238A1 (zh) 语音后台控制方法及移动终端
CN104615359A (zh) 对应用软件进行语音操作的方法及装置
CN104505108B (zh) 一种信息定位方法及终端
US20160078864A1 (en) Identifying un-stored voice commands
CN108665889B (zh) 语音信号端点检测方法、装置、设备及存储介质
CN103943103B (zh) 电子设备及其语音处理方法
CN105741841B (zh) 语音控制方法及电子设备
JP2018021987A (ja) 会話処理装置、及びプログラム
WO2017092322A1 (zh) 智能电视的浏览器操作方法及智能电视
CN103197862A (zh) 电子设备及其控制方法
US20180350359A1 (en) Methods, systems, and media for controlling a media content presentation device in response to a voice command
JP2016058816A (ja) 情報端末および情報端末システム
KR102456588B1 (ko) 사용자 명령어 등록을 위한 디스플레이 장치 및 방법
KR102089593B1 (ko) 디스플레이 장치, 및 이의 제어 방법, 그리고 음성 인식 시스템의 디스플레이 장치 제어 방법

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant