CN103187063A - 电子装置和控制电子装置的方法 - Google Patents

电子装置和控制电子装置的方法 Download PDF

Info

Publication number
CN103187063A
CN103187063A CN2012104254239A CN201210425423A CN103187063A CN 103187063 A CN103187063 A CN 103187063A CN 2012104254239 A CN2012104254239 A CN 2012104254239A CN 201210425423 A CN201210425423 A CN 201210425423A CN 103187063 A CN103187063 A CN 103187063A
Authority
CN
China
Prior art keywords
voice
electronic installation
mission mode
speech
guide message
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2012104254239A
Other languages
English (en)
Inventor
韩尚珍
权容焕
金正根
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Samsung Electronics Co Ltd
Original Assignee
Samsung Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from KR1020110147448A external-priority patent/KR20130078483A/ko
Priority claimed from KR1020120058340A external-priority patent/KR101324232B1/ko
Application filed by Samsung Electronics Co Ltd filed Critical Samsung Electronics Co Ltd
Publication of CN103187063A publication Critical patent/CN103187063A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/41Structure of client; Structure of client peripherals
    • H04N21/422Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS]
    • H04N21/42204User interfaces specially adapted for controlling a client device through a remote control device; Remote control devices therefor
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/06Transformation of speech into a non-audible representation, e.g. speech visualisation or speech processing for tactile aids
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/41Structure of client; Structure of client peripherals
    • H04N21/422Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS]
    • H04N21/42203Input-only peripherals, i.e. input devices connected to specially adapted client devices, e.g. global positioning system [GPS] sound input device, e.g. microphone
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/47End-user applications
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/30Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/225Feedback of the input speech
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/226Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics
    • G10L2015/228Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics of application context

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Human Computer Interaction (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Health & Medical Sciences (AREA)
  • Data Mining & Analysis (AREA)
  • Quality & Reliability (AREA)
  • User Interface Of Digital Computer (AREA)
  • Selective Calling Equipment (AREA)
  • Details Of Television Systems (AREA)

Abstract

提供了一种电子装置和一种控制电子装置的方法。所述方法包括:接收语音命令;以及如果语音命令是第一语音启动命令,则将电子装置的模式改变为第一语音任务模式,如果语音命令是第二语音命令,则将电子装置的模式改变为第二语音任务模式,其中,在第一语音任务模式中,根据另一语音输入来控制电子装置,在第二语音任务模式中,根据与电子装置一起操作的外部装置所接收的另一语音输入来控制电子装置。因此,通过使用电子装置的麦克风和外部装置的麦克风提供了控制电子装置的效率和灵活性。

Description

电子装置和控制电子装置的方法
相关申请的交叉引用
本申请要求根据35U.S.C第119条享有分别在2011年12月30日、2011年12月30日和2012年5月31日在韩国知识产权局提交的第10-2011-0147448号、第10-2011-0147453号和10-2012-0058340号韩国专利申请的优先权,通过引用将以上申请的全部公开内容包含于此。
技术领域
示例性实施例总体上涉及一种电子装置和一种控制电子装置的方法,更具体地,涉及一种根据通过语音输入单元的用户语音输入而被控制的电子装置和一种使用语音输入来控制电子装置的方法。
背景技术
近来技术发展增加了多种电子装置的供应。具体地,已经在消费者家中使用了包括TV在内的多种电子装置。这些电子装置的功能随用户需求而逐渐扩展。例如,TV可以连接至互联网,以支持互联网服务。此外,用户通过TV观看大量数字广播频道。
因此,需要多种输入方法,用于有效地使用电子装置的多种功能。例如,将使用遥控器的输入方法、使用鼠标的输入方法、使用触摸板的输入方法等应用于电子装置。
然而,只使用这种简单方法将难以有效地使用电子装置的多种功能。例如,如果电子装置的所有功能被实现为只经由遥控器进行控制,则将不可避免地增加遥控器的按钮数目。在这种情况下,普通用户难以学习如何使用遥控器并且按压错误按钮的几率增大。此外,根据在屏幕上显示多种菜单来帮助用户搜索和选择相应菜单的方法,用户要检查复杂的菜单树来选择期望菜单,对用户而言,这可能是困难和混乱的。
因此,已经开发了使用语音识别的技术,以更方便和直观地控制电子装置。通过使用语音识别来控制电子装置的方法的示例包括通过使用电子装置的麦克风来控制电子装置的方法和通过使用与电子装置一起操作的外部装置(例如,遥控器)的麦克风来控制电子装置的方法。
然而,如果电子装置同时使用两种语音输入方法,则用户可能不知道使用哪个麦克风来控制电子装置。此外,因为使用两种语音输入方法控制的电子装置的功能彼此不同,所以将向用户提供不同用户界面(UI)。
此外,由于语音识别技术上的限制,用户的语音并非总是被正确识别。此外,由于环境或不熟练操作,在语音识别中可能发生错误。因此,需要一种向用户示出这种语音识别错误的方法。
发明内容
示例性实施例解决了至少上述问题和/或缺点及以上没有描述的其它缺点。此外,不需要示例性实施例克服上述缺点,并且示例性实施例可以不克服任何上述问题。
示例性实施例提供了一种电子装置及使用其来控制所述电子装置的方法,所述电子装置根据语音命令提供不同语音任务模式,并且显示与所述不同语音任务模式中的每一个相对应的不同语音向导信息。
示例性实施例还提供了一种电子装置和使用其来控制所述电子装置的方法,所述电子装置选择并显示多个反馈消息中的一个,用于示出语音识别错误。
根据示例性实施例的一个方面,提供了一种控制电子装置的方法。所述方法可以包括:接收语音输入;以及如果语音输入是第一语音命令,则将电子装置的模式改变为第一语音任务模式,如果语音输入是第二语音命令,则将电子装置的模式改变为第二语音任务模式,其中,在第一语音任务模式中,电子装置接收另一语音输入,在第二语音任务模式中,经由与电子装置一起操作的外部装置接收所述另一语音输入。
所述方法还可以包括:如果电子装置的模式改变为第一语音任务模式,则显示与第一语音任务模式相对应的第一语音向导信息,以及如果电子装置的模式改变为第二语音任务模式,则显示与第二语音任务模式相对应的第二语音向导信息。
第一语音向导信息可以包括多个语音项,在第一语音任务模式中引导用户提供所述另一语音输入。第二语音向导信息可以包括多个语音项,在第二语音任务模式中引导用户提供所述另一语音输入。第二语音向导信息的所述多个语音项中的至少一个不同于第一语音向导信息中的所述多个语音项。
第一语音向导信息可以包括所述多个语音项中的第一语音项,第一语音项是用于执行关于电子装置的频道加/减命令的指令。第二语音向导信息可以排除第一语音项并且可以包括第二语音项,其中,第二语音项是用于提供频道列表的指令。
第一语音向导信息可以包括对电子装置处于第一语音任务模式加以指示的图标区。第二语音向导信息可以包括对电子装置处于第二语音任务模式加以指示的图标区。
如果电子装置切换至第二语音任务模式,则接收对按压了外部装置的预设按钮加以指示的输入,以及所述另一语音输入由所述外部装置接收且被提供给电子装置。
第一语音命令可以是预设词,第二语音命令可以是在接收了对按压了外部装置的预设按钮加以指示的输入之后的所述另一语音输入。
所述外部装置可以是遥控器。
根据示例性实施例的另一方面,提供了一种电子装置,包括:语音输入单元,接收语音输入;以及控制器,基于语音输入单元接收的语音输入来控制电子装置。如果语音输入是第一语音命令,则控制器将电子装置的模式改变为第一语音任务模式,以及如果语音输入是第二语音命令,则控制器将电子装置的模式改变为第二语音任务模式,其中,在第一语音任务模式中,电子装置的语音输入单元接收另一语音输入,在第二语音任务模式中,经由与电子装置一起操作的外部装置接收所述另一语音输入。
电子装置还可以包括显示单元。控制器可以控制显示单元在第一语音任务模式中显示第一语音向导信息,以及在第二语音任务模式中显示第二语音向导信息。
第一语音向导信息可以包括多个语音项,在第一语音任务模式中引导用户提供所述另一语音输入。第二语音向导信息可以包括多个语音项,在第二语音任务模式中引导用户提供所述另一语音输入。第二语音向导信息的所述多个语音项中的至少一个可以不同于第一语音向导信息中的所述多个语音项。
第一语音向导信息可以包括多个语音项中的第一语音项,第一语音项是用于执行关于电子装置的频道加/减的指令。第二语音向导信息可以排除第一语音项并且可以包括提供频道列表的第二语音项。
第一语音向导信息可以包括对电子装置处于第一语音任务模式加以指示的图标区。第二语音向导信息可以包括对电子装置处于第二语音任务模式加以指示的图标区。
第二语音任务模式可以接收对按压了外部装置的预设按钮加以指示的输入,并且可以是所述外部装置接收的另一语音输入。
第一语音命令可以是预设词。第二语音命令可以是在接收了对按压了所述外部装置的预设按钮加以指示的输入之后的所述另一语音输入。
外部装置可以是遥控器。
根据示例性实施例的另一方面,提供了一种控制电子装置的方法。所述方法可以包括:接收语音输入;如果接收了语音输入,则将电子装置的模式改变为语音任务模式;以及如果在语音任务模式中发生了语音识别错误,则输出对语音识别错误加以指示的多个反馈消息中的一个。
所述方法还可以包括:如果在语音任务模式中重复地发生语音识别错误,则随机地选择和输出所述多个反馈消息中的一个。
语音任务模式可以包括第一语音任务模式和第二语音任务模式,其中在第一语音任务模式中,根据另一语音输入来控制电子装置,在第二语音任务模式中,根据经由与电子装置一起操作的外部装置所接收的所述另一语音输入来控制电子装置。
可以根据语音任务模式的类型来选择所述多个反馈消息中的不同反馈消息。
可以根据语音识别错误的类型来选择所述多个反馈消息中的不同反馈消息。
语音识别错误可以包括以下至少一项:在识别所述另一语音输入时错误,在所述另一语音输入之后的预设时间内按压所述外部装置的按钮时的错误,以及在按压所述外部装置的按钮之后的预设时间内提供所述另一语音输入时的错误。
输出所述多个反馈消息中的一个可以包括:如果第一次发生语音识别错误,则显示默认反馈消息。
根据示例性实施例的再一方面,提供了一种电子装置,包括:语音输入单元,接收语音输入;以及控制器,基于语音输入单元接收的语音输入来控制电子装置。如果语音输入单元接收了语音输入,则控制器将电子装置的模式改变为语音任务模式,以及如果在语音任务模式中发生了语音识别错误,则控制器提供对语音识别错误加以指示的多个反馈消息中的一个。
如果在语音任务模式中重复地发生语音识别错误,则控制器可以随机地选择和输出所述多个反馈消息中的一个。
语音任务模式可以包括第一语音任务模式和第二语音任务模式,其中在第一语音任务模式中,根据另一语音输入来控制电子装置,在第二语音任务模式中,根据与电子装置一起操作的外部装置所接收的所述另一语音输入来控制电子装置。
可以根据语音任务模式的类型来选择所述多个反馈消息中的不同反馈消息。
可以根据语音识别错误的类型来选择所述多个反馈消息中的不同反馈消息。
语音识别错误可以包括以下至少一项:在识别所述另一语音输入时的错误,在所述另一语音输入之后的预设时间内按压所述外部装置的按钮时的错误,以及在按压所述外部装置的按钮之后的预设时间内提供所述另一语音输入时的错误。
如果第一次发生语音识别错误,则控制器可以在显示单元上输出默认反馈消息。
附图说明
通过参考附图描述特定示例性实施例,上述和/或其它方面将更加清楚,其中:
图1至图3是示出了根据多个示例性实施例的电子装置的结构的框图;
图4是示出了根据示例性实施例的在第一语音任务模式中显示的第一语音向导信息的视图,在第一语音任务模式中,通过电子装置的语音输入单元输入用户语音;
图5是示出了根据示例性实施例的在第二语音任务模式中显示的第二语音向导信息的视图,在第二语音任务模式中,通过与电子装置一起操作的外部装置的语音输入单元输入用户语音;
图6是示出了根据示例性实施例的根据语音输入方法来提供不同语音任务模式的方法的流程图;
图7是示出了根据示例性实施例的在发生语音识别错误的情况下的反馈消息的视图;
图8A至图11F是示出了根据多个示例性实施例的根据语音任务模式和语音错误类型来显示的反馈消息的视图;以及
图12是示出了根据示例性实施例的控制电子装置的方法的流程图。
具体实施方式
将参考附图更详细地描述示例性实施例。
在以下描述中,即使在不同的附图中,相同附图参考数字也用于相同或相似元件。在以下描述中定义的对象,例如详细结构和元件,用于帮助全面理解示例性实施例。因此,显而易见的是,在没有这些特别定义的对象的情况下,也可以执行示例性实施例。此外,因为公知功能或结构将因为不必要的细节而混淆示例性实施例,所以将不对其进行详细描述。
图1是示出了根据示例性实施例的电子装置100的示意图。
参照图1,电子装置100包括语音输入单元110、存储器130、控制器140和显示器193。此处,电子装置100可以被实现为可以连接至外部网络、数字TV、便携式电话等的智能TV、机顶盒或PC,但是不限于此。示例性电子装置100可以包括存储器、处理器、诸如键盘等硬件输入单元和屏幕中的一个或多个。
语音输入单元110接收声音,例如用户发出的口头指令。语音输入单元110将输入语音信号转换为电信号且向控制器140输出电信号。例如,语音输入单元110可以实现为麦克风。此外,可以在电子装置100中安装语音输入单元110,或者可以与电子装置100分离地安装语音输入单元110。如果与电子装置100分离地安装语音输入单元110,则语音输入单元110可以经由有线或无线网络连接至电子装置100。
具体地,根据示例性实施例的语音输入单元110可以包括电子装置100的语音输入单元(例如,麦克风)和与电子装置100一起操作的100的外部装置的语音输入单元(例如,遥控器)。
存储器130存储用于驱动和控制电子装置100的多种数据和程序。存储器130存储语音识别模块和动作检测模块,语音识别模块对使用语音输入单元110获得的语音输入加以识别,动作检测模块检测和识别通过动作输入单元120(图2所示)的动作输入。存储器130可以包括语音数据库(DB)和动作DB。语音DB指的是记录了预设语音和与预设语音相匹配的语音任务的DB。动作DB指的是记录了预设动作和与预设动作相匹配的动作任务的DB。
显示器193显示与经由广播接收机接收的广播信号相对应的图像。显示器193可以显示经由外部端子输入单元的图像数据(例如,运动图像)输入。显示器193可以在控制器140的控制之下显示用于执行语音任务的语音向导信息和用于执行动作任务的动作向导信息。
控制器140控制语音输入单元110、存储器130和显示器193。此处,控制器140可以包括用于控制中央处理单元(CPU)和电子装置100的模块以及存储数据的只读存储器(ROM)和随机存取存储器(RAM)。
如果通过语音输入单元110输入了语音,则控制器140通过使用语音识别模块和语音DB来识别语音。语音识别可以分为单独词识别(isolated word recognition)、连续话语识别(continuous speechrecognition)和关键词确定(keyword spotting),其中,单独词识别用于根据输入语音的形式来划分每个词以识别发出的言语声音,连续话语识别用于识别连续词、连续句和对话话语,关键词确定是单独词识别和连续话语识别的中间形式,用于检测和识别预定关键词或关键短语。
如果输入了用户语音,则控制器140检测在输入语音信号内的用户所发言语声音的开始和结尾,以确定语音部分。控制器140可以计算输入语音信号的能量且根据计算得到的能量来挑选出语音信号的能量级,以通过动态编程来检测语音部分。控制器140基于声学模型从检测的语音部分中的语音信号中检测音位(phoneme)(言语声音的最小单元),以产生音位数据。控制器140将隐式马尔可夫模型(HMM)概率模型应用于产生的音位数据,以产生文本信息。然而,如上所述的识别用户语音的方法仅是示例性实施例,因而可以使用其它方法识别用户语音。因此,控制器140可以识别语音信号中包括的用户语音。
控制器140使用如上例示的识别的语音来执行电子装置100的任务。电子装置100的任务包括电子装置100能够执行的至少一种功能,例如频道改变、音量调节、内容(例如运动图像、音乐、图片等)的播放、互联网浏览等等。
具体地,如果输入了语音启动命令,则控制器140确定输入的语音启动命令是第一语音启动命令还是第二语音启动命令。这里,语音启动命令指的是请求电子装置100进入受通过语音输入单元110的用户语音输入控制的语音任务模式的命令。具体地,第一语音启动命令可以是包括通过电子装置100的语音输入单元110输入的预设词的用户语音命令。此外,第二语音启动命令可以被输入外部装置并且可以是用于按压与电子装置100一起操作的外部装置(例如,遥控器)的预设按钮的用户命令。具体地,诸如“Hi,TV”之类的特定用户语音可以用作语音启动命令,用户可以使用用户设置来改变语音启动命令。然而,第一和第二语音启动命令仅是示例性实施例,因而可以实现为其它类型的语音启动命令。
如果确定语音启动命令是第一语音启动命令,则控制器140将电子装置100的模式改变为第一语音任务模式。这里,第一语音任务模式是受通过电子装置100的语音输入单元的用户语音输入控制的语音任务模式。
如果确定语音启动命令是第二语音启动命令,则控制器140将电子装置100的模式改变为第二语音任务模式。第二语音任务模式是受对与电子装置100一起操作的外部装置的用户语音输入控制的语音任务模式。具体地,在第二语音任务模式中,当按压外部装置的语音输入按钮时,可以输入用户语音。备选地,在第二语音任务模式中,可以按压外部装置的语音输入按钮并且可以输入用户语音,然后可以再次按压语音输入按钮以输入用户语音。然而,这仅是示例性实施例,因而除了通过使用外部装置的按钮来识别语音的方法之外,可以使用其它方法来通过外部装置输入用户语音。例如,仅当开启外部装置的开关时,才可以输入用户语音。
具体地,在第一语音任务模式中,电子装置100可以不受向外部装置输入的用户语音的控制。此外,在第二语音任务模式中,电子装置100可以不受向电子装置100的语音输入单元输入的用户语音的控制。
如果电子装置100的模式改变为语音任务模式,则控制器140显示与语音任务模式相对应的语音向导信息。这里,语音向导信息显示至少一个语音项,所述至少一个语音项提供语音命令和电子装置100执行的相应功能。
具体地,如果电子装置100的模式改变为第一语音任务模式,则控制器140显示与第一语音任务模式相对应的第一语音向导信息。此外,如果电子装置100的模式改变为第二语音任务模式,则控制器140显示与第二语音任务模式相对应的第二语音向导信息。
将参考图4和5更详细地描述第一语音向导信息和第二语音向导信息。
图4是示出了根据示例性实施例的第一语音向导信息的视图。
如图4所示,在显示广播图像的屏幕的下端显示第一语音向导信息400。此外,第一语音向导信息400包括图标410和多个语音项421至427,其中,图标410确认显示装置的当前模式是第一语音任务模式,语音项421至427引导用户输入语音命令。多个语音项421至427包括断电语音项421、外部输入语音项422、频道快捷方式语音项423、频道加/减语音项424、音量加/减语音项425、静音语音项426和“更多”语音项427。“更多”语音项427是这样的项,其示出了替换或补充已显示语音项的更多语音项。
这里,图标410指示显示装置的当前模式是第一语音任务模式,并且可以描绘为麦克风形状,例如图4所示。
具体地,第一语音向导信息400可以包括与遥控器的能够通过按压一次而被执行的按钮相对应的语音项。例如,第一语音向导信息400可以包括频道加/减语音项424、音量加/减语音项425、静音语音项426等。
图5是示出了根据示例性实施例的第二语音向导信息500的视图。
如图5所示,在显示广播图像的屏幕的下端显示第二语音向导信息500,屏幕的所述下端与显示第一语音向导信息400的区域是相同区域。此外,第二语音向导信息500包括图标510和多个语音项521至526。图标510确认显示装置的当前模式是第二语音任务模式,例如向诸如遥控器等外部装置输入言语命令的模式,多个语音项521至526引导用户输入语音命令。多个语音项521至526包括频道快捷方式语音项521、搜索语音项525、外部输入语音项523、频道列表语音项524、书签语音项525和“更多”语音项526。这里,书签语音项是这样的语音项,其请求显示包括用户经常使用的功能(例如,特定应用程序执行)的菜单。
这里,图标510指示显示装置的当前模式是第二语音任务模式,并且可以描绘为遥控器形状,例如图5所示,其不同于图4所示的图标410的麦克风形状。因此,用户可以分别基于第一和第二语音向导信息400和500的图标410和510来检查当前语音任务模式是第一语音任务模式还是第二语音任务模式。
此外,第二语音向导信息500的多个语音项中的一些语音项可以不同于第一语音向导信息400的多个语音项。具体地,第二语音向导信息500可以不包括与遥控器的可以通过按压一次而被执行的按钮相对应的语音项。例如,第二语音向导信息500可以不包括频道加/减语音项424、音量加/减语音项425、静音语音项426等。这是因为用户在第二语音任务模式中持有遥控器,因而与说话相比,用户按压遥控器的按钮更方便。
相反,第二语音向导信息500可以包括可能难以找到的语音项,即需要用户通过一个或多个菜单来找到的项,例如搜索语音项522、外部输入语音项523、频道列表语音项524和书签语音项525。
换句话说,如上所述,可以根据第一和第二语音任务模式提供不同类型的语音向导信息。因此,用户可以根据多个语音任务模式来有效而方便地控制电子装置100。
如果显示了第一语音向导信息400和第二语音向导信息500中的一个,则控制器140在相应语音任务模式中根据向语音输入单元110输入的用户输入来控制电子装置100。例如,如果在显示第一语音向导信息400时通过语音输入单元110输入了用户语音“静音”,则控制器140可以将电子装置100的音量级别设置为“0”。此外,如果当显示第二语音向导信息500时通过语音输入单元110输入了用户语音“频道列表”,则控制器140可以在显示单元193上显示频道列表。
图2是示出了根据另一示例性实施例的电子装置100的结构的框图。参照图2,电子装置100包括语音输入单元110、动作输入单元120、存储器130、控制器140、广播接收机150、外部端子输入单元160、遥控信号接收机170、网络接口180和图像输出单元190。例如而非限制地,图2所示的电子装置100可以实现为机顶盒。
对图2的语音输入单元110、存储器130和控制器140的描述类似于对图1的语音输入单元110、存储器130和控制器140的描述,因而省略其详细描述。
动作输入单元120接收通过捕获用户的动作而获得的图像信号(例如,连续帧)且向控制器140提供图像信号。例如,动作输入单元120可以实现为包括镜头和图像传感器的单元。此外,可以在电子装置100中安装动作输入单元120,或者可以与电子装置100分离地安装动作输入单元120。与电子装置100分离地安装的动作输入单元120可以通过有线或无线网络连接至电子装置100。
广播接收机150通过有线或无线网络从外部源接收广播信号。广播信号包括视频、音频和附加数据(例如,电子节目指南(EPG))。广播接收机150可以从诸如陆地广播、有线广播、卫星广播、互联网广播等多种源接收广播信号。
外部端子输入单元160从电子装置100的外部接收视频数据(例如,运动图像等)和音频数据(例如,音乐等)等。外部端子输入单元160可以包括以下中的至少一项:高清晰度多媒体接口(HDMI)输入端子161、分量输入端子162、PC输入端子163和通用串行数字(USB)输入端子164(图3所示)。遥控信号接收机170从外部遥控器接收遥控信号。即使在电子装置100的语音任务模式或动作任务模式中,遥控信号接收机170也可以接收遥控信号。
网络接口180可以在控制器140的控制下将电子装置100与外部装置(例如,服务器、另一电子装置等)相连。控制器140可以通过网络接口180从与电子装置100相连的外部装置下载应用程序,或者可以基于应用程序来浏览外部装置。网络接口单元180可以提供以太网181、无线局域网(WLAN)182和蓝牙183中的至少一个。
图像输出单元190向外部电子装置(例如,监视器或TV)输出通过广播接收机150接收的广播信号、通过外部端子输入单元160输入的视频数据、或存储器130中存储的视频数据。如果通过动作输入单元120输入了动作,则控制器140通过使用动作感测模块和动作DB来识别动作。动作识别使用动作识别模块将与通过动作输入单元120输入的用户动作相对应的图像(例如连续帧)分为背景区和手区(例如,展开手指或握紧拳头)并且识别手的连续动作。如果输入了用户动作,则控制器140将接收的图像存储在帧单元中且使用存储的帧来感测用户动作的对象。控制器140感测帧的对象的形状、颜色和动作中的至少一个来检测对象。控制器140可以使用多个帧的对象的位置来跟踪检测的对象的动作。
控制器140根据所跟踪对象的形状和移动来检测动作。例如,控制器140使用对象的变化、速度、位置和方向中的至少一个来确定用户的移动。用户动作包括抓(握起手的动作)、指向移动(利用手移动显示的光标的动作)、拍击(以预定速度或更快的速度沿一个方向移动手的动作)、摆动(向左/向右或向上/向下摆手的动作)和旋转(旋转手的动作)。本公开可以应用于除上述示例性实施例之外的其它类型的动作。例如,还可以包括将抓紧的手展开的展开动作等等。
控制器140确定对象是否在预定时间(例如,800ms)内离开了既定区域(例如,40cm×40cm的正方形),以确定用户的动作是指向移动还是拍击。如果对象没有在预定时间内离开既定区域,则控制器140可以确定用户的动作是指向移动。如果对象在预定时间内离开了既定区域,则控制器140可以确定用户的动作是拍击。根据另一示例性实施例,如果确定对象的速度等于或小于预设速度(例如,30cm/s),则控制器140确定用户的动作是指向移动。如果确定对象的速度超过了预设速度,则控制器140确定用户的动作是拍击。
图3是根据另一示例性实施例的电子装置100的框图。如图3所示,电子装置100包括语音输入单元110、动作输入单元120、存储器130、控制器140、广播接收机150、外部端子输入单元160、遥控信号接收机170、网络接口180、显示器193和音频输出单元196。仅举例而言,电子装置100可以是数字TV,但不限于此。
图3的语音输入单元110、动作输入单元120、存储器130、控制器140、广播接收机150、外部端子输入单元160、遥控信号接收机170、网络接口180和显示器193的描述类似于图1和2中具有相同参考数字的元件的描述。因此,这里省略其详细描述。
音频输出单元196在控制器140的控制之下输出与广播信号相对应的语音。音频输出单元196可以包括扬声器196a、耳机输出端子196b和索尼/菲利普数字接口(S/PDIF)输出端子193c中的至少一个。
如图3所示,存储器130包括功率控制模块130a、频道控制模块130b、音量控制模块130c、外部输入控制模块130d、屏幕控制模块130e、音频控制模块130f、互联网控制模块130g、应用程序模块130h、搜索控制模块130i、用户界面(UI)处理模块130j、语音识别模块130k、动作识别模块130l、语音DB130m和动作DB130n。这些模块130a至130n可以实现为软件,以分别执行功率控制功能、频道控制功能、音量控制功能、外部输入控制功能、屏幕控制空能、音频控制功能、互联网控制功能、应用程序执行功能、搜索控制功能和UI处理功能。控制器140可以执行存储器130中存储的软件,以执行相应功能。然而,可以通过用于执行相应模块的相应的分离的硬件实现上述模块。
现在将参考图6更详细地描述根据示例性实施例的于语音输入方法来提供不同任务模式的方法。
参考图6,在操作S610中,电子装置100接收语音启动命令。这里,语音启动命令是请求电子装置100进入受通过语音输入单元110的用户语音输入控制的语音任务模式的命令。具体地,第一语音启动命令可以是包括电子装置100的语音输入单元110输入的预设词的用户语音命令,第二语音启动命令可以是按压与电子装置100一起操作的外部装置(例如,遥控器)的预设按钮的用户命令。
在操作S620中,电子装置100确定语音启动命令是否是第一语音启动命令。
如果在操作S620中确定语音启动命令是第一语音启动命令(是),则在步骤S630中,电子装置100将电子装置100的模式改变为第一语音任务模式。这里,第一语音任务模式是这样的模式:根据通过电子装置100的语音输入单元110的用户语音输入来控制电子装置100。
在操作S640中,电子装置100显示第一语音向导信息。这里,第一语音向导信息可以包括对电子装置100的当前模式是第一语音任务模式加以指示的图标和用于在第一语音任务模式中执行多种功能的多个语音项。这里,第一语音向导信息的所述多个语音项可以包括诸如频道加/减语音图标、音量加/减语音图标和静音语音图标等语音项,如果输入了用户语音,则这些语音项可以执行电子装置100的功能。
在操作S680中,电子装置100使用第一语音向导信息来执行语音任务。
如果在操作S620中确定语音启动命令不是第一语音启动命令(否),则在操作S650中,电子装置100确定语音启动命令是第二语音启动命令。
在操作S660中,电子装置100将电子装置100的模式改变为第二语音任务模式。这里,第二语音任务模式是这样的模式:根据通过与电子装置100一起操作的外部装置(例如,遥控器)的语音输入单元110的用户语音输入来控制电子装置100。具体地,在第二语音任务模式中,可以按压外部装置的预设第二按钮(例如,语音输入按钮),然后由对外部装置的用户语音输入来控制所述电子装置。
在操作S670中,电子装置100显示第二语音向导信息。这里,第二语音向导信息可以包括对电子装置100的当前模式是第二语音任务模式加以指示的图标和用于在第二语音任务模式中执行多种功能的多个语音项。这里,对电子装置100的当前模式是第二语音任务模式加以指示的图标不同于对电子装置100的当前模式是第一语音任务模式加以指示的图标。此外,第二语音向导信息的多个语音项可以包括埋入到分层菜单中的语音项,例如外部输入语音图标、频道列表语音图标和书签语音图标。
在操作S680中,电子装置100使用第二语音向导信息来执行语音任务。
根据控制电子装置100的上述示例方法,用户还可以使用不同类型的语音输入方法来有效地控制电子装置100。
现在,将参考图7至图12来根据示例性实施例描述在输入语音时发生语音识别错误的情况下输出反馈消息的方法。
具体地,如果输入了语音启动命令,则控制器140将电子装置100的模式改变为语音任务模式。这里,语音任务模式是经由通过语音输入单元110的用户语音输入来控制电子装置100的模式。
如上所述,语音启动命令可以是包括通过电子装置100的语音输入单元110输入的预设词的用户语音命令(在下文中,称作第一语音启动命令)或按压与电子装置100一起操作的外部装置(例如,遥控器)的预设按钮的用户命令(在下文中,称作第二语音启动命令)。具体地,如果输入了第一语音启动命令,则控制器140将电子装置100的模式改变为第一语音任务模式。这里,第一语音任务模式是根据对电子装置100的语音输入单元的用户语音输入来进行控制的语音任务模式。如果输入了第二语音启动命令,则控制器140将电子装置100的模式改变为第二语音任务模式。第二语音任务模式是根据对与电子装置100一起操作的外部装置的用户语音输入来进行控制的语音任务模式。具体地,在第二语音任务模式中,当按压了外部装置的语音输入按钮时,可以输入用户语音。
如果电子装置100的模式改变为第一和第二语音任务模式中的一个,则控制器140控制显示器193显示语音向导信息,其中该语音向导信息在语音任务模式下引导用于执行功能的用户语音输入。这里,语音向导信息可以例如是图4的第一语音向导信息400和图5的第二语音向导信息500中的一个。
如果在使用语音向导信息执行语音任务时发生了语音识别错误,则控制器140显示对根据示例性实施例的语音识别错误加以指示的反馈消息750,如图7所示。在图7描述的示例性实施例中,语音向导信息包括图标710,其中,该图标710指示第一语音任务模式,例如,用户将语音命令直接输入电子装置100。语音向导信息700还可以包括多个语音项,例如断电语音项721、外部输入语音项722、频道快捷方式语音项723、频道加/减语音项724、语音加/减语音项725、静音语音项726和“更多”语音项727。“更多”语音项727是在被选时向用户提供附加语音项的项。这里,发生语音识别错误的情况可以包括以下情况中的至少一种:通过语音输入单元110的用户语音输入的音量太低,语音DB不包括与通过语音输入单元110的用户语音输入的识别结果相匹配的命令,以及用户在操作电子装置100时不熟练。
具体地,控制器140可以显示存储器130中存储的多个反馈消息中的一个。具体地,控制器140可以根据语音任务模式和语音识别错误的类型来显示不同反馈消息。
具体地,控制器140可以基于是在第一语音任务模式还是在第二语音任务模式中发生了语音识别错误来显示不同反馈消息。例如,如果在第一语音任务模式中发生了语音识别错误,则控制器140可以显示图8A-8L所示的多个反馈消息中的一个。如果在第二语音任务模式中发生了语音识别错误,则控制器140可以显示图9A-9N、图10A-10G、图11A-11F所示的多个反馈消息中的一个。
控制器140还可以根据在第二语音任务模式中的语音识别错误的类型来不同地显示反馈消息750。例如,如果语音DB不包括与用户语音输入的识别结果相匹配的命令或者由于语音音量低于预设值而导致没有识别用户语音,则控制器140可以显示图9A-9N所示的多个反馈消息中的一个。如果在输入用户语音之后持续按压外部装置的语音输入按钮,则控制器140可以显示图10A-10G所示的多个反馈消息中的一个。如果在按压了外部装置的语音输入按钮之后的预设时间内没有输入用户语音,则控制器140可以显示图11A-11F所示的多个反馈消息中的一个。
当在第一次语音识别期间发生错误时,控制器140还可以根据语音任务模式和语音识别错误的类型来显示默认反馈消息。例如,如果在第一语音任务模式中发生了语音识别错误,则控制器140可以显示图8A-8L所示的多个反馈消息中的图8A所示的第一反馈消息“请重复”。如果没有识别出第二语音任务模式中的用户语音输入,则控制器140可以显示图9A-9N所示的多个反馈消息中的图9A所示的反馈消息“请重复”。如果在第二语音任务模式中输入了用户语音之后还按压了语音输入按钮一段预设时间,则控制器140可以显示图10A-10G所示的多个反馈消息中的图10A所示的反馈消息“请您的手离开按钮”。如果在第二语音任务模式中输入了用户语音之后的预定时间内仍没有按压语音输入按钮,则控制器140可以显示图11A-11F所示的多个反馈消息中的图11A所示的反馈消息“请您发命令”。
如上所述,可以由制造商根据语音任务模式和语音识别错误的类型设置默认反馈消息,和/或,可以稍后由用户改变所述默认反馈消息。
如果重复地发生语音识别错误,则控制器140可以随机地显示除默认反馈消息之外的其它反馈消息之一。例如,如果在第一语音任务模式中重复地发生语音识别错误,则控制器140可以随机地显示除图8A所示的反馈消息之外的图8B-8L所示的其它反馈消息之一。如果在第二语音任务模式中重复地没有识别出用户语音输入,则控制器140可以显示除图9A所示的反馈消息901之外的图9B-9N所示的其它反馈消息之一。如果在第二语音任务模式中输入了用户语音之后还在持续地按压语音输入按钮,则控制器140可以每隔预设时间(例如,每10秒)随机地显示除图10A所示的反馈消息之外的图10B-10G所示的其它反馈消息之一。如果在第二语音任务模式中按压了语音输入按钮之后的预定时间内还没有输入用户语音,则控制器140可以每隔预设时间(例如,每10秒)随机地显示一次除图11A所示的反馈消息1101之外的图11B-11F所示的其它反馈消息之一。
如上所述,可以根据语音识别错误和语音任务模式来提供不同反馈消息。因此,用户可以精确地确定语音识别中的错误。此外,用户可以获得与电子装置进行对话的效果,从而向用户提供更多乐趣。
现在,将参考图12更详细地描述根据示例性实施例在电子装置100中发生语音识别错误的情况下提供反馈消息的方法。
参照图12,在操作S1210中,电子装置100确定是否输入了语音启动命令。这里,语音启动命令是将电子装置100的模式改变为语音任务模式的用户命令,并且可以包括第一和第二语音启动命令。第一语音启动命令是包括通过电子装置100的语音输入单元110输入的预设词的用户语音命令,第二语音启动命令是按压对与电子装置100一起操作的外部装置(例如,遥控器)的预设按钮的用户命令。
如果在操作1210中确定输入了语音启动命令,则在操作S1220中,电子装置100将自己的模式改变为语音任务模式。这里,如果语音启动命令是第一语音启动命令,则电子装置100将自己的模式改变为受通过电子装置100的语音输入单元110的用户语音输入控制的第一语音模式。如果语音启动命令是第二语音启动命令,则电子装置100将自己的模式改变为受通过外部装置的语音输入单元110的用户语音输入控制的第二语音任务模式。
当执行语音任务模式时,在操作S1230中,电子装置100确定是否发生了语音识别错误。这里,发生了语音识别错误的情况可以包括以下情况中的至少一种:通过语音输入单元110的用户语音输入的音量低于预设值,语音DB不包括与通过语音输入单元110的用户语音输入的识别结果相匹配的命令,以及用户不熟练地操作电子装置100,因此没有适当地输入语音命令。
如果在操作S1230中确定发生了语音识别错误,则在操作S1240中,电子装置100显示多个反馈消息中的一个。这里,可以根据语音任务模式和语音识别错误来不同地显示反馈消息。例如,如果在第一语音任务模式中发生了语音识别错误,则电子装置100显示图8A-8K所示的多个反馈消息中的一个。如果在第二语音任务模式中发生了语音识别错误,则电子装置100可以显示图9A-11F所示的多个反馈消息中的一个。这里,如果第一次发生语音识别错误,则电子装置100可以显示多个反馈消息中的默认反馈消息。
在操作S1250中,电子装置100确定是否重复地发生语音识别错误。在示例性实施例中,电子装置可以确定发生识别错误的次数是否大于预定阈值。
如果在操作S1250中确定重复地发生语音识别错误,则在操作S1260中,电子装置100随机地显示多个反馈消息中的其它反馈消息。例如,如果在第一语音任务模式中重复地发生语音识别错误,则电子装置100可以随机地显示除图8A所示的第一反馈消息之外的图8B-8L所示的其它反馈消息之一。如果重复地不能识别出在第二语音任务模式中的用户语音输入,则电子装置100可以显示除图9A所示的第一反馈消息之外的图9B-9N所示的其它反馈消息之一。如果在第二语音任务中输入了用户语音之后仍在持续按压语音输入按钮,则电子装置100可以以预设时间间隔(例如,每10秒)随机地显示除图10A所示的第一反馈消息之外的图10B-10G所示的其它反馈消息之一。如果在第二任务模式中按压了语音输入按钮之后的预设时间内没有继续输入用户语音,则电子装置100可以随机地显示除图11A所示的第一反馈消息1101之外的图11B-10F所示的其它反馈消息之一。
如上所述,根据各种示例性实施例,可以根据语音识别错误和语音任务模式来提供不同反馈消息。因此,用户可以精确地确定语音识别中的错误。此外,用户可以获得与电子装置进行对话的效果,从而向用户提供更多乐趣。
用于执行根据上述多种示例性实施例的控制方法的程序代码可以存储在多种记录介质上。具体地,程序代码可以存储在多种终端可读记录介质上,例如随机存取存储器(RAM)、快闪存储器、只读存储器(ROM)、可擦除可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)、寄存器、硬盘、可移除盘、存储卡、通用串行总线(USB)存储器、CD-ROM等。
上述示例性实施例仅是示例性的,不应该解释为限制。本公开可以容易地应用于其它类型的装置。此外,示例性实施例的描述旨在说明,而非限制权利要求的范围,多种备选、修改和变型对于本领域技术人员而言是显而易见的。

Claims (15)

1.一种对识别语音的电子装置进行控制的方法,所述方法包括:
接收语音启动命令;以及
如果语音启动命令是第一语音启动命令,则将电子装置的模式改变为根据对所述电子装置的语音输入单元的用户语音输入而被控制的第一语音任务模式,如果语音启动命令是第二语音启动命令,则将电子装置的模式改变为根据对外部装置的用户语音输入而被控制的第二语音任务模式,其中所述外部装置与所述电子装置一起操作。
2.如权利要求1所述的方法,还包括:
如果电子装置的模式改变为第一语音任务模式,则显示与第一语音任务模式相对应的第一语音向导信息,如果电子装置的模式改变为第二语音任务模式,则显示与第二语音任务模式相对应的第二语音向导信息。
3.如权利要求2所述的方法,其中:
第一语音向导信息包括多个语音项,用于在第一语音任务模式中引导用户语音输入;以及
第二语音向导信息包括多个语音项,用于在第二语音任务模式中引导用户语音输入,
其中,第二语音向导信息的所述多个语音项中的至少一个不同于第一语音向导信息中的所述多个语音项。
4.如权利要求3所述的方法,其中:
第一语音向导信息包括用于执行频道加/减命令的语音项;以及
第二语音向导信息不包括用于执行频道加/减命令的语音项,并且包括用于提供频道列表的不同语音项。
5.如权利要求2所述的方法,其中:
第一语音向导信息包括指示第一语音任务模式的第一图标区;以及
第二语音向导信息包括指示第二语音任务模式的第二图标区。
6.如权利要求1所述的方法,其中,第二语音任务模式是按压所述外部装置的预设按钮,并且受对所述外部装置的用户语音输入的控制。
7.如权利要求1所述的方法,其中:
第一语音启动命令是包括预设词的用户语音命令;以及
第二语音启动命令是按压所述外部装置的预设按钮的用户命令。
8.如权利要求1所述的方法,其中,所述外部装置是遥控器。
9.一种电子装置,包括:
语音输入单元,接收用户语音;以及
控制器,如果语音启动命令是第一语音启动命令,则将电子装置的模式改变为根据对所述电子装置的语音输入单元的用户语音输入而被控制的第一语音任务模式,如果语音启动命令是第二语音启动命令,则将电子装置的模式改变为根据对外部装置的用户语音输入而被控制的第二语音任务模式,其中所述外部装置与所述电子装置一起操作。
10.如权利要求9所述的电子装置,还包括:
显示单元,
其中,控制器控制显示单元在电子装置的模式改变为第一语音任务模式的情况下显示与第一语音任务模式相对应的第一语音向导信息,在电子装置的模式改变为第二语音任务模式的情况下显示与第二语音任务模式相对应的第二语音向导信息。
11.如权利要求10所述的电子装置,其中:
第一语音向导信息包括多个语音项,用于在第一语音任务模式中引导用户语音输入;以及
第二语音向导信息包括多个语音项,用于在第二语音任务模式中引导用户语音输入,
其中,第二语音向导信息的所述多个语音项中的至少一个不同于第一语音向导信息中的所述多个语音项。
12.如权利要求11所述的电子装置,其中:
第一语音向导信息包括要执行频道加/减命令的语音项;以及
第二语音向导信息不包括要执行频道加/减命令的语音项,并且包括提供频道列表的不同语音项。
13.如权利要求10所述的电子装置,其中:
第一语音向导信息包括指示第一语音任务模式的第一图标区;以及
第二语音向导信息包括指示第二语音任务模式的第二图标区。
14.如权利要求9所述的电子装置,其中第二语音任务模式是按压所述外部装置的预设按钮,并且受对所述外部装置的用户语音输入的控制。
15.如权利要求9所述的电子装置,其中:
第一语音启动命令是包括预设词的用户语音命令;以及
第二语音启动命令是按压所述外部装置的预设按钮的用户命令。
CN2012104254239A 2011-12-30 2012-10-30 电子装置和控制电子装置的方法 Pending CN103187063A (zh)

Applications Claiming Priority (6)

Application Number Priority Date Filing Date Title
KR20110147453 2011-12-30
KR10-2011-0147453 2011-12-30
KR1020110147448A KR20130078483A (ko) 2011-12-30 2011-12-30 전자 장치 및 그의 제어 방법
KR10-2011-0147448 2011-12-30
KR1020120058340A KR101324232B1 (ko) 2011-12-30 2012-05-31 전자 장치 및 그의 제어 방법
KR10-2012-0058340 2012-05-31

Publications (1)

Publication Number Publication Date
CN103187063A true CN103187063A (zh) 2013-07-03

Family

ID=47358521

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2012104254239A Pending CN103187063A (zh) 2011-12-30 2012-10-30 电子装置和控制电子装置的方法

Country Status (6)

Country Link
US (3) US8650036B2 (zh)
EP (2) EP2610862B1 (zh)
JP (1) JP5535298B2 (zh)
CN (1) CN103187063A (zh)
AU (1) AU2012261686B2 (zh)
WO (1) WO2013100366A1 (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103414929A (zh) * 2013-07-18 2013-11-27 深圳Tcl新技术有限公司 语音遥控的方法、遥控器及电视机
CN104639967A (zh) * 2015-01-31 2015-05-20 乐视致新电子科技(天津)有限公司 语音启动终端的方法及装置
CN105426154A (zh) * 2014-09-22 2016-03-23 中兴通讯股份有限公司 一种语音输入控制的方法、装置及终端
CN105632491A (zh) * 2014-11-26 2016-06-01 三星电子株式会社 用于语音识别的方法和电子装置
CN108600810A (zh) * 2018-05-03 2018-09-28 四川长虹电器股份有限公司 利用语音遥控器提高语音识别精度的电视系统及方法
WO2021004511A1 (zh) * 2019-07-11 2021-01-14 海信视像科技股份有限公司 电子设备、非易失性存储介质及声音识别方法
CN112272826A (zh) * 2019-07-05 2021-01-26 海信视像科技股份有限公司 电子设备及检索服务选定方法

Families Citing this family (37)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ES2958183T3 (es) * 2011-08-05 2024-02-05 Samsung Electronics Co Ltd Procedimiento de control de aparatos electrónicos basado en el reconocimiento de voz y de movimiento, y aparato electrónico que aplica el mismo
EP2610862B1 (en) * 2011-12-30 2015-07-08 Samsung Electronics Co., Ltd. Electronic apparatus and method of controlling electronic apparatus
US9026448B2 (en) * 2012-08-16 2015-05-05 Nuance Communications, Inc. User interface for entertainment systems
US8799959B2 (en) 2012-08-16 2014-08-05 Hoi L. Young User interface for entertainment systems
US9497515B2 (en) 2012-08-16 2016-11-15 Nuance Communications, Inc. User interface for entertainment systems
US9106957B2 (en) 2012-08-16 2015-08-11 Nuance Communications, Inc. Method and apparatus for searching data sources for entertainment systems
US9031848B2 (en) 2012-08-16 2015-05-12 Nuance Communications, Inc. User interface for searching a bundled service content data source
JP6393021B2 (ja) * 2012-08-28 2018-09-19 京セラ株式会社 電子機器、制御方法、及び制御プログラム
KR102091003B1 (ko) * 2012-12-10 2020-03-19 삼성전자 주식회사 음성인식 기술을 이용한 상황 인식 서비스 제공 방법 및 장치
US9530410B1 (en) * 2013-04-09 2016-12-27 Google Inc. Multi-mode guard for voice commands
JP6315942B2 (ja) * 2013-11-01 2018-04-25 株式会社ユピテル システム及びプログラム
US8768712B1 (en) 2013-12-04 2014-07-01 Google Inc. Initiating actions based on partial hotwords
KR102179506B1 (ko) * 2013-12-23 2020-11-17 삼성전자 주식회사 전자장치 및 그 제어방법
US10770075B2 (en) * 2014-04-21 2020-09-08 Qualcomm Incorporated Method and apparatus for activating application by speech input
JP6392374B2 (ja) * 2014-12-25 2018-09-19 マクセル株式会社 ヘッドマウントディスプレイシステム及びヘッドマウントディスプレイ装置の操作方法
US9489172B2 (en) * 2015-02-26 2016-11-08 Motorola Mobility Llc Method and apparatus for voice control user interface with discreet operating mode
US9754588B2 (en) 2015-02-26 2017-09-05 Motorola Mobility Llc Method and apparatus for voice control user interface with discreet operating mode
JP2018072359A (ja) * 2015-03-12 2018-05-10 パナソニックIpマネジメント株式会社 音響装置及び補正方法
JP2017191418A (ja) * 2016-04-13 2017-10-19 ホーチキ株式会社 防災監視設備の受信機
CN105957530B (zh) * 2016-04-28 2020-01-03 海信集团有限公司 一种语音控制方法、装置和终端设备
US10091545B1 (en) * 2016-06-27 2018-10-02 Amazon Technologies, Inc. Methods and systems for detecting audio output of associated device
US10506204B2 (en) 2016-10-10 2019-12-10 At&T Digital Life, Inc. State detection and voice guided setup for a video doorbell unit
JP6659514B2 (ja) 2016-10-12 2020-03-04 東芝映像ソリューション株式会社 電子機器及びその制御方法
JP6826474B2 (ja) * 2017-03-27 2021-02-03 東芝ホームテクノ株式会社 加熱調理器
JP6941856B2 (ja) * 2017-03-31 2021-09-29 国立大学法人大阪大学 対話ロボットおよびロボット制御プログラム
KR102392087B1 (ko) 2017-07-10 2022-04-29 삼성전자주식회사 원격 조정 장치 및 원격 조정 장치의 사용자 음성 수신방법
KR102474804B1 (ko) * 2017-09-25 2022-12-06 현대자동차주식회사 음성 인식 제어 장치, 그를 포함한 시스템 및 그 방법
US10468017B2 (en) * 2017-12-14 2019-11-05 GM Global Technology Operations LLC System and method for understanding standard language and dialects
KR102563314B1 (ko) 2018-08-30 2023-08-04 삼성전자주식회사 전자 장치 및 단축 명령어의 바로가기 생성 방법
JP2020047062A (ja) * 2018-09-20 2020-03-26 Dynabook株式会社 電子機器および制御方法
US11094327B2 (en) * 2018-09-28 2021-08-17 Lenovo (Singapore) Pte. Ltd. Audible input transcription
JP2022051970A (ja) * 2019-02-01 2022-04-04 ソニーグループ株式会社 情報処理装置、情報処理方法、およびプログラム
CN109994111B (zh) * 2019-02-26 2021-11-23 维沃移动通信有限公司 一种交互方法、装置及移动终端
CN110265033A (zh) * 2019-06-21 2019-09-20 四川长虹电器股份有限公司 扩展设备语音交互功能的系统及方法
KR20210025812A (ko) 2019-08-28 2021-03-10 삼성전자주식회사 전자장치, 디스플레이장치 및 그 제어방법
CN111681594A (zh) 2020-06-24 2020-09-18 武汉华星光电技术有限公司 Mog电路及显示面板
US11922096B1 (en) 2022-08-30 2024-03-05 Snap Inc. Voice controlled UIs for AR wearable devices

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2002011122A1 (en) * 2000-07-28 2002-02-07 Koninklijke Philips Electronics N.V. System for controlling an apparatus with speech commands
US20020052746A1 (en) * 1996-12-31 2002-05-02 News Datacom Limited Corporation Voice activated communication system and program guide
US20020161572A1 (en) * 2000-01-05 2002-10-31 Noritaka Kusumoto Device setter, device setting system, and recorded medium where device setting program recorded
US7254543B2 (en) * 2001-12-18 2007-08-07 Toshio Ibaraki Television apparatus having speech recognition function, and method of controlling the same
US20110270615A1 (en) * 2001-10-03 2011-11-03 Adam Jordan Global speech user interface

Family Cites Families (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5774859A (en) * 1995-01-03 1998-06-30 Scientific-Atlanta, Inc. Information system having a speech interface
KR970057020A (ko) 1995-12-15 1997-07-31 배순훈 음성인식에 의한 텔레비전 제어장치
JPH09322086A (ja) 1996-05-31 1997-12-12 Hitachi Ltd 番組予約システム
JPH10133849A (ja) 1996-10-28 1998-05-22 Toshiba Corp パーソナルコンピュータおよびエラー通知方法
JP2000062549A (ja) 1998-08-20 2000-02-29 Tokai Rika Co Ltd 車両用音声認識装置
FR2783625B1 (fr) * 1998-09-21 2000-10-13 Thomson Multimedia Sa Systeme comprenant un appareil telecommande et un dispositif de telecommande vocale de l'appareil
JP2000112497A (ja) 1998-10-02 2000-04-21 Canon Inc 音声認識方法及び装置と通信装置及びその制御方法
US6397186B1 (en) * 1999-12-22 2002-05-28 Ambush Interactive, Inc. Hands-free, voice-operated remote control transmitter
JP2003005897A (ja) * 2001-06-20 2003-01-08 Alpine Electronics Inc 情報入力方法および装置
US7519534B2 (en) * 2002-10-31 2009-04-14 Agiletv Corporation Speech controlled access to content on a presentation medium
US20060041926A1 (en) * 2004-04-30 2006-02-23 Vulcan Inc. Voice control of multimedia content
JP2007052397A (ja) 2005-07-21 2007-03-01 Denso Corp 操作装置
US20070136752A1 (en) * 2005-12-12 2007-06-14 John Sanders Personalized electronic programming guide
KR100834679B1 (ko) 2006-10-31 2008-06-02 삼성전자주식회사 음성 인식 오류 통보 장치 및 방법
JP2008256802A (ja) 2007-04-02 2008-10-23 Fujitsu Ten Ltd 音声認識装置および音声認識方法
TW200928315A (en) * 2007-12-24 2009-07-01 Mitac Int Corp Voice-controlled navigation device and method thereof
KR101502004B1 (ko) 2008-07-25 2015-03-12 엘지전자 주식회사 이동 단말기 및 그의 음성 명령 인식 방법
JP2011118822A (ja) * 2009-12-07 2011-06-16 Nec Casio Mobile Communications Ltd 電子機器、発話検出装置、音声認識操作システム、音声認識操作方法及びプログラム
JP2011209787A (ja) * 2010-03-29 2011-10-20 Sony Corp 情報処理装置、および情報処理方法、並びにプログラム
KR101134245B1 (ko) 2010-05-28 2012-04-09 엘지이노텍 주식회사 3차원 가상 리모콘을 포함한 전자기기 및 그의 구동 방법
US20120110456A1 (en) * 2010-11-01 2012-05-03 Microsoft Corporation Integrated voice command modal user interface
JP5695447B2 (ja) * 2011-03-01 2015-04-08 株式会社東芝 テレビジョン装置及び遠隔操作装置
JP5790238B2 (ja) * 2011-07-22 2015-10-07 ソニー株式会社 情報処理装置、情報処理方法及びプログラム
WO2013022135A1 (en) * 2011-08-11 2013-02-14 Lg Electronics Inc. Electronic device and method of controlling the same
EP2610862B1 (en) * 2011-12-30 2015-07-08 Samsung Electronics Co., Ltd. Electronic apparatus and method of controlling electronic apparatus

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020052746A1 (en) * 1996-12-31 2002-05-02 News Datacom Limited Corporation Voice activated communication system and program guide
US20020161572A1 (en) * 2000-01-05 2002-10-31 Noritaka Kusumoto Device setter, device setting system, and recorded medium where device setting program recorded
WO2002011122A1 (en) * 2000-07-28 2002-02-07 Koninklijke Philips Electronics N.V. System for controlling an apparatus with speech commands
US20110270615A1 (en) * 2001-10-03 2011-11-03 Adam Jordan Global speech user interface
US7254543B2 (en) * 2001-12-18 2007-08-07 Toshio Ibaraki Television apparatus having speech recognition function, and method of controlling the same

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103414929A (zh) * 2013-07-18 2013-11-27 深圳Tcl新技术有限公司 语音遥控的方法、遥控器及电视机
CN105426154A (zh) * 2014-09-22 2016-03-23 中兴通讯股份有限公司 一种语音输入控制的方法、装置及终端
CN105632491A (zh) * 2014-11-26 2016-06-01 三星电子株式会社 用于语音识别的方法和电子装置
CN105632491B (zh) * 2014-11-26 2020-07-21 三星电子株式会社 用于语音识别的方法和电子装置
CN104639967A (zh) * 2015-01-31 2015-05-20 乐视致新电子科技(天津)有限公司 语音启动终端的方法及装置
CN108600810A (zh) * 2018-05-03 2018-09-28 四川长虹电器股份有限公司 利用语音遥控器提高语音识别精度的电视系统及方法
CN112272826A (zh) * 2019-07-05 2021-01-26 海信视像科技股份有限公司 电子设备及检索服务选定方法
WO2021004511A1 (zh) * 2019-07-11 2021-01-14 海信视像科技股份有限公司 电子设备、非易失性存储介质及声音识别方法
CN112243588A (zh) * 2019-07-11 2021-01-19 海信视像科技股份有限公司 电子设备、非易失性存储介质及声音识别方法

Also Published As

Publication number Publication date
AU2012261686A1 (en) 2013-07-18
EP2860726B1 (en) 2017-12-06
WO2013100366A1 (en) 2013-07-04
US20140129234A1 (en) 2014-05-08
EP2860726A3 (en) 2015-04-22
EP2860726A2 (en) 2015-04-15
US20130173270A1 (en) 2013-07-04
AU2012261686B2 (en) 2014-08-14
EP2610862A1 (en) 2013-07-03
US8650036B2 (en) 2014-02-11
EP2610862B1 (en) 2015-07-08
US9148688B2 (en) 2015-09-29
JP5535298B2 (ja) 2014-07-02
JP2013140349A (ja) 2013-07-18
US20140223477A1 (en) 2014-08-07

Similar Documents

Publication Publication Date Title
CN103187063A (zh) 电子装置和控制电子装置的方法
CN103187054B (zh) 电子装置和控制电子装置的方法
KR102667413B1 (ko) 음성 명령에 기초하여 애플리케이션을 실행하는 방법 및 장치
JP5746111B2 (ja) 電子装置及びその制御方法
JP6111030B2 (ja) 電子装置及びその制御方法
CN109343819B (zh) 在语音识别系统中控制显示装置的显示装置和方法
EP2680597B1 (en) Display apparatus, electronic device, interactive system, and controlling methods thereof
KR20130078518A (ko) 전자 장치 및 그의 제어 방법
CN109243463B (zh) 遥控器及其用于接收用户语音的方法
JP2013037688A (ja) 電子装置及びその制御方法
JP2013037689A (ja) 電子装置及びその制御方法
KR101237472B1 (ko) 전자 장치 및 그의 제어 방법
KR101324232B1 (ko) 전자 장치 및 그의 제어 방법
KR20140085055A (ko) 전자 장치 및 그의 제어 방법
KR20130078483A (ko) 전자 장치 및 그의 제어 방법
KR20130080380A (ko) 전자 장치 및 그의 제어 방법
CN103218038A (zh) 电子设备及其控制方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20130703