CN101557651A - 移动终端及其菜单控制方法 - Google Patents
移动终端及其菜单控制方法 Download PDFInfo
- Publication number
- CN101557651A CN101557651A CNA200810127912XA CN200810127912A CN101557651A CN 101557651 A CN101557651 A CN 101557651A CN A200810127912X A CNA200810127912X A CN A200810127912XA CN 200810127912 A CN200810127912 A CN 200810127912A CN 101557651 A CN101557651 A CN 101557651A
- Authority
- CN
- China
- Prior art keywords
- portable terminal
- phonetic order
- implication
- controller
- user
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 41
- 230000006870 function Effects 0.000 claims abstract description 116
- 230000004913 activation Effects 0.000 claims description 27
- 230000008676 import Effects 0.000 claims description 12
- 230000008878 coupling Effects 0.000 claims description 5
- 238000010168 coupling process Methods 0.000 claims description 5
- 238000005859 coupling reaction Methods 0.000 claims description 5
- 238000011002 quantification Methods 0.000 claims 2
- 238000004891 communication Methods 0.000 description 24
- 230000008859 change Effects 0.000 description 6
- 238000010586 diagram Methods 0.000 description 6
- 230000000712 assembly Effects 0.000 description 5
- 238000000429 assembly Methods 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 230000004044 response Effects 0.000 description 5
- 238000012545 processing Methods 0.000 description 3
- 230000011664 signaling Effects 0.000 description 3
- 230000005236 sound signal Effects 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 238000010295 mobile communication Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000002441 reversible effect Effects 0.000 description 2
- 229910001220 stainless steel Inorganic materials 0.000 description 2
- 239000010935 stainless steel Substances 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 239000010936 titanium Substances 0.000 description 2
- KLDZYURQCUYZBL-UHFFFAOYSA-N 2-[3-[(2-hydroxyphenyl)methylideneamino]propyliminomethyl]phenol Chemical compound OC1=CC=CC=C1C=NCCCN=CC1=CC=CC=C1O KLDZYURQCUYZBL-UHFFFAOYSA-N 0.000 description 1
- 101150012579 ADSL gene Proteins 0.000 description 1
- 102100020775 Adenylosuccinate lyase Human genes 0.000 description 1
- 108700040193 Adenylosuccinate lyases Proteins 0.000 description 1
- RTAQQCXQSZGOHL-UHFFFAOYSA-N Titanium Chemical compound [Ti] RTAQQCXQSZGOHL-UHFFFAOYSA-N 0.000 description 1
- 230000001133 acceleration Effects 0.000 description 1
- 230000003213 activating effect Effects 0.000 description 1
- 238000013473 artificial intelligence Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 239000011469 building brick Substances 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000013500 data storage Methods 0.000 description 1
- 201000001098 delayed sleep phase syndrome Diseases 0.000 description 1
- 208000033921 delayed sleep phase type circadian rhythm sleep disease Diseases 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000008713 feedback mechanism Effects 0.000 description 1
- 238000001746 injection moulding Methods 0.000 description 1
- 238000012905 input function Methods 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000005259 measurement Methods 0.000 description 1
- 239000007769 metal material Substances 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 229920003023 plastic Polymers 0.000 description 1
- 239000004033 plastic Substances 0.000 description 1
- 230000009467 reduction Effects 0.000 description 1
- 230000029058 respiratory gaseous exchange Effects 0.000 description 1
- 238000005096 rolling process Methods 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 239000010409 thin film Substances 0.000 description 1
- 229910052719 titanium Inorganic materials 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
- 230000001755 vocal effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/167—Audio in a user interface, e.g. using voice commands for navigating, audio feedback
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04B—TRANSMISSION
- H04B1/00—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
- H04B1/38—Transceivers, i.e. devices in which transmitter and receiver form a structural unit and in which at least one part is used for functions of transmitting and receiving
- H04B1/40—Circuits
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F2203/00—Indexing scheme relating to G06F3/00 - G06F3/048
- G06F2203/038—Indexing scheme relating to G06F3/038
- G06F2203/0381—Multimodal input, i.e. interface arrangements enabling the user to issue commands by simultaneous use of input devices of different nature, e.g. voice plus gesture on digitizer
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/048—Interaction techniques based on graphical user interfaces [GUI]
- G06F3/0481—Interaction techniques based on graphical user interfaces [GUI] based on specific properties of the displayed interaction object or a metaphor-based environment, e.g. interaction with desktop elements like windows or icons, or assisted by a cursor's changing behaviour or appearance
- G06F3/0482—Interaction with lists of selectable items, e.g. menus
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/226—Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics
- G10L2015/228—Procedures used during a speech recognition process, e.g. man-machine dialogue using non-speech characteristics of application context
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M1/00—Substation equipment, e.g. for use by subscribers
- H04M1/72—Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
- H04M1/724—User interfaces specially adapted for cordless or mobile telephones
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M2250/00—Details of telephonic subscriber devices
- H04M2250/74—Details of telephonic subscriber devices with voice recognition means
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Telephone Function (AREA)
- User Interface Of Digital Computer (AREA)
- Mobile Radio Communication Systems (AREA)
Abstract
一种移动终端包括:输入单元,其被配置成接收输入以激活所述移动终端上的语音识别功能;存储器,其被配置成存储与移动终端上执行的操作有关的信息;以及控制器,其被配置成在接收到用于激活语音识别功能的输入时激活语音识别功能,以基于移动终端上执行的至少一个先前的操作和包括在语音指令中的语言来确定输入语音指令的含义,以及基于移动终端上执行的至少一个先前操作和包括在语音指令中的语言并基于输入语音指令的所确定含义匹配与移动终端的操作有关的信息的概率,来提供与输入语音指令的所确定含义有关的操作。移动终端及其菜单控制方法。
Description
发明背景
技术领域
本发明涉及移动终端,以及相应的基于语音命令和该移动终端上先前执行的操作在该移动终端上执行操作的方法。
相关技术的描述
除基本的通话服务外,现在移动终端还提供很多附加服务。例如,用户现在可访问因特网、玩游戏、观看视频、听音乐、捕捉图像和视频、记录音频文件等。移动终端现在还提供广播节目,使得用户可观看电视节目、体育节目、视频等。
因此,移动终端包括复杂的图形用户界面或GUI,用户可使用它来访问终端上的各种功能。例如,用户可访问主菜单,然后选择诸如电子邮件子菜单、呼叫历史子菜单、互联网接入子菜单、图片子菜单等多个子菜单中的一个。一旦用户选择具体子菜单,移动终端提供用户可选择的又一个子菜单或选项列表,以执行期望功能。
然而,将菜单系统形成为树形图,以使用户必需执行数个中间功能以便于选择期望的最终功能。另外,因为终端的尺寸小,所以菜单选项的尺寸也小,且难以看见。当终端包括触摸屏显示器时触摸具体菜单选项也经常导致用户同时触摸一个以上的菜单项(因为菜单项密集地显示在一起)或用户触摸差错的菜单项。
发明内容
因此,本发明的一个目的是解决以上指出的问题及其它问题。
本发明的另一个目的是提供一种移动终端,以及相应的识别语音指令的含义并基于所识别的语音指令控制终端的方法。
本发明的又一个目的是提供一种移动终端,以及相应的基于所识别的语音指令提供一个或多个菜单以操作终端的不同功能的方法。
为了实现这些或其它优点并根据本发明的目的,如本文具体表达并广泛描述的,在一个方面上,本发明提供了一种移动终端,包括:输入单元,其被配置成接收用于激活移动终端上的语音识别功能的输入;存储器,其被配置成存储与移动终端上执行的操作有关的信息;以及控制器,其被配置成在接收到用于激活语音识别功能的输入时激活语音识别功能,以基于移动终端上执行的至少一个先前的操作和包括在语音指令中的语言来确定输入语音指令的含义,以及基于移动终端上执行的至少一个先前操作和包括在语音指令中的语言并基于输入语音指令的所确定含义匹配与移动终端的操作有关的信息的概率,来提供与输入语音指令的所确定含义有关的操作。
在另一个方面中,本发明提供了一种控制移动终端的方法,其包括:接收用于激活移动终端上的语音识别功能的输入;在接收用于激活语音识别功能的输入之后激活语音识别功能;以及基于移动终端上执行的至少一个先前操作和包括在语音指令中的语言,并基于输入语音指令的所确定含义匹配与移动终端的操作有关的信息的概率,来提供与输入语音指令的所确定含义有关的操作。
本发明的适用性的进一步的范围将在下文给出的详细描述中变得显而易见。然而,应当理解,详细描述和特定例子尽管指示了本发明的较佳实施例但仅作为说明给出,因为在本发明的精神和范围内的各种变化和修改对本领域的技术人员来说在阅读详细描述之后是显而易见的。
附图简要说明
从下文给出的详细描述和附图中将更全面地理解本发明,该详细描述和附图仅作为例示给出,因此不是对本发明的限制,在附图中:
图1是根据本发明的实施例的移动终端的框图;
图2是根据本发明的实施例的移动终端的前侧立体图;
图3是图2中所示的移动终端的后侧立体图;
图4是根据本发明的实施例的可与图1-3中的移动终端一起操作的无线通信系统的框图;
图5是示出根据本发明的一个实施例的控制移动终端的方法的流程图;
图6(a)至6(c)是示出根据本发明的一个实施例的用于选择激活移动终端的语音识别功能的方法的显示屏的概观;
图7A是示出根据本发明的一个实施例的移动终端的语音识别方法的流程图;
图7B是根据本发明的另一个实施例的包括基于移动终端的语音识别率显示的菜单的显示屏的概观;
图7C是示出根据本发明的一个实施例的移动终端的语音识别方法的显示屏的概观;
图7D是示出根据本发明的一个实施例的移动终端的语音识别方法的显示屏的概观;
图8是示出根据本发明的一个实施例的在移动终端的语音识别方法中使用的数据库系统的框图;以及
图9是示出根据本发明的一个实施例的显示通知用户移动终端中正在执行语音指令的消息的显示屏的概观。
具体实施方式
下面将详细参考本发明的较佳实施方式,其示例在附图中例示。
图1是根据本发明的实施例的移动终端100的框图。如图所示,移动终端100包括无线通信单元110,该无线通信单元110具有允许在移动终端100与该移动终端所在的无线通信系统或网络之间进行无线通信的一个或多个组件。
例如,无线通信单元110包括经由广播频道从外部广播管理实体接收广播信号和/或广播关联信息的广播接收模块111。广播频道可包括卫星频道和地面频道。
此外,广播管理实体通常是指发送广播信号和/或广播关联信息的系统。广播关联信息的示例包括与广播频道、广播节目、广播服务提供商等相关联的信息。例如,广播关联信息可包括数字多媒体广播(DMB)的电子节目指南(EPG)和手持数字视频广播(DVB-H)的电子服务指南(ESG)。
此外,广播信号可被实现为TV广播信号、无线电广播信号以及数据广播信号等。广播信号还可包括与TV或无线电广播信号组合的广播信号。
广播接收模块111还被配置成接收从各种类型广播系统发送的广播信号。例如,这种广播系统包括地面数字多媒体广播(DMB-T)、卫星数字多媒体广播(DMB-S)、手持数字视频广播(DVB-H)系统、称为媒体单一前向链路的数据广播系统和地面综合业务数字广播(ISDB-T)等。接收多播信号也是有可能的。此外,由广播接收模块111接收的数据可被存储在诸如存储器160的合适设备中。
无线通信单元110还包括移动通信模块112,它向一个或多个网络实体(例如基站、节点-B)发送无线信号或从其接收无线信号。这些信号可表示音频、视频、多媒体、控制信令和数据等。
还包括的是无线因特网模块113,它支持移动终端的因特网接入。该模块113可内置或外置地耦合到终端上。无线通信单元110还包括短距离通信模块114,其有助于相对较短距离的通信。实现该模块的合适技术包括例如在网络技术中通常称为蓝牙和ZigBee的射频标识(RFID)、红外数据关联(IrDA)以及超宽带(UWB),谨此略举几例。
定位模块115也被包括在无线通信单元110中,并标识或以其它方式获得移动终端100的位置。该定位模块115可用与相关联的卫星、网络组件及其组合协作的全球定位系统(GPS)组件实现。
此外,如图1所示,移动终端100还包括音频/视频(A/V)输入单元120,它向移动终端100提供音频或视频信号。如图所示,A/V输入单元120包括相机121和话筒122。相机121接收并处理静止图片或视频的图像帧。
此外,在便携式设备处于诸如电话呼叫模式、记录模式和语音识别模式之类的特定模式下时,话筒122接收外部音频信号。所接收的音频信号然后被处理并转换成数字数据。同样,该便携式设备,尤其是A/V输入单元120,通常包括用于去除在接收外部音频信号过程中生成的噪声的混杂噪声去除算法。此外,由A/V输入单元120生成的数据可存储在存储器160中、由输出单元150使用、或者经由通信单元110的一个或多个模块发送。如果需要的话,可使用两个或更多话筒和/或相机。
移动终端100还包括用户输入单元130,它响应于用户对一个或多个关联输入设备的操纵而生成输入数据。这种设备的示例包括键盘、按键开关、触摸板(例如静态压力/电容)、转动轮和转动开关。具体示例是用户输入单元130被配置成与触摸屏显示器协作的触摸板的终端,这将在以下更详细描述。
感测单元140也被包括在移动终端100中,并提供对移动终端100的各个方面的状态测量。例如,感测单元140可检测移动终端100的开/关状态、移动终端100的组件(例如显示器和键区)的相对定位、移动终端100或移动终端100的组件的位置变化、用户与移动终端100接触与否、移动终端100的取向或加速/减速等。
作为示例,当移动终端100是滑盖型移动终端时,感测单元140可感测移动终端100的滑动部分是打开还是关闭。其它示例包括感测单元140感测电源190是否提供功率、接口单元170和外部设备之间是否存在耦合或其它连接。
此外,接口单元170往往实现成将移动终端与外部设备耦合。典型的外部设备包括有线/无线头戴受话机、外部充电器、电源、用于存储数据(例如音频、视频、图片等)的存储设备、耳机和话筒等。此外,接口单元170可用有线/无线数据端口、卡插槽(例如,用于耦合到储存卡、客户识别模块(SIM)卡、用户识别模块(UIM)卡、可移动用户识别模块(RUIM)卡等)、音频输入/输出端口和视频输入/输出端口。
输出单元150通常包括支持移动终端100输出要求的各种组件。移动终端100还包括显示器151,它以可视方式显示与移动终端100相关联的信息。例如,如果移动终端100运行于电话呼叫模式,则显示器151通常提供包括与呼出、进行和终止电话呼叫相关联的信息的用户界面或图形用户界面。作为另一示例,如果移动终端100处于视频呼叫模式或照相模式下,则显示器151可附加地或替代地显示与这些模式相关联的图像。
此外,显示器151较佳地还包括与诸如触摸板之类的输入设备协同工作的触摸屏。该配置允许显示器151同时充当输出设备和输入设备。此外,显示器151可用包括例如液晶显示器(LCD)、薄膜晶体管液晶显示器(TFT-LCD)、有机发光二极管显示器(OLED)、柔性显示器和三维显示器的显示技术实现。
移动终端100还可包括一个或多个这样的显示器。双显示器实施例的示例是一个显示器被配置成内部显示器(当终端处于打开位置时可以查看)以及第二显示器被配置成外部显示器(在打开和关闭位置都可以查看)。
图1还示出具有支持移动终端100的音频输出需要的音频输出模块152的输出单元150。音频输出模块152通常用一个或多个扬声器、蜂鸣器、其它音频产生设备及其组合来实现。
此外,音频输出模块152可在包括呼叫接收模式、呼叫进行模式、记录模式、语音识别模式和广播接收模式在内的各种模式中运行。在运行过程中,音频输出模块152输出与特定功能(例如,呼叫接收、消息接收和差错)相关的音频。
此外,图中的输出单元150还具有用于发出信号或以其它方式标识发生了与移动终端100相关联的特定事件的警报器153。典型事件包括收到呼叫、收到消息和收到用户输入。这种输出的示例包括向用户提供触觉感知(例如振动)。例如,警报器153可被配置成响应于移动终端100接收到呼叫或消息而振动。
作为另一示例,可由警报器153响应于在移动终端100处收到用户输入而提供振动,因而提供一种触觉反馈机制。另外,由输出单元150的组件提供的各种输出可独立实现,或者这种输出可用这些组件的任意组合实现。
此外,存储器160一般被用于存储各种类型的数据以支持移动终端100的处理、控制和存储需要。这些数据的示例包括在移动终端100上操作的应用程序的程序指令、呼叫历史、联系人数据、电话簿数据、消息、图片、视频等。
此外,在图1中示出的存储器160可用任何类型(或组合)的合适易失性和非易失性存储器或存储设备来实现,包括随机存取存储器(RAM)、静态随机存取存储器(SRAM)、电可擦可编程只读存储器(EEPROM)、可擦可编程只读存储器(EPROM)、可编程只读存储器(PROM)、只读存储器(ROM)、磁性存储器、闪存、磁盘或光盘、卡式存储器、或其它类似存储器或数据存储设备。
终端100还包括控制器180,它通常控制移动终端100的总体操作。例如,控制器进行与语音呼叫、数据通信、即时消息通信、视频呼叫、相机操作和记录操作相关联的控制和处理。如图1所示,控制器180可包括提供多媒体回放功能的多媒体模块181。多媒体模块181可被配置成控制器180的一部分,或者该模块可被实现为独立组件。
此外,电源190提供便携式设备的各个组件所需的电力。所提供电力可以是内部电力、外部电力或其组合。
接下来,图2是根据本发明的实施例的移动终端100的前侧视图。如图2所示,移动终端100包括配置成与第二机身205滑动配合的第一机身200。图1中的用户输入单元130可包括诸如功能键210之类的第一输入单元和诸如键区215之类的第二输入单元以及诸如侧键245之类的第三输入单元。
功能键210与第一机身200相关联,而键区215与第二机身205相关联。键区包括使用户能够呼出电话、准备文本或多媒体消息、或以其它方式操作移动终端100的各种键(例如数字、字符和符号)。
此外,第一机身200相对于第二机身205在打开和关闭位置之间滑动。在关闭位置时,第一机身200以这种方式在第二机身205上定位:键区215基本上或完全被第一机身200遮蔽。在打开位置时,用户访问键区215以及显示器151和功能键210成为可能。功能键方便用户输入诸如开始、停止和滚动的命令。
此外,移动终端100可在待机模式(例如,能够接收呼叫或消息、接收和响应网络控制信令)或活动呼叫模式下工作。通常,移动终端100在处于关闭位置时在待机模式下运行,而在打开位置时在活动模式下运行。然而,该模式配置可按要求或需要更改。
此外,第一机身200由第一外壳220和第二外壳225形成,而第二机身205由第一外壳230和第二外壳235形成。各第一和第二外壳通常由诸如注入成型塑料之类的适当刚性(ridge)材料来形成,或者用诸如不锈钢(STS)和钛(Ti)的金属材料形成。
如果需要,可在第一和第二机身200、205之一或两者的第一和第二外壳之间设置一个或多个中间外壳。通常将第一和第二机身200、205的大小调整成可容纳用于支持移动终端100的操作的电子组件。
第一机身200还包括相机121和被配置成相对于显示器151定位的扬声器的音频输出单元152。相机121还可以这种方式构成:它可相对于第一机身200选择性地定位(例如,转动、旋转等)。
此外,功能键210靠近显示器151的下侧定位。如上所述,显示器151被实现为LCD或OLED。显示器151还可被配置成具有响应于用户接触(例如,手指、输入笔等)触摸屏而生成信号的底层触摸板的触摸屏。
第二机身205还包括与键区215相邻定位的话筒122和侧键245,该侧键245是沿第二机身205的侧面定位的一类用户输入单元。较佳地,侧键245可被配置成热键,使得侧键245与移动终端100的特定功能相关联。如图所示,接口单元170与侧键245相邻定位,而电池形式的电源190位于第二机身205的下部。
图3是图2所示移动终端的后侧视图。如图3所示,第二机身205包括相机121、以及相关联的闪光灯250和反射镜255。闪光灯250结合第二机身205的相机121操作,反射镜255用于帮助用户在自拍模式中定位相机121。此外,第二机身205的相机121朝向与图2所示的第一机身200的相机121所朝向的方向相反的方向。
此外,第一和第二机身的相机121各自可具有相同或不同的能力。例如,在一实施例中,第一机身200的相机121以比第二机身205的相机121相对较低的分辨率操作。这一安排在例如其中反向链路带宽能力受到限制的视频会议通话期间十分有效。此外,第二机身205(图3)的相机的相对较高分辨率对获取较高质量图片以备后续使用而言十分有用。
第二机身205还包括配置成位于第二机身205上侧的扬声器的音频输出模块152。第一和第二机身200、205的音频输出模块还可协作提供立体声输出。此外,这些音频输出模块的任意一个或两者可被配置成充当扬声器电话。
终端100还包括广播信号接收天线260,它位于第二机身205的上端。天线260与广播接收模块111(图1)协作运行。如果需要的话,天线260可以是固定的,或是配置成缩回第二机身205中。此外,第一机身200的背侧包括与位于第二机身205前侧的相应滑动模块可滑动地耦合的滑动模块265。
此外,第一和第二机身200、205的各种组件的所示安排可按要求和需要进行更改。通常,一个机身的组件中的一部分或全部能够可替换地在另一机身上实现。此外,这些组件的位置和相对定位可以定位在不同于代表性附图所示的位置上。
此外,图1-3的移动终端100可被配置成在经由帧或分组发送数据的通信系统中操作,包括无线、有线通信系统和基于卫星的通信系统。这些通信系统使用不同的空中接口和/或物理层。
由通信系统使用的这种空中接口的示例包括例如频分多址(FDMA)、时分多址(TDMA)、码分多址(CDMA)和通用移动电信系统(UMTS)、UMTS的长期演进(LTE)以及全球移动通信系统(GSM)。仅作为非限制性示例,进一步的描述将涉及CDMA通信系统,但是这些教导同样地适用于其它系统类型。
接下来,图4示出具有多个移动终端100、多个基站270、多个基站控制器(BSC)275和移动交换中心(MSC)280的CDMA无线通信系统。
MSC 280配置成与公共交换电话网(PSTN)290接口,且MSC 280还被配置成与BSC 275接口。此外,BSC 275经由回程线路耦合到基站270。此外,回程线路可根据若干公知接口中的任一种来配置,包括例如E1/T1、ATM、IP、PPP、帧中继、HDSL、ADSL、或xDSL。此外,系统可包括两个以上的BSC 275。
每个基站270还可包括一个或多个扇区,每个扇区具有全向天线或指向径向远离基站270的特定方向的天线。或者,每个扇区可包括用于分集接收的两个天线。此外,每个基站270可被配置成支持多个频率分配,并且各个频率分配具有特定频谱(例如,1.25MHz、5MHz)。
扇区和频率分配的交集被称为CDMA信道。基站270还可被称为基站收发机子系统(BTS)。在一些情形中,术语“基站”可用于通指BSC 275、以及一个或多个基站270。
基站还可表示成“小区站点(cell site)”。或者,给定基站270的各个扇区可被称为小区站点。另外,地面数字多媒体广播(DMB)发射机295被示为向工作在该系统中的移动终端100广播。
此外,移动终端100的广播接收模块111(图1)通常被配置成接收由DMB发射机295发射的广播信号。如上所述,可对其它类型的广播和多播信令实现类似的安排。
图4还示出了若干全球定位系统(GPS)卫星300。这些卫星有助于定位一部分或者所有移动终端100的位置。在图4中示出了两个卫星,但是,可使用更多或更少的卫星来获取定位信息。
另外,移动终端100的定位模块115(图1)通常被配置成与卫星300协作以获得期望的位置信息。然而,或者也可以实现其它类型的位置检测技术,比如可添加到或替代GPS定位技术的定位技术。一部分的或者全部的GPS卫星300可选择性地或附加地配置成提供卫星DMB传送。
此外,在无线通信系统的典型操作期间,基站270从各个移动终端100接收多组反向链路信号。移动终端100进行呼叫、发消息、以及其它通信。
另外,在基站270内处理由给定基站270接收到的每个反向链路信号,且所得数据被转发到相关联的BSC 275。BSC提供呼叫资源分配以及包括基站270之间的软切换的移动性管理功能。
此外,BSC 275还将收到的数据路由至MSC 280,MSC 280提供附加路由服务用于与PSTN 290接口。类似地,PSTN与MSC 280接口,并且MSC 280与BSC 275接口。BSC 275还控制基站270,向移动终端100发送多组前向链路信号。
在以下的描述中,参照各实施例解释适用于以上配置的移动终端100的控制方法。然而,以下的实施例可单独实现或通过其组合实现。此外,在以下的描述中,假设显示器151包括触摸屏。另外,触摸屏或其屏幕可由附图标记‘400’指示。
图5是根据本发明的实施例的控制移动终端的方法的框图。在该描述中还将参考图1。如图所示,控制器180确定何时激活移动终端的语音识别功能(S101)。当语音识别功能被激活时(S101中的是),控制器180接收由用户输入的语音指令(在下文中称为“语音指令”)(S102)。然后,当控制器180识别出语音指令已由用户输入(S102中的是)时,控制器180确定所识别语音指令的含义(S103)。
此外,为了激活本实施例的语音识别功能,用户可选择具体按钮或触摸移动终端中所包括的触摸屏的具体部分。使用户物理激活语音识别功能是特别有利的,因为用户更能意识到他们将要使用语音命令来控制终端。即,因为用户必需首先执行对终端的物理操纵,所以他或她直观地意识到他们将把语音命令或指令输入至终端,因此可说得更清楚或更慢从而激活具体功能。
因而,例如,因为用户说得更清楚或更慢,所以准确识别语音指令的概率增加。即,语音识别功能的激活通过终端上按钮的物理操纵来执行,而不是通过对终端讲话来激活语音识别功能。
此外,控制器180可基于用户触摸具体按钮或触摸屏的一部分达多少次、用户触摸具体按钮或触摸屏的一部分有多长时间等来开始或终止语音识别功能的激活。用户还可设置控制器180要如何利用由本发明提供的适当菜单选项来激活语音识别功能。例如,用户可选择终端上的菜单选项,包括1)基于语音激活按钮被选择的次数X设置语音识别的激活,2)基于语音激活按钮被选择的时间量X设置语音识别的激活,3)当按钮X和Y被选择时设置语音识别的激活等。用户于是可输入X和Y的值,以便于可变地设置控制器180如何确定语音激活功能被激活。因此,根据本发明的实施例,用户积极地参与其移动终端的语音识别功能,这增加了控制器180确定与用户语音指令相对应的正确功能的概率,这也使得用户能根据他或她的需要修改语音激活功能。
控制器180还可在指定的按钮被触摸或选择的同时维持语音识别功能的激活状态,并在指定的按钮被放开时停止语音识别功能。或者,控制器180可在指定按钮被触摸或选择后将语音识别功能的激活维持预定的时间段,并在预定时间段结束时停止或终止语音识别功能。在又一个实施例中,控制器180可将所接收的语音指令存储在存储器160中,同时将语音识别功能维持为激活状态。
此外,控制器180可在语音识别功能被终止后立即确定语音指令的含义,或可在用户输入语音指令时同时确定语音指令的含义。此外,为了确定语音指令的含义,控制器180可分析输入语音指令中使用的词、关键词、句子结构等,并确定语音指令的内容或含义。
此外,控制器180还可在存储器160的数据库中存储与设置在移动终端中的功能、服务或菜单有关的信息,以便于确定语音指令的含义。此外,为了提高准确检测用户语音指令的概率,可利用学习或人工智能法更新数据库中存储的信息。先前在移动终端上执行的操作还可被存储在数据库中。例如,用户可打开其终端,并且在大多数时候在执行任何其它操作之前检查其电子邮件。
因此,控制器180可使用其先前的操作来增加确定用于语音指令的含义的概率。用户在首先打开或开启其移动终端时还可输入相同的语音指令。这些先前的操作还可与输入语音指令存储在一起,并由控制器180用来确定输入指令的含义。
因而,终端上执行的先前操作包括终端的激活状态(例如,在待机模式期间、电话呼叫期间、视频电话呼叫期间、电子邮件会话期间、即时消息会话期间、关闭终端等),还包括先前由用户输入的指令。例如,为了听音乐,用户可在先前关闭终端,然后输入指令“播放我的音乐”。控制器180然后可利用移动终端的状态(即,处于关闭状态)来帮助确定用户输入的语音指令是什么。
返回到图5,当控制器180利用数据库中的信息确定语音指令的含义时,控制器180输出相应的结果值(S104)。即,结果值可包括用于执行与所识别的语音指令对应的功能或用于控制具体元件的控制信号。结果值还可对应于用于显示与所识别的指令有关的一个或多个菜单的数据信息。
此外,用户可输入作为具体菜单的准确指定的语音指令(例如,图像捕捉、语音呼叫、消息传送等)或利用自然语言(例如,显示照片、省电等)。同样,自然语言指令可以或可以不包括与具体菜单有关的准确指定。
此外,自然语言是一般由日常生活中的人使用的话语,它与人工语言(它是人工创造的)不同,并可利用自然语言处理算法来处理。另外,在图5中,控制器180然后确定它是否可识别由用户输入的语音指令(S105)。
例如,控制器180可确定它是否能以高于具体阈值(例如80%)的概率识别语音指令。如果控制器180不能确定满足具体阈值的语音指令的含义,则控制器180可执行附加的差错处理(S107),然后重复步骤S103至S105。
然而,如果控制器180可识别满足具体阈值的语音指令,则控制器180可有利地显示满足具体阈值的多个菜单(例如,具有高于80%的具体识别率或更高)(S106)。用户可在视觉上看到所显示的菜单,然后选择所显示菜单之一。
该特征是特别有利的,因为用户再次积极地参与到语音识别功能之中。更具体地,与控制器180不能清楚确定语音指令的含义而向用户显示或输出消息不同,控制器180有利地输出准确概率高于具体阈值(例如80%)的多个菜单。例如,如果用户输入语音指令“节省电池”,但控制器180只能唯一地确定指令“节省”(例如,由于背景噪声、不良接收等),则控制器180可显示与关键词“节省”有关的具体菜单或选项。即,控制器180可显示照片菜单、电池菜单和电子邮件菜单,因为这些菜单各自包括“节省”功能部件。因此,用户就可从多个所显示的菜单中选择适当菜单。
此外,如上所述,控制器180可在确定输入语音指令的含义时使用终端先前的操作。控制器180还可使用终端的物理状态来帮助确定输入语音指令的含义。例如,在判定输入语音指令的含义时,控制器180可有利地使用关于电池状态的信息(例如,低电池状态)。
此外,作为接收用户确认的类型,可使用消息、语音或菜单的显示位置或形式(形状和大小),且响应类型可以是用户语音、具体按钮或触摸输入。另外,如上所述,如果输入语音指令的识别率低于具体阈值,则控制器180可执行差错处理操作(S107)。
另外,在差错处理操作期间,控制器180可从用户处接收另外的语音指令,或者如上所讨论地,可显示具有高于一定识别率或概率的多个菜单。控制器180还确定高于具体概率的所识别功能或菜单的数量。如果所识别的具有高于一定识别率的功能或菜单小于具体数量(例如,如果仅有一个功能或一个菜单),则控制器180自动执行单个功能或菜单。
接下来,图6(a)至6(c)是示出根据本发明的实施例的用户激活移动终端的语音识别功能的显示屏。另外,如上所述,本发明有利地使用户能基于用户的物理操纵确定何时开始语音激活功能。因而,用户更清楚其环境(例如,他是否在安静的环境中讲话)、其语音的音调或音量、他使用的自然语音或其它类型的语言等。因此,用户有可能在输入语音指令时更加仔细,这导致控制器180准确确定语音指令的含义的概率更高。
此外,使用户能通过触摸或选择终端上的按钮来手动激活语音识别功能的另一个优点在于降低了电池电量。即,语音识别功能消耗了终端的多个资源,且当语音识别功能的激活状态在待机状态(或空闲状态)下连续操作时,终端的总功率被连续地消耗。
更具体地,当控制器180被配置成经由用户向终端讲话(而不是用户选择具体按钮)来接收用于激活语音识别功能的激活信号时,控制器180必须连续地在活动状态中操作语音识别功能,并等待用户开始讲话(这将指示语音识别开始)。这种等待用户语音输入以开始语音识别功能的连续操作连续地减少终端的可用功率。
因此,为了防止移动终端的功率消耗和资源消耗,控制器180有利地控制语音识别功能的开始和终止。在一个例子中,如图6(a)所示,移动终端的用户输入单元130包括显示单元151上的软按钮350,用户可触摸该软按钮350来启动或停止语音识别功能。另外,软按钮可具有按钮形状,或可以是具体形状的图标。软按钮350还可用例如设置在终端的一侧上的硬按钮351来替换,如图6(a)所示。
在另一个例子中,如图6(b)所示,可将显示单元151的任意部分用于激活和停用语音识别功能,而不在显示单元151上显示按钮或图标。在又一个例子中,如图6(c)所示,可经由移动终端的话筒122输入具体声音,以控制语音识别功能的激活和终止。
更详细地,具体声音可以是具有高于具体声级的撞击声,诸如用户拍手的声音。控制器180然后利用确定通过话筒122输入的声级的算法或电路来检测该撞击声。即,用于检测撞击声的算法或电路被配置成检测高于预先设定的具体声级的声音,且与语音识别功能相比不消耗移动终端的大量资源或电能。
用户还可有利地设置哪些具体的撞击声用于激活语音识别功能。例如,用户可选择由本发明的终端提供的适当菜单选项,然后拍手两次或三次以通知控制器180具体次数的拍手声音将用于激活语音识别功能。用户还可设置任何其它的声音作为用于激活语音识别功能的声音。
此外,控制器180可以多种模式驱动语音识别功能。例如,控制器180可按其中高于具体级别的声音激活语音识别功能的第一模式和其中接收语音指令并确定其内容或含义的第二模式可分辨地驱动语音识别功能。即,如果高于具体级别的声音在第一模式中检测到,则控制器180执行第二模式来激活语音指令识别功能。
此外,在另一个实施例中,控制器180在从用户处接收肢体信息时开始激活语音识别功能。更具体地,肢体信息包括手势信号或用户的姿势。可将感测单元140用于检测用户的肢体信息。在另一个实施例中,控制器180在利用无线设备接收短距离或遥控区域的无线电信号后开始激活语音识别功能。
此外,控制器180可经由无线通信单元110接收无线电信号,并通过感测单元140接收手势信号或用户的姿势。在这些实施例中,用于接收激活语音识别功能的信号的无线通信单元110、用户输入单元130以及感测单元140可被统称为激活信号输入单元。
此外,如上所述,为了降低移动终端的功耗和资源消耗,控制器180在预定时间段后、在从用户接收终止信号后等终止或停止语音识别功能。为此目的,终止信号能以与用于开始激活语音识别功能的方式相同或类似的方式对应于所触摸或按下的按钮、触摸触摸屏的具体部分、撞击声、无线电信号或来自用户的肢体信息。
更具体地,控制器180可开始语音识别功能的激活,在具体的时间段期间维持语音识别功能的激活状态,并在具体时间段结束时自动终止语音识别功能的激活状态。或者,控制器180可在按钮或触摸被连续输入时维持语音识别功能的激活状态,并在放开输入时终止语音识别功能的激活状态。在另一个例子中,控制器180可在用户不向终端讲话的时间大于具体时间段时终止语音识别功能。
接下来,图7A是示出根据本发明的另一个实施例的语音识别方法的流程图。在该描述中还将参考图1。如图7A所示,当输入语音识别功能(S201)时,控制器180在存储器160中存储输入语音指令(S202),并根据具体语音识别算法处理语音指令(S203)。
然后,根据语音识别算法,控制器180将输入语音指令转换成文本信息,并将经转换的文本信息存储在存储器160的任意区域中(S204)。之后,控制器180处理文本信息以确定指令的含义。此外,控制器180较佳地在语音指令被输入的同时确定语音指令的含义。
然而,如上所述,控制器180还可在用户完成语音指令的输入之后确定语音指令的含义。例如,如果用户在预先设定的具体时间段内不输入语音指令,则控制器180可确定用户已经完成输入语音指令,然后开始确定语音指令的含义的过程。
接下来,如图7A所示,控制器180检测包括在文本信息中的具体词或关键词,以确定语音指令的含义(S205),并将所检测的词或关键词与关于移动终端的具体数据库中所存储的各种功能和菜单的信息进行比较(S206)。此外,当相同或类似的词或关键词被存储在数据库中时,语音指令的识别率可由对应的词或关键词的数量来确定(S207)。
此外,用于确定识别率的信息可不限于包括在语音指令中的词或关键词的数量的信息。即,用于确定识别率的值可针对每一个关键词不同地设定,从而即使词或关键词的数量很小,识别率也可根据具有高识别率的关键词而改变。
同样,语音识别率是指示所识别的语音指令是否准确的信息。更具体地,如果具体菜单的名称被准确输入,则可获得100%的识别率。然而,如果以自然语言接收语音指令,则无意义的词可被包括在语音指令中,且每一个用户对相同的词读音不同。所以实际上难以获得100%的识别率。
因此,本发明的实施例有利地将高于具体值(例如80%)的识别率视为准确。因此,如果有几种含义以类似的识别率确定(即,识别率是类似的,但语音指令可被翻译成具有各种含义),则控制器180显示对应于高于预定阈值的识别率的多个可执行菜单,使得用户可选择所显示菜单之一(S208)。
此外,控制器180还可按优先级的顺序显示菜单,且该顺序从具有最高识别率的菜单开始。例如,如图7B所示,具有最高识别率的菜单图标可显示在显示屏410的中心部分。或者,如图7B所示,具有最高识别率的菜单图标可在显示屏420上显示为较大、较暗或突出显示。所显示的最高识别率的菜单还可以闪烁的方式显示。
此外,为了提高识别率,如果菜单被用户频繁选择,则控制器180可学习并记住选择的次数,并使用该学习到的信息来改变关于具体菜单的识别率。因此,识别率可关于具有类似或相同的发音或内容的语音指令输入来改变。
接下来,图7C根据本发明的一个实施例的用于说明语音识别方法的显示屏的概观。如图所示,当用户以自然语言输入语音指令“我想看我的图片”时,控制器180从形成语音指令的句子中检测有意义的词或关键词(例如,看、图片),并将词与存储在移动终端的数据库中的信息进行比较。
此外,所检测的词或关键词是否是有意义的词可通过一部分语音来确定。或者,可将具体的预先设定的关键词检测为有意义的词。控制器180于是在数据库中搜索与有意义的词或关键词对应的信息。
此外,数据库可包括与移动终端的各种菜单或功能有关的多个关键词信息。例如,作为与“相册”对应的关键词信息,除准确的“相册”之外,可相应地存储诸如相机菜单的下级菜单、“照片”、“视频”、“影集”等多个关键词信息。
如图7C中的显示屏510所示,当没有关于与语音指令等同的菜单或功能的信息时,控制器180显示多个菜单,每一个菜单都具有高于具体值的识别率。如以上所讨论的,控制器180将具有最高识别率的菜单图标521显示为比其它所显示的项大或暗。
此外,图7C中的显示屏520示出在只有一个菜单具有高于具体值的识别率时,控制器180自动执行识别率高于具体值的相应菜单功能。此外,控制器180可输出其含义被确定为文本或其它类消息的语音指令,或通过语音消息输出。
图7D是根据本发明的又一个实施例的说明语音识别方法的显示屏的概观。在该实施例中,用户首先通过触摸显示屏610激活语音识别功能,然后以自然语言输入语音指令“启用电池省电”,如显示屏620所示。控制器180然后在形成语音指令的句子中检测有意义的词或关键词(例如,电池、省电),并该词与存储在数据库中的信息进行比较以确定其含义。
然而,在该实施例中,因为没有准确对应于语音指令的菜单,所以控制器180显示与降低电池功耗的功能有关的多个菜单(例如,背景图像、背光、待机屏幕等),如显示屏630所示。
此外,如以上所讨论的,可根据高识别率的顺序有区别地显示或突出显示多个菜单的大小、位置、颜色和对比度中的至少一个。例如,具有高用户选择的菜单的识别率可显示成与其它菜单有区别。
接下来,图8是示出根据本发明的一个实施例的用于语音识别的数据库的框图。数据库包括所存储的由控制器180用于确定语音指令的含义的信息。因此,多个数据库可根据每一个信息的特性来配置。此外,根据每一个信息的特性配置的每一个数据库可在控制器180的控制下通过连续的学习过程更新。
此外,数据库的学习过程指的是将用户发出的语音与相应的词匹配。例如,如果用户发音为“十五”但控制器180将该词识别为“五十”,则用户可将“五十”纠正为“十五”,使得控制器180将后来发出的相同发音识别为“十五”。
因此,通过该学习过程,多个语音信息可与数据库的每个信息匹配。例如,数据库可包括:第一数据库161,用于存储语音信息,使通过话筒的用户语音输入能根据格式、音节或词素来识别;第二数据库162,用于存储信息,使控制器180能基于所识别的语音信息确定语音指令的整体含义;第三数据库163,用于存储与执行移动终端的功能或服务的菜单有关的信息;以及第四数据库164,用于存储要从移动终端输出的针对用户关于所确定语音指令的含义的确认的消息或语音消息。
此外,每一个数据库可存储语言(发音)信息或格式、音节、词素、词、关键词或句子信息。因此,控制器180可通过使用多个数据库161至164中的至少一个确定语音识别操作和语音指令的含义,并执行与对应于语音指令的所确定含义的功能或服务有关的菜单。
接下来,图9是根据本发明的一个实施例的显示信息以通知用户移动终端中正在执行所识别的语音指令的显示屏的概观。更具体地,当控制器180识别语音指令或确定语音指令的含义时,控制器180输出相应的结果值。结果值可以是用于执行移动终端的具体功能的控制信号,与所识别指令有关的菜单信息,或在执行功能时输出的数据信息。在图9中,控制器180输出信息500,通知用户所输入的语音指令正在被识别。
此外,上述的实施例指的是识别用户的语音指令。然而,本发明还适用于用户在语音指令正在被识别时执行附加的输入功能。例如,语音识别和触摸输入、语音识别和按钮输入、或语音识别或触摸/按钮输入可同时执行。
此外,控制器180可防止语音识别功能在具体模式或菜单或具体操作状态下执行。另外,音频信息(例如,语音通知或引导信息)或指示语音识别功能正在被应用的视频信息(例如,图9中的指示符500)可在语音识别模式、菜单或操作状态下显示。同样,可将正在应用语音识别功能的信息通过输出帮助信息来提供给用户。
此外,以上各个实施例可使用例如计算机软件、硬件、或其某种组合而在计算机可读介质中实现。对于硬件实现,上述实施例可在一个或多个专用集成电路(ASIC)、数字信号处理器(DSP)、数字信号处理设备(DSPD)、可编程逻辑设备(PLD)、现场可编程门阵列(FPGA)、处理器、控制器、微控制器、微处理器、设计成执行本文所述功能的其它电子单元、或其选择性组合内实现。
对于软件实现,本文所述的实施例可通过诸如程序和函数的独立软件模块实现,每个软件模块实现本文所述的功能和操作中的一个或多个。软件代码可通过以任何合适编程语言编写的软件应用程序实现,并且可被存储在存储器(例如,存储器160)中,而且可由控制器或处理器(例如,控制器180)执行。
另外,移动终端100可以以各种不同配置实现。这些配置的示例包括翻盖式、滑盖型、直板型、旋转型、回转型及其组合。
由于示例性实施例可按几种形式实现,而不背离其特性,所以还应理解,上述的实施例不会被上述描述的任何细节所限制,除非另外指出,而应广泛地解释为在所附权利要求定义的范围中。因此,落入权利要求的范围内的各种变化和修改或该范围的等价技术方案因此由所附权利要求所包含。
Claims (26)
1.一种移动终端,包括:
输入单元,其被配置成接收输入以激活所述移动终端上的语音识别功能;
存储器,其被配置成存储与所述移动终端上执行的操作有关的信息;以及
控制器,其被配置成在接收到所述用于激活语音识别功能的输入时激活语音识别功能,以基于所述移动终端上执行的至少一个先前的操作和包括在语音指令中的语言来确定所述输入语音指令的含义,以及基于所述移动终端上执行的至少一个先前操作和包括在所述语音指令中的语言并基于所述输入语音指令的所确定含义匹配与所述移动终端的操作有关的信息的概率,来提供与所述输入语音指令的所确定含义有关的操作。
2.如权利要求1所述的移动终端,其特征在于,所提供的操作不包括中间操作,使得所提供操作的选择导致与所选择的所提供操作对应的功能在不需要选择所不包括的中间操作的情况下被执行。
3.如权利要求1所述的移动终端,其特征在于,与所述语音指令的所确定含义有关的所提供操作包括具有大于预定阈值的概率的所有操作。
4.如权利要求3所述的移动终端,其特征在于,所述预定阈值由所述终端的制造商或所述终端的用户设置。
5.如权利要求3所述的移动终端,其特征在于,所述预定阈值基于所确定数量的操作自动选择。
6.如权利要求1所述的移动终端,其特征在于,所述控制器还被配置成基于所述移动终端的操作状态确定所述输入语音指令的含义。
7.如权利要求1所述的移动终端,其特征在于,与所述输入语音指令的所确定含义有关的所提供操作包括对应于所述输入语音指令的所确定含义的至少一个菜单选项。
8.如权利要求7所述的移动终端,其特征在于,所述控制器还被配置成输出具有高于预定阈值的概率的对应于所述输入语音指令的所确定含义的所有菜单选项。
9.如权利要求8所述的移动终端,其特征在于,所述控制器还被配置成将具有最高概率的对应于所述输入语音指令的所确定含义的菜单选项与其它菜单可分辨地显示。
10.如权利要求9所述的移动终端,其特征在于,所述控制器通过有差别地控制具有最高概率的菜单选项的大小、显示位置、颜色、对比度和突出显示信息中的至少一个来可分辨地显示具有最高概率的对应于所述输入语音指令的所确定含义的菜单选项。
11.如权利要求1所述的移动终端,其特征在于,所述输入单元包括以下单元中的至少一个:1)被触摸以激活所述语音识别功能的触摸软按钮,2)被按下或操纵以激活所述语音识别功能的硬按钮,3)包括在所述输入单元中的触摸屏的被触摸以激活所述语音识别功能的任意位置,4)被输入以激活所述语音识别功能的撞击声,5)局部区域无线电信号或遥控区域无线电信号,以及6)来自用户的肢体信息信号。
12.如权利要求1所述的移动终端,其特征在于,还包括:
第一数据库,配置成存储由所述控制器用来识别所述语音指令的语音或发音信息;
第二数据库,配置成存储由所述控制器用来识别所述语音指令的词、关键词或句子信息;
第三数据库,配置成存储与所述移动终端的功能或菜单有关的信息;以及
第四数据库,配置成存储要被输出以通知用户所述控制器试图确定所识别语音指令的含义的帮助信息。
13.如权利要求1所述的移动终端,其特征在于,
所述控制器还被配置成输出指示所述语音识别功能处于激活状态的音频或视频信息。
14.一种控制移动终端的方法,所述方法包括:
接收用于激活所述移动终端的语音识别功能的输入;
在接收所述用于激活语音识别功能的输入后激活所述语音识别功能;以及
基于所述移动终端上执行的至少一个先前操作和包括在语音指令中的语言,并基于所述输入语音指令的所确定含义匹配与所述移动终端的操作有关的信息的概率,来提供与输入语音指令的所确定含义有关的操作。
15.如权利要求14所述的方法,其特征在于,所提供操作不包括中间操作,使得所提供操作的选择导致与所选择的所提供操作对应的功能在不需要选择所不包括的中间操作的情况下被执行。
16.如权利要求14所述的方法,其特征在于,与所述语音指令的所确定含义有关的所提供操作包括具有大于预定阈值的概率的所有操作。
17.如权利要求16所述的方法,其特征在于,所述预定阈值由所述终端的制造商或所述终端的用户设置。
18.如权利要求16所述的方法,其特征在于,所述预定阈值基于确定数量的操作自动选择。
19.如权利要求14所述的方法,其特征在于,还包括:
基于所述移动终端上执行的至少一个在前操作和包括在所述语音指令中的语言来确定所述输入语音指令的含义。
20.如权利要求19所述的方法,其特征在于,还包括:
基于所述移动终端的操作状态确定所述输入语音指令的含义。
21.如权利要求20所述的方法,其特征在于,与所述输入语音指令的所确定含义有关的所提供操作包括对应于所述输入语音指令的所确定含义的至少一个菜单选项。
22.如权利要求21所述的方法,其特征在于,还包括:
输出具有高于预定阈值的概率的对应于所述输入语音指令的所确定含义的所有菜单选项。
23.如权利要求22所述的方法,其特征在于,还包括:
将具有最高概率的对应于所述输入语音指令的所确定含义的菜单选项与其它菜单可分辨地显示。
24.如权利要求23所述的方法,其特征在于,所述显示步骤通过有差别地控制具有最高概率的菜单选项的大小、显示位置、颜色、对比度和突出显示信息中的至少一个来可分辨地显示具有最高概率的对应于所述输入语音指令的所确定含义的菜单选项。
25.如权利要求14所述的方法,其特征在于,所述输入步骤包括利用以下中的至少一个激活语音识别功能:1)被触摸以激活所述语音识别功能的触摸软按钮,2)被按下或操纵以激活所述语音识别功能的硬按钮,3)包括在所述输入单元中的触摸屏的被触摸以激活所述语音识别功能的任意位置,4)被输入以激活所述语音识别功能的撞击声,5)局部区域无线电信号或遥控区域无线电信号,以及6)来自用户的肢体信息信号。
26.如权利要求14所述的方法,其特征在于,还包括:
输出指示所述语音识别功能处于激活状态的音频或视频信息。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020080032842A KR20090107365A (ko) | 2008-04-08 | 2008-04-08 | 이동 단말기 및 그 메뉴 제어방법 |
KR10-2008-0032842 | 2008-04-08 | ||
KR1020080032842 | 2008-04-08 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101557651A true CN101557651A (zh) | 2009-10-14 |
CN101557651B CN101557651B (zh) | 2012-12-12 |
Family
ID=40445594
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN200810127912XA Active CN101557651B (zh) | 2008-04-08 | 2008-07-02 | 移动终端及其菜单控制方法 |
Country Status (6)
Country | Link |
---|---|
US (2) | US8150700B2 (zh) |
EP (1) | EP2109298B1 (zh) |
JP (1) | JP5481058B2 (zh) |
KR (1) | KR20090107365A (zh) |
CN (1) | CN101557651B (zh) |
RU (1) | RU2394386C2 (zh) |
Cited By (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102883041A (zh) * | 2012-08-02 | 2013-01-16 | 聚熵信息技术(上海)有限公司 | 移动终端的语音控制装置及方法 |
CN103295571A (zh) * | 2012-02-29 | 2013-09-11 | 辉达公司 | 使用时间和/或频谱压缩的音频命令的控制 |
CN103578472A (zh) * | 2012-08-10 | 2014-02-12 | 海尔集团公司 | 电器设备的控制方法和控制装置 |
CN103593134A (zh) * | 2012-08-17 | 2014-02-19 | 上海博泰悦臻电子设备制造有限公司 | 车载设备和语音功能的控制方法 |
CN103593081A (zh) * | 2012-08-17 | 2014-02-19 | 上海博泰悦臻电子设备制造有限公司 | 车载设备和语音功能的控制方法 |
WO2014078980A1 (zh) * | 2012-11-20 | 2014-05-30 | 华为终端有限公司 | 一种语音响应的方法及移动设备 |
CN103869948A (zh) * | 2012-12-14 | 2014-06-18 | 联想(北京)有限公司 | 语音命令处理方法和电子设备 |
CN104796527A (zh) * | 2014-01-17 | 2015-07-22 | Lg电子株式会社 | 移动终端及其控制方法 |
CN104917904A (zh) * | 2014-03-14 | 2015-09-16 | 联想(北京)有限公司 | 一种语音信息处理方法、装置和电子设备 |
CN105472145A (zh) * | 2013-03-15 | 2016-04-06 | 株式会社Adesign | 锁定模式下利用语音信号连接呼叫的具有控制功能的移动设备 |
CN106683675A (zh) * | 2017-02-08 | 2017-05-17 | 张建华 | 一种控制方法及语音操作系统 |
CN107544827A (zh) * | 2017-08-23 | 2018-01-05 | 金蝶软件(中国)有限公司 | 一种功能调用的方法及相关装置 |
CN107945806A (zh) * | 2017-11-10 | 2018-04-20 | 北京小米移动软件有限公司 | 基于声音特征的用户识别方法及装置 |
WO2018196231A1 (zh) * | 2017-04-26 | 2018-11-01 | 海信集团有限公司 | 智能终端显示用户操控指令的方法和智能终端 |
CN109887487A (zh) * | 2019-01-29 | 2019-06-14 | 北京声智科技有限公司 | 一种数据筛选方法、装置及电子设备 |
CN109976702A (zh) * | 2019-03-20 | 2019-07-05 | 青岛海信电器股份有限公司 | 一种语音识别方法、装置及终端 |
CN110265030A (zh) * | 2012-01-09 | 2019-09-20 | 三星电子株式会社 | 图像显示设备及控制图像显示设备的方法 |
CN112397069A (zh) * | 2021-01-19 | 2021-02-23 | 成都启英泰伦科技有限公司 | 一种语音遥控方法及装置 |
CN112700774A (zh) * | 2014-01-21 | 2021-04-23 | 三星电子株式会社 | 电子设备及其语音识别方法 |
Families Citing this family (256)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8645137B2 (en) | 2000-03-16 | 2014-02-04 | Apple Inc. | Fast, language-independent method for user authentication by voice |
US8677377B2 (en) | 2005-09-08 | 2014-03-18 | Apple Inc. | Method and apparatus for building an intelligent automated assistant |
US9318108B2 (en) | 2010-01-18 | 2016-04-19 | Apple Inc. | Intelligent automated assistant |
US8977255B2 (en) | 2007-04-03 | 2015-03-10 | Apple Inc. | Method and system for operating a multi-function portable electronic device using voice-activation |
US10002189B2 (en) | 2007-12-20 | 2018-06-19 | Apple Inc. | Method and apparatus for searching using an active ontology |
US9330720B2 (en) | 2008-01-03 | 2016-05-03 | Apple Inc. | Methods and apparatus for altering audio output signals |
US8996376B2 (en) | 2008-04-05 | 2015-03-31 | Apple Inc. | Intelligent text-to-speech conversion |
KR20090107365A (ko) * | 2008-04-08 | 2009-10-13 | 엘지전자 주식회사 | 이동 단말기 및 그 메뉴 제어방법 |
US10496753B2 (en) | 2010-01-18 | 2019-12-03 | Apple Inc. | Automatically adapting user interfaces for hands-free interaction |
US20100030549A1 (en) | 2008-07-31 | 2010-02-04 | Lee Michael M | Mobile device having human language translation capability with positional feedback |
US8676904B2 (en) | 2008-10-02 | 2014-03-18 | Apple Inc. | Electronic devices with voice command and contextual data processing capabilities |
WO2010067118A1 (en) | 2008-12-11 | 2010-06-17 | Novauris Technologies Limited | Speech recognition involving a mobile device |
KR101566379B1 (ko) * | 2009-05-07 | 2015-11-13 | 삼성전자주식회사 | 입력 신호 종류 별 사용자 기능 활성화 방법 및 이를 지원하는 휴대 단말기 |
US10706373B2 (en) | 2011-06-03 | 2020-07-07 | Apple Inc. | Performing actions associated with task items that represent tasks to perform |
US10241752B2 (en) | 2011-09-30 | 2019-03-26 | Apple Inc. | Interface for a virtual digital assistant |
US10241644B2 (en) | 2011-06-03 | 2019-03-26 | Apple Inc. | Actionable reminder entries |
US9858925B2 (en) | 2009-06-05 | 2018-01-02 | Apple Inc. | Using context information to facilitate processing of commands in a virtual assistant |
US9431006B2 (en) | 2009-07-02 | 2016-08-30 | Apple Inc. | Methods and apparatuses for automatic speech recognition |
US10276170B2 (en) | 2010-01-18 | 2019-04-30 | Apple Inc. | Intelligent automated assistant |
US10679605B2 (en) | 2010-01-18 | 2020-06-09 | Apple Inc. | Hands-free list-reading by intelligent automated assistant |
US10705794B2 (en) | 2010-01-18 | 2020-07-07 | Apple Inc. | Automatically adapting user interfaces for hands-free interaction |
US10553209B2 (en) | 2010-01-18 | 2020-02-04 | Apple Inc. | Systems and methods for hands-free notification summaries |
WO2011089450A2 (en) | 2010-01-25 | 2011-07-28 | Andrew Peter Nelson Jerram | Apparatuses, methods and systems for a digital conversation management platform |
US8682667B2 (en) | 2010-02-25 | 2014-03-25 | Apple Inc. | User profiling for selecting user specific voice input processing information |
US20110246194A1 (en) * | 2010-03-30 | 2011-10-06 | Nvoq Incorporated | Indicia to indicate a dictation application is capable of receiving audio |
US8738377B2 (en) * | 2010-06-07 | 2014-05-27 | Google Inc. | Predicting and learning carrier phrases for speech input |
US8296151B2 (en) * | 2010-06-18 | 2012-10-23 | Microsoft Corporation | Compound gesture-speech commands |
US20130215079A1 (en) * | 2010-11-09 | 2013-08-22 | Koninklijke Philips Electronics N.V. | User interface with haptic feedback |
US10762293B2 (en) | 2010-12-22 | 2020-09-01 | Apple Inc. | Using parts-of-speech tagging and named entity recognition for spelling correction |
KR101802522B1 (ko) * | 2011-02-10 | 2017-11-29 | 삼성전자주식회사 | 복수의 터치스크린을 가지는 장치 및 복수의 터치스크린을 가지는 장치의 화면변경방법 |
JP5039214B2 (ja) * | 2011-02-17 | 2012-10-03 | 株式会社東芝 | 音声認識操作装置及び音声認識操作方法 |
US8630860B1 (en) * | 2011-03-03 | 2014-01-14 | Nuance Communications, Inc. | Speaker and call characteristic sensitive open voice search |
CN102685307A (zh) * | 2011-03-15 | 2012-09-19 | 中兴通讯股份有限公司 | 命令信息处理方法、装置及系统 |
US9262612B2 (en) | 2011-03-21 | 2016-02-16 | Apple Inc. | Device access using voice authentication |
EP2506202A1 (en) * | 2011-03-29 | 2012-10-03 | Research In Motion Limited | Mobile wireless communications device for selecting a payment account to use with a payment processing system based upon a microphone or device profile and associated methods |
JP2015039071A (ja) * | 2011-03-30 | 2015-02-26 | 株式会社東芝 | 音声認識操作装置及び音声認識操作方法 |
US20120304067A1 (en) * | 2011-05-25 | 2012-11-29 | Samsung Electronics Co., Ltd. | Apparatus and method for controlling user interface using sound recognition |
US10057736B2 (en) | 2011-06-03 | 2018-08-21 | Apple Inc. | Active transport based notifications |
US8994660B2 (en) | 2011-08-29 | 2015-03-31 | Apple Inc. | Text correction processing |
KR20130032966A (ko) | 2011-09-26 | 2013-04-03 | 엘지전자 주식회사 | 사용자 인터페이스 방법 및 장치 |
US9992745B2 (en) | 2011-11-01 | 2018-06-05 | Qualcomm Incorporated | Extraction and analysis of buffered audio data using multiple codec rates each greater than a low-power processor rate |
WO2013085507A1 (en) | 2011-12-07 | 2013-06-13 | Hewlett-Packard Development Company, L.P. | Low power integrated circuit to analyze a digitized audio stream |
KR101889836B1 (ko) | 2012-02-24 | 2018-08-20 | 삼성전자주식회사 | 음성인식을 통한 단말기의 잠금 상태 해제 및 조작 방법 및 장치 |
JP5814823B2 (ja) * | 2012-02-28 | 2015-11-17 | 京セラ株式会社 | 携帯端末、特定モード設定プログラムおよび特定モード設定方法 |
US10134385B2 (en) | 2012-03-02 | 2018-11-20 | Apple Inc. | Systems and methods for name pronunciation |
US9483461B2 (en) | 2012-03-06 | 2016-11-01 | Apple Inc. | Handling speech synthesis of content for multiple languages |
WO2013162414A1 (ru) * | 2012-04-23 | 2013-10-31 | Janovskiy Igor Vladimirovich | Терминал беспроводной голосовой связи |
JP2013238935A (ja) * | 2012-05-11 | 2013-11-28 | Sharp Corp | 入力装置、入力装置の制御方法、制御プログラム、および記録媒体 |
US9280610B2 (en) | 2012-05-14 | 2016-03-08 | Apple Inc. | Crowd sourcing information to fulfill user requests |
US10417037B2 (en) | 2012-05-15 | 2019-09-17 | Apple Inc. | Systems and methods for integrating third party services with a digital assistant |
US9721563B2 (en) | 2012-06-08 | 2017-08-01 | Apple Inc. | Name recognition system |
US9495129B2 (en) | 2012-06-29 | 2016-11-15 | Apple Inc. | Device, method, and user interface for voice-activated navigation and browsing of a document |
US9781262B2 (en) * | 2012-08-02 | 2017-10-03 | Nuance Communications, Inc. | Methods and apparatus for voice-enabling a web application |
US10157612B2 (en) | 2012-08-02 | 2018-12-18 | Nuance Communications, Inc. | Methods and apparatus for voice-enabling a web application |
US9292253B2 (en) | 2012-08-02 | 2016-03-22 | Nuance Communications, Inc. | Methods and apparatus for voiced-enabling a web application |
US9400633B2 (en) * | 2012-08-02 | 2016-07-26 | Nuance Communications, Inc. | Methods and apparatus for voiced-enabling a web application |
US9292252B2 (en) | 2012-08-02 | 2016-03-22 | Nuance Communications, Inc. | Methods and apparatus for voiced-enabling a web application |
US9576574B2 (en) | 2012-09-10 | 2017-02-21 | Apple Inc. | Context-sensitive handling of interruptions by intelligent digital assistant |
US9547647B2 (en) | 2012-09-19 | 2017-01-17 | Apple Inc. | Voice-based media searching |
JP6068901B2 (ja) * | 2012-09-26 | 2017-01-25 | 京セラ株式会社 | 情報端末、音声操作プログラムおよび音声操作方法 |
US8468023B1 (en) | 2012-10-01 | 2013-06-18 | Google Inc. | Handsfree device with countinuous keyword recognition |
JP6133564B2 (ja) | 2012-10-05 | 2017-05-24 | 京セラ株式会社 | 電子機器、制御方法、及び制御プログラム |
CN103871401B (zh) * | 2012-12-10 | 2016-12-28 | 联想(北京)有限公司 | 一种语音识别的方法及电子设备 |
JPWO2014103568A1 (ja) | 2012-12-28 | 2017-01-12 | ソニー株式会社 | 情報処理装置、情報処理方法、およびプログラム |
KR101732137B1 (ko) | 2013-01-07 | 2017-05-02 | 삼성전자주식회사 | 원격 제어 장치 및 전력 제어 방법 |
CN113470641B (zh) | 2013-02-07 | 2023-12-15 | 苹果公司 | 数字助理的语音触发器 |
KR102057629B1 (ko) * | 2013-02-19 | 2020-01-22 | 엘지전자 주식회사 | 이동 단말기 및 이동 단말기의 제어 방법 |
US9734819B2 (en) | 2013-02-21 | 2017-08-15 | Google Technology Holdings LLC | Recognizing accented speech |
EP2962403A4 (en) * | 2013-02-27 | 2016-11-16 | Knowles Electronics Llc | LANGUAGE-CONTROLLED COMMUNICATION CONNECTIONS |
US9368114B2 (en) | 2013-03-14 | 2016-06-14 | Apple Inc. | Context-sensitive handling of interruptions |
US10652394B2 (en) | 2013-03-14 | 2020-05-12 | Apple Inc. | System and method for processing voicemail |
WO2014144579A1 (en) | 2013-03-15 | 2014-09-18 | Apple Inc. | System and method for updating an adaptive speech recognition model |
US10748529B1 (en) | 2013-03-15 | 2020-08-18 | Apple Inc. | Voice activated device for use with a voice-based digital assistant |
US9661136B2 (en) | 2013-03-15 | 2017-05-23 | Adesign | Mobile device having function of controlling call connection in lock mode by using voice signal |
WO2014144949A2 (en) | 2013-03-15 | 2014-09-18 | Apple Inc. | Training an at least partial voice command system |
WO2014197336A1 (en) | 2013-06-07 | 2014-12-11 | Apple Inc. | System and method for detecting errors in interactions with a voice-based digital assistant |
US9582608B2 (en) | 2013-06-07 | 2017-02-28 | Apple Inc. | Unified ranking with entropy-weighted information for phrase-based semantic auto-completion |
WO2014197334A2 (en) | 2013-06-07 | 2014-12-11 | Apple Inc. | System and method for user-specified pronunciation of words for speech synthesis and recognition |
WO2014197335A1 (en) | 2013-06-08 | 2014-12-11 | Apple Inc. | Interpreting and acting upon commands that involve sharing information with remote devices |
US10176167B2 (en) | 2013-06-09 | 2019-01-08 | Apple Inc. | System and method for inferring user intent from speech inputs |
KR101772152B1 (ko) | 2013-06-09 | 2017-08-28 | 애플 인크. | 디지털 어시스턴트의 둘 이상의 인스턴스들에 걸친 대화 지속성을 가능하게 하기 위한 디바이스, 방법 및 그래픽 사용자 인터페이스 |
CN105265005B (zh) | 2013-06-13 | 2019-09-17 | 苹果公司 | 用于由语音命令发起的紧急呼叫的系统和方法 |
CN105453026A (zh) | 2013-08-06 | 2016-03-30 | 苹果公司 | 基于来自远程设备的活动自动激活智能响应 |
GB2518002B (en) * | 2013-09-10 | 2017-03-29 | Jaguar Land Rover Ltd | Vehicle interface system |
US9508345B1 (en) | 2013-09-24 | 2016-11-29 | Knowles Electronics, Llc | Continuous voice sensing |
KR102155482B1 (ko) | 2013-10-15 | 2020-09-14 | 삼성전자 주식회사 | 디스플레이장치 및 그 제어방법 |
US9532155B1 (en) | 2013-11-20 | 2016-12-27 | Knowles Electronics, Llc | Real time monitoring of acoustic environments using ultrasound |
US10296160B2 (en) | 2013-12-06 | 2019-05-21 | Apple Inc. | Method for extracting salient dialog usage from live data |
CN104754203B (zh) * | 2013-12-31 | 2018-07-31 | 华为技术有限公司 | 拍摄方法、装置及终端 |
US9462169B2 (en) | 2013-12-31 | 2016-10-04 | Huawei Technologies Co., Ltd. | Shooting method, apparatus, and terminal |
US9437188B1 (en) | 2014-03-28 | 2016-09-06 | Knowles Electronics, Llc | Buffered reprocessing for multi-microphone automatic speech recognition assist |
US9620105B2 (en) | 2014-05-15 | 2017-04-11 | Apple Inc. | Analyzing audio input for efficient speech and music recognition |
US10592095B2 (en) | 2014-05-23 | 2020-03-17 | Apple Inc. | Instantaneous speaking of content on touch devices |
US9502031B2 (en) | 2014-05-27 | 2016-11-22 | Apple Inc. | Method for supporting dynamic grammars in WFST-based ASR |
US10170123B2 (en) | 2014-05-30 | 2019-01-01 | Apple Inc. | Intelligent assistant for home automation |
WO2015184186A1 (en) | 2014-05-30 | 2015-12-03 | Apple Inc. | Multi-command single utterance input method |
US9734193B2 (en) | 2014-05-30 | 2017-08-15 | Apple Inc. | Determining domain salience ranking from ambiguous words in natural speech |
US9842101B2 (en) | 2014-05-30 | 2017-12-12 | Apple Inc. | Predictive conversion of language input |
US9633004B2 (en) | 2014-05-30 | 2017-04-25 | Apple Inc. | Better resolution when referencing to concepts |
US9785630B2 (en) | 2014-05-30 | 2017-10-10 | Apple Inc. | Text prediction using combined word N-gram and unigram language models |
US9430463B2 (en) | 2014-05-30 | 2016-08-30 | Apple Inc. | Exemplar-based natural language processing |
US10078631B2 (en) | 2014-05-30 | 2018-09-18 | Apple Inc. | Entropy-guided text prediction using combined word and character n-gram language models |
US9760559B2 (en) | 2014-05-30 | 2017-09-12 | Apple Inc. | Predictive text input |
US9715875B2 (en) | 2014-05-30 | 2017-07-25 | Apple Inc. | Reducing the need for manual start/end-pointing and trigger phrases |
US10289433B2 (en) | 2014-05-30 | 2019-05-14 | Apple Inc. | Domain specific language for encoding assistant dialog |
WO2015188327A1 (zh) * | 2014-06-11 | 2015-12-17 | 华为技术有限公司 | 快速启动应用服务的方法和终端 |
US9338493B2 (en) | 2014-06-30 | 2016-05-10 | Apple Inc. | Intelligent automated assistant for TV user interactions |
US10659851B2 (en) | 2014-06-30 | 2020-05-19 | Apple Inc. | Real-time digital assistant knowledge updates |
KR102367132B1 (ko) * | 2014-07-31 | 2022-02-25 | 삼성전자주식회사 | 디바이스 및 디바이스의 기능 수행 방법 |
WO2016017978A1 (en) * | 2014-07-31 | 2016-02-04 | Samsung Electronics Co., Ltd. | Device and method for performing functions |
KR20160016491A (ko) * | 2014-07-31 | 2016-02-15 | 삼성전자주식회사 | 디바이스 및 디바이스의 기능 수행 방법 |
US10446141B2 (en) | 2014-08-28 | 2019-10-15 | Apple Inc. | Automatic speech recognition based on user feedback |
US10078382B2 (en) * | 2014-09-04 | 2018-09-18 | Home Box Office, Inc. | Unified input and invoke handling |
US10044591B2 (en) | 2014-09-04 | 2018-08-07 | Home Box Office, Inc. | Two-way remote communication system for testing a client device program |
RU2601152C2 (ru) | 2014-09-09 | 2016-10-27 | ХЕРЕ Глобал Б.В. | Устройство, способ и компьютерная программа для обеспечения предоставления информации пользователю |
US9818400B2 (en) | 2014-09-11 | 2017-11-14 | Apple Inc. | Method and apparatus for discovering trending terms in speech requests |
US10789041B2 (en) | 2014-09-12 | 2020-09-29 | Apple Inc. | Dynamic thresholds for always listening speech trigger |
CN104267922B (zh) * | 2014-09-16 | 2019-05-31 | 联想(北京)有限公司 | 一种信息处理方法及电子设备 |
US9668121B2 (en) | 2014-09-30 | 2017-05-30 | Apple Inc. | Social reminders |
US10074360B2 (en) | 2014-09-30 | 2018-09-11 | Apple Inc. | Providing an indication of the suitability of speech recognition |
US9886432B2 (en) | 2014-09-30 | 2018-02-06 | Apple Inc. | Parsimonious handling of word inflection via categorical stem + suffix N-gram language models |
US9646609B2 (en) | 2014-09-30 | 2017-05-09 | Apple Inc. | Caching apparatus for serving phonetic pronunciations |
US10127911B2 (en) | 2014-09-30 | 2018-11-13 | Apple Inc. | Speaker identification and unsupervised speaker adaptation techniques |
US10552013B2 (en) | 2014-12-02 | 2020-02-04 | Apple Inc. | Data detection |
US10444977B2 (en) * | 2014-12-05 | 2019-10-15 | Verizon Patent And Licensing Inc. | Cellphone manager |
US9711141B2 (en) | 2014-12-09 | 2017-07-18 | Apple Inc. | Disambiguating heteronyms in speech synthesis |
KR20160089782A (ko) * | 2015-01-20 | 2016-07-28 | 엘지전자 주식회사 | 이동 단말기 및 그 제어 방법 |
US9865280B2 (en) | 2015-03-06 | 2018-01-09 | Apple Inc. | Structured dictation using intelligent automated assistants |
US10152299B2 (en) | 2015-03-06 | 2018-12-11 | Apple Inc. | Reducing response latency of intelligent automated assistants |
US9721566B2 (en) | 2015-03-08 | 2017-08-01 | Apple Inc. | Competing devices responding to voice triggers |
US10567477B2 (en) | 2015-03-08 | 2020-02-18 | Apple Inc. | Virtual assistant continuity |
US9886953B2 (en) | 2015-03-08 | 2018-02-06 | Apple Inc. | Virtual assistant activation |
US9899019B2 (en) | 2015-03-18 | 2018-02-20 | Apple Inc. | Systems and methods for structured stem and suffix language models |
CN106155504B (zh) * | 2015-03-26 | 2019-09-10 | 小米科技有限责任公司 | 模组唤醒方法及装置 |
US9842105B2 (en) | 2015-04-16 | 2017-12-12 | Apple Inc. | Parsimonious continuous-space phrase representations for natural language processing |
US10460227B2 (en) | 2015-05-15 | 2019-10-29 | Apple Inc. | Virtual assistant in a communication session |
US10200824B2 (en) | 2015-05-27 | 2019-02-05 | Apple Inc. | Systems and methods for proactively identifying and surfacing relevant content on a touch-sensitive device |
US10083688B2 (en) | 2015-05-27 | 2018-09-25 | Apple Inc. | Device voice control for selecting a displayed affordance |
KR20160142528A (ko) * | 2015-06-03 | 2016-12-13 | 엘지전자 주식회사 | 단말 장치, 네트워크 시스템 및 그 제어 방법 |
US10127220B2 (en) | 2015-06-04 | 2018-11-13 | Apple Inc. | Language identification from short strings |
US10101822B2 (en) | 2015-06-05 | 2018-10-16 | Apple Inc. | Language input correction |
US9578173B2 (en) | 2015-06-05 | 2017-02-21 | Apple Inc. | Virtual assistant aided communication with 3rd party service in a communication session |
US10186254B2 (en) | 2015-06-07 | 2019-01-22 | Apple Inc. | Context-based endpoint detection |
US10255907B2 (en) | 2015-06-07 | 2019-04-09 | Apple Inc. | Automatic accent detection using acoustic models |
US11025565B2 (en) | 2015-06-07 | 2021-06-01 | Apple Inc. | Personalized prediction of responses for instant messaging |
US20160378747A1 (en) | 2015-06-29 | 2016-12-29 | Apple Inc. | Virtual assistant for media playback |
US9407989B1 (en) | 2015-06-30 | 2016-08-02 | Arthur Woodrow | Closed audio circuit |
US10747498B2 (en) | 2015-09-08 | 2020-08-18 | Apple Inc. | Zero latency digital assistant |
US10671428B2 (en) | 2015-09-08 | 2020-06-02 | Apple Inc. | Distributed personal assistant |
US10740384B2 (en) | 2015-09-08 | 2020-08-11 | Apple Inc. | Intelligent automated assistant for media search and playback |
US10331312B2 (en) | 2015-09-08 | 2019-06-25 | Apple Inc. | Intelligent automated assistant in a media environment |
US9697820B2 (en) | 2015-09-24 | 2017-07-04 | Apple Inc. | Unit-selection text-to-speech synthesis using concatenation-sensitive neural networks |
US10366158B2 (en) | 2015-09-29 | 2019-07-30 | Apple Inc. | Efficient word encoding for recurrent neural network language models |
US11010550B2 (en) | 2015-09-29 | 2021-05-18 | Apple Inc. | Unified language modeling framework for word prediction, auto-completion and auto-correction |
US11587559B2 (en) | 2015-09-30 | 2023-02-21 | Apple Inc. | Intelligent device identification |
US10691473B2 (en) | 2015-11-06 | 2020-06-23 | Apple Inc. | Intelligent automated assistant in a messaging environment |
US10956666B2 (en) | 2015-11-09 | 2021-03-23 | Apple Inc. | Unconventional virtual assistant interactions |
US10049668B2 (en) | 2015-12-02 | 2018-08-14 | Apple Inc. | Applying neural network language models to weighted finite state transducers for automatic speech recognition |
US10223066B2 (en) | 2015-12-23 | 2019-03-05 | Apple Inc. | Proactive assistance based on dialog communication between devices |
JP2017146437A (ja) * | 2016-02-17 | 2017-08-24 | 本田技研工業株式会社 | 音声入力処理装置 |
US10446143B2 (en) | 2016-03-14 | 2019-10-15 | Apple Inc. | Identification of voice inputs providing credentials |
US11176930B1 (en) * | 2016-03-28 | 2021-11-16 | Amazon Technologies, Inc. | Storing audio commands for time-delayed execution |
US9934775B2 (en) | 2016-05-26 | 2018-04-03 | Apple Inc. | Unit-selection text-to-speech synthesis based on predicted concatenation parameters |
US9972304B2 (en) | 2016-06-03 | 2018-05-15 | Apple Inc. | Privacy preserving distributed evaluation framework for embedded personalized systems |
US11227589B2 (en) | 2016-06-06 | 2022-01-18 | Apple Inc. | Intelligent list reading |
US10249300B2 (en) | 2016-06-06 | 2019-04-02 | Apple Inc. | Intelligent list reading |
US10049663B2 (en) | 2016-06-08 | 2018-08-14 | Apple, Inc. | Intelligent automated assistant for media exploration |
DK179309B1 (en) | 2016-06-09 | 2018-04-23 | Apple Inc | Intelligent automated assistant in a home environment |
US10067938B2 (en) | 2016-06-10 | 2018-09-04 | Apple Inc. | Multilingual word prediction |
US10490187B2 (en) | 2016-06-10 | 2019-11-26 | Apple Inc. | Digital assistant providing automated status report |
US10586535B2 (en) | 2016-06-10 | 2020-03-10 | Apple Inc. | Intelligent digital assistant in a multi-tasking environment |
US10192552B2 (en) | 2016-06-10 | 2019-01-29 | Apple Inc. | Digital assistant providing whispered speech |
US10509862B2 (en) | 2016-06-10 | 2019-12-17 | Apple Inc. | Dynamic phrase expansion of language input |
DK201670540A1 (en) | 2016-06-11 | 2018-01-08 | Apple Inc | Application integration with a digital assistant |
DK179415B1 (en) | 2016-06-11 | 2018-06-14 | Apple Inc | Intelligent device arbitration and control |
DK179049B1 (en) | 2016-06-11 | 2017-09-18 | Apple Inc | Data driven natural language event detection and classification |
DK179343B1 (en) | 2016-06-11 | 2018-05-14 | Apple Inc | Intelligent task discovery |
US20180039478A1 (en) * | 2016-08-02 | 2018-02-08 | Google Inc. | Voice interaction services |
US10261752B2 (en) | 2016-08-02 | 2019-04-16 | Google Llc | Component libraries for voice interaction services |
US10474753B2 (en) | 2016-09-07 | 2019-11-12 | Apple Inc. | Language identification using recurrent neural networks |
US10043516B2 (en) | 2016-09-23 | 2018-08-07 | Apple Inc. | Intelligent automated assistant |
WO2018079379A1 (ja) | 2016-10-27 | 2018-05-03 | 株式会社Nttドコモ | 通信端末装置、プログラム及び情報処理方法 |
KR102594022B1 (ko) | 2016-11-24 | 2023-10-26 | 삼성전자주식회사 | 전자 장치 및 그의 채널맵 업데이트 방법 |
US11281993B2 (en) | 2016-12-05 | 2022-03-22 | Apple Inc. | Model and ensemble compression for metric learning |
US10593346B2 (en) | 2016-12-22 | 2020-03-17 | Apple Inc. | Rank-reduced token representation for automatic speech recognition |
US11204787B2 (en) | 2017-01-09 | 2021-12-21 | Apple Inc. | Application integration with a digital assistant |
US10353480B2 (en) | 2017-04-17 | 2019-07-16 | Essential Products, Inc. | Connecting assistant device to devices |
US10355931B2 (en) * | 2017-04-17 | 2019-07-16 | Essential Products, Inc. | Troubleshooting voice-enabled home setup |
US10417266B2 (en) | 2017-05-09 | 2019-09-17 | Apple Inc. | Context-aware ranking of intelligent response suggestions |
DK201770383A1 (en) | 2017-05-09 | 2018-12-14 | Apple Inc. | USER INTERFACE FOR CORRECTING RECOGNITION ERRORS |
DK201770439A1 (en) | 2017-05-11 | 2018-12-13 | Apple Inc. | Offline personal assistant |
US10395654B2 (en) | 2017-05-11 | 2019-08-27 | Apple Inc. | Text normalization based on a data-driven learning network |
US10726832B2 (en) | 2017-05-11 | 2020-07-28 | Apple Inc. | Maintaining privacy of personal information |
DK180048B1 (en) | 2017-05-11 | 2020-02-04 | Apple Inc. | MAINTAINING THE DATA PROTECTION OF PERSONAL INFORMATION |
DK179745B1 (en) | 2017-05-12 | 2019-05-01 | Apple Inc. | SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT |
DK201770429A1 (en) | 2017-05-12 | 2018-12-14 | Apple Inc. | LOW-LATENCY INTELLIGENT AUTOMATED ASSISTANT |
DK179496B1 (en) | 2017-05-12 | 2019-01-15 | Apple Inc. | USER-SPECIFIC Acoustic Models |
US11301477B2 (en) | 2017-05-12 | 2022-04-12 | Apple Inc. | Feedback analysis of a digital assistant |
DK201770431A1 (en) | 2017-05-15 | 2018-12-20 | Apple Inc. | Optimizing dialogue policy decisions for digital assistants using implicit feedback |
DK201770411A1 (en) | 2017-05-15 | 2018-12-20 | Apple Inc. | MULTI-MODAL INTERFACES |
DK201770432A1 (en) | 2017-05-15 | 2018-12-21 | Apple Inc. | Hierarchical belief states for digital assistants |
US10311144B2 (en) | 2017-05-16 | 2019-06-04 | Apple Inc. | Emoji word sense disambiguation |
US10303715B2 (en) | 2017-05-16 | 2019-05-28 | Apple Inc. | Intelligent automated assistant for media exploration |
DK179560B1 (en) | 2017-05-16 | 2019-02-18 | Apple Inc. | FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES |
US10403278B2 (en) | 2017-05-16 | 2019-09-03 | Apple Inc. | Methods and systems for phonetic matching in digital assistant services |
US20180336892A1 (en) | 2017-05-16 | 2018-11-22 | Apple Inc. | Detecting a trigger of a digital assistant |
US10657328B2 (en) | 2017-06-02 | 2020-05-19 | Apple Inc. | Multi-task recurrent neural network architecture for efficient morphology handling in neural language modeling |
JP6914154B2 (ja) * | 2017-09-15 | 2021-08-04 | シャープ株式会社 | 表示制御装置、表示制御方法及びプログラム |
US10445429B2 (en) | 2017-09-21 | 2019-10-15 | Apple Inc. | Natural language understanding using vocabularies with compressed serialized tries |
US10755051B2 (en) | 2017-09-29 | 2020-08-25 | Apple Inc. | Rule-based natural language processing |
CN207199277U (zh) * | 2017-10-11 | 2018-04-06 | 京东方科技集团股份有限公司 | 一种显示装置 |
US10636424B2 (en) | 2017-11-30 | 2020-04-28 | Apple Inc. | Multi-turn canned dialog |
US10733982B2 (en) | 2018-01-08 | 2020-08-04 | Apple Inc. | Multi-directional dialog |
US10733375B2 (en) | 2018-01-31 | 2020-08-04 | Apple Inc. | Knowledge-based framework for improving natural language understanding |
US10789959B2 (en) | 2018-03-02 | 2020-09-29 | Apple Inc. | Training speaker recognition models for digital assistants |
US10592604B2 (en) | 2018-03-12 | 2020-03-17 | Apple Inc. | Inverse text normalization for automatic speech recognition |
US10818288B2 (en) | 2018-03-26 | 2020-10-27 | Apple Inc. | Natural assistant interaction |
US10909331B2 (en) | 2018-03-30 | 2021-02-02 | Apple Inc. | Implicit identification of translation payload with neural machine translation |
US10928918B2 (en) | 2018-05-07 | 2021-02-23 | Apple Inc. | Raise to speak |
US11145294B2 (en) | 2018-05-07 | 2021-10-12 | Apple Inc. | Intelligent automated assistant for delivering content from user experiences |
US10984780B2 (en) | 2018-05-21 | 2021-04-20 | Apple Inc. | Global semantic word embeddings using bi-directional recurrent neural networks |
US10892996B2 (en) | 2018-06-01 | 2021-01-12 | Apple Inc. | Variable latency device coordination |
DK179822B1 (da) | 2018-06-01 | 2019-07-12 | Apple Inc. | Voice interaction at a primary device to access call functionality of a companion device |
DK201870355A1 (en) | 2018-06-01 | 2019-12-16 | Apple Inc. | VIRTUAL ASSISTANT OPERATION IN MULTI-DEVICE ENVIRONMENTS |
US11386266B2 (en) | 2018-06-01 | 2022-07-12 | Apple Inc. | Text correction |
DK180639B1 (en) | 2018-06-01 | 2021-11-04 | Apple Inc | DISABILITY OF ATTENTION-ATTENTIVE VIRTUAL ASSISTANT |
US10496705B1 (en) | 2018-06-03 | 2019-12-03 | Apple Inc. | Accelerated task performance |
FI20185605A1 (en) * | 2018-06-29 | 2019-12-30 | Crf Box Oy | Continuous verification of user identity in clinical trials via audio-based user interface |
US11010561B2 (en) | 2018-09-27 | 2021-05-18 | Apple Inc. | Sentiment prediction from textual data |
US10839159B2 (en) | 2018-09-28 | 2020-11-17 | Apple Inc. | Named entity normalization in a spoken dialog system |
US11462215B2 (en) | 2018-09-28 | 2022-10-04 | Apple Inc. | Multi-modal inputs for voice commands |
US11170166B2 (en) | 2018-09-28 | 2021-11-09 | Apple Inc. | Neural typographical error modeling via generative adversarial networks |
US11475898B2 (en) | 2018-10-26 | 2022-10-18 | Apple Inc. | Low-latency multi-speaker speech recognition |
CN109688474A (zh) * | 2018-12-28 | 2019-04-26 | 南京创维信息技术研究院有限公司 | 电视语音控制方法、装置和计算机可读存储介质 |
US11638059B2 (en) | 2019-01-04 | 2023-04-25 | Apple Inc. | Content playback on multiple devices |
US11348573B2 (en) | 2019-03-18 | 2022-05-31 | Apple Inc. | Multimodality in digital assistant systems |
US11423908B2 (en) | 2019-05-06 | 2022-08-23 | Apple Inc. | Interpreting spoken requests |
US11475884B2 (en) | 2019-05-06 | 2022-10-18 | Apple Inc. | Reducing digital assistant latency when a language is incorrectly determined |
DK201970509A1 (en) | 2019-05-06 | 2021-01-15 | Apple Inc | Spoken notifications |
US11307752B2 (en) | 2019-05-06 | 2022-04-19 | Apple Inc. | User configurable task triggers |
US11140099B2 (en) | 2019-05-21 | 2021-10-05 | Apple Inc. | Providing message response suggestions |
DK180129B1 (en) | 2019-05-31 | 2020-06-02 | Apple Inc. | USER ACTIVITY SHORTCUT SUGGESTIONS |
US11289073B2 (en) | 2019-05-31 | 2022-03-29 | Apple Inc. | Device text to speech |
DK201970510A1 (en) | 2019-05-31 | 2021-02-11 | Apple Inc | Voice identification in digital assistant systems |
US11496600B2 (en) | 2019-05-31 | 2022-11-08 | Apple Inc. | Remote execution of machine-learned models |
US11360641B2 (en) | 2019-06-01 | 2022-06-14 | Apple Inc. | Increasing the relevance of new available information |
US11468890B2 (en) | 2019-06-01 | 2022-10-11 | Apple Inc. | Methods and user interfaces for voice-based control of electronic devices |
US11449308B2 (en) * | 2019-07-19 | 2022-09-20 | Google Llc | Condensed spoken utterances for automated assistant control of an intricate application GUI |
JP7237356B2 (ja) * | 2019-08-28 | 2023-03-13 | 株式会社トーアエンジニアリング | Cad制御支援システム |
WO2021056255A1 (en) | 2019-09-25 | 2021-04-01 | Apple Inc. | Text detection using global geometry estimators |
JP7447458B2 (ja) * | 2019-12-13 | 2024-03-12 | コニカミノルタ株式会社 | 制御装置、制御システム及び制御プログラム |
US11183193B1 (en) | 2020-05-11 | 2021-11-23 | Apple Inc. | Digital assistant hardware abstraction |
US11061543B1 (en) | 2020-05-11 | 2021-07-13 | Apple Inc. | Providing relevant data items based on context |
US11490204B2 (en) | 2020-07-20 | 2022-11-01 | Apple Inc. | Multi-device audio adjustment coordination |
US11438683B2 (en) | 2020-07-21 | 2022-09-06 | Apple Inc. | User identification using headphones |
US11680209B1 (en) | 2021-12-13 | 2023-06-20 | Uop Llc | Process for converting plastic feed containing polypropylene to aromatics |
Family Cites Families (89)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6237734A (ja) * | 1985-08-12 | 1987-02-18 | Matsushita Electric Ind Co Ltd | 命令選択装置 |
JPH05341951A (ja) * | 1992-06-11 | 1993-12-24 | Toshiba Corp | 音声入力操作装置 |
JP3725566B2 (ja) * | 1992-12-28 | 2005-12-14 | 株式会社東芝 | 音声認識インターフェース |
US5452289A (en) * | 1993-01-08 | 1995-09-19 | Multi-Tech Systems, Inc. | Computer-based multifunction personal communications system |
CA2115210C (en) | 1993-04-21 | 1997-09-23 | Joseph C. Andreshak | Interactive computer system recognizing spoken commands |
FI981154A (fi) * | 1998-05-25 | 1999-11-26 | Nokia Mobile Phones Ltd | Menetelmä ja laite puheen tunnistamiseksi |
KR20010024521A (ko) | 1998-08-17 | 2001-03-26 | 이데이 노부유끼 | 음성 인식 장치 및 방법, 내비게이션 장치, 휴대 전화장치 및 정보 처리 장치 |
US6965863B1 (en) * | 1998-11-12 | 2005-11-15 | Microsoft Corporation | Speech recognition user interface |
US7881936B2 (en) * | 1998-12-04 | 2011-02-01 | Tegic Communications, Inc. | Multimodal disambiguation of speech recognition |
US6233560B1 (en) * | 1998-12-16 | 2001-05-15 | International Business Machines Corporation | Method and apparatus for presenting proximal feedback in voice command systems |
KR100310339B1 (ko) * | 1998-12-30 | 2002-01-17 | 윤종용 | 이동전화 단말기의 음성인식 다이얼링 방법 |
US6519479B1 (en) * | 1999-03-31 | 2003-02-11 | Qualcomm Inc. | Spoken user interface for speech-enabled devices |
US6434527B1 (en) * | 1999-05-17 | 2002-08-13 | Microsoft Corporation | Signalling and controlling the status of an automatic speech recognition system for use in handsfree conversational dialogue |
US6931384B1 (en) * | 1999-06-04 | 2005-08-16 | Microsoft Corporation | System and method providing utility-based decision making about clarification dialog given communicative uncertainty |
US6622119B1 (en) * | 1999-10-30 | 2003-09-16 | International Business Machines Corporation | Adaptive command predictor and method for a natural language dialog system |
US7725307B2 (en) * | 1999-11-12 | 2010-05-25 | Phoenix Solutions, Inc. | Query engine for processing voice based queries including semantic decoding |
GB2358987B (en) | 2000-02-01 | 2003-10-29 | Ericsson Telefon Ab L M | Electronic devices |
US6895380B2 (en) * | 2000-03-02 | 2005-05-17 | Electro Standards Laboratories | Voice actuation with contextual learning for intelligent machine control |
US6934684B2 (en) * | 2000-03-24 | 2005-08-23 | Dialsurf, Inc. | Voice-interactive marketplace providing promotion and promotion tracking, loyalty reward and redemption, and other features |
JP2001296881A (ja) * | 2000-04-14 | 2001-10-26 | Sony Corp | 情報処理装置および方法、並びに記録媒体 |
US6587824B1 (en) * | 2000-05-04 | 2003-07-01 | Visteon Global Technologies, Inc. | Selective speaker adaptation for an in-vehicle speech recognition system |
US7392193B2 (en) * | 2000-06-16 | 2008-06-24 | Microlife Corporation | Speech recognition capability for a personal digital assistant |
US6658386B2 (en) * | 2000-12-12 | 2003-12-02 | International Business Machines Corporation | Dynamically adjusting speech menu presentation style |
JP3919210B2 (ja) * | 2001-02-15 | 2007-05-23 | アルパイン株式会社 | 音声入力案内方法及び装置 |
GB2372864B (en) * | 2001-02-28 | 2005-09-07 | Vox Generation Ltd | Spoken language interface |
US20020152071A1 (en) * | 2001-04-12 | 2002-10-17 | David Chaiken | Human-augmented, automatic speech recognition engine |
JP2003241790A (ja) * | 2002-02-13 | 2003-08-29 | Internatl Business Mach Corp <Ibm> | 音声コマンド処理システム、コンピュータ装置、音声コマンド処理方法およびプログラム |
US7398209B2 (en) * | 2002-06-03 | 2008-07-08 | Voicebox Technologies, Inc. | Systems and methods for responding to natural language speech utterance |
EP1400953B1 (en) * | 2002-09-12 | 2013-03-20 | me2me AG | Method for building speech and/or language recognition models |
US20070186480A1 (en) * | 2002-11-22 | 2007-08-16 | Brian Freeman | Automatic door control system |
US6993482B2 (en) * | 2002-12-18 | 2006-01-31 | Motorola, Inc. | Method and apparatus for displaying speech recognition results |
KR100668297B1 (ko) * | 2002-12-31 | 2007-01-12 | 삼성전자주식회사 | 음성인식방법 및 장치 |
US7333803B2 (en) * | 2004-01-20 | 2008-02-19 | Lucent Technologies Inc. | Network support for voice-to-text memo service |
US20050177373A1 (en) * | 2004-02-05 | 2005-08-11 | Avaya Technology Corp. | Methods and apparatus for providing context and experience sensitive help in voice applications |
US20090164215A1 (en) * | 2004-02-09 | 2009-06-25 | Delta Electronics, Inc. | Device with voice-assisted system |
US20050197843A1 (en) * | 2004-03-07 | 2005-09-08 | International Business Machines Corporation | Multimodal aggregating unit |
KR100617711B1 (ko) | 2004-06-25 | 2006-08-28 | 삼성전자주식회사 | 휴대단말기에서 음성인식구동 방법 |
US20080154601A1 (en) * | 2004-09-29 | 2008-06-26 | Microsoft Corporation | Method and system for providing menu and other services for an information processing system using a telephone or other audio interface |
US8942985B2 (en) * | 2004-11-16 | 2015-01-27 | Microsoft Corporation | Centralized method and system for clarifying voice commands |
US7376645B2 (en) * | 2004-11-29 | 2008-05-20 | The Intellection Group, Inc. | Multimodal natural language query system and architecture for processing voice and proximity-based queries |
CN100521707C (zh) | 2004-12-24 | 2009-07-29 | 深圳市金立通信设备有限公司 | 具声控拨号功能的手机控制方法 |
US8185399B2 (en) * | 2005-01-05 | 2012-05-22 | At&T Intellectual Property Ii, L.P. | System and method of providing an automated data-collection in spoken dialog systems |
US7437297B2 (en) * | 2005-01-27 | 2008-10-14 | International Business Machines Corporation | Systems and methods for predicting consequences of misinterpretation of user commands in automated systems |
US8200495B2 (en) * | 2005-02-04 | 2012-06-12 | Vocollect, Inc. | Methods and systems for considering information about an expected response when performing speech recognition |
US7640160B2 (en) * | 2005-08-05 | 2009-12-29 | Voicebox Technologies, Inc. | Systems and methods for responding to natural language speech utterance |
JP5320064B2 (ja) * | 2005-08-09 | 2013-10-23 | モバイル・ヴォイス・コントロール・エルエルシー | 音声制御型ワイヤレス通信デバイス・システム |
US7620549B2 (en) * | 2005-08-10 | 2009-11-17 | Voicebox Technologies, Inc. | System and method of supporting adaptive misrecognition in conversational speech |
US8265939B2 (en) * | 2005-08-31 | 2012-09-11 | Nuance Communications, Inc. | Hierarchical methods and apparatus for extracting user intent from spoken utterances |
JP2007065347A (ja) * | 2005-08-31 | 2007-03-15 | Denso Corp | 音声認識システム |
US7693716B1 (en) * | 2005-09-27 | 2010-04-06 | At&T Intellectual Property Ii, L.P. | System and method of developing a TTS voice |
US20070112571A1 (en) * | 2005-11-11 | 2007-05-17 | Murugappan Thirugnana | Speech recognition at a mobile terminal |
JP2007142840A (ja) * | 2005-11-18 | 2007-06-07 | Canon Inc | 情報処理装置及び情報処理方法 |
CN101495955B (zh) * | 2005-12-12 | 2013-06-19 | 特捷通讯公司 | 移动设备检索与导航 |
JP4755918B2 (ja) * | 2006-02-22 | 2011-08-24 | 東芝テック株式会社 | データ入力装置及び方法並びにプログラム |
KR100735820B1 (ko) * | 2006-03-02 | 2007-07-06 | 삼성전자주식회사 | 휴대 단말기에서 음성 인식에 의한 멀티미디어 데이터 검색방법 및 그 장치 |
JP4809101B2 (ja) | 2006-03-31 | 2011-11-09 | 京セラ株式会社 | 移動体通信端末、及びプログラム |
JP2007280179A (ja) * | 2006-04-10 | 2007-10-25 | Mitsubishi Electric Corp | 携帯端末 |
US8121838B2 (en) * | 2006-04-11 | 2012-02-21 | Nuance Communications, Inc. | Method and system for automatic transcription prioritization |
US20080233937A1 (en) | 2006-05-08 | 2008-09-25 | Marja-Leena Nurmela | Mobile communication terminal and method |
US7774202B2 (en) * | 2006-06-12 | 2010-08-10 | Lockheed Martin Corporation | Speech activated control system and related methods |
WO2007148142A1 (en) | 2006-06-20 | 2007-12-27 | Telefonaktiebolaget Lm Ericsson (Publ) | Arrangement and method for controlling service activation on a mobile terminal |
KR100783105B1 (ko) | 2006-08-22 | 2007-12-07 | 삼성전자주식회사 | 음성인식 기능을 구비한 전화기의 전화통화 방법 및 장치 |
US7957972B2 (en) * | 2006-09-05 | 2011-06-07 | Fortemedia, Inc. | Voice recognition system and method thereof |
KR100774927B1 (ko) | 2006-09-27 | 2007-11-09 | 엘지전자 주식회사 | 이동통신 단말기, 메뉴 및 아이템 선택방법 |
KR20080032842A (ko) | 2006-10-11 | 2008-04-16 | 삼성전자주식회사 | 평판표시패널을 구비한 전자기기 |
US20080091426A1 (en) * | 2006-10-12 | 2008-04-17 | Rod Rempel | Adaptive context for automatic speech recognition systems |
US7904298B2 (en) * | 2006-11-17 | 2011-03-08 | Rao Ashwin P | Predictive speech-to-text input |
JP4471128B2 (ja) * | 2006-11-22 | 2010-06-02 | セイコーエプソン株式会社 | 半導体集積回路装置、電子機器 |
US20090192898A1 (en) * | 2006-11-29 | 2009-07-30 | E-Meal, Llc | Remote Ordering System |
US20080154612A1 (en) * | 2006-12-26 | 2008-06-26 | Voice Signal Technologies, Inc. | Local storage and use of search results for voice-enabled mobile communications devices |
US8996379B2 (en) * | 2007-03-07 | 2015-03-31 | Vlingo Corporation | Speech recognition text entry for software applications |
US7870000B2 (en) * | 2007-03-28 | 2011-01-11 | Nuance Communications, Inc. | Partially filling mixed-initiative forms from utterances having sub-threshold confidence scores based upon word-level confidence data |
US8204746B2 (en) * | 2007-03-29 | 2012-06-19 | Intellisist, Inc. | System and method for providing an automated call center inline architecture |
JP4412504B2 (ja) * | 2007-04-17 | 2010-02-10 | 本田技研工業株式会社 | 音声認識装置、音声認識方法、及び音声認識用プログラム |
US7809664B2 (en) * | 2007-12-21 | 2010-10-05 | Yahoo! Inc. | Automated learning from a question and answering network of humans |
US8099289B2 (en) * | 2008-02-13 | 2012-01-17 | Sensory, Inc. | Voice interface and search for electronic devices including bluetooth headsets and remote systems |
US7917368B2 (en) * | 2008-02-25 | 2011-03-29 | Mitsubishi Electric Research Laboratories, Inc. | Method for interacting with users of speech recognition systems |
US20090234655A1 (en) * | 2008-03-13 | 2009-09-17 | Jason Kwon | Mobile electronic device with active speech recognition |
US8958848B2 (en) * | 2008-04-08 | 2015-02-17 | Lg Electronics Inc. | Mobile terminal and menu control method thereof |
KR20090107365A (ko) * | 2008-04-08 | 2009-10-13 | 엘지전자 주식회사 | 이동 단말기 및 그 메뉴 제어방법 |
KR101466027B1 (ko) * | 2008-04-30 | 2014-11-28 | 엘지전자 주식회사 | 이동 단말기 및 그 통화내용 관리 방법 |
KR101462930B1 (ko) * | 2008-04-30 | 2014-11-19 | 엘지전자 주식회사 | 이동 단말기 및 그 화상통화 제어방법 |
KR101462932B1 (ko) * | 2008-05-28 | 2014-12-04 | 엘지전자 주식회사 | 이동 단말기 및 그의 텍스트 수정방법 |
KR100988397B1 (ko) * | 2008-06-09 | 2010-10-19 | 엘지전자 주식회사 | 이동 단말기 및 그의 텍스트 수정방법 |
KR101513615B1 (ko) * | 2008-06-12 | 2015-04-20 | 엘지전자 주식회사 | 이동 단말기 및 그 음성 인식 방법 |
KR101502003B1 (ko) * | 2008-07-08 | 2015-03-12 | 엘지전자 주식회사 | 이동 단말기 및 그 텍스트 입력 방법 |
KR20100007625A (ko) * | 2008-07-14 | 2010-01-22 | 엘지전자 주식회사 | 이동 단말기 및 그 메뉴 표시 방법 |
US8412531B2 (en) * | 2009-06-10 | 2013-04-02 | Microsoft Corporation | Touch anywhere to speak |
US9263034B1 (en) * | 2010-07-13 | 2016-02-16 | Google Inc. | Adapting enhanced acoustic models |
-
2008
- 2008-04-08 KR KR1020080032842A patent/KR20090107365A/ko active Search and Examination
- 2008-06-16 US US12/140,107 patent/US8150700B2/en not_active Expired - Fee Related
- 2008-07-01 RU RU2008126782A patent/RU2394386C2/ru active
- 2008-07-02 CN CN200810127912XA patent/CN101557651B/zh active Active
- 2008-11-21 JP JP2008298799A patent/JP5481058B2/ja active Active
- 2008-12-05 EP EP08021190.7A patent/EP2109298B1/en active Active
-
2012
- 2012-01-31 US US13/362,353 patent/US8560324B2/en active Active
Cited By (32)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110265030A (zh) * | 2012-01-09 | 2019-09-20 | 三星电子株式会社 | 图像显示设备及控制图像显示设备的方法 |
US11763812B2 (en) | 2012-01-09 | 2023-09-19 | Samsung Electronics Co., Ltd. | Image display apparatus and method of controlling the same |
US12033635B2 (en) | 2012-01-09 | 2024-07-09 | Samsung Electronics Co., Ltd. | Image display apparatus and method of controlling the same |
CN103295571A (zh) * | 2012-02-29 | 2013-09-11 | 辉达公司 | 使用时间和/或频谱压缩的音频命令的控制 |
CN102883041A (zh) * | 2012-08-02 | 2013-01-16 | 聚熵信息技术(上海)有限公司 | 移动终端的语音控制装置及方法 |
CN103578472A (zh) * | 2012-08-10 | 2014-02-12 | 海尔集团公司 | 电器设备的控制方法和控制装置 |
CN103593134A (zh) * | 2012-08-17 | 2014-02-19 | 上海博泰悦臻电子设备制造有限公司 | 车载设备和语音功能的控制方法 |
CN103593081A (zh) * | 2012-08-17 | 2014-02-19 | 上海博泰悦臻电子设备制造有限公司 | 车载设备和语音功能的控制方法 |
CN103593134B (zh) * | 2012-08-17 | 2018-01-23 | 上海博泰悦臻电子设备制造有限公司 | 车载设备和语音功能的控制方法 |
CN103593081B (zh) * | 2012-08-17 | 2017-11-07 | 上海博泰悦臻电子设备制造有限公司 | 车载设备和语音功能的控制方法 |
CN106453793A (zh) * | 2012-11-20 | 2017-02-22 | 华为终端有限公司 | 一种语音响应的方法及移动设备 |
CN106302931A (zh) * | 2012-11-20 | 2017-01-04 | 华为终端有限公司 | 一种语音响应的方法及移动设备 |
WO2014078980A1 (zh) * | 2012-11-20 | 2014-05-30 | 华为终端有限公司 | 一种语音响应的方法及移动设备 |
CN106302931B (zh) * | 2012-11-20 | 2018-11-06 | 华为终端(东莞)有限公司 | 一种语音响应的方法、电子设备及计算机可读存储介质 |
CN106453793B (zh) * | 2012-11-20 | 2018-11-06 | 华为终端(东莞)有限公司 | 一种语音响应的方法、电子设备及计算机可读存储介质 |
CN103869948A (zh) * | 2012-12-14 | 2014-06-18 | 联想(北京)有限公司 | 语音命令处理方法和电子设备 |
CN103869948B (zh) * | 2012-12-14 | 2019-01-15 | 联想(北京)有限公司 | 语音命令处理方法和电子设备 |
CN105472145A (zh) * | 2013-03-15 | 2016-04-06 | 株式会社Adesign | 锁定模式下利用语音信号连接呼叫的具有控制功能的移动设备 |
CN104796527B (zh) * | 2014-01-17 | 2017-08-11 | Lg电子株式会社 | 移动终端及其控制方法 |
CN104796527A (zh) * | 2014-01-17 | 2015-07-22 | Lg电子株式会社 | 移动终端及其控制方法 |
US9578160B2 (en) | 2014-01-17 | 2017-02-21 | Lg Electronics Inc. | Mobile terminal and controlling method thereof |
CN112700774A (zh) * | 2014-01-21 | 2021-04-23 | 三星电子株式会社 | 电子设备及其语音识别方法 |
CN104917904A (zh) * | 2014-03-14 | 2015-09-16 | 联想(北京)有限公司 | 一种语音信息处理方法、装置和电子设备 |
CN106683675A (zh) * | 2017-02-08 | 2017-05-17 | 张建华 | 一种控制方法及语音操作系统 |
WO2018196231A1 (zh) * | 2017-04-26 | 2018-11-01 | 海信集团有限公司 | 智能终端显示用户操控指令的方法和智能终端 |
CN107544827A (zh) * | 2017-08-23 | 2018-01-05 | 金蝶软件(中国)有限公司 | 一种功能调用的方法及相关装置 |
CN107945806A (zh) * | 2017-11-10 | 2018-04-20 | 北京小米移动软件有限公司 | 基于声音特征的用户识别方法及装置 |
CN109887487B (zh) * | 2019-01-29 | 2021-05-11 | 北京声智科技有限公司 | 一种数据筛选方法、装置及电子设备 |
CN109887487A (zh) * | 2019-01-29 | 2019-06-14 | 北京声智科技有限公司 | 一种数据筛选方法、装置及电子设备 |
WO2020186712A1 (zh) * | 2019-03-20 | 2020-09-24 | 海信视像科技股份有限公司 | 一种语音识别方法、装置及终端 |
CN109976702A (zh) * | 2019-03-20 | 2019-07-05 | 青岛海信电器股份有限公司 | 一种语音识别方法、装置及终端 |
CN112397069A (zh) * | 2021-01-19 | 2021-02-23 | 成都启英泰伦科技有限公司 | 一种语音遥控方法及装置 |
Also Published As
Publication number | Publication date |
---|---|
RU2008126782A (ru) | 2010-01-10 |
KR20090107365A (ko) | 2009-10-13 |
US8150700B2 (en) | 2012-04-03 |
US20120130712A1 (en) | 2012-05-24 |
CN101557651B (zh) | 2012-12-12 |
JP5481058B2 (ja) | 2014-04-23 |
EP2109298B1 (en) | 2017-11-22 |
RU2394386C2 (ru) | 2010-07-10 |
EP2109298A1 (en) | 2009-10-14 |
JP2009252238A (ja) | 2009-10-29 |
US20090254351A1 (en) | 2009-10-08 |
US8560324B2 (en) | 2013-10-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101557651B (zh) | 移动终端及其菜单控制方法 | |
CN101557432B (zh) | 移动终端及其菜单控制方法 | |
CN101605171B (zh) | 移动终端及其中的文本校正方法 | |
CN101572953B (zh) | 移动终端和控制移动终端的视频呼叫的方法 | |
CN101572750B (zh) | 移动终端及其呼叫内容管理方法 | |
CN101350905B (zh) | 移动终端和在其中创建多媒体内容的方法 | |
KR101513615B1 (ko) | 이동 단말기 및 그 음성 인식 방법 | |
CN101431380B (zh) | 用于转换移动终端的广播频道的移动终端和方法 | |
KR101502003B1 (ko) | 이동 단말기 및 그 텍스트 입력 방법 | |
RU2420028C2 (ru) | Мобильный терминал и способ предоставления интерфейса пользователя при его использовании | |
RU2412463C2 (ru) | Терминал мобильной связи и способ управления его меню | |
US20100009719A1 (en) | Mobile terminal and method for displaying menu thereof | |
US20090299730A1 (en) | Mobile terminal and method for correcting text thereof | |
CN101384040B (zh) | 移动终端显示消息的方法及使用该方法的移动终端 | |
CN103856598A (zh) | 移动终端以及接收入局呼叫的方法 | |
CN101442570A (zh) | 移动终端及其键输入方法 | |
KR20150086030A (ko) | 이동 단말기 및 이의 제어 방법 | |
CN101505551B (zh) | 终端及其控制方法 | |
CN101404685A (zh) | 移动终端及其控制方法 | |
CN101404681A (zh) | 用于再现移动终端的视频的装置和方法 | |
CN106790942B (zh) | 语音信息智能保存方法及装置 | |
KR101521909B1 (ko) | 이동 단말기 및 그 메뉴 제어방법 | |
KR101451661B1 (ko) | 이동 단말기 및 그 메뉴 제어 방법 | |
CN104853038A (zh) | 通讯录自定义排序方法及装置 | |
KR101667702B1 (ko) | 이동 단말기 및 그 제어 방법 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant |