CN104104790A - 语音操控方法与移动终端装置 - Google Patents
语音操控方法与移动终端装置 Download PDFInfo
- Publication number
- CN104104790A CN104104790A CN201310291242.6A CN201310291242A CN104104790A CN 104104790 A CN104104790 A CN 104104790A CN 201310291242 A CN201310291242 A CN 201310291242A CN 104104790 A CN104104790 A CN 104104790A
- Authority
- CN
- China
- Prior art keywords
- voice
- mobile terminal
- voice signal
- terminal apparatus
- language understanding
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 38
- 230000004044 response Effects 0.000 claims abstract description 35
- 230000006870 function Effects 0.000 claims description 27
- 230000006854 communication Effects 0.000 description 43
- 238000004891 communication Methods 0.000 description 41
- 230000002452 interceptive effect Effects 0.000 description 27
- 230000000875 corresponding effect Effects 0.000 description 26
- 230000001755 vocal effect Effects 0.000 description 15
- 230000011218 segmentation Effects 0.000 description 12
- 241000123069 Ocyurus chrysurus Species 0.000 description 7
- 238000012545 processing Methods 0.000 description 5
- 230000009471 action Effects 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 3
- 238000004590 computer program Methods 0.000 description 2
- 230000000284 resting effect Effects 0.000 description 2
- 230000008054 signal transmission Effects 0.000 description 2
- 230000003321 amplification Effects 0.000 description 1
- 230000008901 benefit Effects 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000010411 cooking Methods 0.000 description 1
- 230000008878 coupling Effects 0.000 description 1
- 238000010168 coupling process Methods 0.000 description 1
- 238000005859 coupling reaction Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 230000006698 induction Effects 0.000 description 1
- 238000003199 nucleic acid amplification method Methods 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/06—Transformation of speech into a non-audible representation, e.g. speech visualisation or speech processing for tactile aids
- G10L21/16—Transforming into a non-visible representation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F1/00—Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
- G06F1/26—Power supply means, e.g. regulation thereof
- G06F1/32—Means for saving power
- G06F1/3203—Power management, i.e. event-based initiation of a power-saving mode
- G06F1/3206—Monitoring of events, devices or parameters that trigger a change in power modality
- G06F1/3215—Monitoring of peripheral devices
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F1/00—Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
- G06F1/26—Power supply means, e.g. regulation thereof
- G06F1/32—Means for saving power
- G06F1/3203—Power management, i.e. event-based initiation of a power-saving mode
- G06F1/3234—Power saving characterised by the action undertaken
- G06F1/3287—Power saving characterised by the action undertaken by switching off individual functional units in the computer system
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/167—Audio in a user interface, e.g. using voice commands for navigating, audio feedback
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M1/00—Substation equipment, e.g. for use by subscribers
- H04M1/72—Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
- H04M1/724—User interfaces specially adapted for cordless or mobile telephones
- H04M1/72403—User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality
- H04M1/7243—User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality with interactive means for internal management of messages
- H04M1/72433—User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality with interactive means for internal management of messages for voice messaging, e.g. dictaphones
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M1/00—Substation equipment, e.g. for use by subscribers
- H04M1/72—Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
- H04M1/724—User interfaces specially adapted for cordless or mobile telephones
- H04M1/72448—User interfaces specially adapted for cordless or mobile telephones with means for adapting the functionality of the device according to specific conditions
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M1/00—Substation equipment, e.g. for use by subscribers
- H04M1/72—Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
- H04M1/724—User interfaces specially adapted for cordless or mobile telephones
- H04M1/72484—User interfaces specially adapted for cordless or mobile telephones wherein functions are triggered by incoming communication events
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M2250/00—Details of telephonic subscriber devices
- H04M2250/74—Details of telephonic subscriber devices with voice recognition means
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- General Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- General Health & Medical Sciences (AREA)
- Signal Processing (AREA)
- Acoustics & Sound (AREA)
- Computational Linguistics (AREA)
- Computer Networks & Wireless Communication (AREA)
- Computing Systems (AREA)
- Computer Hardware Design (AREA)
- Quality & Reliability (AREA)
- Data Mining & Analysis (AREA)
- Otolaryngology (AREA)
- General Business, Economics & Management (AREA)
- Business, Economics & Management (AREA)
- Telephone Function (AREA)
- Telephonic Communication Services (AREA)
Abstract
一种语音操控方法与移动终端装置。移动终端装置包括语音接收单元、语音输出单元、语音唤醒模块以及语言理解模块。当语音唤醒模块判断第一语音信号符合识别信息时,移动终端装置启动语音接收单元。当语音接收单元在第一语音信号之后接收到第二语音信号时,语言理解模块解析第二语音信号而获得语音辨识结果。当语音辨识结果具有可执行请求信息时,语言理解模块执行应答操作,且移动终端装置关闭语音接收单元接收第三语音信号。当语音辨识结果不具有可执行请求信息,语言理解模块执行语音对话模式。
Description
技术领域
本发明涉及一种语音操控的技术,且特别涉及一种通过语音触发以启动和进行语音交互的语音操控方法与使用此方法的移动终端装置。
背景技术
随着科技的发展,具有语音系统的移动终端装置已日渐普及。上述的语音系统是通过语音理解技术,让使用者与移动终端装置进行沟通。举例来说,使用者只要对上述的移动终端装置讲出某项要求,例如想要查车次、查天气或是欲拨打电话等,系统便会依据使用者的语音信号,采取对应的动作。上述的动作可能是以语音方式回答使用者问题或是依照使用者指令去驱使移动终端装置的系统进行动作。
以语音系统启动的便捷性来说,目前大都是触发移动终端装置的屏幕其所显示的应用程序来启动,或者通过移动终端装置所设置的实体按键来启动。因此,使用者必须直接触及移动终端装置的屏幕或所设置的实体按键,以通过移动终端装置本身来启动语音系统,然而这对于使用者来说,在某些场合,上述的设计却是相当的不便。比如说:在行车期间,或者在厨房做菜时,需要拨打位于客厅的移动电话,以询问友人食谱细节等使用者无法立即触及移动终端装置,但需使语音系统开启的情况。
更进一步,开启语音对话后,如何进行更符合人类对话自然规律的完全脱手的多次交互对话。换句话说,目前若使用者需要与移动终端装置进行多次交互对话,仍必须通过手,来启动移动终端装置的语音系统,而无法做到如同两个自然人之间的对话,可以连续语音问答,无需每次一问一答之后都需要手动开启移动终端装置的语音系统来进行下一次语音问答。
基此,如何改进上述的这些缺点,成为亟待解决的议题
发明内容
本发明提供一种移动终端装置与语音操控方法,可更快速地提供语音服务。使用者仅需发送具有识别信息的语音信号,即可方便地与移动终端装置进行语音沟通。更进一步,移动终端装置可与使用者进行连续语音应答,并可根据使用者所说的内容来终止语音交互,更符合人类对话的自然规律。在对话过程中不再需要手动参与,可以实现人机对话的完全脱手,藉以可更方便、快速地提供语音服务。
本发明提出一种移动终端装置,其包括语音接收单元、语音输出单元、语音唤醒模块以及语言理解模块。语音唤醒模块用以判断是否接收到符合识别信息的第一语音信号。语言理解模块耦接于语音接收单元、语音输出单元以及语音唤醒模块。其中,当语音唤醒模块判断第一语音信号符合识别信息时,移动终端装置启动语音接收单元,且语言理解模块判断语音接收单元是否在第一语音信号之后接收到第二语音信号。倘若语音接收单元未接收到第二语音信号,则语言理解模块执行语音对话模式。倘若语音接收单元接收到第二语音信号,则语言理解模块解析第二语音信号而获得语音辨识结果。其中,当语音辨识结果具有可执行请求信息时,语言理解模块执行应答操作,且移动终端装置关闭语音接收单元接收第三语音信号,以及当语音辨识结果不具有可执行请求信息时,语言理解模块执行语音对话模式。上述语言理解模块在执行语音对话模式时,语言理解模块会自动发送语音应答以询问使用者的请求信息。在此,当使用者输出第四语音信号以作为回应时,语言理解模块会判断使用者所输出的第四语音信号是否符合对话终止提示信息,或是否具有可执行请求信息。如果所述第四语音信号符合对话终止提示信息或具有可执行请求信息,语言理解模块则会根据对话终止提示信息而终止语音对话模式,或者执行对应的可执行请求信息;如果所述第四语音信号不符合对话终止提示信息且不具有可执行请求信息,语言理解模块则会继续执行语音对话模式,直到使用者所输出的语音信号符合对话终止提示信息或具有可执行请求信息为止。另一方面,语言理解模块在执行语音对话模式时,如果使用者未输出第四语音信号以作为回应,语言理解模块则会继续通过语音输出单元发送语音应答来询问使用者,直到语言理解模块于预设时间内,由于使用者的第四语音信号不符合对话终止提示信息且不具有可执行请求信息,亦或一直未发出第四语音信号,语言理解模块自动发送语音应答以询问使用者的请求信息的次数,超过预设次数,则终止语音对话模式。
本发明提出一种语音操控方法,用于移动终端装置。语音操控方法包括以下步骤。判断是否接收到符合识别信息的第一语音信号。当第一语音信号符合识别信息时,判断在第一语音信号之后是否接收到第二语音信号。倘若未接收到第二语音信号,则执行语音对话模式。倘若接收到第二语音信号,则解析第二语音信号而获得语音辨识结果。其中,当语音辨识结果具有可执行请求信息时,执行应答操作,并关闭接收第三语音信号,以及当语音辨识结果不具有可执行请求信息时,执行语音对话模式。上在执行语音对话模式的步骤中,会自动发送语音应答以询问使用者的请求信息。在此,当使用者输出第四语音信号以作为回应时,会判断使用者所输出的第四语音信号是否符合对话终止提示信息,或是否具有可执行请求信息。如果所述第四语音信号符合对话终止提示信息或具有可执行请求信息,则会根据对话终止提示信息而终止语音对话模式,或者执行对应的可执行请求信息;如果所述第四语音信号不符合对话终止提示信息且不具有可执行请求信息,则会继续执行语音对话模式,直到使用者所输出的语音信号符合对话终止提示信息或具有可执行请求信息为止。另一方面,在执行语音对话模式的步骤中,如果使用者未输出第四语音信号以作为回应,则会继续发送语音应答来询问使用者,直到于预设时间内,由于使用者的第四语音信号不符合要求或一直未发出第四语音信号,语言理解模块自动发送语音应答以询问使用者的请求信息的次数,超过预设次数,则终止语音对话模式。
基于上述,在移动终端装置未启动其语音交互功能时,倘若语音唤醒模块接收到符合识别信息的语音信号,则语音接收单元会被启动,以接收在上述语音信号之后的另一个语音信号。之后,语言理解模块则会根据上述另一个语音信号来做出应答操作并终止移动终端装置的语音交互功能;或者根据上述另一个语音信号发送语音应答,直到解析到对话终止提示信息或做出应答操作为止。如果语音接收单元被启动后,在预定时间内未接收到另一个有效语音的次数超过一预定次数,则该移动终端装置关闭该语音接收单元。这里的有效语音可以是可执行的请求信息(比如,“帮我查下上海今天的天气情况”)或者是符合一对话终止提示信息的语音(比如,“好,没事了”),再或者为一可应答的信息(比如,“今天的我太太过生日,我买什么礼物比较好?”)。藉此,移动终端装置可依据符合识别信息的语音信号,而启动语音交互功能,藉以可更快速、更便捷地提供语音服务。
为让本发明的上述特征和优点能更明显易懂,下文特举实施例,并配合附图作详细说明如下。
附图说明
图1是依照本发明一实施例所绘示的移动终端装置的方块图。
图2是依照本发明一实施例所绘示的语音接听方法的流程图。
图3是依照本发明一实施例所绘示的移动终端装置的方块图。
图4是依照本发明一实施例所绘示的语音操控方法的流程图。
图5是依照本发明一实施例所绘示的语音操控方法的流程图。
【符号说明】
100、300:移动终端装置
104、304:辅助操控装置
106、306:语义数据库
110、310:语音输出单元
120、320:语音接收单元
130、330:语言理解模块
140、340:来电通信单元
350:语音唤醒模块
A1:语音应答
C:来电通话
V1、V2、V3:语音信号
SD:语音辨识结果
SO:语音通知
SI:语音信号
S202、S204、S206、S208:语音接听方法的各步骤
S402、S404、S406、S408、S410、S412、S414、S502、S504、S506、S508、S510:语音操控方法的流程图
具体实施方式
虽然现今的移动终端装置已可提供语音系统,以让使用者发出语音来和移动终端装置沟通,但使用者在启动此语音系统时,仍必须通过移动终端装置本身来启动。因此在使用者无法立即触及移动终端装置,但需使语音系统开启的情况,往往无法满足使用者立即的需求。更进一步,即使能够唤醒语音对话系统,但目前的移动装置在对话过程中仍然需要手的不时参与,比如使用者提问结束后,需要再次询问时需要手动再次开启语音对话系统,极不方便。为此,本发明提出一种语音接听方法、语音操控方法及移动终端装置,让使用者能够更便捷地开启语音系统。更进一步,本发明能够使得使用者在整个对话过程中,摆脱手的操作,使得对话更加便捷快速自然。为了使本发明的内容更为明了,以下特举实施例作为本发明确实能够据以实施的范例。
图1是依照本发明一实施例所绘示的移动终端装置的方块图。请参照图1,移动终端装置100具有语音输出单元110、语音接收单元120、语言理解模块130以及来电通信单元140。移动终端装置100例如为移动电话(Cellphone)、个人数字助理(Personal Digital Assistant,PDA)手机、智能手机(Smartphone),或是安装有通讯软件的掌上型计算机(Pocket PC)、平板型计算机(Tablet PC)或笔记型计算机等等。移动终端装置100可以是任何具备通讯功能的便携式(Portable)移动装置,在此并不限制其范围。此外,移动终端装置100可使用Android操作系统、Microsoft操作系统、Android操作系统、Linux操作系统等等,不限于上述。在本实施例中,移动终端装置100会通过来电通信单元140接收到来电通话C。当来电通信单元140接收到来电通话C时,移动终端装置100会通过语音输出单元110,自动发送语音通知SO以询问使用者如何进行回应。此时,移动终端装置100会通过语音接收单元120以接收来自使用者的语音信号SI,并通过语言理解模块130来对此语音信号SI进行解析以产生语音辨识结果SD。最后,移动终端装置100会通过来电通信单元140,以根据语音辨识结果SD来执行对应的通信操作。上述的模块与单元的功能分述如下。
语音输出单元110例如是扬声器。语音输出单元110具有扩音功能,用以输出语音通知以及来自通话对象的语音。具体来说,当移动终端装置100接收到来电通话C时,移动终端装置100可通过语音输出单元110发送语音通知SO,以告知使用者来电通话C的来源(例如通话对象)或询问使用者是否要接听此来电通话C等等。例如,来电通信单元140可依据来电通话C而通过语音输出单元110发出关于来电通话C的电话号码信息,或进而依据联络人通讯录而查出拨出此来电通话C的联络人名称,不限于上述。举例来说,来电通信单元140可通过语音输出单元110而发送出“王大明给您来电,现在接听吗?”、“X公司给您来电,现在接听吗?”、“来电是0922-123564,现在接听吗?”或“来电是886922-123564,现在接听吗?”等关于来电通话C的信息。此外,倘若此来电通话C未提供电话号码,则来电通信单元140也可通过语音输出单元110而送出预设的语音通知SO,例如,“这是未知电话,现在接听吗?”等等。另一方面,当使用者接通来电通话C后,使用者也会通过语音输出单元110来进行接听。
语音接收单元120例如为麦克风,用以接收使用者的声音,以获得来自使用者的语音信号SI。
语言理解模块130耦接于语音接收单元120,用以解析语音接收单元120所接收的语音信号SI,以获得语音辨识结果。具体而言,语言理解模块130可包括语音辨识模块以及语音处理模块(未绘示),其中,语音辨识模块会接收从语音接收单元120传来的语音信号SI,以将语音信号转换成多个分段语义(例如词汇或字句等)。语音处理模块则可依据这些分段语义而解析出这些分段语义所代表的意指(例如意图、时间、地点等),进而判断出上述语音信号SI中所表示的意思。此外,语音处理模块还会根据所解析的结果产生对应的应答内容。
更进一步而言,在计算机系统架构下的自然语言理解中,通常会使用固定词语法来提取语音信号SI的语句,以解析这些语句所意指的指令或意图(例如接听来电通话C、拒绝接听来电通话C或发送简讯等动作)等,而判断出语音信号SI的意思,藉以获得语音辨识结果。在本实施例中,语言理解模块130的语音处理模块,可通过语义数据库106,来查询语音信号SI中所分割成的分段语义是对应于哪些指令,其中语义数据库106可记录有各种分段语义与各种命令的关系。在本实施例中,根据上述各种分段语义,语言理解模块130的语音处理模块还可判断出语音信号SI中哪些是使用者欲回应来电通话C的信息。
举例来说,当使用者回应“好的”、“接听”、“接一下”等之类表示要接听来电通话C的语音信号SI时,语言理解模块130可通过语义数据库106来查询“好的”、“接听”、“接一下”等所对应的命令,而解析出上述的语音信号SI是用以表示接听来电通话C。在另一实施例中,当使用者回应“不接”、“不”、“先不接”等之类表示要拒绝接听来电通话C的语音信号SI时,语言理解模块130可通过语义数据库106来查询“不接”、“不”、“先不接”等所对应的命令,而解析出上述的语音信号SI是用以表示拒绝接听来电通话C。
在另一实施例中,当使用者回应“先不接,告诉他我到公司后再打电话给他”等之类表示发送讯息以回应来电通话C的语音信号SI时,语言理解模块130可通过语义数据库106来查询“先不接”所对应的命令,而解析出语音信号SI为表示拒绝接听来电通话C。并且,语言理解模块130还可通过语义数据库106来判断出“告诉他”是表示发送讯息的命令,藉以根据这个命令来执行通信操作,例如是根据这个命令来产生通信信号(如发送简讯等)。其中,语言理解模块130还可判断出“告诉他”之后的语音是表示发送讯息时的应答内容(例如是“到公司后再打电话”)。
需说明的是,在本实施例中,语言理解模块130可由一个或数个逻辑门组合而成的硬件电路来实作,也可以是以计算机程序代码来实作。值得一提的是,在另一实施例中,上述的语言理解模块也可配置于云端服务器中。也就是说,移动终端装置100也可与云端服务器(未绘示)连线,其中云端服务器连线具有语言理解模块。如此一来,移动终端装置100可将所接收到的语音信号SI,发送给云端服务器中的语言理解模块进行解析,再从云端服务器获得语音辨识结果。
来电通信单元140耦接于语音接收单元120与语言理解模块130。来电通信单元140用以接收来电通话C及执行通信操作。具体来说,来电通信单元140接收到来电通话C后,可根据使用者的语音(后将详述),来进行接听来电通话C、拒接来电通话C、传送预设语音应答以回应来电通话C,或者传送简讯、语音应答等应答信号,以回应来电通话C,其中应答信号中具有使用者欲回应来电通话C的应答内容。
在此说明的是,本实施例的移动终端装置100具有通常模式及第一模式。其中,第一模式例如是移动终端装置100用于移动中的行车装置中而进入车载模式。更具体而言,在此第一模式中,当移动终端装置100接收到来电通话C时,移动终端装置100会自动发送语音通知(例如来电通话的来源)以询问使用者是否接听这个来电通话C,即移动终端装置100可自动地开启其免持系统,以和使用者进行语音交互。相对而言,通常模式例如是移动终端装置100于非车载模式的时候。亦即,在此通常模式中,移动终端装置100不会自动发送语音通知以询问使用者是否接听这个来电通话C,而无法根据使用者的语音信号来做回应,即移动终端装置100不会自动地开启其免持系统。
如此一来,当移动终端装置100切换为第一模式时,如果移动终端装置100接收到来电通话,则会发送语音通知使用者,以让使用者通过语音的方式,传送语音信号至移动终端装置100,使得移动终端装置100可根据使用者所说的话,来回应此来电通话(例如接听或拒绝接听来电通话等通信操作)。
需说明的是,本实施例的移动终端装置100可自动从通常模式切换为第一模式。具体而言,当移动终端装置100连线于辅助装置104时,移动终端装置100可从通常模式切换为第一模式。另一方面,当移动终端装置100未连线于辅助装置104时,移动终端装置104可从第一模式切换为通常模式。在此,移动终端装置100可匹配于辅助装置104。其中,当移动终端装置100通过无线传输信号或者电性连接于辅助装置104时,可使移动终端装置10自动切换为第一模式。
此外,在另一实施例中,当移动终端装置100用于移动中的行车装置时,移动终端装置100也可根据感应行车装置的速度的大小,来决定是否切换成第一模式。例如,当行车装置的速度超过阈值时,移动终端装置100则会从通常模式切换为第一模式。另一方面,当行车装置的速度未超过阈值时,移动终端装置100则会从自第一模式切换为通常模式。如此一来,使用者可更加便利地通过语音来操控移动终端装置100。
图2是依照本发明一实施例所绘示的语音接听方法的流程图。请同时参照图1及图2,在步骤202中,移动终端装置100会从通常模式切换为第一模式。在移动终端装置100于第一模式的情况下,如步骤S204所示,当来电通信单元140接收到来电通话C时,来电通信单元140会通过语音输出单元110发送语音通知SO,并启动语音接收单元120接收语音信号SI。根据上述的语音通知SO,使用者可得知来电通话C的来源,并可通过语音的方式来操控来电通信单元140以回应此来电通话C。因此,当来电通信单元140接收到来电通话C时,来电通信单元140会启动语音接收单元120以接收来自使用者的语音信号SI。
在步骤S206,语言理解模块130会解析语音接收单元120所接收到的语音信号SI,以获得语音辨识结果。在此,语言理解模块130可接收来自语音接收单元120的语音信号SI,并将语音信号SI分割成多个分段语义。并且,语言理解模块130会对上述分段语义进行自然语言理解,以辨识出语音信号SI中的应答信息。
接着,在步骤S208,来电通信单元140会根据语言理解模块130所解析出的语音辨识结果,执行对应的通信操作。在本实施例中,由于使用者可通过语音的方式,以命令移动终端装置100进行接听、拒接来电通话C、发送讯息或其他动作以回应来电通话C,因此语言理解模块130解析语音信号SI之后,可判断出语音信号SI中的命令。故来电通信单元140可根据语音信号SI中的命令来执行对一的通信操作。上述来电通信单元140所执行的通信操作可以是接听来电通话C、拒绝接听来电通话C、传送预设语音应答以回应来电通话C,或者传送简讯、语音应答等应答信号,以回应来电通话C,其中应答信号中具有使用者欲回应来电通话C的应答内容。
为了使本领域的技术人员进一步了解本实施例来电通信单元140所执行的通信操作,下文再举诸实施例,其中,仍搭配图1的移动终端装置100来进行说明。
当移动终端装置100切换为第一模式时(例如移动终端装置100用于移动中的行车装置中而进入车载模式),假设来电通信单元140接收到来电通话C,且来电通信单元140会通过语音输出单元110发送“王大明给您来电,现在接听吗?”这个语音通知SO。在本实施例中,倘若使用者回应“好的”这个语音信号SI,则来电通信单元140会接听这个来电通话C。
另一方面,倘若使用者回应“不接”这个语音信号SI,则来电通信单元140会拒绝接听这个来电通话C。在一实施例中,来电通信单元140还可传送“您拨的电话暂时无法接听,请稍后再拨,或在『哔』声后留言”这个预设语音应答来回应来电通话C。
此外,倘若使用者回应“先不接,告诉他我到公司后再打电话给他”这个语音信号SI,则来电通信单元140会拒绝接听这个来电通话C,并且会自语音辨识结果取得应答内容,即“到公司后再打电话”这个应答内容以发送简讯,其中例如在简讯中记载“我在开会,稍后再回拨”这个简讯内容来回应来电通话C。
如此一来,在移动终端装置100进入车载模式的情况下,移动终端装置100可自动询问使用者是否接听来电通话C,以让使用者直接通过语音的方式来操控移动终端装置100进行接听、拒绝接听或其他通信操作。
另外需说明的是,本实施利并不限制使用者通过语音的方式来回应来电通话C。在其他实施例中,使用者可通过按压配置于移动终端装置100的按键(未绘示),以令来电通信单元140进行接听/拒接。或者,使用者也可通过连线于移动终端装置100的辅助操控装置104(例如是具有蓝牙功能或无线传输功能的随身装置),来操控来电通信单元140进行接听/拒接。
依据上述,移动终端装置100可自动从通常模式切换为第一模式。并且,当来电通信单元140在第一模式接收到来电通话时,语音输出单元110会发送语音通知以询问使用者。当使用者发送语音信号时,语言理解模块130会对此语音信号进行解析,且来电通信单元140会根据语言理解模块130解析后所获得的语音辨识结果,执行对应的通信操作。如此一来,移动终端装置可更快速地提供语音服务,其中当移动终端装置100在第一模式的情况下,例如用于移动中的行车装置时,使用者可方便地根据移动终端装置100所发送的语音通知,通过语音的方式来回应来电通话。藉此,使用者可更加便利地操控移动终端装置。
图3是依照本发明一实施例所绘示的移动终端装置的方块图。请参照图3,移动终端装置300具有语音输出单元310、语音接收单元320、语言理解模块330以及语音唤醒模块350。本实施例的移动终端装置300与图1的移动终端装置100相似,其不同之处在于:本实施例的移动终端装置300更具有语音唤醒模块350。
语音唤醒模块350用以判断是否接收到具有识别信息的语音信号。在本实施例中,当语音唤醒模块350未接收到具有识别信息的语音信号时,语音输出单元310、语音接收单元320及语言理解模块330可以处于待机或关闭等模式,即移动终端装置300不会与使用者进行语音交互。而当语音唤醒模块350接收到具有识别信息的语音信号时,移动终端装置300则会启动语音接收单元320以接收之后的语音信号,并通过语言理解模块330来进行解析,即移动终端装置300会依据此语音信号与使用者进行语音交互,且还可执行对应于语音信号的应答操作等。故在本实施例中,使用者可直接以语音的方式,说出具有识别信息的语音(例如特定的词汇,如名字),来唤醒移动终端装置300执行语音交互功能。此外,本实施例的语音唤醒模块350可由一个或数个逻辑门组合而成的硬件电路来实作,也可以是以计算机程序代码来实作。
值得一提的是,由于语音接收单元320是在语音唤醒模块350辨识出识别信息之后而被启动,因此语言理解模块330可避免对非语音信号(例如杂音信号)进行解析。此外,由于语音唤醒模块350只要能辨识出识别信息所对应的音讯(例如“小茜”这个识别信息所对应的音讯),即会判断所接收到的语音信号具有识别信息,因此语音唤醒模块350可以不具备有自然语言理解的能力,而具有较低功率的消耗。如此一来,当使用者未提供具有识别信息的语音信号时,移动终端装置300不会启动语音交互功能,故移动终端装置300不仅可方便使用者通过语音来进行操控,也可节省电源消耗。
故在本实施例中,移动终端装置300可通过语音唤醒模块350来判断是否接收到符合识别信息的语音信号(下文以语音信号V1表示),如果是,则移动终端装置300会启动语音接收单元320以接收音讯,并且通过语言理解模块330判断语音接收单元320是否在语音信号V1之后接收到另一语音信号(下文以语音信号V2表示)。倘若语言理解模块330判断语音接收单元320接收到语音信号V2,语言理解模块330会解析语音信号V2而获得语音辨识结果,以及判断语音辨识结果中是否具有可执行请求信息。如果语音辨识结果具有可执行请求信息时,则移动终端装置300会通过语言理解模块330执行应答操作,并终止语音交互功能。
然而,如果上述语音接收单元320在语音信号V1之后,未接收到另一语音信号V2,或者,语言理解模块330解析语音信号V2而获得的语音辨识结果,不具有可执行请求信息时,则移动终端装置300会通过语言理解模块330执行语音对话模式,以和使用者进行语音沟通。其中,语言理解模块330在执行语音对话模式时,语言理解模块330会自动发送语音应答以询问使用者的请求信息(即使用者的意图)。此时,语言理解模块330会判断使用者所输出的语音信号是否符合对话终止提示信息,或是否具有可执行请求信息。如果有,则会终止语音对话模式,或者执行对应的可执行请求信息;如果否,则语言理解模块330则会继续执行语音对话模式,即语言理解模块330会自动发送语音应答以询问使用者的请求信息(即使用者的意图)。直到使用者所输出的语音信号符合对话终止提示信息或具有可执行请求信息为止。
以下即搭配上述移动终端装置300来说明语音操控的方法。图4是依照本发明一实施例所绘示的语音操控方法的流程图。请同时参照图3及图4,在步骤S402中,语音唤醒模块350会判断是否接收到符合识别信息的语音信号(下文以语音信号V1表示)。详细而言,识别信息可以是特定的词汇(例如名字)所对应的预设音,其中此预设音会在特定音频范围或特定能量范围之内。也就是说,语音唤醒模块350可判断是否接收到在特定音频范围或特定能量范围之内的预设音,而判断出是否接收到具有识别信息的语音信号V1。在本实施例中,使用者可预先通过移动终端装置300的系统来设定这个识别信息,例如预先提供识别信息所对应的预设音,而语音唤醒模块350可通过比对语音信号V1是否符合这个预设音,来判断语音信号V1是否具有识别信息。举例来说,假设识别信息为“小茜”这个名字所对应的预设音,则语音唤醒模块350会判断是否接收到具有“小茜”的语音信号V1。
倘若语音唤醒模块350未接收到符合识别信息的语音信号V1,则如步骤S404所示,移动终端装置300不会启动语音交互功能。由于语音唤醒模块350未接收到符合识别信息的语音信号V1,因此语音接收单元320是成关闭状态或休眠状态而不会进行语音信号的接收,故移动终端装置300中的语言理解模块330不会取得到之后的语音信号来进行解析。举例来说,假设识别信息为“小茜”,倘若使用者未说出“小茜”而是说出“小王”等其他语音,即语音唤醒模块350无法接收到符合“小茜”的语音信号V1,故移动终端装置300的语音交互功能不会被启动。
在步骤S406中,当语音唤醒模块350判断语音信号V1符合识别信息时,移动终端装置300会启动语音接收单元320以接收音讯。并且,语言理解模块330会依据语音接收单元320所接收到的音讯,判断语音接收单元320是否在语音信号V1之后接收到另一语音信号(下文以语音信号V2表示)。在本实施例中,语言理解模块330可判断语音接收单元320所接收到的音讯的能量是否超过一设定值。如果所述音讯的能量未超过设定值,则语言理解模块330会判断此音讯为杂音,藉以判断语音接收单元320未接收到语音信号V2;如果所述音讯的能量已达设定值,则语言理解模块330可判断语音接收单元320已接收到语音信号V2,进而根据此语音信号V2来执行后续的步骤。
倘若语言理解模块330判断语音接收单元320未接收到语音信号V2,则如步骤S408所示,语言理解模块330会执行语音对话模式。在语音对话模式中,语言理解模块330可通过语音输出单元310发送语音应答,且可通过语音接收单元320继续接收及解析来自使用者的另一个语音信号,据以做出另一个语音应答或者应答操作,直到语言理解模块330判断出具有对话终止提示信息的语音信号,或者移动终端装置300已完成使用者的命令或请求为止。关于语音对话模式的详细步骤,将于后详述(如图5所示)。
倘若语言理解模块330判断语音接收单元320接收到语音信号V2,则如步骤S410所示,语言理解模块330会解析语音信号V2而获得语音辨识结果。语言理解模块330可接收来自语音接收单元320的语音信号V2,并将语音信号V2分割成多个分段语义,以及对上述分段语义进行自然语言理解,以辨识出语音信号V2中的内容。如同图1的语言理解模块130,本实施例的语言理解模块330可依据固定词语法来提取语音信号V2的语句,以解析这些语句所意指的指令或意图(例如命令句或者询问句)等,而判断出语音信号V2的意思,藉以获得语音辨识结果。其中,语言理解模块330可通过语义数据库306,来查询语音信号V2中所分割成的分段语义是对应于哪些指令,而上述语义数据库306可记录有各种分段语义与各种命令的关系。
接着,如步骤S412所示,语言理解模块330会判断语音辨识结果中是否具有可执行请求信息。详细而言,可执行请求信息例如是指让移动终端装置300完成所请求的操作。也就是说,语言理解模块330可依据语音辨识结果中的可执行请求信息,让移动终端装置300执行一个动作,其中移动终端装置300例如可通过一个或多个应用程序来完成。举例来说,当语音信号V2为“帮我打电话给王大明”、“帮我查台北明天的天气”或“现在几点”等,则语音信号V2具有可执行请求信息,因此,语言理解模块330解析上述语音信号V2后,可令移动终端装置300拨打电话给王大明、上网查并回报台北明天的天气、或者查询并回报现在的时间等这些动作。
另一方面,如果语音辨识结果不具有可执行请求信息,则表示语言理解模块330无法依据语音辨识结果而判断使用者的意图,因此无法让移动终端装置300完成所请求的操作。举例来说,当语音信号V2为“帮我打电话”、“帮我查天气”、“现在”等,则语言理解模块330解析语音信号V2后,无法令移动终端装置300完成上述所请求的操作。亦即,语言理解模块330无法判断出上述语音信号V2中的通话对象、查询哪一时间内或哪一地点的天气,以及无法根据一个不具完整语意的句子来执行。
当语音辨识结果具有可执行请求信息时,则如步骤S414所示,语言理解模块330会执行应答操作,且移动终端装置300会关闭接收其他语音信号(下文以语音信号V3表示),藉以关闭移动终端装置300的语音交互功能。
具体来说,当可执行请求信息为操作指令时,则语言理解模块330会启动对应于操作指令的操作功能。例如,当可执行请求信息为“调低屏幕的亮度”,则语言理解模块330会发出一调整亮度的信号于移动终端装置300的系统,使其将屏幕的亮度调低。此外,当可执行请求信息为询问句时,则语言理解模块330会发送对应在此询问句的语音应答。此时语言理解模块330可辨识出询问句中的一个或多个关键词,并依据这些关键词而自搜寻引擎中进行查询对应的答案,再通过语音输出单元310来输出语音应答。例如,当可执行请求信息为“明天台北的温度是几度?”,则语言理解模块330可发出一查询信号以通过搜寻引擎查询对应的答案,并通过语音输出单元310来输出“明天台北的温度是26度”这个语音应答。
在此说明的是,由于上述的可执行请求信息会让移动终端装置300完成所请求的操作,因此语言理解模块330执行应答操作之后,此时的语音接收单元320会成关闭或休眠状态,而不会接收到其他的语音信号V3。更进一步而言,当语音接收单元320被关闭接收语音信号V3时,如果使用者欲通过语音的方式来令移动终端装置300执行所请求的操作,则使用者需再呼叫具有识别信息的语音,藉以通过语音唤醒模块350来进行判断,进而再次启动语音接收单元320。
当语音辨识结果不具有可执行请求信息时,则如步骤S408所示,语言理解模块330会执行语音对话模式(关于语音对话模式的详细步骤,将于后详述,如图5所示)。在此,语言理解模块330会根据语音信号V2通过语音输出单元310发送语音应答,并且会通过语音接收单元320,继续接收另一个语音信号。也就是说,语言理解模块330会继续接收及解析来自使用者的语音信号,据以做出另一个语音应答或者应答操作,直到语言理解模块330判断出具有对话终止提示信息的语音信号,或者移动终端装置300已完成使用者的命令或请求为止。
如此一来,在本实施例中,使用者仅需发送具有识别信息的语音信号,即可方便地与移动终端装置300进行语音沟通。由于移动终端装置300可在关闭语音接收单元320之后,再次根据所述具有识别信息的语音信号而自动打开语音交互功能,故使用者可完全地解放双手,而和移动终端装置300进行对话,并完全通过语音的方式来操控移动终端装置300执行对应的应答操作等等。
为了使本领域技术人员进一步了解上述语言理解模块330所执行的语音对话模式,下文再举诸实施例为例,其中仍搭配图3的移动终端装置300来进行说明。
图5是依照本发明一实施例所绘示的语音操控方法的流程图。请同时参照图3、图4与图5,语言理解模块330在执行语音对话模式(如图4的步骤S408)时,在图5的步骤S502中,语言理解模块330会产生语音应答,下文以语音应答A1表示,并通过语音输出单元310输出。由于语言理解模块330会因未接收到语音信号V2(如图4的步骤S406)而执行语音对话模式,或者是因接收到不具有可执行请求信息的语音信号V2而执行语音对话模式(如图4的步骤S412),故此时,语言理解模块330会自动发送语音应答A1以询问使用者的请求信息(即使用者的意图)。
举例来说,当语音接收单元320未接收到语音信号V2时,语言理解模块330可通过语音输出单元310发送“有什么事吗?”、“需要提供什么服务?”等,不限于此,藉以询问使用者。此外,当语言理解模块330所接收到的语音信号V2不具有可执行请求信息时,语言理解模块330可通过语音输出单元310发送“您说的是哪一个地方的天气?”、“您说的是谁的电话?”或“您说的是什么意思?”等等,不限于此。
需说明的是,语言理解模块330也可根据这个不具有可执行请求信息的语音信号V2,而找出匹配此语音信号V2的语音应答。换句话说,语言理解模块330可进入语音聊天的模式,以和使用者进行沟通。其中,语言理解模块330可透语义数据库306来实现上述的语音聊天的模式。详细而言,语义数据库306可记录有多种候选答案,而语言理解模块330依据优先顺序来选取这些候选答案的其中之一来作为语音应答。例如,语言理解模块330可依据众人使用习惯,以决定这些候选答案的优先顺序。或者,语言理解模块330可依据使用者的喜好或者习惯,以决定这些候选答案的优先顺序。值得一提的是,语义数据库306中也可记录先前语言理解模块330所输出的语音应答的内容,并依据先前的内容来产生语音应答。上述选出语音应答的方法为举例说明,本实施例并不以此为限制。
当语言理解模块330通过语音输出单元310输出语音应答之后,在步骤S504中,语言理解模块330会判断语音接收单元320是否再接收到其他语音信号(下文以语音信号V4表示)。此处与图4的步骤S406相似,可参照前述的说明。
当语音接收单元320接收语音信号V4时,则如步骤S506所示,语言理解模块330会判断语音信号V4是否符合对话终止提示信息,或者语音信号V4是否具有可执行请求信息。对话终止提示信息例如是特定词汇,用以表示对话终止。亦即,语言理解模块330会对语音信号V4进行解析,倘若解析到上述的特定词汇,则判断语音信号V4符合对话终止提示信息。举例来说,当语音信号V4符合“再见”或“没事了”等这些对话终止提示信息,则语音接收单元320不会继续接收语音信号。另一方面,如果语音信号V4具有可执行请求信息,则语言理解模块330即会执行对应于可执行请求信息的应答操作。并且,语言理解模块330会终止语音对话模式,而语音接收单元320亦不再继续接收语音信号。在此与图4的步骤S414相似,可参照前述的说明。
在步骤S506中,如果语音信号V4符合对话终止提示信息,或者具有可执行请求信息时,则如步骤S508所示,语言理解模块330则终止语音对话模式,并终止接收之后的语音信号,据以结束移动终端装置300和使用者进行语音沟通。也就是说,此时若使用者欲通过语音的方式来操控移动终端装置300,则需说出具有识别信息(例如“小茜”这个名子)的语音信号,才可再启动移动终端装置300执行语音交互。
此外,在步骤S506中,如果语音信号V4不符合对话终止提示信息,亦不具有可执行请求信息时,则回到步骤S502,语言理解模块330会继续通过语音输出单元310发送语音应答来询问使用者。
另一方面,返回步骤S504,当语音接收单元320未接收到语音信号V4,则如步骤S510所示,语言理解模块330会判断于预设时间内未接收到语音信号V4的次数,是否超过预设次数。具体来说,如果于预设时间内未接收到语音信号V4,则语言理解模块330会记录一笔次数。如此一来,当所记录的次数未超过预设次数时,则回到步骤S502,语言理解模块330会继续通过语音输出单元310发送语音应答,藉以询问使用者的意图。其中,语言理解模块330可在语音接收单元320未接收到语音信号V4的预设时间之后,产生语音应答。上述的语音应答例如是“您还在吗?”、“需要提供什么服务?”等问句,不限于此。
反之,在步骤S510中,当所记录的次数为超过预设次数时,则如步骤S508所示,语言理解模块330会终止此语音对话模式,且语音接收单元320会终止接收之后的语音信号,亦即移动终端装置300会结束与使用者进行语音沟通,以结束语音交互。
值得一提的是,当移动终端装置300结束语音交互功能之后,使用者不仅可呼叫具有识别信息的语音信号,以和移动终端装置300沟通,使用者也可通过辅助操控装置304,从辅助操控装置304发出无线传输信号至移动终端装置300,以启动语音交互功能。在此,移动终端装置300便会启动语音接收单元320来接收语音信号。
依据上述,本实施例的移动终端装置300可据符合识别信息的语音信号,而启动移动终端装置300的语音交互功能,藉以可更快速地提供语音服务。其中,在移动终端装置300未启动其语音交互功能时,语音唤醒模块350会侦测符合识别信息的语音信号。倘若语音唤醒模块350接收到上述符合识别信息的语音信号时,语音接收单元320则会被启动,以接收在上述语音信号之后的另一个语音信号。之后,语言理解模块330则会根据上述另一个语音信号来做出应答操作并终止移动终端装置300的语音交互功能;或者根据上述另一个语音信号发送语音应答,藉以获得使用者的意图或和使用者对话,直到解析到对话终止提示信息或做出应答操作为止。如此一来,使用者仅需发送具有识别信息的语音信号,即可方便地与移动终端装置300进行语音沟通,并在通话过程中可以完全解放双手,因为移动终端装置300是在一个对话回合后自动打开语音交互功能。藉此,使用者可更加便利地操控移动终端装置300。
综上所述,在本发明的语音接听方法与移动终端装置中,移动终端装置可自动从通常模式切换为第一模式。并且,当移动终端装置在第一模式接收到来电通话时,移动终端装置可发送语音通知以询问使用者,而让使用者可通过语音的方式发送语音信号来操控移动终端装置进行回应。此时,移动终端装置可根据来自使用者的语音信号进行解析,并根据解析后所获得的语音辨识结果,执行对应的应答操作。如此一来,使用者可方便地根据移动终端装置所发送的语音通知,通过语音的方式来回应来电通话。
此外,在本发明的语音操控方法与移动终端装置中,移动终端装置可据符合识别信息的语音信号,以启动语音交互功能。在移动终端装置未启动其语音交互功能时,倘若移动终端装置接收到符合识别信息的语音信号,移动终端装置则会接收在上述语音信号之后的另一个语音信号。之后,移动终端装置会根据上述另一个语音信号来做出应答操作并终止语音交互功能;或者根据上述另一个语音信号发送语音应答,藉以获得使用者的意图或和使用者对话,直到解析到对话终止提示信息或做出应答操作为止。如此一来,使用者仅需发送具有识别信息的语音信号,即可方便地与移动终端装置进行语音沟通,并在通话过程中可以完全解放双手,因为移动终端装置总是在一个对话回合后自动打开语音输入。且移动终端装置可根据使用者所说的内容来终止语音交互,藉以可更快速地提供语音服务。基此,本发明的语音接听方法、语音操控方法与移动终端装置,可让使用者可更加便利地操控移动终端装置。
虽然本发明已以实施例公开如上,然其并非用以限定本发明,本领域技术人员在不脱离本发明的精神和范围内,当可作些许的更动与润饰,故本发明的保护范围当视所附权利要求书界定范围为准。
Claims (20)
1.一种移动终端装置,包括:
一语音接收单元;
一语音输出单元;
一语音唤醒模块,判断是否接收到符合一识别信息的一第一语音信号;以及
一语言理解模块,耦接于该语音接收单元、该语音输出单元以及该语音唤醒模块,其中当该语音唤醒模块判断该第一语音信号符合该识别信息时,该移动终端装置启动该语音接收单元,且该语言理解模块判断该语音接收单元是否在该第一语音信号之后接收到一第二语音信号,倘若该语音接收单元未接收到该第二语音信号,则该语言理解模块执行一语音对话模式,倘若该语音接收单元接收到该第二语音信号,则该语言理解模块解析该第二语音信号而获得一语音辨识结果,其中
当该语音辨识结果具有一可执行请求信息时,该语言理解模块执行一应答操作,且该移动终端装置关闭该语音接收单元接收一第三语音信号,以及当该语音辨识结果不具有一可执行请求信息时,该语言理解模块执行该语音对话模式。
2.如权利要求1所述的移动终端装置,其中执行该语音对话模式的步骤还包括:
该语言理解模块自动发送语音应答以询问使用者的请求信息。
3.如权利要求2所述的移动终端装置,其中当使用者输出一第四语音信号作为回应时,该语言理解模块判断该第四语音信号是否符合一对话终止提示信息,或是否具有该可执行请求信息。
4.如权利要求3所述的移动终端装置,其中当该第四语音信号符合该终止提示信息或具有该可执行请求信息时,该语言理解模块根据对话终止提示信息而终止该语音对话模式,或执行对应的该可执行请求信息。
5.如权利要求3所述的移动终端装置,其中当该第四语音信号不符合该终止提示信息且不具有该可执行请求信息时,该语言理解模块再次执行该语音对话模式。
6.如权利要求5所述的移动终端装置,其中当该语言理解模块在执行该语音对话模式时,如果使用者未输出该第四语音信号时,该语言理解模块则再次执行该语音对话模式。
7.如权利要求5或6所述的移动终端装置,其中当该语言理解模块于一预设时间内,由于使用者发出的该第四语音信号不符合该终止提示信息或不具有该可执行请求信息,亦或一直未发出该第四语音信号,而导致该语言理解模块自动发送另一语音应答以询问使用者的请求信息的次数超过该预设次数,则终止该语音对话模式,且该移动终端装置关闭该语音接收单元。
8.如权利要求1所述的移动终端装置,其中当该可执行请求信息为一操作指令时,该语言理解模块启动对应于该操作指令的一操作功能。
9.如权利要求1所述的移动终端装置,其中当该可执行请求信息为一询问句,该语言理解模块通过该语音输出单元发送对应于该询问句的一语音应答。
10.如权利要求1所述的移动终端装置,其中该移动终端装置默认在一个对话回合后自动打开该语音接收单元,除非前一个对话回合中使用者发出一对话终止提示信息。
11.一种语音操控方法,用于一移动终端装置,该方法包括:
判断是否接收到符合一识别信息的一第一语音信号;
当该第一语音信号符合该识别信息时,判断在该第一语音信号之后是否接收到一第二语音信号;
倘若未接收到该第二语音信号,则执行一语音对话模式;
倘若接收到该第二语音信号,则解析该第二语音信号而获得一语音辨识结果;
当该语音辨识结果具有一可执行请求信息时,执行一应答操作,并关闭接收一第三语音信号;以及
当该语音辨识结果不具有一可执行请求信息时,执行该语音对话模式。
12.如权利要求11所述的语音操控方法,其中执行该语音对话模式的步骤还包括:
该语言理解模块自动发送语音应答以询问使用者的请求信息。
13.如权利要求12所述的语音操控方法,其中当使用者输出一第四语音信号作为回应时,该语言理解模块判断该第四语音信号是否符合一对话终止提示信息,或者是否具有该可执行请求信息。
14.如权利要求13所述的语音操控方法,其中当该第四语音信号符合该终止提示信息或是具有该可执行请求信息时,该语言理解模块根据对话终止提示信息而终止该语音对话模式,或执行对应的该可执行请求信息。
15.如权利要求13所述的移动终端装置,其中当该第四语音信号不符合该终止提示信息且不具有该可执行请求信息时,该语言理解模块再次执行该语音对话模式。
16.如权利要求15所述的语音操控方法,其中当该语言理解模块在执行该语音对话模式时,如果使用者未输出该第四语音信号时,该语言理解模块则再次执行该语音对话模式。
17.如权利要求15或16所述的语音操控方法,其中当该语言理解模块于一预设时间内,由于使用者发出的该第四语音信号不符合该终止提示信息或者不具有该可执行请求信息,或者一直未发出该第四语音信号,而自动发送另一语音应答以询问使用者的请求信息的次数超过该预设次数,则终止该语音对话模式,且该移动终端装置关闭该语音接收单元。
18.如权利要求11所述的语音操控方法,当该语音辨识结果具有该可执行请求信息时,执行该应答操作的步骤包括:
当该可执行请求信息为一操作指令时,启动对应于该操作指令的一操作功能。
19.如权利要求11所述的语音操控方法,其中当该语音辨识结果具有该可执行请求信息时,执行该应答操作的步骤还包括:
当该可执行请求信息为一询问句,发送对应于该询问句的一语音应答。
20.如权利要求11所述的移动终端装置,其中该移动终端装置默认在一个对话回合后自动打开该语音接收单元,除非前一个对话回合中使用者发出一对话终止提示信息。
Priority Applications (4)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710383843.8A CN107274897A (zh) | 2013-04-10 | 2013-07-11 | 语音操控方法与移动终端装置 |
CN201310291242.6A CN104104790A (zh) | 2013-04-10 | 2013-07-11 | 语音操控方法与移动终端装置 |
TW102125767A TWI489372B (zh) | 2013-04-10 | 2013-07-18 | 語音操控方法與行動終端裝置 |
US14/231,765 US20140309996A1 (en) | 2013-04-10 | 2014-04-01 | Voice control method and mobile terminal apparatus |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201310123229XA CN103198831A (zh) | 2013-04-10 | 2013-04-10 | 语音操控方法与移动终端装置 |
CN201310123229.X | 2013-04-10 | ||
CN201310291242.6A CN104104790A (zh) | 2013-04-10 | 2013-07-11 | 语音操控方法与移动终端装置 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710383843.8A Division CN107274897A (zh) | 2013-04-10 | 2013-07-11 | 语音操控方法与移动终端装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN104104790A true CN104104790A (zh) | 2014-10-15 |
Family
ID=48721306
Family Applications (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310123229XA Pending CN103198831A (zh) | 2013-04-10 | 2013-04-10 | 语音操控方法与移动终端装置 |
CN201710383843.8A Pending CN107274897A (zh) | 2013-04-10 | 2013-07-11 | 语音操控方法与移动终端装置 |
CN201310291242.6A Pending CN104104790A (zh) | 2013-04-10 | 2013-07-11 | 语音操控方法与移动终端装置 |
Family Applications Before (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201310123229XA Pending CN103198831A (zh) | 2013-04-10 | 2013-04-10 | 语音操控方法与移动终端装置 |
CN201710383843.8A Pending CN107274897A (zh) | 2013-04-10 | 2013-07-11 | 语音操控方法与移动终端装置 |
Country Status (3)
Country | Link |
---|---|
US (1) | US20140309996A1 (zh) |
CN (3) | CN103198831A (zh) |
TW (1) | TWI489372B (zh) |
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104821168A (zh) * | 2015-04-30 | 2015-08-05 | 北京京东方多媒体科技有限公司 | 一种语音识别方法及装置 |
CN105100455A (zh) * | 2015-07-06 | 2015-11-25 | 珠海格力电器股份有限公司 | 语音控制接听来电通话的方法和装置 |
CN106653021A (zh) * | 2016-12-27 | 2017-05-10 | 上海智臻智能网络科技股份有限公司 | 语音唤醒的控制方法、装置及终端 |
CN106782554A (zh) * | 2016-12-19 | 2017-05-31 | 百度在线网络技术(北京)有限公司 | 基于人工智能的语音唤醒方法和装置 |
CN107016070A (zh) * | 2017-03-22 | 2017-08-04 | 北京光年无限科技有限公司 | 一种用于智能机器人的人机对话方法及装置 |
CN107077846A (zh) * | 2014-10-24 | 2017-08-18 | 索尼互动娱乐股份有限公司 | 控制装置、控制方法、程序和信息存储介质 |
CN107147809A (zh) * | 2015-03-06 | 2017-09-08 | 广东欧珀移动通信有限公司 | 一种移动终端便捷通话方法及系统 |
CN109145096A (zh) * | 2017-06-27 | 2019-01-04 | 中国海洋大学 | 基于规则库的个性化日常陪护机器人自动问答系统 |
CN109377989A (zh) * | 2018-09-27 | 2019-02-22 | 上海与德科技有限公司 | 唤醒方法、装置、系统、设备及存储介质 |
CN109686368A (zh) * | 2018-12-10 | 2019-04-26 | 北京梧桐车联科技有限责任公司 | 语音唤醒应答处理方法及装置、电子设备及存储介质 |
CN111899734A (zh) * | 2020-07-16 | 2020-11-06 | 陕西闪现智能科技有限公司 | 智能语音对话装置及其运行方法、智能语音对话机器人 |
Families Citing this family (145)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8677377B2 (en) | 2005-09-08 | 2014-03-18 | Apple Inc. | Method and apparatus for building an intelligent automated assistant |
US9318108B2 (en) | 2010-01-18 | 2016-04-19 | Apple Inc. | Intelligent automated assistant |
US8977255B2 (en) | 2007-04-03 | 2015-03-10 | Apple Inc. | Method and system for operating a multi-function portable electronic device using voice-activation |
US8676904B2 (en) | 2008-10-02 | 2014-03-18 | Apple Inc. | Electronic devices with voice command and contextual data processing capabilities |
US10706373B2 (en) | 2011-06-03 | 2020-07-07 | Apple Inc. | Performing actions associated with task items that represent tasks to perform |
US10276170B2 (en) | 2010-01-18 | 2019-04-30 | Apple Inc. | Intelligent automated assistant |
US8682667B2 (en) | 2010-02-25 | 2014-03-25 | Apple Inc. | User profiling for selecting user specific voice input processing information |
US10417037B2 (en) | 2012-05-15 | 2019-09-17 | Apple Inc. | Systems and methods for integrating third party services with a digital assistant |
KR20240132105A (ko) | 2013-02-07 | 2024-09-02 | 애플 인크. | 디지털 어시스턴트를 위한 음성 트리거 |
US10652394B2 (en) | 2013-03-14 | 2020-05-12 | Apple Inc. | System and method for processing voicemail |
US10748529B1 (en) | 2013-03-15 | 2020-08-18 | Apple Inc. | Voice activated device for use with a voice-based digital assistant |
KR101772152B1 (ko) | 2013-06-09 | 2017-08-28 | 애플 인크. | 디지털 어시스턴트의 둘 이상의 인스턴스들에 걸친 대화 지속성을 가능하게 하기 위한 디바이스, 방법 및 그래픽 사용자 인터페이스 |
US10176167B2 (en) | 2013-06-09 | 2019-01-08 | Apple Inc. | System and method for inferring user intent from speech inputs |
DE112014003653B4 (de) | 2013-08-06 | 2024-04-18 | Apple Inc. | Automatisch aktivierende intelligente Antworten auf der Grundlage von Aktivitäten von entfernt angeordneten Vorrichtungen |
CN105493180B (zh) * | 2013-08-26 | 2019-08-30 | 三星电子株式会社 | 用于语音识别的电子装置和方法 |
CN103595869A (zh) * | 2013-11-15 | 2014-02-19 | 华为终端有限公司 | 一种终端语音控制方法、装置及终端 |
US10296160B2 (en) | 2013-12-06 | 2019-05-21 | Apple Inc. | Method for extracting salient dialog usage from live data |
JP6359327B2 (ja) * | 2014-04-25 | 2018-07-18 | シャープ株式会社 | 情報処理装置および制御プログラム |
US10553098B2 (en) | 2014-05-20 | 2020-02-04 | Ooma, Inc. | Appliance device integration with alarm systems |
US9633547B2 (en) | 2014-05-20 | 2017-04-25 | Ooma, Inc. | Security monitoring and control |
KR102245098B1 (ko) * | 2014-05-23 | 2021-04-28 | 삼성전자주식회사 | 휴대 단말 및 그 제어 방법 |
US9715875B2 (en) | 2014-05-30 | 2017-07-25 | Apple Inc. | Reducing the need for manual start/end-pointing and trigger phrases |
US10170123B2 (en) | 2014-05-30 | 2019-01-01 | Apple Inc. | Intelligent assistant for home automation |
US9633004B2 (en) | 2014-05-30 | 2017-04-25 | Apple Inc. | Better resolution when referencing to concepts |
CN110797019B (zh) | 2014-05-30 | 2023-08-29 | 苹果公司 | 多命令单一话语输入方法 |
US9430463B2 (en) | 2014-05-30 | 2016-08-30 | Apple Inc. | Exemplar-based natural language processing |
US9338493B2 (en) | 2014-06-30 | 2016-05-10 | Apple Inc. | Intelligent automated assistant for TV user interactions |
US11330100B2 (en) * | 2014-07-09 | 2022-05-10 | Ooma, Inc. | Server based intelligent personal assistant services |
CN104253902A (zh) * | 2014-07-21 | 2014-12-31 | 宋婉毓 | 与智能语音设备进行语音交互的方法 |
CN105490890A (zh) * | 2014-09-16 | 2016-04-13 | 中兴通讯股份有限公司 | 智能家庭终端及其控制方法 |
US9668121B2 (en) | 2014-09-30 | 2017-05-30 | Apple Inc. | Social reminders |
US10127911B2 (en) | 2014-09-30 | 2018-11-13 | Apple Inc. | Speaker identification and unsupervised speaker adaptation techniques |
KR102299330B1 (ko) * | 2014-11-26 | 2021-09-08 | 삼성전자주식회사 | 음성 인식 방법 및 그 전자 장치 |
KR101643560B1 (ko) * | 2014-12-17 | 2016-08-10 | 현대자동차주식회사 | 음성 인식 장치, 그를 가지는 차량 및 그 방법 |
CN105788600B (zh) * | 2014-12-26 | 2019-07-26 | 联想(北京)有限公司 | 声纹识别方法和电子设备 |
CN104598192B (zh) * | 2014-12-29 | 2018-08-07 | 联想(北京)有限公司 | 信息处理方法及电子设备 |
US10152299B2 (en) | 2015-03-06 | 2018-12-11 | Apple Inc. | Reducing response latency of intelligent automated assistants |
US9886953B2 (en) * | 2015-03-08 | 2018-02-06 | Apple Inc. | Virtual assistant activation |
US9721566B2 (en) | 2015-03-08 | 2017-08-01 | Apple Inc. | Competing devices responding to voice triggers |
US10009286B2 (en) | 2015-05-08 | 2018-06-26 | Ooma, Inc. | Communications hub |
US10460227B2 (en) | 2015-05-15 | 2019-10-29 | Apple Inc. | Virtual assistant in a communication session |
CN104916015B (zh) * | 2015-05-25 | 2018-02-06 | 安恒世通(北京)网络科技有限公司 | 一种声控锁具的方法 |
US10200824B2 (en) | 2015-05-27 | 2019-02-05 | Apple Inc. | Systems and methods for proactively identifying and surfacing relevant content on a touch-sensitive device |
US10083688B2 (en) | 2015-05-27 | 2018-09-25 | Apple Inc. | Device voice control for selecting a displayed affordance |
US9578173B2 (en) | 2015-06-05 | 2017-02-21 | Apple Inc. | Virtual assistant aided communication with 3rd party service in a communication session |
US10235129B1 (en) | 2015-06-29 | 2019-03-19 | Amazon Technologies, Inc. | Joining users to communications via voice commands |
US20160378747A1 (en) | 2015-06-29 | 2016-12-29 | Apple Inc. | Virtual assistant for media playback |
CN106326307A (zh) * | 2015-06-30 | 2017-01-11 | 芋头科技(杭州)有限公司 | 一种语言交互方法 |
CN105224278B (zh) * | 2015-08-21 | 2019-02-22 | 百度在线网络技术(北京)有限公司 | 语音交互服务处理方法及装置 |
US10740384B2 (en) | 2015-09-08 | 2020-08-11 | Apple Inc. | Intelligent automated assistant for media search and playback |
US10331312B2 (en) | 2015-09-08 | 2019-06-25 | Apple Inc. | Intelligent automated assistant in a media environment |
US10671428B2 (en) | 2015-09-08 | 2020-06-02 | Apple Inc. | Distributed personal assistant |
US10747498B2 (en) | 2015-09-08 | 2020-08-18 | Apple Inc. | Zero latency digital assistant |
US11587559B2 (en) | 2015-09-30 | 2023-02-21 | Apple Inc. | Intelligent device identification |
US10691473B2 (en) | 2015-11-06 | 2020-06-23 | Apple Inc. | Intelligent automated assistant in a messaging environment |
US10956666B2 (en) | 2015-11-09 | 2021-03-23 | Apple Inc. | Unconventional virtual assistant interactions |
CN105471712A (zh) * | 2015-11-25 | 2016-04-06 | 深圳狗尾草智能科技有限公司 | 一种机器人答复系统及其答复方法 |
US10223066B2 (en) | 2015-12-23 | 2019-03-05 | Apple Inc. | Proactive assistance based on dialog communication between devices |
CN105704327B (zh) * | 2016-03-31 | 2019-06-14 | 宇龙计算机通信科技(深圳)有限公司 | 一种拒接电话的方法及系统 |
US10854199B2 (en) | 2016-04-22 | 2020-12-01 | Hewlett-Packard Development Company, L.P. | Communications with trigger phrases |
US11227589B2 (en) | 2016-06-06 | 2022-01-18 | Apple Inc. | Intelligent list reading |
US10586535B2 (en) | 2016-06-10 | 2020-03-10 | Apple Inc. | Intelligent digital assistant in a multi-tasking environment |
DK179415B1 (en) | 2016-06-11 | 2018-06-14 | Apple Inc | Intelligent device arbitration and control |
DK201670540A1 (en) | 2016-06-11 | 2018-01-08 | Apple Inc | Application integration with a digital assistant |
TWI584270B (zh) * | 2016-06-15 | 2017-05-21 | 瑞昱半導體股份有限公司 | 語音控制系統及其方法 |
CN107644640A (zh) * | 2016-07-22 | 2018-01-30 | 佛山市顺德区美的电热电器制造有限公司 | 一种信息处理方法及家电设备 |
US10580404B2 (en) * | 2016-09-01 | 2020-03-03 | Amazon Technologies, Inc. | Indicator for voice-based communications |
US10474753B2 (en) | 2016-09-07 | 2019-11-12 | Apple Inc. | Language identification using recurrent neural networks |
CN106603826A (zh) * | 2016-11-29 | 2017-04-26 | 维沃移动通信有限公司 | 一种应用事件的处理方法及移动终端 |
US11204787B2 (en) | 2017-01-09 | 2021-12-21 | Apple Inc. | Application integration with a digital assistant |
CN106782541A (zh) * | 2017-02-24 | 2017-05-31 | 太仓市同维电子有限公司 | 一种带有语音识别功能的家庭网关设计方法 |
DK201770383A1 (en) | 2017-05-09 | 2018-12-14 | Apple Inc. | USER INTERFACE FOR CORRECTING RECOGNITION ERRORS |
US10395654B2 (en) | 2017-05-11 | 2019-08-27 | Apple Inc. | Text normalization based on a data-driven learning network |
DK180048B1 (en) | 2017-05-11 | 2020-02-04 | Apple Inc. | MAINTAINING THE DATA PROTECTION OF PERSONAL INFORMATION |
US10726832B2 (en) | 2017-05-11 | 2020-07-28 | Apple Inc. | Maintaining privacy of personal information |
DK201770428A1 (en) | 2017-05-12 | 2019-02-18 | Apple Inc. | LOW-LATENCY INTELLIGENT AUTOMATED ASSISTANT |
US11301477B2 (en) | 2017-05-12 | 2022-04-12 | Apple Inc. | Feedback analysis of a digital assistant |
DK179745B1 (en) | 2017-05-12 | 2019-05-01 | Apple Inc. | SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT |
DK179496B1 (en) | 2017-05-12 | 2019-01-15 | Apple Inc. | USER-SPECIFIC Acoustic Models |
DK201770411A1 (en) | 2017-05-15 | 2018-12-20 | Apple Inc. | MULTI-MODAL INTERFACES |
US20180336892A1 (en) | 2017-05-16 | 2018-11-22 | Apple Inc. | Detecting a trigger of a digital assistant |
DK179549B1 (en) | 2017-05-16 | 2019-02-12 | Apple Inc. | FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES |
US20180336275A1 (en) | 2017-05-16 | 2018-11-22 | Apple Inc. | Intelligent automated assistant for media exploration |
US10311144B2 (en) | 2017-05-16 | 2019-06-04 | Apple Inc. | Emoji word sense disambiguation |
CN107291451B (zh) * | 2017-05-25 | 2021-01-19 | 深圳市冠旭电子股份有限公司 | 语音唤醒方法及装置 |
US11269393B2 (en) * | 2017-06-02 | 2022-03-08 | Apple Inc. | Techniques for adjusting computing device sleep states |
US20190019505A1 (en) * | 2017-07-12 | 2019-01-17 | Lenovo (Singapore) Pte. Ltd. | Sustaining conversational session |
TWI655624B (zh) * | 2017-08-03 | 2019-04-01 | 晨星半導體股份有限公司 | 聲控裝置及相關的聲音訊號處理方法 |
CN107895578B (zh) * | 2017-11-15 | 2021-07-20 | 百度在线网络技术(北京)有限公司 | 语音交互方法和装置 |
CN107886948A (zh) * | 2017-11-16 | 2018-04-06 | 百度在线网络技术(北京)有限公司 | 语音交互方法及装置,终端,服务器及可读存储介质 |
CN108182939A (zh) * | 2017-12-13 | 2018-06-19 | 苏州车萝卜汽车电子科技有限公司 | 用于自助服务的语音处理方法及装置 |
CN110136719B (zh) * | 2018-02-02 | 2022-01-28 | 上海流利说信息技术有限公司 | 一种实现智能语音对话的方法、装置及系统 |
CN110164426B (zh) * | 2018-02-10 | 2021-10-26 | 佛山市顺德区美的电热电器制造有限公司 | 语音控制方法和计算机存储介质 |
US10592604B2 (en) | 2018-03-12 | 2020-03-17 | Apple Inc. | Inverse text normalization for automatic speech recognition |
US10818288B2 (en) | 2018-03-26 | 2020-10-27 | Apple Inc. | Natural assistant interaction |
US10928918B2 (en) | 2018-05-07 | 2021-02-23 | Apple Inc. | Raise to speak |
US11145294B2 (en) | 2018-05-07 | 2021-10-12 | Apple Inc. | Intelligent automated assistant for delivering content from user experiences |
DK180639B1 (en) | 2018-06-01 | 2021-11-04 | Apple Inc | DISABILITY OF ATTENTION-ATTENTIVE VIRTUAL ASSISTANT |
US10892996B2 (en) | 2018-06-01 | 2021-01-12 | Apple Inc. | Variable latency device coordination |
DK201870355A1 (en) | 2018-06-01 | 2019-12-16 | Apple Inc. | VIRTUAL ASSISTANT OPERATION IN MULTI-DEVICE ENVIRONMENTS |
DK179822B1 (da) | 2018-06-01 | 2019-07-12 | Apple Inc. | Voice interaction at a primary device to access call functionality of a companion device |
US11076039B2 (en) | 2018-06-03 | 2021-07-27 | Apple Inc. | Accelerated task performance |
CN108847216B (zh) * | 2018-06-26 | 2021-07-16 | 联想(北京)有限公司 | 语音处理方法及电子设备、存储介质 |
CN108847236A (zh) * | 2018-07-26 | 2018-11-20 | 珠海格力电器股份有限公司 | 语音信息的接收方法及装置、语音信息的解析方法及装置 |
CN108986809B (zh) * | 2018-08-30 | 2020-01-03 | 广东小天才科技有限公司 | 一种便携式设备及其唤醒方法和装置 |
US11010561B2 (en) | 2018-09-27 | 2021-05-18 | Apple Inc. | Sentiment prediction from textual data |
US11170166B2 (en) | 2018-09-28 | 2021-11-09 | Apple Inc. | Neural typographical error modeling via generative adversarial networks |
US10839159B2 (en) | 2018-09-28 | 2020-11-17 | Apple Inc. | Named entity normalization in a spoken dialog system |
US11462215B2 (en) | 2018-09-28 | 2022-10-04 | Apple Inc. | Multi-modal inputs for voice commands |
US11475898B2 (en) | 2018-10-26 | 2022-10-18 | Apple Inc. | Low-latency multi-speaker speech recognition |
CN109243462A (zh) * | 2018-11-20 | 2019-01-18 | 广东小天才科技有限公司 | 一种语音唤醒方法及装置 |
CN109545211A (zh) * | 2018-12-07 | 2019-03-29 | 苏州思必驰信息科技有限公司 | 语音交互方法及系统 |
CN109788128A (zh) * | 2018-12-27 | 2019-05-21 | 深圳市优必选科技有限公司 | 一种来电提示方法、来电提示装置及终端设备 |
US11638059B2 (en) | 2019-01-04 | 2023-04-25 | Apple Inc. | Content playback on multiple devices |
CN109584878A (zh) * | 2019-01-14 | 2019-04-05 | 广东小天才科技有限公司 | 一种语音唤醒方法及系统 |
CN109767767A (zh) * | 2019-01-25 | 2019-05-17 | 广州富港万嘉智能科技有限公司 | 一种语音交互方法、系统、电子设备及存储介质 |
US11348573B2 (en) | 2019-03-18 | 2022-05-31 | Apple Inc. | Multimodality in digital assistant systems |
CN113711306A (zh) * | 2019-04-09 | 2021-11-26 | 哈曼国际工业有限公司 | 车辆系统的语音控制 |
US11423908B2 (en) | 2019-05-06 | 2022-08-23 | Apple Inc. | Interpreting spoken requests |
DK201970509A1 (en) | 2019-05-06 | 2021-01-15 | Apple Inc | Spoken notifications |
US11475884B2 (en) | 2019-05-06 | 2022-10-18 | Apple Inc. | Reducing digital assistant latency when a language is incorrectly determined |
US11307752B2 (en) | 2019-05-06 | 2022-04-19 | Apple Inc. | User configurable task triggers |
US11140099B2 (en) | 2019-05-21 | 2021-10-05 | Apple Inc. | Providing message response suggestions |
CN110025172A (zh) * | 2019-05-27 | 2019-07-19 | 广东金石卖场建设有限公司 | 一种语音控制的服装展示架 |
DK201970511A1 (en) | 2019-05-31 | 2021-02-15 | Apple Inc | Voice identification in digital assistant systems |
US11496600B2 (en) | 2019-05-31 | 2022-11-08 | Apple Inc. | Remote execution of machine-learned models |
US11289073B2 (en) | 2019-05-31 | 2022-03-29 | Apple Inc. | Device text to speech |
DK180129B1 (en) | 2019-05-31 | 2020-06-02 | Apple Inc. | USER ACTIVITY SHORTCUT SUGGESTIONS |
US11227599B2 (en) | 2019-06-01 | 2022-01-18 | Apple Inc. | Methods and user interfaces for voice-based control of electronic devices |
US11360641B2 (en) | 2019-06-01 | 2022-06-14 | Apple Inc. | Increasing the relevance of new available information |
CN110246497A (zh) * | 2019-07-09 | 2019-09-17 | 王振仁 | 一种语音控制灯具的控制方法、系统及介质 |
CN110364143B (zh) * | 2019-08-14 | 2022-01-28 | 腾讯科技(深圳)有限公司 | 语音唤醒方法、装置及其智能电子设备 |
CN110473556B (zh) * | 2019-09-17 | 2022-06-21 | 深圳市万普拉斯科技有限公司 | 语音识别方法、装置和移动终端 |
WO2021056255A1 (en) | 2019-09-25 | 2021-04-01 | Apple Inc. | Text detection using global geometry estimators |
CN112732340B (zh) * | 2019-10-14 | 2022-03-15 | 思必驰科技股份有限公司 | 人机对话处理方法及装置 |
US11061543B1 (en) | 2020-05-11 | 2021-07-13 | Apple Inc. | Providing relevant data items based on context |
US11038934B1 (en) | 2020-05-11 | 2021-06-15 | Apple Inc. | Digital assistant hardware abstraction |
US11755276B2 (en) | 2020-05-12 | 2023-09-12 | Apple Inc. | Reducing description length based on confidence |
US11490204B2 (en) | 2020-07-20 | 2022-11-01 | Apple Inc. | Multi-device audio adjustment coordination |
US11438683B2 (en) | 2020-07-21 | 2022-09-06 | Apple Inc. | User identification using headphones |
CN112233672A (zh) * | 2020-09-30 | 2021-01-15 | 成都长虹网络科技有限责任公司 | 分布式语音控制方法、系统、计算机设备和可读存储介质 |
CN112435663A (zh) * | 2020-11-11 | 2021-03-02 | 青岛歌尔智能传感器有限公司 | 命令语音管理方法、装置、设备及介质 |
TWI790647B (zh) * | 2021-01-13 | 2023-01-21 | 神盾股份有限公司 | 語音助理系統 |
WO2022255992A1 (en) * | 2021-06-01 | 2022-12-08 | Paymentus Corporation | Methods, apparatuses, and systems for dynamically navigating interactive communication systems |
CN114020189B (zh) * | 2022-01-05 | 2022-04-19 | 浙江口碑网络技术有限公司 | 易查模式开启方法、装置及电子设备 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1542734A (zh) * | 2003-05-02 | 2004-11-03 | ������������ʽ���� | 声音识别装置以及方法 |
US20050114132A1 (en) * | 2003-11-21 | 2005-05-26 | Acer Inc. | Voice interactive method and system |
TW201013635A (en) * | 2008-09-24 | 2010-04-01 | Mitac Int Corp | Intelligent voice system and method thereof |
US8165886B1 (en) * | 2007-10-04 | 2012-04-24 | Great Northern Research LLC | Speech interface system and method for control and interaction with applications on a computing system |
CN202413790U (zh) * | 2011-12-15 | 2012-09-05 | 浙江吉利汽车研究院有限公司 | 一种汽车自适应性语音提示系统 |
US20130031476A1 (en) * | 2011-07-25 | 2013-01-31 | Coin Emmett | Voice activated virtual assistant |
Family Cites Families (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5842168A (en) * | 1995-08-21 | 1998-11-24 | Seiko Epson Corporation | Cartridge-based, interactive speech recognition device with response-creation capability |
US20010047263A1 (en) * | 1997-12-18 | 2001-11-29 | Colin Donald Smith | Multimodal user interface |
US6965863B1 (en) * | 1998-11-12 | 2005-11-15 | Microsoft Corporation | Speech recognition user interface |
US7292678B2 (en) * | 2000-08-31 | 2007-11-06 | Lamson Holdings Llc | Voice activated, voice responsive product locator system, including product location method utilizing product bar code and aisle-situated, aisle-identifying bar code |
US20050209858A1 (en) * | 2004-03-16 | 2005-09-22 | Robert Zak | Apparatus and method for voice activated communication |
CN100474871C (zh) * | 2005-12-20 | 2009-04-01 | 中国人民解放军信息工程大学 | 一种信号传输信道检测方法和呼叫控制系统 |
US10540976B2 (en) * | 2009-06-05 | 2020-01-21 | Apple Inc. | Contextual voice commands |
US10705794B2 (en) * | 2010-01-18 | 2020-07-07 | Apple Inc. | Automatically adapting user interfaces for hands-free interaction |
CN102332269A (zh) * | 2011-06-03 | 2012-01-25 | 陈威 | 呼吸面具中呼吸噪声的消除方法 |
CN102447786A (zh) * | 2011-11-14 | 2012-05-09 | 候万春 | 一种个人专用生活协助装置和方法 |
CN102722662A (zh) * | 2012-05-14 | 2012-10-10 | 深圳职业技术学院 | 一种计算机的声控锁屏和解屏系统及方法 |
KR102009423B1 (ko) * | 2012-10-08 | 2019-08-09 | 삼성전자주식회사 | 음성 인식을 이용한 미리 설정된 동작 모드의 수행 방법 및 장치 |
-
2013
- 2013-04-10 CN CN201310123229XA patent/CN103198831A/zh active Pending
- 2013-07-11 CN CN201710383843.8A patent/CN107274897A/zh active Pending
- 2013-07-11 CN CN201310291242.6A patent/CN104104790A/zh active Pending
- 2013-07-18 TW TW102125767A patent/TWI489372B/zh active
-
2014
- 2014-04-01 US US14/231,765 patent/US20140309996A1/en not_active Abandoned
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1542734A (zh) * | 2003-05-02 | 2004-11-03 | ������������ʽ���� | 声音识别装置以及方法 |
US20050114132A1 (en) * | 2003-11-21 | 2005-05-26 | Acer Inc. | Voice interactive method and system |
US8165886B1 (en) * | 2007-10-04 | 2012-04-24 | Great Northern Research LLC | Speech interface system and method for control and interaction with applications on a computing system |
TW201013635A (en) * | 2008-09-24 | 2010-04-01 | Mitac Int Corp | Intelligent voice system and method thereof |
US20130031476A1 (en) * | 2011-07-25 | 2013-01-31 | Coin Emmett | Voice activated virtual assistant |
CN202413790U (zh) * | 2011-12-15 | 2012-09-05 | 浙江吉利汽车研究院有限公司 | 一种汽车自适应性语音提示系统 |
Cited By (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107077846A (zh) * | 2014-10-24 | 2017-08-18 | 索尼互动娱乐股份有限公司 | 控制装置、控制方法、程序和信息存储介质 |
CN107147809B (zh) * | 2015-03-06 | 2020-04-10 | Oppo广东移动通信有限公司 | 一种移动终端便捷通话方法及系统 |
CN107147809A (zh) * | 2015-03-06 | 2017-09-08 | 广东欧珀移动通信有限公司 | 一种移动终端便捷通话方法及系统 |
US9799335B2 (en) | 2015-04-30 | 2017-10-24 | Boe Technology Group Co., Ltd. | Method and device for speech recognition |
CN104821168B (zh) * | 2015-04-30 | 2017-03-29 | 北京京东方多媒体科技有限公司 | 一种语音识别方法及装置 |
CN104821168A (zh) * | 2015-04-30 | 2015-08-05 | 北京京东方多媒体科技有限公司 | 一种语音识别方法及装置 |
CN105100455A (zh) * | 2015-07-06 | 2015-11-25 | 珠海格力电器股份有限公司 | 语音控制接听来电通话的方法和装置 |
CN106782554A (zh) * | 2016-12-19 | 2017-05-31 | 百度在线网络技术(北京)有限公司 | 基于人工智能的语音唤醒方法和装置 |
CN106653021A (zh) * | 2016-12-27 | 2017-05-10 | 上海智臻智能网络科技股份有限公司 | 语音唤醒的控制方法、装置及终端 |
CN107016070A (zh) * | 2017-03-22 | 2017-08-04 | 北京光年无限科技有限公司 | 一种用于智能机器人的人机对话方法及装置 |
CN107016070B (zh) * | 2017-03-22 | 2020-06-02 | 北京光年无限科技有限公司 | 一种用于智能机器人的人机对话方法及装置 |
CN109145096A (zh) * | 2017-06-27 | 2019-01-04 | 中国海洋大学 | 基于规则库的个性化日常陪护机器人自动问答系统 |
CN109377989A (zh) * | 2018-09-27 | 2019-02-22 | 上海与德科技有限公司 | 唤醒方法、装置、系统、设备及存储介质 |
CN109377989B (zh) * | 2018-09-27 | 2021-03-12 | 昆山品源知识产权运营科技有限公司 | 唤醒方法、装置、系统、设备及存储介质 |
CN109686368A (zh) * | 2018-12-10 | 2019-04-26 | 北京梧桐车联科技有限责任公司 | 语音唤醒应答处理方法及装置、电子设备及存储介质 |
CN111899734A (zh) * | 2020-07-16 | 2020-11-06 | 陕西闪现智能科技有限公司 | 智能语音对话装置及其运行方法、智能语音对话机器人 |
Also Published As
Publication number | Publication date |
---|---|
CN107274897A (zh) | 2017-10-20 |
TWI489372B (zh) | 2015-06-21 |
US20140309996A1 (en) | 2014-10-16 |
TW201439896A (zh) | 2014-10-16 |
CN103198831A (zh) | 2013-07-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104104790A (zh) | 语音操控方法与移动终端装置 | |
CN104104789A (zh) | 语音接听方法与移动终端装置 | |
AU2019246868B2 (en) | Method and system for voice activation | |
CN107895578B (zh) | 语音交互方法和装置 | |
CN1220176C (zh) | 用于一种语音识别设备的训练或适配方法 | |
CN108108142A (zh) | 语音信息处理方法、装置、终端设备及存储介质 | |
CN107978316A (zh) | 控制终端的方法及装置 | |
CN106201424A (zh) | 一种信息交互方法、装置及电子设备 | |
CN104168353A (zh) | 蓝牙耳机及其语音交互控制方法 | |
CN101971250A (zh) | 具有活动语音识别的移动电子设备 | |
CN113705943B (zh) | 基于语音对讲功能的任务管理方法、系统与移动装置 | |
CN104702789A (zh) | 具有语音控制功能的智能手机及其语音控制方法 | |
CN101415257A (zh) | 一种人机对话聊天方法 | |
KR20140067687A (ko) | 대화형 음성인식이 가능한 차량 시스템 | |
CN106791210A (zh) | 一种手机来电接听装置及来电接听方法 | |
US8321227B2 (en) | Methods and devices for appending an address list and determining a communication profile | |
CN109036401A (zh) | 一种开启语音控制系统的方法 | |
CN105007365A (zh) | 一种分机号拨打方法及装置 | |
CN104575496A (zh) | 一种自动发送多媒体文件的方法及装置、移动终端 | |
KR100467593B1 (ko) | 음성인식 키 입력 무선 단말장치, 무선 단말장치에서키입력 대신 음성을 이용하는 방법 및 그 기록매체 | |
CN105472152A (zh) | 一种智能终端自动接听电话的方法系统 | |
CN101588415A (zh) | 语音服务方法和语音服务系统 | |
CN109618417B (zh) | 一种交互实现方法、系统、配件以及存储介质 | |
CN111274828A (zh) | 基于留言的语言翻译方法、系统、计算机程序和手持终端 | |
CN204775061U (zh) | 一种基于移动汽车服务盒子的系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20141015 |
|
RJ01 | Rejection of invention patent application after publication |