CN103220423A - 语音接听方法与移动终端装置 - Google Patents

语音接听方法与移动终端装置 Download PDF

Info

Publication number
CN103220423A
CN103220423A CN 201310122236 CN201310122236A CN103220423A CN 103220423 A CN103220423 A CN 103220423A CN 201310122236 CN201310122236 CN 201310122236 CN 201310122236 A CN201310122236 A CN 201310122236A CN 103220423 A CN103220423 A CN 103220423A
Authority
CN
China
Prior art keywords
voice
mobile terminal
terminal apparatus
incoming call
voice signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN 201310122236
Other languages
English (en)
Inventor
寻亮
张国峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Via Technologies Inc
Original Assignee
Via Technologies Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Via Technologies Inc filed Critical Via Technologies Inc
Priority to CN 201310122236 priority Critical patent/CN103220423A/zh
Priority to CN201710903738.2A priority patent/CN107613132A/zh
Priority to CN201310291083.XA priority patent/CN104104789A/zh
Priority to TW102125584A priority patent/TWI535258B/zh
Publication of CN103220423A publication Critical patent/CN103220423A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Telephonic Communication Services (AREA)
  • Telephone Function (AREA)
  • Mobile Radio Communication Systems (AREA)

Abstract

一种语音接听方法与移动终端装置,其中移动终端装置具有通常模式及第一模式。语音接听方法包括以下步骤。从通常模式切换为第一模式。当于第一模式接收到来电通话时,发送语音通知,并启动接收语音信号。解析语音信号以获得语音辨识结果,以及根据语音辨识结果,执行对应的应答操作。

Description

语音接听方法与移动终端装置
技术领域
本发明是有关于一种语音操控的技术,且特别是有关于一种语音接听方法与移动终端装置。
背景技术
随着科技的发展,具有语音系统的移动终端装置已日渐普及。上述的语音系统是通过语音理解技术,让使用者与移动终端装置进行沟通。举例来说,使用者只要对上述的移动终端装置讲出某项要求,例如想要查车次、查天气或是欲拨打电话等,系统便会依据使用者的语音信号,采取对应的动作。上述的动作可能是以语音方式回答使用者问题或是依照使用者指令去驱使移动终端装置的系统进行动作。
以语音系统启动的便捷性来说,目前大都是触发移动终端装置的屏幕其所显示的应用程序来启动,或者通过移动终端装置所设置的实体按键来启动。上述的设计皆须通过移动终端装置本身来启动,但是在某些场合,上述的设计却是相当的不便。比如说:在行车期间,或者在厨房做菜时,需要拨打位于客厅的行动电话,以询问友人食谱细节等使用者无法立即触及移动终端装置,但需使语音系统开启的情况。更进一步,开启语音对话后,如何进行更符合人类对话自然规律的完全脱手的多次交互对话。
基于此,如何改进上述的这些缺点,成为亟待解决的议题。
发明内容
本发明提供一种语音接听方法与移动终端装置,可更快速地提供语音服务。使用者仅需发送具有识别信息的语音信号,即可方便地与移动终端装置进行语音沟通,且移动终端装置可根据使用者所说的内容来终止语音交互,更符合人类对话的自然规律,使得在对话过程中不再需要手动参与,可以实现人机对话的完全脱手,藉以可更方便、快速地提供语音服务。
本发明提出一种语音接听方法,用于具有通常模式及第一模式的移动终端装置。语音接听方法包括以下步骤。从通常模式切换为第一模式。当于第一模式接收到来电通话时,发送语音通知,并启动接收语音信号。解析语音信号以获得语音辨识结果。根据语音辨识结果,执行对应的应答操作。
本发明另提出一种移动终端装置,其包括语音输出单元、语音接收单元、语言理解模块以及来电接收单元。语音输出单元用以发送语音通知。语音接收单元用以接收语音信号。语言理解模块耦接于语音接收单元,用以解析语音信号。来电接收单元耦接于语音输出单元与语言理解模块。来电接收单元用以接收来电通话及执行应答操作。其中,移动终端装置从通常模式切换为第一模式,且当来电接收单元接收来电通话时,来电接收单元通过语音输出单元发送语音通知,并启动语音接收单元接收语音信号。并且,语言理解模块解析语音信号以获得语音辨识结果,以及来电接收单元根据语音辨识结果执行对应的应答操作。
基于上述,当移动终端装置在第一模式接收到来电通话时,移动终端装置可发送语音通知以询问使用者,而让使用者可根据语音通知,通过语音的方式来操控移动终端装置进行回应。并且,移动终端装置可根据来自使用者所说的话,执行对应的应答操作。如此一来,移动终端装置可更快速地提供语音服务,让使用者可更加便利地、更便捷地操控移动终端装置。
为让本发明的上述特征和优点能更明显易懂,下文特举实施例,并结合所附图式作详细说明如下。
附图说明
图1是依照本发明一实施例所绘示的移动终端装置的方块图。
图2是依照本发明一实施例所绘示的语音接听方法的流程图。
图3是依照本发明一实施例所绘示的移动终端装置的方块图。
图4是依照本发明一实施例所绘示的语音操控方法的流程图。
图5是依照本发明一实施例所绘示的语音操控方法的流程图。
具体实施方式
虽然现今的移动终端装置已可提供语音系统,以让使用者发出语音来和移动终端装置沟通,但使用者在启动此语音系统时,仍必须通过移动终端装置本身来启动。因此在使用者无法立即触及移动终端装置,但需使语音系统开启的情况,往往无法满足使用者立即的需求。更进一步,即使能够唤醒语音对话系统,但目前的行动装置在对话过程中仍然需要手的不时参与,比如使用者提问结束后,需要再次询问时需要手动再次开启语音对话系统,极不方便。为此,本发明提出一种语音接听方法、语音操控方法及移动终端装置,让使用者能够更便捷地开启语音系统。更进一步,本发明能够使得使用者在整个对话过程中,摆脱手的操作,使得对话更加便捷快速自然。为了使本发明的内容更为明了,以下特举实施例作为本发明确实能够据以实施的范例。
图1是依照本发明一实施例所绘示的移动终端装置的方块图。请参照图1,移动终端装置100具有语音输出单元110、语音接收单元120、语言理解模块130以及来电接收单元140。移动终端装置100例如为行动电话(Cellphone)、个人数字助理(Personal Digital Assistant,PDA)手机、智能手机(Smartphone),或是安装有通讯软件的掌上电脑(Pocket PC)、平板电脑(Tablet PC)或笔记计算机等等。移动终端装置100可以是任何具备通讯功能的可携式(Portable)行动装置,在此并不限制其范围。此外,移动终端装置100可使用Android作业系统、Microsoft作业系统、Android作业系统、Linux作业系统等等,不限于上述。
语音输出单元110例如是扬声器。语音输出单元110具有扩音功能,用以输出语音通知以及来自通话对象的语音。具体来说,当移动终端装置100接收到来电通话时,移动终端装置100可通过语音输出单元110发送语音通知,以告知使用者此来电通话的来源(例如通话对象)或询问使用者是否要接听此来电通话等等。此外,当使用者接通来电通话后,使用者也会通过语音输出单元110来进行接听。
语音接收单元120例如为麦克风,用以接收使用者的声音,以将使用者的声音转换为语音信号。
语言理解模块130耦接于语音接收单元120,用以解析语音接收单元120所接收的语音信号,以获得语音辨识结果。具体而言,语言理解模块130可包括语音辨识模块以及语音处理模块(未绘示),其中,语音辨识模块可会接收从语音接收单元120传来的语音信号,以将语音信号转换成多个分段语义(例如词汇或字句等)。语音处理模块则可依据这些分段语义而解析出这些分段语义所代表的意指(例如意图、时间、地点等),进而判断出上述语音信号中所表示的意思。此外,语音处理模块还会根据所解析的结果产生对应的应答内容。
在本实施例中,语言理解模块130可由一个或数个逻辑门组合而成的硬件电路来实现,亦可以是以计算机程序代码来实现。值得一提的是,在另一实施例中,上述的语言理解模块亦可配置于云端伺服器中。也就是说,移动终端装置100亦可与云端伺服器(未绘示)连线,其中云端伺服器连线具有语言理解模块。如此一来,移动终端装置100可将所接收到的语音信号,发送给云端伺服器中的语言理解模块进行解析,再从云端伺服器获得语音辨识结果。
来电接收单元140耦接于语音接收单元120与语言理解模块130。来电接收单元140用以接收来电通话及执行应答操作。具体来说,来电接收单元140接收到来电通话后,可根据使用者的语音(后将详述),来进行接听来电通话、拒接来电通话、发送预设语音应答、短信等应答操作来回应来电通话。
在此说明的是,本实施例的移动终端装置100具有通常模式及第一模式。其中,第一模式例如是移动终端装置100用于行动中的行车装置中而进入车载模式。更具体而言,在此第一模式中,当移动终端装置100接收到来电通话时,移动终端装置100会自动发送语音通知(例如来电通话的来源)以询问使用者是否接听这个来电通话,即移动终端装置100可自动地开启其免持系统,以和使用者进行语音交互。相对而言,通常模式例如是移动终端装置100于非车载模式的时候。亦即,在此通常模式中,移动终端装置100不会自动发送语音通知以询问使用者是否接听这个来电通话,而无法根据使用者的语音信号来做回应,即移动终端装置100不会自动地开启其免持系统。
如此一来,当移动终端装置100切换为第一模式时,若移动终端装置100接收到来电通话,则会发送语音通知使用者,以让使用者通过语音的方式,传送语音信号至移动终端装置100,使得移动终端装置100可根据使用者所说的话,来回应此来电通话(例如接听或拒绝接听来电通话等应答操作)。
需说明的是,本实施例的移动终端装置100可自动从通常模式切换为第一模式。具体而言,当移动终端装置100连线于辅助装置104时,移动终端装置100可从通常模式切换为第一模式。另一方面,当移动终端装置100未连线于辅助装置104时,移动终端装置104可从第一模式切换为通常模式。在此,移动终端装置100可匹配于辅助装置104。其中,当移动终端装置100通过无线传输信号或者电性连接于辅助装置104时,可使移动终端装置10自动切换为第一模式。
此外,在另一实施例中,当移动终端装置100用于行动中的行车装置时,移动终端装置100也可根据感应行车装置的速度的大小,来决定是否切换成第一模式。例如,当行车装置的速度超过阈值时,移动终端装置100则会从通常模式切换为第一模式。另一方面,当行车装置的速度未超过阈值时,移动终端装置100则会从自第一模式切换为通常模式。如此一来,使用者可更加便利地通过语音来操控移动终端装置100。
图2是依照本发明一实施例所绘示的语音接听方法的流程图。请同时参照图1及图2,于步骤202中,移动终端装置100会从通常模式切换为第一模式。在移动终端装置100于第一模式的情况下,如步骤S204所示,当来电接收单元140接收到来电通话C时,来电接收单元140会通过语音输出单元110发送语音通知SO,并启动语音接收单元120接收语音信号SI。
详细而言,语音通知SO可告知使用者来电通话的来源,例如,来电接收单元140可依据来电通话C而通过语音输出单元110发出关于来电通话C的电话号码信息,或进而依据联络人通讯录而查出拨出此来电通话C的联络人名称,不限于上述。举例来说,来电接收单元140可通过语音输出单元110而发送出“王大明给您来电,现在接听吗?”、“X公司给您来电,现在接听吗?”、“来电是0922-123564,现在接听吗?”或“来电是886922-123564,现在接听吗?”等关于来电通话C的信息。此外,倘若此来电通话C未提供电话号码,则来电接收单元140亦可通过语音输出单元110而送出预设的语音通知SO,例如,“这是未知电话,现在接听吗?”等等。
根据上述的语音通知SO,使用者可得知来电通话C的来源,并可通过语音的方式来操控来电接收单元140以回应此来电通话C。因此,当来电接收单元140接收到来电通话C时,来电接收单元140会启动语音接收单元120以接收来自使用者的语音信号SI。
于步骤S206,语言理解模块130会解析语音接收单元120所接收到的语音信号SI,以获得语音辨识结果。在此,语言理解模块130可接收来自语音接收单元120的语音信号SI,并将语音信号SI分割成多个分段语义。并且,语言理解模块130会对上述分段语义进行自然语言理解,以辨识出语音信号SI中的应答信息。在此说明的是,在计算机系统架构下的自然语言理解中,通常会使用固定词语法来撷取语音信号SI的语句,以解析这些语句所意指的指令或意图(例如接听来电通话C、拒绝接听来电通话C或发送短信等动作)等,而判断出语音信号SI的意思,藉以获得语音辨识结果。在本实施例中,语言理解模块130可通过语义资料库106,来查询语音信号SI中所分割成的分段语义是对应于哪些指令,其中语义资料库106可记录有各种分段语义与各种命令的关系。在本实施例中,根据上述各种分段语义,语言理解模块130还可判断出语音信号SI中哪些是使用者欲回应来电通话C的信息。
举例来说,当使用者回应“好的”、“接听”、“接一下”等之类表示要接听来电通话C的语音信号SI时,语言理解模块130可通过语义资料库106来查询“好的”、“接听”、“接一下”等所对应的命令,而解析出上述的语音信号SI是用以表示接听来电通话C。在另一实施例中,当使用者回应“不接”、“不”、“先不接”等之类表示要拒绝接听来电通话C的语音信号SI时,语言理解模块130可通过语义资料库106来查询“不接”、“不”、“先不接”等所对应的命令,而解析出上述的语音信号SI是用以表示拒绝接听来电通话C。在另一实施例中,当使用者回应“先不接,告诉他我到公司后再打电话给他”等之类表示发送消息以回应来电通话C的语音信号SI时,语言理解模块130可通过语义资料库106来查询“先不接”所对应的命令,而解析出语音信号S为表示拒绝接听来电通话C。并且,语言理解模块130还可通过语义资料库106来判断出“告诉他”是表示发送消息的命令,藉以在后续步骤中根据这个命令来执行应答操作,例如是根据这个命令来产生应答信号(如发送短信等)。此外,语言理解模块130还可判断出“告诉他”之后的语音是表示发送消息时的应答内容(例如是“到公司后再打电话”)。
接着,于步骤S208,来电接收单元140会根据语言理解模块130所解析出的语音辨识结果,执行对应的应答操作。在本实施例中,由于使用者可通过语音的方式,以命令移动终端装置100进行接听、拒接来电通话C、发送消息或其他动作以回应来电通话C,因此语言理解模块130解析语音信号SI之后,可判断出语音信号SI中的命令。故来电接收单元140可根据语音信号SI中的命令来执行对一的应答操作。上述来电接收单元140所执行应答操作可以是接听来电通话C、拒绝接听来电通话C、传送预设语音应答以回应来电通话C,或者传送短信、语音应答等应答信号,以回应来电通话C,其中应答信号中具有使用者欲回应来电通话C的应答内容。
为了使本领域的技术人员进一步了解本实施例来电接收单元140所执行的应答操作,下面再举诸实施例,其中,仍结合图1的移动终端装置100来进行说明。
当移动终端装置100切换为第一模式时(例如移动终端装置100用于行动中的行车装置中而进入车载模式),假设来电接收单元140接收到来电通话C,且来电接收单元140会通过语音输出单元110发送“王大明给您来电,现在接听吗?”这个语音通知SO。在本实施例中,倘若使用者回应“好的”这个语音信号SI,则来电接收单元140会接听这个来电通话C。
另一方面,倘若使用者回应“不接”这个语音信号SI,则来电接收单元140会拒绝接听这个来电通话C。在一实施例中,来电接收单元140还可传送“您拨的电话暂时无法接听,请稍后再拨,或在“哔”声后留言”这个预设语音应答来回应来电通话C。
此外,倘若使用者回应“先不接,告诉他我到公司后再打电话给他”这个语音信号SI,则来电接收单元140会拒绝接听这个来电通话C,并且会自语音辨识结果取得应答内容,即“到公司后再打电话”这个应答内容以发送短信,其中例如在短信中记载“我在开会,稍后再回拨”这个短信内容来回应来电通话C。
如此一来,在移动终端装置100进入车载模式的情况下,移动终端装置100可自动询问使用者是否接听来电通话C,以让使用者直接通过语音的方式来操控移动终端装置100进行接听、拒绝接听或其他应答操作。
依据上述,移动终端装置100可自动从通常模式切换为第一模式。并且,当来电接收单元140在第一模式接收到来电通话时,语音输出单元110会发送语音通知以询问使用者。当使用者发送语音信号时,语言理解模块130会对此语音信号进行解析,且来电接收单元140会根据语言理解模块130解析后所获得的语音辨识结果,执行对应的应答操作。如此一来,移动终端装置可更快速地提供语音服务,其中当移动终端装置100在第一模式的情况下,例如用于行动中的行车装置时,使用者可方便地根据移动终端装置100所发送的语音通知,通过语音的方式来回应来电通话。藉此,使用者可更加便利地操控移动终端装置。
图3是依照本发明一实施例所绘示的移动终端装置的方块图。请参照图3,移动终端装置300具有语音输出单元310、语音接收单元320、语言理解模块330以及语音唤醒模块350。本实施例的移动终端装置300与图1的移动终端装置100相似,其不同之处在于:本实施例的移动终端装置300更具有语音唤醒模块350。
语音唤醒模块350用以判断是否接收到具有识别信息的语音信号。在本实施例中,当语音唤醒模块350未接收到具有识别信息的语音信号时,语音输出单元310、语音接收单元320及语言理解模块330可以处于待机或关闭等模式,即移动终端装置300不会与使用者进行语音交互。而当语音唤醒模块350接收到具有识别信息的语音信号时,移动终端装置300则会启动语音接收单元320以接收之后的语音信号,并通过语言理解模块330来进行解析,即移动终端装置300会依据此语音信号与使用者进行语音交互,且还可执行对应于语音信号的应答操作等。故在本实施例中,使用者可直接以语音的方式,说出具有识别信息的语音(例如特定的字汇,如名字),来唤醒移动终端装置300执行语音交互功能。此外,本实施例的语音唤醒模块350可由一个或数个逻辑门组合而成的硬件电路来实现,亦可以是以计算机程序代码来实现。
值得一提的是,由于语音接收单元320是在语音唤醒模块350辨识出识别信息之后而被启动,因此语言理解模块330可避免对非语音信号(例如杂音信号)进行解析。此外,由于语音唤醒模块350只要能辨识出识别信息所对应的声音信号(例如“小茜”这个识别信息所对应的声音信号),即会判断所接收到的语音信号具有识别信息,因此语音唤醒模块350可以不具备有自然语言理解的能力,而具有较低功率的消耗。如此一来,当使用者未提供具有识别信息的语音信号时,移动终端装置300不会启动语音交互功能,故移动终端装置300不仅可方便使用者通过语音来进行操控,亦可节省电源消耗。
以下即结合上述移动终端装置300来说明语音操控的方法。图4是依照本发明一实施例所绘示的语音操控方法的流程图。请同时参照图3及图4,于步骤S402中,语音唤醒模块350会判断是否接收到符合识别信息的语音信号(下面以语音信号V1表示)。详细而言,识别信息可以是特定的字汇(例如名字)所对应的预设音,其中此预设音会在特定音频范围或特定能量范围之内。也就是说,语音唤醒模块350可判断是否接收到在特定音频范围或特定能量范围之内的预设音,而判断出是否接收到具有识别信息的语音信号V1。在本实施例中,使用者可预先通过移动终端装置300的系统来设定这个识别信息,例如预先提供识别信息所对应的预设音,而语音唤醒模块350可藉由比对语音信号V1是否符合这个预设音,来判断语音信号V1是否具有识别信息。举例来说,假设识别信息为“小茜”这个名字所对应的预设音,则语音唤醒模块350会判断是否接收到具有“小茜”的语音信号V1。
倘若语音唤醒模块350未接收到符合识别信息的语音信号V1,则如步骤S404所示,移动终端装置300不会启动语音交互功能。由于语音唤醒模块350未接收到符合识别信息的语音信号V1,因此语音接收单元320是成关闭状态或休眠状态而不会进行语音信号的接收,故移动终端装置300中的语言理解模块330不会取得到之后的语音信号来进行解析。举例来说,假设识别信息为“小茜”,倘若使用者未说出“小茜”而是说出“小王”等其他语音,即语音唤醒模块350无法接收到符合“小茜”的语音信号V1,故移动终端装置300的语音交互功能不会被启动。
于步骤S406中,当语音唤醒模块350判断语音信号V1符合识别信息时,移动终端装置300会启动语音接收单元320以接收音讯。并且,语言理解模块330会依据语音接收单元320所接收到的音讯,判断语音接收单元320是否在语音信号V1之后接收到另一语音信号(下面以语音信号V2表示)。在本实施例中,语言理解模块330可判断语音接收单元320所接收到的声音信号的能量是否超过一设定值。若所述声音信号的能量未超过设定值,则语言理解模块330会判断此声音信号为杂音,藉以判断语音接收单元320未接收到语音信号V2;若所述声音信号的能量已达设定值,则语言理解模块330可判断语音接收单元320已接收到语音信号V2,进而根据此语音信号V2来执行后续的步骤。
倘若语言理解模块330判断语音接收单元320未接收到语音信号V2,则如步骤S408所示,语言理解模块330会执行语音对话模式。在语音对话模式中,语言理解模块330可通过语音输出单元310发送语音应答,且可通过语音接收单元320继续接收及解析来自使用者的另一个语音信号,据以做出另一个语音应答或者应答操作,直到语言理解模块330判断出具有对话终止提示信息的语音信号,或者移动终端装置300已完成使用者的命令或请求为止。关于语音对话模式的详细步骤,将于后详述。
倘若语言理解模块330判断语音接收单元320接收到语音信号V2,则如步骤S410所示,语言理解模块330会解析语音信号V2而获得语音辨识结果。语言理解模块330可接收来自语音接收单元320的语音信号V2,并将语音信号V2分割成多个分段语义,以及对上述分段语义进行自然语言理解,以辨识出语音信号V2中的内容。如同图1的语言理解模块130,本实施例的语言理解模块330可依据固定词语法来撷取语音信号V2的语句,以解析这些语句所意指的指令或意图(例如命令句或者询问句)等,而判断出语音信号V2的意思,藉以获得语音辨识结果。其中,语言理解模块330可通过语义资料库306,来查询语音信号V2中所分割成的分段语义是对应于哪些指令,而上述语义资料库306可记录有各种分段语义与各种命令的关系。
接着,如步骤S412所示,语言理解模块330会判断语音辨识结果中是否具有可执行请求信息。详细而言,可执行请求信息例如是指让移动终端装置300完成请求操作。也就是说,语言理解模块330可依据语音辨识结果中的可执行请求信息,让移动终端装置300执行一个动作,其中移动终端装置300例如可通过一个或多个应用程序来完成。举例来说,当语音信号V2为“帮我打电话给王大明”、“帮我查台北明天的天气”或“现在几点”等,则语音信号V2具有可执行请求信息,因此,语言理解模块330解析上述语音信号V2后,可令移动终端装置300拨打电话给王大明、上网查并回报台北明天的天气、或者查询并回报现在的时间等这些动作。
另一方面,若语音辨识结果不具有可执行请求信息,则表示语言理解模块330无法依据语音辨识结果而判断使用者的意图,因此无法让移动终端装置300完成请求操作。举例来说,当语音信号V2为“帮我打电话”、“帮我查天气”、“现在”等,则语言理解模块330解析语音信号V2后,无法令移动终端装置300完成上述的请求操作。亦即,语言理解模块330无法判断出上述语音信号V2中的通话对象、查询哪一时间内或哪一地点的天气,以及无法根据一个不具完整语意的句子来执行。
当语音辨识结果具有可执行请求信息时,则如步骤S414所示,语言理解模块330会执行应答操作,且移动终端装置300会关闭接收其他语音信号(下面以语音信号V3表示),藉以关闭移动终端装置300的语音交互功能。
具体来说,当可执行请求信息为操作指令时,则语言理解模块330会启动对应于操作指令的操作功能。例如,当可执行请求信息为“调低屏幕的亮度”,则语言理解模块330会发出一调整亮度的信号给移动终端装置300的系统,使其将屏幕的亮度调低。此外,当可执行请求信息为询问句时,则语言理解模块330会发送对应于此询问句的语音应答。此时语言理解模块330可辨识出询问句中的一个或多个关键词,并依据这些关键词而自搜寻引擎中进行查询对应的答案,再通过语音输出单元310来输出语音应答。例如,当可执行请求信息为“明天台北的温度是几度?”,则语言理解模块330可发出一查询信号以通过搜寻引擎查询对应的答案,并通过语音输出单元310来输出“明天台北的温度是26度”这个语音应答。
在此说明的是,由于上述的可执行请求信息会让移动终端装置300完成请求操作,因此语言理解模块330执行应答操作之后,此时的语音接收单元320会成关闭或休眠状态,而不会接收到其他的语音信号V3。更进一步而言,当语音接收单元320被关闭接收语音信号V3时,若使用者欲通过语音的方式来令移动终端装置300执行请求操作,则使用者需再呼叫具有识别信息的语音,藉以通过语音唤醒模块350来进行判断,进而再次启动语音接收单元320。
当语音辨识结果不具有可执行请求信息时,则如步骤S408所示,语言理解模块330会执行语音对话模式。在此,语言理解模块330会根据语音信号V2通过语音输出单元310发送语音应答,并且会通过语音接收单元320,继续接收另一个语音信号。也就是说,语言理解模块330会继续接收及解析来自使用者的语音信号,据以做出另一个语音应答或者应答操作,直到语言理解模块330判断出具有对话终止提示信息的语音信号,或者移动终端装置300已完成使用者的命令或请求为止。
为了使本领域的技术人员进一步了解上述语言理解模块330所执行的语音对话模式,下面举诸实施例为例,其中仍结合图3的移动终端装置300来进行说明。
图5是依照本发明一实施例所绘示的语音操控方法的流程图。请同时参照图3、图4与图5,语言理解模块330在执行语音对话模式时,于步骤S502中,语言理解模块330会产生语音应答,下面以语音应答A1表示,并通过语音输出单元310输出。由于语言理解模块330会因未接收到语音信号V2(如图4的步骤S406)而执行语音对话模式,或者是因接收到不具有可执行请求信息的语音信号V2而执行语音对话模式(如图4的步骤S412),故此时,语言理解模块330会自动发送语音应答A1以询问使用者的请求信息(即使用者的意图)。
举例来说,当语音接收单元320未接收到语音信号V2时,语言理解模块330可通过语音输出单元310发送“有什么事吗?”、“需要提供什么服务?”等,不限于此,藉以询问使用者。此外,当语言理解模块330所接收到的语音信号V2不具有可执行请求信息时,语言理解模块330可通过语音输出单元310发送“您说的是哪一个地方的天气?”、“您说的是谁的电话?”或“您说的是什么意思?”等等,不限于此。
需说明的是,语言理解模块330亦可根据这个不具有可执行请求信息的语音信号V2,而找出匹配此语音信号V2的语音应答。换言之,语言理解模块330可进入语音聊天的模式,以和使用者进行沟通。其中,语言理解模块330可通过语义资料库306来实现上述的语音聊天的模式。详细而言,语义资料库306可记录有多种候选答案,而语言理解模块330依据优先顺序来选取这些候选答案的其中之一来做为语音应答。例如,语言理解模块330可依据众人使用习惯,以决定这些候选答案的优先顺序。或者,语言理解模块330可依据使用者的喜好或者习惯,以决定这些候选答案的优先顺序。值得一提的是,语义资料库306中亦可记录先前语言理解模块330所输出的语音应答的内容,并依据先前的内容来产生语音应答。上述选出语音应答的方法为举例说明,本实施例并不以此为限制。
当语言理解模块330通过语音输出单元310输出语音应答之后,于步骤S504中,语言理解模块330会判断语音接收单元320是否再接收到其他语音信号(下面以语音信号V4表示)。此处与图4的步骤S406相似,可参照前述的说明。
当语音接收单元320接收语音信号V4时,则如步骤S506所示,语言理解模块330会判断语音信号V4是否符合对话终止提示信息,或者语音信号V4是否具有可执行请求信息。对话终止提示信息例如是特定词汇,用以表示对话终止。亦即,语言理解模块330会对语音信号V4进行解析,倘若解析到上述的特定词汇,则判断语音信号V4符合对话终止提示信息。举例来说,当语音信号V4符合“再见”或“没事了”等这些对话终止提示信息,则语音接收单元320不会继续接收语音信号。另一方面,若语音信号V4具有可执行请求信息,则语言理解模块330即会执行对应于可执行请求信息的应答操作。并且,语言理解模块330会终止语音对话模式,而语音接收单元320亦不再继续接收语音信号。在此与图4的步骤S414相似,可参照前述的说明。
若语音信号V4符合对话终止提示信息,或者具有可执行请求信息时,则如步骤S508所示,语言理解模块330则终止语音对话模式,并终止接收之后的语音信号,据以结束移动终端装置300和使用者进行语音沟通。也就是说,此时若使用者欲通过语音的方式来操控移动终端装置300,则需说出具有识别信息(例如“小茜”这个名子)的语音信号,才可再启动移动终端装置300执行语音交互。
此外,若语音信号V4不符合对话终止提示信息,亦不具有可执行请求信息时,则回到步骤S502,语言理解模块330会继续通过语音输出单元310发送语音应答来询问使用者。
返回步骤S504,当语音接收单元320未接收到语音信号V4,则如步骤S510所示,语言理解模块330会判断预设时间内未接收到语音信号V4的次数,是否超过预设次数。具体来说,若预设时间内未接收到语音信号V4,则语言理解模块330会记录一笔次数。如此一来,当所记录的次数未超过预设次数时,则回到步骤S502,语言理解模块330会继续通过语音输出单元310发送语音应答,藉以询问使用者的意图。其中,语言理解模块330可于语音接收单元320未接收到语音信号V4的预设时间之后,产生语音应答。上述的语音应答例如是“您还在吗?”、“需要提供什么服务?”等问句,不限于此。
反之,当所记录的次数为超过预设次数时,则如步骤S508所示,语言理解模块330会终止此语音对话模式,且语音接收单元320会终止接收之后的语音信号,亦即移动终端装置300会结束与使用者进行语音沟通,以结束语音交互。
值得一提的是,当移动终端装置300结束语音交互功能之后,使用者不仅可呼叫具有识别信息的语音信号,以和移动终端装置300沟通,使用者亦可通过辅助操控装置304,从辅助操控装置304发出无线传输信号至移动终端装置300,以启动语音交互功能。于此,移动终端装置300便会启动语音接收单元320来接收语音信号。
依据上述,本实施例的移动终端装置300可据符合识别信息的语音信号,而启动移动终端装置300的语音交互功能,藉以可更快速地提供语音服务。其中,在移动终端装置300未启动其语音交互功能时,语音唤醒模块350会侦测符合识别信息的语音信号。倘若语音唤醒模块350接收到上述符合识别信息的语音信号时,语音接收单元320则会被启动,以接收在上述语音信号之后的另一个语音信号。之后,语言理解模块330则会根据上述另一个语音信号来做出应答操作并终止移动终端装置300的语音交互功能;或者根据上述另一个语音信号发送语音应答,藉以获得使用者的意图或和使用者对话,直到解析到对话终止提示信息或做出应答操作为止。如此一来,使用者可更加便利地操控移动终端装置300。
综上所述,在本发明的语音接听方法与移动终端装置中,移动终端装置可自动从通常模式切换为第一模式。并且,当移动终端装置在第一模式接收到来电通话时,移动终端装置可发送语音通知以询问使用者,而让使用者可通过语音的方式发送语音信号来操控移动终端装置进行回应。此时,移动终端装置可根据来自使用者的语音信号进行解析,并根据解析后所获得的语音辨识结果,执行对应的应答操作。如此一来,使用者可方便地根据移动终端装置所发送的语音通知,通过语音的方式来回应来电通话。
此外,在本发明的语音操控方法与移动终端装置中,移动终端装置可据符合识别信息的语音信号,以启动语音交互功能。在移动终端装置未启动其语音交互功能时,倘若移动终端装置接收到符合识别信息的语音信号,移动终端装置则会接收在上述语音信号之后的另一个语音信号。之后,移动终端装置会根据上述另一个语音信号来做出应答操作并终止语音交互功能;或者根据上述另一个语音信号发送语音应答,藉以获得使用者的意图或和使用者对话,直到解析到对话终止提示信息或做出应答操作为止。如此一来,使用者仅需发送具有识别信息的语音信号,即可方便地与移动终端装置进行语音沟通,并在通话过程中可以完全解放双手,因为移动终端总是在一个对话回合后自动打开语音输入。且移动终端装置可根据使用者所说的内容来终止语音交互,藉以可更快速地提供语音服务。基于此,本发明的语音接听方法、语音操控方法与移动终端装置,可让使用者可更加便利地操控移动终端装置。
虽然本发明已以实施例公开如上,然其并非用以限定本发明,任何所属技术领域中具有通常知识者,在不脱离本发明的精神和范围内,当可作些许的更动与润饰,故本发明的保护范围当视后附的权利要求所界定者为准。

Claims (16)

1.一种语音接听方法,用于具有一通常模式及一第一模式的一移动终端装置,该方法包括:
当该移动终端装置连线于一辅助装置时,该移动终端装置自该通常模式切换为该第一模式;
当于该第一模式接收到一来电通话时,发送一语音通知,并启动接收一语音信号;
解析该语音信号以获得一语音辨识结果;以及
根据该语音辨识结果,执行对应的一应答操作。
2.如权利要求1所述的语音接听方法,更包括:
当该移动终端装置未连线于该辅助装置时,该移动终端装置自该第一模式切换为该通常模式。
3.如权利要求1所述的语音接听方法,其中该移动终端装置用于行动中的一行车装置,该语音接听方法更包括:
当该行车装置的速度超过一阈值时,该移动终端装置自该通常模式切换为该第一模式;以及
当该行车装置的速度未超过该阈值时,该移动终端装置自该第一模式切换为该通常模式。
4.如权利要求1所述的语音接听方法,其中该第一模式为该移动终端装置用于行动中的一行车装置。
5.如权利要求1所述的语音接听方法,其中在执行对应的该应答操作的步骤包括:
接听该来电通话或拒绝接听该来电通话。
6.如权利要求5所述的语音接听方法,其中在拒绝接听该来电通话的步骤包括:
传送一预设语音应答以回应该来电通话。
7.如权利要求1所述的语音接听方法,更包括:
自该语音辨识结果取得一应答内容,并根据该应答内容产生一应答信号以回应该来电通话。
8.如权利要求1所述的语音接听方法,更包括:
自一辅助操控装置接收一操控信号,以接听或拒绝接听该来电通话。
9.一种移动终端装置,包括:
一语音输出单元,用以发送一语音通知;
一语音接收单元,用以接收一语音信号;
一语言理解模块,耦接于该语音接收单元,用以解析该语音信号;
一来电接收单元,耦接于该语音输出单元与该语言理解模块,该来电接收单元用以接收一来电通话及执行一应答操作,其中该移动终端装置从一通常模式切换为一第一模式,以及当该来电接收单元于该第一模式接收到该来电通话时,该来电接收单元通过该语音输出单元发送该语音通知,并启动该语音接收单元接收该语音信号,该语言理解模块解析该语音信号以获得一语音辨识结果,以及该来电接收单元根据该语音辨识结果执行对应的该应答操作。
10.如权利要求9所述的移动终端装置,更包括:
当该移动终端装置连线于一辅助装置时,该移动终端装置自该通常模式切换为该第一模式;以及
当该移动终端装置未连线于该辅助装置时,该移动终端装置自该第一模式切换为该通常模式。
11.如权利要求9所述的移动终端装置,其中该移动终端装置用于行动中的一行车装置,且当该行车装置的速度超过一阈值时,该移动终端装置自该通常模式切换为该第一模式,以及当该行车装置的速度未超过该阈值时,该移动终端装置自该第一模式切换为该通常模式。
12.如权利要求9所述的移动终端装置,其中该第一模式为该移动终端装置用于行动中的一行车装置。
13.如权利要求9所述的移动终端装置,其中该来电接收单元根据该语音辨识结果,接听该来电通话或拒绝接听该来电通话。
14.如权利要求13所述的移动终端装置,其中该来电接收单元拒绝接听该来电通话时,传送一预设语音应答以回应该来电通话。
15.如权利要求9所述的移动终端装置,其中该来电接收单元自该语音辨识结果取得一应答内容,并根据该应答内容产生一应答信号以回应该来电通话。
16.如权利要求9所述的移动终端装置,其中该来电接收单元自一辅助操控装置接收一操控信号,以接听或拒绝接听该来电通话。
CN 201310122236 2013-04-10 2013-04-10 语音接听方法与移动终端装置 Pending CN103220423A (zh)

Priority Applications (4)

Application Number Priority Date Filing Date Title
CN 201310122236 CN103220423A (zh) 2013-04-10 2013-04-10 语音接听方法与移动终端装置
CN201710903738.2A CN107613132A (zh) 2013-04-10 2013-07-11 语音接听方法与移动终端装置
CN201310291083.XA CN104104789A (zh) 2013-04-10 2013-07-11 语音接听方法与移动终端装置
TW102125584A TWI535258B (zh) 2013-04-10 2013-07-17 語音接聽方法與行動終端裝置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 201310122236 CN103220423A (zh) 2013-04-10 2013-04-10 语音接听方法与移动终端装置

Publications (1)

Publication Number Publication Date
CN103220423A true CN103220423A (zh) 2013-07-24

Family

ID=48817867

Family Applications (3)

Application Number Title Priority Date Filing Date
CN 201310122236 Pending CN103220423A (zh) 2013-04-10 2013-04-10 语音接听方法与移动终端装置
CN201710903738.2A Pending CN107613132A (zh) 2013-04-10 2013-07-11 语音接听方法与移动终端装置
CN201310291083.XA Pending CN104104789A (zh) 2013-04-10 2013-07-11 语音接听方法与移动终端装置

Family Applications After (2)

Application Number Title Priority Date Filing Date
CN201710903738.2A Pending CN107613132A (zh) 2013-04-10 2013-07-11 语音接听方法与移动终端装置
CN201310291083.XA Pending CN104104789A (zh) 2013-04-10 2013-07-11 语音接听方法与移动终端装置

Country Status (2)

Country Link
CN (3) CN103220423A (zh)
TW (1) TWI535258B (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103929532A (zh) * 2014-03-18 2014-07-16 联想(北京)有限公司 一种信息处理方法及电子设备
CN104464723A (zh) * 2014-12-16 2015-03-25 科大讯飞股份有限公司 一种语音交互方法及系统
CN105007375A (zh) * 2015-07-20 2015-10-28 广东小天才科技有限公司 一种自动接听外接来电的方法及装置
CN105049591A (zh) * 2015-05-26 2015-11-11 腾讯科技(深圳)有限公司 处理来电的方法和装置
CN105810194A (zh) * 2016-05-11 2016-07-27 北京奇虎科技有限公司 待机状态下语音控制信息获取方法和智能终端
CN107395867A (zh) * 2015-03-06 2017-11-24 广东欧珀移动通信有限公司 一种移动终端便捷通话方法及系统
CN108880993A (zh) * 2018-07-02 2018-11-23 广东小天才科技有限公司 一种语音即时通信方法、系统及移动终端
CN112995929A (zh) * 2019-11-29 2021-06-18 长城汽车股份有限公司 一种短消息发送方法、装置及车辆

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105472152A (zh) * 2015-12-03 2016-04-06 广东小天才科技有限公司 一种智能终端自动接听电话的方法系统
JP6508251B2 (ja) * 2017-04-27 2019-05-08 トヨタ自動車株式会社 音声対話システムおよび情報処理装置
CN107465805A (zh) * 2017-06-28 2017-12-12 深圳天珑无线科技有限公司 一种来电应答方法、具有存储功能的装置及通信终端
TWI639115B (zh) 2017-11-01 2018-10-21 塞席爾商元鼎音訊股份有限公司 偵測語音輸入模式之方法
CN108847236A (zh) * 2018-07-26 2018-11-20 珠海格力电器股份有限公司 语音信息的接收方法及装置、语音信息的解析方法及装置
CN110060678B (zh) * 2019-04-16 2021-09-14 深圳欧博思智能科技有限公司 一种基于智能设备的虚拟角色控制方法及智能设备
CN111191005A (zh) * 2019-12-27 2020-05-22 恒大智慧科技有限公司 社区查询方法及系统、社区服务器、计算机可读存储介质
CN111160002B (zh) * 2019-12-27 2022-03-01 北京百度网讯科技有限公司 用于输出口语理解中解析异常信息的方法和装置

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1494299A (zh) * 2002-10-30 2004-05-05 英华达(上海)电子有限公司 手机上语音输入转换成文字的装置与方法
CN101211504A (zh) * 2006-12-31 2008-07-02 康佳集团股份有限公司 一种通过语音对电视机进行遥控的方法、系统及设备
US8165886B1 (en) * 2007-10-04 2012-04-24 Great Northern Research LLC Speech interface system and method for control and interaction with applications on a computing system
CN101657033A (zh) * 2008-08-22 2010-02-24 环达电脑(上海)有限公司 具语音操控的可携式通讯装置及其方法
TW201013635A (en) * 2008-09-24 2010-04-01 Mitac Int Corp Intelligent voice system and method thereof
CN202413790U (zh) * 2011-12-15 2012-09-05 浙江吉利汽车研究院有限公司 一种汽车自适应性语音提示系统
CN102843471A (zh) * 2012-08-17 2012-12-26 广东欧珀移动通信有限公司 一种智能控制手机应答模式的方法及手机
CN102932595A (zh) * 2012-10-22 2013-02-13 北京小米科技有限责任公司 声控拍摄方法、装置及终端
CN103024177A (zh) * 2012-12-13 2013-04-03 广东欧珀移动通信有限公司 一种移动终端驾驶模式操作方法及移动终端
CN103139396A (zh) * 2013-03-28 2013-06-05 上海斐讯数据通信技术有限公司 一种情景模式的实现方法及移动终端

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103929532A (zh) * 2014-03-18 2014-07-16 联想(北京)有限公司 一种信息处理方法及电子设备
CN104464723A (zh) * 2014-12-16 2015-03-25 科大讯飞股份有限公司 一种语音交互方法及系统
CN107395867A (zh) * 2015-03-06 2017-11-24 广东欧珀移动通信有限公司 一种移动终端便捷通话方法及系统
CN105049591A (zh) * 2015-05-26 2015-11-11 腾讯科技(深圳)有限公司 处理来电的方法和装置
CN105007375A (zh) * 2015-07-20 2015-10-28 广东小天才科技有限公司 一种自动接听外接来电的方法及装置
CN105810194A (zh) * 2016-05-11 2016-07-27 北京奇虎科技有限公司 待机状态下语音控制信息获取方法和智能终端
CN105810194B (zh) * 2016-05-11 2019-07-05 北京奇虎科技有限公司 待机状态下语音控制信息获取方法和智能终端
CN108880993A (zh) * 2018-07-02 2018-11-23 广东小天才科技有限公司 一种语音即时通信方法、系统及移动终端
CN112995929A (zh) * 2019-11-29 2021-06-18 长城汽车股份有限公司 一种短消息发送方法、装置及车辆

Also Published As

Publication number Publication date
TW201440482A (zh) 2014-10-16
CN107613132A (zh) 2018-01-19
CN104104789A (zh) 2014-10-15
TWI535258B (zh) 2016-05-21

Similar Documents

Publication Publication Date Title
CN103198831A (zh) 语音操控方法与移动终端装置
CN103220423A (zh) 语音接听方法与移动终端装置
AU2019246868B2 (en) Method and system for voice activation
US7400712B2 (en) Network provided information using text-to-speech and speech recognition and text or speech activated network control sequences for complimentary feature access
US20060074658A1 (en) Systems and methods for hands-free voice-activated devices
US20090204410A1 (en) Voice interface and search for electronic devices including bluetooth headsets and remote systems
CN111263962B (zh) 信息处理设备和信息处理方法
CN108108142A (zh) 语音信息处理方法、装置、终端设备及存储介质
CN102483915A (zh) 具有包括导引配对和语音触发操作的语音控制功能的电信装置
JP2007529916A (ja) コンピュータでの音声通信
US20080254746A1 (en) Voice-enabled hands-free telephone system for audibly announcing vehicle component information to vehicle users in response to spoken requests from the users
CN201307938Y (zh) 一种移动终端
CN102237087A (zh) 语音控制方法和语音控制装置
CN101415257A (zh) 一种人机对话聊天方法
US20070281748A1 (en) Method & apparatus for unlocking a mobile phone keypad
US8321227B2 (en) Methods and devices for appending an address list and determining a communication profile
CN109036401A (zh) 一种开启语音控制系统的方法
KR100467593B1 (ko) 음성인식 키 입력 무선 단말장치, 무선 단말장치에서키입력 대신 음성을 이용하는 방법 및 그 기록매체
CN103188633A (zh) 车载通讯系统
JPH11352986A (ja) 音声認識利用装置の誤認識緩和方法
CN103188364A (zh) 车载通讯系统
CN203734807U (zh) 语控蓝牙耳机、汽车定位及智能语音服务平台
CN117336402A (zh) 可盲用人工智能手机
JP3716928B2 (ja) 音声発呼装置
CN109243434A (zh) 一种双语音输入装置及系统

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20130724