CN103198831A - 语音操控方法与移动终端装置 - Google Patents

语音操控方法与移动终端装置 Download PDF

Info

Publication number
CN103198831A
CN103198831A CN201310123229XA CN201310123229A CN103198831A CN 103198831 A CN103198831 A CN 103198831A CN 201310123229X A CN201310123229X A CN 201310123229XA CN 201310123229 A CN201310123229 A CN 201310123229A CN 103198831 A CN103198831 A CN 103198831A
Authority
CN
China
Prior art keywords
voice
voice signal
mobile terminal
terminal apparatus
language understanding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201310123229XA
Other languages
English (en)
Inventor
张国峰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Via Technologies Inc
Original Assignee
Via Technologies Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Via Technologies Inc filed Critical Via Technologies Inc
Priority to CN201310123229XA priority Critical patent/CN103198831A/zh
Publication of CN103198831A publication Critical patent/CN103198831A/zh
Priority to CN201710383843.8A priority patent/CN107274897A/zh
Priority to CN201310291242.6A priority patent/CN104104790A/zh
Priority to TW102125767A priority patent/TWI489372B/zh
Priority to US14/231,765 priority patent/US20140309996A1/en
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/06Transformation of speech into a non-audible representation, e.g. speech visualisation or speech processing for tactile aids
    • G10L21/16Transforming into a non-visible representation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/32Means for saving power
    • G06F1/3203Power management, i.e. event-based initiation of a power-saving mode
    • G06F1/3206Monitoring of events, devices or parameters that trigger a change in power modality
    • G06F1/3215Monitoring of peripheral devices
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F1/00Details not covered by groups G06F3/00 - G06F13/00 and G06F21/00
    • G06F1/26Power supply means, e.g. regulation thereof
    • G06F1/32Means for saving power
    • G06F1/3203Power management, i.e. event-based initiation of a power-saving mode
    • G06F1/3234Power saving characterised by the action undertaken
    • G06F1/3287Power saving characterised by the action undertaken by switching off individual functional units in the computer system
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/72Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
    • H04M1/724User interfaces specially adapted for cordless or mobile telephones
    • H04M1/72403User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality
    • H04M1/7243User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality with interactive means for internal management of messages
    • H04M1/72433User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality with interactive means for internal management of messages for voice messaging, e.g. dictaphones
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/72Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
    • H04M1/724User interfaces specially adapted for cordless or mobile telephones
    • H04M1/72448User interfaces specially adapted for cordless or mobile telephones with means for adapting the functionality of the device according to specific conditions
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/72Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
    • H04M1/724User interfaces specially adapted for cordless or mobile telephones
    • H04M1/72484User interfaces specially adapted for cordless or mobile telephones wherein functions are triggered by incoming communication events
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/22Procedures used during a speech recognition process, e.g. man-machine dialogue
    • G10L2015/223Execution procedure of a spoken command
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2250/00Details of telephonic subscriber devices
    • H04M2250/74Details of telephonic subscriber devices with voice recognition means
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • General Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • General Health & Medical Sciences (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Computational Linguistics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Computing Systems (AREA)
  • Computer Hardware Design (AREA)
  • Quality & Reliability (AREA)
  • Data Mining & Analysis (AREA)
  • Otolaryngology (AREA)
  • General Business, Economics & Management (AREA)
  • Business, Economics & Management (AREA)
  • Telephone Function (AREA)
  • Telephonic Communication Services (AREA)

Abstract

一种移动终端装置与语音操控方法。移动终端装置包括语音接收单元、语音输出单元、语音唤醒模块以及语言理解模块。当语音唤醒模块判断第一语音信号符合识别信息时,移动终端装置启动语音接收单元。当语音接收单元在第一语音信号之后接收到第二语音信号时,语言理解模块解析第二语音信号而获得语音识别结果。当语音识别结果具有可执行请求信息时,语言理解模块执行应答操作,且移动终端装置关闭语音接收单元接收第三语音信号。当语音识别结果不具有可执行请求信息,语言理解模块执行语音对话模式。

Description

语音操控方法与移动终端装置
技术领域
本发明涉及一种语音操控的技术,特别是涉及一种启动语音交互的语音操控方法与移动终端装置。
背景技术
随着科技的发展,具有语音系统的移动终端装置已日渐普及。上述的语音系统是通过语音理解技术,让使用者与移动终端装置进行沟通。举例来说,使用者只要对上述的移动终端装置讲出某项要求,例如想要查车次、查天气或是欲拨打电话等,系统便会依据使用者的语音信号,采取对应的动作。上述的动作可能是以语音方式回答使用者问题或是依照使用者指令去驱使移动终端装置的系统进移动作。
以语音系统启动的便捷性来说,目前大都是触发移动终端装置的屏幕其所显示的应用程序来启动,或者通过移动终端装置所设置的实体按键来启动。上述的设计皆须通过移动终端装置本身来启动,但是在某些场合,上述的设计却是相当的不便。比如说:在行车期间,或者在厨房做菜时,需要拨打位于客厅的移动电话,以询问友人食谱细节等使用者无法立即触及移动终端装置,但需使语音系统开启的情况。更进一步,开启语音对话后,如何进行更符合人类对话自然规律的完全脱手的多次交互对话。
基此,如何改进上述的这些缺点,成为亟待解决的议题
发明内容
本发明提供一种移动终端装置与语音操控方法,可更快速地提供语音服务。使用者仅需发送具有识别信息的语音信号,即可方便地与移动终端装置进行语音沟通,且移动终端装置可根据使用者所说的内容来终止语音交互,更符合人类对话的自然规律,使得在对话过程中不再需要手动参与,可以实现人机对话的完全脱手,藉以可更方便、快速地提供语音服务。
本发明提出一种移动终端装置,其包括语音接收单元、语音输出单元、语音唤醒模块以及语言理解模块。语音唤醒模块用以判断是否接收到符合识别信息的第一语音信号。语言理解模块耦接于语音接收单元、语音输出单元以及语音唤醒模块。其中,当语音唤醒模块判断第一语音信号符合识别信息时,移动终端装置启动语音接收单元,且语言理解模块判断语音接收单元是否在第一语音信号之后接收到第二语音信号。倘若语音接收单元未接收到第二语音信号,则语言理解模块执行语音对话模式。倘若语音接收单元接收到第二语音信号,则语言理解模块解析第二语音信号而获得语音识别结果。其中,当语音识别结果具有可执行请求信息时,语言理解模块执行应答操作,且移动终端装置关闭语音接收单元接收第三语音信号,以及当语音识别结果不具有可执行请求信息时,语言理解模块执行语音对话模式。
本发明提出一种语音操控方法,用于移动终端装置。语音操控方法包括以下步骤。判断是否接收到符合识别信息的第一语音信号。当第一语音信号符合识别信息时,判断在第一语音信号之后是否接收到第二语音信号。倘若未接收到第二语音信号,则执行语音对话模式。倘若接收到第二语音信号,则解析第二语音信号而获得语音识别结果。其中,当语音识别结果具有可执行请求信息时,执行应答操作,并关闭接收第三语音信号,以及当语音识别结果不具有可执行请求信息时,执行语音对话模式。
基于上述,在移动终端装置未启动其语音交互功能时,倘若语音唤醒模块接收到符合识别信息的语音信号,则语音接收单元会被启动,以接收在上述语音信号之后的另一个语音信号。之后,语言理解模块则会根据上述另一个语音信号来做出应答操作并终止移动终端装置的语音交互功能;或者根据上述另一个语音信号发送语音应答,直到解析到对话终止提示信息或做出应答操作为止。若语音接收单元被启动后,在预定时间内未接收到另一个有效语音的次数超过一预定次数,则该移动终端装置关闭该语音接收单元。这里的有效语音可以是可执行的请求信息(比如,“帮我查下上海今天的天气情况”)或者是符合一对话终止提示信息的语音(比如,“好,没事了”),再或者为一可应答的信息(比如,“今天的我太太过生日,我买什么礼物比较好?”)。藉此,移动终端装置可依据符合识别信息的语音信号,而启动语音交互功能,藉以可更快速、更便捷地提供语音服务。
为使本发明的上述特征和优点能更明显易懂,下文特举实施例,并结合附图详细说明如下。
附图说明
图1是依照本发明一实施例所绘示的移动终端装置的方块图。
图2是依照本发明一实施例所绘示的语音接听方法的流程图。
图3是依照本发明一实施例所绘示的移动终端装置的方块图。
图4是依照本发明一实施例所绘示的语音操控方法的流程图。
图5是依照本发明一实施例所绘示的语音操控方法的流程图。
附图符号说明
100、300:移动终端装置
104、304:辅助操控装置
106、306:语义数据库
110、310:语音输出单元
120、320:语音接收单元
130、330:语言理解模块
140、340:来电接收单元
350:语音唤醒模块
S202、S204、S206、S208:语音接听方法的各步骤
S402、S404、S406、S408、S410、S412、S414、S502、S504、S506、S508、S510:语音操控方法的流程图
具体实施方式
虽然现今的移动终端装置已可提供语音系统,以让使用者发出语音来和移动终端装置沟通,但使用者在启动此语音系统时,仍必须通过移动终端装置本身来启动。因此在使用者无法立即触及移动终端装置,但需使语音系统开启的情况,往往无法满足使用者立即的需求。更进一步,即使能够唤醒语音对话系统,但目前的移动装置在对话过程中仍然需要手的不时参与,比如使用者提问结束后,需要再次询问时需要手动再次开启语音对话系统,极不方便。为此,本发明提出一种语音接听方法、语音操控方法及移动终端装置,让使用者能够更便捷地开启语音系统。更进一步,本发明能够使得使用者在整个对话过程中,摆脱手的操作,使得对话更加便捷快速自然。为了使本发明的内容更为明了,以下特举实施例作为本发明确实能够据以实施的范例。
图1是依照本发明一实施例所绘示的移动终端装置的方块图。请参照图1,移动终端装置100具有语音输出单元110、语音接收单元120、语言理解模块130以及来电接收单元140。移动终端装置100例如为移动电话(Cellphone)、个人数字助理(Personal Digital Assistant,PDA)手机、智慧型手机(Smart phone),或是安装有通讯软件的掌上型计算机(Pocket PC)、平板型计算机(Tablet PC)或笔记型计算机等等。移动终端装置100可以是任何具备通讯功能的便携式(Portable)移动装置,在此并不限制其范围。此外,移动终端装置100可使用Android操作系统、Microsoft操作系统、Android操作系统、Linux操作系统等等,不限于上述。
语音输出单元110例如是扬声器。语音输出单元110具有扩音功能,用以输出语音通知以及来自通话对象的语音。具体来说,当移动终端装置100接收到来电通话时,移动终端装置100可通过语音输出单元110发送语音通知,以告知使用者此来电通话的来源(例如通话对象)或询问使用者是否要接听此来电通话等等。此外,当使用者接通来电通话后,使用者也会通过语音输出单元110来进行接听。
语音接收单元120例如为麦克风,用以接收使用者的声音,以将使用者的声音转换为语音信号。
语言理解模块130耦接于语音接收单元120,用以解析语音接收单元120所接收的语音信号,以获得语音识别结果。具体而言,语言理解模块130可包括语音识别模块以及语音处理模块(未绘示),其中,语音识别模块可会接收从语音接收单元120传来的语音信号,以将语音信号转换成多个分段语义(例如词汇或字句等)。语音处理模块则可依据这些分段语义而解析出这些分段语义所代表的意指(例如意图、时间、地点等),进而判断出上述语音信号中所表示的意思。此外,语音处理模块还会根据所解析的结果产生对应的应答内容。
在本实施例中,语言理解模块130可由一个或数个逻辑门组合而成的硬件电路来实作,亦可以是以计算机程序码来实作。值得一提的是,在另一实施例中,上述的语言理解模块亦可配置于云端伺服器中。也就是说,移动终端装置100亦可与云端伺服器(未绘示)连线,其中云端伺服器连线具有语言理解模块。如此一来,移动终端装置100可将所接收到的语音信号,发送给云端伺服器中的语言理解模块进行解析,再从云端伺服器获得语音识别结果。
来电接收单元140耦接于语音接收单元120与语言理解模块130。来电接收单元140用以接收来电通话及执行应答操作。具体来说,来电接收单元140接收到来电通话后,可根据使用者的语音(后将详述),来进行接听来电通话、拒接来电通话、发送预设语音应答、简讯等应答操作来回应来电通话。
在此说明的是,本实施例的移动终端装置100具有通常模式及第一模式。其中,第一模式例如是移动终端装置100用于移动中的行车装置中而进入车载模式。更具体而言,在此第一模式中,当移动终端装置100接收到来电通话时,移动终端装置100会自动发送语音通知(例如来电通话的来源)以询问使用者是否接听这个来电通话,即移动终端装置100可自动地开启其免持系统,以和使用者进行语音交互。相对而言,通常模式例如是移动终端装置100于非车载模式的时候。亦即,在此通常模式中,移动终端装置100不会自动发送语音通知以询问使用者是否接听这个来电通话,而无法根据使用者的语音信号来做回应,即移动终端装置100不会自动地开启其免持系统。
如此一来,当移动终端装置100切换为第一模式时,若移动终端装置100接收到来电通话,则会发送语音通知使用者,以让使用者通过语音的方式,传送语音信号至移动终端装置100,使得移动终端装置100可根据使用者所说的话,来回应此来电通话(例如接听或拒绝接听来电通话等应答操作)。
需说明的是,本实施例的移动终端装置100可自动从通常模式切换为第一模式。具体而言,当移动终端装置100连线于辅助装置104时,移动终端装置100可从通常模式切换为第一模式。另一方面,当移动终端装置100未连线于辅助装置104时,移动终端装置104可从第一模式切换为通常模式。在此,移动终端装置100可匹配于辅助装置104。其中,当移动终端装置100通过无线传输讯号或者电性连接于辅助装置104时,可使移动终端装置100自动切换为第一模式。
此外,在另一实施例中,当移动终端装置100用于移动中的行车装置时,移动终端装置100也可根据感应行车装置的速度的大小,来决定是否切换成第一模式。例如,当行车装置的速度超过阈值时,移动终端装置100则会从通常模式切换为第一模式。另一方面,当行车装置的速度未超过阈值时,移动终端装置100则会从自第一模式切换为通常模式。如此一来,使用者可更加便利地通过语音来操控移动终端装置100。
图2是依照本发明一实施例所绘示的语音接听方法的流程图。请同时参照图1及图2,于步骤202中,移动终端装置100会从通常模式切换为第一模式。在移动终端装置100于第一模式的情况下,如步骤S204所示,当来电接收单元140接收到来电通话C时,来电接收单元140会通过语音输出单元110发送语音通知SO,并启动语音接收单元120接收语音信号SI。
详细而言,语音通知SO可告知使用者来电通话的来源,例如,来电接收单元140可依据来电通话C而通过语音输出单元110发出关于来电通话C的电话号码信息,或进而依据联络人通讯录而查出拨出此来电通话C的联络人名称,不限于上述。举例来说,来电接收单元140可通过语音输出单元110而发送出「王大明给您来电,现在接听吗?」、「X公司给您来电,现在接听吗?」、「来电是0922-123564,现在接听吗?」或「来电是886922-123564,现在接听吗?」等关于来电通话C的信息。此外,倘若此来电通话C未提供电话号码,则来电接收单元140亦可通过语音输出单元110而送出预设的语音通知SO,例如,「这是未知电话,现在接听吗?」等等。
根据上述的语音通知SO,使用者可得知来电通话C的来源,并可通过语音的方式来操控来电接收单元140以回应此来电通话C。因此,当来电接收单元140接收到来电通话C时,来电接收单元140会启动语音接收单元120以接收来自使用者的语音信号SI。
于步骤S206,语言理解模块130会解析语音接收单元120所接收到的语音信号SI,以获得语音识别结果。在此,语言理解模块130可接收来自语音接收单元120的语音信号SI,并将语音信号SI分割成多个分段语义。并且,语言理解模块130会对上述分段语义进行自然语言理解,以识别出语音信号SI中的应答信息。在此说明的是,在计算机系统架构下的自然语言理解中,通常会使用固定词语法来撷取语音信号SI的语句,以解析这些语句所意指的指令或意图(例如接听来电通话C、拒绝接听来电通话C或发送简讯等动作)等,而判断出语音信号SI的意思,藉以获得语音识别结果。在本实施例中,语言理解模块130可通过语义数据库106,来查询语音信号SI中所分割成的分段语义是对应于哪些指令,其中语义数据库106可记录有各种分段语义与各种命令的关系。在本实施例中,根据上述各种分段语义,语言理解模块130还可判断出语音信号SI中哪些是使用者欲回应来电通话C的信息。
举例来说,当使用者回应「好的」、「接听」、「接一下」等之类表示要接听来电通话C的语音信号SI时,语言理解模块130可通过语义数据库106来查询「好的」、「接听」、「接一下」等所对应的命令,而解析出上述的语音信号SI是用以表示接听来电通话C。在另一实施例中,当使用者回应「不接」、「不」、「先不接」等之类表示要拒绝接听来电通话C的语音信号SI时,语言理解模块130可通过语义数据库106来查询「不接」、「不」、「先不接」等所对应的命令,而解析出上述的语音信号SI是用以表示拒绝接听来电通话C。在另一实施例中,当使用者回应「先不接,告诉他我到公司后再打电话给他」等之类表示发送讯息以回应来电通话C的语音信号SI时,语言理解模块130可通过语义数据库106来查询「先不接」所对应的命令,而解析出语音信号S为表示拒绝接听来电通话C。并且,语言理解模块130还可通过语义数据库106来判断出「告诉他」是表示发送讯息的命令,藉以在后续步骤中根据这个命令来执行应答操作,例如是根据这个命令来产生应答信号(如发送简讯等)。此外,语言理解模块130还可判断出「告诉他」之后的语音是表示发送讯息时的应答内容(例如是「到公司后再打电话」)。
接着,于步骤S208,来电接收单元140会根据语言理解模块130所解析出的语音识别结果,执行对应的应答操作。在本实施例中,由于使用者可通过语音的方式,以命令移动终端装置100进行接听、拒接来电通话C、发送讯息或其他动作以回应来电通话C,因此语言理解模块130解析语音信号SI之后,可判断出语音信号SI中的命令。故来电接收单元140可根据语音信号SI中的命令来执行对一的应答操作。上述来电接收单元140所执行应答操作可以是接听来电通话C、拒绝接听来电通话C、传送预设语音应答以回应来电通话C,或者传送简讯、语音应答等应答信号,以回应来电通话C,其中应答信号中具有使用者欲回应来电通话C的应答内容。
为了使本领域的技术人员进一步了解本实施例来电接收单元140所执行的应答操作,底下再举诸实施例,其中,仍结合图1的移动终端装置100来进行说明。
当移动终端装置100切换为第一模式时(例如移动终端装置100用于移动中的行车装置中而进入车载模式),假设来电接收单元140接收到来电通话C,且来电接收单元140会通过语音输出单元110发送「王大明给您来电,现在接听吗?」这个语音通知SO。在本实施例中,倘若使用者回应「好的」这个语音信号SI,则来电接收单元140会接听这个来电通话C。
另一方面,倘若使用者回应「不接」这个语音信号SI,则来电接收单元140会拒绝接听这个来电通话C。在一实施例中,来电接收单元140还可传送「您拨的电话暂时无法接听,请稍后再拨,或在『哔』声后留言」这个预设语音应答来回应来电通话C。
此外,倘若使用者回应「先不接,告诉他我到公司后再打电话给他」这个语音信号SI,则来电接收单元140会拒绝接听这个来电通话C,并且会自语音识别结果取得应答内容,即「到公司后再打电话」这个应答内容以发送简讯,其中例如在简讯中记载「我在开会,稍后再回拨」这个简讯内容来回应来电通话C。
如此一来,在移动终端装置100进入车载模式的情况下,移动终端装置100可自动询问使用者是否接听来电通话C,以让使用者直接通过语音的方式来操控移动终端装置100进行接听、拒绝接听或其他应答操作。
依据上述,移动终端装置100可自动从通常模式切换为第一模式。并且,当来电接收单元140在第一模式接收到来电通话时,语音输出单元110会发送语音通知以询问使用者。当使用者发送语音信号时,语言理解模块130会对此语音信号进行解析,且来电接收单元140会根据语言理解模块130解析后所获得的语音识别结果,执行对应的应答操作。如此一来,移动终端装置可更快速地提供语音服务,其中当移动终端装置100在第一模式的情况下,例如用于移动中的行车装置时,使用者可方便地根据移动终端装置100所发送的语音通知,通过语音的方式来回应来电通话。藉此,使用者可更加便利地操控移动终端装置。
图3是依照本发明一实施例所绘示的移动终端装置的方块图。请参照图3,移动终端装置300具有语音输出单元310、语音接收单元320、语言理解模块330以及语音唤醒模块350。本实施例的移动终端装置300与图1的移动终端装置100相似,其不同之处在于:本实施例的移动终端装置300还具有语音唤醒模块350。
语音唤醒模块350用以判断是否接收到具有识别信息的语音信号。在本实施例中,当语音唤醒模块350未接收到具有识别信息的语音信号时,语音输出单元310、语音接收单元320及语言理解模块330可以处于待机或关闭等模式,即移动终端装置300不会与使用者进行语音交互。而当语音唤醒模块350接收到具有识别信息的语音信号时,移动终端装置300则会启动语音接收单元320以接收之后的语音信号,并通过语言理解模块330来进行解析,即移动终端装置300会依据此语音信号与使用者进行语音交互,且还可执行对应于语音信号的应答操作等。故在本实施例中,使用者可直接以语音的方式,说出具有识别信息的语音(例如特定的字汇,如名字),来唤醒移动终端装置300执行语音交互功能。此外,本实施例的语音唤醒模块350可由一个或数个逻辑门组合而成的硬件电路来实作,亦可以是以计算机程序码来实作。
值得一提的是,由于语音接收单元320是在语音唤醒模块350识别出识别信息之后而被启动,因此语言理解模块330可避免对非语音信号(例如杂音信号)进行解析。此外,由于语音唤醒模块350只要能识别出识别信息所对应的音讯(例如「小茜」这个识别信息所对应的音讯),即会判断所接收到的语音信号具有识别信息,因此语音唤醒模块350可以不具备有自然语言理解的能力,而具有较低功率的消耗。如此一来,当使用者未提供具有识别信息的语音信号时,移动终端装置300不会启动语音交互功能,故移动终端装置300不仅可方便使用者通过语音来进行操控,亦可节省电源消耗。
以下即结合上述移动终端装置300来说明语音操控的方法。图4是依照本发明一实施例所绘示的语音操控方法的流程图。请同时参照图3及图4,于步骤S402中,语音唤醒模块350会判断是否接收到符合识别信息的语音信号(底下以语音信号V1表示)。详细而言,识别信息可以是特定的字汇(例如名字)所对应的预设音,其中此预设音会在特定音频范围或特定能量范围之内。也就是说,语音唤醒模块350可判断是否接收到在特定音频范围或特定能量范围之内的预设音,而判断出是否接收到具有识别信息的语音信号V1。在本实施例中,使用者可预先通过移动终端装置300的系统来设定这个识别信息,例如预先提供识别信息所对应的预设音,而语音唤醒模块350可藉由比对语音信号V1是否符合这个预设音,来判断语音信号V1是否具有识别信息。举例来说,假设识别信息为「小茜」这个名字所对应的预设音,则语音唤醒模块350会判断是否接收到具有「小茜」的语音信号V1。
倘若语音唤醒模块350未接收到符合识别信息的语音信号V1,则如步骤S404所示,移动终端装置300不会启动语音交互功能。由于语音唤醒模块350未接收到符合识别信息的语音信号V1,因此语音接收单元320是成关闭状态或休眠状态而不会进行语音信号的接收,故移动终端装置300中的语言理解模块330不会取得到之后的语音信号来进行解析。举例来说,假设识别信息为「小茜」,倘若使用者未说出「小茜」而是说出「小王」等其他语音,即语音唤醒模块350无法接收到符合「小茜」的语音信号V1,故移动终端装置300的语音交互功能不会被启动。
于步骤S406中,当语音唤醒模块350判断语音信号V1符合识别信息时,移动终端装置300会启动语音接收单元320以接收音讯。并且,语言理解模块330会依据语音接收单元320所接收到的音讯,判断语音接收单元320是否在语音信号V1之后接收到另一语音信号(底下以语音信号V2表示)。在本实施例中,语言理解模块330可判断语音接收单元320所接收到的音讯的能量是否超过一设定值。若所述音讯的能量未超过设定值,则语言理解模块330会判断此音讯为杂音,藉以判断语音接收单元320未接收到语音信号V2;若所述音讯的能量已达设定值,则语言理解模块330可判断语音接收单元320已接收到语音信号V2,进而根据此语音信号V2来执行后续的步骤。
倘若语言理解模块330判断语音接收单元320未接收到语音信号V2,则如步骤S408所示,语言理解模块330会执行语音对话模式。在语音对话模式中,语言理解模块330可通过语音输出单元310发送语音应答,且可通过语音接收单元320继续接收及解析来自使用者的另一个语音信号,据以做出另一个语音应答或者应答操作,直到语言理解模块330判断出具有对话终止提示信息的语音信号,或者移动终端装置300已完成使用者的命令或请求为止。关于语音对话模式的详细步骤,将于后详述。
倘若语言理解模块330判断语音接收单元320接收到语音信号V2,则如步骤S410所示,语言理解模块330会解析语音信号V2而获得语音识别结果。语言理解模块330可接收来自语音接收单元320的语音信号V2,并将语音信号V2分割成多个分段语义,以及对上述分段语义进行自然语言理解,以识别出语音信号V2中的内容。如同图1的语言理解模块130,本实施例的语言理解模块330可依据固定词语法来撷取语音信号V2的语句,以解析这些语句所意指的指令或意图(例如命令句或者询问句)等,而判断出语音信号V2的意思,藉以获得语音识别结果。其中,语言理解模块330可通过语义数据库306,来查询语音信号V2中所分割成的分段语义是对应于哪些指令,而上述语义数据库306可记录有各种分段语义与各种命令的关系。
接着,如步骤S412所示,语言理解模块330会判断语音识别结果中是否具有可执行请求信息。详细而言,可执行请求信息例如是指让移动终端装置300完成请求操作。也就是说,语言理解模块330可依据语音识别结果中的可执行请求信息,让移动终端装置300执行一个动作,其中移动终端装置300例如可通过一个或多个应用程序来完成。举例来说,当语音信号V2为「帮我打电话给王大明」、「帮我查台北明天的天气」或「现在几点」等,则语音信号V2具有可执行请求信息,因此,语言理解模块330解析上述语音信号V2后,可令移动终端装置300拨打电话给王大明、上网查并回报台北明天的天气、或者查询并回报现在的时间等这些动作。
另一方面,若语音识别结果不具有可执行请求信息,则表示语言理解模块330无法依据语音识别结果而判断使用者的意图,因此无法让移动终端装置300完成请求操作。举例来说,当语音信号V2为「帮我打电话」、「帮我查天气」、「现在」等,则语言理解模块330解析语音信号V2后,无法令移动终端装置300完成上述的请求操作。亦即,语言理解模块330无法判断出上述语音信号V2中的通话对象、查询哪一时间内或哪一地点的天气,以及无法根据一个不具完整语意的句子来执行。
当语音识别结果具有可执行请求信息时,则如步骤S414所示,语言理解模块330会执行应答操作,且移动终端装置300会关闭接收其他语音信号(底下以语音信号V3表示),藉以关闭移动终端装置300的语音交互功能。
具体来说,当可执行请求信息为操作指令时,则语言理解模块330会启动对应于操作指令的操作功能。例如,当可执行请求信息为「调低屏幕的亮度」,则语言理解模块330会发出一调整亮度的信号于移动终端装置300的系统,使其将屏幕的亮度调低。此外,当可执行请求信息为询问句时,则语言理解模块330会发送对应于此询问句的语音应答。此时语言理解模块330可识别出询问句中的一个或多个关键词,并依据这些关键词而自搜寻引擎中进行查询对应的答案,再通过语音输出单元310来输出语音应答。例如,当可执行请求信息为「明天台北的温度是几度?」,则语言理解模块330可发出一查询信号以通过搜寻引擎查询对应的答案,并通过语音输出单元310来输出「明天台北的温度是26度」这个语音应答。
在此说明的是,由于上述的可执行请求信息会让移动终端装置300完成请求操作,因此语言理解模块330执行应答操作之后,此时的语音接收单元320会成关闭或休眠状态,而不会接收到其他的语音信号V3。更进一步而言,当语音接收单元320被关闭接收语音信号V3时,若使用者欲通过语音的方式来令移动终端装置300执行请求操作,则使用者需再呼叫具有识别信息的语音,藉以通过语音唤醒模块350来进行判断,进而再次启动语音接收单元320。
当语音识别结果不具有可执行请求信息时,则如步骤S408所示,语言理解模块330会执行语音对话模式。在此,语言理解模块330会根据语音信号V2通过语音输出单元310发送语音应答,并且会通过语音接收单元320,继续接收另一个语音信号。也就是说,语言理解模块330会继续接收及解析来自使用者的语音信号,据以做出另一个语音应答或者应答操作,直到语言理解模块330判断出具有对话终止提示信息的语音信号,或者移动终端装置300已完成使用者的命令或请求为止。
为了使本领域的技术人员进一步了解上述语言理解模块330所执行的语音对话模式,底下举诸实施例为例,其中仍结合图3的移动终端装置300来进行说明。
图5是依照本发明一实施例所绘示的语音操控方法的流程图。请同时参照图3、图4与图5,语言理解模块330在执行语音对话模式时,于步骤S502中,语言理解模块330会产生语音应答,底下以语音应答A1表示,并通过语音输出单元310输出。由于语言理解模块330会因未接收到语音信号V2(如图4的步骤S406)而执行语音对话模式,或者是因接收到不具有可执行请求信息的语音信号V2而执行语音对话模式(如图4的步骤S412),故此时,语言理解模块330会自动发送语音应答A1以询问使用者的请求信息(即使用者的意图)。
举例来说,当语音接收单元320未接收到语音信号V2时,语言理解模块330可通过语音输出单元310发送「有什么事吗?」、「需要提供什么服务?」等,不限于此,藉以询问使用者。此外,当语言理解模块330所接收到的语音信号V2不具有可执行请求信息时,语言理解模块330可通过语音输出单元310发送「您说的是哪一个地方的天气?」、「您说的是谁的电话?」或「您说的是什么意思?」等等,不限于此。
需说明的是,语言理解模块330亦可根据这个不具有可执行请求信息的语音信号V2,而找出匹配此语音信号V2的语音应答。换言之,语言理解模块330可进入语音聊天的模式,以和使用者进行沟通。其中,语言理解模块330可通过语义数据库306来实现上述的语音聊天的模式。详细而言,语义数据库306可记录有多种候选答案,而语言理解模块330依据优先顺序来选取这些候选答案的其中之一来做为语音应答。例如,语言理解模块330可依据众人使用习惯,以决定这些候选答案的优先顺序。或者,语言理解模块330可依据使用者的喜好或者习惯,以决定这些候选答案的优先顺序。值得一提的是,语义数据库306中亦可记录先前语言理解模块330所输出的语音应答的内容,并依据先前的内容来产生语音应答。上述选出语音应答的方法为举例说明,本实施例并不以此为限制。
当语言理解模块330通过语音输出单元310输出语音应答之后,于步骤S504中,语言理解模块330会判断语音接收单元320是否再接收到其他语音信号(底下以语音信号V4表示)。此处与图4的步骤S406相似,可参照前述的说明。
当语音接收单元320接收语音信号V4时,则如步骤S506所示,语言理解模块330会判断语音信号V4是否符合对话终止提示信息,或者语音信号V4是否具有可执行请求信息。对话终止提示信息例如是特定词汇,用以表示对话终止。亦即,语言理解模块330会对语音信号V4进行解析,倘若解析到上述的特定词汇,则判断语音信号V4符合对话终止提示信息。举例来说,当语音信号V4符合「再见」或「没事了」等这些对话终止提示信息,则语音接收单元320不会继续接收语音信号。另一方面,若语音信号V4具有可执行请求信息,则语言理解模块330即会执行对应于可执行请求信息的应答操作。并且,语言理解模块330会终止语音对话模式,而语音接收单元320亦不再继续接收语音信号。在此与图4的步骤S414相似,可参照前述的说明。
若语音信号V4符合对话终止提示信息,或者具有可执行请求信息时,则如步骤S508所示,语言理解模块330则终止语音对话模式,并终止接收之后的语音信号,据以结束移动终端装置300和使用者进行语音沟通。也就是说,此时若使用者欲通过语音的方式来操控移动终端装置300,则需说出具有识别信息(例如「小茜」这个名子)的语音信号,才可再启动移动终端装置300执行语音交互。
此外,若语音信号V4不符合对话终止提示信息,亦不具有可执行请求信息时,则回到步骤S502,语言理解模块330会继续通过语音输出单元310发送语音应答来询问使用者。
返回步骤S504,当语音接收单元320未接收到语音信号V4,则如步骤S510所示,语言理解模块330会判断于预设时间内未接收到语音信号V4的次数,是否超过预设次数。具体来说,若于预设时间内未接收到语音信号V4,则语言理解模块330会记录一笔次数。如此一来,当所记录的次数未超过预设次数时,则回到步骤S502,语言理解模块330会继续通过语音输出单元310发送语音应答,藉以询问使用者的意图。其中,语言理解模块330可于语音接收单元320未接收到语音信号V4的预设时间之后,产生语音应答。上述的语音应答例如是「您还在吗?」、「需要提供什么服务?」等问句,不限于此。
反之,当所记录的次数为超过预设次数时,则如步骤S508所示,语言理解模块330会终止此语音对话模式,且语音接收单元320会终止接收之后的语音信号,亦即移动终端装置300会结束与使用者进行语音沟通,以结束语音交互。
值得一提的是,当移动终端装置300结束语音交互功能之后,使用者不仅可呼叫具有识别信息的语音信号,以和移动终端装置300沟通,使用者也可按压按键302,来直接启动移动终端装置300的语音交互功能。或者,使用者亦可通过辅助操控装置304,从辅助操控装置304发出无线传输信号至移动终端装置300,以启动语音交互功能。于此,移动终端装置300便会启动语音接收单元320来接收语音信号。
依据上述,本实施例的移动终端装置300可依据符合识别信息的语音信号,而启动移动终端装置300的语音交互功能,藉以可更快速地提供语音服务。其中,在移动终端装置300未启动其语音交互功能时,语音唤醒模块350会检测符合识别信息的语音信号。倘若语音唤醒模块350接收到上述符合识别信息的语音信号时,语音接收单元320则会被启动,以接收在上述语音信号之后的另一个语音信号。之后,语言理解模块330则会根据上述另一个语音信号来做出应答操作并终止移动终端装置300的语音交互功能;或者根据上述另一个语音信号发送语音应答,藉以获得使用者的意图或和使用者对话,直到解析到对话终止提示信息或做出应答操作为止。如此一来,使用者可更加便利地操控移动终端装置300。
综上所述,在本发明的语音接听方法与移动终端装置中,移动终端装置可自动从通常模式切换为第一模式。并且,当移动终端装置在第一模式接收到来电通话时,移动终端装置可发送语音通知以询问使用者,而让使用者可通过语音的方式发送语音信号来操控移动终端装置进行回应。此时,移动终端装置可根据来自使用者的语音信号进行解析,并根据解析后所获得的语音识别结果,执行对应的应答操作。如此一来,使用者可方便地根据移动终端装置所发送的语音通知,通过语音的方式来回应来电通话。
此外,在本发明的语音操控方法与移动终端装置中,移动终端装置可据符合识别信息的语音信号,以启动语音交互功能。在移动终端装置未启动其语音交互功能时,倘若移动终端装置接收到符合识别信息的语音信号,移动终端装置则会接收在上述语音信号之后的另一个语音信号。之后,移动终端装置会根据上述另一个语音信号来做出应答操作并终止语音交互功能;或者根据上述另一个语音信号发送语音应答,藉以获得使用者的意图或和使用者对话,直到解析到对话终止提示信息或做出应答操作为止。如此一来,使用者仅需发送具有识别信息的语音信号,即可方便地与移动终端装置进行语音沟通,并在通话过程中可以完全解放双手,因为移动终端总是在一个对话回合后自动打开语音输入。且移动终端装置可根据使用者所说的内容来终止语音交互,藉以可更快速地提供语音服务。基此,本发明的语音接听方法、语音操控方法与移动终端装置,可让使用者可更加便利地操控移动终端装置。
虽然本发明已以实施例揭示如上,然其并非用以限定本发明,本领域技术人员,在不脱离本发明的精神和范围的前提下,可作些许的更动与润饰,故本发明的保护范围是以本发明的权利要求为准。

Claims (12)

1.一种移动终端装置,包括:
一语音接收单元;
一语音输出单元;
一语音唤醒模块,判断是否接收到符合一识别信息的一第一语音信号;以及
一语言理解模块,耦接于该语音接收单元、该语音输出单元以及该语音唤醒模块,其中当该语音唤醒模块判断该第一语音信号符合该识别信息时,该移动终端装置启动该语音接收单元,且该语言理解模块判断该语音接收单元是否在该第一语音信号之后接收到一第二语音信号,倘若该语音接收单元未接收到该第二语音信号,则该语言理解模块执行一语音对话模式,倘若该语音接收单元接收到该第二语音信号,则该语言理解模块解析该第二语音信号而获得一语音识别结果,其中
当该语音识别结果具有一可执行请求信息时,该语言理解模块执行一应答操作,且该移动终端装置关闭该语音接收单元接收一第三语音信号,以及当该语音识别结果不具有一可执行请求信息时,该语言理解模块执行该语音对话模式。
2.如权利要求1所述的移动终端装置,其中当该可执行请求信息为一操作指令时,该语言理解模块启动对应于该操作指令的一操作功能。
3.如权利要求1所述的移动终端装置,其中当该可执行请求信息为一询问句,该语言理解模块通过该语音输出单元发送对应于该询问句的一语音应答。
4.如权利要求1所述的移动终端装置,其中该语言理解模块判断该语音接收单元在一预设时间内接收到该第二语音信号或一第四语音信号的次数,是否超过一预设次数,若该次数超过该预定次数,则终止该语音对话模式,且该移动终端装置关闭该语音接收单元。
5.如权利要求4所述的移动终端装置,其中该语言理解模块判断该语音接收单元是否接收到符合一对话终止提示信息的该第四语音信号,以及
倘若该语音接收单元接收到符合该对话终止提示信息的该第四语音信号,则该语言理解模块终止该语音对话模式,且该移动终端装置关闭该语音接收单元。
6.如权利要求4所述的移动终端装置,其中该语言理解模块判断该语音接收单元是否接收到具有该可执行请求信息的该第四语音信号,以及
倘若该语音接收单元接收到具有该可执行请求信息的该第四语音信号,则该语言理解模块终止该语音对话模式,且该移动终端装置关闭该语音接收单元。
7.一种语音操控方法,用于一移动终端装置,该方法包括:
判断是否接收到符合一识别信息的一第一语音信号;
当该第一语音信号符合该识别信息时,判断在该第一语音信号之后是否接收到一第二语音信号;
倘若未接收到该第二语音信号,则执行一语音对话模式;
倘若接收到该第二语音信号,则解析该第二语音信号而获得一语音识别结果;
当该语音识别结果具有一可执行请求信息时,执行一应答操作,并关闭接收一第三语音信号;以及
当该语音识别结果不具有一可执行请求信息时,执行该语音对话模式。
8.如权利要求7所述的语音操控方法,其中当该语音识别结果具有该可执行请求信息时,执行该应答操作的步骤包括:
当该可执行请求信息为一操作指令时,启动对应于该操作指令的一操作功能。
9.如权利要求7所述的语音操控方法,其中当该语音识别结果具有该可执行请求信息时,执行该应答操作的步骤还包括:
当该可执行请求信息为一询问句,发送对应于该询问句的一语音应答。
10.如权利要求7所述的语音操控方法,其中当未在一预设时间内接收到该第二语音信号或一第四语音信号的次数,超过一预设次数,则终止该语音对话模式。
11.如权利要求10所述的语音操控方法,其中在根据接收到的该第二语音信号产生该语音应答,并继续接收该第四语音信号的步骤包括:
判断是否接收到符合一对话终止提示信息的该第四语音信号;以及
倘若接收到符合该对话终止提示信息的该第四语音信号,则终止该语音对话模式,并终止接收该第四语音信号。
12.如权利要求10所述的语音操控方法,其中在根据接收到的该第二语音信号产生该语音应答,并继续接收该第四语音信号的步骤包括:
判断是否接收到具有该可执行请求信息的该第四语音信号;以及
倘若接收到具有该可执行请求信息的该第四语音信号,则终止该语音对话模式,并终止接收该第四语音信号。
CN201310123229XA 2013-04-10 2013-04-10 语音操控方法与移动终端装置 Pending CN103198831A (zh)

Priority Applications (5)

Application Number Priority Date Filing Date Title
CN201310123229XA CN103198831A (zh) 2013-04-10 2013-04-10 语音操控方法与移动终端装置
CN201710383843.8A CN107274897A (zh) 2013-04-10 2013-07-11 语音操控方法与移动终端装置
CN201310291242.6A CN104104790A (zh) 2013-04-10 2013-07-11 语音操控方法与移动终端装置
TW102125767A TWI489372B (zh) 2013-04-10 2013-07-18 語音操控方法與行動終端裝置
US14/231,765 US20140309996A1 (en) 2013-04-10 2014-04-01 Voice control method and mobile terminal apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310123229XA CN103198831A (zh) 2013-04-10 2013-04-10 语音操控方法与移动终端装置

Publications (1)

Publication Number Publication Date
CN103198831A true CN103198831A (zh) 2013-07-10

Family

ID=48721306

Family Applications (3)

Application Number Title Priority Date Filing Date
CN201310123229XA Pending CN103198831A (zh) 2013-04-10 2013-04-10 语音操控方法与移动终端装置
CN201310291242.6A Pending CN104104790A (zh) 2013-04-10 2013-07-11 语音操控方法与移动终端装置
CN201710383843.8A Pending CN107274897A (zh) 2013-04-10 2013-07-11 语音操控方法与移动终端装置

Family Applications After (2)

Application Number Title Priority Date Filing Date
CN201310291242.6A Pending CN104104790A (zh) 2013-04-10 2013-07-11 语音操控方法与移动终端装置
CN201710383843.8A Pending CN107274897A (zh) 2013-04-10 2013-07-11 语音操控方法与移动终端装置

Country Status (3)

Country Link
US (1) US20140309996A1 (zh)
CN (3) CN103198831A (zh)
TW (1) TWI489372B (zh)

Cited By (93)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104253902A (zh) * 2014-07-21 2014-12-31 宋婉毓 与智能语音设备进行语音交互的方法
CN104598192A (zh) * 2014-12-29 2015-05-06 联想(北京)有限公司 信息处理方法及电子设备
WO2015070644A1 (zh) * 2013-11-15 2015-05-21 华为终端有限公司 一种终端语音控制方法、装置及终端
CN104916015A (zh) * 2015-05-25 2015-09-16 郭萌 一种声控锁具的方法
CN105224278A (zh) * 2015-08-21 2016-01-06 百度在线网络技术(北京)有限公司 语音交互服务处理方法及装置
CN105471712A (zh) * 2015-11-25 2016-04-06 深圳狗尾草智能科技有限公司 一种机器人答复系统及其答复方法
CN105493180A (zh) * 2013-08-26 2016-04-13 三星电子株式会社 用于语音识别的电子装置和方法
CN105719645A (zh) * 2014-12-17 2016-06-29 现代自动车株式会社 语音识别装置、包括其的车辆和控制语音识别装置的方法
CN105788600A (zh) * 2014-12-26 2016-07-20 联想(北京)有限公司 声纹识别方法和电子设备
CN106233377A (zh) * 2014-04-25 2016-12-14 夏普株式会社 信息处理装置和控制程序
CN106603826A (zh) * 2016-11-29 2017-04-26 维沃移动通信有限公司 一种应用事件的处理方法及移动终端
CN106653021A (zh) * 2016-12-27 2017-05-10 上海智臻智能网络科技股份有限公司 语音唤醒的控制方法、装置及终端
CN106782541A (zh) * 2017-02-24 2017-05-31 太仓市同维电子有限公司 一种带有语音识别功能的家庭网关设计方法
CN107408387A (zh) * 2015-03-08 2017-11-28 苹果公司 虚拟助理激活
CN107644640A (zh) * 2016-07-22 2018-01-30 佛山市顺德区美的电热电器制造有限公司 一种信息处理方法及家电设备
CN107895578A (zh) * 2017-11-15 2018-04-10 百度在线网络技术(北京)有限公司 语音交互方法和装置
CN108182939A (zh) * 2017-12-13 2018-06-19 苏州车萝卜汽车电子科技有限公司 用于自助服务的语音处理方法及装置
CN108847236A (zh) * 2018-07-26 2018-11-20 珠海格力电器股份有限公司 语音信息的接收方法及装置、语音信息的解析方法及装置
CN109243462A (zh) * 2018-11-20 2019-01-18 广东小天才科技有限公司 一种语音唤醒方法及装置
CN109389981A (zh) * 2017-08-03 2019-02-26 晨星半导体股份有限公司 声控装置及相关的声音信号处理方法
CN109686368A (zh) * 2018-12-10 2019-04-26 北京梧桐车联科技有限责任公司 语音唤醒应答处理方法及装置、电子设备及存储介质
CN109767767A (zh) * 2019-01-25 2019-05-17 广州富港万嘉智能科技有限公司 一种语音交互方法、系统、电子设备及存储介质
CN109788128A (zh) * 2018-12-27 2019-05-21 深圳市优必选科技有限公司 一种来电提示方法、来电提示装置及终端设备
CN110136719A (zh) * 2018-02-02 2019-08-16 上海流利说信息技术有限公司 一种实现智能语音对话的方法、装置及系统
CN110246497A (zh) * 2019-07-09 2019-09-17 王振仁 一种语音控制灯具的控制方法、系统及介质
CN110473556A (zh) * 2019-09-17 2019-11-19 深圳市万普拉斯科技有限公司 语音识别方法、装置和移动终端
US10720160B2 (en) 2018-06-01 2020-07-21 Apple Inc. Voice interaction at a primary device to access call functionality of a companion device
US10741181B2 (en) 2017-05-09 2020-08-11 Apple Inc. User interface for correcting recognition errors
US10741185B2 (en) 2010-01-18 2020-08-11 Apple Inc. Intelligent automated assistant
US10878809B2 (en) 2014-05-30 2020-12-29 Apple Inc. Multi-command single utterance input method
CN112233672A (zh) * 2020-09-30 2021-01-15 成都长虹网络科技有限责任公司 分布式语音控制方法、系统、计算机设备和可读存储介质
US10909171B2 (en) 2017-05-16 2021-02-02 Apple Inc. Intelligent automated assistant for media exploration
US10930282B2 (en) 2015-03-08 2021-02-23 Apple Inc. Competing devices responding to voice triggers
CN112435663A (zh) * 2020-11-11 2021-03-02 青岛歌尔智能传感器有限公司 命令语音管理方法、装置、设备及介质
US10978090B2 (en) 2013-02-07 2021-04-13 Apple Inc. Voice trigger for a digital assistant
US11010127B2 (en) 2015-06-29 2021-05-18 Apple Inc. Virtual assistant for media playback
US11009970B2 (en) 2018-06-01 2021-05-18 Apple Inc. Attention aware virtual assistant dismissal
US11037565B2 (en) 2016-06-10 2021-06-15 Apple Inc. Intelligent digital assistant in a multi-tasking environment
US11070949B2 (en) 2015-05-27 2021-07-20 Apple Inc. Systems and methods for proactively identifying and surfacing relevant content on an electronic device with a touch-sensitive display
US11120372B2 (en) 2011-06-03 2021-09-14 Apple Inc. Performing actions associated with task items that represent tasks to perform
US11126400B2 (en) 2015-09-08 2021-09-21 Apple Inc. Zero latency digital assistant
US11133008B2 (en) 2014-05-30 2021-09-28 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
US11140099B2 (en) 2019-05-21 2021-10-05 Apple Inc. Providing message response suggestions
US11152002B2 (en) 2016-06-11 2021-10-19 Apple Inc. Application integration with a digital assistant
US11169616B2 (en) 2018-05-07 2021-11-09 Apple Inc. Raise to speak
US11217251B2 (en) 2019-05-06 2022-01-04 Apple Inc. Spoken notifications
US11237797B2 (en) 2019-05-31 2022-02-01 Apple Inc. User activity shortcut suggestions
US11257504B2 (en) 2014-05-30 2022-02-22 Apple Inc. Intelligent assistant for home automation
US11269678B2 (en) 2012-05-15 2022-03-08 Apple Inc. Systems and methods for integrating third party services with a digital assistant
US11289073B2 (en) 2019-05-31 2022-03-29 Apple Inc. Device text to speech
US11307752B2 (en) 2019-05-06 2022-04-19 Apple Inc. User configurable task triggers
US11348573B2 (en) 2019-03-18 2022-05-31 Apple Inc. Multimodality in digital assistant systems
US11348582B2 (en) 2008-10-02 2022-05-31 Apple Inc. Electronic devices with voice command and contextual data processing capabilities
US11360641B2 (en) 2019-06-01 2022-06-14 Apple Inc. Increasing the relevance of new available information
US11380310B2 (en) 2017-05-12 2022-07-05 Apple Inc. Low-latency intelligent automated assistant
US11388291B2 (en) 2013-03-14 2022-07-12 Apple Inc. System and method for processing voicemail
US11405466B2 (en) 2017-05-12 2022-08-02 Apple Inc. Synchronization and task delegation of a digital assistant
US11423886B2 (en) 2010-01-18 2022-08-23 Apple Inc. Task flow identification based on user intent
US11423908B2 (en) 2019-05-06 2022-08-23 Apple Inc. Interpreting spoken requests
US11431642B2 (en) 2018-06-01 2022-08-30 Apple Inc. Variable latency device coordination
US11468282B2 (en) 2015-05-15 2022-10-11 Apple Inc. Virtual assistant in a communication session
US11467802B2 (en) 2017-05-11 2022-10-11 Apple Inc. Maintaining privacy of personal information
US11475898B2 (en) 2018-10-26 2022-10-18 Apple Inc. Low-latency multi-speaker speech recognition
US11475884B2 (en) 2019-05-06 2022-10-18 Apple Inc. Reducing digital assistant latency when a language is incorrectly determined
US11488406B2 (en) 2019-09-25 2022-11-01 Apple Inc. Text detection using global geometry estimators
US11496600B2 (en) 2019-05-31 2022-11-08 Apple Inc. Remote execution of machine-learned models
US11500672B2 (en) 2015-09-08 2022-11-15 Apple Inc. Distributed personal assistant
US11516537B2 (en) 2014-06-30 2022-11-29 Apple Inc. Intelligent automated assistant for TV user interactions
US11526368B2 (en) 2015-11-06 2022-12-13 Apple Inc. Intelligent automated assistant in a messaging environment
US11532306B2 (en) 2017-05-16 2022-12-20 Apple Inc. Detecting a trigger of a digital assistant
US11580990B2 (en) 2017-05-12 2023-02-14 Apple Inc. User-specific acoustic models
US11599331B2 (en) 2017-05-11 2023-03-07 Apple Inc. Maintaining privacy of personal information
US11638059B2 (en) 2019-01-04 2023-04-25 Apple Inc. Content playback on multiple devices
US11656884B2 (en) 2017-01-09 2023-05-23 Apple Inc. Application integration with a digital assistant
US11657813B2 (en) 2019-05-31 2023-05-23 Apple Inc. Voice identification in digital assistant systems
US11671920B2 (en) 2007-04-03 2023-06-06 Apple Inc. Method and system for operating a multifunction portable electronic device using voice-activation
US11696060B2 (en) 2020-07-21 2023-07-04 Apple Inc. User identification using headphones
US11710482B2 (en) 2018-03-26 2023-07-25 Apple Inc. Natural assistant interaction
US11727219B2 (en) 2013-06-09 2023-08-15 Apple Inc. System and method for inferring user intent from speech inputs
US11755276B2 (en) 2020-05-12 2023-09-12 Apple Inc. Reducing description length based on confidence
US11765209B2 (en) 2020-05-11 2023-09-19 Apple Inc. Digital assistant hardware abstraction
US11790914B2 (en) 2019-06-01 2023-10-17 Apple Inc. Methods and user interfaces for voice-based control of electronic devices
US11798547B2 (en) 2013-03-15 2023-10-24 Apple Inc. Voice activated device for use with a voice-based digital assistant
US11809483B2 (en) 2015-09-08 2023-11-07 Apple Inc. Intelligent automated assistant for media search and playback
US11809783B2 (en) 2016-06-11 2023-11-07 Apple Inc. Intelligent device arbitration and control
US11838734B2 (en) 2020-07-20 2023-12-05 Apple Inc. Multi-device audio adjustment coordination
US11853536B2 (en) 2015-09-08 2023-12-26 Apple Inc. Intelligent automated assistant in a media environment
US11853647B2 (en) 2015-12-23 2023-12-26 Apple Inc. Proactive assistance based on dialog communication between devices
US11854539B2 (en) 2018-05-07 2023-12-26 Apple Inc. Intelligent automated assistant for delivering content from user experiences
US11886805B2 (en) 2015-11-09 2024-01-30 Apple Inc. Unconventional virtual assistant interactions
US11893992B2 (en) 2018-09-28 2024-02-06 Apple Inc. Multi-modal inputs for voice commands
US11914848B2 (en) 2020-05-11 2024-02-27 Apple Inc. Providing relevant data items based on context
US11928604B2 (en) 2005-09-08 2024-03-12 Apple Inc. Method and apparatus for building an intelligent automated assistant

Families Citing this family (58)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8682667B2 (en) 2010-02-25 2014-03-25 Apple Inc. User profiling for selecting user specific voice input processing information
CN110442699A (zh) 2013-06-09 2019-11-12 苹果公司 操作数字助理的方法、计算机可读介质、电子设备和系统
US10296160B2 (en) 2013-12-06 2019-05-21 Apple Inc. Method for extracting salient dialog usage from live data
US9633547B2 (en) 2014-05-20 2017-04-25 Ooma, Inc. Security monitoring and control
US10553098B2 (en) 2014-05-20 2020-02-04 Ooma, Inc. Appliance device integration with alarm systems
KR102245098B1 (ko) * 2014-05-23 2021-04-28 삼성전자주식회사 휴대 단말 및 그 제어 방법
US9430463B2 (en) 2014-05-30 2016-08-30 Apple Inc. Exemplar-based natural language processing
US9633004B2 (en) 2014-05-30 2017-04-25 Apple Inc. Better resolution when referencing to concepts
US11330100B2 (en) * 2014-07-09 2022-05-10 Ooma, Inc. Server based intelligent personal assistant services
CN105490890A (zh) * 2014-09-16 2016-04-13 中兴通讯股份有限公司 智能家庭终端及其控制方法
US10127911B2 (en) 2014-09-30 2018-11-13 Apple Inc. Speaker identification and unsupervised speaker adaptation techniques
US9668121B2 (en) 2014-09-30 2017-05-30 Apple Inc. Social reminders
KR20180110207A (ko) * 2014-10-24 2018-10-08 주식회사 소니 인터랙티브 엔터테인먼트 제어 장치, 제어 방법, 및 정보 기억 매체
KR102299330B1 (ko) * 2014-11-26 2021-09-08 삼성전자주식회사 음성 인식 방법 및 그 전자 장치
US10152299B2 (en) 2015-03-06 2018-12-11 Apple Inc. Reducing response latency of intelligent automated assistants
CN107395867B (zh) * 2015-03-06 2020-05-05 Oppo广东移动通信有限公司 一种移动终端便捷通话方法及系统
CN104821168B (zh) 2015-04-30 2017-03-29 北京京东方多媒体科技有限公司 一种语音识别方法及装置
US10009286B2 (en) 2015-05-08 2018-06-26 Ooma, Inc. Communications hub
US10083688B2 (en) 2015-05-27 2018-09-25 Apple Inc. Device voice control for selecting a displayed affordance
US9578173B2 (en) 2015-06-05 2017-02-21 Apple Inc. Virtual assistant aided communication with 3rd party service in a communication session
US10235129B1 (en) 2015-06-29 2019-03-19 Amazon Technologies, Inc. Joining users to communications via voice commands
CN106326307A (zh) * 2015-06-30 2017-01-11 芋头科技(杭州)有限公司 一种语言交互方法
CN105100455A (zh) * 2015-07-06 2015-11-25 珠海格力电器股份有限公司 语音控制接听来电通话的方法和装置
CN105704327B (zh) * 2016-03-31 2019-06-14 宇龙计算机通信科技(深圳)有限公司 一种拒接电话的方法及系统
US10854199B2 (en) 2016-04-22 2020-12-01 Hewlett-Packard Development Company, L.P. Communications with trigger phrases
US11227589B2 (en) 2016-06-06 2022-01-18 Apple Inc. Intelligent list reading
TWI584270B (zh) * 2016-06-15 2017-05-21 瑞昱半導體股份有限公司 語音控制系統及其方法
US10580404B2 (en) * 2016-09-01 2020-03-03 Amazon Technologies, Inc. Indicator for voice-based communications
US10474753B2 (en) 2016-09-07 2019-11-12 Apple Inc. Language identification using recurrent neural networks
CN106782554B (zh) * 2016-12-19 2020-09-25 百度在线网络技术(北京)有限公司 基于人工智能的语音唤醒方法和装置
CN107016070B (zh) * 2017-03-22 2020-06-02 北京光年无限科技有限公司 一种用于智能机器人的人机对话方法及装置
US10395654B2 (en) 2017-05-11 2019-08-27 Apple Inc. Text normalization based on a data-driven learning network
US11301477B2 (en) 2017-05-12 2022-04-12 Apple Inc. Feedback analysis of a digital assistant
US10311144B2 (en) 2017-05-16 2019-06-04 Apple Inc. Emoji word sense disambiguation
DK179549B1 (en) 2017-05-16 2019-02-12 Apple Inc. FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES
CN107291451B (zh) * 2017-05-25 2021-01-19 深圳市冠旭电子股份有限公司 语音唤醒方法及装置
US11269393B2 (en) * 2017-06-02 2022-03-08 Apple Inc. Techniques for adjusting computing device sleep states
CN109145096A (zh) * 2017-06-27 2019-01-04 中国海洋大学 基于规则库的个性化日常陪护机器人自动问答系统
US20190019505A1 (en) * 2017-07-12 2019-01-17 Lenovo (Singapore) Pte. Ltd. Sustaining conversational session
CN107886948A (zh) * 2017-11-16 2018-04-06 百度在线网络技术(北京)有限公司 语音交互方法及装置,终端,服务器及可读存储介质
CN110164426B (zh) * 2018-02-10 2021-10-26 佛山市顺德区美的电热电器制造有限公司 语音控制方法和计算机存储介质
US10592604B2 (en) 2018-03-12 2020-03-17 Apple Inc. Inverse text normalization for automatic speech recognition
US11076039B2 (en) 2018-06-03 2021-07-27 Apple Inc. Accelerated task performance
CN108847216B (zh) * 2018-06-26 2021-07-16 联想(北京)有限公司 语音处理方法及电子设备、存储介质
CN108986809B (zh) * 2018-08-30 2020-01-03 广东小天才科技有限公司 一种便携式设备及其唤醒方法和装置
US11010561B2 (en) 2018-09-27 2021-05-18 Apple Inc. Sentiment prediction from textual data
CN109377989B (zh) * 2018-09-27 2021-03-12 昆山品源知识产权运营科技有限公司 唤醒方法、装置、系统、设备及存储介质
US10839159B2 (en) 2018-09-28 2020-11-17 Apple Inc. Named entity normalization in a spoken dialog system
US11170166B2 (en) 2018-09-28 2021-11-09 Apple Inc. Neural typographical error modeling via generative adversarial networks
CN109545211A (zh) * 2018-12-07 2019-03-29 苏州思必驰信息科技有限公司 语音交互方法及系统
CN109584878A (zh) * 2019-01-14 2019-04-05 广东小天才科技有限公司 一种语音唤醒方法及系统
CN110025172A (zh) * 2019-05-27 2019-07-19 广东金石卖场建设有限公司 一种语音控制的服装展示架
CN110364143B (zh) * 2019-08-14 2022-01-28 腾讯科技(深圳)有限公司 语音唤醒方法、装置及其智能电子设备
CN112732340B (zh) * 2019-10-14 2022-03-15 思必驰科技股份有限公司 人机对话处理方法及装置
CN111899734A (zh) * 2020-07-16 2020-11-06 陕西闪现智能科技有限公司 智能语音对话装置及其运行方法、智能语音对话机器人
CN113411723A (zh) * 2021-01-13 2021-09-17 神盾股份有限公司 语音助理系统
CA3221181A1 (en) * 2021-06-01 2022-12-08 Dushyant Sharma Methods, apparatuses, and systems for dynamically navigating interactive communication systems
CN114020189B (zh) * 2022-01-05 2022-04-19 浙江口碑网络技术有限公司 易查模式开启方法、装置及电子设备

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5842168A (en) * 1995-08-21 1998-11-24 Seiko Epson Corporation Cartridge-based, interactive speech recognition device with response-creation capability
US20010047263A1 (en) * 1997-12-18 2001-11-29 Colin Donald Smith Multimodal user interface
US6965863B1 (en) * 1998-11-12 2005-11-15 Microsoft Corporation Speech recognition user interface
US7292678B2 (en) * 2000-08-31 2007-11-06 Lamson Holdings Llc Voice activated, voice responsive product locator system, including product location method utilizing product bar code and aisle-situated, aisle-identifying bar code
JP4209247B2 (ja) * 2003-05-02 2009-01-14 アルパイン株式会社 音声認識装置および方法
TWI235358B (en) * 2003-11-21 2005-07-01 Acer Inc Interactive speech method and system thereof
US20050209858A1 (en) * 2004-03-16 2005-09-22 Robert Zak Apparatus and method for voice activated communication
CN100474871C (zh) * 2005-12-20 2009-04-01 中国人民解放军信息工程大学 一种信号传输信道检测方法和呼叫控制系统
US8165886B1 (en) * 2007-10-04 2012-04-24 Great Northern Research LLC Speech interface system and method for control and interaction with applications on a computing system
TW201013635A (en) * 2008-09-24 2010-04-01 Mitac Int Corp Intelligent voice system and method thereof
US10540976B2 (en) * 2009-06-05 2020-01-21 Apple Inc. Contextual voice commands
US10705794B2 (en) * 2010-01-18 2020-07-07 Apple Inc. Automatically adapting user interfaces for hands-free interaction
CN102332269A (zh) * 2011-06-03 2012-01-25 陈威 呼吸面具中呼吸噪声的消除方法
US20130031476A1 (en) * 2011-07-25 2013-01-31 Coin Emmett Voice activated virtual assistant
CN102447786A (zh) * 2011-11-14 2012-05-09 候万春 一种个人专用生活协助装置和方法
CN202413790U (zh) * 2011-12-15 2012-09-05 浙江吉利汽车研究院有限公司 一种汽车自适应性语音提示系统
CN102722662A (zh) * 2012-05-14 2012-10-10 深圳职业技术学院 一种计算机的声控锁屏和解屏系统及方法
KR102009423B1 (ko) * 2012-10-08 2019-08-09 삼성전자주식회사 음성 인식을 이용한 미리 설정된 동작 모드의 수행 방법 및 장치

Cited By (139)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11928604B2 (en) 2005-09-08 2024-03-12 Apple Inc. Method and apparatus for building an intelligent automated assistant
US11671920B2 (en) 2007-04-03 2023-06-06 Apple Inc. Method and system for operating a multifunction portable electronic device using voice-activation
US11900936B2 (en) 2008-10-02 2024-02-13 Apple Inc. Electronic devices with voice command and contextual data processing capabilities
US11348582B2 (en) 2008-10-02 2022-05-31 Apple Inc. Electronic devices with voice command and contextual data processing capabilities
US11423886B2 (en) 2010-01-18 2022-08-23 Apple Inc. Task flow identification based on user intent
US10741185B2 (en) 2010-01-18 2020-08-11 Apple Inc. Intelligent automated assistant
US11120372B2 (en) 2011-06-03 2021-09-14 Apple Inc. Performing actions associated with task items that represent tasks to perform
US11269678B2 (en) 2012-05-15 2022-03-08 Apple Inc. Systems and methods for integrating third party services with a digital assistant
US11321116B2 (en) 2012-05-15 2022-05-03 Apple Inc. Systems and methods for integrating third party services with a digital assistant
US11557310B2 (en) 2013-02-07 2023-01-17 Apple Inc. Voice trigger for a digital assistant
US11636869B2 (en) 2013-02-07 2023-04-25 Apple Inc. Voice trigger for a digital assistant
US11862186B2 (en) 2013-02-07 2024-01-02 Apple Inc. Voice trigger for a digital assistant
US10978090B2 (en) 2013-02-07 2021-04-13 Apple Inc. Voice trigger for a digital assistant
US11388291B2 (en) 2013-03-14 2022-07-12 Apple Inc. System and method for processing voicemail
US11798547B2 (en) 2013-03-15 2023-10-24 Apple Inc. Voice activated device for use with a voice-based digital assistant
US11727219B2 (en) 2013-06-09 2023-08-15 Apple Inc. System and method for inferring user intent from speech inputs
US10192557B2 (en) 2013-08-26 2019-01-29 Samsung Electronics Co., Ltd Electronic device and method for voice recognition using a plurality of voice recognition engines
CN105493180B (zh) * 2013-08-26 2019-08-30 三星电子株式会社 用于语音识别的电子装置和方法
CN105493180A (zh) * 2013-08-26 2016-04-13 三星电子株式会社 用于语音识别的电子装置和方法
US11158326B2 (en) 2013-08-26 2021-10-26 Samsung Electronics Co., Ltd Electronic device and method for voice recognition using a plurality of voice recognition devices
JP2016502829A (ja) * 2013-11-15 2016-01-28 ▲華▼▲為▼▲終▼端有限公司 端末音声制御方法、装置、端末、およびプログラム
WO2015070644A1 (zh) * 2013-11-15 2015-05-21 华为终端有限公司 一种终端语音控制方法、装置及终端
CN106233377A (zh) * 2014-04-25 2016-12-14 夏普株式会社 信息处理装置和控制程序
US11810562B2 (en) 2014-05-30 2023-11-07 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
US10878809B2 (en) 2014-05-30 2020-12-29 Apple Inc. Multi-command single utterance input method
US11257504B2 (en) 2014-05-30 2022-02-22 Apple Inc. Intelligent assistant for home automation
US11699448B2 (en) 2014-05-30 2023-07-11 Apple Inc. Intelligent assistant for home automation
US11133008B2 (en) 2014-05-30 2021-09-28 Apple Inc. Reducing the need for manual start/end-pointing and trigger phrases
US11670289B2 (en) 2014-05-30 2023-06-06 Apple Inc. Multi-command single utterance input method
US11838579B2 (en) 2014-06-30 2023-12-05 Apple Inc. Intelligent automated assistant for TV user interactions
US11516537B2 (en) 2014-06-30 2022-11-29 Apple Inc. Intelligent automated assistant for TV user interactions
CN104253902A (zh) * 2014-07-21 2014-12-31 宋婉毓 与智能语音设备进行语音交互的方法
CN105719645A (zh) * 2014-12-17 2016-06-29 现代自动车株式会社 语音识别装置、包括其的车辆和控制语音识别装置的方法
CN105719645B (zh) * 2014-12-17 2020-09-18 现代自动车株式会社 语音识别装置、包括其的车辆和控制语音识别装置的方法
CN105788600B (zh) * 2014-12-26 2019-07-26 联想(北京)有限公司 声纹识别方法和电子设备
CN105788600A (zh) * 2014-12-26 2016-07-20 联想(北京)有限公司 声纹识别方法和电子设备
CN104598192A (zh) * 2014-12-29 2015-05-06 联想(北京)有限公司 信息处理方法及电子设备
CN107408387A (zh) * 2015-03-08 2017-11-28 苹果公司 虚拟助理激活
US10529332B2 (en) 2015-03-08 2020-01-07 Apple Inc. Virtual assistant activation
US11842734B2 (en) 2015-03-08 2023-12-12 Apple Inc. Virtual assistant activation
US10930282B2 (en) 2015-03-08 2021-02-23 Apple Inc. Competing devices responding to voice triggers
US11087759B2 (en) 2015-03-08 2021-08-10 Apple Inc. Virtual assistant activation
US11468282B2 (en) 2015-05-15 2022-10-11 Apple Inc. Virtual assistant in a communication session
CN104916015A (zh) * 2015-05-25 2015-09-16 郭萌 一种声控锁具的方法
US11070949B2 (en) 2015-05-27 2021-07-20 Apple Inc. Systems and methods for proactively identifying and surfacing relevant content on an electronic device with a touch-sensitive display
US11010127B2 (en) 2015-06-29 2021-05-18 Apple Inc. Virtual assistant for media playback
US11947873B2 (en) 2015-06-29 2024-04-02 Apple Inc. Virtual assistant for media playback
CN105224278A (zh) * 2015-08-21 2016-01-06 百度在线网络技术(北京)有限公司 语音交互服务处理方法及装置
CN105224278B (zh) * 2015-08-21 2019-02-22 百度在线网络技术(北京)有限公司 语音交互服务处理方法及装置
US11550542B2 (en) 2015-09-08 2023-01-10 Apple Inc. Zero latency digital assistant
US11954405B2 (en) 2015-09-08 2024-04-09 Apple Inc. Zero latency digital assistant
US11126400B2 (en) 2015-09-08 2021-09-21 Apple Inc. Zero latency digital assistant
US11853536B2 (en) 2015-09-08 2023-12-26 Apple Inc. Intelligent automated assistant in a media environment
US11809483B2 (en) 2015-09-08 2023-11-07 Apple Inc. Intelligent automated assistant for media search and playback
US11500672B2 (en) 2015-09-08 2022-11-15 Apple Inc. Distributed personal assistant
US11809886B2 (en) 2015-11-06 2023-11-07 Apple Inc. Intelligent automated assistant in a messaging environment
US11526368B2 (en) 2015-11-06 2022-12-13 Apple Inc. Intelligent automated assistant in a messaging environment
US11886805B2 (en) 2015-11-09 2024-01-30 Apple Inc. Unconventional virtual assistant interactions
CN105471712A (zh) * 2015-11-25 2016-04-06 深圳狗尾草智能科技有限公司 一种机器人答复系统及其答复方法
US11853647B2 (en) 2015-12-23 2023-12-26 Apple Inc. Proactive assistance based on dialog communication between devices
US11037565B2 (en) 2016-06-10 2021-06-15 Apple Inc. Intelligent digital assistant in a multi-tasking environment
US11657820B2 (en) 2016-06-10 2023-05-23 Apple Inc. Intelligent digital assistant in a multi-tasking environment
US11809783B2 (en) 2016-06-11 2023-11-07 Apple Inc. Intelligent device arbitration and control
US11152002B2 (en) 2016-06-11 2021-10-19 Apple Inc. Application integration with a digital assistant
US11749275B2 (en) 2016-06-11 2023-09-05 Apple Inc. Application integration with a digital assistant
CN107644640A (zh) * 2016-07-22 2018-01-30 佛山市顺德区美的电热电器制造有限公司 一种信息处理方法及家电设备
CN106603826A (zh) * 2016-11-29 2017-04-26 维沃移动通信有限公司 一种应用事件的处理方法及移动终端
CN106653021A (zh) * 2016-12-27 2017-05-10 上海智臻智能网络科技股份有限公司 语音唤醒的控制方法、装置及终端
CN106653021B (zh) * 2016-12-27 2020-06-02 上海智臻智能网络科技股份有限公司 语音唤醒的控制方法、装置及终端
US11656884B2 (en) 2017-01-09 2023-05-23 Apple Inc. Application integration with a digital assistant
CN106782541A (zh) * 2017-02-24 2017-05-31 太仓市同维电子有限公司 一种带有语音识别功能的家庭网关设计方法
US10741181B2 (en) 2017-05-09 2020-08-11 Apple Inc. User interface for correcting recognition errors
US11467802B2 (en) 2017-05-11 2022-10-11 Apple Inc. Maintaining privacy of personal information
US11599331B2 (en) 2017-05-11 2023-03-07 Apple Inc. Maintaining privacy of personal information
US11405466B2 (en) 2017-05-12 2022-08-02 Apple Inc. Synchronization and task delegation of a digital assistant
US11380310B2 (en) 2017-05-12 2022-07-05 Apple Inc. Low-latency intelligent automated assistant
US11580990B2 (en) 2017-05-12 2023-02-14 Apple Inc. User-specific acoustic models
US11538469B2 (en) 2017-05-12 2022-12-27 Apple Inc. Low-latency intelligent automated assistant
US11837237B2 (en) 2017-05-12 2023-12-05 Apple Inc. User-specific acoustic models
US11862151B2 (en) 2017-05-12 2024-01-02 Apple Inc. Low-latency intelligent automated assistant
US11675829B2 (en) 2017-05-16 2023-06-13 Apple Inc. Intelligent automated assistant for media exploration
US10909171B2 (en) 2017-05-16 2021-02-02 Apple Inc. Intelligent automated assistant for media exploration
US11532306B2 (en) 2017-05-16 2022-12-20 Apple Inc. Detecting a trigger of a digital assistant
CN109389981A (zh) * 2017-08-03 2019-02-26 晨星半导体股份有限公司 声控装置及相关的声音信号处理方法
CN107895578B (zh) * 2017-11-15 2021-07-20 百度在线网络技术(北京)有限公司 语音交互方法和装置
CN107895578A (zh) * 2017-11-15 2018-04-10 百度在线网络技术(北京)有限公司 语音交互方法和装置
CN108182939A (zh) * 2017-12-13 2018-06-19 苏州车萝卜汽车电子科技有限公司 用于自助服务的语音处理方法及装置
CN110136719B (zh) * 2018-02-02 2022-01-28 上海流利说信息技术有限公司 一种实现智能语音对话的方法、装置及系统
CN110136719A (zh) * 2018-02-02 2019-08-16 上海流利说信息技术有限公司 一种实现智能语音对话的方法、装置及系统
US11710482B2 (en) 2018-03-26 2023-07-25 Apple Inc. Natural assistant interaction
US11907436B2 (en) 2018-05-07 2024-02-20 Apple Inc. Raise to speak
US11854539B2 (en) 2018-05-07 2023-12-26 Apple Inc. Intelligent automated assistant for delivering content from user experiences
US11169616B2 (en) 2018-05-07 2021-11-09 Apple Inc. Raise to speak
US11487364B2 (en) 2018-05-07 2022-11-01 Apple Inc. Raise to speak
US11900923B2 (en) 2018-05-07 2024-02-13 Apple Inc. Intelligent automated assistant for delivering content from user experiences
US11630525B2 (en) 2018-06-01 2023-04-18 Apple Inc. Attention aware virtual assistant dismissal
US11360577B2 (en) 2018-06-01 2022-06-14 Apple Inc. Attention aware virtual assistant dismissal
US10720160B2 (en) 2018-06-01 2020-07-21 Apple Inc. Voice interaction at a primary device to access call functionality of a companion device
US10984798B2 (en) 2018-06-01 2021-04-20 Apple Inc. Voice interaction at a primary device to access call functionality of a companion device
US11009970B2 (en) 2018-06-01 2021-05-18 Apple Inc. Attention aware virtual assistant dismissal
US11431642B2 (en) 2018-06-01 2022-08-30 Apple Inc. Variable latency device coordination
CN108847236A (zh) * 2018-07-26 2018-11-20 珠海格力电器股份有限公司 语音信息的接收方法及装置、语音信息的解析方法及装置
US11893992B2 (en) 2018-09-28 2024-02-06 Apple Inc. Multi-modal inputs for voice commands
US11475898B2 (en) 2018-10-26 2022-10-18 Apple Inc. Low-latency multi-speaker speech recognition
CN109243462A (zh) * 2018-11-20 2019-01-18 广东小天才科技有限公司 一种语音唤醒方法及装置
CN109686368A (zh) * 2018-12-10 2019-04-26 北京梧桐车联科技有限责任公司 语音唤醒应答处理方法及装置、电子设备及存储介质
CN109788128A (zh) * 2018-12-27 2019-05-21 深圳市优必选科技有限公司 一种来电提示方法、来电提示装置及终端设备
US11638059B2 (en) 2019-01-04 2023-04-25 Apple Inc. Content playback on multiple devices
CN109767767A (zh) * 2019-01-25 2019-05-17 广州富港万嘉智能科技有限公司 一种语音交互方法、系统、电子设备及存储介质
US11783815B2 (en) 2019-03-18 2023-10-10 Apple Inc. Multimodality in digital assistant systems
US11348573B2 (en) 2019-03-18 2022-05-31 Apple Inc. Multimodality in digital assistant systems
US11675491B2 (en) 2019-05-06 2023-06-13 Apple Inc. User configurable task triggers
US11475884B2 (en) 2019-05-06 2022-10-18 Apple Inc. Reducing digital assistant latency when a language is incorrectly determined
US11217251B2 (en) 2019-05-06 2022-01-04 Apple Inc. Spoken notifications
US11705130B2 (en) 2019-05-06 2023-07-18 Apple Inc. Spoken notifications
US11307752B2 (en) 2019-05-06 2022-04-19 Apple Inc. User configurable task triggers
US11423908B2 (en) 2019-05-06 2022-08-23 Apple Inc. Interpreting spoken requests
US11140099B2 (en) 2019-05-21 2021-10-05 Apple Inc. Providing message response suggestions
US11888791B2 (en) 2019-05-21 2024-01-30 Apple Inc. Providing message response suggestions
US11237797B2 (en) 2019-05-31 2022-02-01 Apple Inc. User activity shortcut suggestions
US11360739B2 (en) 2019-05-31 2022-06-14 Apple Inc. User activity shortcut suggestions
US11496600B2 (en) 2019-05-31 2022-11-08 Apple Inc. Remote execution of machine-learned models
US11289073B2 (en) 2019-05-31 2022-03-29 Apple Inc. Device text to speech
US11657813B2 (en) 2019-05-31 2023-05-23 Apple Inc. Voice identification in digital assistant systems
US11790914B2 (en) 2019-06-01 2023-10-17 Apple Inc. Methods and user interfaces for voice-based control of electronic devices
US11360641B2 (en) 2019-06-01 2022-06-14 Apple Inc. Increasing the relevance of new available information
CN110246497A (zh) * 2019-07-09 2019-09-17 王振仁 一种语音控制灯具的控制方法、系统及介质
CN110473556A (zh) * 2019-09-17 2019-11-19 深圳市万普拉斯科技有限公司 语音识别方法、装置和移动终端
CN110473556B (zh) * 2019-09-17 2022-06-21 深圳市万普拉斯科技有限公司 语音识别方法、装置和移动终端
US11488406B2 (en) 2019-09-25 2022-11-01 Apple Inc. Text detection using global geometry estimators
US11914848B2 (en) 2020-05-11 2024-02-27 Apple Inc. Providing relevant data items based on context
US11924254B2 (en) 2020-05-11 2024-03-05 Apple Inc. Digital assistant hardware abstraction
US11765209B2 (en) 2020-05-11 2023-09-19 Apple Inc. Digital assistant hardware abstraction
US11755276B2 (en) 2020-05-12 2023-09-12 Apple Inc. Reducing description length based on confidence
US11838734B2 (en) 2020-07-20 2023-12-05 Apple Inc. Multi-device audio adjustment coordination
US11750962B2 (en) 2020-07-21 2023-09-05 Apple Inc. User identification using headphones
US11696060B2 (en) 2020-07-21 2023-07-04 Apple Inc. User identification using headphones
CN112233672A (zh) * 2020-09-30 2021-01-15 成都长虹网络科技有限责任公司 分布式语音控制方法、系统、计算机设备和可读存储介质
CN112435663A (zh) * 2020-11-11 2021-03-02 青岛歌尔智能传感器有限公司 命令语音管理方法、装置、设备及介质

Also Published As

Publication number Publication date
TW201439896A (zh) 2014-10-16
TWI489372B (zh) 2015-06-21
CN104104790A (zh) 2014-10-15
US20140309996A1 (en) 2014-10-16
CN107274897A (zh) 2017-10-20

Similar Documents

Publication Publication Date Title
CN103198831A (zh) 语音操控方法与移动终端装置
CN103220423A (zh) 语音接听方法与移动终端装置
AU2019246868B2 (en) Method and system for voice activation
US7400712B2 (en) Network provided information using text-to-speech and speech recognition and text or speech activated network control sequences for complimentary feature access
US20060074658A1 (en) Systems and methods for hands-free voice-activated devices
CN111263962B (zh) 信息处理设备和信息处理方法
CN107018228B (zh) 一种语音控制系统、语音处理方法及终端设备
JP2007529916A (ja) コンピュータでの音声通信
CN201307938Y (zh) 一种移动终端
CN103491257A (zh) 一种在通话过程中发送联系人信息的方法及系统
CN101415257A (zh) 一种人机对话聊天方法
US20070281748A1 (en) Method & apparatus for unlocking a mobile phone keypad
CN106791210A (zh) 一种手机来电接听装置及来电接听方法
US8321227B2 (en) Methods and devices for appending an address list and determining a communication profile
CN109036401A (zh) 一种开启语音控制系统的方法
CN109166572A (zh) 机器人阅读的方法和阅读机器人
CN105007365A (zh) 一种分机号拨打方法及装置
KR100467593B1 (ko) 음성인식 키 입력 무선 단말장치, 무선 단말장치에서키입력 대신 음성을 이용하는 방법 및 그 기록매체
US7471776B2 (en) System and method for communication with an interactive voice response system
CN114999496A (zh) 音频传输方法、控制设备及终端设备
CN103188364A (zh) 车载通讯系统
CN117336402A (zh) 可盲用人工智能手机
KR20020051389A (ko) 전화기의 통화 중 음성명령 처리방법
CN109243434A (zh) 一种双语音输入装置及系统
KR20230153854A (ko) 사용자 단말, 사용자 단말의 제어 방법 및 대화 관리 방법

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20130710