CN104008749A - 用于移动设备的语音控制的方法和装置 - Google Patents
用于移动设备的语音控制的方法和装置 Download PDFInfo
- Publication number
- CN104008749A CN104008749A CN201410066907.8A CN201410066907A CN104008749A CN 104008749 A CN104008749 A CN 104008749A CN 201410066907 A CN201410066907 A CN 201410066907A CN 104008749 A CN104008749 A CN 104008749A
- Authority
- CN
- China
- Prior art keywords
- mobile device
- verbal order
- vcm110
- parameter
- predetermined
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 47
- 230000001755 vocal effect Effects 0.000 claims abstract description 71
- 238000004891 communication Methods 0.000 claims abstract description 44
- 230000009471 action Effects 0.000 claims description 15
- 230000006870 function Effects 0.000 claims description 13
- 238000012545 processing Methods 0.000 claims description 10
- 230000004044 response Effects 0.000 claims description 10
- 238000012544 monitoring process Methods 0.000 abstract description 5
- 230000008569 process Effects 0.000 description 12
- 238000010586 diagram Methods 0.000 description 6
- 230000008859 change Effects 0.000 description 5
- 230000003213 activating effect Effects 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 3
- 238000012546 transfer Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 2
- 230000011664 signaling Effects 0.000 description 2
- 230000007704 transition Effects 0.000 description 2
- 230000006399 behavior Effects 0.000 description 1
- 238000004590 computer program Methods 0.000 description 1
- 230000000977 initiatory effect Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- GOLXNESZZPUPJE-UHFFFAOYSA-N spiromesifen Chemical compound CC1=CC(C)=CC(C)=C1C(C(O1)=O)=C(OC(=O)CC(C)(C)C)C11CCCC1 GOLXNESZZPUPJE-UHFFFAOYSA-N 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/285—Memory allocation or algorithm optimisation to reduce hardware requirements
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/30—Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M1/00—Substation equipment, e.g. for use by subscribers
- H04M1/72—Mobile telephones; Cordless telephones, i.e. devices for establishing wireless links to base stations without route selection
- H04M1/724—User interfaces specially adapted for cordless or mobile telephones
- H04M1/72403—User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality
- H04M1/72409—User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality by interfacing with external accessories
- H04M1/72412—User interfaces specially adapted for cordless or mobile telephones with means for local support of applications that increase the functionality by interfacing with external accessories using two-way short-range wireless interfaces
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
- G10L2015/223—Execution procedure of a spoken command
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M1/00—Substation equipment, e.g. for use by subscribers
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M2201/00—Electronic components, circuits, software, systems or apparatus used in telephone systems
- H04M2201/40—Electronic components, circuits, software, systems or apparatus used in telephone systems using speech recognition
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M2250/00—Details of telephonic subscriber devices
- H04M2250/02—Details of telephonic subscriber devices including a Bluetooth interface
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M2250/00—Details of telephonic subscriber devices
- H04M2250/74—Details of telephonic subscriber devices with voice recognition means
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D30/00—Reducing energy consumption in communication networks
- Y02D30/70—Reducing energy consumption in communication networks in wireless communication networks
Landscapes
- Engineering & Computer Science (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Quality & Reliability (AREA)
- Telephone Function (AREA)
- Mobile Radio Communication Systems (AREA)
Abstract
提供了一种用于移动设备的语音控制的方法和装置。该方法在该移动设备和语音控制模块之间建立连接。响应于建立该连接,该移动设备进入中间模式;以及,该语音控制模块监视口头输入,该口头输入包括预定口头命令集合中的口头命令。该语音控制模块向移动设备发送与所接收的口头命令有关的指令;以及,该移动设备按照所接收的指令行动。一种装置/语音控制模块(VCM),用于移动设备的语音控制,其中,该VCM包括:连接模块,被配置为在该VCM和该移动设备之间建立连接;监视模块,被配置为监视来自预定口头命令集合中的口头命令;以及通信模块,被配置为向移动设备发送与所接收的口头命令有关的指令。
Description
技术领域
本公开大体上涉及移动设备。更具体而言,本公开涉及用于移动设备的语音控制的方法和装置。
背景技术
在日常生活中,移动设备(例如,智能电话、平板计算机等)已经变得大量使用。许多用户改变他们的行为以适应他们移动设备的使用。因为许多管辖区域已经颁布法律禁止开车时移动设备的使用,用户希望具有以免提的方式继续移动设备应用的使用的能力。
典型的免提系统需要用户通过按下按钮或其他激活特征来发起免提消息或呼叫,以发起系统正在监听命令的免提模式。免提模式于是允许用户使用语音命令控制移动设备。一般而言,移动设备需要被设置为针对语音控制的免提模式,因为如果让移动设备处于连续监听模式中,该设备会捕捉到不预期作为命令的口头语言,并且此外监视语音命令所需的功率会使移动设备的电池快速耗尽。因为功率需求,如果免提模式退出或超时,移动设备一般将还需要其他用户交互。因此,存在对移动设备的语音控制的改进方法和装置的需求。
发明内容
在第一方面中,本公开提供了一种用于移动设备的语音控制的方法;所述方法在所述移动设备和语音控制模块之间建立连接。响应于建立所述连接,所述移动设备进入中间模式;以及,所述语音控制模块监视口头输入,所述口头输入包括预定口头命令集合中的口头命令。在接收到预定口头命令集合中的口头命令时,所述语音控制模块向所述移动设备发送与所接收的口头命令有关的指令;以及,所述移动设备按照所接收的指令行动。
在一些情况下,在所述移动设备和所述语音控制模块之间建立所述连接包括无线配对。
在一些情况下,所述移动设备进入所述中间模式包括禁用所述移动设备的至少一些预定功能。在一些情况下,所述至少一些预定功能包括与一个或更多个预定网络进行通信的能力和/或监视口头命令的能力。
在一些情况下,所述预定口头命令集合包括与通信应用相对应的口头命令,其中,所述通信应用可以包括以下至少一项:电话、即时消息、语音消息、短消息服务(SMS)、多媒体消息服务(MMS)、电子邮件消息。
所述方法还可以包括在所述语音控制模块处监视包括口头命令的口头输入,还包括在所述语音控制模块处监视包括与所述口头命令相关联的参数的口头输入。
所述方法还可以包括:如果相关联的参数是必需的参数并且还未接收到,则基于所述相关联的参数,在所述语音控制模块处发出针对其他口头输入的提示。
在一些情况下,在所述语音控制模块处监视具有与所述口头命令相关联的参数的口头输入包括:基于在所述语音控制模块处存储的预定的可能响应的集合来识别参数。
在一些情况下,所述方法包括在所述移动设备出按照所接收的指令行动,包括激活与所述口头命令有关的应用。
在一些其他情况下,在所述移动设备处按照所接收的指令行动还包括:基于所述口头命令,经由所述应用执行动作。
在另一方面中,提供了一种装置,在此情况下,一种用于移动设备的语音控制的语音控制模块(VCM)具有:连接模块,被配置为在所述VCM和所述移动设备之间建立连接;监视模块,被配置为监视口头输入,所述口头输入包括来自预定口头命令集合中的口头命令;以及,通信模块,被配置为向移动设备发送与所接收的口头命令有关的指令。
在一些情况下,所述连接包括所述移动设备和所述语音控制模块之间的无线配对。
在一些情况下,所述预定口头命令集合包括与通信应用相对应的口头命令,其中,所述通信应用包括以下至少一项:电话、即时消息、语音消息、短消息服务(SMS)、多媒体消息服务(MMS)、电子邮件消息。
在一些情况下,所述监视模块还被配置为:监视包括与所述口头命令相关联的参数的口头输入。
在一些其他情况下,所述监视模块还被配置为:如果相关联的参数是必需的参数并且还未接收到,则基于所述相关联的参数发出针对其他口头输入的提示。
在一些情况下,所述VCM可以包括存储模块,并且其中,所述监视模块还被配置为:基于在所述存储模块处存储的预定的可能响应的集合来识别参数。
在另一方面中,提供一种移动设备,包括:连接模块,被配置为在所述移动设备和语音控制模块(VCM)之间建立连接;模式设置模块,被配置为响应于建立所述连接,使所述移动设备进入中间模式;监视模块,被配置为监视从所述VCM接收的指令;以及,处理模块,被配置为在所述移动设备处执行所接收的指令。
在一些情况下,所述连接是所述移动设备和所述VCM之间的无线配对。
在一些情况下,进入所述中间模式禁用所述移动设备的至少一些预定功能。在一些其他情况下,所述至少一些预定功能包括与一个或更多个预定网络进行通信的能力。在一些其他情况下,所述至少一些预定功能包括监视口头命令的能力。
在一些情况下,所述处理模块被配置为:通过激活与所述VCM识别的口头命令有关的应用,以及基于所述口头命令经由所述应用执行动作,来执行所接收的指令。
根据本文的另一方面,提供了一种计算机可读介质,包括计算机可读代码,当在计算机设备上执行所述计算机可读代码时,执行如上所述的用于语音控制的方法。
在结合附图查看以下具体实施例的描述之后,本公开的其他方面和特征对本领域普通技术人员将变得明显。
附图说明
现在将参考附图仅以示例方式描述本公开的实施例。
图1示出了用于语音控制的系统的实施例;
图2是示出了用于语音控制的方法的流程图;
图3是用于接收和处理口头命令的方法的流程图;
图4是用于接收与用于语音控制的系统的通信的方法的流程图;
图5是利用用于语音控制的系统发送即时消息的使用情况图;以及
图6是利用用于语音控制的系统接收即时消息的使用情况图。
具体实施方式
一般而言,本公开提供用于移动设备的语音控制的方法和装置的实施例。更具体而言,本文实施例提供与移动设备建立连接的装置(例如,语音控制系统或模块),与移动设备建立连接触发该移动设备进入中间模式。语音控制模块然后监视来自用户的口头输入。一旦接收到口头输入,语音控制模式可以从命令短语中确定或识别用户所发出的命令短语。命令短语包括命令并还可以包括与该命令相关联的必需的或可选的参数。一旦已经接收到命令短语,语音控制模块向移动设备发送用于执行命令并在接收到参数时使用相关联的参数的指令。不像传统的免提系统(仍需要用户按下按钮或以其他方式激活移动设备上的“语音模式”),本实施例旨在允许发起移动设备的免提控制而不需要物理输入。
图1示出了用于语音控制的装置或系统100的实施例。用于语音控制的装置100包括语音控制模块(VCM)110,语音控制模块(VCM)110被配置为与移动设备200相连。具体而言,VCM100包含连接模块120,连接模块120能够实现与移动设备200的相应的连接模块210的连接199。连接199可以是无线连接,例如蓝牙TM配对或本领域已知的其他连接。
一旦在VCM110的连接模块120和移动设备200的连接模块210之间建立起连接199,移动设备200被置于中间模式。该中间模式可以通过VCM110向移动设备200发送指令来发起。备选地,在识别与VCM110的连接199时,移动设备200自身可以进入中间模式。例如,一旦连接199已经建立起来,连接模块210可以触发移动设备200中的处理器220进入中间模式。在中间模式中,可以禁用一个或更多个功能或处理,例如禁用网络连接(未示出)(例如Wi-FiTM连接或不需要的蓝牙TM连接(例如与诸如外部键盘(未示出)等的设备))、关闭显示屏(未示出)、关闭接收语音命令的能力等。具体而言,中间模式可以涉及经由VCM110禁用当处于语音控制模式时一般不会使用的功能或处理。移动设备200的中间模式旨在允许移动设备降低功耗,同时仍允许移动设备处理来自VCM110的命令或处理新事件(例如接收到电话呼叫等)。处理器220可以与连接模块210分离但可操作地相连,或处理器220和连接模块210可以是单个组件。
VCM110还包括监视模块130。监视模块130监视来自用户并如本文所述的口头输入;具体而言,其监视来自用户的命令短语。监视模块130包括麦克风140或与麦克风140可操作地相连,麦克风140用于接收口头输入,并且包括扬声器150或与扬声器150可操作地相连,扬声器150用于输出音频。用户能够通过移动设备200或VCM110改变麦克风140和/或扬声器150的音量。
监视模块130还与处理器160相连。一旦监视模块130检测到来自用户的口头输入,监视模块130将该口头输入中继到处理器160。可以在向处理器160发送口头输入之前或之后,使用各种已知的数字信号处理(DSP)技术对该口头输入进行处理,以解析该口头输入。
处理器160与可以是例如数据库的存储模块170可操作地相连。处理器160对该口头输入进行解析,以确定命令短语。可以对命令短语进行解析,以确定用户已经发出的口头命令和任意其他参数。处理器160将该口头命令与存储模块170中所存储的预定口头命令集合进行比较。预定口头命令集合可以包括与通信应用相对应的口头命令,并且通信应用可以包括以下至少一项:电话、即时消息、语音消息、短消息服务(SMS)、多媒体消息服务(MMS)、电子邮件消息。
预定口头命令可以与一个或更多个伴随参数(即,更具体地标识如何执行该命令或构成要发送的通信内容的数据)相关联;参数可以是必须的或可选的。例如,针对新电子邮件的命令可以需要收件人和消息,并可以具有可选的数据(例如标题),而针对即时消息的命令可以需要接收人和消息,并可以具有诸如文本消息或语音消息的选择的选项。
如上所述,监视模块130或处理器160对口头输入进行解析,并且处理器160被配置为:在存在任何参数时,确定是否已经从用户接收到所有必需的参数。如果确定已经获得针对特定口头命令的所有必需的参数,则处理器160将向通信模块180发送与口头命令和参数有关的信息,通信模块180将创建并经由连接模块120向移动设备200发送与执行该命令有关的指令。将理解的是,通信模块180可以是处理器160的部分或是连接模块120的部分。
另一方面,如果确定仍需要与该命令相关联的一个或更多个必需的参数,则VCM110被配置为请求来自用户的其他口头输入。具体而言,VCM110可以基于相关联的参数发出针对其他口头输入的提示。在一些情况下,VCM110可以通过基于在语音控制模块中存储的预定可能响应集合来识别参数,以识别包括与该口头命令相关联的参数的口头输入。例如,如果不存在针对即时消息或电话呼叫命令给定的接收人,则VCM110将向用户提示指定接收人。如果参数与针对通信的接收人有关,VCM110可以将所接收的口头输入与预定潜在接收人列表进行比较和/或基于预定潜在接收人列表对用户进行提示。使用预定列表进行提示可以包括向用户读出该预定列表或预定列表的子集。在VCM110处的预定潜在接收人列表的使用旨在允许更高效地识别接收人并还进一步降低在移动设备200的电池使用,因为移动设备200将不被用于提供针对参数的提示。将理解的是,类似方案可以用于诸如标题行、消息正文等的其他参数。
移动设备200还包括监视模块230。监视模块230监视经由连接模块210来自VCM110的指令。移动设备200的连接模块210或监视模块230然后将向处理器220中继该指令。
监视模块230还可以监视进入移动设备200的通信。例如,当移动设备200处于中间模式时,监视模块230可以检测通信(例如,电话、新的即时消息或电子邮件)的接收,并然后向VCM110提供关于发布与所接收的通信有关的信息的指令。
VCM110可以集成在车辆中,或可以是可安装在挡风玻璃遮阳板上或以其他方式在车辆中设置的独立设备。VCM110还可以包括电源190,例如电池。备选地,VCM110可以通过与车辆的电连接(未示出)而供电。
VCM110可以被配置为接收包括音频文件(例如语音剪辑)的数据。在一些情况下,用户可以优选包括意在允许接收人听到消息的声音的音频文件。在一些情况下,VCM110可以包括话音到文本模块(未示出),用于在请求或需要时(例如如果应用需要文本文件而不是音频文件)将话音转换为文本。在一些其他实施例中,VCM110可以包括针对可以传送视频数据的应用的视频捕捉模块。
图2示出了用于移动设备的语音控制的方法300的实施例的流程图。在步骤310,在VCM110和移动设备200之间建立连接199。连接199可以是有线连接或无线连接。在一些情况下,连接199可以是蓝牙TM连接。在步骤320,一旦连接199建立起来,移动设备200进入中间模式。中间模式如上所述。在步骤390,当移动设备处于中间模式时,移动设备200将监视来自VCM110的指令并监视通信的接收。
在步骤330,VCM110监视以确定用户是否发出口头输入。在一些情况下,当与移动设备200的连接建立起来时,VCM110可以开始监视。在其他情况下,VCM110可以在连接已经建立起来之前就开始监视。当VCM110和移动设备200相互靠近时(例如,当用户进入汽车时),预期VCM110和移动设备200之间的连接199建立起来,并且一旦建立起来,预期即使在执行执行或命令之后,连接199保持建立。当例如用户离开汽车或用户进入用户不再需要或想要免提通信的区域时,连接199可以自动地(按照配置)或由用户结束或终止。
在步骤340,VCM110检测到来自用户的口头输入。在步骤350,VCM110对口头输入进行解析和处理,以确定是否已经接收到命令短语。在确定是否已经接收到命令短语中,可以将口头输入与预定口头命令集合进行比较,以确定预期的命令。然后,可以将口头输入/命令短语进一步解析为口头命令以及与口头命令相关联的任意参数。如果口头输入不包括来自预定命令集合的口头命令,一般不采取动作。然而,在一些实施例中,VCM110可以询问关于是否预期命令、提供可接受命令的列表(有时被称为热表(hotlist))或向用户提示重新尝试口头输入。VCM110可以确定类似命令,并可以尝试通过列出可用命令等将用户引导到来自预定命令集合的命令。
在步骤360,从VCM110向移动设备200发送基于命令和任意参数的指令,如虚线箭头365所示。该指令可以包括例如针对移动设备200启动适用该命令的应用(例如在电子邮件命令的情况下是电子邮件应用)的指令。
一旦已经发送指令,VCM110可以继续在步骤330监视口头输入,以便于确定用户是否给出另一或其他口头输入。VCM110可以继续监视,直到移动设备200和VCM110之间的连接199已经结束或直到用户发出指示VCM110结束监视的命令。
在步骤370,移动设备200接收到与命令有关的指令。在步骤380,移动设备200处理该命令并执行用户所请求的动作。一般而言,执行该命令以完成用户所请求的任务,例如发送电子邮件、发送即时消息或进行电话呼叫。
在一些情况下,VCM110可以逐步地或逐阶段地向移动设备200发送指令。一旦已知用户希望使用的通信应用,基于所接收的命令短语或口头命令,VCM110可以发送针对用户设备启动合适的应用的指令。一旦VCM110已经收集到与该命令相关联的参数(例如通信的接收人、要发送的消息等),VCM110然后向移动设备发送这些相关联的参数,允许移动设备完成用于语音控制的系统100的用户所请求的动作。
在步骤390,在移动设备200已经按照指令行动之后,移动设备继续监视来自VCM110的指令。
图3示出了VCM110用于接收和处理口头输入的方法400的实施例的流程图。此方法一般是在VCM110与移动设备200连接之后并当移动设备200保持在中间模式中时由VCM110执行。然而,VCM110还可以被配置为获取命令短语并对其进行存储,直到与移动设备200的连接199建立起来。在步骤410,VCM110经由麦克风140和监视模块130接收口头输入。在步骤420,VCM110将该口头输入解析为词语。
在步骤430,VCM110查看并比较该口头输入,以确定在该口头输入中是否包括命令短语。具体而言,VCM110将该所解析的口头输入与在存储模块170中存储的预定口头命令集合进行比较。如果存在口头命令,则VCM110还可以从口头输入/命令短语中取回与该口头命令相关联的参数。在步骤440,VCM110还查看所解析的口头输入,以确定是否已经接收到针对所接收的口头命令的所有必需的参数。在步骤450,如果未接收到与该命令相关联的必需的参数中任意一个,则VCM110将请求用户提供具有这些相关联参数的其他口头输入。如上所述,可以基于预定参数集合,比较或识别针对参数的口头输入。在具体示例中,如果不存在为通信命令(例如即时消息命令)提供的接收人,则VCM110将向用户提示指定接收人。在确定是否已经指定接收人中,VCM110可以将来自命令短语的参数与在存储模块170中存储的预定的潜在接收人的集合进行比较。
如果在向用户提示之后,VCM110确定必需的参数仍然不完整,则VCM110将在步骤450发出针对来自用户的口头输入的其他请求。VCM110将继续请求其他口头输入,直到已经接收到所有必需的参数或直到用户通过退出或结束用于接收和处理口头输入的方法来停止该处理为止。在一些实施例中,VCM110可以记录潜在接收人列表或潜在接收人子集,例如最近所使用的接收人的列表。
在一些情况下,VCM110还可以确定是否存在可选参数(例如用于向消息中包括其他接收人或在电子邮件中包括标题的选项),并可以向用户提示确定该用户是否想要包括伴随该命令的任意可选参数。
在步骤460,一旦已经接收到必需的参数并确定必需的参数是完整的,VCM110将向移动设备200发送与该命令及其相关联参数有关的指令。该指令可以包括用于激活有关通信应用、编写面向所指定的接收人的消息等的命令。一旦移动设备200处理该指令,移动设备200保持在中间模式中并继续监视来自VCM110的其他指令。在一些情况下,VCM110将向移动设备200发送初始命令以采取动作(例如打开通信应用)。移动设备200将激活与该命令有关的应用,并等待与要执行的命令和/或必需的参数有关的辅助指令。
图4示出了用于利用用于语音控制的系统100接收通信的方法500的实施例的流程图。在步骤510,移动设备200接收到通信(例如,电话呼叫、电子邮件、会议提醒、即时消息等)。在一种情况下(如所示),VCM110可以充当用于通信的管道。在此情况下,在步骤530中,移动设备将该通信转换为音频。例如,可以将电子邮件或即时消息的文本或细节(例如电话号码和呼叫人标识)转换为音频。在步骤540,移动设备然后向VCM110发送该音频。音频被发送到VCM110,如虚线箭头550所示。在其他情况下,VCM110可以充当处理器,使得可以从移动设备200数字地发送通信,并且VCM110可以将该通信转换为音频,以向用于语音控制的系统100的用户播放该通信。在通信的播放之后,VCM110可以询问用户是否存在响应,然后可以以与新消息类似的方式对该响应进行处理,但接收人将会是已知的并且不需要作为与该命令相关联的参数。
在步骤560,一旦VCM110接收该通信,VCM110将向该通信的用户发出告警。在步骤570,用户可以选择接收该通信,在此情况下,VCM110播放该通信并可以进一步中继与该通信有关的细节。在一些情况下,用户可以选择忽略或取消告警,在此情况下,VCM110将不会播放该通信或其他细节。
在步骤580,在播放通信之后,VCM110可以向用户请求响应。例如,如果通信是电子邮件或即时消息,VCM110可以向用户询问是否存在响应(例如回复电子邮件或消息)。取决于所接收的通信的类型,针对响应的请求可以是不同的。一般而言,可以以与新消息类似的方式处理响应,但接收人将会是已知的并且不需要作为参数。
图5示出了使用用于语音控制系统100发送即时消息的示例使用情况图。在步骤600,用户通过开启用于语音控制的系统100(包括VCM110和移动设备200)而开始。在步骤610,VCM110与移动设备200配对。在步骤620,移动设备200接受配对并进入中间模式。当处于中间模式时,移动设备激活监听来自VCM110的消息的监视模块230。在中间模式期间,移动设备200还可以禁用一个或更多个预定功能,例如,移动设备可以禁用一个或更多个与网络(例如Wi-Fi)的连接,或可以停止监听语音命令。
在步骤630,一旦配对,VCM110可以向用户发出配对完成并且VCM110有效的告警。在一些情况下,此告警可以包括开启LED并播放听得见的噪音。一旦VCM110有效,其继续监听口头输入。在一些情况下,VCM还可以要求用户给出命令。
VCM110监视口头输入。在步骤640,用户发出被解析以确定命令短语的口头输入。在接收到命令短语时,VCM110查看命令短语以确定口头命令。VCM110确定是否接收到从预定命令集合中选择的口头命令(例如与通信应用有关的命令)。在本示例中,用户发出口头输入,例如“发送即时消息”。这表示口头命令。VCM110还对该命令短语进行解析以确定与该命令相关联的任意参数。在步骤650,因为用户未指定参数,VCM110可以请求用户说出接收人的名称,或可以向用户读出可以在存储模块170中存储的联系人热表。该热表可以由用户更新或可以与移动设备上的用户地址簿中的联系人同步,等等。取决于用户所使用的应用或通信方法,热表可以改变。在一些情况下,用户可以具有电子邮件热表上的联系人,该电子邮件热表上的联系人不出现在针对即时消息的用户热表和/或针对电话呼叫的用户热表上。例如,在即时消息传送应用的情况下,热表可以包含用户先前联系的接收人、当移动用户与VCM110配对时当前已经与用户开始对话的接收人或先前所确定的用户已经选择的接收人。在一些情况下,热表可以包含联系人组,用户可以选择联系人组而不分离地选择若干个人。
在步骤660,用户选择接收人。在步骤670,VCM110指示移动设备200打开即时消息应用。在步骤680,移动设备激活应用,移动设备200发信号通知VCM110以指示移动设备已经做好准备接收下一数据流,例如音频剪辑。
在步骤690,VCM110然后可以向用户询问消息。在步骤700,用户陈述消息。在步骤710,VCM记录该消息并可以向用户回放该消息并确认该消息向指定接收人的发送。在步骤720,用户确认该消息。在步骤730,VCM110然后向移动设备200发送该消息。该消息可以是音频剪辑或可以通过VCM110或移动设备200转换为文本。在步骤740,移动设备200接收该消息并向合适的接收人发送该消息。
图6示出了经由用于语音控制的系统100接收即时消息的示例使用情况图。在步骤800,移动设备200接收即时消息。在需要时移动设备200将所接收的消息转换为音频,并向VCM110发送该音频。在一些情况下,移动设备200可以向VCM110发送消息,并且VCM110可以将该消息转换为要向用户播放的音频。
在步骤810,VCM110将向用户通知已经接收到即时消息并询问用户是否想要收听该消息。在步骤820,用户同意。在步骤830,VCM110向用户播放音频。如果用户不同意,则VCM110将不会播放该消息,并将重新开始监视来自用户的口头输入或来自移动设备200的其他输入。
如果VCM110播放音频,VCM110然后可以询问用户是否希望对该即时消息进行响应。如果用户不希望进行响应,则VCM110返回监视状态。在步骤840,用户指示他希望进行响应。在步骤850,VCM110向移动设备200发送用于打开即时消息传送应用的请求。在步骤860,移动设备200将打开相应的应用,并向VCM110发信号通知移动设备200已经做好准备接收下一指令。
在步骤870,VCM110可以向用户询问消息。在步骤880,用户开始该消息。在一些情况下,用户可以开始该消息而不需要来自VCM的提示。在步骤890,VCM记录该消息并可以向用户回放该消息并确认该消息的发送。如果用户喜欢发送文本消息而不是音频剪辑,则VCM110还可以将语音消息转成文本消息。在步骤900,用户确认该消息。在步骤910,VCM110向移动设备200发送该消息。在步骤920,移动设备200接收到该消息并向合适的接收人发送该即时消息。在一些情况下,移动设备200可以将音频消息转为文本,以在即时消息传送应用中作为文本消息发送该消息。
尽管以上示例详细描述了用于语音控制的系统100关于即时消息传送的使用,将理解的是,用于语音控制的系统100可以与其他通信应用(例如电子邮件、SMS、MMS、电话等)一起使用。
在另一示例中,用于语音控制的系统100可以用于快速拨叫联系人。在VCM110的存储模块170中所存储的联系人热表中可以包括针对个人联系人的数量。如果用户希望给联系人打电话,用户可以指定热表上的联系人,然后VCM110可以利用与热表中联系人相关联的信息,向移动设备发送指令。如果多个联系人包含相同的名字,则VCM110可以确定哪个联系人是最常联系的,并向用户询问此联系人是否是正确的人。如果不是,VCM110可以继续遍历具有相同名字的列表,以确定正确的人,或用户可以指定其他细节以使匹配联系人变窄。一旦确定了联系人,热表上相关联的联系人条目可以包含多个电话号码,VCM110可以确定哪个号码是最常联系的,并向用户询问此电话号码是否是要呼叫的正确号码。如果这是不正确的号码,则VCM110可以继续遍历相关联电话号码列表,以确定正确的电话号码。在一些情况下,VCM110向用户提示从多个电话号码中选择正确的号码。例如,用户可以请求拨打针对特定联系人的家庭号码或工作号码。
此外,本文的系统和方法还可以被适配用于其他应用,例如,移动设备可以包括地图应用,或移动设备可以是GPS设备,并且VCM110可以包括当VCM110被警告特定条件时或基于用户的请求向用户提供例如道路条件、交通条件、备选路线的能力。
在前述描述中,为了解释的目的,阐述了许多细节,以便于提供对实施例的彻底理解。然而,将对本领域技术人员显而易见的是,这些特定细节不是必需的。在其他实例中,可以以方框图的形式示出周知的结构和单元,以便于不会使理解不清楚。例如,未提供关于本文所描述的实施例实现为软件例程、硬件电路、固件或其组合的特定细节。
本公开的实施例可以表示为在计算机可读介质(还被称为计算机可读程序代码实现于其中的计算机可读介质、处理器可读介质或计算机可用介质)中存储的计算机程序产品。计算机可读介质可以是任意合适的有形、非瞬时性介质(包括磁存储介质、光存储介质或电存储介质),包括磁盘、紧致光盘只读存储器(CD-ROM)、存储设备(易失性或非易失性)或类似存储机制。机器可读介质可以包含当执行时使处理器执行根据本公开实施例的方法中的步骤的各种指令集合、代码序列、配置信息或其他数据。本领域普通技术人员将理解,还可以在机器可读介质上存储用于实现所描述的实现所必需的其他指令和操作。在机器可读介质上存储的指令可以由处理器或其他合适的处理设备执行,并可以与用于执行所描述的任务的电路接口连接。
上述实施例旨在作为示例。在不脱离仅由所附权利要求所限定的范围的前提下,本领域技术人员可以对特定实施例进行改变、修改和变更。
Claims (20)
1.一种用于移动设备的语音控制的方法,所述方法包括:
在所述移动设备和语音控制模块之间建立连接;
响应于建立所述连接,所述移动设备进入中间模式;
在所述语音控制模块处监视口头输入,所述口头输入包括来自预定口头命令集合中的口头命令;
在接收到来自所述预定口头命令集合中的口头命令时,从所述语音控制模块向所述移动设备发送与所接收的口头命令有关的指令;以及
在所述移动设备处按照所接收的指令行动。
2.根据权利要求1所述的方法,其中,进入所述中间模式包括禁用所述移动设备的至少一些预定功能。
3.根据权利要求2所述的方法,其中,所述至少一些预定功能包括与一个或更多个预定网络进行通信的能力。
4.根据权利要求2所述的方法,其中,所述至少一些预定功能包括监视口头命令的能力。
5.根据权利要求1所述的方法,其中,所述预定口头命令集合包括与通信应用相对应的口头命令。
6.根据权利要求1所述的方法,其中,在所述语音控制模块处监视包括口头命令的口头输入还包括:在所述语音控制模块处监视包括与所述口头命令相关联的参数的口头输入。
7.根据权利要求6所述的方法,还包括:如果相关联的参数是必需的参数并且还未接收到,则基于所述相关联的参数在所述语音控制模块处发出针对其他口头输入的提示。
8.根据权利要求6所述的方法,其中,在所述语音控制模块处监视包括与所述口头命令相关联的参数的口头输入包括:基于在所述语音控制模块处存储的预定的可能响应的集合来识别参数。
9.根据权利要求1所述的方法,其中,在所述移动设备处按照所接收的指令行动包括:激活与所述口头命令有关的应用。
10.根据权利要求9所述的方法,其中,在所述移动设备处按照所接收的指令行动还包括:基于所述口头命令,经由所述应用执行动作。
11.一种语音控制模块VCM,用于移动设备的语音控制,所述VCM包括:
连接模块,被配置为:在所述VCM和所述移动设备之间建立连接;
监视模块,被配置为:监视口头输入,所述口头输入包括来自预定口头命令集合中的口头命令;以及
通信模块,被配置为:向所述移动设备发送与所接收的口头命令有关的指令。
12.根据权利要求11所述的VCM,其中,所述预定口头命令集合包括与通信应用相对应的口头命令。
13.根据权利要求11所述的VCM,其中,所述监视模块还被配置为:监视包括与所述口头命令相关联的参数的口头输入。
14.根据权利要求13所述的VCM,其中,所述监视模块还被配置为:如果相关联的参数是必需的参数并且还未接收到,则基于所述相关联的参数发出针对其他口头输入的提示。
15.根据权利要求13所述的VCM,还包括存储模块,并且所述监视模块还被配置为:基于在所述存储模块处存储的预定的可能响应的集合来识别参数。
16.一种移动设备,包括:
连接模块,被配置为:在所述移动设备和语音控制模块VCM之间建立连接;
模式设置模块,被配置为:响应于建立所述连接,使所述移动设备进入中间模式;
监视模块,被配置为:监视从所述VCM接收的指令;以及
处理模块,被配置为:在所述移动设备处执行所接收的指令。
17.根据权利要求16所述的移动设备,其中,进入所述中间模式禁用所述移动设备的至少一些预定功能。
18.根据权利要求17所述的移动设备,其中,所述至少一些预定功能包括与一个或更多个预定网络进行通信的能力。
19.根据权利要求16所述的移动设备,其中,所述处理模块被配置为通过以下操作来执行所接收的指令:激活与所述VCM识别的口头命令有关的应用,以及基于所述口头命令经由所述应用执行动作。
20.一种计算机可读介质,包括计算机可读代码,当在计算机设备上执行所述计算机可读代码时,执行根据权利要求1所述的方法。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US13/778,325 | 2013-02-27 | ||
US13/778,325 US9280981B2 (en) | 2013-02-27 | 2013-02-27 | Method and apparatus for voice control of a mobile device |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104008749A true CN104008749A (zh) | 2014-08-27 |
CN104008749B CN104008749B (zh) | 2018-03-06 |
Family
ID=51369377
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410066907.8A Active CN104008749B (zh) | 2013-02-27 | 2014-02-26 | 用于移动设备的语音控制的方法和装置 |
Country Status (3)
Country | Link |
---|---|
US (3) | US9280981B2 (zh) |
CN (1) | CN104008749B (zh) |
CA (1) | CA2842061C (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TWI621340B (zh) * | 2015-02-26 | 2018-04-11 | 默科資訊股份有限公司 | 偵測空氣波動的控制系統與其控制方法 |
CN111800891A (zh) * | 2014-11-24 | 2020-10-20 | 苹果公司 | 点对点自组织语音通信 |
Families Citing this family (132)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8677377B2 (en) | 2005-09-08 | 2014-03-18 | Apple Inc. | Method and apparatus for building an intelligent automated assistant |
US9318108B2 (en) | 2010-01-18 | 2016-04-19 | Apple Inc. | Intelligent automated assistant |
US8977255B2 (en) | 2007-04-03 | 2015-03-10 | Apple Inc. | Method and system for operating a multi-function portable electronic device using voice-activation |
US10002189B2 (en) | 2007-12-20 | 2018-06-19 | Apple Inc. | Method and apparatus for searching using an active ontology |
US9330720B2 (en) | 2008-01-03 | 2016-05-03 | Apple Inc. | Methods and apparatus for altering audio output signals |
US20100030549A1 (en) | 2008-07-31 | 2010-02-04 | Lee Michael M | Mobile device having human language translation capability with positional feedback |
US8676904B2 (en) | 2008-10-02 | 2014-03-18 | Apple Inc. | Electronic devices with voice command and contextual data processing capabilities |
US20120311585A1 (en) | 2011-06-03 | 2012-12-06 | Apple Inc. | Organizing task items that represent tasks to perform |
US10276170B2 (en) | 2010-01-18 | 2019-04-30 | Apple Inc. | Intelligent automated assistant |
US8682667B2 (en) | 2010-02-25 | 2014-03-25 | Apple Inc. | User profiling for selecting user specific voice input processing information |
US9262612B2 (en) | 2011-03-21 | 2016-02-16 | Apple Inc. | Device access using voice authentication |
US10057736B2 (en) | 2011-06-03 | 2018-08-21 | Apple Inc. | Active transport based notifications |
US10134385B2 (en) | 2012-03-02 | 2018-11-20 | Apple Inc. | Systems and methods for name pronunciation |
US10417037B2 (en) | 2012-05-15 | 2019-09-17 | Apple Inc. | Systems and methods for integrating third party services with a digital assistant |
DE212014000045U1 (de) | 2013-02-07 | 2015-09-24 | Apple Inc. | Sprach-Trigger für einen digitalen Assistenten |
US9280981B2 (en) * | 2013-02-27 | 2016-03-08 | Blackberry Limited | Method and apparatus for voice control of a mobile device |
US10652394B2 (en) | 2013-03-14 | 2020-05-12 | Apple Inc. | System and method for processing voicemail |
US10748529B1 (en) | 2013-03-15 | 2020-08-18 | Apple Inc. | Voice activated device for use with a voice-based digital assistant |
WO2014197335A1 (en) | 2013-06-08 | 2014-12-11 | Apple Inc. | Interpreting and acting upon commands that involve sharing information with remote devices |
DE112014002747T5 (de) | 2013-06-09 | 2016-03-03 | Apple Inc. | Vorrichtung, Verfahren und grafische Benutzerschnittstelle zum Ermöglichen einer Konversationspersistenz über zwei oder mehr Instanzen eines digitalen Assistenten |
US10176167B2 (en) | 2013-06-09 | 2019-01-08 | Apple Inc. | System and method for inferring user intent from speech inputs |
US20150112465A1 (en) * | 2013-10-22 | 2015-04-23 | Joseph Michael Quinn | Method and Apparatus for On-Demand Conversion and Delivery of Selected Electronic Content to a Designated Mobile Device for Audio Consumption |
US10296160B2 (en) | 2013-12-06 | 2019-05-21 | Apple Inc. | Method for extracting salient dialog usage from live data |
US9715875B2 (en) | 2014-05-30 | 2017-07-25 | Apple Inc. | Reducing the need for manual start/end-pointing and trigger phrases |
US10170123B2 (en) | 2014-05-30 | 2019-01-01 | Apple Inc. | Intelligent assistant for home automation |
US9633004B2 (en) | 2014-05-30 | 2017-04-25 | Apple Inc. | Better resolution when referencing to concepts |
US9430463B2 (en) | 2014-05-30 | 2016-08-30 | Apple Inc. | Exemplar-based natural language processing |
EP3149728B1 (en) | 2014-05-30 | 2019-01-16 | Apple Inc. | Multi-command single utterance input method |
US9338493B2 (en) | 2014-06-30 | 2016-05-10 | Apple Inc. | Intelligent automated assistant for TV user interactions |
US9818400B2 (en) | 2014-09-11 | 2017-11-14 | Apple Inc. | Method and apparatus for discovering trending terms in speech requests |
US10074360B2 (en) | 2014-09-30 | 2018-09-11 | Apple Inc. | Providing an indication of the suitability of speech recognition |
US10127911B2 (en) | 2014-09-30 | 2018-11-13 | Apple Inc. | Speaker identification and unsupervised speaker adaptation techniques |
US9668121B2 (en) | 2014-09-30 | 2017-05-30 | Apple Inc. | Social reminders |
US10152299B2 (en) | 2015-03-06 | 2018-12-11 | Apple Inc. | Reducing response latency of intelligent automated assistants |
US9721566B2 (en) | 2015-03-08 | 2017-08-01 | Apple Inc. | Competing devices responding to voice triggers |
US10567477B2 (en) | 2015-03-08 | 2020-02-18 | Apple Inc. | Virtual assistant continuity |
US9886953B2 (en) | 2015-03-08 | 2018-02-06 | Apple Inc. | Virtual assistant activation |
US10460227B2 (en) | 2015-05-15 | 2019-10-29 | Apple Inc. | Virtual assistant in a communication session |
US10083688B2 (en) | 2015-05-27 | 2018-09-25 | Apple Inc. | Device voice control for selecting a displayed affordance |
US10200824B2 (en) | 2015-05-27 | 2019-02-05 | Apple Inc. | Systems and methods for proactively identifying and surfacing relevant content on a touch-sensitive device |
US9578173B2 (en) | 2015-06-05 | 2017-02-21 | Apple Inc. | Virtual assistant aided communication with 3rd party service in a communication session |
US11025565B2 (en) | 2015-06-07 | 2021-06-01 | Apple Inc. | Personalized prediction of responses for instant messaging |
US20160378747A1 (en) | 2015-06-29 | 2016-12-29 | Apple Inc. | Virtual assistant for media playback |
US10432560B2 (en) * | 2015-07-17 | 2019-10-01 | Motorola Mobility Llc | Voice controlled multimedia content creation |
US10671428B2 (en) | 2015-09-08 | 2020-06-02 | Apple Inc. | Distributed personal assistant |
US10740384B2 (en) | 2015-09-08 | 2020-08-11 | Apple Inc. | Intelligent automated assistant for media search and playback |
US10331312B2 (en) | 2015-09-08 | 2019-06-25 | Apple Inc. | Intelligent automated assistant in a media environment |
US10747498B2 (en) | 2015-09-08 | 2020-08-18 | Apple Inc. | Zero latency digital assistant |
US10691473B2 (en) | 2015-11-06 | 2020-06-23 | Apple Inc. | Intelligent automated assistant in a messaging environment |
US10956666B2 (en) | 2015-11-09 | 2021-03-23 | Apple Inc. | Unconventional virtual assistant interactions |
US10049668B2 (en) | 2015-12-02 | 2018-08-14 | Apple Inc. | Applying neural network language models to weighted finite state transducers for automatic speech recognition |
US10223066B2 (en) | 2015-12-23 | 2019-03-05 | Apple Inc. | Proactive assistance based on dialog communication between devices |
US11227589B2 (en) | 2016-06-06 | 2022-01-18 | Apple Inc. | Intelligent list reading |
US10049663B2 (en) | 2016-06-08 | 2018-08-14 | Apple, Inc. | Intelligent automated assistant for media exploration |
US10586535B2 (en) | 2016-06-10 | 2020-03-10 | Apple Inc. | Intelligent digital assistant in a multi-tasking environment |
DK201670540A1 (en) | 2016-06-11 | 2018-01-08 | Apple Inc | Application integration with a digital assistant |
DK179415B1 (en) | 2016-06-11 | 2018-06-14 | Apple Inc | Intelligent device arbitration and control |
DK179343B1 (en) * | 2016-06-11 | 2018-05-14 | Apple Inc | Intelligent task discovery |
US10528607B2 (en) * | 2016-07-29 | 2020-01-07 | Splunk Inc. | Syntax templates for coding |
US10474753B2 (en) | 2016-09-07 | 2019-11-12 | Apple Inc. | Language identification using recurrent neural networks |
US10043516B2 (en) | 2016-09-23 | 2018-08-07 | Apple Inc. | Intelligent automated assistant |
US11281993B2 (en) | 2016-12-05 | 2022-03-22 | Apple Inc. | Model and ensemble compression for metric learning |
US11204787B2 (en) | 2017-01-09 | 2021-12-21 | Apple Inc. | Application integration with a digital assistant |
DK201770383A1 (en) | 2017-05-09 | 2018-12-14 | Apple Inc. | USER INTERFACE FOR CORRECTING RECOGNITION ERRORS |
US10417266B2 (en) | 2017-05-09 | 2019-09-17 | Apple Inc. | Context-aware ranking of intelligent response suggestions |
DK180048B1 (en) | 2017-05-11 | 2020-02-04 | Apple Inc. | MAINTAINING THE DATA PROTECTION OF PERSONAL INFORMATION |
US10726832B2 (en) | 2017-05-11 | 2020-07-28 | Apple Inc. | Maintaining privacy of personal information |
DK201770439A1 (en) | 2017-05-11 | 2018-12-13 | Apple Inc. | Offline personal assistant |
US10395654B2 (en) | 2017-05-11 | 2019-08-27 | Apple Inc. | Text normalization based on a data-driven learning network |
US11301477B2 (en) | 2017-05-12 | 2022-04-12 | Apple Inc. | Feedback analysis of a digital assistant |
DK179496B1 (en) | 2017-05-12 | 2019-01-15 | Apple Inc. | USER-SPECIFIC Acoustic Models |
DK201770427A1 (en) | 2017-05-12 | 2018-12-20 | Apple Inc. | LOW-LATENCY INTELLIGENT AUTOMATED ASSISTANT |
DK179745B1 (en) | 2017-05-12 | 2019-05-01 | Apple Inc. | SYNCHRONIZATION AND TASK DELEGATION OF A DIGITAL ASSISTANT |
DK201770431A1 (en) | 2017-05-15 | 2018-12-20 | Apple Inc. | Optimizing dialogue policy decisions for digital assistants using implicit feedback |
DK201770432A1 (en) | 2017-05-15 | 2018-12-21 | Apple Inc. | Hierarchical belief states for digital assistants |
US10403278B2 (en) | 2017-05-16 | 2019-09-03 | Apple Inc. | Methods and systems for phonetic matching in digital assistant services |
DK179549B1 (en) | 2017-05-16 | 2019-02-12 | Apple Inc. | FAR-FIELD EXTENSION FOR DIGITAL ASSISTANT SERVICES |
US10311144B2 (en) | 2017-05-16 | 2019-06-04 | Apple Inc. | Emoji word sense disambiguation |
US10303715B2 (en) | 2017-05-16 | 2019-05-28 | Apple Inc. | Intelligent automated assistant for media exploration |
US20180336892A1 (en) | 2017-05-16 | 2018-11-22 | Apple Inc. | Detecting a trigger of a digital assistant |
US10657328B2 (en) | 2017-06-02 | 2020-05-19 | Apple Inc. | Multi-task recurrent neural network architecture for efficient morphology handling in neural language modeling |
CN107342083B (zh) * | 2017-07-05 | 2021-07-20 | 百度在线网络技术(北京)有限公司 | 用于提供语音服务的方法和装置 |
US10445429B2 (en) | 2017-09-21 | 2019-10-15 | Apple Inc. | Natural language understanding using vocabularies with compressed serialized tries |
US10755051B2 (en) | 2017-09-29 | 2020-08-25 | Apple Inc. | Rule-based natural language processing |
US10636424B2 (en) | 2017-11-30 | 2020-04-28 | Apple Inc. | Multi-turn canned dialog |
US10733982B2 (en) | 2018-01-08 | 2020-08-04 | Apple Inc. | Multi-directional dialog |
US10733375B2 (en) | 2018-01-31 | 2020-08-04 | Apple Inc. | Knowledge-based framework for improving natural language understanding |
DE102018103965A1 (de) * | 2018-02-22 | 2019-08-22 | Schuler Pressen Gmbh | Verfahren zur Mensch-Maschine-Kommunikation mittels einer Mensch-Maschine-Schnittstelle und Vorrichtung hierfür |
US10789959B2 (en) | 2018-03-02 | 2020-09-29 | Apple Inc. | Training speaker recognition models for digital assistants |
US10592604B2 (en) | 2018-03-12 | 2020-03-17 | Apple Inc. | Inverse text normalization for automatic speech recognition |
US10818288B2 (en) | 2018-03-26 | 2020-10-27 | Apple Inc. | Natural assistant interaction |
US10909331B2 (en) | 2018-03-30 | 2021-02-02 | Apple Inc. | Implicit identification of translation payload with neural machine translation |
US10928918B2 (en) | 2018-05-07 | 2021-02-23 | Apple Inc. | Raise to speak |
US11145294B2 (en) | 2018-05-07 | 2021-10-12 | Apple Inc. | Intelligent automated assistant for delivering content from user experiences |
US10984780B2 (en) | 2018-05-21 | 2021-04-20 | Apple Inc. | Global semantic word embeddings using bi-directional recurrent neural networks |
US10892996B2 (en) | 2018-06-01 | 2021-01-12 | Apple Inc. | Variable latency device coordination |
DK180639B1 (en) | 2018-06-01 | 2021-11-04 | Apple Inc | DISABILITY OF ATTENTION-ATTENTIVE VIRTUAL ASSISTANT |
DK179822B1 (da) | 2018-06-01 | 2019-07-12 | Apple Inc. | Voice interaction at a primary device to access call functionality of a companion device |
DK201870355A1 (en) | 2018-06-01 | 2019-12-16 | Apple Inc. | VIRTUAL ASSISTANT OPERATION IN MULTI-DEVICE ENVIRONMENTS |
US11386266B2 (en) | 2018-06-01 | 2022-07-12 | Apple Inc. | Text correction |
US11076039B2 (en) | 2018-06-03 | 2021-07-27 | Apple Inc. | Accelerated task performance |
US11010561B2 (en) | 2018-09-27 | 2021-05-18 | Apple Inc. | Sentiment prediction from textual data |
US11462215B2 (en) | 2018-09-28 | 2022-10-04 | Apple Inc. | Multi-modal inputs for voice commands |
US10839159B2 (en) | 2018-09-28 | 2020-11-17 | Apple Inc. | Named entity normalization in a spoken dialog system |
US11170166B2 (en) | 2018-09-28 | 2021-11-09 | Apple Inc. | Neural typographical error modeling via generative adversarial networks |
CN109360557A (zh) * | 2018-10-10 | 2019-02-19 | 腾讯科技(北京)有限公司 | 语音控制应用程序的方法、装置和计算机设备 |
US11475898B2 (en) | 2018-10-26 | 2022-10-18 | Apple Inc. | Low-latency multi-speaker speech recognition |
CN109346077B (zh) * | 2018-11-01 | 2022-03-25 | 汤强 | 一种适用于便携智能设备的语音系统及其使用方法 |
CN113330512A (zh) * | 2018-12-28 | 2021-08-31 | 谷歌有限责任公司 | 根据选择的建议向自动化助理补充语音输入 |
US11638059B2 (en) | 2019-01-04 | 2023-04-25 | Apple Inc. | Content playback on multiple devices |
WO2020142717A1 (en) * | 2019-01-04 | 2020-07-09 | Cerence Operating Company | Methods and systems for increasing autonomous vehicle safety and flexibility using voice interaction |
US11348573B2 (en) | 2019-03-18 | 2022-05-31 | Apple Inc. | Multimodality in digital assistant systems |
US11475884B2 (en) | 2019-05-06 | 2022-10-18 | Apple Inc. | Reducing digital assistant latency when a language is incorrectly determined |
US11423908B2 (en) | 2019-05-06 | 2022-08-23 | Apple Inc. | Interpreting spoken requests |
DK201970509A1 (en) | 2019-05-06 | 2021-01-15 | Apple Inc | Spoken notifications |
US11307752B2 (en) | 2019-05-06 | 2022-04-19 | Apple Inc. | User configurable task triggers |
US11140099B2 (en) | 2019-05-21 | 2021-10-05 | Apple Inc. | Providing message response suggestions |
DK180129B1 (en) | 2019-05-31 | 2020-06-02 | Apple Inc. | USER ACTIVITY SHORTCUT SUGGESTIONS |
US11289073B2 (en) | 2019-05-31 | 2022-03-29 | Apple Inc. | Device text to speech |
US11496600B2 (en) | 2019-05-31 | 2022-11-08 | Apple Inc. | Remote execution of machine-learned models |
DK201970510A1 (en) | 2019-05-31 | 2021-02-11 | Apple Inc | Voice identification in digital assistant systems |
US11360641B2 (en) | 2019-06-01 | 2022-06-14 | Apple Inc. | Increasing the relevance of new available information |
US11468890B2 (en) | 2019-06-01 | 2022-10-11 | Apple Inc. | Methods and user interfaces for voice-based control of electronic devices |
CN110493123B (zh) * | 2019-09-16 | 2022-06-28 | 腾讯科技(深圳)有限公司 | 即时通讯方法、装置、设备及存储介质 |
WO2021056255A1 (en) | 2019-09-25 | 2021-04-01 | Apple Inc. | Text detection using global geometry estimators |
US11308265B1 (en) * | 2019-10-11 | 2022-04-19 | Wells Fargo Bank, N.A. | Digitally aware neural dictation interface |
CN111651135B (zh) * | 2020-04-27 | 2021-05-25 | 珠海格力电器股份有限公司 | 一种声音唤醒方法、装置、存储介质及电器设备 |
US11038934B1 (en) | 2020-05-11 | 2021-06-15 | Apple Inc. | Digital assistant hardware abstraction |
US11061543B1 (en) | 2020-05-11 | 2021-07-13 | Apple Inc. | Providing relevant data items based on context |
US11755276B2 (en) | 2020-05-12 | 2023-09-12 | Apple Inc. | Reducing description length based on confidence |
US11490204B2 (en) | 2020-07-20 | 2022-11-01 | Apple Inc. | Multi-device audio adjustment coordination |
US11438683B2 (en) | 2020-07-21 | 2022-09-06 | Apple Inc. | User identification using headphones |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080106370A1 (en) * | 2006-11-02 | 2008-05-08 | Viking Access Systems, Llc | System and method for speech-recognition facilitated communication to monitor and control access to premises |
US20100330908A1 (en) * | 2009-06-25 | 2010-12-30 | Blueant Wireless Pty Limited | Telecommunications device with voice-controlled functions |
CN101957202A (zh) * | 2009-07-15 | 2011-01-26 | 常州市新科汽车电子有限公司 | 导航仪的用户待办事件存储及提醒方法 |
US20110257973A1 (en) * | 2007-12-05 | 2011-10-20 | Johnson Controls Technology Company | Vehicle user interface systems and methods |
CN102736536A (zh) * | 2012-07-13 | 2012-10-17 | 海尔集团公司 | 语音控制电器设备的方法、装置 |
US20130045676A1 (en) * | 2010-10-14 | 2013-02-21 | Matthew W. Taylor | Electronic system and controlling method thereof |
Family Cites Families (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5774862A (en) * | 1989-06-19 | 1998-06-30 | Ho; Kit-Fun | Computer communication system |
JP3034773B2 (ja) * | 1994-12-27 | 2000-04-17 | シャープ株式会社 | 電子通訳機 |
US6775697B1 (en) * | 2000-05-26 | 2004-08-10 | Cisco Technology, Inc. | Locally configurable audio IP network appliance and method for configuring the same |
JP3705735B2 (ja) * | 2000-08-29 | 2005-10-12 | シャープ株式会社 | オンデマンド・インタフェース装置とそのウィンドウ表示装置 |
JP2002123283A (ja) * | 2000-10-12 | 2002-04-26 | Nissan Motor Co Ltd | 音声認識操作装置 |
US6820056B1 (en) * | 2000-11-21 | 2004-11-16 | International Business Machines Corporation | Recognizing non-verbal sound commands in an interactive computer controlled speech word recognition display system |
JP4728537B2 (ja) * | 2001-09-14 | 2011-07-20 | 株式会社ホンダアクセス | ブルートゥース通信システム |
JP2007067742A (ja) | 2005-08-30 | 2007-03-15 | Kyocera Corp | 携帯電話機 |
US8270933B2 (en) | 2005-09-26 | 2012-09-18 | Zoomsafer, Inc. | Safety features for portable electronic device |
US8165886B1 (en) | 2007-10-04 | 2012-04-24 | Great Northern Research LLC | Speech interface system and method for control and interaction with applications on a computing system |
US7996045B1 (en) | 2007-11-09 | 2011-08-09 | Google Inc. | Providing interactive alert information |
JP2012505602A (ja) | 2008-10-09 | 2012-03-01 | ユニバーシティ オブ ユタ リサーチ ファウンデーション | 運転中のセル電話使用を防ぐシステムおよび方法 |
US8787936B2 (en) | 2009-07-21 | 2014-07-22 | Katasi Llc | Method and system for controlling a mobile communication device in a moving vehicle |
US8145199B2 (en) | 2009-10-31 | 2012-03-27 | BT Patent LLC | Controlling mobile device functions |
EP2531999A4 (en) | 2010-02-05 | 2017-03-29 | Nuance Communications, Inc. | Language context sensitive command system and method |
US20120052907A1 (en) | 2010-08-30 | 2012-03-01 | Sensory, Incorporated | Hands-Free, Eyes-Free Mobile Device for In-Car Use |
DE102011109932B4 (de) * | 2011-08-10 | 2014-10-02 | Audi Ag | Verfahren zum Ansteuern funktioneller Einrichtungen in einem Fahrzeug bei Sprachbefehl-Bedienung |
KR101946364B1 (ko) * | 2012-05-01 | 2019-02-11 | 엘지전자 주식회사 | 적어도 하나의 마이크 센서를 갖는 모바일 디바이스 및 그 제어방법 |
US10156455B2 (en) * | 2012-06-05 | 2018-12-18 | Apple Inc. | Context-aware voice guidance |
US9997069B2 (en) * | 2012-06-05 | 2018-06-12 | Apple Inc. | Context-aware voice guidance |
US9280981B2 (en) * | 2013-02-27 | 2016-03-08 | Blackberry Limited | Method and apparatus for voice control of a mobile device |
-
2013
- 2013-02-27 US US13/778,325 patent/US9280981B2/en active Active
-
2014
- 2014-02-03 CA CA2842061A patent/CA2842061C/en active Active
- 2014-02-26 CN CN201410066907.8A patent/CN104008749B/zh active Active
-
2016
- 2016-03-07 US US15/063,160 patent/US9653080B2/en active Active
-
2017
- 2017-05-12 US US15/593,997 patent/US9978369B2/en active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080106370A1 (en) * | 2006-11-02 | 2008-05-08 | Viking Access Systems, Llc | System and method for speech-recognition facilitated communication to monitor and control access to premises |
US20110257973A1 (en) * | 2007-12-05 | 2011-10-20 | Johnson Controls Technology Company | Vehicle user interface systems and methods |
US20100330908A1 (en) * | 2009-06-25 | 2010-12-30 | Blueant Wireless Pty Limited | Telecommunications device with voice-controlled functions |
CN101957202A (zh) * | 2009-07-15 | 2011-01-26 | 常州市新科汽车电子有限公司 | 导航仪的用户待办事件存储及提醒方法 |
US20130045676A1 (en) * | 2010-10-14 | 2013-02-21 | Matthew W. Taylor | Electronic system and controlling method thereof |
CN102736536A (zh) * | 2012-07-13 | 2012-10-17 | 海尔集团公司 | 语音控制电器设备的方法、装置 |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111800891A (zh) * | 2014-11-24 | 2020-10-20 | 苹果公司 | 点对点自组织语音通信 |
US11844123B2 (en) | 2014-11-24 | 2023-12-12 | Apple Inc. | Point-to-point ad hoc voice communication |
CN111800891B (zh) * | 2014-11-24 | 2024-05-03 | 苹果公司 | 用于点对点自组织语音通信的方法、装置和介质 |
TWI621340B (zh) * | 2015-02-26 | 2018-04-11 | 默科資訊股份有限公司 | 偵測空氣波動的控制系統與其控制方法 |
Also Published As
Publication number | Publication date |
---|---|
US20160189714A1 (en) | 2016-06-30 |
US20170263252A1 (en) | 2017-09-14 |
US9280981B2 (en) | 2016-03-08 |
US20140244268A1 (en) | 2014-08-28 |
CA2842061A1 (en) | 2014-08-27 |
CA2842061C (en) | 2017-12-05 |
US9978369B2 (en) | 2018-05-22 |
CN104008749B (zh) | 2018-03-06 |
US9653080B2 (en) | 2017-05-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104008749A (zh) | 用于移动设备的语音控制的方法和装置 | |
US9978272B2 (en) | Vehicle to vehicle chatting and communication system | |
CN102972015B (zh) | 电话保持机制 | |
US20110300840A1 (en) | On the road groups | |
EP2446652A1 (en) | Vehicle internet radio interface | |
CN101223766A (zh) | 电子会议系统、电子会议管理装置、终端装置、电子会议管理方法、控制程序及记录了控制程序的计算机可读取的记录媒体 | |
CN101141530A (zh) | 用于集中式存储数据的方法 | |
US8891740B2 (en) | Voice input state identification | |
US9183563B2 (en) | Electronic questionnaire | |
US20180288222A1 (en) | Recording and playing back portions of a telephone call | |
CN103108073A (zh) | 一种利用手机客户端提供语音选项和反馈文字提示的方法 | |
US10038780B2 (en) | System for switching and outputting sender-controlled incoming ringtone and method therefor | |
US20110183725A1 (en) | Hands-Free Text Messaging | |
EP3686884B1 (en) | Method for voice control of a mobile device | |
KR100830533B1 (ko) | 화상 통화 기반 자동 응답 단말기, 이를 이용하는 시스템및 방법 | |
CN113472947B (zh) | 无屏智能终端及其控制方法、计算机可读存储介质 | |
US20060014527A1 (en) | Apparatus and method for transmitting voice message in mobile communication terminal | |
KR101102323B1 (ko) | 블루투스를 이용한 인연 검색 서비스 방법 | |
KR20040046312A (ko) | 문자 및 음성정보 전송 시스템 및 그 방법 | |
TW201444331A (zh) | 訊息注入系統及方法 | |
KR20140131923A (ko) | 메시지 송출 시스템 및 방법 | |
WO2006071087A1 (en) | Information providing system and method using real-time streaming transmission | |
KR20140008074A (ko) | 중계 기능을 수행하는 이동통신 단말기 및 그 제어방법 | |
TW200847749A (en) | Automatically calling method and system thereof |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right |
Effective date of registration: 20240529 Address after: Illinois Patentee after: Ot patent trusteeship Co.,Ltd. Country or region after: U.S.A. Address before: Voight, Ontario, Canada Patentee before: BlackBerry Ltd. Country or region before: Canada |