CN108196821A - 具有连续关键词识别的免提设备 - Google Patents
具有连续关键词识别的免提设备 Download PDFInfo
- Publication number
- CN108196821A CN108196821A CN201810118789.9A CN201810118789A CN108196821A CN 108196821 A CN108196821 A CN 108196821A CN 201810118789 A CN201810118789 A CN 201810118789A CN 108196821 A CN108196821 A CN 108196821A
- Authority
- CN
- China
- Prior art keywords
- keyword
- equipment
- data processing
- specific audio
- free device
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000005540 biological transmission Effects 0.000 claims description 14
- 238000000034 method Methods 0.000 claims description 14
- 238000003860 storage Methods 0.000 claims description 12
- 230000004044 response Effects 0.000 claims description 5
- 230000001052 transient effect Effects 0.000 claims description 3
- 238000012545 processing Methods 0.000 abstract description 204
- 238000010586 diagram Methods 0.000 description 23
- 241000196324 Embryophyta Species 0.000 description 21
- 230000006870 function Effects 0.000 description 9
- 238000004891 communication Methods 0.000 description 7
- 238000012552 review Methods 0.000 description 5
- 241001062009 Indigofera Species 0.000 description 4
- 230000003139 buffering effect Effects 0.000 description 3
- 238000004590 computer program Methods 0.000 description 3
- 230000008878 coupling Effects 0.000 description 3
- 238000010168 coupling process Methods 0.000 description 3
- 238000005859 coupling reaction Methods 0.000 description 3
- 238000013500 data storage Methods 0.000 description 3
- 238000012544 monitoring process Methods 0.000 description 3
- 230000006399 behavior Effects 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 238000000151 deposition Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/16—Sound input; Sound output
- G06F3/167—Audio in a user interface, e.g. using voice commands for navigating, audio feedback
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/30—Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M1/00—Substation equipment, e.g. for use by subscribers
- H04M1/60—Substation equipment, e.g. for use by subscribers including speech amplifiers
- H04M1/6033—Substation equipment, e.g. for use by subscribers including speech amplifiers for providing handsfree use or a loudspeaker mode in telephone sets
- H04M1/6041—Portable telephones adapted for handsfree use
- H04M1/6058—Portable telephones adapted for handsfree use involving the use of a headset accessory device connected to the portable telephone
- H04M1/6066—Portable telephones adapted for handsfree use involving the use of a headset accessory device connected to the portable telephone including a wireless connection
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R1/00—Details of transducers, loudspeakers or microphones
- H04R1/10—Earpieces; Attachments therefor ; Earphones; Monophonic headphones
- H04R1/1091—Details not provided for in groups H04R1/1008 - H04R1/1083
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L2015/088—Word spotting
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M2250/00—Details of telephonic subscriber devices
- H04M2250/02—Details of telephonic subscriber devices including a Bluetooth interface
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04M—TELEPHONIC COMMUNICATION
- H04M2250/00—Details of telephonic subscriber devices
- H04M2250/74—Details of telephonic subscriber devices with voice recognition means
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2201/00—Details of transducers, loudspeakers or microphones covered by H04R1/00 but not provided for in any of its subgroups
- H04R2201/10—Details of earpieces, attachments therefor, earphones or monophonic headphones covered by H04R1/10 but not provided for in any of its subgroups
- H04R2201/107—Monophonic and stereophonic headphones with microphone for two-way hands free communication
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2201/00—Details of transducers, loudspeakers or microphones covered by H04R1/00 but not provided for in any of its subgroups
- H04R2201/10—Details of earpieces, attachments therefor, earphones or monophonic headphones covered by H04R1/10 but not provided for in any of its subgroups
- H04R2201/109—Arrangements to adapt hands free headphones for use on both ears
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R2420/00—Details of connection covered by H04R, not provided for in its groups
- H04R2420/07—Applications of wireless loudspeakers or wireless microphones
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Acoustics & Sound (AREA)
- Theoretical Computer Science (AREA)
- Signal Processing (AREA)
- Computational Linguistics (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Computer Networks & Wireless Communication (AREA)
- General Health & Medical Sciences (AREA)
- Telephone Function (AREA)
- Telephonic Communication Services (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
公开了具有连续关键词识别的免提设备。被耦合到数据处理设备的免提设备可以可操作为针对至少一个关键词的出现而监控至少一个音频流。在识别至少一个关键词时,免提设备可以建立在免提设备和数据处理设备之间的第一连接,以用于启动数据处理设备中的语音接口。免提设备可以经由第一连接将在至少一个关键词的识别之后接收的音频数据发送到数据处理设备,以用于经由语音接口对音频数据做出响应。在关键词配置操作期间,免提设备可以将至少一个输入的关键词发送到数据处理设备以用于记录。免提设备可经由第二连接从数据处理设备接收记录的至少一个关键词,以用于免提设备的关键词配置。
Description
本申请是分案申请,原案的申请号是201380060748.4,申请日是2013年9月19日,发明名称是“具有连续关键词识别的免提设备”。
技术领域
本公开的某些实施例涉及语音识别和接口系统。更具体地说,本公开的某些实施例涉及用于具有连续关键词识别的免提设备的方法和系统。
背景技术
诸如例如耳麦之类的免提设备通常可连同数据处理设备一起使用。免提设备可包括例如使用诸如例如蓝牙之类的一种或多种无线技术的无线耳麦。数据处理设备可包括例如移动电话、智能电话、平板电脑和/或具有语音识别的其它设备。数据处理设备可包括语音接口功能。语音接口功能能够识别并响应于可以例如从免提设备的麦克风接收的用户的语音。数据处理设备的语音接口可以例如通过按压在数据处理设备上的按钮而被触发或调用。
通过比较这样的系统与如参考附图在本申请的其余部分中陈述的本公开内容,常规和传统方法的进一步限制和缺点对于本领域的技术人员来说将变得显而易见。
发明内容
本公开的方面指向用于具有连续关键词识别的免提设备的方法和系统。在本公开的各种实施例中,其与数据处理设备耦合或连接且已被配置用于识别至少一个关键词的免提设备可以可操作为针对至少一个关键词的出现而监控至少一个接收的音频流。在识别至少一个关键词时,免提设备可以可操作为建立在免提设备和数据处理设备之间的第一连接,以用于启动在数据处理设备中的语音接口。免提设备可以可操作为经由建立的第一连接将可以在至少一个关键词的识别之后被接收的音频数据发送到数据处理设备,以用于由数据处理设备经由语音接口对发送的音频数据做出响应。在这一点上,将被发送到数据处理设备的音频数据可以在对应于建立第一连接的时间间隔期间在免提设备中被缓冲。
在关键词配置操作期间,免提设备可以可操作为输入至少一个关键词。免提设备可以可操作为将输入的至少一个关键词发送到数据处理设备,以用于由数据处理设备记录输入的至少一个关键词。免提设备可以可操作为经由第二连接从数据处理设备接收记录的至少一个关键词。免提设备然后可以可操作为利用记录的至少一个关键词来执行免提设备的配置,以用于识别在至少一个接收的音频流中的至少一个关键词。
本公开的各种优点、方面和新颖的特征,以及其图示实施例的细节将从以下描述和附图中更完全地被理解。
附图说明
图1为图示依照本公开的实施例的与数据处理设备耦合的示例免提设备的框图。
图2为图示依照本公开的实施例的具有连续关键词识别的示例免提设备的框图。
图3为图示依照本公开的实施例的具有连续关键词识别的示例蓝牙免提设备的框图。
图4为图示依照本公开的实施例的用于具有连续关键词识别的免提设备的示例步骤的流程图。
图5为图示依照本公开的实施例的用于具有连续关键词识别的蓝牙免提设备的示例步骤的流程图。
图6为图示依照本公开的实施例的用于免提设备的关键词配置的示例步骤的流程图。
图7为图示依照本公开的实施例的用于蓝牙免提设备的关键词配置的示例步骤的流程图。
图8为图示依照本公开的实施例的在工厂环境中硬编码到免提设备中的关键词的示例情景的框图。
具体实施方式
本公开的某些实施例可以在用于具有连续关键词识别的免提设备的方法和系统中被找到。某些具体细节在以下描述和附图中被陈述以提供对本公开的各种实施例的彻底理解。然而,本领域的技术人员将会理解,可以在没有以下描述中描述的若干细节的情况下实践本公开的附加实施例。
在本公开的各种实施例中,其耦合或连接到数据处理设备且已被配置用于识别至少一个关键词的免提设备可以可操作为针对至少一个关键词的出现而监控至少一个接收的音频流。在识别至少一个关键词时,免提设备可以可操作为在免提设备和数据处理设备之间建立第一连接,以用于启动在数据处理设备中的语音接口。免提设备可以可操作为经由建立的第一连接将可以在至少一个关键词的识别之后被接收的音频数据发送到数据处理设备,以用于由数据处理设备经由语音接口对发送的音频数据做出响应。在这一点上,将被发送到数据处理设备的音频数据可以在对应于建立第一连接的时间间隔期间在免提设备中被缓冲。
在关键词配置操作期间,免提设备可以可操作为输入至少一个关键词。免提设备可以可操作为将输入的至少一个关键词发送到数据处理设备,以用于通过数据处理设备记录输入的至少一个关键词。免提设备可以可操作为经由第二连接从数据处理设备接收记录的至少一个关键词。免提设备然后可以可操作为利用记录的至少一个关键词而执行免提设备的配置,以用于识别在至少一个接收的音频流中的至少一个关键词。
在本公开的示例实施例中,免提设备可以可操作为在如下情况下进入关键词配置操作:数据处理设备接收请求,且数据处理设备基于接收的要求而使得免提设备进入关键词配置操作。免提设备还可以可操作为在如下情况下进入关键词配置操作:免提设备第一次耦合到数据处理设备,数据处理设备发现免提设备能够针对至少一个关键词的出现而监控至少一个接收的音频流,数据处理设备确定免提设备尚未被配置用于识别至少一个关键词,且数据处理设备通过提示和请求经由免提设备对至少一个关键词的输入,而使得免提设备进入关键词配置操作。在这一点上,在数据处理设备确定免提设备已被配置用于识别至少一个关键词的情况下,数据处理设备可启用关键词配置接口,以允许经由关键词配置操作来记录至少一个关键词,而不请求经由免提设备对至少一个关键词的输入。
在本公开的示例实施例中,数据处理设备可储存记录的至少一个关键词,以允许在随后的关键词配置操作中再使用储存的至少一个关键词。在将记录的至少一个关键词经由第二连接发送到免提设备以用于关键词配置之前,数据处理设备可重新播放记录的至少一个关键词以用于复核(review)。作为复核记录的至少一个关键词的结果,数据处理设备可接收指示,其中指示可包括例如记录的至少一个关键词的接受、记录的至少一个关键词的拒绝、或关键词配置操作的取消。
在本发明的另一示例实施例中,免提设备可包括其可以在工厂环境中被硬编码到免提设备中的至少一个关键词。免提设备还可包括至少一个关键词中的每个关键词的至少一个口音版本,其中至少一个关键词中的每个关键词的至少一个口音版本可以在工厂环境中被硬编码到免提设备中。在这种情况下,在关键词配置操作期间,可以允许从至少一个关键词中的每个关键词的至少一个口音版本之中选择至少一个新的关键词。免提设备还可包括至少一个关键词中的每个关键词的至少一个版本,其中至少一个关键词中的每个关键词的至少一个版本可以在工厂环境中被硬编码到免提设备中,并且至少一个版本可分别对应于数据处理设备的至少一种设备类型。在这种情况下,在关键词配置操作期间,可以允许从至少一个关键词中的每个关键词的至少一个版本之中选择至少一个新的关键词。
在本公开的一些实施例中,免提设备可包括蓝牙免提设备。例如,蓝牙免提设备可以是蓝牙耳麦。在这种情况下,其经由蓝牙通信被耦合或连接到数据处理设备且已被配置用于识别至少一个关键词的蓝牙免提设备可以可操作为针对至少一个关键词的出现而监控至少一个接收的音频流。在识别至少一个关键词时,蓝牙免提设备可以可操作为建立在蓝牙免提设备和数据处理设备之间的第一连接,以用于启动在数据处理设备中的语音接口。蓝牙免提设备可以可操作为经由建立的第一连接将可以在至少一个关键词的识别之后被接收的音频数据发送到数据处理设备,以用于由数据处理设备经由语音接口对发送的音频数据做出响应。
在关键词配置操作期间,蓝牙免提设备可以可操作为输入至少一个关键词。蓝牙免提设备可以可操作为将输入的至少一个关键词发送到数据处理设备,以用于通过数据处理设备记录输入的至少一个关键词。蓝牙免提设备可以可操作为经由第二连接从数据处理设备接收记录的至少一个关键词。蓝牙免提设备然后可以可操作为利用记录的至少一个关键词来执行蓝牙免提设备的配置,以用于识别在至少一个接收的音频流中的至少一个关键词。在本公开的示例实施例中,蓝牙免提设备可以可操作为在如下情况下进入关键词配置操作:蓝牙免提设备第一次耦合到数据处理设备,数据处理设备发现蓝牙免提设备能够针对至少一个关键词的出现而监控至少一个接收的音频流,数据处理设备确定蓝牙免提设备尚未被配置用于识别至少一个关键词,且数据处理设备通过提示和请求经由蓝牙免提设备对至少一个关键词的输入,而使得蓝牙免提设备进入关键词配置操作。在这一点上,数据处理设备可利用蓝牙服务发现协议(SDP)来发现蓝牙免提设备能够针对至少一个关键词的出现而监控至少一个接收的音频流。
图1为图示依照本公开的实施例的与数据处理设备耦合的示例免提设备的框图。参考图1,示出了免提设备101、数据处理设备102和用户103。免提设备101可以被耦合或连接到数据处理设备102以用于免提操作,且用户103可穿戴免提设备101以用于免提操作。
免提设备101可以包括合适的逻辑、电路系统、接口和/或代码,其可以可操作为利用免提操作提供诸如数据处理设备102之类的数据处理设备的等效手持功能。在本公开的示例实施例中,免提设备101可被配置用于识别至少一个关键词。免提设备101可以可操作为针对至少一个关键词的出现而监控至少一个接收的音频流。在识别至少一个关键词时,免提设备101可以可操作为建立在免提设备101和数据处理设备102之间的第一连接,以用于启动在数据处理设备102中的语音接口。免提设备101可以可操作为经由建立的第一连接来将可能在至少一个关键词的识别之后被接收的音频数据发送到数据处理设备102。然后数据处理设备102可以经由语音接口对发送的音频数据做出响应。
数据处理设备102可以包括合适的逻辑、电路系统、接口和/或代码,其可以可操作为处理数据或信号。数据处理设备还可以可操作为跨例如一个或多个无线通信网络和/或一个或多个有线通信网络传达信号。数据处理设备102可包括例如移动电话、智能电话、平板电脑和/或具有语音识别的其它设备。在本公开的示例实施例中,数据处理设备102可以包括语音接口性能。在数据处理设备102中的语音接口可以例如基于由用户103经由免提设备101输入或讲出的一些关键词而被启动或触发。然后语音接口可以对用户103经由免提设备101输入或讲出的音频数据做出响应。
在操作中,免提设备101(其被耦合或连接到数据处理设备102)可以已被配置用于识别至少一个关键词。免提设备101可以可操作为针对至少一个关键词的出现而监控至少一个被接收的音频流。在识别至少一个关键词时,免提设备101可以可操作为建立在免提设备101和数据处理设备102之间的第一连接,以用于启动在数据处理设备102中的语音接口。免提设备101可以可操作为经由建立的第一连接将可能在至少一个关键词的识别之后被接收的音频数据发送到数据处理设备102。数据处理设备102然后可以经由语音接口对发送的音频数据做出响应。在这一点上,免提设备101在对应于建立第一连接的时间间隔期间可以可操作为缓冲待发送到数据处理设备102的音频数据。在这种情况下,例如,用户103可能想要拨打电话号码。用户103可以讲出关键词“拨打”或“拨号”,随后是电话号码。在识别关键词(例如,拨打或拨号)时,免提设备101可建立在免提设备101和数据处理设备102之间的第一连接,以用于启动或触发在数据处理设备102中的语音接口。免提设备101可以经由建立的第一连接将对应于电话号码的音频数据传输到数据处理设备102。对应于电话号码的音频数据可以在对应于建立第一连接的时间期间被缓冲。在这一点上,用于建立第一连接的时间延迟可以对于用户103来说是透明的。数据处理设备102然后可以经由语音接口对对应于电话号码的音频数据做出响应,并代表用户103拨打电话号码。
在用于使免提设备101能够识别至少一个关键词的关键词配置操作期间,免提设备101可以可操作为将由用户103输入或讲出的至少一个关键词发送到数据处理设备102,且数据处理设备102可以记录由用户103输入的至少一个关键词。免提设备101可以可操作为经由第二连接从数据处理设备102接收记录的至少一个关键词。免提设备101然后可以可操作为利用记录的至少一个关键词而执行免提设备101的配置,以用于识别在至少一个已接收的音频流中的至少一个关键词。
在本公开的示例实施例中,在数据处理设备102接收来自用户103用于关键词配置的请求且数据处理设备102基于从用户103接收的请求而使得免提设备101进入关键词配置操作的情况下,免提设备101可以可操作为进入关键词配置操作。例如,数据处理设备102可以通过指令或命令免提设备101开始将诸如至少一个关键词之类的音频数据发送到数据处理设备102而使得免提设备101进入关键词配置操作。免提设备101还可以可操作为在如下情况下进入关键词配置操作:免提设备101第一次被耦合或连接到数据处理设备102,数据处理设备102发现免提设备101能够针对至少一个关键词的出现而监控至少一个已接收的音频流,数据处理设备102确定免提设备101尚未被配置用于识别至少一个关键词,且数据处理设备102通过提示和请求用户103经由免提设备101输入或讲出至少一个关键词而使得免提设备101进入关键词配置操作。在这一点上,在数据处理设备102确定免提设备101早已被配置用于识别至少一个关键词的情况下,数据处理设备102可启用关键词配置接口,以允许用户103经由关键词配置操作来记录至少一个关键词,而不请求用户103经由免提设备101输入或讲出至少一个关键词。在这种情况下,用户103可以选择例如在闲暇时经由相同的关键词配置操作记录至少一个新的关键词。
在本公开的示例实施例中,数据处理设备102可以储存记录的至少一个关键词,以允许用户103在随后的关键词配置操作中再使用已储存的至少一个关键词。在这种情况下,用户103可以切换回到之前使用的关键词,而无须从头开始记录关键词。在将记录的至少一个关键词经由用于关键词配置的第二连接发送到免提设备101之前,数据处理设备102可以重新播放记录的至少一个关键词以用于用户103复核,且作为用户103复核记录的至少一个关键词的结果,数据处理设备102可接收从用户103传达的指示。指示可以包括例如记录的至少一个关键词的接受、记录的至少一个关键词的拒绝、或关键词配置操作的取消。
在本公开的另一示例实施例中,免提设备101可以包括其可以在工厂环境中被硬编码到免提设备101中的至少一个关键词。免提设备101还可以包括至少一个关键词中的每个关键词的至少一个口音版本,其中至少一个关键词中的每个关键词的至少一个口音版本可以在工厂环境中被硬编码到免提设备101中。在这一点上,在关键词配置操作期间,用户103可以被允许例如基于用户103的口音从至少一个关键词中的每个关键词的至少一个口音版本之中选择至少一个新关键词。例如,用户103可以选择其可以匹配他/她的口音的至少一个新关键词。
免提设备101还可以包括至少一个关键词中的每个关键词的至少一个版本,其中至少一个关键词中的每个关键词的至少一个版本可能在工厂环境中被硬编码到免提设备101中,并且至少一个版本可以分别对应于数据处理设备102的至少一种设备类型。在这一点上,在关键词配置操作期间,用户103可以被允许例如基于数据处理设备102的设备类型从至少一个关键词中的每个关键词的至少一个版本之中选择至少一个新关键词。例如,在数据处理设备102是移动电话的情况下,用户103可以选择其包括“电话”的关键词版本。在数据处理设备102是PC或电脑的情况下,用户103可以选择其包括“电脑”的关键词版本。
图2为图示依照本公开的实施例的具有连续关键词识别的示例免提设备的框图。参考图2,示出了免提设备101和数据处理设备102。免提设备101可以被耦合或连接到数据处理设备102。免提设备101可以包括处理器208、存储器210、麦克风206、扬声器212、关键词识别模块202和关键词配置模块204。数据处理设备102可包括处理器238、存储器240、语音接口模块234、用户接口模块236和关键词服务模块232。免提设备101和数据处理设备102可以是如例如关于图1所描述的。
免提设备101中的处理器208可包括合适的逻辑、电路系统、接口和/或代码,其可以可操作为管理和/或控制在免提设备101中的各种部件(诸如例如麦克风206、扬声器212、关键词识别模块202、关键词配置模块204和/或其它部件)的操作。处理器208可利用其使得能够执行各种应用的操作系统。处理器208可实现用于与例如数据处理设备102通信的一个或多个通信协议。
在免提设备101中的存储器210可包括合适的逻辑、电路系统、接口和/或代码,其可以可操作为储存可由例如处理器208、关键词识别模块202和/或关键词配置模块204利用的诸如可执行指令和/或数据之类的信息。存储器210可包括RAM、ROM、诸如闪速存储器之类的低延迟非易失存储器和/或其它合适的电子数据存储。
在免提设备101中的麦克风206可包括合适的逻辑、电路系统、接口和/或代码,其可以可操作为将音频波转换为电信号。麦克风206连同扬声器212一起可使诸如用户103之类的用户能够参与语音对话,以提供音频命令和/或接收音频反馈。
在免提设备101中的扬声器212可包括合适的逻辑、电路系统、接口和/或代码,其可以可操作为将电信号转换为音频波。扬声器212连同麦克风206一起可使诸如用户103之类的用户能够参与语音对话,以提供音频命令和/或接收音频反馈。
在免提设备101中的关键词识别模块202可包括合适的逻辑、电路系统、接口和/或代码,其可以可操作为提供用于免提设备101的关键词识别功能。在本公开的示例实施例中,关键词识别模块202可以可操作为识别可以经由麦克风206由诸如用户103之类的用户输入或讲出的至少一个关键词。在识别至少一个关键词时,关键词识别模块202可以可操作为建立在关键词识别模块202和数据处理设备202中的关键词服务模块232之间的第一连接220,以用于语音接口操作。关键词识别模块202然后可以经由建立的第一连接220将可能在至少一个关键词的识别之后被接收的音频数据传输到关键词服务模块232,以用于语音接口操作。
在免提设备101中的关键词配置模块204可包括合适的逻辑、电路系统、接口和/或代码,其可以可操作为提供用于免提设备101的关键词配置功能。在本公开的示例实施例中,关键词配置模块204可以可操作为利用至少一个关键词配置关键词识别模块202。
在数据处理设备102中的处理器238可包括合适的逻辑、电路系统、接口和/或代码,其可以可操作为管理和/或控制在数据处理设备102中的各种部件(诸如例如语音接口模块234、用户接口模块236、关键词服务模块232和/或其它部件)的操作。处理器238可利用其使得能够执行各种应用的操作系统。处理器238可实现用于与例如免提设备101通信的一个或多个通信协议。
在数据处理设备102中的存储器240可包括合适的逻辑、电路系统、接口和/或代码,其可以可操作为存储其可由例如处理器238、语音接口模块234、用户接口模块236和/或关键词服务模块232利用的诸如可执行指令和/或数据之类的信息。存储器240可包括RAM、ROM、诸如闪速存储器之类的低延迟非易失存储器和/或其它合适的电子数据存储。
在数据处理设备102中的语音接口模块234可包括合适的逻辑、电路系统、接口和/或代码,其可以可操作为提供用于数据处理设备102的语音接口功能。在本公开的示例实施例中,语音接口模块234可以基于从免提设备101传达的至少一个关键词,由关键词服务模块232激活或启动以用于语音接口操作。在免提设备101中的关键词配置操作期间,语音接口模块234可以可操作为记录其可以经由免提设备101从诸如用户103之类的用户接收的至少一个关键词。语音接口模块234可以可操作为将记录的至少一个关键词经由第二连接230发送或传输到免提设备101中的关键词配置模块204。关键词配置模块204然后可以利用记录的至少一个关键词来执行关键词识别模块202的配置。
在数据处理设备102中的用户接口模块236可包括合适的逻辑、电路系统、接口和/或代码,其可以可操作为提供用于数据处理设备102的用户接口功能。在免提设备101中的关键词配置操作期间,用户接口模块236可以可操作为从诸如用户103之类的用户接收用于关键词配置的一个或多个请求。
在数据处理设备102中的关键词服务模块232可包括合适的逻辑、电路系统、接口和/或代码,其可以可操作为启动或触发语音接口模块234以用于语音接口操作。在本公开的示例实施例中,在关键词服务模块232和免提设备101中的关键词识别模块202之间建立第一连接220的情况下,关键词服务模块232可以可操作为启动语音接口模块234。关键词服务模块232然后可以可操作为将经由第一连接220接收的音频数据传递到语音接口模块234以用于语音接口操作。
在操作中,在免提设备101中的关键词识别模块202可以已经被配置用于识别至少一个关键词。关键词识别模块202可以可操作为针对至少一个关键词的出现而监控至少一个音频流,至少一个音频流可经由免提设备101中的麦克风206被接收。在识别至少一个关键词时,关键词识别模块202可以可操作为建立在关键词识别模块202和数据处理设备102中的关键词服务模块232之间的第一连接220。在第一连接220建立之后,关键词服务模块232然后可以启动数据处理设备102中的语音接口模块234。关键词识别模块202可以可操作为将可以在识别至少一个关键词之后经由麦克风206被接收的音频数据经由建立的第一连接220发送到语音接口模块234。语音接口模块234然后可以对发送的音频数据做出响应以用于语音接口操作。在这一点上,在对应于建立第一连接220的时间间隔期间,关键词识别模块202可以可操作为在例如存储器210中缓冲将被发送到语音接口模块234的音频数据。
在用于使免提设备101能够识别至少一个关键词的关键词配置操作期间,在免提设备101中的处理器208可以可操作为将可由用户103经由麦克风206输入或讲出的至少一个关键词发送到数据处理设备102。在数据处理设备102中的处理器238然后可以将接收的由用户103输入的至少一个关键词传递到语音接口模块234。语音接口模块234可以记录由用户103输入的至少一个关键词。关键词配置模块204然后可以可操作为经由第二连接230从语音接口模块234接收记录的至少一个关键词。关键词配置模块204然后可以可操作为利用记录的至少一个关键词来执行关键词识别模块202的配置,以用于关键词识别模块202来识别在至少一个接收的音频流中的至少一个关键词。在这一点上,例如,关键词配置模块204可以将记录的至少一个关键词转换为关键词识别模块202所要求的形式。
在本公开的示例实施例中,在数据处理设备102经由用户接口模块236接收来自用户103的用于关键词配置的请求,并且语音接口模块234基于从用户103接收的请求而使得免提设备101进入关键词配置操作的情况下,免提设备101可以可操作为进入关键词配置操作。例如,语音接口模块234可以通过指令或命令免提设备101开始将诸如至少一个关键词之类的音频数据发送到数据处理设备102而使得免提设备101进入关键词配置操作。
免提设备101还可以可操作为在如下情况下进入关键词配置操作:免提设备101第一次耦合或连接到数据处理设备102,在数据处理设备102中的处理器238发现免提设备101能够针对至少一个关键词的出现而监控至少一个接收的音频流,处理器238确定免提设备101尚未被配置用于识别至少一个关键词,且处理器238通过经由用户接口模块236提示和请求用户103经由免提设备101中的麦克风206输入或讲出至少一个关键词而使得免提设备101进入关键词配置操作。在这一点上,处理器238可以与关键词配置模块204通信或连接,以查询关键词识别模块202是否已被配置。在关键词配置模块204报告回关键词识别模块202尚未被配置的情况下,处理器238可以确定免提设备101尚未被配置用于识别至少一个关键词。在处理器238确定免提设备101已被配置用于识别至少一个关键词的情况下,处理器238可以启用关键词配置接口,以允许用户103经由关键词配置操作记录至少一个关键词,而不请求用户103经由免提设备101中的麦克风206输入或讲出至少一个关键词。
在本公开的示例实施例中,语音接口模块234可例如在存储器240中存储或保持记录的至少一个关键词,以允许用户103在随后的关键词配置操作中再使用被存储的至少一个关键词。在这种情况下,用户103可以切换回到之前使用的关键词,而无须从头开始记录关键词。在将记录的至少一个关键词经由第二连接230发送到免提设备101中的关键词配置模块204以用于关键词配置之前,语音接口模块234可以重新播放记录的至少一个关键词以用于用户103复核。用户103可以经由免提设备101中的扬声器212听到或复核记录的至少一个关键词。作为用户103复核记录的至少一个关键词的结果,数据处理设备102可以接收从用户103经由用户接口模块236传达或接收的指示。指示可以包括例如记录的至少一个关键词的接受、记录的至少一个关键词的拒绝、或关键词配置操作的取消。
在本公开的另一示例实施例中,免提设备101可包括其可以在工厂环境中被硬编码到免提设备101中(例如,被硬编码在存储器210中)的至少一个关键词。免提设备101还可以包括例如至少一个关键词中的每个关键词的至少一个口音版本,其中至少一个关键词中的每个关键词的至少一个口音版本可以在工厂环境中被硬编码到免提设备101中(例如,被硬编码在存储器210中)。在这一点上,在关键词配置操作期间,用户103可以被允许例如基于用户103的口音,从至少一个关键词中的每个关键词的至少一个口音版本之中选择至少一个新关键词。例如,用户103可以选择其可以匹配他/她的口音的至少一个新关键词。
免提设备101还可以包括至少一个关键词中的每个关键词的至少一个版本,其中至少一个关键词中的每个关键词的至少一个版本可以在工厂环境中被硬编码到免提设备101中(例如,被硬编码在存储器210中),且至少一个版本可以分别对应于数据处理设备102的至少一个设备类型。在这一点上,在关键词配置操作期间,用户103可以被允许例如基于数据处理设备102的设备类型,从至少一个关键词中的每个关键词的至少一个版本之中选择至少一个新关键词。例如,在数据处理设备102是智能电话的情况下,用户103可以选择包括“电话”的关键词版本。在数据处理设备102是平板电脑的情况下,用户103可以选择包括“平板电脑”的关键词版本。
图3为图示依照本公开的实施例的具有连续关键词识别的示例蓝牙免提设备的框图。参考图3,示出了蓝牙免提设备301和数据处理设备303。蓝牙免提设备301可以经由蓝牙无线通信与数据处理设备302耦合。蓝牙免提设备301可以包括处理器308、存储器310、麦克风306、扬声器312、关键词识别模块302和关键词配置模块304。数据处理设备303可以包括处理器338、存储器340、语音接口模块334、用户接口模块336和关键词服务模块332。在本公开的示例实施例中,蓝牙免提设备301可以包括例如蓝牙耳麦。在这种情况下,扬声器312可以包括听筒(earphone)。
在蓝牙免提设备301中的处理器308可包括合适的逻辑、电路系统、接口和/或代码,其可以可操作为管理和/或控制在蓝牙免提设备301中的各种部件(诸如例如麦克风306、扬声器312、关键词识别模块302、关键词配置模块304和/或其它部件)的操作。处理器308可以利用其使得能够执行各种应用的操作系统。处理器308可实现用于与例如数据处理设备303通信的多个蓝牙协议栈307。
在蓝牙免提设备301中的存储器310可包括合适的逻辑、电路系统、接口和/或代码,其可以可操作为存储其可以被例如处理器308、关键词识别模块302和/或关键词配置模块304利用的诸如可执行指令和/或数据之类的信息。存储器310可包括RAM、ROM、诸如闪速存储器之类的低延迟非易失存储器和/或其它合适的电子数据存储。
在蓝牙免提设备301中的麦克风306可包括合适的逻辑、电路系统、接口和/或代码,其可以可操作为将音频波转换为电信号。麦克风306连同扬声器312一起可以使诸如用户103之类的用户能够参与语音对话,以提供音频命令和/或接收音频反馈。
在蓝牙免提设备301中的扬声器312可包括合适的逻辑、电路系统、接口和/或代码,其可以可操作为将电信号转换为音频波。扬声器312连同麦克风306一起可以使诸如用户103之类的用户能够参与语音对话,以提供音频命令和/或接收音频反馈。
在蓝牙免提设备301中的关键词识别模块302可包括合适的逻辑、电路系统、接口和/或代码,其可以可操作为提供用于蓝免提设备301的关键词识别功能。在本公开的示例实施例中,关键词识别模块302可以可操作为识别可以经由麦克风306由诸如用户103之类的用户输入或讲出的至少一个关键词。在识别至少一个关键词时,关键词识别模块302可以可操作为建立在关键词识别模块302和数据处理设备303中的关键词服务模块332之间的第一连接320以用于语音接口操作。关键词识别模块302然后可以经由建立的第一连接320将可以在至少一个关键词的识别之后被接收的音频数据传输到关键词服务模块332以用于语音接口操作。
在蓝牙免提设备301中的关键词配置模块304可包括合适的逻辑、电路系统、接口和/或代码,其可以可操作为提供用于蓝牙免提设备301的关键词配置功能。在本公开的示例实施例中,关键词配置模块304可以可操作为利用至少一个关键词来配置关键词识别模块302。
在数据处理设备303中的处理器338可包括合适的逻辑、电路系统、接口和/或代码,其可以可操作为管理和/或控制在数据处理设备303中的各种部件(诸如例如语音接口模块334、用户接口模块336、关键词服务模块332和/或其它部件)的操作。处理器338可利用其使得能够执行各种应用的操作系统。处理器338可实现用于与例如蓝牙免提设备301通信的多个蓝牙协议栈307。
在数据处理设备303中的存储器340可包括合适的逻辑、电路系统、接口和/或代码,其可以可操作为存储其可被例如处理器338、语音接口模块334、用户接口模块336和/或关键词服务模块332利用的诸如可执行指令和/或数据之类的信息。存储器340可包括RAM、ROM、诸如闪速存储器之类的低延迟非易失存储器和/或其它合适的电子数据存储。
在数据处理设备303中的语音接口模块334可包括合适的逻辑、电路系统、接口和/或代码,其可以可操作为提供用于数据处理设备303的语音接口功能。在本公开的示例实施例中,语音接口模块334可以基于从蓝牙免提设备301传达的至少一个关键词,由关键词服务模块332激活或启动以用于语音接口操作。在蓝牙免提设备301中的关键词配置操作期间,语音接口模块334可以可操作为记录可以经由蓝牙免提设备301从诸如用户103之类的用户接收的至少一个关键词。语音接口模块334可以可操作为将记录的至少一个关键词经由第二连接330发送或传输到在蓝牙免提设备301中的关键词配置模块304。关键词配置模块304然后可以利用记录的至少一个关键词来执行关键词识别模块302的配置。
在数据处理设备303中的用户接口模块336可包括合适的逻辑、电路系统、接口和/或代码,其可以可操作为提供用于数据处理设备303的用户接口功能。在蓝牙免提设备301中的关键词配置操作期间,用户接口模块336可以可操作为从诸如用户103之类的用户接收用于关键词配置的一个或多个请求。
在数据处理设备303中的关键词服务模块332可包括合适的逻辑、电路系统、接口和/或代码,其可以可操作为启动或触发语音接口模块334以用于语音接口操作。在本公开的示例实施例中,在关键词服务模块332和蓝牙免提设备301中的关键词识别模块302之间建立第一连接320的情况下,关键词服务模块332可以可操作为启动语音接口模块334。关键词服务模块332然后可以可操作为将经由第一连接320接收的音频数据传递到语音接口模块334以用于语音接口操作。
在操作中,在蓝牙免提设备301中的关键词识别模块302可以已经被配置用于识别至少一个关键词。关键词识别模块302可以可操作为针对至少一个关键词的出现而监控至少一个音频流,至少一个音频流可以经由蓝牙免提设备301中的麦克风306被接收。在识别至少一个关键词时,关键词识别模块302可以可操作为建立在关键词识别模块302和数据处理设备303中的关键词服务模块332之间的第一连接320。关键词服务模块332然后可以在第一连接320建立之后启动数据处理设备303中的语音接口模块334。关键词识别模块302可以可操作为将其可以在至少一个关键词识别之后经由麦克风306被接收的音频数据经由建立的第一连接320发送到语音接口模块334。语音接口模块334然后可以对发送的音频数据做出响应以用于语音接口操作。在这一点上,在对应于建立第一连接320的时间间隔期间,关键词识别模块302可以可操作为在例如存储器310中缓冲将被发送到语音接口模块334的音频数据。
在用于使蓝牙免提设备301能够识别至少一个关键词的关键词配置操作期间,在蓝牙免提设备301中的处理器308可以可操作为将可以由用户103经由麦克风306输入或讲出的至少一个关键词发送到数据处理设备303。在数据处理设备303中的处理器338然后可以将接收的由用户103输入的至少一个关键词传递到语音接口模块334。语音接口模块334可以记录由用户103输入的至少一个关键词。关键词配置模块304然后可以可操作为从语音接口模块334经由第二连接330接收记录的至少一个关键词。关键词配置模块304然后可以可操作为利用记录的至少一个关键词来执行关键词识别模块302的配置,以用于关键词识别模块302来识别在至少一个接收的音频流中的至少一个关键词。在这一点上,例如,关键词配置模块304可以将记录的至少一个关键词转换为关键词识别模块302要求的形式。
在本公开的示例实施例中,在数据处理设备303经由用户接口模块336接收来自用户103的用于关键词配置的请求,且语音接口模块334基于从用户103接收的请求而使得蓝牙免提设备301进入关键词配置操作的情况下,蓝牙免提设备301可以可操作为进入关键词配置操作。例如,语音接口模块334可通过指令或命令蓝牙免提设备301开始将诸如至少一个关键词之类的音频数据发送到数据处理设备303,而使得蓝牙免提设备301进入关键词配置操作。
蓝牙免提设备301还可以可操作为在如下情况下进入关键词配置操作:蓝牙免提设备301第一次耦合或连接到数据处理设备303,在数据处理设备303中的处理器338发现蓝牙免提设备301能够针对至少一个关键词的出现而监控至少一个接收的音频流,处理器338确定蓝牙免提设备301尚未被配置用于识别至少一个关键词,且处理器338通过经由用户接口模块336提示和请求用户103经由蓝牙免提设备301中的麦克风306输入或讲出至少一个关键词,而使得蓝牙免提设备301进入关键词配置操作。在这一点上,处理器338可利用蓝牙协议栈307中的蓝牙服务发现协议(SDP)309来发现蓝牙免提设备301能够针对至少一个关键词的出现而监控至少一个接收的音频流。处理器338可以与关键词配置模块304通信或连接,以查询关键词识别模块302是否已被配置。在关键词配置模块304报告回关键词识别模块302尚未被配置的情况下,处理器338可确定蓝牙免提设备301尚未被配置用于识别至少一个关键词。在处理器338确定蓝牙免提设备301已被配置用于识别至少一个关键词的情况下,处理器338可以启用关键词配置接口,以允许用户103经由关键词配置操作记录至少一个关键词,而不请求用户103经由蓝牙免提设备301中的麦克风306输入或讲出至少一个关键词。
在本公开的示例实施例中,语音接口模块334可例如在存储器340中存储或保持记录的至少一个关键词,以允许用户103在随后的关键词配置操作中再使用被存储的至少一个关键词。在这种情况下,用户103可以切换回到之前使用的关键词,而无须从头开始记录关键词。在将记录的至少一个关键词经由第二连接330发送到蓝牙免提设备301中的关键词配置模块304以用于关键词配置之前,语音接口模块334可以重新播放记录的至少一个关键词以用于用户103复核。用户103可经由蓝牙免提设备301中的扬声器312听到或复核记录的至少一个关键词。作为用户103复核记录的至少一个关键词的结果,数据处理设备303可接收从用户103经由用户接口模块336传达或接收的指示。指示可包括例如记录的至少一个关键词的接受、记录的至少一个关键词的拒绝、或关键词配置操作的取消。
在本公开的另一示例实施例中,蓝牙免提设备301可包括其可以在工厂环境中被硬编码到蓝牙免提设备301中(例如,被硬编码在存储器310中)的至少一个关键词。蓝牙免提设备301还可以包括例如至少一个关键词中的每个关键词的至少一个口音版本,其中至少一个关键词中的每个关键词的至少一个口音版本可以在工厂环境中被硬编码到蓝牙免提设备301中(例如,被硬编码在存储器310中)。在这一点上,在关键词配置操作期间,用户103可以被允许例如基于用户103的口音,从至少一个关键词中的每个关键词的至少一个口音版本之中选择至少一个新关键词。例如,用户103可选择其可以匹配或接近于他/她的口音的至少一个新关键词。
蓝牙免提设备301还可以包括至少一个关键词中的每个关键词的至少一个版本,其中至少一个关键词中的每个关键词的至少一个版本可以在工厂环境中被硬编码到蓝牙免提设备301中(例如,被硬编码在存储器310中),且至少一个版本可分别对应于至少一个设备类型。在这一点上,在关键词配置操作期间,用户103可以被允许例如基于数据处理设备303的设备类型,从至少一个关键词中的每个关键词的至少一个版本之中选择至少一个新关键词。例如,在数据处理设备303是智能电话的情况下,用户103可选择包括“电话”的关键词版本。在数据处理设备303是平板电脑的情况下,用户103可选择包括“平板电脑”的关键词版本。
图4为图示依照本公开的实施例的用于具有连续关键词识别的免提设备的示例步骤的流程图。参考图4,示例步骤开始于步骤401。在步骤402中,在免提设备101中的关键词配置模块204可以可操作为执行免提设备101中的关键词识别模块202的配置,以用于通过关键词识别模块202识别至少一个关键词。在步骤403中,在免提设备101中的关键词识别模块202可以可操作为针对至少一个关键词的出现而监控至少一个音频流,至少一个音频流可以经由免提设备101中的麦克风206被接收。在步骤404中,在识别至少一个关键词时,在免提设备101中的关键词识别模块202可以可操作为建立在关键词识别模块202和数据处理设备102中的关键词服务模块232之间的诸如第一连接220之类的第一连接,以用于启动在数据处理设备102中的诸如语音接口模块234之类的语音接口。在步骤405中,在免提设备101中的关键词识别模块202可以可操作为经由建立的第一连接220将可以在至少一个关键词的识别之后被接收(例如经由麦克风206)的音频数据发送到数据处理设备102中的语音接口模块234,以用于由数据处理设备102经由语音接口模块234对发送的音频数据做出响应。示例步骤可继续进行到结束步骤406。
图5为图示依照本公开的实施例的用于具有连续关键词识别的蓝牙免提设备的示例步骤的流程图。参考图5,示例步骤开始于步骤501。在步骤502中,在蓝牙免提设备301中的关键词识别模块302可以可操作为针对至少一个关键词的出现而监控至少一个音频流,至少一个音频流可以经由蓝牙免提设备301中的麦克风306被接收。在这一点上,在蓝牙免提设备301中的关键词识别模块302可以已被配置用于识别至少一个关键词。在步骤503中,在识别至少一个关键词时,在蓝牙免提设备301中的关键词识别模块302可以可操作为建立在关键词识别模块302和数据处理设备303中的关键词服务模块332之间的诸如第一连接320之类的第一连接,以用于启动在数据处理设备303中的诸如语音接口模块334之类的语音接口。在步骤504中,在蓝牙免提设备301中的关键词识别模块302可以可操作为经由建立的第一连接320将可以在至少一个关键词的识别之后被接收(例如经由麦克风306)的音频数据发送到数据处理设备303中的语音接口模块334,以用于由数据处理设备303经由语音接口模块334对发送的音频数据做出响应。示例步骤可继续进行到结束步骤505。
图6为图示依照本公开的实施例的用于免提设备的关键词配置的示例步骤的流程图。参考图6,示例步骤开始于步骤601。在步骤602中,免提设备101可以可操作为进入用于免提设备101的关键词配置操作。在这一点上,免提设备101可以在如下情况下进入关键词配置操作:耦合的数据处理设备102经由数据处理设备102中的用户接口模块236接收来自用户103的用于关键词配置的请求,且数据处理设备102中的语音接口模块234基于从用户103接收的请求而使得免提设备101进入关键词配置操作。免提设备101还可以在如下情况下进入关键词配置操作:免提设备101第一次耦合或连接到数据处理设备102,数据处理设备102中的处理器238发现免提设备101能够针对至少一个关键词的出现而监控至少一个接收的音频流,处理器238确定免提设备101尚未被配置用于识别至少一个关键词,且处理器238通过经由用户接口模块236提示和请求用户103在免提设备101中输入或讲出至少一个关键词,而使得免提设备101进入关键词配置操作。在步骤603中,免提设备101可以可操作为经由免提设备101中的麦克风206而输入至少一个关键词。在步骤604中,免提设备101中的处理器208可以可操作为将输入的至少一个关键词发送到数据处理设备102,以用于通过数据处理设备102中的语音接口模块234记录输入的至少一个关键词。在步骤605中,免提设备101中的关键词配置模块204然后可以可操作为接收来自数据设备102中的语音接口模块234的记录的至少一个关键词。在步骤606中,免提设备101中的关键词配置模块204然后可以可操作为利用记录的至少一个关键词来执行免提设备101中关键词识别模块202的配置,以用于关键词识别模块202识别在至少一个接收的音频流中的至少一个关键词。示例步骤可继续进行到结束步骤607。
图7为图示依照本公开的实施例的用于蓝牙免提设备的关键词配置的示例步骤的流程图。参考图7,示例步骤开始于步骤701。在步骤702中,蓝牙免提设备301可以可操作为进入用于蓝牙免提设备301的关键词配置操作。在这一点上,蓝牙免提设备301可以在如下情况下进入关键词配置操作:耦合的数据处理设备303经由数据处理设备303中的用户接口模块236接收来自用户103用于关键词配置的请求,且数据处理设备303中的语音接口模块334基于从用户103接收的请求而使得蓝牙免提设备301进入关键词配置操作。蓝牙免提设备301还可以在如下情况下进入关键词配置操作:蓝牙免提设备301第一次耦合或连接到数据处理设备303,数据处理设备303中的处理器338发现(例如利用蓝牙服务发现协议)蓝牙免提设备301能够针对至少一个关键词的出现而监控至少一个接收的音频流,处理器338确定蓝牙免提设备301尚未被配置用于识别至少一个关键词,且处理器338通过经由用户接口模块336提示和请求用户103在蓝牙免提设备301中输入或讲出至少一个关键词,而使得蓝牙免提设备301进入关键词配置操作。在步骤703中,蓝牙免提设备301可以可操作为经由蓝牙免提设备301中的麦克风306而输入至少一个关键词。在步骤704中,蓝牙免提设备301中的处理器308可以可操作为将输入的至少一个关键词发送到数据处理设备303,以用于通过数据处理设备303中的语音接口模块334记录输入的至少一个关键词。在步骤705中,蓝牙免提设备301中的关键词配置模块304然后可以可操作为接收来自数据设备303中的语音接口模块334的记录的至少一个关键词。在步骤706中,蓝牙免提设备301中的关键词配置模块304然后可以可操作为利用记录的至少一个关键词来执行蓝牙免提设备301中关键词识别模块302的配置,以用于关键词识别模块302识别在至少一个接收的音频流中的至少一个关键词。示例步骤可继续进行到结束步骤707。
图8为图示依照本公开的实施例的在工厂环境中硬编码到免提设备中的关键词的示例情景的框图。参考图8,示出了在工厂环境801中的免提设备101。免提设备101可以如关于例如图2所描述的。
在示例操作中,免提设备101可包括其可以在工厂环境801中被硬编码到免提设备101中(例如,被硬编码在存储器210中)的至少一个关键词802。免提设备101还可以包括例如至少一个关键词802中的每个关键词802的至少一个口音版本803,其中至少一个关键词802中的每个关键词802的至少一个口音版本803可以在工厂环境801中被硬编码到免提设备101中(例如,被硬编码在存储器210中)。在这一点上,在免提设备101的关键词配置操作期间,诸如用户103之类的用户可以被允许例如基于用户103的口音,从至少一个关键词802中的每个关键词802的至少一个口音版本803之中选择至少一个新关键词。例如,用户103可选择其可以与他/她的口音匹配的新关键词。
免提设备101还可以包括至少一个关键词802中的每个关键词802的至少一个版本804,其中至少一个关键词802中的每个关键词802的至少一个版本804可以在工厂环境801中被硬编码到免提设备101中(例如,被硬编码在存储器210中),并且至少一个版本804可分别对应于诸如数据处理设备102之类的数据处理设备的至少一种设备类型。在这一点上,在免提设备101的关键词配置操作期间,用户103可以被允许例如基于数据处理设备102的设备类型,从至少一个关键词802中的每个关键词802的至少一个版本804之中选择至少一个新关键词。例如,在数据处理设备102是智能电话的情况下,用户103可以选择包含“电话”的关键词版本。在数据处理设备102是平板电脑的情况下,用户103可以选择包含“平板电脑”的关键词版本。
在本公开的各种实施例中,免提设备101可被耦合或连接到数据处理设备102。在免提设备101中的关键词识别模块202可以已被配置为识别至少一个关键词。关键词识别模块202可以可操作为针对至少一个关键词的出现而监控至少一个音频流,至少一个音频流可以经由免提设备101中的麦克风206来接收。在识别至少一个关键词时,关键词识别模块202可以可操作为建立在关键词识别模块202和数据处理设备102中的关键词服务模块232之间的第一连接220,以用于通过数据处理设备102中的关键词服务模块232启动语音接口模块234。关键词识别模块202可以可操作为经由建立的第一连接220将可以在识别至少一个关键词之后经由麦克风206接收的音频数据发送到语音接口模块234,以用于由数据处理设备102经由语音接口模块234对发送的音频数据做出响应。在这一点上,在对应于建立第一连接220的时间间隔期间,关键词识别模块202可以可操作为例如在免提设备101中的存储器210中缓冲将被发送到语音接口模块234的音频数据。
在用于使得免提设备101能够识别至少一个关键词的关键词配置操作期间,免提设备101可以可操作为经由免提设备101中的麦克风206输入至少一个关键词。免提设备101可以可操作为将输入的至少一个关键词发送到数据处理设备102,以用于由数据处理设备102中的语音接口模块234记录输入的至少一个关键词。在免提设备101中的关键词配置模块204然后可以可操作为经由第二连接230接收来自语音接口模块234的记录的至少一个关键词。关键词配置模块204然后可以可操作为利用记录的至少一个关键词来执行关键词识别模块202的配置,以用于关键词识别模块202识别至少一个接收的音频流中的至少一个关键词。
在本公开的示例实施例中,免提设备101可以可操作为在如下情况下进入关键词配置操作:数据处理设备102接收用于关键词配置的请求,并且语音接口模块234基于接收的请求而使得免提设备101进入关键词配置操作。
免提设备101还可以可操作为在如下情况下进入关键词配置操作:免提设备101第一次与数据处理设备102耦合或者连接,数据处理设备102发现免提设备101能够针对至少一个关键词的出现而监控至少一个接收的音频流,数据处理设备102确定了免提设备101尚未被配置为识别至少一个关键词,并且数据处理设备102通过提示和请求经由免提设备101中的麦克风206输入至少一个关键词而使得提设备101进入关键词配置操作。在数据处理设备102确定免提设备101已经被配置为识别至少一个关键词的情况下,数据处理设备102可以启用关键词配置接口,以允许经由关键词配置操作来记录至少一个关键词,而不请求经由免提设备101中的麦克风206输入至少一个关键词。
在本公开的示例实施例中,在数据处理设备102中的语音接口模块234可例如在数据处理设备102中的存储器240中存储或保持记录的至少一个关键词,以允许在随后的关键词配置操作中再使用存储的至少一个关键词。在将记录的至少一个关键词经由第二连接230发送到免提设备101中的关键词配置模块204以用于关键词配置之前,数据处理设备102中的语音接口模块234可重新播放记录的至少一个关键词以用于复核。作为记录的至少一个关键词的复核的结果,数据处理设备102可经由例如用户接口模块236接收指示。指示可包括例如记录的至少一个关键词的接受、记录的至少一个关键词的拒绝、或关键词配置操作的取消。
在本公开的另一示例实施例中,免提设备101可包括其可以在工厂环境801中被硬编码到免提设备101中(例如,被硬编码在存储器210中)的至少一个关键词802。免提设备101还可以包括例如至少一个关键词802中的每个关键词802的至少一个口音版本803,其中至少一个关键词802中的每个关键词802的至少一个口音版本803可以在工厂环境801中被硬编码到免提设备101中(例如,被硬编码在存储器210中)。在这一点上,在关键词配置操作期间,可以允许从至少一个关键词802中的每个关键词802的至少一个口音版本803之中选择至少一个新的关键词。
免提设备101还可以包括至少一个关键词802中的每个关键词802的至少一个版本804,其中至少一个关键词802中的每个关键词802的至少一个版本804可以在工厂环境801中被硬编码到免提设备101中(例如,被硬编码在存储器210中),且至少一个版本804可以分别对应于数据处理设备102的至少一种设备类型。在这一点上,在关键词配置操作期间,可以允许从至少一个关键词802中的每个关键词802的至少一个版本804之中选择至少一个新的关键词。
在本公开的一些实施例中,免提设备101可以包括蓝牙免提设备301。蓝牙免提设备301可以经由蓝牙通信被耦合到数据处理设备303。在蓝牙免提设备301中的关键词识别模块302可以已被配置用于识别至少一个关键词。在这种情况下,关键词识别模块302可以可操作为针对至少一个关键词的出现而监控可以经由蓝牙免提设备301中的麦克风306而被接收的至少一个音频流。在识别至少一个关键词时,关键词识别模块302可以可操作为建立在关键词识别模块302和数据处理设备303中的关键词服务模块332之间的第一连接320,以用于通过数据处理设备303中的关键词服务模块332启动语音接口模块334。关键词识别模块302可以可操作为经由建立的第一连接320将可以在至少一个关键词的识别之后经由麦克风306接收的音频数据发送到语音接口模块334,以用于由数据处理设备303经由语音接口模块334对发送的音频数据做出响应。
在用于使蓝牙免提设备301能够识别至少一个关键词的关键词配置操作期间,蓝牙免提设备301可以可操作为经由蓝牙免提设备301中的麦克风306输入至少一个关键词。蓝牙免提设备301可以可操作为将输入的至少一个关键词发送到数据处理设备303,以用于通过数据处理设备303中的语音接口模块334记录输入的至少一个关键词。蓝牙免提设备301中的关键词配置模块304然后可以可操作为经由第二连接330从语音接口模块334接收记录的至少一个关键词。关键词配置模块304然后可以可操作为利用记录的至少一个关键词来执行关键词识别模块302的配置,以用于关键词识别模块302识别至少一个接收的音频流中的至少一个关键词。
蓝牙免提设备301可以可操作为在如下情况下进入关键词配置操作:蓝牙免提设备301第一次耦合或连接到数据处理设备303,数据处理设备303发现蓝牙免提设备301能够针对至少一个关键词的出现而监控至少一个接收的音频流,数据处理设备303确定蓝牙免提设备301尚未被配置用于识别至少一个关键词,且数据处理设备303通过提示和请求经由蓝牙免提设备301中的麦克风306输入至少一个关键词,而使得蓝牙免提设备301进入关键词配置操作。在这一点上,数据处理设备303中的处理器338可以利用蓝牙服务发现协议(SDP)309来发现蓝牙免提设备301能够针对至少一个关键词的出现而监控至少一个接收的音频流。
本公开的其它实施例可提供非瞬态计算机可读介质和/或存储介质,和/或非瞬态机器可读介质和/或存储介质,在其上已存储了具有可由机器和/或计算机执行的至少一个代码部分的机器代码和/或计算机程序,由此使得机器和/或计算机执行如本文中描述的用于具有连续关键词识别的免提设备的步骤。
据此,本公开的方面可以在硬件、软件或硬件和软件的组合中被实现。本公开的方面可以以集中方式实现在至少一个计算机系统中,或以分布式方式(其中不同元件遍布若干互联的计算机系统)来实现。适于执行本文描述的方法的任何种类的计算机系统或其它装置是合适的。硬件和软件的典型组合可以是具有计算机程序的通用计算机系统,该计算机程序当被加载和执行时,控制计算机系统使得它执行本文描述的方法。
本公开的方面还可以嵌入在计算机程序产品中,其包括使得能够实施本文描述的方法的所有特征,且当被加载在计算机系统中时其能够执行这些方法。在本上下文中的计算机程序意指指令集以任何语言、代码或符号的任何表达,该指令集旨在于使得具有信息处理能力的系统直接或在以下项的任一者或两者之后执行特定功能:a)转换为另一种语言、代码或符号;b)以不同的材料形式复制。
尽管本公开已参考某些实施例进行描述,将由本领域的技术人员理解的是,可作出各种改变且等效物可替代,而不脱离本公开的范围。此外,可作出许多修改,以使特定条件或材料适于本公开的教导而不脱离它的范围。因此,旨在的是,本公开不限于公开的特定实施例,而是本公开将包含落在所附权利要求的范围内的所有实施例。
Claims (20)
1.一种计算机实现的方法,包括:
由第一设备接收特定音频数据,所述第一设备(i)包括被配置用于识别音频数据中的特定关键词的可能出现的关键词识别器,并且(ii)不包括用于对语音命令做出响应的语音接口;
由(i)包括所述关键词识别器并且(ii)不包括语音接口的所述第一设备上的所述关键词识别器,确定所述特定关键词可能出现在所述特定音频数据的初始部分中;以及
响应于由(i)包括所述关键词识别器并且(ii)不包括语音接口的所述第一设备上的所述关键词识别器确定所述特定关键词可能出现在所述特定音频数据的所述初始部分中,由所述第一设备向包括用于对语音命令做出响应的语音接口的第二设备传输所述特定音频数据的另一部分,以用于由所述第二设备中包括的所述语音接口进行处理。
2.根据权利要求1所述的方法,其中确定所述特定关键词可能出现在所述特定音频数据的初始部分中包括:确定所述特定音频数据的所述初始部分包括被硬编码在所述第一设备的存储器中的所述特定关键词。
3.根据权利要求1所述的方法,其中所述特定关键词是用户定义的关键词。
4.根据权利要求1所述的方法,其中确定所述特定关键词可能出现在所述特定音频数据的初始部分中包括:确定所述特定音频数据的所述初始部分包括热词。
5.根据权利要求1所述的方法,其中确定所述特定关键词可能出现在所述特定音频数据的初始部分中包括:确定所述特定音频数据的所述初始部分包括与一个或多个语音命令相关联的特定关键词。
6.根据权利要求1所述的方法,包括:由所述第一设备上实现的语音识别器执行针对所述特定音频数据的语音识别。
7.根据权利要求1所述的方法,其中所述第一设备上实现的所述语音识别器包括连续语音识别器。
8.一种系统,包括:
一个或多个计算机以及存储指令的一个或多个存储设备,所述指令当由所述一个或多个计算机执行时能够使得所述一个或多个计算机执行操作,所述操作包括:
由第一设备接收特定音频数据,所述第一设备(i)包括被配置用于识别音频数据中的特定关键词的可能出现的关键词识别器,并且(ii)不包括用于对语音命令做出响应的语音接口;
由(i)包括所述关键词识别器并且(ii)不包括语音接口的所述第一设备上的所述关键词识别器,确定所述特定关键词可能出现在所述特定音频数据的初始部分中;以及
响应于由(i)包括所述关键词识别器并且(ii)不包括语音接口的所述第一设备上的所述关键词识别器确定所述特定关键词可能出现在所述特定音频数据的所述初始部分中,由所述第一设备向包括用于对语音命令做出响应的语音接口的第二设备传输所述特定音频数据的另一部分,以用于由所述第二设备中包括的所述语音接口进行处理。
9.根据权利要求8所述的系统,其中确定所述特定关键词可能出现在所述特定音频数据的初始部分中包括:确定所述特定音频数据的所述初始部分包括被硬编码在所述第一设备的存储器中的所述特定关键词。
10.根据权利要求8所述的系统,其中所述特定关键词是用户定义的关键词。
11.根据权利要求8所述的系统,其中确定所述特定关键词可能出现在所述特定音频数据的初始部分中包括确定所述特定音频数据的所述初始部分包括热词。
12.根据权利要求8所述的系统,其中确定所述特定关键词可能出现在所述特定音频数据的初始部分中包括:确定所述特定音频数据的所述初始部分包括与一个或多个语音命令相关联的特定关键词。
13.根据权利要求8所述的系统,包括:由所述第一设备上实现的语音识别器执行针对所述特定音频数据的语音识别。
14.根据权利要求13所述的系统,其中所述第一设备上实现的所述语音识别器包括连续语音识别器。
15.一种非瞬态计算机可读介质,存储包括能够由一个或多个计算机执行的指令的软件,在所述执行时所述指令使得所述一个或多个计算机执行操作,所述操作包括:
由第一设备接收特定音频数据,所述第一设备(i)包括被配置用于识别音频数据中的特定关键词的可能出现的关键词识别器,并且(ii)不包括用于对语音命令做出响应的语音接口;
由(i)包括所述关键词识别器并且(ii)不包括语音接口的所述第一设备上的所述关键词识别器,确定所述特定关键词可能出现在所述特定音频数据的初始部分中;以及
响应于由(i)包括所述关键词识别器并且(ii)不包括语音接口的所述第一设备上的所述关键词识别器确定所述特定关键词可能出现在所述特定音频数据的所述初始部分中,由所述第一设备向包括用于对语音命令做出响应的语音接口的第二设备传输所述特定音频数据的另一部分,以用于由所述第二设备中包括的所述语音接口进行处理。
16.根据权利要求15所述的介质,其中确定所述特定关键词可能出现在所述特定音频数据的初始部分中包括:确定所述特定音频数据的所述初始部分包括被硬编码在所述第一设备的存储器中的所述特定关键词。
17.根据权利要求15所述的介质,其中所述特定关键词是用户定义的关键词。
18.根据权利要求15所述的介质,其中确定所述特定关键词可能出现在所述特定音频数据的初始部分中包括:确定所述特定音频数据的所述初始部分包括热词。
19.根据权利要求15所述的介质,其中确定所述特定关键词可能出现在所述特定音频数据的初始部分中包括:确定所述特定音频数据的所述初始部分包括与一个或多个语音命令相关联的特定关键词。
20.根据权利要求15所述的介质,包括:由所述第一设备上实现的语音识别器执行针对所述特定音频数据的语音识别。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US13/632,723 | 2012-10-01 | ||
US13/632,723 US8468023B1 (en) | 2012-10-01 | 2012-10-01 | Handsfree device with countinuous keyword recognition |
US13/889,502 US9214155B2 (en) | 2012-10-01 | 2013-05-08 | Handsfree device with countinuous keyword recognition |
US13/889,502 | 2013-05-08 | ||
CN201380060748.4A CN104798031B (zh) | 2012-10-01 | 2013-09-19 | 用于耦合到数据处理设备的免提设备的方法和系统 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201380060748.4A Division CN104798031B (zh) | 2012-10-01 | 2013-09-19 | 用于耦合到数据处理设备的免提设备的方法和系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN108196821A true CN108196821A (zh) | 2018-06-22 |
CN108196821B CN108196821B (zh) | 2019-06-04 |
Family
ID=48578204
Family Applications (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201380060748.4A Active CN104798031B (zh) | 2012-10-01 | 2013-09-19 | 用于耦合到数据处理设备的免提设备的方法和系统 |
CN201710367355.8A Active CN107340988B (zh) | 2012-10-01 | 2013-09-19 | 具有连续关键词识别的免提设备 |
CN201810118789.9A Active CN108196821B (zh) | 2012-10-01 | 2013-09-19 | 具有连续关键词识别的免提设备 |
Family Applications Before (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201380060748.4A Active CN104798031B (zh) | 2012-10-01 | 2013-09-19 | 用于耦合到数据处理设备的免提设备的方法和系统 |
CN201710367355.8A Active CN107340988B (zh) | 2012-10-01 | 2013-09-19 | 具有连续关键词识别的免提设备 |
Country Status (4)
Country | Link |
---|---|
US (3) | US8468023B1 (zh) |
EP (2) | EP2904486B1 (zh) |
CN (3) | CN104798031B (zh) |
WO (1) | WO2014055260A1 (zh) |
Families Citing this family (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9460735B2 (en) * | 2013-12-28 | 2016-10-04 | Intel Corporation | Intelligent ancillary electronic device |
CN103714680A (zh) * | 2013-12-31 | 2014-04-09 | 京东方科技集团股份有限公司 | 家用电器及其控制方法、家用电器系统 |
CN104394276A (zh) * | 2014-11-28 | 2015-03-04 | 深圳市中兴移动通信有限公司 | 一种移动终端及其在通话中自动免提的方法和装置 |
US10199041B2 (en) | 2014-12-30 | 2019-02-05 | Honeywell International Inc. | Speech recognition systems and methods for maintenance repair and overhaul |
CN105472152A (zh) * | 2015-12-03 | 2016-04-06 | 广东小天才科技有限公司 | 一种智能终端自动接听电话的方法系统 |
US9961435B1 (en) * | 2015-12-10 | 2018-05-01 | Amazon Technologies, Inc. | Smart earphones |
US10311876B2 (en) | 2017-02-14 | 2019-06-04 | Google Llc | Server side hotwording |
CN107492376A (zh) * | 2017-07-07 | 2017-12-19 | 佛山科学技术学院 | 一种基于智能耳塞的声音识别系统及其识别方法 |
CN108428452B (zh) * | 2018-03-14 | 2019-12-13 | 百度在线网络技术(北京)有限公司 | 终端支架和远场语音交互系统 |
DE102018209822A1 (de) * | 2018-06-18 | 2019-12-19 | Sivantos Pte. Ltd. | Verfahren zur Steuerung der Datenübertragung zwischen zumindest einem Hörgerät und einem Peripheriegerät eines Hörgerätesystems sowie Hörgerät |
DE102018209824A1 (de) * | 2018-06-18 | 2019-12-19 | Sivantos Pte. Ltd. | Verfahren zur Steuerung der Datenübertragung zwischen zumindest einem Hörgerät und einem Peripheriegerät eines Hörgerätesystems sowie Hörgerät |
US11264029B2 (en) * | 2019-01-05 | 2022-03-01 | Starkey Laboratories, Inc. | Local artificial intelligence assistant system with ear-wearable device |
US11264035B2 (en) | 2019-01-05 | 2022-03-01 | Starkey Laboratories, Inc. | Audio signal processing for automatic transcription using ear-wearable device |
EP4184949A1 (en) * | 2019-04-17 | 2023-05-24 | Oticon A/s | A hearing device comprising a transmitter |
US20210168578A1 (en) * | 2020-12-23 | 2021-06-03 | Intel Corporation | Apparatus, system and method of communicating audio traffic over a bluetooth link |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6006185A (en) * | 1997-05-09 | 1999-12-21 | Immarco; Peter | System and device for advanced voice recognition word spotting |
US6023676A (en) * | 1996-12-12 | 2000-02-08 | Dspc Israel, Ltd. | Keyword recognition system and method |
US7542787B2 (en) * | 2002-09-24 | 2009-06-02 | At&T Intellectual Property I, L. P. | Apparatus and method for providing hands-free operation of a device |
CN101715018A (zh) * | 2009-11-03 | 2010-05-26 | 沈阳晨讯希姆通科技有限公司 | 手机功能的语音控制方法 |
CN102194454A (zh) * | 2010-03-05 | 2011-09-21 | 富士通株式会社 | 用于检测连续语音中的关键词的设备和方法 |
Family Cites Families (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2000058942A2 (en) * | 1999-03-26 | 2000-10-05 | Koninklijke Philips Electronics N.V. | Client-server speech recognition |
US6408272B1 (en) * | 1999-04-12 | 2002-06-18 | General Magic, Inc. | Distributed voice user interface |
KR20010094229A (ko) * | 2000-04-04 | 2001-10-31 | 이수성 | 전화기의 음성인식 조작 방법 및 시스템 |
US6889191B2 (en) * | 2001-12-03 | 2005-05-03 | Scientific-Atlanta, Inc. | Systems and methods for TV navigation with compressed voice-activated commands |
US20040003136A1 (en) * | 2002-06-27 | 2004-01-01 | Vocollect, Inc. | Terminal and method for efficient use and identification of peripherals |
JP2004233793A (ja) * | 2003-01-31 | 2004-08-19 | Toshiba Corp | 電子機器および同機器で用いられる遠隔制御方法 |
CN100345085C (zh) * | 2004-12-30 | 2007-10-24 | 中国科学院自动化研究所 | 基于玩家姿势和语音的电子游戏场景和角色控制方法 |
US20080037727A1 (en) * | 2006-07-13 | 2008-02-14 | Clas Sivertsen | Audio appliance with speech recognition, voice command control, and speech generation |
US7280849B1 (en) | 2006-07-31 | 2007-10-09 | At & T Bls Intellectual Property, Inc. | Voice activated dialing for wireless headsets |
US7957972B2 (en) * | 2006-09-05 | 2011-06-07 | Fortemedia, Inc. | Voice recognition system and method thereof |
US8260618B2 (en) * | 2006-12-21 | 2012-09-04 | Nuance Communications, Inc. | Method and apparatus for remote control of devices through a wireless headset using voice activation |
JP4347383B2 (ja) * | 2007-01-12 | 2009-10-21 | パナソニック株式会社 | 携帯端末の音声認識制御方法及び無線通信システム |
US9026447B2 (en) * | 2007-11-16 | 2015-05-05 | Centurylink Intellectual Property Llc | Command and control of devices and applications by voice using a communication base system |
US8099289B2 (en) * | 2008-02-13 | 2012-01-17 | Sensory, Inc. | Voice interface and search for electronic devices including bluetooth headsets and remote systems |
KR20090107365A (ko) | 2008-04-08 | 2009-10-13 | 엘지전자 주식회사 | 이동 단말기 및 그 메뉴 제어방법 |
US8498425B2 (en) * | 2008-08-13 | 2013-07-30 | Onvocal Inc | Wearable headset with self-contained vocal feedback and vocal command |
WO2010078386A1 (en) * | 2008-12-30 | 2010-07-08 | Raymond Koverzin | Power-optimized wireless communications device |
US20100304783A1 (en) * | 2009-05-29 | 2010-12-02 | Logan James R | Speech-driven system with headset |
US8438659B2 (en) * | 2009-11-05 | 2013-05-07 | Vocollect, Inc. | Portable computing device and headset interface |
-
2012
- 2012-10-01 US US13/632,723 patent/US8468023B1/en active Active
-
2013
- 2013-05-08 US US13/889,502 patent/US9214155B2/en active Active
- 2013-09-19 EP EP13773968.6A patent/EP2904486B1/en active Active
- 2013-09-19 CN CN201380060748.4A patent/CN104798031B/zh active Active
- 2013-09-19 EP EP16188850.8A patent/EP3139265A1/en not_active Withdrawn
- 2013-09-19 WO PCT/US2013/060690 patent/WO2014055260A1/en active Application Filing
- 2013-09-19 CN CN201710367355.8A patent/CN107340988B/zh active Active
- 2013-09-19 CN CN201810118789.9A patent/CN108196821B/zh active Active
-
2015
- 2015-11-13 US US14/940,532 patent/US9824685B2/en active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6023676A (en) * | 1996-12-12 | 2000-02-08 | Dspc Israel, Ltd. | Keyword recognition system and method |
US6006185A (en) * | 1997-05-09 | 1999-12-21 | Immarco; Peter | System and device for advanced voice recognition word spotting |
US7542787B2 (en) * | 2002-09-24 | 2009-06-02 | At&T Intellectual Property I, L. P. | Apparatus and method for providing hands-free operation of a device |
CN101715018A (zh) * | 2009-11-03 | 2010-05-26 | 沈阳晨讯希姆通科技有限公司 | 手机功能的语音控制方法 |
CN102194454A (zh) * | 2010-03-05 | 2011-09-21 | 富士通株式会社 | 用于检测连续语音中的关键词的设备和方法 |
Also Published As
Publication number | Publication date |
---|---|
US20140095163A1 (en) | 2014-04-03 |
US8468023B1 (en) | 2013-06-18 |
CN104798031A (zh) | 2015-07-22 |
US9214155B2 (en) | 2015-12-15 |
EP3139265A1 (en) | 2017-03-08 |
WO2014055260A1 (en) | 2014-04-10 |
US9824685B2 (en) | 2017-11-21 |
EP2904486A1 (en) | 2015-08-12 |
CN107340988A (zh) | 2017-11-10 |
US20160071514A1 (en) | 2016-03-10 |
CN108196821B (zh) | 2019-06-04 |
EP2904486B1 (en) | 2019-01-02 |
CN104798031B (zh) | 2018-02-13 |
CN107340988B (zh) | 2020-10-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104798031B (zh) | 用于耦合到数据处理设备的免提设备的方法和系统 | |
US10255918B2 (en) | Command and control of devices and applications by voice using a communication base system | |
JP2004248248A (ja) | ユーザがプログラム可能な移動局ハンドセット用の音声ダイヤル入力 | |
US9300795B2 (en) | Voice input state identification | |
CN104065836A (zh) | 监控通话的方法和装置 | |
CN102483915A (zh) | 具有包括导引配对和语音触发操作的语音控制功能的电信装置 | |
TW200540649A (en) | Method and apparatus for automatic telephone menu navigation | |
US9077802B2 (en) | Automated response system | |
WO2019207379A1 (en) | System and method for providing a response to a user query using a visual assistant | |
CN107135452A (zh) | 助听器适配方法及装置 | |
WO2001010144A1 (en) | Selecting a communication mode in a mobile communication device | |
CN106534459A (zh) | 语音提示方法及装置 | |
TWI300305B (en) | Wireless voice operating system of portable communication device | |
CN105516605A (zh) | 一种拍摄方法和装置 | |
CN108810244A (zh) | 语音对话系统以及信息处理装置 | |
CN111556406B (zh) | 音频处理方法、音频处理装置及耳机 | |
JP2023510518A (ja) | 音声端末機の音声検証及び制限方法 | |
WO2021150647A1 (en) | System and method for data analytics for communications in walkie-talkie network | |
KR20090078210A (ko) | 휴대단말에서 통화 내용 녹음 방법 및 장치 | |
KR20030018950A (ko) | 이동전화 단말기를 녹음기로 사용하는 방법 | |
JP2020161971A (ja) | 通信代替装置、通信代替システム、通信代替方法、および通信代替プログラム | |
JP2013214924A (ja) | 無線操作機、無線操作機の制御方法、およびプログラム | |
JP2001067095A (ja) | 音声認識方法及びその装置 | |
KR20040084554A (ko) | 휴대폰의 효과음 전송 방법 및 장치 | |
JPS62105559A (ja) | 電話機のダイヤル方式 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |