CN108196821B - 具有连续关键词识别的免提设备 - Google Patents

具有连续关键词识别的免提设备 Download PDF

Info

Publication number
CN108196821B
CN108196821B CN201810118789.9A CN201810118789A CN108196821B CN 108196821 B CN108196821 B CN 108196821B CN 201810118789 A CN201810118789 A CN 201810118789A CN 108196821 B CN108196821 B CN 108196821B
Authority
CN
China
Prior art keywords
keyword
free device
hand free
audio data
data processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810118789.9A
Other languages
English (en)
Other versions
CN108196821A (zh
Inventor
J·R·小斯特拉克
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Google LLC
Original Assignee
Google LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Google LLC filed Critical Google LLC
Publication of CN108196821A publication Critical patent/CN108196821A/zh
Application granted granted Critical
Publication of CN108196821B publication Critical patent/CN108196821B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/167Audio in a user interface, e.g. using voice commands for navigating, audio feedback
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/28Constructional details of speech recognition systems
    • G10L15/30Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M1/00Substation equipment, e.g. for use by subscribers
    • H04M1/60Substation equipment, e.g. for use by subscribers including speech amplifiers
    • H04M1/6033Substation equipment, e.g. for use by subscribers including speech amplifiers for providing handsfree use or a loudspeaker mode in telephone sets
    • H04M1/6041Portable telephones adapted for handsfree use
    • H04M1/6058Portable telephones adapted for handsfree use involving the use of a headset accessory device connected to the portable telephone
    • H04M1/6066Portable telephones adapted for handsfree use involving the use of a headset accessory device connected to the portable telephone including a wireless connection
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R1/00Details of transducers, loudspeakers or microphones
    • H04R1/10Earpieces; Attachments therefor ; Earphones; Monophonic headphones
    • H04R1/1091Details not provided for in groups H04R1/1008 - H04R1/1083
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/08Speech classification or search
    • G10L2015/088Word spotting
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2250/00Details of telephonic subscriber devices
    • H04M2250/02Details of telephonic subscriber devices including a Bluetooth interface
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04MTELEPHONIC COMMUNICATION
    • H04M2250/00Details of telephonic subscriber devices
    • H04M2250/74Details of telephonic subscriber devices with voice recognition means
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2201/00Details of transducers, loudspeakers or microphones covered by H04R1/00 but not provided for in any of its subgroups
    • H04R2201/10Details of earpieces, attachments therefor, earphones or monophonic headphones covered by H04R1/10 but not provided for in any of its subgroups
    • H04R2201/107Monophonic and stereophonic headphones with microphone for two-way hands free communication
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2201/00Details of transducers, loudspeakers or microphones covered by H04R1/00 but not provided for in any of its subgroups
    • H04R2201/10Details of earpieces, attachments therefor, earphones or monophonic headphones covered by H04R1/10 but not provided for in any of its subgroups
    • H04R2201/109Arrangements to adapt hands free headphones for use on both ears
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2420/00Details of connection covered by H04R, not provided for in its groups
    • H04R2420/07Applications of wireless loudspeakers or wireless microphones

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Acoustics & Sound (AREA)
  • Theoretical Computer Science (AREA)
  • Signal Processing (AREA)
  • Computational Linguistics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • General Health & Medical Sciences (AREA)
  • Telephone Function (AREA)
  • Telephonic Communication Services (AREA)
  • User Interface Of Digital Computer (AREA)

Abstract

公开了具有连续关键词识别的免提设备。被耦合到数据处理设备的免提设备可以可操作为针对至少一个关键词的出现而监控至少一个音频流。在识别至少一个关键词时,免提设备可以建立在免提设备和数据处理设备之间的第一连接,以用于启动数据处理设备中的语音接口。免提设备可以经由第一连接将在至少一个关键词的识别之后接收的音频数据发送到数据处理设备,以用于经由语音接口对音频数据做出响应。在关键词配置操作期间,免提设备可以将至少一个输入的关键词发送到数据处理设备以用于记录。免提设备可经由第二连接从数据处理设备接收记录的至少一个关键词,以用于免提设备的关键词配置。

Description

具有连续关键词识别的免提设备
本申请是分案申请,原案的申请号是201380060748.4,申请日是2013年9月19日,发明名称是“具有连续关键词识别的免提设备”。
技术领域
本公开的某些实施例涉及语音识别和接口系统。更具体地说,本公开的某些实施例涉及用于具有连续关键词识别的免提设备的方法和系统。
背景技术
诸如例如耳麦之类的免提设备通常可连同数据处理设备一起使用。免提设备可包括例如使用诸如例如蓝牙之类的一种或多种无线技术的无线耳麦。数据处理设备可包括例如移动电话、智能电话、平板电脑和/或具有语音识别的其它设备。数据处理设备可包括语音接口功能。语音接口功能能够识别并响应于可以例如从免提设备的麦克风接收的用户的语音。数据处理设备的语音接口可以例如通过按压在数据处理设备上的按钮而被触发或调用。
通过比较这样的系统与如参考附图在本申请的其余部分中陈述的本公开内容,常规和传统方法的进一步限制和缺点对于本领域的技术人员来说将变得显而易见。
发明内容
本公开的方面指向用于具有连续关键词识别的免提设备的方法和系统。在本公开的各种实施例中,其与数据处理设备耦合或连接且已被配置用于识别至少一个关键词的免提设备可以可操作为针对至少一个关键词的出现而监控至少一个接收的音频流。在识别至少一个关键词时,免提设备可以可操作为建立在免提设备和数据处理设备之间的第一连接,以用于启动在数据处理设备中的语音接口。免提设备可以可操作为经由建立的第一连接将可以在至少一个关键词的识别之后被接收的音频数据发送到数据处理设备,以用于由数据处理设备经由语音接口对发送的音频数据做出响应。在这一点上,将被发送到数据处理设备的音频数据可以在对应于建立第一连接的时间间隔期间在免提设备中被缓冲。
在关键词配置操作期间,免提设备可以可操作为输入至少一个关键词。免提设备可以可操作为将输入的至少一个关键词发送到数据处理设备,以用于由数据处理设备记录输入的至少一个关键词。免提设备可以可操作为经由第二连接从数据处理设备接收记录的至少一个关键词。免提设备然后可以可操作为利用记录的至少一个关键词来执行免提设备的配置,以用于识别在至少一个接收的音频流中的至少一个关键词。
本公开的各种优点、方面和新颖的特征,以及其图示实施例的细节将从以下描述和附图中更完全地被理解。
附图说明
图1为图示依照本公开的实施例的与数据处理设备耦合的示例免提设备的框图。
图2为图示依照本公开的实施例的具有连续关键词识别的示例免提设备的框图。
图3为图示依照本公开的实施例的具有连续关键词识别的示例蓝牙免提设备的框图。
图4为图示依照本公开的实施例的用于具有连续关键词识别的免提设备的示例步骤的流程图。
图5为图示依照本公开的实施例的用于具有连续关键词识别的蓝牙免提设备的示例步骤的流程图。
图6为图示依照本公开的实施例的用于免提设备的关键词配置的示例步骤的流程图。
图7为图示依照本公开的实施例的用于蓝牙免提设备的关键词配置的示例步骤的流程图。
图8为图示依照本公开的实施例的在工厂环境中硬编码到免提设备中的关键词的示例情景的框图。
具体实施方式
本公开的某些实施例可以在用于具有连续关键词识别的免提设备的方法和系统中被找到。某些具体细节在以下描述和附图中被陈述以提供对本公开的各种实施例的彻底理解。然而,本领域的技术人员将会理解,可以在没有以下描述中描述的若干细节的情况下实践本公开的附加实施例。
在本公开的各种实施例中,其耦合或连接到数据处理设备且已被配置用于识别至少一个关键词的免提设备可以可操作为针对至少一个关键词的出现而监控至少一个接收的音频流。在识别至少一个关键词时,免提设备可以可操作为在免提设备和数据处理设备之间建立第一连接,以用于启动在数据处理设备中的语音接口。免提设备可以可操作为经由建立的第一连接将可以在至少一个关键词的识别之后被接收的音频数据发送到数据处理设备,以用于由数据处理设备经由语音接口对发送的音频数据做出响应。在这一点上,将被发送到数据处理设备的音频数据可以在对应于建立第一连接的时间间隔期间在免提设备中被缓冲。
在关键词配置操作期间,免提设备可以可操作为输入至少一个关键词。免提设备可以可操作为将输入的至少一个关键词发送到数据处理设备,以用于通过数据处理设备记录输入的至少一个关键词。免提设备可以可操作为经由第二连接从数据处理设备接收记录的至少一个关键词。免提设备然后可以可操作为利用记录的至少一个关键词而执行免提设备的配置,以用于识别在至少一个接收的音频流中的至少一个关键词。
在本公开的示例实施例中,免提设备可以可操作为在如下情况下进入关键词配置操作:数据处理设备接收请求,且数据处理设备基于接收的要求而使得免提设备进入关键词配置操作。免提设备还可以可操作为在如下情况下进入关键词配置操作:免提设备第一次耦合到数据处理设备,数据处理设备发现免提设备能够针对至少一个关键词的出现而监控至少一个接收的音频流,数据处理设备确定免提设备尚未被配置用于识别至少一个关键词,且数据处理设备通过提示和请求经由免提设备对至少一个关键词的输入,而使得免提设备进入关键词配置操作。在这一点上,在数据处理设备确定免提设备已被配置用于识别至少一个关键词的情况下,数据处理设备可启用关键词配置接口,以允许经由关键词配置操作来记录至少一个关键词,而不请求经由免提设备对至少一个关键词的输入。
在本公开的示例实施例中,数据处理设备可储存记录的至少一个关键词,以允许在随后的关键词配置操作中再使用储存的至少一个关键词。在将记录的至少一个关键词经由第二连接发送到免提设备以用于关键词配置之前,数据处理设备可重新播放记录的至少一个关键词以用于复核(review)。作为复核记录的至少一个关键词的结果,数据处理设备可接收指示,其中指示可包括例如记录的至少一个关键词的接受、记录的至少一个关键词的拒绝、或关键词配置操作的取消。
在本发明的另一示例实施例中,免提设备可包括其可以在工厂环境中被硬编码到免提设备中的至少一个关键词。免提设备还可包括至少一个关键词中的每个关键词的至少一个口音版本,其中至少一个关键词中的每个关键词的至少一个口音版本可以在工厂环境中被硬编码到免提设备中。在这种情况下,在关键词配置操作期间,可以允许从至少一个关键词中的每个关键词的至少一个口音版本之中选择至少一个新的关键词。免提设备还可包括至少一个关键词中的每个关键词的至少一个版本,其中至少一个关键词中的每个关键词的至少一个版本可以在工厂环境中被硬编码到免提设备中,并且至少一个版本可分别对应于数据处理设备的至少一种设备类型。在这种情况下,在关键词配置操作期间,可以允许从至少一个关键词中的每个关键词的至少一个版本之中选择至少一个新的关键词。
在本公开的一些实施例中,免提设备可包括蓝牙免提设备。例如,蓝牙免提设备可以是蓝牙耳麦。在这种情况下,其经由蓝牙通信被耦合或连接到数据处理设备且已被配置用于识别至少一个关键词的蓝牙免提设备可以可操作为针对至少一个关键词的出现而监控至少一个接收的音频流。在识别至少一个关键词时,蓝牙免提设备可以可操作为建立在蓝牙免提设备和数据处理设备之间的第一连接,以用于启动在数据处理设备中的语音接口。蓝牙免提设备可以可操作为经由建立的第一连接将可以在至少一个关键词的识别之后被接收的音频数据发送到数据处理设备,以用于由数据处理设备经由语音接口对发送的音频数据做出响应。
在关键词配置操作期间,蓝牙免提设备可以可操作为输入至少一个关键词。蓝牙免提设备可以可操作为将输入的至少一个关键词发送到数据处理设备,以用于通过数据处理设备记录输入的至少一个关键词。蓝牙免提设备可以可操作为经由第二连接从数据处理设备接收记录的至少一个关键词。蓝牙免提设备然后可以可操作为利用记录的至少一个关键词来执行蓝牙免提设备的配置,以用于识别在至少一个接收的音频流中的至少一个关键词。在本公开的示例实施例中,蓝牙免提设备可以可操作为在如下情况下进入关键词配置操作:蓝牙免提设备第一次耦合到数据处理设备,数据处理设备发现蓝牙免提设备能够针对至少一个关键词的出现而监控至少一个接收的音频流,数据处理设备确定蓝牙免提设备尚未被配置用于识别至少一个关键词,且数据处理设备通过提示和请求经由蓝牙免提设备对至少一个关键词的输入,而使得蓝牙免提设备进入关键词配置操作。在这一点上,数据处理设备可利用蓝牙服务发现协议(SDP)来发现蓝牙免提设备能够针对至少一个关键词的出现而监控至少一个接收的音频流。
图1为图示依照本公开的实施例的与数据处理设备耦合的示例免提设备的框图。参考图1,示出了免提设备101、数据处理设备102和用户103。免提设备101可以被耦合或连接到数据处理设备102以用于免提操作,且用户103可穿戴免提设备101以用于免提操作。
免提设备101可以包括合适的逻辑、电路系统、接口和/或代码,其可以可操作为利用免提操作提供诸如数据处理设备102之类的数据处理设备的等效手持功能。在本公开的示例实施例中,免提设备101可被配置用于识别至少一个关键词。免提设备101可以可操作为针对至少一个关键词的出现而监控至少一个接收的音频流。在识别至少一个关键词时,免提设备101可以可操作为建立在免提设备101和数据处理设备102之间的第一连接,以用于启动在数据处理设备102中的语音接口。免提设备101可以可操作为经由建立的第一连接来将可能在至少一个关键词的识别之后被接收的音频数据发送到数据处理设备102。然后数据处理设备102可以经由语音接口对发送的音频数据做出响应。
数据处理设备102可以包括合适的逻辑、电路系统、接口和/或代码,其可以可操作为处理数据或信号。数据处理设备还可以可操作为跨例如一个或多个无线通信网络和/或一个或多个有线通信网络传达信号。数据处理设备102可包括例如移动电话、智能电话、平板电脑和/或具有语音识别的其它设备。在本公开的示例实施例中,数据处理设备102可以包括语音接口性能。在数据处理设备102中的语音接口可以例如基于由用户103经由免提设备101输入或讲出的一些关键词而被启动或触发。然后语音接口可以对用户103经由免提设备101输入或讲出的音频数据做出响应。
在操作中,免提设备101(其被耦合或连接到数据处理设备102)可以已被配置用于识别至少一个关键词。免提设备101可以可操作为针对至少一个关键词的出现而监控至少一个被接收的音频流。在识别至少一个关键词时,免提设备101可以可操作为建立在免提设备101和数据处理设备102之间的第一连接,以用于启动在数据处理设备102中的语音接口。免提设备101可以可操作为经由建立的第一连接将可能在至少一个关键词的识别之后被接收的音频数据发送到数据处理设备102。数据处理设备102然后可以经由语音接口对发送的音频数据做出响应。在这一点上,免提设备101在对应于建立第一连接的时间间隔期间可以可操作为缓冲待发送到数据处理设备102的音频数据。在这种情况下,例如,用户103可能想要拨打电话号码。用户103可以讲出关键词“拨打”或“拨号”,随后是电话号码。在识别关键词(例如,拨打或拨号)时,免提设备101可建立在免提设备101和数据处理设备102之间的第一连接,以用于启动或触发在数据处理设备102中的语音接口。免提设备101可以经由建立的第一连接将对应于电话号码的音频数据传输到数据处理设备102。对应于电话号码的音频数据可以在对应于建立第一连接的时间期间被缓冲。在这一点上,用于建立第一连接的时间延迟可以对于用户103来说是透明的。数据处理设备102然后可以经由语音接口对对应于电话号码的音频数据做出响应,并代表用户103拨打电话号码。
在用于使免提设备101能够识别至少一个关键词的关键词配置操作期间,免提设备101可以可操作为将由用户103输入或讲出的至少一个关键词发送到数据处理设备102,且数据处理设备102可以记录由用户103输入的至少一个关键词。免提设备101可以可操作为经由第二连接从数据处理设备102接收记录的至少一个关键词。免提设备101然后可以可操作为利用记录的至少一个关键词而执行免提设备101的配置,以用于识别在至少一个已接收的音频流中的至少一个关键词。
在本公开的示例实施例中,在数据处理设备102接收来自用户103用于关键词配置的请求且数据处理设备102基于从用户103接收的请求而使得免提设备101进入关键词配置操作的情况下,免提设备101可以可操作为进入关键词配置操作。例如,数据处理设备102可以通过指令或命令免提设备101开始将诸如至少一个关键词之类的音频数据发送到数据处理设备102而使得免提设备101进入关键词配置操作。免提设备101还可以可操作为在如下情况下进入关键词配置操作:免提设备101第一次被耦合或连接到数据处理设备102,数据处理设备102发现免提设备101能够针对至少一个关键词的出现而监控至少一个已接收的音频流,数据处理设备102确定免提设备101尚未被配置用于识别至少一个关键词,且数据处理设备102通过提示和请求用户103经由免提设备101输入或讲出至少一个关键词而使得免提设备101进入关键词配置操作。在这一点上,在数据处理设备102确定免提设备101早已被配置用于识别至少一个关键词的情况下,数据处理设备102可启用关键词配置接口,以允许用户103经由关键词配置操作来记录至少一个关键词,而不请求用户103经由免提设备101输入或讲出至少一个关键词。在这种情况下,用户103可以选择例如在闲暇时经由相同的关键词配置操作记录至少一个新的关键词。
在本公开的示例实施例中,数据处理设备102可以储存记录的至少一个关键词,以允许用户103在随后的关键词配置操作中再使用已储存的至少一个关键词。在这种情况下,用户103可以切换回到之前使用的关键词,而无须从头开始记录关键词。在将记录的至少一个关键词经由用于关键词配置的第二连接发送到免提设备101之前,数据处理设备102可以重新播放记录的至少一个关键词以用于用户103复核,且作为用户103复核记录的至少一个关键词的结果,数据处理设备102可接收从用户103传达的指示。指示可以包括例如记录的至少一个关键词的接受、记录的至少一个关键词的拒绝、或关键词配置操作的取消。
在本公开的另一示例实施例中,免提设备101可以包括其可以在工厂环境中被硬编码到免提设备101中的至少一个关键词。免提设备101还可以包括至少一个关键词中的每个关键词的至少一个口音版本,其中至少一个关键词中的每个关键词的至少一个口音版本可以在工厂环境中被硬编码到免提设备101中。在这一点上,在关键词配置操作期间,用户103可以被允许例如基于用户103的口音从至少一个关键词中的每个关键词的至少一个口音版本之中选择至少一个新关键词。例如,用户103可以选择其可以匹配他/她的口音的至少一个新关键词。
免提设备101还可以包括至少一个关键词中的每个关键词的至少一个版本,其中至少一个关键词中的每个关键词的至少一个版本可能在工厂环境中被硬编码到免提设备101中,并且至少一个版本可以分别对应于数据处理设备102的至少一种设备类型。在这一点上,在关键词配置操作期间,用户103可以被允许例如基于数据处理设备102的设备类型从至少一个关键词中的每个关键词的至少一个版本之中选择至少一个新关键词。例如,在数据处理设备102是移动电话的情况下,用户103可以选择其包括“电话”的关键词版本。在数据处理设备102是PC或电脑的情况下,用户103可以选择其包括“电脑”的关键词版本。
图2为图示依照本公开的实施例的具有连续关键词识别的示例免提设备的框图。参考图2,示出了免提设备101和数据处理设备102。免提设备101可以被耦合或连接到数据处理设备102。免提设备101可以包括处理器208、存储器210、麦克风206、扬声器212、关键词识别模块202和关键词配置模块204。数据处理设备102可包括处理器238、存储器240、语音接口模块234、用户接口模块236和关键词服务模块232。免提设备101和数据处理设备102可以是如例如关于图1所描述的。
免提设备101中的处理器208可包括合适的逻辑、电路系统、接口和/或代码,其可以可操作为管理和/或控制在免提设备101中的各种部件(诸如例如麦克风206、扬声器212、关键词识别模块202、关键词配置模块204和/或其它部件)的操作。处理器208可利用其使得能够执行各种应用的操作系统。处理器208可实现用于与例如数据处理设备102通信的一个或多个通信协议。
在免提设备101中的存储器210可包括合适的逻辑、电路系统、接口和/或代码,其可以可操作为储存可由例如处理器208、关键词识别模块202和/或关键词配置模块204利用的诸如可执行指令和/或数据之类的信息。存储器210可包括RAM、ROM、诸如闪速存储器之类的低延迟非易失存储器和/或其它合适的电子数据存储。
在免提设备101中的麦克风206可包括合适的逻辑、电路系统、接口和/或代码,其可以可操作为将音频波转换为电信号。麦克风206连同扬声器212一起可使诸如用户103之类的用户能够参与语音对话,以提供音频命令和/或接收音频反馈。
在免提设备101中的扬声器212可包括合适的逻辑、电路系统、接口和/或代码,其可以可操作为将电信号转换为音频波。扬声器212连同麦克风206一起可使诸如用户103之类的用户能够参与语音对话,以提供音频命令和/或接收音频反馈。
在免提设备101中的关键词识别模块202可包括合适的逻辑、电路系统、接口和/或代码,其可以可操作为提供用于免提设备101的关键词识别功能。在本公开的示例实施例中,关键词识别模块202可以可操作为识别可以经由麦克风206由诸如用户103之类的用户输入或讲出的至少一个关键词。在识别至少一个关键词时,关键词识别模块202可以可操作为建立在关键词识别模块202和数据处理设备202中的关键词服务模块232之间的第一连接220,以用于语音接口操作。关键词识别模块202然后可以经由建立的第一连接220将可能在至少一个关键词的识别之后被接收的音频数据传输到关键词服务模块232,以用于语音接口操作。
在免提设备101中的关键词配置模块204可包括合适的逻辑、电路系统、接口和/或代码,其可以可操作为提供用于免提设备101的关键词配置功能。在本公开的示例实施例中,关键词配置模块204可以可操作为利用至少一个关键词配置关键词识别模块202。
在数据处理设备102中的处理器238可包括合适的逻辑、电路系统、接口和/或代码,其可以可操作为管理和/或控制在数据处理设备102中的各种部件(诸如例如语音接口模块234、用户接口模块236、关键词服务模块232和/或其它部件)的操作。处理器238可利用其使得能够执行各种应用的操作系统。处理器238可实现用于与例如免提设备101通信的一个或多个通信协议。
在数据处理设备102中的存储器240可包括合适的逻辑、电路系统、接口和/或代码,其可以可操作为存储其可由例如处理器238、语音接口模块234、用户接口模块236和/或关键词服务模块232利用的诸如可执行指令和/或数据之类的信息。存储器240可包括RAM、ROM、诸如闪速存储器之类的低延迟非易失存储器和/或其它合适的电子数据存储。
在数据处理设备102中的语音接口模块234可包括合适的逻辑、电路系统、接口和/或代码,其可以可操作为提供用于数据处理设备102的语音接口功能。在本公开的示例实施例中,语音接口模块234可以基于从免提设备101传达的至少一个关键词,由关键词服务模块232激活或启动以用于语音接口操作。在免提设备101中的关键词配置操作期间,语音接口模块234可以可操作为记录其可以经由免提设备101从诸如用户103之类的用户接收的至少一个关键词。语音接口模块234可以可操作为将记录的至少一个关键词经由第二连接230发送或传输到免提设备101中的关键词配置模块204。关键词配置模块204然后可以利用记录的至少一个关键词来执行关键词识别模块202的配置。
在数据处理设备102中的用户接口模块236可包括合适的逻辑、电路系统、接口和/或代码,其可以可操作为提供用于数据处理设备102的用户接口功能。在免提设备101中的关键词配置操作期间,用户接口模块236可以可操作为从诸如用户103之类的用户接收用于关键词配置的一个或多个请求。
在数据处理设备102中的关键词服务模块232可包括合适的逻辑、电路系统、接口和/或代码,其可以可操作为启动或触发语音接口模块234以用于语音接口操作。在本公开的示例实施例中,在关键词服务模块232和免提设备101中的关键词识别模块202之间建立第一连接220的情况下,关键词服务模块232可以可操作为启动语音接口模块234。关键词服务模块232然后可以可操作为将经由第一连接220接收的音频数据传递到语音接口模块234以用于语音接口操作。
在操作中,在免提设备101中的关键词识别模块202可以已经被配置用于识别至少一个关键词。关键词识别模块202可以可操作为针对至少一个关键词的出现而监控至少一个音频流,至少一个音频流可经由免提设备101中的麦克风206被接收。在识别至少一个关键词时,关键词识别模块202可以可操作为建立在关键词识别模块202和数据处理设备102中的关键词服务模块232之间的第一连接220。在第一连接220建立之后,关键词服务模块232然后可以启动数据处理设备102中的语音接口模块234。关键词识别模块202可以可操作为将可以在识别至少一个关键词之后经由麦克风206被接收的音频数据经由建立的第一连接220发送到语音接口模块234。语音接口模块234然后可以对发送的音频数据做出响应以用于语音接口操作。在这一点上,在对应于建立第一连接220的时间间隔期间,关键词识别模块202可以可操作为在例如存储器210中缓冲将被发送到语音接口模块234的音频数据。
在用于使免提设备101能够识别至少一个关键词的关键词配置操作期间,在免提设备101中的处理器208可以可操作为将可由用户103经由麦克风206输入或讲出的至少一个关键词发送到数据处理设备102。在数据处理设备102中的处理器238然后可以将接收的由用户103输入的至少一个关键词传递到语音接口模块234。语音接口模块234可以记录由用户103输入的至少一个关键词。关键词配置模块204然后可以可操作为经由第二连接230从语音接口模块234接收记录的至少一个关键词。关键词配置模块204然后可以可操作为利用记录的至少一个关键词来执行关键词识别模块202的配置,以用于关键词识别模块202来识别在至少一个接收的音频流中的至少一个关键词。在这一点上,例如,关键词配置模块204可以将记录的至少一个关键词转换为关键词识别模块202所要求的形式。
在本公开的示例实施例中,在数据处理设备102经由用户接口模块236接收来自用户103的用于关键词配置的请求,并且语音接口模块234基于从用户103接收的请求而使得免提设备101进入关键词配置操作的情况下,免提设备101可以可操作为进入关键词配置操作。例如,语音接口模块234可以通过指令或命令免提设备101开始将诸如至少一个关键词之类的音频数据发送到数据处理设备102而使得免提设备101进入关键词配置操作。
免提设备101还可以可操作为在如下情况下进入关键词配置操作:免提设备101第一次耦合或连接到数据处理设备102,在数据处理设备102中的处理器238发现免提设备101能够针对至少一个关键词的出现而监控至少一个接收的音频流,处理器238确定免提设备101尚未被配置用于识别至少一个关键词,且处理器238通过经由用户接口模块236提示和请求用户103经由免提设备101中的麦克风206输入或讲出至少一个关键词而使得免提设备101进入关键词配置操作。在这一点上,处理器238可以与关键词配置模块204通信或连接,以查询关键词识别模块202是否已被配置。在关键词配置模块204报告回关键词识别模块202尚未被配置的情况下,处理器238可以确定免提设备101尚未被配置用于识别至少一个关键词。在处理器238确定免提设备101已被配置用于识别至少一个关键词的情况下,处理器238可以启用关键词配置接口,以允许用户103经由关键词配置操作记录至少一个关键词,而不请求用户103经由免提设备101中的麦克风206输入或讲出至少一个关键词。
在本公开的示例实施例中,语音接口模块234可例如在存储器240中存储或保持记录的至少一个关键词,以允许用户103在随后的关键词配置操作中再使用被存储的至少一个关键词。在这种情况下,用户103可以切换回到之前使用的关键词,而无须从头开始记录关键词。在将记录的至少一个关键词经由第二连接230发送到免提设备101中的关键词配置模块204以用于关键词配置之前,语音接口模块234可以重新播放记录的至少一个关键词以用于用户103复核。用户103可以经由免提设备101中的扬声器212听到或复核记录的至少一个关键词。作为用户103复核记录的至少一个关键词的结果,数据处理设备102可以接收从用户103经由用户接口模块236传达或接收的指示。指示可以包括例如记录的至少一个关键词的接受、记录的至少一个关键词的拒绝、或关键词配置操作的取消。
在本公开的另一示例实施例中,免提设备101可包括其可以在工厂环境中被硬编码到免提设备101中(例如,被硬编码在存储器210中)的至少一个关键词。免提设备101还可以包括例如至少一个关键词中的每个关键词的至少一个口音版本,其中至少一个关键词中的每个关键词的至少一个口音版本可以在工厂环境中被硬编码到免提设备101中(例如,被硬编码在存储器210中)。在这一点上,在关键词配置操作期间,用户103可以被允许例如基于用户103的口音,从至少一个关键词中的每个关键词的至少一个口音版本之中选择至少一个新关键词。例如,用户103可以选择其可以匹配他/她的口音的至少一个新关键词。
免提设备101还可以包括至少一个关键词中的每个关键词的至少一个版本,其中至少一个关键词中的每个关键词的至少一个版本可以在工厂环境中被硬编码到免提设备101中(例如,被硬编码在存储器210中),且至少一个版本可以分别对应于数据处理设备102的至少一个设备类型。在这一点上,在关键词配置操作期间,用户103可以被允许例如基于数据处理设备102的设备类型,从至少一个关键词中的每个关键词的至少一个版本之中选择至少一个新关键词。例如,在数据处理设备102是智能电话的情况下,用户103可以选择包括“电话”的关键词版本。在数据处理设备102是平板电脑的情况下,用户103可以选择包括“平板电脑”的关键词版本。
图3为图示依照本公开的实施例的具有连续关键词识别的示例蓝牙免提设备的框图。参考图3,示出了蓝牙免提设备301和数据处理设备303。蓝牙免提设备301可以经由蓝牙无线通信与数据处理设备302耦合。蓝牙免提设备301可以包括处理器308、存储器310、麦克风306、扬声器312、关键词识别模块302和关键词配置模块304。数据处理设备303可以包括处理器338、存储器340、语音接口模块334、用户接口模块336和关键词服务模块332。在本公开的示例实施例中,蓝牙免提设备301可以包括例如蓝牙耳麦。在这种情况下,扬声器312可以包括听筒(earphone)。
在蓝牙免提设备301中的处理器308可包括合适的逻辑、电路系统、接口和/或代码,其可以可操作为管理和/或控制在蓝牙免提设备301中的各种部件(诸如例如麦克风306、扬声器312、关键词识别模块302、关键词配置模块304和/或其它部件)的操作。处理器308可以利用其使得能够执行各种应用的操作系统。处理器308可实现用于与例如数据处理设备303通信的多个蓝牙协议栈307。
在蓝牙免提设备301中的存储器310可包括合适的逻辑、电路系统、接口和/或代码,其可以可操作为存储其可以被例如处理器308、关键词识别模块302和/或关键词配置模块304利用的诸如可执行指令和/或数据之类的信息。存储器310可包括RAM、ROM、诸如闪速存储器之类的低延迟非易失存储器和/或其它合适的电子数据存储。
在蓝牙免提设备301中的麦克风306可包括合适的逻辑、电路系统、接口和/或代码,其可以可操作为将音频波转换为电信号。麦克风306连同扬声器312一起可以使诸如用户103之类的用户能够参与语音对话,以提供音频命令和/或接收音频反馈。
在蓝牙免提设备301中的扬声器312可包括合适的逻辑、电路系统、接口和/或代码,其可以可操作为将电信号转换为音频波。扬声器312连同麦克风306一起可以使诸如用户103之类的用户能够参与语音对话,以提供音频命令和/或接收音频反馈。
在蓝牙免提设备301中的关键词识别模块302可包括合适的逻辑、电路系统、接口和/或代码,其可以可操作为提供用于蓝免提设备301的关键词识别功能。在本公开的示例实施例中,关键词识别模块302可以可操作为识别可以经由麦克风306由诸如用户103之类的用户输入或讲出的至少一个关键词。在识别至少一个关键词时,关键词识别模块302可以可操作为建立在关键词识别模块302和数据处理设备303中的关键词服务模块332之间的第一连接320以用于语音接口操作。关键词识别模块302然后可以经由建立的第一连接320将可以在至少一个关键词的识别之后被接收的音频数据传输到关键词服务模块332以用于语音接口操作。
在蓝牙免提设备301中的关键词配置模块304可包括合适的逻辑、电路系统、接口和/或代码,其可以可操作为提供用于蓝牙免提设备301的关键词配置功能。在本公开的示例实施例中,关键词配置模块304可以可操作为利用至少一个关键词来配置关键词识别模块302。
在数据处理设备303中的处理器338可包括合适的逻辑、电路系统、接口和/或代码,其可以可操作为管理和/或控制在数据处理设备303中的各种部件(诸如例如语音接口模块334、用户接口模块336、关键词服务模块332和/或其它部件)的操作。处理器338可利用其使得能够执行各种应用的操作系统。处理器338可实现用于与例如蓝牙免提设备301通信的多个蓝牙协议栈307。
在数据处理设备303中的存储器340可包括合适的逻辑、电路系统、接口和/或代码,其可以可操作为存储其可被例如处理器338、语音接口模块334、用户接口模块336和/或关键词服务模块332利用的诸如可执行指令和/或数据之类的信息。存储器340可包括RAM、ROM、诸如闪速存储器之类的低延迟非易失存储器和/或其它合适的电子数据存储。
在数据处理设备303中的语音接口模块334可包括合适的逻辑、电路系统、接口和/或代码,其可以可操作为提供用于数据处理设备303的语音接口功能。在本公开的示例实施例中,语音接口模块334可以基于从蓝牙免提设备301传达的至少一个关键词,由关键词服务模块332激活或启动以用于语音接口操作。在蓝牙免提设备301中的关键词配置操作期间,语音接口模块334可以可操作为记录可以经由蓝牙免提设备301从诸如用户103之类的用户接收的至少一个关键词。语音接口模块334可以可操作为将记录的至少一个关键词经由第二连接330发送或传输到在蓝牙免提设备301中的关键词配置模块304。关键词配置模块304然后可以利用记录的至少一个关键词来执行关键词识别模块302的配置。
在数据处理设备303中的用户接口模块336可包括合适的逻辑、电路系统、接口和/或代码,其可以可操作为提供用于数据处理设备303的用户接口功能。在蓝牙免提设备301中的关键词配置操作期间,用户接口模块336可以可操作为从诸如用户103之类的用户接收用于关键词配置的一个或多个请求。
在数据处理设备303中的关键词服务模块332可包括合适的逻辑、电路系统、接口和/或代码,其可以可操作为启动或触发语音接口模块334以用于语音接口操作。在本公开的示例实施例中,在关键词服务模块332和蓝牙免提设备301中的关键词识别模块302之间建立第一连接320的情况下,关键词服务模块332可以可操作为启动语音接口模块334。关键词服务模块332然后可以可操作为将经由第一连接320接收的音频数据传递到语音接口模块334以用于语音接口操作。
在操作中,在蓝牙免提设备301中的关键词识别模块302可以已经被配置用于识别至少一个关键词。关键词识别模块302可以可操作为针对至少一个关键词的出现而监控至少一个音频流,至少一个音频流可以经由蓝牙免提设备301中的麦克风306被接收。在识别至少一个关键词时,关键词识别模块302可以可操作为建立在关键词识别模块302和数据处理设备303中的关键词服务模块332之间的第一连接320。关键词服务模块332然后可以在第一连接320建立之后启动数据处理设备303中的语音接口模块334。关键词识别模块302可以可操作为将其可以在至少一个关键词识别之后经由麦克风306被接收的音频数据经由建立的第一连接320发送到语音接口模块334。语音接口模块334然后可以对发送的音频数据做出响应以用于语音接口操作。在这一点上,在对应于建立第一连接320的时间间隔期间,关键词识别模块302可以可操作为在例如存储器310中缓冲将被发送到语音接口模块334的音频数据。
在用于使蓝牙免提设备301能够识别至少一个关键词的关键词配置操作期间,在蓝牙免提设备301中的处理器308可以可操作为将可以由用户103经由麦克风306输入或讲出的至少一个关键词发送到数据处理设备303。在数据处理设备303中的处理器338然后可以将接收的由用户103输入的至少一个关键词传递到语音接口模块334。语音接口模块334可以记录由用户103输入的至少一个关键词。关键词配置模块304然后可以可操作为从语音接口模块334经由第二连接330接收记录的至少一个关键词。关键词配置模块304然后可以可操作为利用记录的至少一个关键词来执行关键词识别模块302的配置,以用于关键词识别模块302来识别在至少一个接收的音频流中的至少一个关键词。在这一点上,例如,关键词配置模块304可以将记录的至少一个关键词转换为关键词识别模块302要求的形式。
在本公开的示例实施例中,在数据处理设备303经由用户接口模块336接收来自用户103的用于关键词配置的请求,且语音接口模块334基于从用户103接收的请求而使得蓝牙免提设备301进入关键词配置操作的情况下,蓝牙免提设备301可以可操作为进入关键词配置操作。例如,语音接口模块334可通过指令或命令蓝牙免提设备301开始将诸如至少一个关键词之类的音频数据发送到数据处理设备303,而使得蓝牙免提设备301进入关键词配置操作。
蓝牙免提设备301还可以可操作为在如下情况下进入关键词配置操作:蓝牙免提设备301第一次耦合或连接到数据处理设备303,在数据处理设备303中的处理器338发现蓝牙免提设备301能够针对至少一个关键词的出现而监控至少一个接收的音频流,处理器338确定蓝牙免提设备301尚未被配置用于识别至少一个关键词,且处理器338通过经由用户接口模块336提示和请求用户103经由蓝牙免提设备301中的麦克风306输入或讲出至少一个关键词,而使得蓝牙免提设备301进入关键词配置操作。在这一点上,处理器338可利用蓝牙协议栈307中的蓝牙服务发现协议(SDP)309来发现蓝牙免提设备301能够针对至少一个关键词的出现而监控至少一个接收的音频流。处理器338可以与关键词配置模块304通信或连接,以查询关键词识别模块302是否已被配置。在关键词配置模块304报告回关键词识别模块302尚未被配置的情况下,处理器338可确定蓝牙免提设备301尚未被配置用于识别至少一个关键词。在处理器338确定蓝牙免提设备301已被配置用于识别至少一个关键词的情况下,处理器338可以启用关键词配置接口,以允许用户103经由关键词配置操作记录至少一个关键词,而不请求用户103经由蓝牙免提设备301中的麦克风306输入或讲出至少一个关键词。
在本公开的示例实施例中,语音接口模块334可例如在存储器340中存储或保持记录的至少一个关键词,以允许用户103在随后的关键词配置操作中再使用被存储的至少一个关键词。在这种情况下,用户103可以切换回到之前使用的关键词,而无须从头开始记录关键词。在将记录的至少一个关键词经由第二连接330发送到蓝牙免提设备301中的关键词配置模块304以用于关键词配置之前,语音接口模块334可以重新播放记录的至少一个关键词以用于用户103复核。用户103可经由蓝牙免提设备301中的扬声器312听到或复核记录的至少一个关键词。作为用户103复核记录的至少一个关键词的结果,数据处理设备303可接收从用户103经由用户接口模块336传达或接收的指示。指示可包括例如记录的至少一个关键词的接受、记录的至少一个关键词的拒绝、或关键词配置操作的取消。
在本公开的另一示例实施例中,蓝牙免提设备301可包括其可以在工厂环境中被硬编码到蓝牙免提设备301中(例如,被硬编码在存储器310中)的至少一个关键词。蓝牙免提设备301还可以包括例如至少一个关键词中的每个关键词的至少一个口音版本,其中至少一个关键词中的每个关键词的至少一个口音版本可以在工厂环境中被硬编码到蓝牙免提设备301中(例如,被硬编码在存储器310中)。在这一点上,在关键词配置操作期间,用户103可以被允许例如基于用户103的口音,从至少一个关键词中的每个关键词的至少一个口音版本之中选择至少一个新关键词。例如,用户103可选择其可以匹配或接近于他/她的口音的至少一个新关键词。
蓝牙免提设备301还可以包括至少一个关键词中的每个关键词的至少一个版本,其中至少一个关键词中的每个关键词的至少一个版本可以在工厂环境中被硬编码到蓝牙免提设备301中(例如,被硬编码在存储器310中),且至少一个版本可分别对应于至少一个设备类型。在这一点上,在关键词配置操作期间,用户103可以被允许例如基于数据处理设备303的设备类型,从至少一个关键词中的每个关键词的至少一个版本之中选择至少一个新关键词。例如,在数据处理设备303是智能电话的情况下,用户103可选择包括“电话”的关键词版本。在数据处理设备303是平板电脑的情况下,用户103可选择包括“平板电脑”的关键词版本。
图4为图示依照本公开的实施例的用于具有连续关键词识别的免提设备的示例步骤的流程图。参考图4,示例步骤开始于步骤401。在步骤402中,在免提设备101中的关键词配置模块204可以可操作为执行免提设备101中的关键词识别模块202的配置,以用于通过关键词识别模块202识别至少一个关键词。在步骤403中,在免提设备101中的关键词识别模块202可以可操作为针对至少一个关键词的出现而监控至少一个音频流,至少一个音频流可以经由免提设备101中的麦克风206被接收。在步骤404中,在识别至少一个关键词时,在免提设备101中的关键词识别模块202可以可操作为建立在关键词识别模块202和数据处理设备102中的关键词服务模块232之间的诸如第一连接220之类的第一连接,以用于启动在数据处理设备102中的诸如语音接口模块234之类的语音接口。在步骤405中,在免提设备101中的关键词识别模块202可以可操作为经由建立的第一连接220将可以在至少一个关键词的识别之后被接收(例如经由麦克风206)的音频数据发送到数据处理设备102中的语音接口模块234,以用于由数据处理设备102经由语音接口模块234对发送的音频数据做出响应。示例步骤可继续进行到结束步骤406。
图5为图示依照本公开的实施例的用于具有连续关键词识别的蓝牙免提设备的示例步骤的流程图。参考图5,示例步骤开始于步骤501。在步骤502中,在蓝牙免提设备301中的关键词识别模块302可以可操作为针对至少一个关键词的出现而监控至少一个音频流,至少一个音频流可以经由蓝牙免提设备301中的麦克风306被接收。在这一点上,在蓝牙免提设备301中的关键词识别模块302可以已被配置用于识别至少一个关键词。在步骤503中,在识别至少一个关键词时,在蓝牙免提设备301中的关键词识别模块302可以可操作为建立在关键词识别模块302和数据处理设备303中的关键词服务模块332之间的诸如第一连接320之类的第一连接,以用于启动在数据处理设备303中的诸如语音接口模块334之类的语音接口。在步骤504中,在蓝牙免提设备301中的关键词识别模块302可以可操作为经由建立的第一连接320将可以在至少一个关键词的识别之后被接收(例如经由麦克风306)的音频数据发送到数据处理设备303中的语音接口模块334,以用于由数据处理设备303经由语音接口模块334对发送的音频数据做出响应。示例步骤可继续进行到结束步骤505。
图6为图示依照本公开的实施例的用于免提设备的关键词配置的示例步骤的流程图。参考图6,示例步骤开始于步骤601。在步骤602中,免提设备101可以可操作为进入用于免提设备101的关键词配置操作。在这一点上,免提设备101可以在如下情况下进入关键词配置操作:耦合的数据处理设备102经由数据处理设备102中的用户接口模块236接收来自用户103的用于关键词配置的请求,且数据处理设备102中的语音接口模块234基于从用户103接收的请求而使得免提设备101进入关键词配置操作。免提设备101还可以在如下情况下进入关键词配置操作:免提设备101第一次耦合或连接到数据处理设备102,数据处理设备102中的处理器238发现免提设备101能够针对至少一个关键词的出现而监控至少一个接收的音频流,处理器238确定免提设备101尚未被配置用于识别至少一个关键词,且处理器238通过经由用户接口模块236提示和请求用户103在免提设备101中输入或讲出至少一个关键词,而使得免提设备101进入关键词配置操作。在步骤603中,免提设备101可以可操作为经由免提设备101中的麦克风206而输入至少一个关键词。在步骤604中,免提设备101中的处理器208可以可操作为将输入的至少一个关键词发送到数据处理设备102,以用于通过数据处理设备102中的语音接口模块234记录输入的至少一个关键词。在步骤605中,免提设备101中的关键词配置模块204然后可以可操作为接收来自数据设备102中的语音接口模块234的记录的至少一个关键词。在步骤606中,免提设备101中的关键词配置模块204然后可以可操作为利用记录的至少一个关键词来执行免提设备101中关键词识别模块202的配置,以用于关键词识别模块202识别在至少一个接收的音频流中的至少一个关键词。示例步骤可继续进行到结束步骤607。
图7为图示依照本公开的实施例的用于蓝牙免提设备的关键词配置的示例步骤的流程图。参考图7,示例步骤开始于步骤701。在步骤702中,蓝牙免提设备301可以可操作为进入用于蓝牙免提设备301的关键词配置操作。在这一点上,蓝牙免提设备301可以在如下情况下进入关键词配置操作:耦合的数据处理设备303经由数据处理设备303中的用户接口模块236接收来自用户103用于关键词配置的请求,且数据处理设备303中的语音接口模块334基于从用户103接收的请求而使得蓝牙免提设备301进入关键词配置操作。蓝牙免提设备301还可以在如下情况下进入关键词配置操作:蓝牙免提设备301第一次耦合或连接到数据处理设备303,数据处理设备303中的处理器338发现(例如利用蓝牙服务发现协议)蓝牙免提设备301能够针对至少一个关键词的出现而监控至少一个接收的音频流,处理器338确定蓝牙免提设备301尚未被配置用于识别至少一个关键词,且处理器338通过经由用户接口模块336提示和请求用户103在蓝牙免提设备301中输入或讲出至少一个关键词,而使得蓝牙免提设备301进入关键词配置操作。在步骤703中,蓝牙免提设备301可以可操作为经由蓝牙免提设备301中的麦克风306而输入至少一个关键词。在步骤704中,蓝牙免提设备301中的处理器308可以可操作为将输入的至少一个关键词发送到数据处理设备303,以用于通过数据处理设备303中的语音接口模块334记录输入的至少一个关键词。在步骤705中,蓝牙免提设备301中的关键词配置模块304然后可以可操作为接收来自数据设备303中的语音接口模块334的记录的至少一个关键词。在步骤706中,蓝牙免提设备301中的关键词配置模块304然后可以可操作为利用记录的至少一个关键词来执行蓝牙免提设备301中关键词识别模块302的配置,以用于关键词识别模块302识别在至少一个接收的音频流中的至少一个关键词。示例步骤可继续进行到结束步骤707。
图8为图示依照本公开的实施例的在工厂环境中硬编码到免提设备中的关键词的示例情景的框图。参考图8,示出了在工厂环境801中的免提设备101。免提设备101可以如关于例如图2所描述的。
在示例操作中,免提设备101可包括其可以在工厂环境801中被硬编码到免提设备101中(例如,被硬编码在存储器210中)的至少一个关键词802。免提设备101还可以包括例如至少一个关键词802中的每个关键词802的至少一个口音版本803,其中至少一个关键词802中的每个关键词802的至少一个口音版本803可以在工厂环境801中被硬编码到免提设备101中(例如,被硬编码在存储器210中)。在这一点上,在免提设备101的关键词配置操作期间,诸如用户103之类的用户可以被允许例如基于用户103的口音,从至少一个关键词802中的每个关键词802的至少一个口音版本803之中选择至少一个新关键词。例如,用户103可选择其可以与他/她的口音匹配的新关键词。
免提设备101还可以包括至少一个关键词802中的每个关键词802的至少一个版本804,其中至少一个关键词802中的每个关键词802的至少一个版本804可以在工厂环境801中被硬编码到免提设备101中(例如,被硬编码在存储器210中),并且至少一个版本804可分别对应于诸如数据处理设备102之类的数据处理设备的至少一种设备类型。在这一点上,在免提设备101的关键词配置操作期间,用户103可以被允许例如基于数据处理设备102的设备类型,从至少一个关键词802中的每个关键词802的至少一个版本804之中选择至少一个新关键词。例如,在数据处理设备102是智能电话的情况下,用户103可以选择包含“电话”的关键词版本。在数据处理设备102是平板电脑的情况下,用户103可以选择包含“平板电脑”的关键词版本。
在本公开的各种实施例中,免提设备101可被耦合或连接到数据处理设备102。在免提设备101中的关键词识别模块202可以已被配置为识别至少一个关键词。关键词识别模块202可以可操作为针对至少一个关键词的出现而监控至少一个音频流,至少一个音频流可以经由免提设备101中的麦克风206来接收。在识别至少一个关键词时,关键词识别模块202可以可操作为建立在关键词识别模块202和数据处理设备102中的关键词服务模块232之间的第一连接220,以用于通过数据处理设备102中的关键词服务模块232启动语音接口模块234。关键词识别模块202可以可操作为经由建立的第一连接220将可以在识别至少一个关键词之后经由麦克风206接收的音频数据发送到语音接口模块234,以用于由数据处理设备102经由语音接口模块234对发送的音频数据做出响应。在这一点上,在对应于建立第一连接220的时间间隔期间,关键词识别模块202可以可操作为例如在免提设备101中的存储器210中缓冲将被发送到语音接口模块234的音频数据。
在用于使得免提设备101能够识别至少一个关键词的关键词配置操作期间,免提设备101可以可操作为经由免提设备101中的麦克风206输入至少一个关键词。免提设备101可以可操作为将输入的至少一个关键词发送到数据处理设备102,以用于由数据处理设备102中的语音接口模块234记录输入的至少一个关键词。在免提设备101中的关键词配置模块204然后可以可操作为经由第二连接230接收来自语音接口模块234的记录的至少一个关键词。关键词配置模块204然后可以可操作为利用记录的至少一个关键词来执行关键词识别模块202的配置,以用于关键词识别模块202识别至少一个接收的音频流中的至少一个关键词。
在本公开的示例实施例中,免提设备101可以可操作为在如下情况下进入关键词配置操作:数据处理设备102接收用于关键词配置的请求,并且语音接口模块234基于接收的请求而使得免提设备101进入关键词配置操作。
免提设备101还可以可操作为在如下情况下进入关键词配置操作:免提设备101第一次与数据处理设备102耦合或者连接,数据处理设备102发现免提设备101能够针对至少一个关键词的出现而监控至少一个接收的音频流,数据处理设备102确定了免提设备101尚未被配置为识别至少一个关键词,并且数据处理设备102通过提示和请求经由免提设备101中的麦克风206输入至少一个关键词而使得提设备101进入关键词配置操作。在数据处理设备102确定免提设备101已经被配置为识别至少一个关键词的情况下,数据处理设备102可以启用关键词配置接口,以允许经由关键词配置操作来记录至少一个关键词,而不请求经由免提设备101中的麦克风206输入至少一个关键词。
在本公开的示例实施例中,在数据处理设备102中的语音接口模块234可例如在数据处理设备102中的存储器240中存储或保持记录的至少一个关键词,以允许在随后的关键词配置操作中再使用存储的至少一个关键词。在将记录的至少一个关键词经由第二连接230发送到免提设备101中的关键词配置模块204以用于关键词配置之前,数据处理设备102中的语音接口模块234可重新播放记录的至少一个关键词以用于复核。作为记录的至少一个关键词的复核的结果,数据处理设备102可经由例如用户接口模块236接收指示。指示可包括例如记录的至少一个关键词的接受、记录的至少一个关键词的拒绝、或关键词配置操作的取消。
在本公开的另一示例实施例中,免提设备101可包括其可以在工厂环境801中被硬编码到免提设备101中(例如,被硬编码在存储器210中)的至少一个关键词802。免提设备101还可以包括例如至少一个关键词802中的每个关键词802的至少一个口音版本803,其中至少一个关键词802中的每个关键词802的至少一个口音版本803可以在工厂环境801中被硬编码到免提设备101中(例如,被硬编码在存储器210中)。在这一点上,在关键词配置操作期间,可以允许从至少一个关键词802中的每个关键词802的至少一个口音版本803之中选择至少一个新的关键词。
免提设备101还可以包括至少一个关键词802中的每个关键词802的至少一个版本804,其中至少一个关键词802中的每个关键词802的至少一个版本804可以在工厂环境801中被硬编码到免提设备101中(例如,被硬编码在存储器210中),且至少一个版本804可以分别对应于数据处理设备102的至少一种设备类型。在这一点上,在关键词配置操作期间,可以允许从至少一个关键词802中的每个关键词802的至少一个版本804之中选择至少一个新的关键词。
在本公开的一些实施例中,免提设备101可以包括蓝牙免提设备301。蓝牙免提设备301可以经由蓝牙通信被耦合到数据处理设备303。在蓝牙免提设备301中的关键词识别模块302可以已被配置用于识别至少一个关键词。在这种情况下,关键词识别模块302可以可操作为针对至少一个关键词的出现而监控可以经由蓝牙免提设备301中的麦克风306而被接收的至少一个音频流。在识别至少一个关键词时,关键词识别模块302可以可操作为建立在关键词识别模块302和数据处理设备303中的关键词服务模块332之间的第一连接320,以用于通过数据处理设备303中的关键词服务模块332启动语音接口模块334。关键词识别模块302可以可操作为经由建立的第一连接320将可以在至少一个关键词的识别之后经由麦克风306接收的音频数据发送到语音接口模块334,以用于由数据处理设备303经由语音接口模块334对发送的音频数据做出响应。
在用于使蓝牙免提设备301能够识别至少一个关键词的关键词配置操作期间,蓝牙免提设备301可以可操作为经由蓝牙免提设备301中的麦克风306输入至少一个关键词。蓝牙免提设备301可以可操作为将输入的至少一个关键词发送到数据处理设备303,以用于通过数据处理设备303中的语音接口模块334记录输入的至少一个关键词。蓝牙免提设备301中的关键词配置模块304然后可以可操作为经由第二连接330从语音接口模块334接收记录的至少一个关键词。关键词配置模块304然后可以可操作为利用记录的至少一个关键词来执行关键词识别模块302的配置,以用于关键词识别模块302识别至少一个接收的音频流中的至少一个关键词。
蓝牙免提设备301可以可操作为在如下情况下进入关键词配置操作:蓝牙免提设备301第一次耦合或连接到数据处理设备303,数据处理设备303发现蓝牙免提设备301能够针对至少一个关键词的出现而监控至少一个接收的音频流,数据处理设备303确定蓝牙免提设备301尚未被配置用于识别至少一个关键词,且数据处理设备303通过提示和请求经由蓝牙免提设备301中的麦克风306输入至少一个关键词,而使得蓝牙免提设备301进入关键词配置操作。在这一点上,数据处理设备303中的处理器338可以利用蓝牙服务发现协议(SDP)309来发现蓝牙免提设备301能够针对至少一个关键词的出现而监控至少一个接收的音频流。
本公开的其它实施例可提供非瞬态计算机可读介质和/或存储介质,和/或非瞬态机器可读介质和/或存储介质,在其上已存储了具有可由机器和/或计算机执行的至少一个代码部分的机器代码和/或计算机程序,由此使得机器和/或计算机执行如本文中描述的用于具有连续关键词识别的免提设备的步骤。
据此,本公开的方面可以在硬件、软件或硬件和软件的组合中被实现。本公开的方面可以以集中方式实现在至少一个计算机系统中,或以分布式方式(其中不同元件遍布若干互联的计算机系统)来实现。适于执行本文描述的方法的任何种类的计算机系统或其它装置是合适的。硬件和软件的典型组合可以是具有计算机程序的通用计算机系统,该计算机程序当被加载和执行时,控制计算机系统使得它执行本文描述的方法。
本公开的方面还可以嵌入在计算机程序产品中,其包括使得能够实施本文描述的方法的所有特征,且当被加载在计算机系统中时其能够执行这些方法。在本上下文中的计算机程序意指指令集以任何语言、代码或符号的任何表达,该指令集旨在于使得具有信息处理能力的系统直接或在以下项的任一者或两者之后执行特定功能:a)转换为另一种语言、代码或符号;b)以不同的材料形式复制。
尽管本公开已参考某些实施例进行描述,将由本领域的技术人员理解的是,可作出各种改变且等效物可替代,而不脱离本公开的范围。此外,可作出许多修改,以使特定条件或材料适于本公开的教导而不脱离它的范围。因此,旨在的是,本公开不限于公开的特定实施例,而是本公开将包含落在所附权利要求的范围内的所有实施例。

Claims (20)

1.一种计算机实现的方法,包括:
由与分离的移动通信设备配对的免提设备接收第一音频数据;
由在所述免提设备上实现的语音识别器确定所述第一音频数据包括一个或多个特定关键词;
在确定所述第一音频数据包括一个或多个特定关键词之后,由所述免提设备发起建立所述免提设备与所述移动通信设备之间的活动通信信道;以及
通过活动通信信道,向所述移动通信设备传送所存储的第二音频数据,所述第二音频数据是在建立所述免提设备与所述移动通信设备之间的活动通信信道之后被接收并且被存储在免提设备上的缓冲器中。
2.根据权利要求1所述的方法,其中,发起建立所述免提设备与所述移动通信设备之间的活动通信信道包括:通过所述通信信道将所述第一音频数据的至少一部分传送到所述移动通信设备。
3.根据权利要求1所述的方法,其中,确定所述第一音频数据包括一个或多个特定关键词包括:确定所述第一音频数据包括被硬编码在所述免提设备的存储器中的一个或多个关键词。
4.根据权利要求1所述的方法,其中,确定所述第一音频数据包括一个或多个特定关键词包括:确定所述第一音频数据包括一个或多个用户定义的关键词。
5.根据权利要求1所述的方法,其中,确定所述第一音频数据包括一个或多个特定关键词包括:确定所述第一音频数据包括与一个或多个语音命令相关联的一个或多个关键词。
6.根据权利要求1所述的方法,其中确定所述第一音频数据包括一个或多个特定关键词包括:确定所述第一音频数据包括热词。
7.根据权利要求1所述的方法,包括:由所述免提设备上实现的所述语音识别器执行针对所述第一音频数据的语音识别。
8.根据权利要求1所述的方法,其中所述免提设备上实现的所述语音识别器包括连续语音识别器。
9.一种存储软件的计算机可读存储设备,所述软件包括能够由一个或多个计算机执行的指令,所述指令当执行时使得所述一个或多个计算机执行操作,所述操作包括:
由与分离的移动通信设备配对的免提设备接收第一音频数据;
由在所述免提设备上实现的语音识别器确定所述第一音频数据包括一个或多个特定关键词;
在确定所述第一音频数据包括一个或多个特定关键词之后,由所述免提设备发起建立所述免提设备与所述移动通信设备之间的活动通信信道;
在发起建立所述免提设备与所述移动通信设备之间的活动通信信道之后,由所述免提设备接收第二音频数据;
将所述第二音频数据存储在所述免提设备上的缓冲器中;
确定所述免提设备与所述移动通信设备之间的所述活动通信信道已经建立;以及
在确定所述免提设备与所述移动通信设备之间的所述活动通信信道已经建立之后,通过所述活动通信信道将所存储的第二音频数据传送到所述移动通信设备。
10.根据权利要求9所述的设备,其中,发起建立所述免提设备与所述移动通信设备之间的活动通信信道包括:通过所述通信信道将所述第一音频数据的至少一部分传送到所述移动通信设备。
11.根据权利要求9所述的设备,其中,确定所述第一音频数据包括一个或多个特定关键词包括:确定所述第一音频数据包括被硬编码在所述免提设备的存储器中的一个或多个关键词。
12.根据权利要求9所述的设备,其中,确定所述第一音频数据包括一个或多个特定关键词包括:确定所述第一音频数据包括一个或多个用户定义的关键词。
13.根据权利要求9所述的设备,其中,确定所述第一音频数据包括一个或多个特定关键词包括:确定所述第一音频数据包括与一个或多个语音命令相关联的一个或多个关键词。
14.根据权利要求9所述的设备,其中确定所述第一音频数据包括一个或多个特定关键词包括:确定所述第一音频数据包括热词。
15.根据权利要求9所述的设备,包括:由所述免提设备上实现的所述语音识别器执行针对所述第一音频数据的语音识别。
16.根据权利要求9所述的设备,其中所述免提设备上实现的所述语音识别器包括连续语音识别器。
17.一种计算机实现的系统,包括:
一个或多个计算机;以及
有形地包含计算机程序产品的计算机可读介质,所述计算机程序产品包括指令,所述指令使所述一个或多个计算机执行操作,所述操作包括:
由与分离的移动通信设备配对的免提设备接收第一音频数据;
由在所述免提设备上实现的语音识别器确定所述第一音频数据包括一个或多个特定关键词;
在确定所述第一音频数据包括一个或多个特定关键词之后,由所述免提设备发起建立所述免提设备与所述移动通信设备之间的活动通信信道;
在发起建立所述免提设备与所述移动通信设备之间的活动通信信道之后,由所述免提设备接收第二音频数据;
将所述第二音频数据存储在所述免提设备上的缓冲器中;
确定所述免提设备与所述移动通信设备之间的所述活动通信信道已经建立;以及
在确定所述免提设备与所述移动通信设备之间的所述活动通信信道已经建立之后,通过所述活动通信信道将所存储的第二音频数据传送到所述移动通信设备。
18.根据权利要求17所述的系统,其中,发起建立所述免提设备与所述移动通信设备之间的活动通信信道包括:通过所述通信信道将所述第一音频数据的至少一部分传送到所述移动通信设备。
19.根据权利要求17所述的系统,其中,确定所述第一音频数据包括一个或多个特定关键词包括:确定所述第一音频数据包括被硬编码在所述免提设备的存储器中的一个或多个关键词。
20.根据权利要求17所述的系统,其中,确定所述第一音频数据包括一个或多个特定关键词包括:确定所述第一音频数据包括一个或多个用户定义的关键词。
CN201810118789.9A 2012-10-01 2013-09-19 具有连续关键词识别的免提设备 Active CN108196821B (zh)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US13/632,723 US8468023B1 (en) 2012-10-01 2012-10-01 Handsfree device with countinuous keyword recognition
US13/632,723 2012-10-01
US13/889,502 2013-05-08
US13/889,502 US9214155B2 (en) 2012-10-01 2013-05-08 Handsfree device with countinuous keyword recognition
CN201380060748.4A CN104798031B (zh) 2012-10-01 2013-09-19 用于耦合到数据处理设备的免提设备的方法和系统

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN201380060748.4A Division CN104798031B (zh) 2012-10-01 2013-09-19 用于耦合到数据处理设备的免提设备的方法和系统

Publications (2)

Publication Number Publication Date
CN108196821A CN108196821A (zh) 2018-06-22
CN108196821B true CN108196821B (zh) 2019-06-04

Family

ID=48578204

Family Applications (3)

Application Number Title Priority Date Filing Date
CN201810118789.9A Active CN108196821B (zh) 2012-10-01 2013-09-19 具有连续关键词识别的免提设备
CN201710367355.8A Active CN107340988B (zh) 2012-10-01 2013-09-19 具有连续关键词识别的免提设备
CN201380060748.4A Active CN104798031B (zh) 2012-10-01 2013-09-19 用于耦合到数据处理设备的免提设备的方法和系统

Family Applications After (2)

Application Number Title Priority Date Filing Date
CN201710367355.8A Active CN107340988B (zh) 2012-10-01 2013-09-19 具有连续关键词识别的免提设备
CN201380060748.4A Active CN104798031B (zh) 2012-10-01 2013-09-19 用于耦合到数据处理设备的免提设备的方法和系统

Country Status (4)

Country Link
US (3) US8468023B1 (zh)
EP (2) EP2904486B1 (zh)
CN (3) CN108196821B (zh)
WO (1) WO2014055260A1 (zh)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9460735B2 (en) * 2013-12-28 2016-10-04 Intel Corporation Intelligent ancillary electronic device
CN103714680A (zh) * 2013-12-31 2014-04-09 京东方科技集团股份有限公司 家用电器及其控制方法、家用电器系统
CN104394276A (zh) * 2014-11-28 2015-03-04 深圳市中兴移动通信有限公司 一种移动终端及其在通话中自动免提的方法和装置
US10199041B2 (en) 2014-12-30 2019-02-05 Honeywell International Inc. Speech recognition systems and methods for maintenance repair and overhaul
CN105472152A (zh) * 2015-12-03 2016-04-06 广东小天才科技有限公司 一种智能终端自动接听电话的方法系统
US9961435B1 (en) * 2015-12-10 2018-05-01 Amazon Technologies, Inc. Smart earphones
US10311876B2 (en) * 2017-02-14 2019-06-04 Google Llc Server side hotwording
CN107492376A (zh) * 2017-07-07 2017-12-19 佛山科学技术学院 一种基于智能耳塞的声音识别系统及其识别方法
CN108428452B (zh) * 2018-03-14 2019-12-13 百度在线网络技术(北京)有限公司 终端支架和远场语音交互系统
DE102018209822A1 (de) * 2018-06-18 2019-12-19 Sivantos Pte. Ltd. Verfahren zur Steuerung der Datenübertragung zwischen zumindest einem Hörgerät und einem Peripheriegerät eines Hörgerätesystems sowie Hörgerät
DE102018209824A1 (de) * 2018-06-18 2019-12-19 Sivantos Pte. Ltd. Verfahren zur Steuerung der Datenübertragung zwischen zumindest einem Hörgerät und einem Peripheriegerät eines Hörgerätesystems sowie Hörgerät
US11264029B2 (en) * 2019-01-05 2022-03-01 Starkey Laboratories, Inc. Local artificial intelligence assistant system with ear-wearable device
US11264035B2 (en) 2019-01-05 2022-03-01 Starkey Laboratories, Inc. Audio signal processing for automatic transcription using ear-wearable device
EP3726856B1 (en) 2019-04-17 2022-11-16 Oticon A/s A hearing device comprising a keyword detector and an own voice detector

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6006185A (en) * 1997-05-09 1999-12-21 Immarco; Peter System and device for advanced voice recognition word spotting
US6023676A (en) * 1996-12-12 2000-02-08 Dspc Israel, Ltd. Keyword recognition system and method
US7542787B2 (en) * 2002-09-24 2009-06-02 At&T Intellectual Property I, L. P. Apparatus and method for providing hands-free operation of a device
CN101715018A (zh) * 2009-11-03 2010-05-26 沈阳晨讯希姆通科技有限公司 手机功能的语音控制方法
CN102194454A (zh) * 2010-03-05 2011-09-21 富士通株式会社 用于检测连续语音中的关键词的设备和方法

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2000058942A2 (en) * 1999-03-26 2000-10-05 Koninklijke Philips Electronics N.V. Client-server speech recognition
US6408272B1 (en) * 1999-04-12 2002-06-18 General Magic, Inc. Distributed voice user interface
KR20010094229A (ko) * 2000-04-04 2001-10-31 이수성 전화기의 음성인식 조작 방법 및 시스템
US6889191B2 (en) * 2001-12-03 2005-05-03 Scientific-Atlanta, Inc. Systems and methods for TV navigation with compressed voice-activated commands
US20040003136A1 (en) * 2002-06-27 2004-01-01 Vocollect, Inc. Terminal and method for efficient use and identification of peripherals
JP2004233793A (ja) * 2003-01-31 2004-08-19 Toshiba Corp 電子機器および同機器で用いられる遠隔制御方法
CN100345085C (zh) * 2004-12-30 2007-10-24 中国科学院自动化研究所 基于玩家姿势和语音的电子游戏场景和角色控制方法
US20080037727A1 (en) * 2006-07-13 2008-02-14 Clas Sivertsen Audio appliance with speech recognition, voice command control, and speech generation
US7280849B1 (en) 2006-07-31 2007-10-09 At & T Bls Intellectual Property, Inc. Voice activated dialing for wireless headsets
US7957972B2 (en) * 2006-09-05 2011-06-07 Fortemedia, Inc. Voice recognition system and method thereof
US8260618B2 (en) * 2006-12-21 2012-09-04 Nuance Communications, Inc. Method and apparatus for remote control of devices through a wireless headset using voice activation
US20100105435A1 (en) * 2007-01-12 2010-04-29 Panasonic Corporation Method for controlling voice-recognition function of portable terminal and radiocommunications system
US9026447B2 (en) * 2007-11-16 2015-05-05 Centurylink Intellectual Property Llc Command and control of devices and applications by voice using a communication base system
US8099289B2 (en) * 2008-02-13 2012-01-17 Sensory, Inc. Voice interface and search for electronic devices including bluetooth headsets and remote systems
KR20090107365A (ko) 2008-04-08 2009-10-13 엘지전자 주식회사 이동 단말기 및 그 메뉴 제어방법
US8498425B2 (en) * 2008-08-13 2013-07-30 Onvocal Inc Wearable headset with self-contained vocal feedback and vocal command
US20120010890A1 (en) * 2008-12-30 2012-01-12 Raymond Clement Koverzin Power-optimized wireless communications device
US20100304783A1 (en) * 2009-05-29 2010-12-02 Logan James R Speech-driven system with headset
US8438659B2 (en) * 2009-11-05 2013-05-07 Vocollect, Inc. Portable computing device and headset interface

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6023676A (en) * 1996-12-12 2000-02-08 Dspc Israel, Ltd. Keyword recognition system and method
US6006185A (en) * 1997-05-09 1999-12-21 Immarco; Peter System and device for advanced voice recognition word spotting
US7542787B2 (en) * 2002-09-24 2009-06-02 At&T Intellectual Property I, L. P. Apparatus and method for providing hands-free operation of a device
CN101715018A (zh) * 2009-11-03 2010-05-26 沈阳晨讯希姆通科技有限公司 手机功能的语音控制方法
CN102194454A (zh) * 2010-03-05 2011-09-21 富士通株式会社 用于检测连续语音中的关键词的设备和方法

Also Published As

Publication number Publication date
US8468023B1 (en) 2013-06-18
US9824685B2 (en) 2017-11-21
CN108196821A (zh) 2018-06-22
CN104798031B (zh) 2018-02-13
EP3139265A1 (en) 2017-03-08
US9214155B2 (en) 2015-12-15
WO2014055260A1 (en) 2014-04-10
US20160071514A1 (en) 2016-03-10
CN104798031A (zh) 2015-07-22
US20140095163A1 (en) 2014-04-03
CN107340988B (zh) 2020-10-20
CN107340988A (zh) 2017-11-10
EP2904486B1 (en) 2019-01-02
EP2904486A1 (en) 2015-08-12

Similar Documents

Publication Publication Date Title
CN108196821B (zh) 具有连续关键词识别的免提设备
US8452347B2 (en) Headset and audio gateway system for execution of voice input driven applications
US8103315B2 (en) Portable terminal device
CN102483915A (zh) 具有包括导引配对和语音触发操作的语音控制功能的电信装置
US8626237B2 (en) Integrating a cellular phone with a speech-enabled softphone
CN101835279A (zh) 一种移动终端连接蓝牙设备的简化方法
US7574228B2 (en) Multi-spot call system, sound volume adjustment device, portable terminal device, and sound volume adjustment method used therefor and program thereof
RU2004130051A (ru) Последовательный мультимодальный ввод
CN105975063B (zh) 一种控制智能终端的方法和装置
WO2019207379A1 (en) System and method for providing a response to a user query using a visual assistant
CN202713296U (zh) 多媒体设备、多媒体传输与播放系统及电话会议系统
CN106911840A (zh) 移动终端及其语音服务方法和装置
US8041299B2 (en) Communication base system and method of using the same
TWI300305B (en) Wireless voice operating system of portable communication device
US11056106B2 (en) Voice interaction system and information processing apparatus
WO2021150647A1 (en) System and method for data analytics for communications in walkie-talkie network
CN106341797A (zh) 具群组对讲功能之蓝牙耳机通讯系统
KR102135389B1 (ko) 스피커 및 스피커를 활용한 원격 회의 시스템
JP2013214924A (ja) 無線操作機、無線操作機の制御方法、およびプログラム
CN113067755A (zh) 一种语音远程控制智能家居设备的方法与系统
US20100173675A1 (en) "Talk-to-talk" telephony, especially mobile telephony
JP2003158578A (ja) コードレス電話システム
KR20090116337A (ko) 원격 번호 인식 장치를 이용한 음성 인식 통화 연결 방법및 장치

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant