CN111105796A - 无线耳机控制装置及控制方法、语音控制设置方法和系统 - Google Patents
无线耳机控制装置及控制方法、语音控制设置方法和系统 Download PDFInfo
- Publication number
- CN111105796A CN111105796A CN201911310508.0A CN201911310508A CN111105796A CN 111105796 A CN111105796 A CN 111105796A CN 201911310508 A CN201911310508 A CN 201911310508A CN 111105796 A CN111105796 A CN 111105796A
- Authority
- CN
- China
- Prior art keywords
- voice
- audio
- module
- command
- control
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 48
- 238000007781 pre-processing Methods 0.000 claims abstract description 71
- 230000005236 sound signal Effects 0.000 claims abstract description 71
- 230000009471 action Effects 0.000 claims description 25
- 238000013528 artificial neural network Methods 0.000 claims description 24
- 238000013135 deep learning Methods 0.000 claims description 24
- 238000000605 extraction Methods 0.000 claims description 17
- 230000006870 function Effects 0.000 claims description 14
- 230000002093 peripheral effect Effects 0.000 claims description 10
- 230000000875 corresponding effect Effects 0.000 description 40
- 230000008569 process Effects 0.000 description 10
- 230000008859 change Effects 0.000 description 6
- 238000006243 chemical reaction Methods 0.000 description 6
- 230000001276 controlling effect Effects 0.000 description 6
- 239000013078 crystal Substances 0.000 description 6
- 238000010586 diagram Methods 0.000 description 5
- 230000005059 dormancy Effects 0.000 description 5
- 230000005540 biological transmission Effects 0.000 description 4
- 239000000284 extract Substances 0.000 description 4
- 230000002045 lasting effect Effects 0.000 description 4
- 230000004044 response Effects 0.000 description 3
- 210000004556 brain Anatomy 0.000 description 2
- 230000010365 information processing Effects 0.000 description 2
- 210000002569 neuron Anatomy 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000005265 energy consumption Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000007774 longterm Effects 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000010355 oscillation Effects 0.000 description 1
- 230000000737 periodic effect Effects 0.000 description 1
- 230000002618 waking effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/22—Procedures used during a speech recognition process, e.g. man-machine dialogue
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/04—Training, enrolment or model building
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L17/00—Speaker identification or verification techniques
- G10L17/18—Artificial neural networks; Connectionist approaches
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/27—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique
- G10L25/30—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique using neural networks
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W76/00—Connection management
- H04W76/10—Connection setup
- H04W76/14—Direct-mode setup
Landscapes
- Engineering & Computer Science (AREA)
- Acoustics & Sound (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Evolutionary Computation (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Artificial Intelligence (AREA)
- Computer Networks & Wireless Communication (AREA)
- Headphones And Earphones (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
本发明涉及一种无线耳机控制装置及控制方法、语音控制设备方法和系统,无线耳机控制装置包括依次连接的音频预处理模块、语音智能识别模块、微处理器和输出模块,音频预处理模块与无线耳机的麦克风相连接,麦克风得到音频信号,音频预处理模块通过连接接口接收音频信号并进行预处理,从中提取音频信号相应的音频特征,语音智能识别模块从音频特征中获取语音声纹,并将其与预设声纹比较,在声纹匹配时,识别音频特征中是否包含语音命令,将识别结果发送至微处理器,微处理器可以输出相对应的控制指令,通过输出模块传输至与之相连接的无线耳机的主控芯片,执行控制指令,与预设声纹相匹配的声音才能对无线耳机进行控制,提高无线耳机控制的安全性。
Description
技术领域
本发明涉及音频信号处理技术领域,特别是涉及一种无线耳机控制装置及控制方法、语音控制设备方法和系统。
背景技术
目前,市面上的无线耳机控制装置一般是用作采集语音信息的接口,将采集的语音信息转换成电信号,发送至后端的处理器进行数据处理。
现在对声控技术的要求越来越高,需要对无线耳机控制装置接收的语音信号进行实时响应,为了达到这一目的,无线耳机控制装置需要持续处于唤醒状态,如此就增加了无线耳机控制装置本身的功耗。而现有的大多数终端上配置的无线耳机控制装置都存在功耗高这一问题,还有少数的终端上配置有语音唤醒功能,终端的处理器通过无线耳机控制装置接收语音,通过语音唤醒算法对语音信号进行处理,进而对终端进行操作唤醒;而终端的处理器执行语音唤醒算法时的电流较大,增加终端处理器的功耗。
发明内容
基于此,有必要针对传统的无线耳机控制装置持续处于唤醒状态功耗较高,通过终端的处理器执行语音唤醒算法功耗较高的问题,提供一种无线耳机控制装置及控制方法、语音控制设备方法和系统。
一种无线耳机控制装置,包括依次连接的音频预处理模块、语音智能识别模块、微处理器和输出模块;语音智能识别模块为模拟电路或模拟数字混合电路;
音频预处理模块还与无线耳机的麦克风连接,输出模块与无线耳机的主控芯片连接;
音频预处理模块用于获取麦克风接收并传输的音频信号,并从音频信号中提取音频特征;
语音智能识别模块用于获取音频特征,根据音频特征获取语音声纹,在语音声纹与预设声纹相匹配时,识别音频特征中是否包含语音命令,并将识别结果发送至微处理器;
微处理器用于在识别结果表示音频特征中包含语音命令时,输出与语音命令相对应的控制指令;
输出模块用于将控制指令传输至主控芯片。
根据上述的无线耳机控制装置,其包括依次连接的音频预处理模块、语音智能识别模块、微处理器和输出模块,音频预处理模块与无线耳机的麦克风相连接,麦克风可以感受声音信号并对其进行采集,得到音频信号,音频预处理模块通过连接接口接收音频信号并进行预处理,从中提取音频信号相应的音频特征,语音智能识别模块从音频特征中获取语音声纹,并将其与预设声纹比较,在声纹匹配时,识别音频特征中是否包含语音命令,将识别结果发送至微处理器,微处理器可以输出与语音命令相对应的控制指令,通过输出模块传输至与之相连接的无线耳机的主控芯片,由主控芯片执行控制指令,实现相应的控制过程;本方案中,通过对声音信号的声纹识别,只有与预设声纹相匹配的声音才能对无线耳机进行控制,可以大幅降低相同语音但声纹不同的误触发几率,提高无线耳机控制的安全性,而且使用语音命令代替传统的物理按键,可以完全释放用户的双手和双眼,提高无线耳机使用的便利性,另外,无线耳机控制装置的语音智能识别模块采用模拟电路或模拟数字混合电路,与传统的使用数字电路执行语音识别算法相比,大幅降低了功耗,更易实现持续工作、快捷反应。
在其中一个实施例中,音频预处理模块包括相互连接的音频接口模块和特征提取模块;音频接口模块还与麦克风连接,特征提取模块还与语音智能识别模块连接;
音频接口模块用于获取音频信号,并对音频信号进行去噪处理,将去噪后的音频信号发送至特征提取模块;
特征提取模块用于从去噪后的音频信号中提取音频特征。
在其中一个实施例中,语音智能识别模块包括深度学习神经网络;
通过深度学习神经网络从音频特征中获取语音声纹,并对语音声纹进行识别;
若语音声纹与预设声纹相匹配,识别音频特征中是否包含语音命令。
在其中一个实施例中,通过深度学习神经网络识别音频特征中是否包含语音命令,并将识别结果发送至微处理器。
在其中一个实施例中,无线耳机控制装置还包括串行外设接口,串行外设接口分别与语音智能识别模块、微处理器连接;
串行外设接口用于为语音智能识别模块和微处理器连接外部存储设备。
一种应用上述的无线耳机控制装置的控制方法,包括以下步骤:
通过音频预处理模块获取麦克风接收并传输的音频信号,并从音频信号中提取音频特征;
通过语音智能识别模块获取音频特征,根据音频特征获取语音声纹,在语音声纹与预设声纹相匹配时,识别音频特征中是否包含语音命令,并将识别结果发送至微处理器;
在识别结果表示音频特征中包含语音命令时,通过微处理器输出与语音命令相对应的控制指令;
通过输出模块将控制指令传输至主控芯片。
根据上述的应用无线耳机控制装置的控制方法,麦克风可以感受声音信号并对其进行采集,得到音频信号,通过音频预处理模块获取音频信号,进行预处理,从中提取音频信号相应的音频特征,通过语音智能识别模块从音频特征中获取语音声纹,并将其与预设声纹比较,在声纹匹配时,识别音频特征中是否包含语音命令,将识别结果发送至微处理器,通过微处理器可以输出与语音命令相对应的控制指令,通过输出模块将控制指令传输至与之相连接的无线耳机的主控芯片,由主控芯片执行控制指令,实现相应的控制过程;本方案中,通过对声音信号的声纹识别,只有与预设声纹相匹配的声音才能对无线耳机进行控制,可以大幅降低相同语音但声纹不同的误触发几率,提高无线耳机控制的安全性,而且使用语音命令代替传统的物理按键,可以完全释放用户的双手和双眼,提高无线耳机使用的便利性,另外,无线耳机控制装置的语音智能识别模块采用模拟电路或模拟数字混合电路,与传统的使用数字电路执行语音识别算法相比,大幅降低了功耗,更易实现持续工作、快捷反应。
在其中一个实施例中,在通过音频预处理模块获取麦克风接收并传输的音频信号之后,还包括以下步骤:
通过音频预处理模块对音频信号进行去噪处理。
在其中一个实施例中,根据音频特征获取语音声纹,在语音声纹与预设声纹相匹配时,识别音频特征中是否包含语音命令的步骤包括以下步骤:
通过语音智能识别模块中的深度学习神经网络,从音频特征获取语音声纹,并对语音声纹进行识别;
若语音声纹与预设声纹相匹配,通过深度学习神经网络识别音频特征中是否包含语音命令。
在其中一个实施例中,语音命令包括语音唤醒命令和/或语音动作命令;
在识别结果表示音频特征中包含语音命令时,通过微处理器输出与语音命令相对应的控制指令的步骤包括以下步骤:
在识别结果表示音频特征中包含语音唤醒命令时,通过微处理器输出与语音唤醒命令相对应的唤醒控制指令,唤醒控制指令用于将处于休眠状态的主控芯片唤醒;
和/或;
在识别结果表示音频特征中包含语音动作命令时,通过微处理器输出与语音动作命令相对应的动作控制指令,动作控制指令用于指示主控芯片执行控制动作。
在其中一个实施例中,应用上述的无线耳机控制装置的控制方法还包括以下步骤:
通过音频预处理模块获取麦克风接收并传输的第一语音信号,并将从第一语音信号提取的第一语音特征传输至语音智能识别模块;
若通过语音智能识别模块判定第一语音特征与预设的声纹设置开启特征相匹配,通过音频预处理模块获取麦克风接收并传输的第二语音信号,并从第二语音信号中提取第二语音特征,通过语音智能识别模块将第二语音特征作为预设声纹;其中,第一语音信号和第二语音信号是用户根据声纹设置提示分别发出的语音对应的信号;
通过音频预处理模块获取麦克风接收并传输的第三语音信号,并将从第三语音信号提取的第三语音特征传输至语音智能识别模块;
若通过语音智能识别模块判定第三语音特征与预设的命令设置开启特征相匹配,通过音频预处理模块获取麦克风接收并传输的第四语音信号,并从第四语音信号中提取第四语音特征,通过语音智能识别模块将第四语音特征作为语音命令;其中,第三语音信号和第四语音信号是用户根据命令设置提示分别发出的语音对应的信号。
一种基于如上述的无线耳机控制装置的语音控制设置方法,输出模块为输入输出模块,语音控制设置方法包括以下步骤:
开启语音控制设置功能,并显示声纹参考信息;
接收用户依据声纹参考信息发出的语音作为第一语音样本,对第一语音样本进行语音格式预处理,获得预设格式的第一语音数据,从第一语音数据中提取第一语音特征,将第一语音特征通过无线方式发送至主控芯片,经输入输出模块和微处理器传输至语音智能识别模块,其中,语音智能识别模块将第一语音特征作为预设声纹;
显示命令参考信息;
接收用户依据命令参考信息发出的语音作为第二语音样本,对第二语音样本进行语音格式预处理,获得预设格式的第二语音数据,从第二语音数据中提取第二语音特征,将第二语音特征通过无线方式发送至主控芯片,经输入输出模块和微处理器传输至语音智能识别模块,其中,语音智能识别模块将第二语音特征作为语音命令。
根据上述的应用无线耳机控制装置的语音控制设置方法,可以应用在各种具备无线传输功能的终端中,实现预设声纹和语音命令的设置。语音控制设置方法可以开启语音控制设置功能,通过接收用户的参照显示的声纹参考信息发出的语音作为第一语音样本,经过语音格式预处理和特征提取后,得到第一语音特征并发送至无线耳机的主控芯片,再经输入输出模块和微处理器传输至语音智能识别模块,作为预设声纹保存;通过相似的方式,可以接收用户参照显示的命令参考信息,对语音命令进行设置,通过上述方式,可以对无线耳机控制装置的声纹和语音命令进行自定义设置,便于用户随时进行更改,以适应应用场景的变化。
一种基于如上述的无线耳机控制装置的语音控制设置系统,输出模块为输入输出模块,语音控制设置系统包括语音控制指示单元和语音控制录入单元;
语音控制指示单元用于开启语音控制设置功能,并显示声纹参考信息;
语音控制录入单元用于接收用户依据声纹参考信息发出的语音作为第一语音样本,对第一语音样本进行语音格式预处理,获得预设格式的第一语音数据,从第一语音数据中提取第一语音特征,将第一语音特征通过无线方式发送至主控芯片,经输入输出模块和微处理器传输至语音智能识别模块,其中,语音智能识别模块将第一语音特征作为预设声纹;
语音控制指示单元还用于显示命令参考信息;
语音控制录入单元还用于接收用户依据命令参考信息发出的语音作为第二语音样本,对第二语音样本进行语音格式预处理,获得预设格式的第二语音数据,从第二语音数据中提取第二语音特征,将第二语音特征通过无线方式发送至主控芯片,经输入输出模块和微处理器传输至语音智能识别模块,其中,语音智能识别模块将第二语音特征作为语音命令。
根据上述的应用无线耳机控制装置的语音控制设置系统,可以应用在各种具备无线传输功能的终端中,实现预设声纹和语音命令的设置。语音控制指示单元可以开启语音控制设置功能,语音控制录入单元可以接收用户的参照显示的声纹参考信息发出的语音作为第一语音样本,经过语音格式预处理和特征提取后,得到第一语音特征并发送至无线耳机的主控芯片,再经输入输出模块和微处理器传输至语音智能识别模块,作为预设声纹保存;通过相似的方式,语音控制指示单元可以显示命令参考信息,语音控制录入单元可以接收用户参照显示的命令参考信息,对语音命令进行设置,通过上述方式,可以对无线耳机控制装置的声纹和语音命令进行自定义设置,便于用户随时进行更改,以适应应用场景的变化。
附图说明
图1为一个实施例中的无线耳机控制装置的结构示意图;
图2为一个实施例中的音频预处理模块的结构示意图;
图3为另一个实施例中的无线耳机控制装置的结构示意图;
图4为又一个实施例中的无线耳机控制装置的结构示意图;
图5为一个实施例中的应用无线耳机控制装置的控制方法的流程示意图。
具体实施方式
为使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步的详细说明。应当理解,此处所描述的具体实施方式仅仅用以解释本发明,并不限定本发明的保护范围。
需要说明的是,本发明实施例所涉及的术语“第一\第二”仅仅是是区别类似的对象,不代表针对对象的特定排序,可以理解地,“第一\第二”在允许的情况下可以互换特定的顺序或先后次序。应该理解“第一\第二”区分的对象在适当情况下可以互换,以使这里描述的本发明的实施例能够以除了在这里图示或描述的那些以外的顺序实施。
本发明实施例的术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或(模块)单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
在本文中提及的“多个”是指两个或两个以上。“和/或”,描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。字符“/”一般表示前后关联对象是一种“或”的关系。
本申请提供的无线耳机控制装置,可以应用于各种可实现无线传输的智能耳机设备中,用于对智能耳机进行控制,带有无线耳机控制装置的智能耳机设备可以通过声音控制执行各种命令和操作。
参见图1所示,为一个实施例的无线耳机控制装置的结构示意图。该实施例中的无线耳机控制装置包括依次连接的音频预处理模块100、语音智能识别模块200、微处理器300和输出模块400;语音智能识别模块200为模拟电路或模拟数字混合电路;
音频预处理模块100还与无线耳机的麦克风连接,输出模块400与无线耳机的主控芯片连接;
音频预处理模块100用于获取麦克风接收并传输的音频信号,并从音频信号中提取音频特征;
语音智能识别模块200用于获取音频特征,根据音频特征获取语音声纹,在语音声纹与预设声纹相匹配时,识别音频特征中是否包含语音命令,并将识别结果发送至微处理器;
微处理器300用于在识别结果表示音频特征中包含语音命令时,输出与语音命令相对应的控制指令;
输出模块400用于将控制指令传输至主控芯片。
在本实施例中,无线耳机控制装置包括依次连接的音频预处理模块100、语音智能识别模块200、微处理器300和输出模块400,音频预处理模块100与无线耳机的麦克风相连接,麦克风可以感受声音信号并对其进行采集,得到音频信号,音频预处理模块100通过连接接口接收音频信号并进行预处理,从中提取音频信号相应的音频特征,语音智能识别模块200从音频特征中获取语音声纹,并将其与预设声纹比较,在声纹匹配时,识别音频特征中是否包含语音命令,将识别结果发送至微处理器300,微处理器300可以输出与语音命令相对应的控制指令,通过输出模块400传输至与之相连接的无线耳机的主控芯片,由主控芯片执行控制指令,实现相应的控制过程;本方案中,通过对声音信号的声纹识别,只有与预设声纹相匹配的声音才能对无线耳机进行控制,可以大幅降低相同语音但声纹不同的误触发几率,提高无线耳机控制的安全性,而且使用语音命令代替传统的物理按键,可以完全释放用户的双手和双眼,提高无线耳机使用的便利性,另外,无线耳机控制装置的语音智能识别模块采用模拟电路或模拟数字混合电路,与传统的使用数字电路执行语音识别算法相比,大幅降低了功耗,更易实现持续工作、快捷反应。
需要说明的是,无线耳机控制装置可以设置在无线耳机的麦克风和主控芯片之间,麦克风作为声音传感器,可以采集无线耳机所处环境中的声音,声音信号可以是语音信号,如用户发出的话语、歌声、旋律音等,也可以是其他播放设备播放的语音、音乐、旋律等;通过麦克风中的硬件电路可以将声音信号转换为以电信号形式存在的音频信号,音频预处理模块100上可以设置音频接口,用于接收音频信号。
需要说明的是,音频预处理模块100、微处理器300可以是数字电路,输出模块400可以是模拟电路或模拟数字混合电路,也可以是数字电路。
在一个实施例中,如图2所示,音频预处理模块100包括相互连接的音频接口模块110和特征提取模块120;音频接口模块110还与麦克风连接,特征提取模块120还与语音智能识别模块200连接;
音频接口模块110用于获取音频信号,并对音频信号进行去噪处理,将去噪后的音频信号发送至特征提取模块120;
特征提取模块120用于从去噪后的音频信号中提取音频特征。
在本实施例中,音频预处理模块100包括相互连接的音频接口模块110和特征提取模块120,音频接口模块110可以使用音频接口从麦克风处得到音频信号,并对音频信号做前期的去噪处理,滤除音频信号中的明显噪声信号,特征提取模块120主要用于去噪后的音频信号中的音频特征提取,经去噪可以提高后续音频特征的准确性。
进一步的,音频接口模块110还可以对音频信号进行格式转换,删除明显的静音段信号、白噪声等;特征提取模块120可以针对去噪后的音频信号的幅度、频率、变化连续性等各种参数,按照预先设置的规则来提取音频特征,音频特征本身实质上是音频信号的一部分,如将幅度大于预设值,频率处于预置的范围内,变化连续性满足一定时长的音频信号进行截取,作为音频特征。
在一个实施例中,语音智能识别模块200包括深度学习神经网络;
通过深度学习神经网络从音频特征中获取语音声纹,并对语音声纹进行识别;
若语音声纹与预设声纹相匹配,识别音频特征中是否包含语音命令。
在本实施例中,深度学习神经网络是由大量类似于神经元的处理单元相互连结而成的非线性复杂网络系统,它通过模拟大脑神经元网络处理、记忆信息的方式,完成人脑那样的信息处理功能,是非线性的并行结构,本方案中,当深度学习神经网络接收到音频特征时,能够作出迅速、准确地判断,从中获取语音声纹,深度学习神经网络中存有预设声纹,可以对语音声纹进行识别匹配,在语音声纹与预设声纹相匹配时,表明当前语音的声源是合法的用户,可以执行识别音频特征中是否包含语音命令的步骤,深度学习神经网络可以减小犯错的可能性,提高语音声纹获取和识别的准确性,而且深度学习神经网络的工作模式产生的功耗较低。
进一步的,若语音声纹与预设声纹不匹配,表明当前语音声纹的声源不是合法的用户,可以直接忽略当前的音频特征,不对其进行下一步的响应,在实际应用中,表现为非法用户发出的语音,即使语音中包括正确的语音命令,也无法对无线耳机进行控制,从而提高无线耳机控制的安全性。
音频特征可以是模拟特征,音频特征同时可以是语音信号所包含的一段语句,通过对语音信号的幅度、频率可以分析得到语音语调,作为语音声纹。
在一个实施例中,通过深度学习神经网络识别音频特征中是否包含语音命令,并将识别结果发送至微处理器300。
在本实施例中,音频特征中是否包含语音命令也可以通过深度学习神经网络进行识别,将识别结果发送至微处理器300进行进一步的处理,利用深度学习神经网络的特性可以大大提高语音命令识别的准确性。
需要说明的是,音频特征可以包含关键词或关键词组等,通过对关键词的或关键词组的识别,可以从中得到相应的语音命令,如关键词“开机”,在识别到这一关键词后,判断其属于控制类的命令时,将其作为语音命令,语音命令可以与各种不同的控制命令相对应,根据实际控制需要进行调整,并不局限于语音关键词的各种形式。
进一步的,音频特征中若包含语音命令,微处理器300可以对其进行语音命令进行响应处理,若不包含语音命令,微处理器300可以不作响应。
在一个实施例中,如图3所示,无线耳机控制装置还包括串行外设接口500,串行外设接口500分别与语音智能识别模块200、微处理器300连接;
串行外设接口500用于为语音智能识别模块200和微处理器300连接外部存储设备。
在本实施例中,无线耳机控制装置还包括串行外设接口500,其与语音智能识别模块200、微处理器300连接,可以为两者连接外部存储设备,用于扩展存储容量,便于提高语音智能识别模块200和微处理器300的数据处理速度。
在一个实施例中,如图4所示,无线耳机控制装置还包括与微处理器300连接的时钟管理电路600,时钟管理电路600包括晶振接口610、时间处理器620和时间寄存器630;
晶振接口610用于接收外部时钟信号;时间寄存器630用于在识别结果中包含时间信息时,保存时间信息;
时间处理器620用于在到达时间信息对应的晶振时间时,输出中断信号至微处理器300,中断信号用于指示微处理器300输出控制指令。
在本实施例中,无线耳机控制装置还包括与微处理器300连接的时钟管理电路600,时钟管理电路600包括晶振接口610、时间处理器620和时间寄存器630,晶振接口610用于接收外部时钟信号,实现时钟信号同步;微处理器300从语音智能识别模块200处接收的识别结果可以包含时间信息,通过时间管理电路600中的时间寄存器630对时间信息进行保存,在到达时间信息对应的晶振时间时,通过时间管理电路600中的时间处理器620输出中断信号至微处理器300,用于指示微处理器300输出控制指令,通过时间管理电路600的时间信息处理,可以实现对控制指令的定时输出控制。
进一步的,时间管理电路600可以包括RTC(实时时钟)电路,可以实现周期性中断输出,以及32KHz时钟输出。
根据上述无线耳机控制装置,本发明实施例还提供一种应用上述无线耳机控制装置的控制方法,以下就应用无线耳机控制装置的控制方法的实施例进行详细说明。
参见图5所示,为一个实施例的应用无线耳机控制装置的控制方法的流程示意图。该实施例中的应用无线耳机控制装置的控制方法包括以下步骤:
步骤S710:通过音频预处理模块获取麦克风接收并传输的音频信号,并从音频信号中提取音频特征;
步骤S720:通过语音智能识别模块获取音频特征,根据音频特征获取语音声纹,在语音声纹与预设声纹相匹配时,识别音频特征中是否包含语音命令,并将识别结果发送至微处理器;
步骤S730:在识别结果表示音频特征中包含语音命令时,通过微处理器输出与语音命令相对应的控制指令;
步骤S740:通过输出模块将控制指令传输至主控芯片。
在本实施例中,麦克风可以感受声音信号并对其进行采集,得到音频信号,通过音频预处理模块获取音频信号,进行预处理,从中提取音频信号相应的音频特征,通过语音智能识别模块从音频特征中获取语音声纹,并将其与预设声纹比较,在声纹匹配时,识别音频特征中是否包含语音命令,将识别结果发送至微处理器,通过微处理器可以输出与语音命令相对应的控制指令,通过输出模块将控制指令传输至与之相连接的无线耳机的主控芯片,由主控芯片执行控制指令,实现相应的控制过程;本方案中,通过对声音信号的声纹识别,只有与预设声纹相匹配的声音才能对无线耳机进行控制,可以大幅降低相同语音但声纹不同的误触发几率,提高无线耳机控制的安全性,而且使用语音命令代替传统的物理按键,可以完全释放用户的双手和双眼,提高无线耳机使用的便利性,另外,无线耳机控制装置的语音智能识别模块采用模拟电路或模拟数字混合电路,与传统的使用数字电路执行语音识别算法相比,大幅降低了功耗,更易实现持续工作、快捷反应。
在一个实施例中,在通过音频预处理模块获取麦克风接收并传输的音频信号之后,还包括以下步骤:
通过音频预处理模块对音频信号进行去噪处理。
在一个实施例中,根据音频特征获取语音声纹,在语音声纹与预设声纹相匹配时,识别音频特征中是否包含语音命令的步骤包括以下步骤:
通过语音智能识别模块中的深度学习神经网络,从音频特征获取语音声纹,并对语音声纹进行识别;
若语音声纹与预设声纹相匹配,通过深度学习神经网络识别音频特征中是否包含语音命令。
在一个实施例中,语音命令包括语音唤醒命令和/或语音动作命令;
在识别结果表示音频特征中包含语音命令时,通过微处理器输出与语音命令相对应的控制指令的步骤包括以下步骤:
在识别结果表示音频特征中包含语音唤醒命令时,通过微处理器输出与语音唤醒命令相对应的唤醒控制指令,唤醒控制指令用于将处于休眠状态的主控芯片唤醒;
和/或;
在识别结果表示音频特征中包含语音动作命令时,通过微处理器输出与语音动作命令相对应的动作控制指令,动作控制指令用于指示主控芯片执行控制动作。
在本实施例中,语音命令可以是语音唤醒命令、语音动作命令中任一种或其组合,若是语音唤醒命令,微处理器可以输出与语音唤醒命令相对应的唤醒控制指令,通过输出模块输出至无线耳机的主控芯片后,可以将处于休眠状态的主控芯片唤醒,进入正常工作状态;若是语音动作命令,微处理器可以输出语音动作命令相对应的动作控制指令,通过输出模块输出至无线耳机的主控芯片后,可以使主控芯片执行相应的动作,如对无线耳机的播放项目进行切换,播放音量进行调整等。
进一步的,若无线耳机的主控芯片当前处于休眠状态,则对唤醒控制指令进行响应,在通过唤醒控制指令进行唤醒后,才对语音动作指令进行响应;若无线耳机的主控芯片当前已处于正常工作状态,则对动作控制指令进行响应,不对唤醒控制指令响应。
进一步的,语音命令还包括语音休眠指令,在识别结果表示音频特征中包含语音休眠命令时,通过微处理器输出与语音休眠命令相对应的休眠控制指令,休眠控制指令用于将处于正常工作状态的主控芯片休眠。
在一个实施例中,应用上述的无线耳机控制装置的控制方法还包括以下步骤:
通过音频预处理模块获取麦克风接收并传输的第一语音信号,并将从第一语音信号提取的第一语音特征传输至语音智能识别模块;
若通过语音智能识别模块判定第一语音特征与预设的声纹设置开启特征相匹配,通过音频预处理模块获取麦克风接收并传输的第二语音信号,并从第二语音信号中提取第二语音特征,通过语音智能识别模块将第二语音特征作为预设声纹;其中,第一语音信号和第二语音信号是用户根据声纹设置提示分别发出的语音对应的信号;
通过音频预处理模块获取麦克风接收并传输的第三语音信号,并将从第三语音信号提取的第三语音特征传输至语音智能识别模块;
若通过语音智能识别模块判定第三语音特征与预设的命令设置开启特征相匹配,通过音频预处理模块获取麦克风接收并传输的第四语音信号,并从第四语音信号中提取第四语音特征,通过语音智能识别模块将第四语音特征作为语音命令;其中,第三语音信号和第四语音信号是用户根据命令设置提示分别发出的语音对应的信号。
在本实施例中,用户可以根据声纹设置提示发出语音,如“声纹设置”或与其意义相同的其他语音,音频预处理模块得到与其对应的第一语音信号,通过语音智能识别模块对其中的第一语音特征(如“声纹设置”的声纹)进行判断,若与预设的声纹设置开启特征相匹配(声纹和语音内容均相匹配),此时可以通过麦克风再次接收用户根据声纹设置提示发出语音,可以录制最大程度体现声纹的语音,如用户说出的“无线耳机”等,可以通过音频预处理模块获取与其对应的第二语音信号,通过语音智能识别模块将其中的第二语音特征(如“无线耳机”的声纹)作为预设声纹,如此可以完成对预设声纹的自由配置,而且只有与原先的预设的声纹设置开启特征相匹配,才能进行预设声纹配置,提高配置安全性;同理,用户可以根据命令设置提示发出语音,如“命令设置”或与其意义相同的其他语音,音频预处理模块得到与其对应的第三语音信号,通过语音智能识别模块对其中的第三语音特征(如“命令设置”的声纹)进行判断,若与预设的命令设置开启特征相匹配(声纹和语音内容均相匹配),此时可以通过麦克风再次接收用户根据命令设置提示发出语音,可以录制最大程度体现命令的语音,如用户说出的“调高音量”、“下一首”、“上一首”等,可以通过音频预处理模块获取与其对应的第四语音信号,通过语音智能识别模块将其中的第四语音特征(如在该声纹下的“调高音量”、“下一首”、“上一首”)作为语音命令,如此可以完成对语音命令的自由配置,而且只有原先的预设的命令设置开启特征相匹配,才能进行语音命令配置,提高配置安全性。
进一步的,上述第一语音信号和第二语音信号可以是不同用户发出的语音对应的信号,以对声纹进行修改,在命令设置过程中,第三语音信号和第四语音信号可以是预先设置声纹的用户发出的语音对应的信号,也可以是新录制声纹的用户发出的语音对应的信号。
本发明实施例的无线耳机控制装置的控制方法与上述无线耳机控制装置相对应,在上述无线耳机控制装置的实施例阐述的技术特征及其有益效果均适用于无线耳机控制装置的控制方法的实施例中。
在一个实施例中,基于上述的无线耳机控制装置的语音控制设置方法,输出模块为输入输出模块,语音控制设置方法包括以下步骤:
开启语音控制设置功能,并显示声纹参考信息;
接收用户依据声纹参考信息发出的语音作为第一语音样本,对第一语音样本进行语音格式预处理,获得预设格式的第一语音数据,从第一语音数据中提取第一语音特征,将第一语音特征通过无线方式发送至主控芯片,经输入输出模块和微处理器传输至语音智能识别模块,其中,语音智能识别模块将第一语音特征作为预设声纹;
显示命令参考信息;
接收用户依据命令参考信息发出的语音作为第二语音样本,对第二语音样本进行语音格式预处理,获得预设格式的第二语音数据,从第二语音数据中提取第二语音特征,将第二语音特征通过无线方式发送至主控芯片,经输入输出模块和微处理器传输至语音智能识别模块,其中,语音智能识别模块将第二语音特征作为语音命令。
在本实施例中,主要实现对语音控制的具体设置,而且是在其他终端上实现,并非直接在无线耳机上实现。如利用手机等移动终端实现对无线耳机的语音控制设置。以手机为例,可以在手机端打开与无线耳机相关联的语音控制软件,并开启语音控制设置功能,此时可以显示声纹参考信息,用于提示用户参照声纹参考信息发出语音,手机端通过自身的麦克风可以接收该语音,作为第一语音样本,语音控制软件对第一语音样本进行格式预处理,得到第一语音数据,其中格式预处理包括语音去噪、语义词划分等等,通过第一语音数据可以提取第一语音特征,并通过手机端的无线传输模块将第一语音特征发送至无线耳机的主控芯片,经输入输出模块和微处理器传输至语音智能识别模块,以保存该第一语音特征作为预设声纹;此后,在手机端还可以显示命令参考信息,通过相似的过程,提示用户发出语音,将其作为第二语音样本,经格式预处理后提取第二语音特征,将其发送至主控芯片,并传输至语音智能识别模块作为语音命令,如此可以实现通过移动终端(如手机等)对无线耳机控制装置的语音控制设置,提高设置操作的便利性。
需要说明的是,命令参考信息可以是语音命令的触发关键字,如命令参考信息是唤醒无线耳机,此时可以录制的用户的语音可以是任意的,也可以与命令参考信息相同,只需将该语音与“唤醒无线耳机”功能相关联即可,其他功能类型的命令参考信息和语音录制也是相似的。
在一个实施例中,无线耳机控制装置可以应用在蓝牙耳机中。目前市面上的蓝牙耳机大部分采用机械按键实现接收电话,调整音量的功能,操作不方便,不能释放双手,少部分蓝牙耳机可以接收语音控制,但由于采用传统的DSP(Digital Signal Processing,数字信号处理)电路,能耗高,不能实现长期实时待机,反应缓慢,另外由于任何人都能通过语音控制耳机,无私密安全性,误触发也很高。
本申请的方案是一种基于声纹识别,自定义语音词的语音控制方法和装置。以蓝牙耳机为例,蓝牙耳机控制装置放置于蓝牙耳机麦克风和蓝牙芯片之间,一直待机,通过蓝牙耳机麦克风实时监测语音关键唤醒字和语音命令,识别用户(讲话者)的声纹,解析语音命令,通过蓝牙主控芯片执行命令。
自定义语音词的语音控制装置可以采用一语音控制芯片,该芯片内置深度学习神经网络,可以对使用者的声纹识别,仅仅使用者的语音才能触发唤醒芯片,大幅降低误触发,提升安全,并且只有使用者的语音命令才能进行语音控制。
而且该芯片可以采用专用ASIC集成电路和模拟电路,代替传统的DSP电路,大幅降低功耗,可以实现一直开机等待语音信号,实时监测蓝牙耳机麦克风的关键唤醒词语音信号,当监测到关键词时,输出唤醒信号至蓝牙耳机主控芯片,使蓝牙耳机进入正常工作状态,在监测到命令词语音信号时,启动本地命令解析,反应快捷。该芯片使用语音命令代替传统的物理按键,完全释放用户的双手和双眼。另外,还可以设置配套的手机用户终端应用程序,通过应用程序接收待识别的语音数据并且对待识别的语音数据进行语音格式预处理,从经过语音格式预处理的音频数据提取语音特征,声纹信息,再进行语音命令触发关键字设置,例如接通电话,播放音乐,调低音量,调高音量等。
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本发明的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对发明专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进,这些都属于本发明的保护范围。因此,本发明专利的保护范围应以所附权利要求为准。
Claims (12)
1.一种无线耳机控制装置,其特征在于,包括依次连接的音频预处理模块、语音智能识别模块、微处理器和输出模块;所述语音智能识别模块为模拟电路或模拟数字混合电路;
所述音频预处理模块还与无线耳机的麦克风连接,所述输出模块与所述无线耳机的主控芯片连接;
所述音频预处理模块用于获取所述麦克风接收并传输的音频信号,并从所述音频信号中提取音频特征;
所述语音智能识别模块用于获取所述音频特征,根据所述音频特征获取语音声纹,在所述语音声纹与预设声纹相匹配时,识别所述音频特征中是否包含语音命令,并将识别结果发送至所述微处理器;
所述微处理器用于在所述识别结果表示所述音频特征中包含语音命令时,输出与所述语音命令相对应的控制指令;
所述输出模块用于将所述控制指令传输至所述主控芯片。
2.根据权利要求1所述的无线耳机控制装置,其特征在于,所述音频预处理模块包括相互连接的音频接口模块和特征提取模块;所述音频接口模块还与所述麦克风连接,所述特征提取模块还与所述语音智能识别模块连接;
所述音频接口模块用于获取所述音频信号,并对所述音频信号进行去噪处理,将去噪后的音频信号发送至所述特征提取模块;
所述特征提取模块用于从所述去噪后的音频信号中提取音频特征。
3.根据权利要求1所述的无线耳机控制装置,其特征在于,所述语音智能识别模块包括深度学习神经网络;
通过所述深度学习神经网络从所述音频特征中获取语音声纹,并对所述语音声纹进行识别;
若所述语音声纹与预设声纹相匹配,识别所述音频特征中是否包含语音命令。
4.根据权利要求3所述的无线耳机控制装置,其特征在于,通过所述深度学习神经网络识别所述音频特征中是否包含语音命令,并将识别结果发送至所述微处理器。
5.根据权利要求1所述的无线耳机控制装置,其特征在于,还包括串行外设接口,所述串行外设接口分别与所述语音智能识别模块、所述微处理器连接;
所述串行外设接口用于为所述语音智能识别模块和所述微处理器连接外部存储设备。
6.一种应用如权利要求1至5中任意一项所述的无线耳机控制装置的控制方法,其特征在于,包括以下步骤:
通过所述音频预处理模块获取所述麦克风接收并传输的音频信号,并从所述音频信号中提取音频特征;
通过所述语音智能识别模块获取所述音频特征,根据所述音频特征获取语音声纹,在所述语音声纹与预设声纹相匹配时,识别所述音频特征中是否包含语音命令,并将识别结果发送至所述微处理器;
在所述识别结果表示所述音频特征中包含语音命令时,通过所述微处理器输出与所述语音命令相对应的控制指令;
通过所述输出模块将所述控制指令传输至所述主控芯片。
7.根据权利要求6所述的控制方法,其特征在于,在所述通过所述音频预处理模块获取所述麦克风接收并传输的音频信号之后,还包括以下步骤:
通过所述音频预处理模块对所述音频信号进行去噪处理。
8.根据权利要求6所述的控制方法,其特征在于,所述根据所述音频特征获取语音声纹,在所述语音声纹与预设声纹相匹配时,识别所述音频特征中是否包含语音命令的步骤包括以下步骤:
通过所述语音智能识别模块中的深度学习神经网络,从所述音频特征获取语音声纹,并对所述语音声纹进行识别;
若所述语音声纹与预设声纹相匹配,通过所述深度学习神经网络识别所述音频特征中是否包含语音命令。
9.根据权利要求6所述的控制方法,其特征在于,所述语音命令包括语音唤醒命令和/或语音动作命令;
所述在所述识别结果表示所述音频特征中包含语音命令时,通过所述微处理器输出与所述语音命令相对应的控制指令的步骤包括以下步骤:
在所述识别结果表示所述音频特征中包含语音唤醒命令时,通过所述微处理器输出与所述语音唤醒命令相对应的唤醒控制指令,所述唤醒控制指令用于将处于休眠状态的主控芯片唤醒;
和/或;
在所述识别结果表示所述音频特征中包含语音动作命令时,通过所述微处理器输出与所述语音动作命令相对应的动作控制指令,所述动作控制指令用于指示所述主控芯片执行控制动作。
10.根据权利要求6至9中任意一项所述的控制方法,其特征在于,还包括以下步骤:
通过所述音频预处理模块获取所述麦克风接收并传输的第一语音信号,并将从所述第一语音信号提取的第一语音特征传输至所述语音智能识别模块;
若通过所述语音智能识别模块判定所述第一语音特征与预设的声纹设置开启特征相匹配,通过所述音频预处理模块获取所述麦克风接收并传输的第二语音信号,并从所述第二语音信号中提取第二语音特征,通过所述语音智能识别模块将所述第二语音特征作为所述预设声纹;其中,所述第一语音信号和所述第二语音信号是用户根据声纹设置提示分别发出的语音对应的信号;
通过所述音频预处理模块获取所述麦克风接收并传输的第三语音信号,并将从所述第三语音信号提取的第三语音特征传输至所述语音智能识别模块;
若通过所述语音智能识别模块判定所述第三语音特征与预设的命令设置开启特征相匹配,通过所述音频预处理模块获取所述麦克风接收并传输的第四语音信号,并从所述第四语音信号中提取第四语音特征,通过所述语音智能识别模块将所述第四语音特征作为所述语音命令;其中,所述第三语音信号和所述第四语音信号是用户根据命令设置提示分别发出的语音对应的信号。
11.一种基于如权利要求1至5中任意一项所述的无线耳机控制装置的语音控制设置方法,其特征在于,所述输出模块为输入输出模块,所述语音控制设置方法包括以下步骤:
开启语音控制设置功能,并显示声纹参考信息;
接收用户依据所述声纹参考信息发出的语音作为第一语音样本,对所述第一语音样本进行语音格式预处理,获得预设格式的第一语音数据,从所述第一语音数据中提取第一语音特征,将所述第一语音特征通过无线方式发送至所述主控芯片,经所述输入输出模块和所述微处理器传输至所述语音智能识别模块,其中,所述语音智能识别模块将所述第一语音特征作为所述预设声纹;
显示命令参考信息;
接收用户依据所述命令参考信息发出的语音作为第二语音样本,对所述第二语音样本进行语音格式预处理,获得预设格式的第二语音数据,从所述第二语音数据中提取第二语音特征,将所述第二语音特征通过无线方式发送至所述主控芯片,经所述输入输出模块和所述微处理器传输至所述语音智能识别模块,其中,所述语音智能识别模块将所述第二语音特征作为所述语音命令。
12.一种基于如权利要求1至5中任意一项所述的无线耳机控制装置的语音控制设置系统,其特征在于,所述输出模块为输入输出模块,所述语音控制设置系统包括语音控制指示单元和语音控制录入单元;
所述语音控制指示单元用于开启语音控制设置功能,并显示声纹参考信息;
所述语音控制录入单元用于接收用户依据所述声纹参考信息发出的语音作为第一语音样本,对所述第一语音样本进行语音格式预处理,获得预设格式的第一语音数据,从所述第一语音数据中提取第一语音特征,将所述第一语音特征通过无线方式发送至所述主控芯片,经所述输入输出模块和所述微处理器传输至所述语音智能识别模块,其中,所述语音智能识别模块将所述第一语音特征作为所述预设声纹;
所述语音控制指示单元还用于显示命令参考信息;
所述语音控制录入单元还用于接收用户依据所述命令参考信息发出的语音作为第二语音样本,对所述第二语音样本进行语音格式预处理,获得预设格式的第二语音数据,从所述第二语音数据中提取第二语音特征,将所述第二语音特征通过无线方式发送至所述主控芯片,经所述输入输出模块和所述微处理器传输至所述语音智能识别模块,其中,所述语音智能识别模块将所述第二语音特征作为所述语音命令。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911310508.0A CN111105796A (zh) | 2019-12-18 | 2019-12-18 | 无线耳机控制装置及控制方法、语音控制设置方法和系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911310508.0A CN111105796A (zh) | 2019-12-18 | 2019-12-18 | 无线耳机控制装置及控制方法、语音控制设置方法和系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN111105796A true CN111105796A (zh) | 2020-05-05 |
Family
ID=70423234
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911310508.0A Pending CN111105796A (zh) | 2019-12-18 | 2019-12-18 | 无线耳机控制装置及控制方法、语音控制设置方法和系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN111105796A (zh) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111696553A (zh) * | 2020-06-05 | 2020-09-22 | 北京搜狗科技发展有限公司 | 一种语音处理方法、装置及可读介质 |
CN111951811A (zh) * | 2020-07-15 | 2020-11-17 | 珠海市杰理科技股份有限公司 | 蓝牙耳机控制方法、装置、蓝牙耳机及预设信息导入方法 |
CN112133313A (zh) * | 2020-10-21 | 2020-12-25 | 交互未来(北京)科技有限公司 | 基于单耳机语音对话过程捂嘴手势的识别方法 |
CN112954521A (zh) * | 2021-01-26 | 2021-06-11 | 深圳市富天达电子有限公司 | 一种具有声控免按键调节系统的蓝牙耳机 |
CN113411723A (zh) * | 2021-01-13 | 2021-09-17 | 神盾股份有限公司 | 语音助理系统 |
CN113810802A (zh) * | 2021-08-27 | 2021-12-17 | 青岛歌尔智能传感器有限公司 | 智能麦克风及电子装置 |
CN114120603A (zh) * | 2021-11-26 | 2022-03-01 | 歌尔科技有限公司 | 语音控制方法、耳机和存储介质 |
CN115376499A (zh) * | 2022-08-18 | 2022-11-22 | 东莞市乐移电子科技有限公司 | 一种应用于学习领域下的智能耳机的学习监控手段 |
Citations (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102152312A (zh) * | 2010-11-16 | 2011-08-17 | 深圳中科智酷机器人科技有限公司 | 机器人系统和机器人系统执行任务的方法 |
CN102779398A (zh) * | 2012-07-09 | 2012-11-14 | 深圳市同洲电子股份有限公司 | 一种智能家电的控制方法、装置及系统 |
CN103116483A (zh) * | 2012-11-29 | 2013-05-22 | 深圳市金立通信设备有限公司 | 一种调用微博的方法、装置及终端 |
CN103456303A (zh) * | 2013-08-08 | 2013-12-18 | 四川长虹电器股份有限公司 | 一种语音控制的方法和智能空调系统 |
CN103594089A (zh) * | 2013-11-18 | 2014-02-19 | 联想(北京)有限公司 | 一种语音识别方法及电子设备 |
CN104110884A (zh) * | 2014-03-14 | 2014-10-22 | 芜湖美的厨卫电器制造有限公司 | 热水器及其控制方法 |
CN104867495A (zh) * | 2013-08-28 | 2015-08-26 | 德州仪器公司 | 上下文感知的声音标志检测 |
CN104873062A (zh) * | 2015-05-29 | 2015-09-02 | 王旭昂 | 一种具有语音控制功能的水杯 |
CN105529029A (zh) * | 2015-12-28 | 2016-04-27 | 歌尔声学股份有限公司 | 音频控制装置、耳机以及便携式设备 |
CN106060235A (zh) * | 2016-05-05 | 2016-10-26 | 广东小天才科技有限公司 | 一种应用于移动设备的开关机控制方法及装置、移动设备 |
CN106611596A (zh) * | 2015-10-22 | 2017-05-03 | 德克萨斯仪器股份有限公司 | 模拟信息特征提取的基于时间的频率调谐 |
CN106920548A (zh) * | 2015-12-25 | 2017-07-04 | 比亚迪股份有限公司 | 语音控制装置、语音控制系统和语音控制方法 |
CN106958915A (zh) * | 2017-03-13 | 2017-07-18 | 合肥极友软件开发有限公司 | 一种基于语音识别技术的空调启闭智能手机控制系统 |
CN107895578A (zh) * | 2017-11-15 | 2018-04-10 | 百度在线网络技术(北京)有限公司 | 语音交互方法和装置 |
CN108132952A (zh) * | 2016-12-01 | 2018-06-08 | 百度在线网络技术(北京)有限公司 | 一种基于语音识别的主动型搜索方法和装置 |
CN109151637A (zh) * | 2018-08-21 | 2019-01-04 | 歌尔科技有限公司 | 无线耳机、用于无线耳机的智能语音控制系统及方法 |
CN109584875A (zh) * | 2018-12-24 | 2019-04-05 | 珠海格力电器股份有限公司 | 一种语音设备控制方法、装置、存储介质及语音设备 |
CN110225184A (zh) * | 2019-05-09 | 2019-09-10 | 张桂芳 | 一种智能家居用多功能音耳机 |
CN110322878A (zh) * | 2019-07-01 | 2019-10-11 | 华为技术有限公司 | 一种语音控制方法、电子设备及系统 |
CN110349589A (zh) * | 2019-07-12 | 2019-10-18 | 四川虹美智能科技有限公司 | 一种智能家电及智能家电的控制方法 |
US20190335268A1 (en) * | 2018-04-30 | 2019-10-31 | Avnera Corporation | Headphones having audio recognition neural net processor architecture |
CN110428844A (zh) * | 2019-07-31 | 2019-11-08 | 歌尔科技有限公司 | 电子设备的语音验证方法、电子设备、音频设备及介质 |
-
2019
- 2019-12-18 CN CN201911310508.0A patent/CN111105796A/zh active Pending
Patent Citations (22)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102152312A (zh) * | 2010-11-16 | 2011-08-17 | 深圳中科智酷机器人科技有限公司 | 机器人系统和机器人系统执行任务的方法 |
CN102779398A (zh) * | 2012-07-09 | 2012-11-14 | 深圳市同洲电子股份有限公司 | 一种智能家电的控制方法、装置及系统 |
CN103116483A (zh) * | 2012-11-29 | 2013-05-22 | 深圳市金立通信设备有限公司 | 一种调用微博的方法、装置及终端 |
CN103456303A (zh) * | 2013-08-08 | 2013-12-18 | 四川长虹电器股份有限公司 | 一种语音控制的方法和智能空调系统 |
CN104867495A (zh) * | 2013-08-28 | 2015-08-26 | 德州仪器公司 | 上下文感知的声音标志检测 |
CN103594089A (zh) * | 2013-11-18 | 2014-02-19 | 联想(北京)有限公司 | 一种语音识别方法及电子设备 |
CN104110884A (zh) * | 2014-03-14 | 2014-10-22 | 芜湖美的厨卫电器制造有限公司 | 热水器及其控制方法 |
CN104873062A (zh) * | 2015-05-29 | 2015-09-02 | 王旭昂 | 一种具有语音控制功能的水杯 |
CN106611596A (zh) * | 2015-10-22 | 2017-05-03 | 德克萨斯仪器股份有限公司 | 模拟信息特征提取的基于时间的频率调谐 |
CN106920548A (zh) * | 2015-12-25 | 2017-07-04 | 比亚迪股份有限公司 | 语音控制装置、语音控制系统和语音控制方法 |
CN105529029A (zh) * | 2015-12-28 | 2016-04-27 | 歌尔声学股份有限公司 | 音频控制装置、耳机以及便携式设备 |
CN106060235A (zh) * | 2016-05-05 | 2016-10-26 | 广东小天才科技有限公司 | 一种应用于移动设备的开关机控制方法及装置、移动设备 |
CN108132952A (zh) * | 2016-12-01 | 2018-06-08 | 百度在线网络技术(北京)有限公司 | 一种基于语音识别的主动型搜索方法和装置 |
CN106958915A (zh) * | 2017-03-13 | 2017-07-18 | 合肥极友软件开发有限公司 | 一种基于语音识别技术的空调启闭智能手机控制系统 |
CN107895578A (zh) * | 2017-11-15 | 2018-04-10 | 百度在线网络技术(北京)有限公司 | 语音交互方法和装置 |
US20190335268A1 (en) * | 2018-04-30 | 2019-10-31 | Avnera Corporation | Headphones having audio recognition neural net processor architecture |
CN109151637A (zh) * | 2018-08-21 | 2019-01-04 | 歌尔科技有限公司 | 无线耳机、用于无线耳机的智能语音控制系统及方法 |
CN109584875A (zh) * | 2018-12-24 | 2019-04-05 | 珠海格力电器股份有限公司 | 一种语音设备控制方法、装置、存储介质及语音设备 |
CN110225184A (zh) * | 2019-05-09 | 2019-09-10 | 张桂芳 | 一种智能家居用多功能音耳机 |
CN110322878A (zh) * | 2019-07-01 | 2019-10-11 | 华为技术有限公司 | 一种语音控制方法、电子设备及系统 |
CN110349589A (zh) * | 2019-07-12 | 2019-10-18 | 四川虹美智能科技有限公司 | 一种智能家电及智能家电的控制方法 |
CN110428844A (zh) * | 2019-07-31 | 2019-11-08 | 歌尔科技有限公司 | 电子设备的语音验证方法、电子设备、音频设备及介质 |
Non-Patent Citations (11)
Title |
---|
A. C. YÜZÜGÜLER 等: ""Analog Neural Networks With Deep-Submicrometer Nonlinear Synapses"", 《IEEE MICRO》 * |
G. F. D. BETTA 等: ""CMOS implementation of an analogically programmable cellular neural network"", 《IEEE TRANSACTIONS ON CIRCUITS AND SYSTEMS II: ANALOG AND DIGITAL SIGNAL PROCESSING》 * |
I-CHANG JOU 等: ""CMOS implementation of neural networks for speech recognition"", 《PROCEEDINGS OF APCCAS"94 - 1994 ASIA PACIFIC CONFERENCE ON CIRCUITS AND SYSTEMS》 * |
K. HALONEN 等: ""VLSI implementation of a reconfigurable cellular neural network containing local logic (CNNL)"", 《IEEE INTERNATIONAL WORKSHOP ON CELLULAR NEURAL NETWORKS AND THEIR APPLICATIONS》 * |
WAWRYN 等: ""Current mode circuits for programmable WTA neural network"", 《ANALOG INTEGRATED CIRCUITS AND SIGNAL PROCESSING》 * |
周伟良 等: "《单片机原理及应用》", 31 August 2005 * |
梁艳 等: ""基于CMOS模拟电路的径向基函数神经网络"", 《半导体学报》 * |
谢其中: "《微型计算机常用外部设备(第四版)》", 31 December 2004, 华中科技大学出版社 * |
贺静 等: ""一种基于CMOS的电流模式线性分类器"", 《云南大学学报(自然科学版)》 * |
赵力: "《语音信号处理》", 30 September 2009, 机械工业出版社 * |
郭玉霞 等: "《MCS-51单片机原理与应用》", 31 January 2010 * |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111696553A (zh) * | 2020-06-05 | 2020-09-22 | 北京搜狗科技发展有限公司 | 一种语音处理方法、装置及可读介质 |
CN111696553B (zh) * | 2020-06-05 | 2023-08-22 | 北京搜狗科技发展有限公司 | 一种语音处理方法、装置及可读介质 |
CN111951811A (zh) * | 2020-07-15 | 2020-11-17 | 珠海市杰理科技股份有限公司 | 蓝牙耳机控制方法、装置、蓝牙耳机及预设信息导入方法 |
CN112133313A (zh) * | 2020-10-21 | 2020-12-25 | 交互未来(北京)科技有限公司 | 基于单耳机语音对话过程捂嘴手势的识别方法 |
CN113411723A (zh) * | 2021-01-13 | 2021-09-17 | 神盾股份有限公司 | 语音助理系统 |
WO2022151651A1 (zh) * | 2021-01-13 | 2022-07-21 | 神盾股份有限公司 | 语音助理系统 |
CN112954521A (zh) * | 2021-01-26 | 2021-06-11 | 深圳市富天达电子有限公司 | 一种具有声控免按键调节系统的蓝牙耳机 |
CN113810802A (zh) * | 2021-08-27 | 2021-12-17 | 青岛歌尔智能传感器有限公司 | 智能麦克风及电子装置 |
CN113810802B (zh) * | 2021-08-27 | 2023-09-29 | 青岛歌尔智能传感器有限公司 | 智能麦克风及电子装置 |
CN114120603A (zh) * | 2021-11-26 | 2022-03-01 | 歌尔科技有限公司 | 语音控制方法、耳机和存储介质 |
CN114120603B (zh) * | 2021-11-26 | 2023-08-08 | 歌尔科技有限公司 | 语音控制方法、耳机和存储介质 |
CN115376499A (zh) * | 2022-08-18 | 2022-11-22 | 东莞市乐移电子科技有限公司 | 一种应用于学习领域下的智能耳机的学习监控手段 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111105796A (zh) | 无线耳机控制装置及控制方法、语音控制设置方法和系统 | |
CN111223497B (zh) | 一种终端的就近唤醒方法、装置、计算设备及存储介质 | |
CN108182937B (zh) | 关键词识别方法、装置、设备及存储介质 | |
CN106714023B (zh) | 一种基于骨传导耳机的语音唤醒方法、系统及骨传导耳机 | |
CN110428810B (zh) | 一种语音唤醒的识别方法、装置及电子设备 | |
CN104168353B (zh) | 蓝牙耳机及其语音交互控制方法 | |
CN105575395A (zh) | 语音唤醒方法及装置、终端及其处理方法 | |
CN110570873B (zh) | 声纹唤醒方法、装置、计算机设备以及存储介质 | |
CN110070863A (zh) | 一种语音控制方法及装置 | |
CN111432303B (zh) | 单耳耳机、智能电子设备、方法和计算机可读介质 | |
CN110428806B (zh) | 基于麦克风信号的语音交互唤醒电子设备、方法和介质 | |
CN108711429B (zh) | 电子设备及设备控制方法 | |
CN110097875B (zh) | 基于麦克风信号的语音交互唤醒电子设备、方法和介质 | |
CN110265011B (zh) | 一种电子设备的交互方法及其电子设备 | |
CN110223711B (zh) | 基于麦克风信号的语音交互唤醒电子设备、方法和介质 | |
CN103886236A (zh) | 声控解锁屏方法和移动终端 | |
CN110910876A (zh) | 物品声寻装置及控制方法、语音控制设置方法和系统 | |
CN112102850A (zh) | 情绪识别的处理方法、装置、介质及电子设备 | |
WO2016183961A1 (zh) | 智能设备的界面切换方法、系统、设备及非易失性计算机存储介质 | |
CN109308900B (zh) | 耳机装置、语音处理系统和语音处理方法 | |
CN110111776A (zh) | 基于麦克风信号的语音交互唤醒电子设备、方法和介质 | |
CN111524513A (zh) | 一种可穿戴设备及其语音传输的控制方法、装置及介质 | |
CN109151637A (zh) | 无线耳机、用于无线耳机的智能语音控制系统及方法 | |
CN109712623A (zh) | 语音控制方法、装置及计算机可读存储介质 | |
CN112951243A (zh) | 语音唤醒方法、装置、芯片、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20200505 |
|
RJ01 | Rejection of invention patent application after publication |