CN112037765A - 基于bnep协议的蓝牙音频设备语音识别系统的方法 - Google Patents
基于bnep协议的蓝牙音频设备语音识别系统的方法 Download PDFInfo
- Publication number
- CN112037765A CN112037765A CN202010921004.9A CN202010921004A CN112037765A CN 112037765 A CN112037765 A CN 112037765A CN 202010921004 A CN202010921004 A CN 202010921004A CN 112037765 A CN112037765 A CN 112037765A
- Authority
- CN
- China
- Prior art keywords
- bluetooth
- module
- voice
- mobile equipment
- bnep
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 51
- 230000005540 biological transmission Effects 0.000 claims abstract description 4
- 238000001228 spectrum Methods 0.000 claims description 12
- 230000009466 transformation Effects 0.000 claims description 10
- 230000008569 process Effects 0.000 claims description 9
- 239000012634 fragment Substances 0.000 claims description 6
- 230000007704 transition Effects 0.000 claims description 6
- 206010052804 Drug tolerance Diseases 0.000 claims description 3
- 238000004364 calculation method Methods 0.000 claims description 3
- 238000006243 chemical reaction Methods 0.000 claims description 3
- 125000004122 cyclic group Chemical group 0.000 claims description 3
- 238000003066 decision tree Methods 0.000 claims description 3
- 238000013135 deep learning Methods 0.000 claims description 3
- 238000000605 extraction Methods 0.000 claims description 3
- 238000001914 filtration Methods 0.000 claims description 3
- 238000009432 framing Methods 0.000 claims description 3
- 230000026781 habituation Effects 0.000 claims description 3
- 230000000977 initiatory effect Effects 0.000 claims description 2
- 238000004891 communication Methods 0.000 abstract description 2
- 230000000875 corresponding effect Effects 0.000 description 12
- 238000010586 diagram Methods 0.000 description 2
- 239000000835 fiber Substances 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 230000007547 defect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/02—Feature extraction for speech recognition; Selection of recognition unit
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/14—Speech classification or search using statistical models, e.g. Hidden Markov Models [HMMs]
- G10L15/142—Hidden Markov Models [HMMs]
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/08—Speech classification or search
- G10L15/18—Speech classification or search using natural language modelling
- G10L15/183—Speech classification or search using natural language modelling using context dependencies, e.g. language models
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/26—Speech to text systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L15/00—Speech recognition
- G10L15/28—Constructional details of speech recognition systems
- G10L15/30—Distributed recognition, e.g. in client-server systems, for mobile phones or network applications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/18—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/03—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
- G10L25/24—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being the cepstrum
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W4/00—Services specially adapted for wireless communication networks; Facilities therefor
- H04W4/80—Services using short range communication, e.g. near-field communication [NFC], radio-frequency identification [RFID] or low energy communication
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W76/00—Connection management
- H04W76/10—Connection setup
- H04W76/14—Direct-mode setup
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04W—WIRELESS COMMUNICATION NETWORKS
- H04W84/00—Network topologies
- H04W84/18—Self-organising networks, e.g. ad-hoc networks or sensor networks
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Human Computer Interaction (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Computer Networks & Wireless Communication (AREA)
- Probability & Statistics with Applications (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Artificial Intelligence (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Telephonic Communication Services (AREA)
Abstract
本发明提供一种基于BNEP协议的蓝牙音频设备语音识别系统的方法,属于通信技术领域。基于BNEP协议的蓝牙音频设备语音识别系统,包括蓝牙耳机、移动设备端、后台服务器,所述蓝牙耳机包括语音采集模块、耳机蓝牙模块,所述移动设备端包括移动设备端蓝牙模块、网络模块,所述后台服务器包括后台服务器蓝牙模块、语音信号解析模块。基于BNEP协议的蓝牙音频设备语音识别系统的方法,采用BNEP实现蓝牙耳机的数据传输,蓝牙耳机直接通过耳机蓝牙模块和移动设备端蓝牙模块通过BNEP组成临时自组织网,通过移动设备端的网络模块访问远端网络。
Description
技术领域
本发明属于通信技术领域,尤其是涉及一种基于BNEP协议的蓝牙音频设备语音识别系统的方法。
背景技术
现有技术通过蓝牙音频设备配置的语音采集模块及运行在移动终端的软件,收集蓝牙音频设备输入的语音信号,将信号传输给移动终端的软件,由软件进行语音识别,将识别后的文字信息显示在移动终端后再由手机识别文字并发起相应动作。
现有技术的缺陷在于:软件端的数据库需要不断迭代数据以保证识别检索功能正常;由软件端进行识别,速度较慢、识别质量较低;用户必须在移动终端下载相应的软件才能实现语音识别功能;下载软件占用用户移动终端的内存资源,数据库越强大占用的资源越多;不同的移动终端存在的软件兼容性问题。
发明内容
本发明旨在解决上述技术问题,提供一种基于BNEP协议的蓝牙音频设备语音识别系统的方法。
为了达到上述目的,本发明采用如下技术方案:
基于BNEP协议的蓝牙音频设备语音识别系统,包括蓝牙耳机、移动设备端、后台服务器,所述蓝牙耳机包括语音采集模块、耳机蓝牙模块,所述移动设备端包括移动设备端蓝牙模块、网络模块,所述后台服务器包括后台服务器蓝牙模块、语音信号解析模块;所述语音采集模块,用于接收语音输入信号;所述耳机蓝牙模块和所述移动设备端蓝牙模块通过BNEP组成临时自组织网,实现蓝牙耳机与所述移动设备端的连接;所述后台服务器蓝牙模块,用于向蓝牙耳机发送申请连接请求、接收移动设备端发送的语音解析请求、发送语音解析数据至移动设备端;所述移动设备端蓝牙模块用于向后台服务器发起解析请求、用于接收语音解析数据;所述语音信号解析模块用于解析语音信号;所述网络模块用于连接网络。
基于BNEP协议的蓝牙音频设备语音识别系统的方法,包括以下步骤:
s1、后台服务器申请连接蓝牙耳机;
s2、耳机蓝牙模块和移动设备端蓝牙模块通过BNEP组成临时自组织网,实现蓝牙耳机与所述移动设备端的连接,所述移动设备端开启网络,所述蓝牙耳机通过BNEP与所述后台服务器实现数据传输;
s3、蓝牙耳机的语音采集模块接收语音输入信号;
s4、移动设备端向后台服务器发起语音解析请求;
s5、后台服务器的语音信号解析模块解析语音信号;
s6、后台服务器发送语音解析数据至移动设备端;
s7、移动设备端接收解析数据并完成指令。
作为优选,耳机蓝牙模块和移动设备端蓝牙模块的蓝牙配对选择NumericComparison的方式,即双方都显示一个6位的数字,由用户来核对数字是否一致,并输入Yes/No,两端Yes表示一致即可配对,可以防止中间人攻击。
作为优选,还包括蓝牙耳机加密方法,所述加密方法采用E0算法,EO加密算法电路包括线性反馈移位寄存器组、组合逻辑门和复合器,E0算法是蓝牙链路层的加密算法,属于流加密方式,即将数据流与密钥比特流进行异或运算,E0算法对每一分组的有效载荷的加密是单独进行的,它发生在循环冗余校验之后,前向纤错编码之前,利用线性反馈移位寄存器产生伪随机序列,从而形成可用于加密的密钥流,然后将密钥流与要加密的数据流进行异或,实现加密,解密时把密文与同样的密钥流再异或一次就可得到明文。
作为优选,E0算法生成二进制密码流Kcipher,即加密密钥Kc,所述线性反馈移位寄存器组包括4个线性反馈移位寄存器,每个线性反馈移位寄存器的输出为一个16状态的简单有限状态机的组合,该状态机的输出为字节流序列,或是初始化阶段的随机初始值,4个线性反馈移位寄存器的长度分别为:L1=25,L2=31,L3=33,L4=39,总长度为128位。
作为优选,在E0算法中,加密密钥Kc被修改为实际加密密钥Kc′,Kc′可在1-16字节间变化,但其最大有效长度由厂商预置。
作为优选,步骤s2中,蓝牙耳机开机并开始广播,移动设备端打开蓝牙后会扫描蓝牙设备,蓝牙耳机被扫描到会回复移动设备端;移动设备端点击连接,蓝牙耳机收到移动设备端的连接要求后回发出安全请求要求移动设备端进行配对,移动设备端收到蓝牙耳机要求配对的广播包后,就会发起配对请求;蓝牙耳机收到移动设备端的配对请求后,会回复移动设备端同意配对;移动设备端和蓝牙耳机就会进行信息传输并生成配对秘钥;秘钥生成后移动设备端和蓝牙耳机保存配对信息,配对完成。
作为优选,步骤s5中,语音信号解析模块的解析语音信号方法包括:将麦克风采集到的数据进行特征提取,然后根据声学模型和发音字典使用决策树搜索输入特征序列对应的字或词,最后根据语言模型来确定输入特征对应的字或者词。
作为优选,语音信号解析模块的解析语音信号方法包括以下步骤:
s51、信号处理:用于声学特征提取,声学模型可以根据该特征计算声学单元各成分的概率,对于基于深度学习的方法则可以直接由声学特征到文字,提取的特征为梅尔频率倒谱系数MFCC;
提取MFCC特征的过程如下:
s511、先对语音进行预加重、分帧和加窗;
s512、对每一个短时分析窗,通过FFT得到对应的频谱;
s513、将上面的频谱通过Mel滤波器组得到Mel频谱;
s514、在Mel频谱上面进行倒谱分析:取对数,做逆变换,实际逆变换一般是通过DCT离散余弦变换来实现,取DCT后的第2个到第13个系数作为MFCC系数,获得Mel频率倒谱系数MFCC,这个MFCC就是这帧语音的特征;
s52、生成声学模型:使用混合高斯-隐马尔科夫模型GMM-HMM作为声学模型,即把信号处理得到的MFCC特征正确的识别成对应HMM state 系列,这个过程涉及两个概率,一是HMM中的似然Likelihood,即把当前frame的特征识别为这个state的概率,二是状态转移概率Transition probabilities,即把上个state转化为这个state的概率,这个过程是HMM中说的 Decoding---这里指计算层面,一个序列转化为另一个序列理论上有指数级转化方式,所以每一个frame只取概率最高的那个state;
s53、生成语言模型:语言模型是对人类说话习惯性的描述,采用的语言模型是基于统计的N元文法n-gram,n-gram是一种基于统计语言模型的算法:将文本里面的内容按照字节进行大小为n的滑动窗口操作,形成了长度是n 的字节片段序列,每一个字节片段称为gram,对所有gram的出现频度进行统计,并且按照事先设定好的阈值进行过滤,形成关键gram列表,也就是这个文本的向量特征空间,列表中的每一种gram就是一个特征向量维度;
s54、解码器解码:解码器根据输入的信号、声学特征、语言模型以及发音词典寻找最大概率的词串。
作为优选,所述的移动设备端为手机,所述的移动设备端与后台服务器的连接网络为3G、4G、5G或WIFI。
采用上述技术方案后,本发明具有如下优点:
本发明蓝牙耳机通过BNEP协议,并通过移动设备端的网络模块连接网络,实现与后台服务器的连接后,就可进行数据流的交互;蓝牙耳机接收输入的语音信号后可主动发起解析请求,通过蓝牙传输给移动设备端后连接后台服务器数据库进行解析;解析完成后,后台服务器端通过网络下发解析数据至移动设备端;移动设备端收到解析数据后可在移动设备端发起相应控制指令。
本发明通过BNEP,用户移动设备端设备无需下载APP,仅需要连接网络就可以实现使用后台服务器数据库解析语音信号,实现蓝牙音频设备语音控制。极大的提升用户的操作便利性、节约用户的内存资源、提高语音解析速度与质量。
附图说明
图1为本发明的基于BNEP协议的蓝牙音频设备语音识别系统的结构示意图;
图2为本发明的基于BNEP协议的蓝牙音频设备语音识别系统的方法的步骤流程图;
图3为本发明的语音信号解析方法的步骤流程图;
图4为本发明的EO加密算法电路的结构示意图;
图中:
1-蓝牙耳机;101-语音采集模块;102-耳机蓝牙模块;2-移动设备端;201-移动设备端蓝牙模块;202-网络模块;3-后台服务器;301-后台服务器蓝牙模块;302-语音信号解析模块。
具体实施方式
以下结合附图及具体实施例,对本发明作进一步的详细说明。
如图1所示,基于BNEP协议的蓝牙音频设备语音识别系统,包括蓝牙耳机1、移动设备端2、后台服务器3。所述蓝牙耳机1包括语音采集模块101、耳机蓝牙模块102;所述移动设备端2包括移动设备端蓝牙模块201、网络模块202;所述后台服务器3包括后台服务器蓝牙模块301、语音信号解析模块302。
所述语音采集模块101,用于接收语音输入信号;所述耳机蓝牙模块102和所述移动设备端蓝牙模块201通过BNEP组成临时自组织网,实现蓝牙耳机1与所述移动设备端2的连接;所述后台服务器蓝牙模块301,用于向蓝牙耳机1发送申请连接请求、接收移动设备端2发送的语音解析请求、发送语音解析数据至移动设备端2;所述移动设备端蓝牙模块201用于向后台服务器3发起解析请求、用于接收语音解析数据;所述语音信号解析模块302用于解析语音信号;所述网络模块202用于连接网络;所述的移动设备端2为手机,所述的移动设备端2与后台服务器3的连接网络为3G、4G、5G或WIFI。
如图2所示,本发明还提供一种基于BNEP协议的蓝牙音频设备语音识别系统的方法,包括以下步骤:
s1、后台服务器3申请连接蓝牙耳机1;
s2、耳机蓝牙模块102和移动设备端蓝牙模块201通过BNEP组成临时自组织网,实现蓝牙耳机1与所述移动设备端2的连接,所述移动设备端2开启网络,所述蓝牙耳机1通过BNEP与所述后台服务器3实现数据传输;
s3、蓝牙耳机1的语音采集模块101接收语音输入信号;
s4、移动设备端2向后台服务器3发起语音解析请求;
s5、后台服务器3的语音信号解析模块302解析语音信号;
s6、后台服务器3发送语音解析数据至移动设备端2;
s7、移动设备端2接收解析数据并完成指令。
耳机蓝牙模块102和移动设备端蓝牙模块201的蓝牙配对选择NumericComparison的方式,即双方都显示一个6位的数字,由用户来核对数字是否一致,并输入Yes/No,两端Yes表示一致即可配对,可以防止中间人攻击。
本发明还包括蓝牙耳机加密方法,所述加密方法采用E0算法,EO加密算法电路包括线性反馈移位寄存器组、组合逻辑门和复合器,E0算法是蓝牙链路层的加密算法,属于流加密方式,即将数据流与密钥比特流进行异或运算,E0算法对每一分组的有效载荷的加密是单独进行的,它发生在循环冗余校验之后,前向纤错编码之前,利用线性反馈移位寄存器产生伪随机序列,从而形成可用于加密的密钥流,然后将密钥流与要加密的数据流进行异或,实现加密,解密时把密文与同样的密钥流再异或一次就可得到明文。
如图4所示,EO加密算法电路包括线性反馈移位寄存器组(Linear FeedbackShift Registcr,LFSR)、组合逻辑和复合器(Blend),其中Blend中T1和T2为线性变换网络,Z-1为延迟网络。LFSRs的长度分别为25、31、33、39。采用多个LFSR是为了增加生成的伪随机序列的长度和随机性。当产生加密流时,LFSRs需要赋予初值(种子)。四个LFSR再加上各是两位的Ct和Ct+1共计132位,由主设备地址ADR(48位)、时钟CL(26位)和链路层加密私钥Kc(最多128位)提供,Kc由E0算法产生的。
E0算法生成二进制密码流Kcipher,即加密密钥Kc,所述线性反馈移位寄存器组包括4个线性反馈移位寄存器,每个线性反馈移位寄存器的输出为一个16状态的简单有限状态机的组合,该状态机的输出为字节流序列,或是初始化阶段的随机初始值,4个线性反馈移位寄存器的长度分别为:L1=25,L2=31,L3=33,L4=39,总长度为128位。
在E0算法中,加密密钥Kc被修改为实际加密密钥Kc′,Kc′可在1-16字节间变化,但其最大有效长度由厂商预置。
步骤s2中,蓝牙耳机1开机并开始广播,移动设备端2打开蓝牙后会扫描蓝牙设备,蓝牙耳机1被扫描到会回复移动设备端2;移动设备端2点击连接,蓝牙耳机1收到移动设备端2的连接要求后回发出安全请求要求移动设备端2进行配对,移动设备端2收到蓝牙耳机1要求配对的广播包后,就会发起配对请求;蓝牙耳机1收到移动设备端2的配对请求后,会回复移动设备端2同意配对;移动设备端2和蓝牙耳机1就会进行信息传输并生成配对秘钥;秘钥生成后移动设备端2和蓝牙耳机1保存配对信息,配对完成。
步骤s5中,语音信号解析模块302的解析语音信号方法包括:将麦克风采集到的数据进行特征提取,然后根据声学模型和发音字典使用决策树搜索输入特征序列对应的字或词,最后根据语言模型来确定输入特征对应的字或者词。
语音信号解析模块302的解析语音信号方法具体包括以下步骤:
s51、信号处理:用于声学特征提取,声学模型可以根据该特征计算声学单元各成分的概率,对于基于深度学习的方法则可以直接由声学特征到文字,提取的特征为梅尔频率倒谱系数MFCC;
提取MFCC特征的过程如下:
s511、先对语音进行预加重、分帧和加窗;
s512、对每一个短时分析窗,通过FFT得到对应的频谱;
s513、将上面的频谱通过Mel滤波器组得到Mel频谱;
s514、在Mel频谱上面进行倒谱分析:取对数,做逆变换,实际逆变换一般是通过DCT离散余弦变换来实现,取DCT后的第2个到第13个系数作为MFCC系数,获得Mel频率倒谱系数MFCC,这个MFCC就是这帧语音的特征;
s52、生成声学模型:使用混合高斯-隐马尔科夫模型GMM-HMM作为声学模型,即把信号处理得到的MFCC特征正确的识别成对应HMM state 系列,这个过程涉及两个概率,一是HMM中的似然Likelihood,即把当前frame的特征识别为这个state的概率,二是状态转移概率Transition probabilities,即把上个state转化为这个state的概率,这个过程是HMM中说的 Decoding---这里指计算层面,一个序列转化为另一个序列理论上有指数级转化方式,所以每一个frame只取概率最高的那个state;
s53、生成语言模型:语言模型是对人类说话习惯性的描述,采用的语言模型是基于统计的N元文法n-gram,n-gram是一种基于统计语言模型的算法:将文本里面的内容按照字节进行大小为n的滑动窗口操作,形成了长度是n 的字节片段序列,每一个字节片段称为gram,对所有gram的出现频度进行统计,并且按照事先设定好的阈值进行过滤,形成关键gram列表,也就是这个文本的向量特征空间,列表中的每一种gram就是一个特征向量维度;
s54、解码器解码:解码器根据输入的信号、声学特征、语言模型以及发音词典寻找最大概率的词串。
本发明蓝牙耳机1通过BNEP协议,并通过移动设备端2的网络模块202连接网络,实现与后台服务器3的连接后,就可进行数据流的交互;蓝牙耳机1接收输入的语音信号后可主动发起解析请求,通过蓝牙传输给移动设备端2后连接后台服务器3数据库进行解析;解析完成后,后台服务器3端通过网络下发解析数据至移动设备端2;移动设备端2收到解析数据后可在移动设备端2发起相应控制指令。
本发明通过BNEP,用户移动设备端设备无需下载APP,仅需要连接网络就可以实现使用后台服务器3数据库解析语音信号,实现蓝牙音频设备语音控制。极大的提升用户的操作便利性、节约用户的内存资源、提高语音解析速度与质量。
除上述优选实施例外,本发明还有其他的实施方式,本领域技术人员可以根据本发明作出各种改变和变形,只要不脱离本发明的精神,均应属于本发明所附权利要求所定义的范围。
Claims (9)
1.基于BNEP协议的蓝牙音频设备语音识别系统的方法,其特征在于,
所述蓝牙音频设备语音识别系统包括蓝牙耳机(1)、移动设备端(2)、后台服务器(3),所述蓝牙耳机(1)包括语音采集模块(101)、耳机蓝牙模块(102),所述移动设备端(2)包括移动设备端蓝牙模块(201)、网络模块(202),所述后台服务器(3)包括后台服务器蓝牙模块(301)、语音信号解析模块(302);所述语音采集模块(101),用于接收语音输入信号;所述耳机蓝牙模块(102)和所述移动设备端蓝牙模块(201)通过BNEP组成临时自组织网,实现蓝牙耳机(1)与所述移动设备端(2)的连接;所述后台服务器蓝牙模块(301),用于向蓝牙耳机(1)发送申请连接请求、接收移动设备端(2)发送的语音解析请求、发送语音解析数据至移动设备端(2);所述移动设备端蓝牙模块(201)用于向后台服务器(3)发起解析请求、用于接收语音解析数据;所述语音信号解析模块(302)用于解析语音信号;所述网络模块(202)用于连接网络;
基于BNEP协议的蓝牙音频设备语音识别系统的方法包括以下步骤:
s1、后台服务器(3)申请连接蓝牙耳机(1);
s2、耳机蓝牙模块(102)和移动设备端蓝牙模块(201)通过BNEP组成临时自组织网,实现蓝牙耳机(1)与所述移动设备端(2)的连接,所述移动设备端(2)开启网络,所述蓝牙耳机(1)通过BNEP与所述后台服务器(3)实现数据传输;
s3、蓝牙耳机(1)的语音采集模块(101)接收语音输入信号;
s4、移动设备端(2)向后台服务器(3)发起语音解析请求;
s5、后台服务器(3)的语音信号解析模块(302)解析语音信号;
s6、后台服务器(3)发送语音解析数据至移动设备端(2);
s7、移动设备端(2)接收解析数据并完成指令。
2.如权利要求1所述的基于BNEP协议的蓝牙音频设备语音识别系统的方法,其特征在于,耳机蓝牙模块(102)和移动设备端蓝牙模块(201)的蓝牙配对选择Numeric Comparison的方式,即双方都显示一个6位的数字,由用户来核对数字是否一致,并输入Yes/No,两端Yes表示一致即可配对,可以防止中间人攻击。
3.如权利要求1所述的基于BNEP协议的蓝牙音频设备语音识别系统的方法,其特征在于,还包括蓝牙耳机加密方法,所述加密方法采用E0算法,EO加密算法电路包括线性反馈移位寄存器组、组合逻辑门和复合器,E0算法是蓝牙链路层的加密算法,属于流加密方式,即将数据流与密钥比特流进行异或运算,E0算法对每一分组的有效载荷的加密是单独进行的,它发生在循环冗余校验之后,前向纤错编码之前,利用线性反馈移位寄存器产生伪随机序列,从而形成可用于加密的密钥流,然后将密钥流与要加密的数据流进行异或,实现加密,解密时把密文与同样的密钥流再异或一次就可得到明文。
4.如权利要求3所述的基于BNEP协议的蓝牙音频设备语音识别系统的方法,其特征在于,E0算法生成二进制密码流Kcipher,即加密密钥Kc,所述线性反馈移位寄存器组包括4个线性反馈移位寄存器,每个线性反馈移位寄存器的输出为一个16状态的简单有限状态机的组合,该状态机的输出为字节流序列,或是初始化阶段的随机初始值,4个线性反馈移位寄存器的长度分别为:L1=25,L2=31,L3=33,L4=39,总长度为128位。
5.如权利要求4所述的基于BNEP协议的蓝牙音频设备语音识别系统的方法,其特征在于,在E0算法中,加密密钥Kc被修改为实际加密密钥Kc′,Kc′可在1-16字节间变化,但其最大有效长度由厂商预置。
6.如权利要求1所述的基于BNEP协议的蓝牙音频设备语音识别系统的方法,其特征在于,步骤s2中,蓝牙耳机(1)开机并开始广播,移动设备端(2)打开蓝牙后会扫描蓝牙设备,蓝牙耳机(1)被扫描到会回复移动设备端(2);移动设备端(2)点击连接,蓝牙耳机(1)收到移动设备端(2)的连接要求后回发出安全请求要求移动设备端(2)进行配对,移动设备端(2)收到蓝牙耳机(1)要求配对的广播包后,就会发起配对请求;蓝牙耳机(1)收到移动设备端(2)的配对请求后,会回复移动设备端(2)同意配对;移动设备端(2)和蓝牙耳机(1)就会进行信息传输并生成配对秘钥;秘钥生成后移动设备端(2)和蓝牙耳机(1)保存配对信息,配对完成。
7.如权利要求1所述的基于BNEP协议的蓝牙音频设备语音识别系统的方法,其特征在于,步骤s5中,语音信号解析模块(302)的解析语音信号方法包括:将麦克风采集到的数据进行特征提取,然后根据声学模型和发音字典使用决策树搜索输入特征序列对应的字或词,最后根据语言模型来确定输入特征对应的字或者词。
8.如权利要求1所述的基于BNEP协议的蓝牙音频设备语音识别系统的方法,其特征在于,语音信号解析模块(302)的解析语音信号方法包括以下步骤:
s51、信号处理:用于声学特征提取,声学模型可以根据该特征计算声学单元各成分的概率,对于基于深度学习的方法则可以直接由声学特征到文字,提取的特征为梅尔频率倒谱系数MFCC;
提取MFCC特征的过程如下:
s511、先对语音进行预加重、分帧和加窗;
s512、对每一个短时分析窗,通过FFT得到对应的频谱;
s513、将上面的频谱通过Mel滤波器组得到Mel频谱;
s514、在Mel频谱上面进行倒谱分析:取对数,做逆变换,实际逆变换一般是通过DCT离散余弦变换来实现,取DCT后的第2个到第13个系数作为MFCC系数,获得Mel频率倒谱系数MFCC,这个MFCC就是这帧语音的特征;
s52、生成声学模型:使用混合高斯-隐马尔科夫模型GMM-HMM作为声学模型,即把信号处理得到的MFCC特征正确的识别成对应HMM state 系列,这个过程涉及两个概率,一是HMM中的似然Likelihood,即把当前frame的特征识别为这个state的概率,二是状态转移概率Transition probabilities,即把上个state转化为这个state的概率,这个过程是HMM中说的 Decoding---这里指计算层面,一个序列转化为另一个序列理论上有指数级转化方式,所以每一个frame只取概率最高的那个state;
s53、生成语言模型:语言模型是对人类说话习惯性的描述,采用的语言模型是基于统计的N元文法n-gram,n-gram是一种基于统计语言模型的算法:将文本里面的内容按照字节进行大小为n的滑动窗口操作,形成了长度是n 的字节片段序列,每一个字节片段称为gram,对所有gram的出现频度进行统计,并且按照事先设定好的阈值进行过滤,形成关键gram列表,也就是这个文本的向量特征空间,列表中的每一种gram就是一个特征向量维度;
s54、解码器解码:解码器根据输入的信号、声学特征、语言模型以及发音词典寻找最大概率的词串。
9.如权利要求1所述的基于BNEP协议的蓝牙音频设备语音识别系统的方法,其特征在于,所述的移动设备端(2)为手机,所述的移动设备端(2)与后台服务器(3)的连接网络为3G、4G、5G或WIFI。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010921004.9A CN112037765A (zh) | 2020-09-04 | 2020-09-04 | 基于bnep协议的蓝牙音频设备语音识别系统的方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202010921004.9A CN112037765A (zh) | 2020-09-04 | 2020-09-04 | 基于bnep协议的蓝牙音频设备语音识别系统的方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112037765A true CN112037765A (zh) | 2020-12-04 |
Family
ID=73591464
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202010921004.9A Pending CN112037765A (zh) | 2020-09-04 | 2020-09-04 | 基于bnep协议的蓝牙音频设备语音识别系统的方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112037765A (zh) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113380261A (zh) * | 2021-05-26 | 2021-09-10 | 特斯联科技集团有限公司 | 一种人工智能语音采集处理器及方法 |
CN115168563A (zh) * | 2022-09-05 | 2022-10-11 | 深圳市华付信息技术有限公司 | 一种基于意图识别的机场服务引导方法、系统及装置 |
TWI816219B (zh) * | 2021-06-15 | 2023-09-21 | 美商惠普發展公司有限責任合夥企業 | 用於基於確認之音訊通訊之運算裝置及非暫時性電腦可讀媒體 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107277272A (zh) * | 2017-07-25 | 2017-10-20 | 深圳市芯中芯科技有限公司 | 一种基于软件app的蓝牙设备语音交互方法及系统 |
CN110446132A (zh) * | 2019-08-07 | 2019-11-12 | 深圳市和信电子有限公司 | 一种实时翻译tws蓝牙耳机及其使用方法 |
CN111083678A (zh) * | 2018-10-22 | 2020-04-28 | 深圳市冠旭电子股份有限公司 | 蓝牙音箱的播放控制方法、系统及智能设备 |
-
2020
- 2020-09-04 CN CN202010921004.9A patent/CN112037765A/zh active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107277272A (zh) * | 2017-07-25 | 2017-10-20 | 深圳市芯中芯科技有限公司 | 一种基于软件app的蓝牙设备语音交互方法及系统 |
CN111083678A (zh) * | 2018-10-22 | 2020-04-28 | 深圳市冠旭电子股份有限公司 | 蓝牙音箱的播放控制方法、系统及智能设备 |
CN110446132A (zh) * | 2019-08-07 | 2019-11-12 | 深圳市和信电子有限公司 | 一种实时翻译tws蓝牙耳机及其使用方法 |
Non-Patent Citations (2)
Title |
---|
施云波著: "《无线传感器网络技术概论》", 30 October 2017 * |
牛少彰等: "《移动互联网安全》", 30 June 2020 * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113380261A (zh) * | 2021-05-26 | 2021-09-10 | 特斯联科技集团有限公司 | 一种人工智能语音采集处理器及方法 |
TWI816219B (zh) * | 2021-06-15 | 2023-09-21 | 美商惠普發展公司有限責任合夥企業 | 用於基於確認之音訊通訊之運算裝置及非暫時性電腦可讀媒體 |
CN115168563A (zh) * | 2022-09-05 | 2022-10-11 | 深圳市华付信息技术有限公司 | 一种基于意图识别的机场服务引导方法、系统及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112037765A (zh) | 基于bnep协议的蓝牙音频设备语音识别系统的方法 | |
US10341048B2 (en) | Channel encoding and decoding method and apparatus | |
CN104602364A (zh) | 无线设备连接无线接入点的方法及无线设备、智能终端 | |
KR101773156B1 (ko) | 광 네트워크 시스템을 위한 통신 방법, 시스템 및 장치 | |
CN106452607B (zh) | 一种传输、解析信息的方法及装置 | |
CN108418683B (zh) | 一种基于汉字结构特征的无载体文本隐写方法 | |
EP3337200A1 (en) | Short message transmission and reception method and device | |
CN112437060B (zh) | 一种数据传输方法、装置、计算机设备及存储介质 | |
CN105790853A (zh) | 一种声波传输字符数据的方法及装置 | |
CN108093400B (zh) | 发送、接收WiFi参数的装置及方法 | |
CN103956163A (zh) | 普通语音与加密语音的相互转换系统及方法 | |
CN108737353B (zh) | 一种基于数据分析系统的数据加密方法及装置 | |
CN113795023B (zh) | 一种基于混沌序列和分组加密的蓝牙数据传输加密方法 | |
CN104869570A (zh) | 一种基于语言信道的说话终端确认方法 | |
CN114257562A (zh) | 即时通讯方法、装置、电子设备和计算机可读存储介质 | |
CN109818743B (zh) | 一种椭圆曲线公钥文本化传递方法及系统 | |
WO2023236984A1 (zh) | 无线网络的接入方法、装置、设备和存储介质 | |
EP3910508A1 (en) | System and methods for speaker identification, message compression and/or message replay in a communications environment | |
CN112367125B (zh) | 信息传输方法、装置、通信设备和计算机可读存储介质 | |
CN108650264A (zh) | 数据传输方法、装置、设备及计算机可读存储介质 | |
CN114244911A (zh) | 语音解析方法、装置、接收端设备及存储介质 | |
CN112202815B (zh) | 一种可信数字身份离线核验装置及方法 | |
CN113393860A (zh) | 语音加密、语音解密、模型训练、语音通信方法及装置 | |
CN111065094B (zh) | 通讯录传输方法、装置、存储介质及电子设备 | |
CN117294473A (zh) | 音频数据加密传输方法、装置、电子设备及可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20201204 |