CN103559883A - 一种基于语音频域指纹的方舱对讲机开启方法 - Google Patents

一种基于语音频域指纹的方舱对讲机开启方法 Download PDF

Info

Publication number
CN103559883A
CN103559883A CN201310372408.7A CN201310372408A CN103559883A CN 103559883 A CN103559883 A CN 103559883A CN 201310372408 A CN201310372408 A CN 201310372408A CN 103559883 A CN103559883 A CN 103559883A
Authority
CN
China
Prior art keywords
audio
frequency
energy
frequency band
voice
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201310372408.7A
Other languages
English (en)
Inventor
郑静晨
郝昱文
李晓雪
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN201310372408.7A priority Critical patent/CN103559883A/zh
Publication of CN103559883A publication Critical patent/CN103559883A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Telephonic Communication Services (AREA)

Abstract

本发明给出了一种基于语音频域指纹的方舱对讲机开启方法,对讲机可自动识别用户的语音,然后开启对讲模式,用户无需在讲话前按下对讲按钮,便可直接对讲,从而使得用户的双手可以更加自由地操作。

Description

一种基于语音频域指纹的方舱对讲机开启方法
技术领域
本发明涉及信号处理、数据通信和方舱医院等领域,具体的说,本发明给出了一种基于语音频域指纹的方舱对讲机开启方法,对讲机可自动识别用户的语音,然后开启对讲模式,用户无需在讲话前按下对讲按钮,便可直接对讲,从而使得用户的双手可以更加自由地进行其它操作。
背景技术
市面上常见的对讲机,在用户需要讲话时,需要按下对讲按钮,才能将自己的语音送入对讲网络。
由于用户在对讲时,有一只手需要按住对讲按钮,这种使用模式很大程度上限制了用户的双手,使得用户无法自由支配自己的双手,在野外方舱医院中,通常情况都会比较紧急,普通对讲模式使得对讲机成为了一个必须要使用但又不能使用的工具,严重时甚至可能引起重大事故。
本发明给出了一种基于语音频域指纹的方舱对讲机开启方法,对讲机可自动识别用户的语音,然后开启对讲模式,用户无需在讲话前按下对讲按钮,便可直接对讲,从而使得用户的双手可以更加自由地进行其它操作。
发明内容
本发明给出了一种基于语音频域指纹的方舱对讲机开启方法,对讲机可自动识别用户的语音,然后开启对讲模式,用户无需在讲话前按下对讲按钮,便可直接对讲,从而使得用户的双手可以更加自由地操作,其具体工作方式如下:
(1) 用户按下训练模式按钮,向对讲机输入一段口令,然后释放训练模式按钮,结束一次训练,重复该操作N遍,语音长度为M个采样点;
(2) 对语音进行频域变换,得到频域语音F,按照50%的重叠率,将F分割为L个频带,计算出第i个音频第j个频带的语音能量为: 
Figure 188580DEST_PATH_IMAGE002
,将
Figure 2952DEST_PATH_IMAGE004
保存为音频样本,得到样本音频频带能量的向量
Figure 356573DEST_PATH_IMAGE006
(3) 计算样本音频各频带的能量期望值为:,从而得到样本音频频带能量的期望音频指纹向量
Figure 353665DEST_PATH_IMAGE010
(4) 当用户准备向对讲网络输入话音时,先向对讲机输入训练时使用的口令,从而采集到现场语音,然后按照样本语音的处理方法,求得现场语音各频带的能量:
Figure 22544DEST_PATH_IMAGE012
,得到现场音频频带能量的音频指纹向量
(5) 计算现场音频各频带的能量与样本音频各频带能量期望的归一化相关系数:
Figure 770237DEST_PATH_IMAGE016
(6) 经过多个样本测试,确定门限值
Figure 38407DEST_PATH_IMAGE018
,如果
Figure 561792DEST_PATH_IMAGE020
,则开启对讲模式,允许用户向对讲网络输入语音,否则作下一步操作操作;
(7)计算现场音频各频带的能量与各样本音频各频带能量的归一化相关系数:
Figure DEST_PATH_IMAGE022
,如果
Figure DEST_PATH_IMAGE024
的次数大于N/2,则开启对讲模式,允许用户向对讲网络输入语音,否则回到等待模式。
附图说明
无。
具体实施方式
本发明给出了一种基于语音频域指纹的方舱对讲机开启方法,对讲机可自动识别用户的语音,然后开启对讲模式,用户无需在讲话前按下对讲按钮,便可直接对讲,从而使得用户的双手可以更加自由地操作,可以通过在对讲机中增加一个软件模块的方法进行实现,具体的实现方式如下:
(1)    用户按下训练模式按钮,向对讲机重复输入一段口令N遍,语音长度为M个采样点;
(2)    按照50%的重叠率将频域音频分割为L个频带,计算出第i个音频第j个频带的语音能量为:
Figure 273528DEST_PATH_IMAGE002
,将
Figure 515153DEST_PATH_IMAGE004
保存为音频样本,得到样本音频频带能量的向量
(3)计算样本音频各频带的能量期望值为:
Figure 964906DEST_PATH_IMAGE008
,从而得到样本音频频带能量的期望音频指纹向量
Figure 300072DEST_PATH_IMAGE010
(4)    当用户准备向对讲网络输入话音时,先向对讲机输入训练时使用的口令,然后按照样本语音的处理方法,求得现场语音各频带的能量:
Figure 560152DEST_PATH_IMAGE012
,得到现场音频频带能量的音频指纹向量
Figure 638967DEST_PATH_IMAGE014
(5)    计算现场音频各频带的能量与样本音频各频带能量期望的归一化相关系数:
Figure 136944DEST_PATH_IMAGE016
(6)    经过多个样本测试,确定门限值
Figure 439750DEST_PATH_IMAGE018
,如果
Figure 390388DEST_PATH_IMAGE020
,则开启对讲模式,允许用户向对讲网络输入语音,否则作下一步操作操作;计算现场音频各频带的能量与各样本音频各频带能量的归一化相关系数:,如果的次数大于N/2,则开启对讲模式,允许用户向对讲网络输入语音,否则回到等待模式。

Claims (8)

1.一种基于语音频域指纹的方舱对讲机开启方法,首先进行对讲机训练,计算出训练样本口令指纹,每次口令输入时,再计算该语音的指纹,匹配样本指纹和现场的指纹,如果匹配成功,则开启对讲模式。
2.根据权利要求1所述的方法,训练时,需要重复向对讲机输入一段口令N遍,每段语音长度为M个采样点。
3.根据权利要求1所述的方法,对频域语音F进行分割的重叠率为50%,将F分割为L个频带。
4.根据权利要求1所述的方法,计算出第i个音频第j个频带的语音能量为:
Figure 911267DEST_PATH_IMAGE001
,将
Figure 359565DEST_PATH_IMAGE002
保存为音频样本,得到样本音频频带能量的向量
Figure 139303DEST_PATH_IMAGE003
5.根据权利要求1所述的方法,计算样本音频各频带的能量期望值为:
Figure 534512DEST_PATH_IMAGE004
,从而得到样本音频频带能量的期望音频指纹向量
Figure 880042DEST_PATH_IMAGE005
6.根据权利要求1所述的方法,现场语音各频带的能量计算方法为:,得到现场音频频带能量的音频指纹向量
Figure 969538DEST_PATH_IMAGE007
7.根据权利要求1所述的方法,现场音频各频带的能量与样本音频各频带能量期望的归一化相关系数:
Figure 168438DEST_PATH_IMAGE008
8.根据权利要求1所述的方法,进行门限判决时,计算现场音频各频带的能量与各样本音频各频带能量的归一化相关系数:
Figure 119208DEST_PATH_IMAGE009
,如果
Figure 112572DEST_PATH_IMAGE010
的次数大于N/2,则开启对讲模式,允许用户向对讲网络输入语音,否则回到等待模式。
CN201310372408.7A 2013-08-24 2013-08-24 一种基于语音频域指纹的方舱对讲机开启方法 Pending CN103559883A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310372408.7A CN103559883A (zh) 2013-08-24 2013-08-24 一种基于语音频域指纹的方舱对讲机开启方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310372408.7A CN103559883A (zh) 2013-08-24 2013-08-24 一种基于语音频域指纹的方舱对讲机开启方法

Publications (1)

Publication Number Publication Date
CN103559883A true CN103559883A (zh) 2014-02-05

Family

ID=50014114

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310372408.7A Pending CN103559883A (zh) 2013-08-24 2013-08-24 一种基于语音频域指纹的方舱对讲机开启方法

Country Status (1)

Country Link
CN (1) CN103559883A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105096936A (zh) * 2014-05-15 2015-11-25 哈尔滨海能达科技有限公司 一种即时按键通话业务控制方法和装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1941080A (zh) * 2005-09-26 2007-04-04 吴田平 一种楼宇对讲门口机声纹识别开锁模块及识别开锁方法
CN101064043A (zh) * 2006-04-29 2007-10-31 上海优浪信息科技有限公司 一种声纹门禁系统及其应用
CN102005070A (zh) * 2010-11-17 2011-04-06 广东中大讯通信息有限公司 一种语音识别门禁系统
CN103260093A (zh) * 2013-05-15 2013-08-21 江苏奇异点网络有限公司 新型多功能对讲机

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1941080A (zh) * 2005-09-26 2007-04-04 吴田平 一种楼宇对讲门口机声纹识别开锁模块及识别开锁方法
CN101064043A (zh) * 2006-04-29 2007-10-31 上海优浪信息科技有限公司 一种声纹门禁系统及其应用
CN102005070A (zh) * 2010-11-17 2011-04-06 广东中大讯通信息有限公司 一种语音识别门禁系统
CN103260093A (zh) * 2013-05-15 2013-08-21 江苏奇异点网络有限公司 新型多功能对讲机

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105096936A (zh) * 2014-05-15 2015-11-25 哈尔滨海能达科技有限公司 一种即时按键通话业务控制方法和装置

Similar Documents

Publication Publication Date Title
CN102932539A (zh) 一种基于语音识别通过打开应用方式解锁的终端及方法
CN111739553B (zh) 会议声音采集、会议记录以及会议记录呈现方法和装置
EP2827326A1 (en) Scene recognition method, device and mobile terminal based on ambient sound
CN108665895A (zh) 用于处理信息的方法、装置和系统
CN103152480B (zh) 利用移动终端进行到站提示的方法和装置
CN107885731A (zh) 语音翻译方法和装置
CN202142288U (zh) 一种便携终端的安全语音通讯装置
CN105426357A (zh) 语音快速选择方法
CN103227721B (zh) 启动应用的系统和方法
CN107885732A (zh) 语音翻译方法、系统和装置
CN102799408A (zh) 具有声控解锁功能的移动终端及移动终端声控解锁的方法
CN105049646A (zh) 变声通话方法、装置及终端
WO2019075829A1 (zh) 语音翻译方法、装置和翻译设备
CN101937676A (zh) 通过音频识别实现远程控制设备的方法和移动终端
CN106379788B (zh) 一种电梯乘客身份识别和人流统计装置及方法
CN104010060A (zh) 识别来电呼入方身份的方法和电子设备
CN103458323A (zh) 一种基于语音时域指纹的对讲模式开启方法
CN107071603A (zh) 一种用于实时语音识别的话筒及系统
CN103559883A (zh) 一种基于语音频域指纹的方舱对讲机开启方法
CN204117590U (zh) 语音采集降噪装置以及语音质量评价系统
CN106603669A (zh) 分布式主从设备的控制方法及系统
CN107196979A (zh) 基于语音识别的叫号预提醒系统
CN107656923A (zh) 语音翻译方法和装置
CN105450881B (zh) 一种回声抑制测试方法
CN111210810A (zh) 模型训练方法和装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20140205