CN112203188B - 一种自动音量调节方法 - Google Patents

一种自动音量调节方法 Download PDF

Info

Publication number
CN112203188B
CN112203188B CN202010725423.5A CN202010725423A CN112203188B CN 112203188 B CN112203188 B CN 112203188B CN 202010725423 A CN202010725423 A CN 202010725423A CN 112203188 B CN112203188 B CN 112203188B
Authority
CN
China
Prior art keywords
volume
interphone
noise energy
energy value
noise
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010725423.5A
Other languages
English (en)
Other versions
CN112203188A (zh
Inventor
王波涛
李娜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing University of Technology
Original Assignee
Beijing University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing University of Technology filed Critical Beijing University of Technology
Priority to CN202010725423.5A priority Critical patent/CN112203188B/zh
Publication of CN112203188A publication Critical patent/CN112203188A/zh
Application granted granted Critical
Publication of CN112203188B publication Critical patent/CN112203188B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/003Changing voice quality, e.g. pitch or formants
    • G10L21/007Changing voice quality, e.g. pitch or formants characterised by the process used
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R2430/00Signal processing covered by H04R, not provided for in its groups
    • H04R2430/01Aspects of volume control, not necessarily automatic, in sound systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Quality & Reliability (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Physics & Mathematics (AREA)
  • Human Computer Interaction (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Multimedia (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Telephone Function (AREA)
  • Interconnected Communication Systems, Intercoms, And Interphones (AREA)

Abstract

一种自动音量调节方法涉及通信技术领域。该算法将麦克风拾取的音频信号以及扬声器播放的音频信号同时输入音量调节算法。对扬声器和麦克风数据求和并取平均值后,计算对应的音量调节系数,根据统计得到的映射关系确定设备最终输出音量。本发明避开传统方法语音和噪声难以区分的问题,提供一种计算音量调节系数的方法,根据环境噪声调节设备的输出音量。使用C语言编写并实现音量调节的算法,建立了基于麦克风和扬声器两路信号的音量调节方法,以实现根据环境的变化对通讯设备的输出音量进行有效的调节。

Description

一种自动音量调节方法
技术领域
本发明涉及通信技术领域,涉及到一种同时具有扬声器和麦克风的通信设备音量调节方法,特别涉及一种需要根据周围环境噪音强弱情况自动调节通信设备扬声器音量的方法。
背景技术
随着无线通讯设备的发展,科技和多媒体技术的进步,人们的生活水平质量不断提高,对讲机、手机等无线通信设备得到了广泛的应用。无线通信设备的功能层出不穷,令人目不暇接,应用领域越来越广泛,例如制造、建筑、服务、民航、公安、运输、水利等行业。
由于通话功能始终是通信设备最基本最重要的功能,因此保证通话的舒适高效,提高用户体验是通信设备应追求的根本目标。通信设备使用场景具有多样化,用户所处环境的噪音是各种不同频率和不同强度声音的无规则组合,情况是复杂多变的,如周围人的嘈杂声,街道的车流声,机器运作的声音等,而为了获得更好的声音效果,提高语音的清晰度,时常需要用户根据环境噪音的变化不断手动调节设备的音量,以获得舒适的听觉体验。这种要求用户手动调节音量的方法很麻烦,不仅阻止用户专注于自己的工作,而且降低了用户体验。例如在使用对讲机的过程中:用户在声音条件非常恶劣的场所,将对讲机的音量调到了最大以方便听清楚队友传来的消息,但是结束任务后就回到安静的房间里,如果此时忘记将对讲机音量调小或关闭对讲机,那么此时突然接收到主叫信号的音量会非常刺耳,对用户的听觉神经造成一定的伤害,降低用户体验;反之如果从一个安静环境下转换到非常嘈杂的地方时,可能会因为没有及时调整音量而错过重要消息,造成很大的损失。因此,对讲机系统需要设计一个能够根据设备使用场景中的环境噪声大小变化而自动调节音量的模块。
针对上述问题,目前存在的方法在区分语音和噪声,得到真实噪声值的步骤遇到了难题。为解决这一问题,本发明提出一种同时利用麦克风信号和扬声器信号,结合当前音量值,计算音量调节系数的方法。实验表明,该方法实现简单,有良好的应用推广价值。
发明内容
为了解决上述技术问题,本发明提供一种实时分析对讲机麦克风信号和扬声器信号进行音量调节的方法,避开语音和噪音难以区分的问题。
本发明提供了一种计算音量调节系数的方法,并在此基础上,根据环境背景噪声调节通信设备输出音量。所述方法包括如下:
(1)区间的划分与映射;
对设备周围环境噪声大小以及对讲机音量进行区间的划分;将对讲机的32个音量等级以及环境噪声分贝数划分等级,对讲机音量具体划分为四个等级,分别为0-9,10-19,20-29,30-32;背景噪声按照分贝大小划分为N,M,L三个等级,其中N对应0-60dB即普通室内谈话以及较为安静的环境,M对应60-90dB即人耳感到吵闹有损神经的环境,L对应90dB以上即吵闹加剧听力受损的环境;
主叫端使用同一音频固定响度的声源作为输入,使用人耳统计分析系,设定周围环境噪声大小三个等级下应该调整的音量等级;
(2)计算音量调节系数;
读取设备的麦克风信号和扬声器信号,分别对读取到的两路信号数据求和,取平均值后得到音量调节系数coef;统计分析得到coef 值和设备噪声能量值的映射关系;
根据计算得到的coef值,得到对应的噪声能量值,与上一次计算得到的噪声能量值进行比较,判断相邻两次噪声能量值是否相同,若不同,则将得到的噪声能量值送入函数接口调节音量;若相同,则在得到的噪声能量值上加1或10,保证设备能够有效调节音量;
(3)确定映射关系;
在保持主叫端音频输入内容一样,音量大小相同的情况下,被叫对讲机当前音量以及环境噪声等级共同约束输入信号的音量调节系数coef;通过在真实环境下的测试发现,音量调节系数coef与目标音量Vol满足以下关系:
Figure BDA0002601496710000031
使用上述音量调节系数与输出音量的对应关系来决定设备最终输出音量;即当音量调节系数小于3.9时,将设备音量调至等级10;当音量调节系数在3.9与4.0之间时,将设备音量调至等级20;当音量调节系数大于等于4.0时,将设备音量调至等级30;
(4)调节音量;
根据最终得到的音量调节系数,通过步骤(3)得到的映射关系确定目标音量等级,并将其对应的噪声能量值送入调节音量的函数中,实现音量的调节功能。
进一步,对讲机在噪声能量值更新频率为40-46帧。
本方法将设备麦克风采集的信号和扬声器采集到的信号,同时送入算法进行实时分析,判断设备周围的噪声环境,达到根据设备周围环境噪声变化不断调节设备输出音量的目的,提高工作效率。使用C 语言编写并成功实现了音量调节算法,建立了基于麦克风和扬声器两路信号的音量调节系统,以实现根据环境的变化对通讯设备输出音量的控制。
附图说明
图1:本发明的流程图;
具体实施方式
本发明提供一种具体实施例,具体检测可分为以下步骤:
(1)对环境噪声以及对讲机音量进行区间的划分;
将对讲机的32个音量等级以及环境噪声分贝数划分等级,对讲机音量具体划分为四个等级,分别为0-9,10-19,20-29,30-32;背景噪声按照分贝大小划分为N,M,L三个等级,其中N对应0-60dB 即普通室内谈话以及较为安静的环境,M对应60-90dB即人耳感到吵闹有损神经的环境,L对应90dB以上即吵闹加剧听力受损的环境。
(2)通过分析得到音量调节系数与待输出音量的映射关系;
读取设备的麦克风信号和扬声器信号,分别对读取到的两路信号数据求和,取平均值后得到音量调节系数coef。并在此前通过大量实际测试,统计分析得到coef值和设备噪声能量值的映射关系。
根据计算得到的coef值,得到对应的噪声能量值,与上一次计算得到的噪声能量值进行比较,判断相邻两次噪声能量值是否相同,若不同,则将得到的噪声能量值送入函数接口调节音量;若相同,则在得到的噪声能量值上加1或10,保证设备能够有效调节音量。
(3)通过分析得到音量调节系数与待输出音量的映射关系;
在保持主叫端音频输入内容一样,音量大小相同的情况下,被叫对讲机当前音量以及环境噪声等级共同约束输入信号的音量调节系数。通过在真实环境下的测试发现,音量调节系数与目标音量满足以下关系:
Figure BDA0002601496710000041
(4)为了达到根据周围环境噪声变化实时控制音量的目的,设计实验测试了更新噪声能量值的最佳频率。总结得出以下结论:对讲机在噪声能量值更新频率为46帧时,响应情况最佳,低于40帧时会不同程度出现未响应的情况,降低对讲机音量调节的使用体验;每次调节前后输入的噪声能量值不应相同,否则不能有效改变对讲机音量。
表1:音量调节系数与目标音量的映射规则。
音量调节系数 coef<3.9 3.9≤coef<4.0 coef≥4.0
待输出音量 10 20 30
更具体的,步骤1:获取当前麦克风采集到的音频数据,以及扬声器接收到的音频数据
步骤2:分别计算两路音频的数据和:Spk_sum、Mic_sum;
Spk_sum=s0+s1+s2+…+sn (1)
Mic_sum=m0+m1+m2+…+mn (2)
其中,si和mi分别表示扬声器数据和麦克风数据,n由一帧数据的长度确定。
步骤3:求其平均值Spk_aver、Mic_aver;
Figure BDA0002601496710000051
Figure BDA0002601496710000052
步骤4:计算音量调节系数coef;
Figure BDA0002601496710000053
步骤5:划分区间并确定映射关系;
首先将环境噪声按照分贝划分为三个等级,将设备音量分为三个区间。然后通过实际测试,统计分析得到设备周围噪声,设备音量以及音量调节系数的映射关系。
步骤6:根据所述映射关系,得到目标音量对应的噪声能量值;
步骤7:将噪声能量值输入接口函数,调节音量。

Claims (2)

1.一种自动音量调节方法,其特征在于:
(1)区间的划分与映射;
对对讲机周围环境噪声大小以及对讲机音量进行区间的划分;将对讲机的 32 个音量等级以及环境噪声分贝数划分等级,对讲机音量具体划分为四个等级,分别为 0-9,10-19,20-29,30-32;环境噪声按照分贝大小划分为 N,M,L 三个等级,其中 N 对应 0-60dB 即普通室内谈话以及较为安静的环境,M 对应 60-90dB 即人耳感到吵闹有损神经的环境,L 对应90dB以上即吵闹加剧听力受损的环境;主叫端使用同一音频固定响度的声源作为输入,使用人耳统计分析,设定周围环境噪声大小三个等级下应该调整的音量等级;即,周围环境噪声大小三个等级下应该调整的音量等级分别为:10、20、30;
(2)计算音量调节系数;
读取对讲机的麦克风信号和扬声器信号,分别对读取到的两路信号数据求和,取平均值后得到音量调节系数 coef;统计分析得到 coef 值和对讲机噪声能量值的映射关系;根据计算得到的 coef 值,得到对应的噪声能量值,与上一次计算得到的噪声能量值进行比较,判断相邻两次噪声能量值是否相同,若不同,则将得到的噪声能量值送入函数接口调节音量;若相同,则在得到的噪声能量值上加 1 或 10;
(3)确定映射关系;
在保持主叫端音频输入内容一样,音量大小相同的情况下,被叫对讲机当前音量以及环境噪声等级共同约束输入信号的音量调节系数;音量调节系数coef与输出音量Vol 满足以下关系:
Figure DEST_PATH_IMAGE002
使用上述音量调节系数与输出音量的对应关系来决定对讲机最终输出音量;即当音量调节系数小于3.9时,将对讲机音量调至等级 10;当音量调节系数在3.9与4.0之间时,将对讲机音量调至等级 20;当音量调节系数大于等于 4.0 时,将对讲机音量调至等级 30;
(4)调节音量;
根据最终得到的音量调节系数coef,通过步骤(3)得到的映射关系确定输出音量等级,并将其对应的噪声能量值送入调节音量的函数中,实现音量的调节功能;
整个调整流程的输入与输出如下:
1)读取对讲机的麦克风信号和扬声器信号,计算得到音量调节系数 coef;
2)由音量调节系数 coef映射得到对讲机输出音量Vol;
3)由对讲机输出音量Vol映射得到对应的噪声能量值;
4)将对应的噪声能量值,与上一次计算得到的噪声能量值进行比较,判断相邻两次噪声能量值是否相同,若不同,则将得到的噪声能量值送入调节音量的函数得到调节后的输出音量等级;若相同,则在得到的噪声能量值上加 1 或 10。
2.根据权利要求 1 所述的方法,其特征在于:
对讲机在噪声能量值更新频率为 40-46 帧。
CN202010725423.5A 2020-07-24 2020-07-24 一种自动音量调节方法 Active CN112203188B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010725423.5A CN112203188B (zh) 2020-07-24 2020-07-24 一种自动音量调节方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010725423.5A CN112203188B (zh) 2020-07-24 2020-07-24 一种自动音量调节方法

Publications (2)

Publication Number Publication Date
CN112203188A CN112203188A (zh) 2021-01-08
CN112203188B true CN112203188B (zh) 2021-10-01

Family

ID=74005543

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010725423.5A Active CN112203188B (zh) 2020-07-24 2020-07-24 一种自动音量调节方法

Country Status (1)

Country Link
CN (1) CN112203188B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113709625B (zh) * 2021-06-04 2023-12-29 北京工业大学 自适应的音量调节方法
CN115052070A (zh) * 2022-06-24 2022-09-13 歌尔股份有限公司 一种调节通话音量的方法、装置、通话设备及介质
CN116389981B (zh) * 2023-05-13 2023-09-19 恩平市唐成电声科技有限公司 一种基于人工智能的功放控制系统及方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB1369711A (en) * 1971-12-03 1974-10-09 Western Electric Co Speech processors
JPH11261355A (ja) * 1998-03-13 1999-09-24 Nec Shizuoka Ltd スピーカー音量自動調整機能システム及びスピーカー音量自動調整方法
JP2011055058A (ja) * 2009-08-31 2011-03-17 Aiphone Co Ltd インターホンシステム

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4449987B2 (ja) * 2007-02-15 2010-04-14 ソニー株式会社 音声処理装置、音声処理方法およびプログラム
US8335324B2 (en) * 2008-12-24 2012-12-18 Fortemedia, Inc. Method and apparatus for automatic volume adjustment
CN105280195B (zh) * 2015-11-04 2018-12-28 腾讯科技(深圳)有限公司 语音信号的处理方法及装置
CN109688498B (zh) * 2018-11-23 2020-10-09 潍坊歌尔电子有限公司 一种音量调节方法、耳机及存储介质
CN110830901B (zh) * 2019-11-29 2021-03-16 中国科学院声学研究所 一种用于调节扬声器音量的多通道扩声系统及方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB1369711A (en) * 1971-12-03 1974-10-09 Western Electric Co Speech processors
JPH11261355A (ja) * 1998-03-13 1999-09-24 Nec Shizuoka Ltd スピーカー音量自動調整機能システム及びスピーカー音量自動調整方法
JP2011055058A (ja) * 2009-08-31 2011-03-17 Aiphone Co Ltd インターホンシステム

Also Published As

Publication number Publication date
CN112203188A (zh) 2021-01-08

Similar Documents

Publication Publication Date Title
CN112203188B (zh) 一种自动音量调节方法
KR100623411B1 (ko) 능동 등화를 구비한 통신 장치 및 이를 위한 방법
US20060271358A1 (en) Enhancing the intelligibility of received speech in a noisy environment
TW201227718A (en) Intelligibility control using ambient noise detection
US20040162722A1 (en) Speech quality indication
EP3038255B1 (en) An intelligent volume control interface
US10616676B2 (en) Dynamically adjustable sidetone generation
CN103618835A (zh) 一种根据周围噪音大小自动切换情景模式的方法及系统
CN101197870A (zh) 一种可调节通话质量的移动终端
US9787824B2 (en) Method of processing telephone signals and electronic device thereof
EP2247082B1 (en) Telecommunication device, telecommunication system and method for telecommunicating voice signals
US20070036281A1 (en) Audio and data communications system
CN101883164A (zh) 音量增益自适应装置及方法
CN107172300A (zh) 音量自动调节方法及其装置
US10200795B2 (en) Method of operating a hearing system for conducting telephone calls and a corresponding hearing system
CN113709625B (zh) 自适应的音量调节方法
CN112509594A (zh) 一种终端、发声方法、存储介质及电子装置
CN101699837B (zh) 一种电话语音输出增益调节的方法、装置和通信终端
JP2009507416A (ja) 周囲ノイズ除去装置と周囲ノイズ除去方法と周囲ノイズ除去装置を備えた移動通信端末機
CN111510559B (zh) 根据环境噪声幅度和来电者声音频率自适应调整来电者声音大小的方法
CN216982106U (zh) 音频处理电路及开放式音频设备
KR20120115941A (ko) 휴대 단말기에서 볼륨을 자동으로 조절하는 장치 및 방법
CN112202778B (zh) 一种信息处理方法、装置和电子设备
WO2012144887A1 (en) Voice immersion smartphone application or headset for reduction of mobile annoyance
US20050213745A1 (en) Voice activity detector for low S/N

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant