CN114550740A - 噪声下的语音清晰度算法及其列车音频播放方法、系统 - Google Patents
噪声下的语音清晰度算法及其列车音频播放方法、系统 Download PDFInfo
- Publication number
- CN114550740A CN114550740A CN202210442351.2A CN202210442351A CN114550740A CN 114550740 A CN114550740 A CN 114550740A CN 202210442351 A CN202210442351 A CN 202210442351A CN 114550740 A CN114550740 A CN 114550740A
- Authority
- CN
- China
- Prior art keywords
- noise
- audio
- audio stream
- train
- frequency
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 34
- 238000004422 calculation algorithm Methods 0.000 title claims abstract description 13
- 238000007781 pre-processing Methods 0.000 claims abstract description 8
- 238000004458 analytical method Methods 0.000 claims abstract description 5
- 230000007613 environmental effect Effects 0.000 claims description 7
- 238000012351 Integrated analysis Methods 0.000 claims description 6
- 230000000873 masking effect Effects 0.000 claims description 6
- 150000007524 organic acids Chemical class 0.000 claims description 6
- 239000000126 substance Substances 0.000 claims description 5
- 238000004364 calculation method Methods 0.000 claims description 4
- 238000004590 computer program Methods 0.000 claims description 3
- 230000000694 effects Effects 0.000 abstract description 6
- 230000001737 promoting effect Effects 0.000 abstract 1
- 238000010586 diagram Methods 0.000 description 2
- 230000002238 attenuated effect Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02T—CLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
- Y02T90/00—Enabling technologies or technologies with a potential or indirect contribution to GHG emissions mitigation
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Quality & Reliability (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Circuit For Audible Band Transducer (AREA)
Abstract
本发明公开了一种噪声下的语音清晰度算法及其列车音频播放方法、系统,其方法包括:S101、获取预布设在列车各节车厢的拾音器所采集的噪声音频;接收车载PIS系统发出的音频流,且做音频流预处理;S102、基于如权利要求1所述的噪声下的语音清晰度算法对噪声音频分析;S103、基于S102的分析结果调整语音信号在音频流的不同频带的能量分布,得到重新能量均衡后的音频流;S104、各个车厢分别采集噪声音频,且对应执行S102‑103;S105、各个重新能量均衡后的音频流分别建立与各个车厢的一一对应关系。本申请具有提升车厢内的语音播报效果,改善乘客的体验的效果。
Description
技术领域
本申请涉及列车音频播放技术领域,尤其是涉及一种噪声下的语音清晰度算法及其列车音频播放方法、系统。
背景技术
地铁在运行过程中伴随着非稳态噪声,且车厢内的声压级一般均呈现出较大范围的动态变化。该噪声将对车厢内的语音播报产生两方面的干扰:
一方面,为了保证高噪声环境下的语音清晰度,语音播报系统可能设置有相对较高的音量,这在低噪声环境下不仅冗余,并且可能对部分乘客产生困扰;
另一方面,在某些区间段车厢内的噪声过强,即使系统采用最大音量,也不能有效提升播报语音的清晰度。
针对上述,本申请提出一种新的技术方案。
发明内容
为了提升车厢内的语音播报效果,改善乘客的体验,本申请提供一种噪声下的语音清晰度算法及其列车音频播放方法、系统。
第一方面,本申请提供一种噪声下的语音清晰度算法,采用如下的技术方案:
一种噪声下的语音清晰度算法,包括:
此时,D满足公式:
第二方面,本申请提供一种列车音频播放方法,采用如下的技术方案:
一种列车音频播放方法,包括:
S101、获取预布设在列车各节车厢的拾音器所采集的噪声音频;
接收车载PIS系统发出的音频流,且做音频流预处理;
S102、基于如上述的噪声下的语音清晰度算法对噪声音频分析;
S103、基于S102的分析结果调整语音信号在音频流的不同频带的能量分布,得到重新能量均衡后的音频流;
S104、各个车厢分别采集噪声音频,且对应执行S102-103;
S105、各个重新能量均衡后的音频流分别建立与各个车厢的一一对应关系。
可选的,所述音频流预处理包括:以IIR带通滤波器对音频率做频率段划分。
可选的,所述频率段划分包括:躲避噪声音频中的能量高点,并在其他频段以倍频方式输出,确定中心频点。
可选的,还包括:对噪声音频识别,基于预建立的噪声特征-车厢场景数据库确定噪声音频获取时的场景;其中,所述对噪声音频识别包括噪声类型识别和噪声参数识别。
可选的,还包括:记录各个车厢历次播放的音频流的处理过程,产生调整档案,并存入数据库;
获取对当前车厢的噪声音频的识别结果,并根据识别结果查找数据库,得到匹配的调整档案;
调用匹配的调整档案中重新能量均衡后的音频流,发送车载PIS系统使用。
第三方面,本申请提供一种列车音频播放系统,采用如下的技术方案:
一种列车音频播放系统,包括:
拾音器,其布设于车厢,用于车厢内的噪声采集;
集成分析模块,其连接于拾音器,且用于加载和执行实现如上述任一所述的列车音频播放方法的计算机程序;
车载PIS系统,其连接于集成分析模块,用于记录原始的音频流和接收重新能量均衡后的音频流,并控制车厢的扬声器播放对应的音频流。
综上所述,本申请包括以下至少一种有益技术效果:首先,可以通过调节语音信号不同频带处的能量分布,在不增加语音总体能量的前提下,提升播报语音清晰度,使乘客能够更清楚的听到播报内容;其次,当环境噪声降低时,可以在不降低语音清晰度的前提下,自适应降低总体播报语音能量,避免给乘客带来高声压级困扰;同时,列车在运行过程中每个车厢的噪声环境其实还是有部分差异的,本申请还可以用于解决各个车厢差异需求,对各个车厢播放的音频流进行实时调整变化。
附图说明
图1是本申请的方法的主流程示意图;
图2是本申请的语音增强概念流程示意图。
具体实施方式
以下结合附图1-2对本申请作进一步详细说明。
本申请实施例公开一种噪声下的语音清晰度算法,其包括:
此时,D满足公式:
展开为:
根据上述可知,语音清晰度是当前语音信号以及当前噪声信号的函数;基于上述,只需对车厢内的噪声进行采集并根据上述分析噪声,对音频流调整,即可改善语音清晰度,以提升车厢内的语音播报效果,改善乘客的体验。
本申请实施例公开一种列车音频播放方法。
参照图1和图2,列车音频播放方法包括:
S101、获取预布设在列车各节车厢的拾音器所采集的噪声音频;以及,
接收车载PIS系统发出的音频流,且做音频流预处理。
可以理解的是,上述噪声音频包括乘客的交谈声、列车产生的机械/风噪、乘客个人终端发出的声音等,并非单指列车运行产生的机械/风噪。
在本实施例中上述音频流预处理,其可使用IIR带通滤波器实现;IIR带通滤波器可称为无限冲激响应滤波器,具有计算量小的特点;带通滤波器的参数设置通过matlab实现。上述音频流预处理包括频率段划分,具体地:躲避噪声音频中的能量高点,并在其他频段以倍频方式输出,确定中心频点。
在一个实施例以10个为例,中心频点分别为32、64、128、256、512、1k、2k、4k、8k、16k;划分过程的滤波器的截止频率相重合。上述是为了进行10段均衡处理,在每个频率段分别调整后,再次混音为一个音频流。
S102、基于上述的噪声下的语音清晰度算法对噪声音频分析。
S103、基于S102的分析结果调整语音信号在音频流的不同频带的能量分布,得到重新能量均衡后的音频流。
可以理解的是,上述不同频带指的是一个音频流的不同频带。能量分布调整,即选择增加,选择增强都是在倍频点上增加的,例如:16k 、32k、64k等。整体思路可以简易理解是:根据噪声或者特定预设场景,在噪声能量高的频段增加语音能量;反之,减少能量。调整量与噪声的关系可预设。
关于上述调整语音信号在音频流的不同频带的能量分布,如:
均衡处理:进行10段均衡,假定上述的每频率段的中心频点为32、64、128、256、512、1k、2k、4k、8k、16k;
之后分别调整每路的增益,此时,每段的调整幅度为-12dBm-12dBm;
最后进行混音处理。
回响处理:将原始声音(如:语音)进行衰减复制,复制至相应的音频位置与原始的后续音频进行混音,达到调整景深的目的,调整衰减系数用来调整环境材质的感受;
混音处理:将音频进行矩阵加处理,对溢出的音频进行数字压限并记录增益系数,在后续音频中声音混音音频不溢出,则对增益系数进行调整,在10ms内使增益系数恢复至1.0。
S104、各个车厢分别采集噪声音频,且执行S102-103。
S105、各个重新能量均衡后的音频流分别建立与各个车厢的一一对应关系。
根据上述内容,本方法可以通过调节语音信号不同频带处的能量分布,在不增加语音总体能量的前提下,提升播报语音清晰度,使乘客能够更清楚的听到播报内容;其次,当环境噪声降低时,可以在不降低语音清晰度的前提下,自适应降低总体播报语音能量,避免给乘客带来高声压级困扰;同时,列车在运行过程中每个车厢的噪声环境其实还是有部分差异的,本方法可以用于解决各个车厢差异需求,对各个车厢播放的音频流进行实时调整变化。
在本申请的另一个实施例中,本方法还包括:对噪声音频识别,基于预建立的噪声特征-车厢场景数据库确定噪声音频获取时的场景。
其中,对噪声音频识别包括噪声类型识别和噪声参数识别。基于实施例的噪声内容,具体地,如:先识别噪声类型,如乘客交谈声,背景噪声(列车噪声),再识别两者的频/幅(即噪声参数识别),以根据差异判断车厢的不同场景。
可以理解的是,对于本申请的混音等音频处理手段,可参考和借用 音源组件或其他可做音频剪辑和混音的各类App+语音识别技术配合实现;如增益调整可直观地示例有,读者以手机等终端打开音乐播放器中的均衡器功能,即可见调整;上述为现有技术,因此不再赘述。
在本申请的另一个实施例中,本方法还包括:
记录各个车厢历次播放的音频流的处理过程,产生调整档案,并存入数据库;
获取对当前车厢的噪声音频的识别结果,并根据识别结果查找数据库,得到匹配的调整档案;
调用匹配的调整档案中重新能量均衡后的音频流,发送车载PIS系统使用。
根据上述内容,除了可以产生记录方便工作人员验证方法的执行效果,还可以在数据积累到一定量后,逐渐减小对调整运算的依赖度,满足列车多样化的环境的同时高效执行;同时,还可以将数据应用于其他列车而不必再增设调整运算的部分,满足更多的使用环境,减小推广难度。
本申请实施例还公开一种列车音频播放系统,其包括:
拾音器,其布设于车厢,用于车厢内的噪声采集;
集成分析模块,其连接于拾音器,且用于加载和执行实现如上述方法的计算机程序;
车载PIS系统,其连接于集成分析模块,用于记录原始的音频流和接收重新能量均衡后的音频流,并控制车厢的扬声器播放对应的音频流。
以上均为本申请的较佳实施例,并非依此限制本申请的保护范围,故:凡依本申请的结构、形状、原理所做的等效变化,均应涵盖于本申请的保护范围之内。
Claims (7)
1.一种噪声下的语音清晰度算法,其特征在于,包括:
此时,D满足公式:
2.一种列车音频播放方法,其特征在于,包括:
S101、获取预布设在列车各节车厢的拾音器所采集的噪声音频;
接收车载PIS系统发出的音频流,且做音频流预处理;
S102、基于如权利要求1所述的噪声下的语音清晰度算法对噪声音频分析;
S103、基于S102的分析结果调整语音信号在音频流的不同频带的能量分布,得到重新能量均衡后的音频流;
S104、各个车厢分别采集噪声音频,且对应执行S102-103;
S105、各个重新能量均衡后的音频流分别建立与各个车厢的一一对应关系。
3.根据权利要求2所述的列车音频播放方法,其特征在于,所述音频流预处理包括:以IIR带通滤波器对音频率做频率段划分。
4.根据权利要求3所述的列车音频播放方法,其特征在于,所述频率段划分包括:躲避噪声音频中的能量高点,并在其他频段以倍频方式输出,确定中心频点。
5.根据权利要求2所述的列车音频播放方法,其特征在于,还包括:
对噪声音频识别,基于预建立的噪声特征-车厢场景数据库确定噪声音频获取时的场景;其中,所述对噪声音频识别包括噪声类型识别和噪声参数识别。
6.根据权利要求5所述的列车音频播放方法,其特征在于,还包括:
记录各个车厢历次播放的音频流的处理过程,产生调整档案,并存入数据库;
获取对当前车厢的噪声音频的识别结果,并根据识别结果查找数据库,得到匹配的调整档案;
调用匹配的调整档案中重新能量均衡后的音频流,发送车载PIS系统使用。
7.一种列车音频播放系统,其特征在于,包括:
拾音器,其布设于车厢,用于车厢内的噪声采集;
集成分析模块,其连接于拾音器,且用于加载和执行实现如权利要求2-6任一所述的列车音频播放方法的计算机程序;
车载PIS系统,其连接于集成分析模块,用于记录原始的音频流和接收重新能量均衡后的音频流,并控制车厢的扬声器播放对应的音频流。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210442351.2A CN114550740B (zh) | 2022-04-26 | 2022-04-26 | 噪声下的语音清晰度算法及其列车音频播放方法、系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210442351.2A CN114550740B (zh) | 2022-04-26 | 2022-04-26 | 噪声下的语音清晰度算法及其列车音频播放方法、系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN114550740A true CN114550740A (zh) | 2022-05-27 |
CN114550740B CN114550740B (zh) | 2022-07-15 |
Family
ID=81667247
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210442351.2A Active CN114550740B (zh) | 2022-04-26 | 2022-04-26 | 噪声下的语音清晰度算法及其列车音频播放方法、系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114550740B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114974309A (zh) * | 2022-07-29 | 2022-08-30 | 广州莱万科技股份有限公司 | 一种基于智能班牌的师生教学情况自动提醒方法 |
Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1201547A (zh) * | 1995-09-14 | 1998-12-09 | 艾利森公司 | 自适应滤波音频信号以增强噪声环境条件下语音清晰度的系统 |
US20150019213A1 (en) * | 2013-07-15 | 2015-01-15 | Rajeev Conrad Nongpiur | Measuring and improving speech intelligibility in an enclosure |
US20150325250A1 (en) * | 2014-05-08 | 2015-11-12 | William S. Woods | Method and apparatus for pre-processing speech to maintain speech intelligibility |
CN106504771A (zh) * | 2016-11-17 | 2017-03-15 | 中国传媒大学 | 一种适用于噪声环境的汉语语音清晰度评测算法 |
CN109308907A (zh) * | 2017-07-27 | 2019-02-05 | 哈曼贝克自动系统股份有限公司 | 单信道降噪 |
CN109410907A (zh) * | 2017-08-18 | 2019-03-01 | 比亚迪股份有限公司 | 云轨的噪音处理方法、装置、设备及存储介质 |
CN110085245A (zh) * | 2019-04-09 | 2019-08-02 | 武汉大学 | 一种基于声学特征转换的语音清晰度增强方法 |
CN110383373A (zh) * | 2017-02-06 | 2019-10-25 | 消音器设备有限公司 | 使用分段频率相关相位抵消的噪声消除 |
CN110447069A (zh) * | 2017-03-22 | 2019-11-12 | 三星电子株式会社 | 自适应噪声环境的语音信号处理的方法和装置 |
CN110509936A (zh) * | 2019-09-03 | 2019-11-29 | 中车青岛四方机车车辆股份有限公司 | 一种列车轻量化降噪结构确定方法及相关装置 |
CN111107478A (zh) * | 2019-12-11 | 2020-05-05 | 江苏爱谛科技研究院有限公司 | 一种声音增强方法及声音增强系统 |
CN111527543A (zh) * | 2017-12-29 | 2020-08-11 | 哈曼国际工业有限公司 | 用于远端电信的声学车厢内噪声消除系统 |
-
2022
- 2022-04-26 CN CN202210442351.2A patent/CN114550740B/zh active Active
Patent Citations (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN1201547A (zh) * | 1995-09-14 | 1998-12-09 | 艾利森公司 | 自适应滤波音频信号以增强噪声环境条件下语音清晰度的系统 |
US20150019213A1 (en) * | 2013-07-15 | 2015-01-15 | Rajeev Conrad Nongpiur | Measuring and improving speech intelligibility in an enclosure |
US20150325250A1 (en) * | 2014-05-08 | 2015-11-12 | William S. Woods | Method and apparatus for pre-processing speech to maintain speech intelligibility |
CN106504771A (zh) * | 2016-11-17 | 2017-03-15 | 中国传媒大学 | 一种适用于噪声环境的汉语语音清晰度评测算法 |
CN110383373A (zh) * | 2017-02-06 | 2019-10-25 | 消音器设备有限公司 | 使用分段频率相关相位抵消的噪声消除 |
CN110447069A (zh) * | 2017-03-22 | 2019-11-12 | 三星电子株式会社 | 自适应噪声环境的语音信号处理的方法和装置 |
CN109308907A (zh) * | 2017-07-27 | 2019-02-05 | 哈曼贝克自动系统股份有限公司 | 单信道降噪 |
CN109410907A (zh) * | 2017-08-18 | 2019-03-01 | 比亚迪股份有限公司 | 云轨的噪音处理方法、装置、设备及存储介质 |
CN111527543A (zh) * | 2017-12-29 | 2020-08-11 | 哈曼国际工业有限公司 | 用于远端电信的声学车厢内噪声消除系统 |
CN110085245A (zh) * | 2019-04-09 | 2019-08-02 | 武汉大学 | 一种基于声学特征转换的语音清晰度增强方法 |
CN110509936A (zh) * | 2019-09-03 | 2019-11-29 | 中车青岛四方机车车辆股份有限公司 | 一种列车轻量化降噪结构确定方法及相关装置 |
CN111107478A (zh) * | 2019-12-11 | 2020-05-05 | 江苏爱谛科技研究院有限公司 | 一种声音增强方法及声音增强系统 |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114974309A (zh) * | 2022-07-29 | 2022-08-30 | 广州莱万科技股份有限公司 | 一种基于智能班牌的师生教学情况自动提醒方法 |
CN114974309B (zh) * | 2022-07-29 | 2022-11-08 | 广州莱万科技股份有限公司 | 一种基于智能班牌的师生教学情况自动提醒方法 |
Also Published As
Publication number | Publication date |
---|---|
CN114550740B (zh) | 2022-07-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11017799B2 (en) | Method for processing voice in interior environment of vehicle and electronic device using noise data based on input signal to noise ratio | |
JP3151459B2 (ja) | パブリックアドレス明瞭度強調システム | |
RU2407142C2 (ru) | Система и способ обработки аудиосигнала для представления в среде с высоким уровнем шума | |
US6993480B1 (en) | Voice intelligibility enhancement system | |
CN104685563B (zh) | 用于嘈杂环境噪里的回放的音频信号整形 | |
CN204836533U (zh) | 一种具有回声消除功能的声控智能音箱 | |
JP5644359B2 (ja) | 音声処理装置 | |
CN110475170A (zh) | 耳机播放状态的控制方法、装置、移动终端及存储介质 | |
Pollack et al. | Masking of speech by noise at high sound levels | |
CN114550740B (zh) | 噪声下的语音清晰度算法及其列车音频播放方法、系统 | |
CN110956976B (zh) | 一种回声消除方法、装置、设备及可读存储介质 | |
CN111128167B (zh) | 一种远场语音唤醒方法、装置、电子产品及存储介质 | |
WO2008113012A1 (en) | System and method for improving audio signals for the hearing impaired | |
CN107135301A (zh) | 一种音频数据处理方法及装置 | |
CN112309416B (zh) | 车载语音回音消除方法、系统、车辆和存储介质 | |
CN108600893A (zh) | 军事环境音频分类系统、方法及军用降噪耳机 | |
AU2253499A (en) | Simplified communication system | |
US20150049879A1 (en) | Method of audio processing and audio-playing device | |
CN102484759A (zh) | 音频信号的处理 | |
CN116343756A (zh) | 人声透传方法、装置、耳机、存储介质及程序产品 | |
CN114121033B (zh) | 基于深度学习的列车广播语音增强方法和系统 | |
CN102695116B (zh) | 一种声音采集、处理和再现方法 | |
WO1999008380A1 (en) | Improved listening enhancement system and method | |
CN114286253B (zh) | 音频处理方法、装置及音频播放设备 | |
CN115410593A (zh) | 音频信道的选择方法、装置、设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |