CN113782053B - 值得保护的城市声景观品质自动监测方法 - Google Patents
值得保护的城市声景观品质自动监测方法 Download PDFInfo
- Publication number
- CN113782053B CN113782053B CN202111035031.7A CN202111035031A CN113782053B CN 113782053 B CN113782053 B CN 113782053B CN 202111035031 A CN202111035031 A CN 202111035031A CN 113782053 B CN113782053 B CN 113782053B
- Authority
- CN
- China
- Prior art keywords
- sound
- landscape
- quality
- sound landscape
- signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012544 monitoring process Methods 0.000 title claims abstract description 51
- 238000000034 method Methods 0.000 title claims abstract description 33
- 238000003066 decision tree Methods 0.000 claims abstract description 55
- 238000011156 evaluation Methods 0.000 claims abstract description 29
- 230000005236 sound signal Effects 0.000 claims abstract description 17
- 238000013145 classification model Methods 0.000 claims abstract description 14
- 230000008859 change Effects 0.000 claims description 85
- 230000000694 effects Effects 0.000 claims description 42
- 238000012549 training Methods 0.000 claims description 31
- 230000011218 segmentation Effects 0.000 claims description 20
- 238000001228 spectrum Methods 0.000 claims description 18
- 230000033764 rhythmic process Effects 0.000 claims description 10
- 230000008569 process Effects 0.000 claims description 8
- 238000012360 testing method Methods 0.000 claims description 7
- 238000007781 pre-processing Methods 0.000 claims description 5
- 238000005070 sampling Methods 0.000 claims description 5
- 238000005311 autocorrelation function Methods 0.000 claims description 4
- 210000005069 ears Anatomy 0.000 claims description 4
- 238000013138 pruning Methods 0.000 claims description 4
- 230000000737 periodic effect Effects 0.000 claims description 3
- 238000010276 construction Methods 0.000 claims 1
- 238000005259 measurement Methods 0.000 description 5
- 238000012512 characterization method Methods 0.000 description 2
- 230000007547 defect Effects 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 230000003449 preventive effect Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000002301 combined effect Effects 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000018109 developmental process Effects 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012806 monitoring device Methods 0.000 description 1
- XOFYZVNMUHMLCC-ZPOLXVRWSA-N prednisone Chemical compound O=C1C=C[C@]2(C)[C@H]3C(=O)C[C@](C)([C@@](CC4)(O)C(=O)CO)[C@@H]4[C@@H]3CCC2=C1 XOFYZVNMUHMLCC-ZPOLXVRWSA-N 0.000 description 1
- 230000001681 protective effect Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 239000004575 stone Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/27—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique
- G10L25/30—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Multimedia (AREA)
- Data Mining & Analysis (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Evolutionary Computation (AREA)
- Acoustics & Sound (AREA)
- Artificial Intelligence (AREA)
- Computational Linguistics (AREA)
- Theoretical Computer Science (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Biology (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Measurement Of Mechanical Vibrations Or Ultrasonic Waves (AREA)
Abstract
本发明公开了一种值得保护的城市声景观品质自动监测方法,首先对值得保护的城市声景观进行录音采集;把采集的声音信号转换为数字信号,再与不同类型、不同声级大小的噪声信号进行混缩得到混缩噪声信号;对所有信号指代声景观品质的指标进行计算,从而获得每一个采集片段的指标参量;以原声景观信号作为对照组,以混缩噪声信号作为评价组,将二者进行比较评价,得到每一个采集片段中声景观品质受到影响程度的评价等级;然后建立决策树分类模型,基于得到的决策树分类模型的分支条件,获取指代声景观品质的指标的不同组合方式与声景观品质受影响程度之间的关系,用于实践中对声景观品质监测,对声景观的受影响程度进行分类识别。
Description
技术领域
本发明属于声景观监测技术领域,具体涉及一种值得保护的城市声景观品质自动监测方法。
背景技术
城市声环境是城市品质的重要体现,长期以来,噪声指标如等效连续声压级LAeq、累计百分数声级LN等被作为声环境的重要评价方式。Kang Jian等在文章[Acousticcomfort evaluation in urban open public spaces]中指出,人对于声环境的主观舒适度不仅仅受到声级大小的影响,还受到其他因素诸如声源类型等方面的影响。因此,相比于传统的噪声评价方式,声景观的评价方法更具有与人的主观感受相契合的特征,引入声景观的概念对声环境进行评价具有重要意义。声景观的品质不仅受到噪声的影响,也涉及其原有的好的声音元素的保留,而随着当今城市化进程推进,城市噪声问题不断暴露的同时,美好的声音也正在消失和改变。因此,保护具有城市特点和时代特征的声景观是亟待解决的问题,而建立有效的监测方法预警系统,是对这些声景观进行科学评估,以便开展预防性保护工作的首要任务。
对值得保护的声景观的监测方法存在以下技术问题和难点:
(1)大量文献如O.Axellson等人在文章[A principal components modelofsoundscapeperception]中指出人的主观声舒适与声源的类型呈现密切的关系。传统的噪声评价指标如LAeq、累计百分数声级LN等更多的从声级的大小以及时间分布的角度对声环境进行评价,而无法携带声源的信息,因此仅使用基于声级大小评价的参量来衡量声景观品质具有一定的片面性。此外,目前对于值得保护的声景观的评价标准并不明确,现有的声学指标如心理声学指标响度、粗糙度、尖锐度、波动度等指标参量也缺乏对值得保护的声景观的特征表征。
(2)值得保护的声景观往往自身存在一定的特征,而对于不同类型的值得保护的声景观,其特征可能各不相同。在对某一个特定的值得保护的声景观品质进行监测时,监测应当符合该声景观自身的原始特征,而该监测标准则不能用于其他的声景观品质监测。这就决定了难以用一个或一组固定的参量限值适用于对所有值得保护声景观品质的监测。
针对于对值得保护的声景观品质监测方法存在上述不足和难点,希望开发一种新的声景观品质监测方法。近年来出现针对于声景观的客观预测指标的研究,包括B.Yu在文章[Development ofIndicators for the Soundscape in Urban Shopping Streets]中开发的动态频谱重心指标,文章[Ten questions on the soundscapes ofthe builtenvironment]也证实心理声学指标也被证明与人的主观感受关系密切。然而,一个参量并不能描述声景观的完整特征,本发明在常用的声学物理指标中,选取了13个与声景观品质呈现显著的相关性的指标,包括声事件频谱重心方差、声事件频谱重心方差改变、响度、响度改变、尖锐度、尖锐度改变、响度波动、响度波动改变、Phi_1、Phi_1改变、Tau_e改变、节奏改变和粗糙度改变。基于此基础,本发明考虑用多指标组合的方式,并结合最新的算法模型,用于单个场景的客观物理指标与主观评价的对应,具有更强的科学性和可信度。
发明内容
本发明的目的在于克服现有技术的不足,提供一种值得保护的城市声景观品质自动监测方法。本发明在多个物理指标结合的思想下,结合主客观评价的对应性特征,采用决策树算法训练模型,模型能够包括表征声景观品质的指标的组合特性,从而达到对声景观品质进行监测和分类的功能。在实际应用过程中,可以在本发明提出的方法的基础上建立声景观品质自动监测系统,用于实现对值得保护的城市声景观品质的监测、分类和预警。方法在实现自动监测分类的同时,保证科学化、人性化,可以解决用传统指标进行测量存在的与人实际的听闻体验差距大,测量结果误差较大,获取的监测数据实时性、代表性较差的问题;以自动监测代替人工监测,在有效解决人工监测存在的人为因素影响测量结果准确度的问题之外,还可以对实际监测工作提供便利,节省大量的人力资源。
本发明是通过以下技术方案实现的:
一种值得保护的城市声景观品质自动监测方法,包括步骤:
步骤一:对值得保护的城市声景观的不同品质状态进行录音采集;
步骤二:把步骤一采集到的声音信号转换为数字信号得到原声景观信号,将原声景观信号与不同类型、不同声级大小的噪声信号进行混缩,得到多个被噪声干扰的混缩噪声信号;对所有信号指代声景观品质的指标进行计算,从而获得每一个采集片段的指标参量;
步骤三、以未混缩噪声的原声景观信号作为对照组,以混缩噪声后的混缩噪声信号作为评价组,将二者进行配对比较评价,得到每一个采集片段中声景观品质受到影响程度的评价等级;
步骤四、基于步骤二和步骤三的数据集,建立决策树分类模型,该步骤进而分为以下步骤;
4-1、读取数据集及数据集预处理;
4-2、训练决策树模型,将数据集中一部分数据作为训练数据,另一部分数据作为测试数据,输入决策树模型进行训练;决策树模型的训练分为以下过程:首先,设第一个结点的训练数据集为D,计算现有特征对该数据集的基尼指数;其次,在所有可能的特征A以及他们所有可能的切分点a中,选择基尼系数最小的特征及其对应的切分点作为最优特征与最优切分点,再次,依最优特征与最优切分点,从现节点生成两个子节点,将训练数据集依特征分配到两个子结点中去;之后,对两个子节点递归地调用上述两个步骤,直至满足停止条件;最终,生成决策树模型;
4-3、数据集中声景观品质的改变程度3个等级分类,将其记为无影响、轻微影响、严重影响;生成后,决策树上的每个节点都标示了分支条件;
步骤五:基于步骤四中的得到的决策树分类模型的分支条件,获取指代声景观品质的指标的不同组合方式与声景观品质受影响程度之间的关系,用于实践中对声景观品质监测,对声景观的受影响程度进行分类识别。
在上述技术方案中,步骤一中,采集点设在值得保护的声景观场景中的典型位置;采集时间为15秒,采样频率为44.1kHz。
在上述技术方案中,步骤二中,噪声信号的类型包括两类:交通噪声和人群噪声;噪声信号的声级大小用信噪比表示,信噪比包括:-5dB、0dB、5dB、10dB和15dB五种情况。
在上述技术方案中,步骤二中,指代声景观品质的指标包括:声事件频谱重心方差、声事件频谱重心方差改变量、响度、响度改变量、尖锐度、尖锐度改变量、响度波动、响度波动改变量、Phi_1、Phi_1改变量、Tau_e改变量、节奏改变量以及粗糙度改变量;其中,声事件频谱重心方差用于描述混缩噪声信号和原声景观信号的背景声和声事件成分的特征,单位为Hz2;响度用于指代人耳对于混缩噪声信号和原声景观信号的强度,单位为sone;响度改变量为混缩噪声信号相对于原声景观信号的响度改变量,单位为sone;尖锐度用于描述人耳对于混缩噪声信号和原声景观信号的音高感,反映声信号的频率分布情况,单位为acum;尖锐度改变量为混缩噪声信号相对于原声景观信号的尖锐度改变量,单位为acum;响度波动用于描述混缩噪声信号和原声景观信号的波动情况,单位为dB;响度波动改变量为混缩噪声信号相对于原声景观信号的响度波动改变量,单位为dB;Phi_1、Tau_e为自相关函数的重要参数,用于描述声信号在事件上的重复性,Phi_1单位为dB,Tau_e单位为ms;节奏改变量为混缩噪声信号相对于原声景观信号的节奏改变量,单位为BPM;粗糙度改变量为混缩噪声信号相对于原声景观信号的粗糙度改变量,单位为asper,粗糙度用于描述声信号由于周期性时域波动所引起的主观听感。
在上述技术方案中,步骤三中,声景观品质受到影响程度的评价等级包括:无影响、轻微影响和严重影响三个等级。
在上述技术方案中,步骤四中,决策树模型的构建基于CART算法,在构建CART决策树时使用“基尼指数”准则来选择和划分属性;使用max_depth作为剪枝参数;在确定深度时,分别设置1-20不同深度,比较不同深度的拟合效果,选择效果最佳的深度设定为最大深度构建决策树模型;在确定分类效果时,采用准确率作为分类效果评价的参照,其表达式为其中TP指模型将正例预测准确的个数,TN指反例预测准确的个数,P和N分别是正和反的样本数总数。
本发明的优点和有益效果为:
1)引入声景观概念,考虑到多个物理指标的组合效应,建立算法模型,提高声景观的品质与客观物理指标对应的科学性和严谨性,解决传统的声压级和频谱进行声环境测量存在的与人实际听闻体验差距大、测量结果误差大、代表性差的问题。在声景观保护工作中可以利用声景观品质的预测模型建立城市声景观监测预警体系,对城市中值得保护的声景观的品质进行科学地评估,以便开展预防性的保护工作;
2)自动检测系统可以代替人工监测,在有效解决人工监测存在的人为因素影响测量结果准确度的问题之外,还可以对实际监测工作提供便利,节省大量的人力资源。
附图说明
图1是本发明值得保护的城市声景观品质监测方法的流程图。
对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,可以根据以上附图获得其他的相关附图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面结合具体实施例进一步说明本发明的技术方案。
本发明是一种基于决策树模型的值得保护的城市声景观品质自动监测方法,包括步骤:
步骤一:对值得保护的城市声景观的不同品质状态进行录音采集。采集点设在值得保护的声景观所在的场景中,采集的时间为该声景观的典型时段,对于该场景具有典型性和代表性,周边没有噪声的干扰。采集时长至少为15秒;采集点附近应没有大的反射面;所用的采集声音信号的设备为数字录音机或相同功能的录音设备,采样频率为44.1kHz。
步骤二:把步骤一采集到的声音信号转换为数字信号得到原声景观信号,将原声景观信号与不同类型、不同声级大小的噪声信号进行混缩,得到多个被噪声干扰的混缩噪声信号;其中混缩用的噪声信号包括交通声和人群噪声;交通声素材选择城市主干路的昼间平峰时段(9:30-11:30)录制;人群噪声素材选择城市繁华商业街录制峰值客流时段(周末15:00-17:00)录制;噪声录制所使用的仪器和参数设定与步骤一中声景观信号采集的方式保持一致;混缩操作可在DAW软件如Adobe Audition中完成。噪声信号的声级大小用信噪比表示,信噪比包括:-5dB、0dB、5dB、10dB和15dB五种情况,原始声景观信号与不同类型和不同信噪比的噪声混缩后,得到10个被噪声干扰的声景观信号。
完成混缩噪声信号制作后,对指代声景观品质的物理指标进行计算,从而获得每一个采集片段的指标参量,包括:
声事件频谱重心方差:声景观中的背景声和声事件成分的特征,单位为Hz2;声事件频谱重心方差改变为混缩噪声信号相对于原声景观信号的声事件频谱重心方差改变量;
响度:人耳对于声信号的强度,单位为sone;响度改变为混缩噪声信号相对于原声景观信号的响度改变量,单位为sone;
尖锐度:声信号的音高感,单位为acum;尖锐度改变为混缩噪声信号相对于原声景观信号的尖锐度改变量,单位为acum;
响度波动:统计百分数声级L10与L90的差值,反映声音大小的波动情况,单位为dB;响度波动改变为混缩噪声信号相对于原声景观信号的响度波动改变量;
Phi_1:ACF曲线中的第一个峰值,单位为dB;Phi_1改变为混缩噪声信号相对于原声景观信号的Phi_1改变量;
Tau_e:ACF曲线中的第一个峰值所对应的时延,单位为ms;Tau_e改变为混缩噪声信号相对于原声景观信号的Tau_e改变量;
节奏:声信号的节奏快慢程度,单位为BPM;节奏改变为混缩噪声信号相对于原声景观信号的节奏改变量;
粗糙度改变:为声音由于周期性时域波动所引起的主观听感,单位为asper;粗糙度改变为混缩噪声信号相对于原声景观信号的粗糙度改变量;
步骤三:对每一个声音信号片段进行主观评价。具体而言,以未加入干扰声源的声景观作为对照组,以加入干扰声源后的声景观作为评价组,将二者进行配对比较。每个声景观播放15秒,播放结束后被试回答问题:“如果对照组声景观品质为原始状态,那么与之相比该声景观品质属于哪个等级?”最终得到每一个采集片段中声景观品质受到影响程度的评价,包括:无影响、轻微影响和严重影响三个等级;
步骤四:基于步骤二和步骤三的数据集,建立决策树分类模型,该步骤进而分为以下步骤;
4-1:读取数据集及数据集预处理;
4-2:训练决策树模型,将数据集中70%的数据作为训练数据,将30%的数据作为测试数据,输入决策树模型进行训练。决策树模型的训练分为以下过程:首先,设第一个结点的训练数据集为D,计算现有特征对该数据集的基尼指数;其次,在所有可能的特征A以及他们所有可能的切分点a中,选择基尼系数最小的特征及其对应的切分点作为最优特征与最优切分点,再次,依最优特征与最优切分点,从现节点生成两个子节点,将训练数据集依特征分配到两个子结点中去;之后,对两个子节点递归地调用上述两个步骤,直至满足停止条件;最终,生成决策树模型。
4-3:数据集中声景观品质的改变程度3个等级分类,将其记为无影响、轻微影响、严重影响。生成后,决策树上的每个节点都标示了分支条件;
步骤五:基于步骤四中的得到的决策树分类模型的分支条件,获取指代性指标的不同组合方式与声景观品质受影响程度之间的关系,用于实践中对声景观品质监测,对声景观的受影响程度进行分类识别。
下面结合附图和具体实施例对本发明技术方案作进一步详细描述。
实施例1:
步骤1:所选监测对象为公园声景观。用使用Sony PCM-D50型数字录音机进行声音录制。录音机安置在地面以上1.5米的高度上,并且远离明显的噪声源,以获得较为真实并且质量较高的声音信号,采集时长是15s,采样频率为44.1kHz。
步骤2:把步骤1采集到的声音信号转换为数字信号,将该信号与不同类型、不同声级大小的噪声信号混缩成多个信号,混缩操作在DAW软件Adobe Audition中完成。
对指代声景观品质的物理指标进行计算分析,获得所有信号的指标参量:声事件频谱重心方差、声事件频谱重心方差改变、响度、响度改变、尖锐度、尖锐度改变、响度波动、响度波动改变、Phi_1、Phi_1改变、Tau_e改变、节奏改变、粗糙度改变的所有数据,部分数据见表1。
表1
步骤3:对每一个采集片段的声音信号进行主观评价。具体而言,以未加入干扰声源的声景观作为对照组,以加入干扰声源后的声景观作为评价组,将二者进行配对比较。每个声景观播放15秒,播放结束后被试回答问题:“如果对照组声景观品质为原始状态,那么与之相比该声景观品质属于哪个等级?”最终得到每一个采集片段中声景观品质受到影响程度的评价,包括:无影响、轻微影响和严重影响三个等级。主观评价被试人数为30人。部分数据见表2。表中主观评价等级列,数字1代表无影响;数字2代表轻微影响;数字3代表严重影响。
表2
步骤4:基于步骤二和步骤三的数据集,建立决策树分类模型,建立决策树分类模型,该步骤进而分为以下几个步骤;
4.1:读取数据集及数据集预处理;
4.2:训练决策树模型。决策树模型的构建基于CART算法,在构建CART决策树时使用“基尼指数”准则来选择和划分属性;使用max_depth作为剪枝参数;在确定深度时,分别设置1-20不同深度,比较不同深度的拟合效果,选择效果最佳的深度设定为最大深度构建决策树模型;在确定分类效果时,采用准确率作为分类效果评价的参照,其表达式为其中TP指模型将正例预测准确的个数,TN指反例预测准确的个数,P和N分别是正和反的样本数总数。进行模型训练时,将数据集中70%的数据作为训练数据,将30%的数据作为测试数据,输入决策树模型进行训练决策树。模型的训练分为以下过程:首先,设第一个结点的训练数据集为D,计算现有特征对该数据集的基尼指数;其次,在所有可能的特征A以及他们所有可能的切分点a中,选择基尼系数最小的特征及其对应的切分点作为最优特征与最优切分点,再次,依最优特征与最优切分点,从现节点生成两个子节点,将训练数据集依特征分配到两个子结点中去;之后,对两个子节点递归地调用上述两个步骤,直至满足停止条件;最终,生成决策树模型。
4.3:数据集中声景观品质的改变程度3个等级分类,将其记为无影响、轻微影响、严重影响。生成后,决策树上的每个节点都标示了分支条件。
步骤5:基于步骤四中的得到的决策树分类模型的分支条件,获取指代性指标的不同组合方式与声景观品质受影响程度之间的关系,用于实践中对声景观品质监测,对声景观的受影响程度进行分类识别。这个分支条件可以作为声景观监测指标的限值,所对应的变量被不同的临界值划分,分次进入最终监测模型。具体来说,根据分支条件可以获得这些指代性指标的不同组合方式与声景观品质受影响程度之间的关系。在实际对声景观品质进行监测时可以通过查表,方便地了解声景观品质的变化程度。本实施例中的决策树模型所得到的指代性指标的组合与声景观品质受影响程度之间的关系见表3。对于此场景,仅有指标参量粗糙度改变量起主导性作用。
表3
影响程度 | 粗糙度改变 |
无影响 | ≤-1.28 |
轻微影响 | -1.155~-0.93 |
严重影响 | >-0.93 |
在实施监测时,录制一段长度为15s的声景观信号片段,对该时刻声景观品质进行判断分类:
计算这段声景观信号片段的声景观品质指代性指标值粗糙度改变的值为-0.84asper:
结合表3给出的指代性指标组合与声景观品质受应巡航程度之间的关系,判断该声景观品质所属分类为严重影响,应当对其采取保护措施。
实施例2:
步骤1:所选监测对象为意大利风情街声景观。用使用Sony PCM-D50型数字录音机进行声音录制。录音机安置在地面以上1.5米的高度上,并且远离明显的噪声源,以获得较为真实并且质量较高的声音信号,采集时长是15s,采样频率为44.1kHz。
步骤2:把步骤1采集到的声音信号转换为数字信号,将该信号与不同类型、不同声级大小的噪声信号混缩成多个信号,混缩操作在DAW软件Adobe Audition中完成。
对指代声景观品质的物理指标进行计算分析,获得所有信号的指标参量:声事件频谱重心方差、声事件频谱重心方差改变、响度、响度改变、尖锐度、尖锐度改变、响度波动、响度波动改变、Phi_1、Phi_1改变、Tau_e改变、节奏改变、粗糙度改变的所有数据,部分数据见表4。
表4
录音编号 | 声时间频谱重心方差 | …… | 粗糙度改变 |
1 | 51.51 | …… | 0.2 |
2 | 78.93 | …… | -0.03 |
3 | 124.27 | …… | -0.23 |
4 | 178.93 | …… | -0.38 |
5 | 197.2 | …… | -0.52 |
6 | 83.89 | …… | 0.19 |
7 | 100.78 | …… | -0.06 |
8 | 196.06 | …… | -0.26 |
9 | 228.73 | …… | -0.44 |
10 | 208.49 | …… | -0.56 |
步骤3:对每一个声音信号片段进行主观评价。具体而言,以未加入干扰声源的声景观作为对照组,以加入干扰声源后的声景观作为评价组,将二者进行配对比较。每个声景观播放15秒,播放结束后被试回答问题:“如果对照组声景观品质为原始状态,那么与之相比该声景观品质属于哪个等级?”最终得到每一个采集片段中声景观品质受到影响程度的评价,包括:无影响、轻微影响和严重影响三个等级。主观评价被试人数为30人。部分数据见表5。表中主观评价等级列,数字1代表无影响;数字2代表轻微影响;数字3代表严重影响。
表5
步骤4:基于步骤二和步骤三的数据集,建立决策树分类模型,建立决策树分类模型,该步骤进而分为以下几个步骤;
4.1:读取数据集及数据集预处理;
4.2:训练决策树模型。决策树模型的构建基于CART算法,在构建CART决策树时使用“基尼指数”准则来选择和划分属性;使用max_depth作为剪枝参数;在确定深度时,分别设置1-20不同深度,比较不同深度的拟合效果,选择效果最佳的深度设定为最大深度构建决策树模型;在确定分类效果时,采用准确率作为分类效果评价的参照,其表达式为其中TP指模型将正例预测准确的个数,TN指反例预测准确的个数,P和N分别是正和反的样本数总数。进行模型训练时,将数据集中70%的数据作为训练数据,将30%的数据作为测试数据,输入决策树模型进行训练决策树。模型的训练分为以下过程:首先,设第一个结点的训练数据集为D,计算现有特征对该数据集的基尼指数;其次,在所有可能的特征A以及他们所有可能的切分点a中,选择基尼系数最小的特征及其对应的切分点作为最优特征与最优切分点,再次,依最优特征与最优切分点,从现节点生成两个子节点,将训练数据集依特征分配到两个子结点中去;之后,对两个子节点递归地调用上述两个步骤,直至满足停止条件;最终,生成决策树模型。
4.3:数据集中声景观品质的改变程度3个等级分类,将其记为无影响、轻微影响、严重影响。生成后,决策树上的每个节点都标示了分支条件。
步骤5:基于步骤四中的得到的决策树分类模型的分支条件,获取指代性指标的不同组合方式与声景观品质受影响程度之间的关系,用于实践中对声景观品质监测,对声景观的受影响程度进行分类识别。这个分支条件可以作为声景观监测指标的限值,所对应的变量被不同的临界值划分,分次进入最终监测模型。具体来说,根据分支条件可以获得这些指代性指标的不同组合方式与声景观品质受影响程度之间的关系。在实际对声景观品质进行监测时可以通过查表,方便地了解声景观品质的变化程度。本实施例中的决策树模型所得到的指代性指标的组合与声景观品质受影响程度之间的关系见表6。对于此场景,指标参量尖锐度改变量和响度起主导性作用。
表6
影响程度 | 尖锐度改变 | 响度 |
无影响 | ≤-0.165 | |
轻微影响 | >-0.165 | ≤11.75 |
严重影响 | >-0.165 | >11.75 |
在实施监测时,录制一段长度为15s的声景观信号片段,对该时刻声景观品质进行判断分类:
计算这段声景观信号片段的声景观品质指代性指标值尖锐度改变、响度的值分别为-0.15acum和10.5sone:
结合表6给出的指代性指标组合与声景观品质受应巡航程度之间的关系,判断该声景观品质所属分类为轻微影响,应当考虑对其采取保护措施,缓解其受破坏的程度。
尽管上面结合实例对本发明进行了描述,但是本发明并不局限于上述的具体实施方式,上述的具体实施方式仅仅是示意性的,而不是限制性的,本领域的普通技术人员在本发明的启示下,在不脱离本发明宗旨的情况下,还可以做出很多变形,这些均属于本发明的保护之内。
以上对本发明做了示例性的描述,应该说明的是,在不脱离本发明的核心的情况下,任何简单的变形、修改或者其他本领域技术人员能够不花费创造性劳动的等同替换均落入本发明的保护范围。
Claims (6)
1.一种值得保护的城市声景观品质自动监测方法,其特征在于,包括步骤:
步骤一:对值得保护的城市声景观的不同品质状态进行录音采集;
步骤二:把步骤一采集到的声音信号转换为数字信号得到原声景观信号,将原声景观信号与不同类型、不同声级大小的噪声信号进行混缩,得到多个被噪声干扰的混缩噪声信号;对所有信号指代声景观品质的指标进行计算,从而获得每一个采集片段的指标参量;
步骤三、以未混缩噪声的原声景观信号作为对照组,以混缩噪声后的混缩噪声信号作为评价组,将二者进行配对比较评价,得到每一个采集片段中声景观品质受到影响程度的评价等级;
步骤四、基于步骤二和步骤三的数据集,建立决策树分类模型,该步骤进而分为以下步骤;
4-1、读取数据集及数据集预处理;
4-2、训练决策树模型,将数据集中一部分数据作为训练数据,另一部分数据作为测试数据,输入决策树模型进行训练;决策树模型的训练分为以下过程:首先,设第一个结点的训练数据集为D,计算现有特征对该数据集的基尼指数;其次,在所有可能的特征A以及他们所有可能的切分点a中,选择基尼系数最小的特征及其对应的切分点作为最优特征与最优切分点,再次,依最优特征与最优切分点,从现节点生成两个子节点,将训练数据集依特征分配到两个子结点中去;之后,对两个子节点递归地调用上述两个步骤,直至满足停止条件;最终,生成决策树模型;
4-3、数据集中声景观品质的改变程度3个等级分类,将其记为无影响、轻微影响、严重影响;生成后,决策树上的每个节点都标示了分支条件;
步骤五:基于步骤四中的得到的决策树分类模型的分支条件,获取指代声景观品质的指标的不同组合方式与声景观品质受影响程度之间的关系,用于实践中对声景观品质监测,对声景观的受影响程度进行分类识别。
2.根据权利要求1所述的值得保护的城市声景观品质自动监测方法,其特征在于:步骤一中,采集点设在值得保护的声景观场景中的典型位置;采集时间为15秒,采样频率为44.1kHz。
3.根据权利要求1所述的值得保护的城市声景观品质自动监测方法,其特征在于:步骤二中,噪声信号的类型包括两类:交通噪声和人群噪声;噪声信号的声级大小用信噪比表示,信噪比包括:-5dB、0dB、5dB、10dB和15dB五种情况。
4.根据权利要求1所述的值得保护的城市声景观品质自动监测方法,其特征在于:步骤二中,指代声景观品质的指标包括:声事件频谱重心方差、声事件频谱重心方差改变量、响度、响度改变量、尖锐度、尖锐度改变量、响度波动、响度波动改变量、Phi_1、Phi_1改变量、Tau_e改变量、节奏改变量以及粗糙度改变量;其中,声事件频谱重心方差用于描述混缩噪声信号和原声景观信号的背景声和声事件成分的特征,单位为Hz2;响度用于指代人耳对于混缩噪声信号和原声景观信号的强度,单位为sone;响度改变量为混缩噪声信号相对于原声景观信号的响度改变量,单位为sone;尖锐度用于描述人耳对于混缩噪声信号和原声景观信号的音高感,反映声信号的频率分布情况,单位为acum;尖锐度改变量为混缩噪声信号相对于原声景观信号的尖锐度改变量,单位为acum;响度波动用于描述混缩噪声信号和原声景观信号的波动情况,单位为dB;响度波动改变量为混缩噪声信号相对于原声景观信号的响度波动改变量,单位为dB;Phi_1、Tau_e为自相关函数的重要参数,用于描述声信号在事件上的重复性,Phi_1单位为dB,Tau_e单位为ms;节奏改变量为混缩噪声信号相对于原声景观信号的节奏改变量,单位为BPM;粗糙度改变量为混缩噪声信号相对于原声景观信号的粗糙度改变量,单位为asper,粗糙度用于描述声信号由于周期性时域波动所引起的主观听感。
5.根据权利要求1所述的值得保护的城市声景观品质自动监测方法,其特征在于:步骤三中,声景观品质受到影响程度的评价等级包括:无影响、轻微影响和严重影响三个等级。
6.根据权利要求1所述的值得保护的城市声景观品质自动监测方法,其特征在于:步骤四中,决策树模型的构建基于CART算法,在构建CART决策树时使用“基尼指数”准则来选择和划分属性;使用max_depth作为剪枝参数;在确定深度时,分别设置1-20不同深度,比较不同深度的拟合效果,选择效果最佳的深度设定为最大深度构建决策树模型;在确定分类效果时,采用准确率作为分类效果评价的参照,其表达式为其中TP指模型将正例预测准确的个数,TN指反例预测准确的个数,P和N分别是正和反的样本数总数。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111035031.7A CN113782053B (zh) | 2021-09-04 | 2021-09-04 | 值得保护的城市声景观品质自动监测方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111035031.7A CN113782053B (zh) | 2021-09-04 | 2021-09-04 | 值得保护的城市声景观品质自动监测方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN113782053A CN113782053A (zh) | 2021-12-10 |
CN113782053B true CN113782053B (zh) | 2023-09-22 |
Family
ID=78841250
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111035031.7A Active CN113782053B (zh) | 2021-09-04 | 2021-09-04 | 值得保护的城市声景观品质自动监测方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113782053B (zh) |
Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102077503A (zh) * | 2008-06-24 | 2011-05-25 | 高通股份有限公司 | 信道质量指示符的相位噪声弹性产生 |
CN103471709A (zh) * | 2013-09-17 | 2013-12-25 | 吉林大学 | 乘用车车内噪声声品质预测方法 |
CN103925989A (zh) * | 2014-03-25 | 2014-07-16 | 天津大学 | 基于acf和iacf的交通噪声自动识别方法 |
CN105021275A (zh) * | 2015-07-15 | 2015-11-04 | 吉林大学 | 基于时域动态特性分析的车内声品质预测方法 |
JP2018081200A (ja) * | 2016-11-16 | 2018-05-24 | Kddi株式会社 | 音声合成のためのデータベースの生成装置、生成方法、音声合成装置及びプログラム |
CN108630228A (zh) * | 2017-03-20 | 2018-10-09 | 比亚迪股份有限公司 | 声品质识别方法、装置、系统、以及车辆 |
CN109243429A (zh) * | 2018-11-21 | 2019-01-18 | 苏州奇梦者网络科技有限公司 | 一种语音建模方法及装置 |
CN109668626A (zh) * | 2018-12-25 | 2019-04-23 | 东莞材料基因高等理工研究院 | 一种基于人机交互界面的噪声声品质评价方法 |
CA3040961A1 (en) * | 2018-04-25 | 2019-10-25 | Metropolitan Airports Commission | Airport noise classification method and system |
WO2019242302A1 (zh) * | 2018-06-22 | 2019-12-26 | 哈尔滨工业大学(深圳) | 一种基于声源识别的噪声监测方法与系统 |
CN111128226A (zh) * | 2019-12-30 | 2020-05-08 | 广东电网有限责任公司电力科学研究院 | 一种噪声声品质检测的装置及方法 |
CN111637965A (zh) * | 2020-06-08 | 2020-09-08 | 田锐 | 一种噪声信息检测方法及其相关设备 |
CN112530455A (zh) * | 2020-11-24 | 2021-03-19 | 东风汽车集团有限公司 | 基于mfcc的汽车关门声品质评价方法及评价系统 |
-
2021
- 2021-09-04 CN CN202111035031.7A patent/CN113782053B/zh active Active
Patent Citations (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102077503A (zh) * | 2008-06-24 | 2011-05-25 | 高通股份有限公司 | 信道质量指示符的相位噪声弹性产生 |
CN103471709A (zh) * | 2013-09-17 | 2013-12-25 | 吉林大学 | 乘用车车内噪声声品质预测方法 |
CN103925989A (zh) * | 2014-03-25 | 2014-07-16 | 天津大学 | 基于acf和iacf的交通噪声自动识别方法 |
CN105021275A (zh) * | 2015-07-15 | 2015-11-04 | 吉林大学 | 基于时域动态特性分析的车内声品质预测方法 |
JP2018081200A (ja) * | 2016-11-16 | 2018-05-24 | Kddi株式会社 | 音声合成のためのデータベースの生成装置、生成方法、音声合成装置及びプログラム |
CN108630228A (zh) * | 2017-03-20 | 2018-10-09 | 比亚迪股份有限公司 | 声品质识别方法、装置、系统、以及车辆 |
CA3040961A1 (en) * | 2018-04-25 | 2019-10-25 | Metropolitan Airports Commission | Airport noise classification method and system |
WO2019242302A1 (zh) * | 2018-06-22 | 2019-12-26 | 哈尔滨工业大学(深圳) | 一种基于声源识别的噪声监测方法与系统 |
CN109243429A (zh) * | 2018-11-21 | 2019-01-18 | 苏州奇梦者网络科技有限公司 | 一种语音建模方法及装置 |
CN109668626A (zh) * | 2018-12-25 | 2019-04-23 | 东莞材料基因高等理工研究院 | 一种基于人机交互界面的噪声声品质评价方法 |
CN111128226A (zh) * | 2019-12-30 | 2020-05-08 | 广东电网有限责任公司电力科学研究院 | 一种噪声声品质检测的装置及方法 |
CN111637965A (zh) * | 2020-06-08 | 2020-09-08 | 田锐 | 一种噪声信息检测方法及其相关设备 |
CN112530455A (zh) * | 2020-11-24 | 2021-03-19 | 东风汽车集团有限公司 | 基于mfcc的汽车关门声品质评价方法及评价系统 |
Non-Patent Citations (2)
Title |
---|
城市变电站噪声的声品质烦躁度评价试验研究;陈勇勇;王小鹏;杨威;;科学技术与工程(第13期);219-223 * |
城市商业街声景的特征与评价――以天津市五条知名商业街为例;杨璐;马蕙;于博雅;;新建筑(第03期);88-91 * |
Also Published As
Publication number | Publication date |
---|---|
CN113782053A (zh) | 2021-12-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Nilsson | A-weighted sound pressure level as an indicator of short-term loudness or annoyance of road-traffic sound | |
Trollé et al. | Short-term annoyance due to tramway noise: Determination of an acoustical indicator of annoyance via multilevel regression analysis | |
Rychtáriková et al. | Soundscape categorization on the basis of objective acoustical parameters | |
Alayrac et al. | Annoyance from industrial noise: Indicators for a wide variety of industrial sources | |
Jambrošić et al. | Assessment of urban soundscapes with the focus on an architectural installation with musical features | |
CN102928071B (zh) | 基于心电指标的道路交通噪声检测系统和方法 | |
CN112098939B (zh) | 一种噪声污染源的识别与评价方法及装置 | |
Alamir et al. | Subjective responses to wind farm noise: A review of laboratory listening test methods | |
CN109920446A (zh) | 一种音频数据处理方法、装置及计算机存储介质 | |
Xie et al. | Research and development of sound quality in portable testing and evaluation system based on self-adaptive neural network | |
CN108615536A (zh) | 基于麦克风阵列的时频联合特征乐器音质评价系统及方法 | |
Bilen et al. | An applied soundscape approach for acoustic evaluation–compatibility with ISO 12913 | |
CN109933933B (zh) | 一种噪声治理方法和设备 | |
CN107885845A (zh) | 音频分类方法及装置、计算机设备及存储介质 | |
CN113782053B (zh) | 值得保护的城市声景观品质自动监测方法 | |
CN114387987A (zh) | 生态噪声源的测量方法、装置、终端及存储介质 | |
Fishbach | Primary segmentation of auditory scenes | |
CN102184733A (zh) | 基于音频关注度的音频质量评价系统及方法 | |
Labairu-Trenchs et al. | Noise annoyance in urban life: the citizen as a key point of the directives | |
Song et al. | Annoyance measurement of singapore urban environmental noise | |
Lee et al. | Annoyance modeling using personal and situational variables for construction site noise in urban areas | |
JP5961048B2 (ja) | 聴覚印象量推定装置及びそのプログラム | |
Paszkowski et al. | Evaluation of sound quality features on environmental noise effects-a case study applied to road traffic noise | |
Effa et al. | Convolutional Neural Network for Audibility Assessment of Acoustic Alarms. | |
JP4590545B2 (ja) | 音響評価方法およびそのシステム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |