CN117202077B - 一种麦克风智能校正方法 - Google Patents
一种麦克风智能校正方法 Download PDFInfo
- Publication number
- CN117202077B CN117202077B CN202311450566.XA CN202311450566A CN117202077B CN 117202077 B CN117202077 B CN 117202077B CN 202311450566 A CN202311450566 A CN 202311450566A CN 117202077 B CN117202077 B CN 117202077B
- Authority
- CN
- China
- Prior art keywords
- audio signal
- analog audio
- signal data
- microphone
- anomaly
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 53
- 238000012937 correction Methods 0.000 title claims abstract description 20
- 230000005236 sound signal Effects 0.000 claims abstract description 225
- 239000011159 matrix material Substances 0.000 claims abstract description 88
- 230000002159 abnormal effect Effects 0.000 claims abstract description 56
- 238000012544 monitoring process Methods 0.000 claims abstract description 54
- 230000005856 abnormality Effects 0.000 claims abstract description 49
- 238000012880 independent component analysis Methods 0.000 claims abstract description 9
- 239000012634 fragment Substances 0.000 claims description 6
- 238000010606 normalization Methods 0.000 claims description 6
- 238000004364 calculation method Methods 0.000 claims description 4
- 238000004088 simulation Methods 0.000 claims description 4
- 238000001914 filtration Methods 0.000 claims description 3
- 238000012545 processing Methods 0.000 abstract description 2
- 230000000737 periodic effect Effects 0.000 description 5
- 230000000694 effects Effects 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 230000001629 suppression Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 210000001260 vocal cord Anatomy 0.000 description 1
Landscapes
- Circuit For Audible Band Transducer (AREA)
Abstract
本发明涉及数据处理技术领域,具体涉及一种麦克风智能校正方法,包括:获取麦克风的监测混合模拟音频信号数据;对麦克风的监测混合模拟音频信号数据进行独立成分分析,得到若干个独立成分模拟音频信号数据,获取每个独立成分模拟音频信号数据中每个局部区域的变化异常程度;获取麦克风的监测混合模拟音频信号数据的异常矩阵上每个元素的异常变化一致程度;根据麦克风的监测混合模拟音频信号数据的异常矩阵上每个元素的异常置信程度,对麦克风的监测混合模拟音频信号数据进行调整,实现麦克风音频数据的智能校正。本发明精准的实现麦克风的智能校正,提高了语音信号的清晰度。
Description
技术领域
本发明涉及数据处理技术领域,具体涉及一种麦克风智能校正方法。
背景技术
在会议系统麦克风工作场景中,在参会人员发言的时,往往存在桌椅板凳摩擦、书本翻页等的多种短促尖锐噪声,人声与噪声的混合音频信号在被会议系统不同位置的多个麦克风捕捉并通过喇叭放大,影响获取的人声音频数据质量与会议室内的声音感官,因此需要对获取的多人声与噪声的混合音频信号进行智能校正,使得麦克风在复杂噪音环境下更好地聚焦于目标声源,提高语音信号的清晰度和可理解性。
通过现有技术独立成分分析可以将混合模拟音频信号数据进行分解,但会导致短促尖锐噪声会被分解到不同的独立成分中,难以实现精准有效的将各个独立成分中的噪声抑制,最终难以实现麦克风智能校正的目的。
发明内容
为了解决上述问题,本发明提供一种麦克风智能校正方法,所述方法包括:
获取麦克风的监测混合模拟音频信号数据;
对麦克风的监测混合模拟音频信号数据进行独立成分分析,得到若干个独立成分模拟音频信号数据;获取每个独立成分模拟音频信号数据的局部区域;获取每个独立成分模拟音频信号数据中每个局部区域的变化异常程度;
根据每个独立成分模拟音频信号数据中每个局部区域的变化异常程度,获取麦克风的监测混合模拟音频信号数据的异常矩阵;获取麦克风的监测混合模拟音频信号数据的异常矩阵上的每个元素的第一异常可能性;根据麦克风的监测混合模拟音频信号数据的异常矩阵上的每个元素的第一异常可能性,获取每个元素的噪声异常可能性;根据麦克风的监测混合模拟音频信号数据的异常矩阵上的每个元素的噪声异常可能性,获取每个元素的异常变化一致程度;
根据麦克风的监测混合模拟音频信号数据的异常矩阵上的每个元素的异常变化一致程度,获取每个元素的异常置信程度;根据麦克风的监测混合模拟音频信号数据的异常矩阵上的每个元素的异常置信程度,对麦克风的监测混合模拟音频信号数据进行调整。
优选的,所述获取每个独立成分模拟音频信号数据的局部区域,包括的具体方法为:
对于第个独立成分模拟音频信号数据,构建第/>个独立成分模拟音频信号数据的数据时间曲线,横坐标为时间点,纵坐标为每个时间点对应的独立成分模拟音频信号数据;将第/>个独立成分模拟音频信号数据的数据时间曲线上所有数据点的斜率组成第/>个独立成分斜率序列;利用预设阈值/>对第/>个独立成分斜率序列进行分割,获得第/>个独立成分斜率序列的若干个斜率子序列;其中,第/>个独立成分斜率序列的每个斜率子序列对应第/>个独立成分模拟音频信号数据的每个局部区域。
优选的,所述获取每个独立成分模拟音频信号数据中每个局部区域的变化异常程度的具体公式为:
式中,表示第/>个独立成分模拟音频信号数据的第/>个局部区域的变化异常程度;/>表示第/>个独立成分斜率序列的所有斜率子序列数量;/>表示第/>个独立成分斜率序列的第/>个斜率子序列;/>表示第/>个独立成分斜率序列的第/>个斜率子序列;/>表示线性归一化函数;/>表示DTW距离。
优选的,所述根据每个独立成分模拟音频信号数据中每个局部区域的变化异常程度,获取麦克风的监测混合模拟音频信号数据的异常矩阵,包括的具体方法为:
对于第个独立成分模拟音频信号数据,将第/>个独立成分模拟音频信号数据的所有局部区域的变化异常程度按照从大到小进行排序,获得第/>个独立成分模拟音频信号数据的排列序号;同理,获得每个独立成分模拟音频信号数据的排列序号;
将所有独立成分模拟音频信号数据构建麦克风的监测混合模拟音频信号数据的异常矩阵;异常矩阵的元素值为每个独立成分模拟音频信号数据中每个局部区域的变化异常程度;其中异常矩阵的每一行包括每个独立成分模拟音频信号数据中所有局部区域的变化异常程度,每个独立成分模拟音频信号数据的排列序号作为异常矩阵的列。
优选的,所述获取麦克风的监测混合模拟音频信号数据的异常矩阵上的每个元素的第一异常可能性,包括的具体方法为:
对于麦克风的监测混合模拟音频信号数据的异常矩阵上的第行第/>列元素,将第行第/>列元素与第/>行第/>列元素的差值绝对值,记为第一差值;将第/>行第/>列元素与第/>行第/>列元素的差值绝对值,记为第二差值;将第一差值与第二差值的和,作为第/>行第/>列元素的第一异常可能性。
优选的,所述根据麦克风的监测混合模拟音频信号数据的异常矩阵上的每个元素的第一异常可能性,获取每个元素的噪声异常可能性,包括的具体方法为:
根据麦克风的监测混合模拟音频信号数据的异常矩阵上每个元素,得到每个元素的模拟变化异常程度;则麦克风的监测混合模拟音频信号数据的异常矩阵上的第行第/>列元素的噪声异常可能性的计算表达式为:
式中,表示麦克风的监测混合模拟音频信号数据的异常矩阵上的第/>行第/>列元素的噪声异常可能性;/>表示麦克风的监测混合模拟音频信号数据的异常矩阵上的第/>行第/>列元素的第一异常可能性;/>表示麦克风的监测混合模拟音频信号数据的异常矩阵上的第/>行第/>列元素;/>表示麦克风的监测混合模拟音频信号数据的异常矩阵上的第/>行第/>列元素的模拟变化异常程度;/>表示取绝对值。
优选的,所述根据麦克风的监测混合模拟音频信号数据的异常矩阵上的每个元素的噪声异常可能性,获取每个元素的异常变化一致程度的具体公式为:
式中,表示麦克风的监测混合模拟音频信号数据的异常矩阵上的第/>行第/>列元素的异常变化一致程度;/>表示麦克风的监测混合模拟音频信号数据的所有独立成分模拟音频信号数据的总数量;/>表示麦克风的监测混合模拟音频信号数据的异常矩阵上的第/>行第/>列元素的噪声异常可能性;/>表示麦克风的监测混合模拟音频信号数据的异常矩阵上的第/>行第/>列元素的噪声异常可能性;/>表示以自然常数为底数的指数函数;/>表示取绝对值。
优选的,所述根据麦克风的监测混合模拟音频信号数据的异常矩阵上的每个元素的异常变化一致程度,获取每个元素的异常置信程度,包括的具体方法为:
对于麦克风的监测混合模拟音频信号数据的异常矩阵上的第行第/>列元素,将第行第/>列元素与第/>行第/>列元素的异常变化一致程度的乘积,记为第一乘积,利用/>线性归一化函数对第一乘积进行归一化后,得到归一化后的第一乘积,将归一化后的第一乘积作为第/>行第/>列元素的异常置信程度。
优选的,所述根据麦克风的监测混合模拟音频信号数据的异常矩阵上的每个元素的异常置信程度,对麦克风的监测混合模拟音频信号数据进行调整,包括的具体方法为:
对于麦克风的监测混合模拟音频信号数据的异常矩阵上的任意一个元素,所述元素与每个独立成分模拟音频信号数据中每个局部区域一一对应,每个局部区域与独立成分斜率序列的每个斜率子序列一一对应,每个斜率子序列与独立成分模拟音频信号数据中每个模拟音频信号片段对应,进而得到所述元素与之对应的模拟音频信号片段;
将异常矩阵上的元素对应的模拟音频信号片段根据异常置信程度划分为第一片段和第二片段;将每个第二片段替换为第一片段的均值片段,得到调整后的第二片段;将所有第一片段和所有调整后的第二片段进行组合,得到每个调整后独立成分模拟音频信号数据;对每个调整后独立成分模拟音频信号数据进行高斯滤波,得到所有修正后的独立成分模拟音频信号数据;使用混音器将所有修正后的独立成分模拟音频信号数据进行多通道混合,获得校正后的混合音频信号数据。
优选的,所述第一片段和第二片段的获取方法为:
对于麦克风的监测混合模拟音频信号数据的异常矩阵上的任意一个元素,若所述元素的异常置信程度小于等于预设阈值,则将所述元素记为第一元素;若所述元素的异常置信程度大于预设阈值/>,则将所述元素记为第二元素;将每个第一元素所对应模拟音频信号片段,记为第一片段;将每个第二元素所对应的模拟音频信号片段,记为第二片段。
本发明的技术方案的有益效果是:针对利用独立成分分析将混合模拟音频信号数据进行分解,导致短促尖锐噪声会被分解到不同的独立成分中,进而难以实现精准有效的将各个独立成分中的噪声抑制的问题;本发明能够根据噪声对于各独立成分内的变化趋势影响及各独立成分间的异常一致性变化趋势,获得噪声影响的异常置信程度,表征各成分内的噪声的影响可信程度,便于后续的混合模拟音频信号的调整,实现麦克风智能校正。本发明通过精确化分析独立成分中噪声随距离衰减造成的影响置信度,更加精准的实现麦克风的智能校正,提高了语音信号的清晰度。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明一种麦克风智能校正方法的步骤流程图。
具体实施方式
为了更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本发明提出的一种麦克风智能校正方法,其具体实施方式、结构、特征及其功效,详细说明如下。在下述说明中,不同的“一个实施例”或“另一个实施例”指的不一定是同一实施例。此外,一或多个实施例中的特定特征、结构或特点可由任何合适形式组合。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。
下面结合附图具体的说明本发明所提供的一种麦克风智能校正方法的具体方案。
请参阅图1,其示出了本发明一个实施例提供的一种麦克风智能校正方法的步骤流程图,该方法包括以下步骤:
步骤S001:获取麦克风的监测混合模拟音频信号数据。
需要说明的是,本实施根据多个位置的麦克风获取麦克风的监测混合模拟音频信号数据,对麦克风的监测混合模拟音频信号数据进行独立成分分析,获取声帧时间间隔内的独立成分中噪声对其周期性的破坏程度,并结合多个独立成分的声帧内的异常一致性,获取噪声影响的异常置信程度,并由此实现噪声的抑制与独立成分的清晰化,最终实现麦克风智能校正的目的。
具体的,为了实现本实施例提出的一种麦克风智能校正方法,首先需要采集麦克风的监测混合模拟音频信号数据,具体过程为:
在会议系统中,通过多位置的麦克风的内部电信号传感器,将会议声音转化为电信号,进而获得麦克风的监测混合模拟音频信号数据;其中,本实施例以采样频率为44.1kHz,采样时间区间为一个声帧进行叙述,可根据具体实施场景设定,本实施例不进行具体限定;采集得到的麦克风的监测混合模拟音频信号数据的长度为一个声帧时间区间。
至此,通过上述方法得到麦克风的监测混合模拟音频信号数据。
步骤S002:对麦克风的监测混合模拟音频信号数据进行独立成分分析,得到若干个独立成分模拟音频信号数据,获取每个独立成分模拟音频信号数据中每个局部区域的变化异常程度。
需要说明的是,由于独立成分分析可以将采集的麦克风的监测混合模拟音频信号数据分解成多个独立成分,多个独立成分对应于多个声源产生的信号,由于不同声源的不同发声特点与音素音调等,其在一个声帧内呈现出近似周期变化的特征,而短促尖锐的噪声也会存在于声帧内局部区间中,影响独立成分的周期性变化特点。
具体的,通过独立成分分析对麦克风的监测混合模拟音频信号数据进行分解,获得若干个独立成分模拟音频信号数据;其中,每个独立成分模拟音频信号数据的长度与麦克风的监测混合模拟音频信号数据一致;独立成分分析为现有技术,本实施例此处不做过多赘述。
需要说明的是,在每个独立成分模拟音频信号数据中,噪声对其局部区间有较大的影响,具体表现为独立成分模拟音频信号数据的局部区间信号变化程度较大,由于每个独立成分模拟音频信号是连续信号,利用独立成分模拟音频信号数据上的各时间点对应的曲线斜率表征其变化程度,获得各独立成分模拟音频信号数据内局部区间的变化异常程度。
预设一个阈值,其中本实施例以/>为例进行叙述,本实施例不进行具体限定,其中/>根据具体实施情况而定。
具体的,对于第个独立成分模拟音频信号数据,构建第/>个独立成分模拟音频信号数据的数据时间曲线,横坐标为时间点,纵坐标为每个时间点对应的独立成分模拟音频信号数据;将第/>个独立成分模拟音频信号数据的数据时间曲线上所有数据点的斜率组成第/>个独立成分斜率序列。
利用预设阈值对第/>个独立成分斜率序列进行分割具体方法为:将第/>个独立成分斜率序列等长分割成若干个长度为预设阈值/>的斜率子序列,进而获得第/>个独立成分斜率序列的若干个斜率子序列;其中,第/>个独立成分斜率序列的每个斜率子序列对应第/>个独立成分模拟音频信号数据的每个局部区域;在第/>个独立成分斜率序列等长分割过程中,若最后一个斜率子序列的长度不足预设阈值/>时,则将最后一个斜率子序列也作为第/>个独立成分斜率序列中的一个斜率子序列。
进一步,第个独立成分模拟音频信号数据的第/>个局部区域的变化异常程度的计算表达式为:
式中,表示第/>个独立成分模拟音频信号数据的第/>个局部区域的变化异常程度;/>表示第/>个独立成分斜率序列的所有斜率子序列数量;/>表示第/>个独立成分斜率序列的第/>个斜率子序列;/>表示第/>个独立成分斜率序列的第/>个斜率子序列;/>表示线性归一化函数;/>表示DTW距离,用于表示两个序列的差异程度。
需要说明的是,对于第个独立成分斜率序列的任意一个斜率子序列,若所述斜率子序列与第/>个独立成分斜率序列的其他斜率子序列的变化幅度差异越大,则所述斜率子序列对应第/>个独立成分模拟音频信号数据的局部区间的变化异常程度越大。
至此,通过上述方法得到每个独立成分模拟音频信号数据中每个局部区域的变化异常程度。
步骤S003:根据麦克风的监测混合模拟音频信号数据的异常矩阵上的每个元素的噪声异常可能性,获取每个元素的异常变化一致程度。
需要说明的是,由于获取的每个独立成分模拟音频信号数据中每个局部区域的变化异常程度能表现出各独立成分模拟音频信号数据内的变化异常,但各独立成分模拟音频信号数据不是严格的周期性,其本身存在一定的波动变化,且其在会议系统空间内麦克风的位置与噪声发生声源的位置间的空间距离会造成麦克风收录混合信号中的噪声影响程度发生变化,具体表现为噪声属于高频信息,随着距离的增加会发生衰减,噪声的影响在某个独立成分中并不十分明显,但在不同独立成分模拟音频信号数据中的相对应的局部区间内会表现出异常一致性变化趋势;因此,根据获得的每个独立成分模拟音频信号数据中每个局部区域的变化异常程度,结合其空间距离变化产生的信号衰减结合不同独立成分模拟音频信号数据中的局部区间内会表现出异常一致性变化趋势,获得独立成分模拟音频信号数据的每个局部区间的异常变化一致程度。
1.获取麦克风的监测混合模拟音频信号数据的异常矩阵。
具体的,对于第个独立成分模拟音频信号数据,将第/>个独立成分模拟音频信号数据的所有局部区域的变化异常程度按照从大到小进行排序,获得第/>个独立成分模拟音频信号数据的排列序号;同理,获得每个独立成分模拟音频信号数据的排列序号;
进一步,将所有独立成分模拟音频信号数据构建麦克风的监测混合模拟音频信号数据的异常矩阵;异常矩阵的元素值为每个独立成分模拟音频信号数据中每个局部区域的变化异常程度;其中异常矩阵的每一行包括每个独立成分模拟音频信号数据中所有局部区域的变化异常程度,每个独立成分模拟音频信号数据的排列序号作为异常矩阵的列。
至此,获得麦克风的监测混合模拟音频信号数据的异常矩阵。
2.获取麦克风的监测混合模拟音频信号数据的异常矩阵上每个元素的异常变化一致程度。
需要说明的是,对于第个独立成分模拟音频信号数据,在麦克风的监测混合模拟音频信号数据的异常矩阵中,若第/>个独立成分模拟音频信号数据的任意一个局部区域与其左右相邻局部区域的变化异常程度差值越大,且所述局部区域的变化异常程度越接近模拟值,则所述局部区域的异常变化一致程度越高,表明所述局部区域上表现的异常越接近于噪声表现的衰减特性,越可能是噪声引起的异常。
具体的,对于麦克风的监测混合模拟音频信号数据的异常矩阵上的第行第/>列元素,将第/>行第/>列元素与第/>行第/>列元素的差值绝对值,记为第一差值;将第/>行第/>列元素与第/>行第/>列元素的差值绝对值,记为第二差值;将第一差值与第二差值的和,作为第/>行第/>列元素的第一异常可能性;其中,对于第/>行第/>列元素只有一个相邻元素时,将第/>行第/>列元素与相邻元素的差值绝对值的2倍,作为第/>行第/>列元素的第一异常可能性。
对于麦克风的监测混合模拟音频信号数据的异常矩阵上每个元素,获得每个元素的模拟变化异常程度,/>表示元素值;则麦克风的监测混合模拟音频信号数据的异常矩阵上的第/>行第/>列元素的噪声异常可能性的计算表达式为:
式中,表示麦克风的监测混合模拟音频信号数据的异常矩阵上的第/>行第/>列元素的噪声异常可能性;/>表示麦克风的监测混合模拟音频信号数据的异常矩阵上的第/>行第/>列元素的第一异常可能性;/>表示麦克风的监测混合模拟音频信号数据的异常矩阵上的第/>行第/>列元素;/>表示麦克风的监测混合模拟音频信号数据的异常矩阵上的第/>行第/>列元素的模拟变化异常程度;/>表示取绝对值。
进一步,麦克风的监测混合模拟音频信号数据的异常矩阵上的第行第/>列元素的异常变化一致程度的计算表达式为:
式中,表示麦克风的监测混合模拟音频信号数据的异常矩阵上的第/>行第/>列元素的异常变化一致程度;/>表示麦克风的监测混合模拟音频信号数据的所有独立成分模拟音频信号数据的总数量;/>表示麦克风的监测混合模拟音频信号数据的异常矩阵上的第/>行第/>列元素的噪声异常可能性;/>表示麦克风的监测混合模拟音频信号数据的异常矩阵上的第/>行第/>列元素的噪声异常可能性;/>表示以自然常数为底数的指数函数;/>表示取绝对值。
至此,通过上述方法得到麦克风的监测混合模拟音频信号数据的异常矩阵上每个元素的异常变化一致程度。
步骤S004:根据麦克风的监测混合模拟音频信号数据的异常矩阵上每个元素的异常置信程度,对麦克风的监测混合模拟音频信号数据进行调整,实现麦克风音频数据的智能校正。
需要说明的是,由于对获得的麦克风的监测混合模拟音频信号数据进行独立成分分析,由于其音源的不同与人发声的声带振动原理,其独立成分在声帧内的呈现出不同趋势的近似周期性变化特征,而噪声部分不具有独立性也不具有周期性,其会存在于不同的独立成分中,无法有效分离且影响对立成分的准确性;因此,本实施例通过噪声对于各独立成分内的变化趋势影响及各独立成分间的异常一致性变化趋势,获得噪声影响的异常置信程度,表征各成分内的噪声的影响可信程度,便于后续的混合模拟音频信号的调整,实现麦克风智能校正。
进一步需要说明的是,麦克风的监测混合模拟音频信号数据的异常矩阵上元素的异常变化一致程度越高,其元素值越大,则其异常置信程度越高,其表征的是总体上异常的显著程度,其越显著,则表明其异常情况是噪声引起的异常可能性越大,越需要在后续进行智能调整。
具体的,对于麦克风的监测混合模拟音频信号数据的异常矩阵上的第行第/>列元素,将第/>行第/>列元素与第/>行第/>列元素的异常变化一致程度的乘积,记为第一乘积,利用/>线性归一化函数对第一乘积进行归一化后,得到归一化后的第一乘积,将归一化后的第一乘积作为第/>行第/>列元素的异常置信程度;同理,获取每个元素的异常置信程度。
预设一个阈值,其中本实施例以/>为例进行叙述,本实施例不进行具体限定,其中/>根据具体实施情况而定。
对于麦克风的监测混合模拟音频信号数据的异常矩阵上的任意一个元素,所述元素与每个独立成分模拟音频信号数据中每个局部区域一一对应,每个局部区域与独立成分斜率序列的每个斜率子序列一一对应,每个斜率子序列与独立成分模拟音频信号数据中每个模拟音频信号片段对应,进而得到所述元素与之对应的模拟音频信号片段。
进一步,将异常矩阵上的元素对应的模拟音频信号片段划分为第一片段和第二片段,若所述元素的异常置信程度小于等于预设阈值,则将所述元素记为第一元素;若所述元素的异常置信程度大于预设阈值/>,则将所述元素记为第二元素;将每个第一元素所对应模拟音频信号片段,记为第一片段;将每个第二元素所对应的模拟音频信号片段,记为第二片段。
将每个第二片段替换为第一片段的均值片段,得到调整后的第二片段;将所有第一片段和所有调整后的第二片段按照原本位置进行组合,得到每个调整后独立成分模拟音频信号数据;对每个调整后独立成分模拟音频信号数据进行高斯滤波,得到所有修正后的独立成分模拟音频信号数据;使用混音器将所有修正后的独立成分模拟音频信号数据进行多通道混合,获得校正后的混合音频信号数据,进而实现麦克风音频数据的智能校正。
至此,本实施例完成。
以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (7)
1.一种麦克风智能校正方法,其特征在于,该方法包括以下步骤:
获取麦克风的监测混合模拟音频信号数据;
对麦克风的监测混合模拟音频信号数据进行独立成分分析,得到若干个独立成分模拟音频信号数据;获取每个独立成分模拟音频信号数据的局部区域;获取每个独立成分模拟音频信号数据中每个局部区域的变化异常程度;
根据每个独立成分模拟音频信号数据中每个局部区域的变化异常程度,获取麦克风的监测混合模拟音频信号数据的异常矩阵;获取麦克风的监测混合模拟音频信号数据的异常矩阵上的每个元素的第一异常可能性;根据麦克风的监测混合模拟音频信号数据的异常矩阵上的每个元素的第一异常可能性,获取每个元素的噪声异常可能性;根据麦克风的监测混合模拟音频信号数据的异常矩阵上的每个元素的噪声异常可能性,获取每个元素的异常变化一致程度;
根据麦克风的监测混合模拟音频信号数据的异常矩阵上的每个元素的异常变化一致程度,获取每个元素的异常置信程度;根据麦克风的监测混合模拟音频信号数据的异常矩阵上的每个元素的异常置信程度,对麦克风的监测混合模拟音频信号数据进行调整;
所述获取每个独立成分模拟音频信号数据的局部区域,包括的具体方法为:
对于第个独立成分模拟音频信号数据,构建第/>个独立成分模拟音频信号数据的数据时间曲线,横坐标为时间点,纵坐标为每个时间点对应的独立成分模拟音频信号数据;将第个独立成分模拟音频信号数据的数据时间曲线上所有数据点的斜率组成第/>个独立成分斜率序列;利用预设阈值/>对第/>个独立成分斜率序列进行分割,获得第/>个独立成分斜率序列的若干个斜率子序列;其中,第/>个独立成分斜率序列的每个斜率子序列对应第/>个独立成分模拟音频信号数据的每个局部区域;
所述根据麦克风的监测混合模拟音频信号数据的异常矩阵上的每个元素的异常置信程度,对麦克风的监测混合模拟音频信号数据进行调整,包括的具体方法为:
对于麦克风的监测混合模拟音频信号数据的异常矩阵上的任意一个元素,所述元素与每个独立成分模拟音频信号数据中每个局部区域一一对应,每个局部区域与独立成分斜率序列的每个斜率子序列一一对应,每个斜率子序列与独立成分模拟音频信号数据中每个模拟音频信号片段对应,进而得到所述元素与之对应的模拟音频信号片段;
将异常矩阵上的元素对应的模拟音频信号片段根据异常置信程度划分为第一片段和第二片段;将每个第二片段替换为第一片段的均值片段,得到调整后的第二片段;将所有第一片段和所有调整后的第二片段进行组合,得到每个调整后独立成分模拟音频信号数据;对每个调整后独立成分模拟音频信号数据进行高斯滤波,得到所有修正后的独立成分模拟音频信号数据;使用混音器将所有修正后的独立成分模拟音频信号数据进行多通道混合,获得校正后的混合音频信号数据;
所述第一片段和第二片段的获取方法为:
对于麦克风的监测混合模拟音频信号数据的异常矩阵上的任意一个元素,若所述元素的异常置信程度小于等于预设阈值,则将所述元素记为第一元素;若所述元素的异常置信程度大于预设阈值/>,则将所述元素记为第二元素;将每个第一元素所对应模拟音频信号片段,记为第一片段;将每个第二元素所对应的模拟音频信号片段,记为第二片段。
2.根据权利要求1所述一种麦克风智能校正方法,其特征在于,所述获取每个独立成分模拟音频信号数据中每个局部区域的变化异常程度的具体公式为:
式中,表示第/>个独立成分模拟音频信号数据的第/>个局部区域的变化异常程度;/>表示第/>个独立成分斜率序列的所有斜率子序列数量;/>表示第/>个独立成分斜率序列的第个斜率子序列;/>表示第/>个独立成分斜率序列的第/>个斜率子序列;/>表示线性归一化函数;/>表示DTW距离。
3.根据权利要求1所述一种麦克风智能校正方法,其特征在于,所述根据每个独立成分模拟音频信号数据中每个局部区域的变化异常程度,获取麦克风的监测混合模拟音频信号数据的异常矩阵,包括的具体方法为:
对于第个独立成分模拟音频信号数据,将第/>个独立成分模拟音频信号数据的所有局部区域的变化异常程度按照从大到小进行排序,获得第/>个独立成分模拟音频信号数据的排列序号;同理,获得每个独立成分模拟音频信号数据的排列序号;
将所有独立成分模拟音频信号数据构建麦克风的监测混合模拟音频信号数据的异常矩阵;异常矩阵的元素值为每个独立成分模拟音频信号数据中每个局部区域的变化异常程度;其中异常矩阵的每一行包括每个独立成分模拟音频信号数据中所有局部区域的变化异常程度,每个独立成分模拟音频信号数据的排列序号作为异常矩阵的列。
4.根据权利要求3所述一种麦克风智能校正方法,其特征在于,所述获取麦克风的监测混合模拟音频信号数据的异常矩阵上的每个元素的第一异常可能性,包括的具体方法为:
对于麦克风的监测混合模拟音频信号数据的异常矩阵上的第行第/>列元素,将第/>行第/>列元素与第/>行第/>列元素的差值绝对值,记为第一差值;将第/>行第/>列元素与第/>行第/>列元素的差值绝对值,记为第二差值;将第一差值与第二差值的和,作为第/>行第/>列元素的第一异常可能性。
5.根据权利要求1所述一种麦克风智能校正方法,其特征在于,所述根据麦克风的监测混合模拟音频信号数据的异常矩阵上的每个元素的第一异常可能性,获取每个元素的噪声异常可能性,包括的具体方法为:
根据麦克风的监测混合模拟音频信号数据的异常矩阵上每个元素,得到每个元素的模拟变化异常程度;则麦克风的监测混合模拟音频信号数据的异常矩阵上的第行第/>列元素的噪声异常可能性的计算表达式为:
式中,表示麦克风的监测混合模拟音频信号数据的异常矩阵上的第/>行第/>列元素的噪声异常可能性;/>表示麦克风的监测混合模拟音频信号数据的异常矩阵上的第/>行第列元素的第一异常可能性;/>表示麦克风的监测混合模拟音频信号数据的异常矩阵上的第/>行第/>列元素;/>表示麦克风的监测混合模拟音频信号数据的异常矩阵上的第行第/>列元素的模拟变化异常程度;/>表示取绝对值。
6.根据权利要求1所述一种麦克风智能校正方法,其特征在于,所述根据麦克风的监测混合模拟音频信号数据的异常矩阵上的每个元素的噪声异常可能性,获取每个元素的异常变化一致程度的具体公式为:
式中,表示麦克风的监测混合模拟音频信号数据的异常矩阵上的第/>行第/>列元素的异常变化一致程度;/>表示麦克风的监测混合模拟音频信号数据的所有独立成分模拟音频信号数据的总数量;/>表示麦克风的监测混合模拟音频信号数据的异常矩阵上的第/>行第/>列元素的噪声异常可能性;/>表示麦克风的监测混合模拟音频信号数据的异常矩阵上的第/>行第/>列元素的噪声异常可能性;/>表示以自然常数为底数的指数函数;/>表示取绝对值。
7.根据权利要求1所述一种麦克风智能校正方法,其特征在于,所述根据麦克风的监测混合模拟音频信号数据的异常矩阵上的每个元素的异常变化一致程度,获取每个元素的异常置信程度,包括的具体方法为:
对于麦克风的监测混合模拟音频信号数据的异常矩阵上的第行第/>列元素,将第/>行第/>列元素与第/>行第/>列元素的异常变化一致程度的乘积,记为第一乘积,利用/>线性归一化函数对第一乘积进行归一化后,得到归一化后的第一乘积,将归一化后的第一乘积作为第/>行第/>列元素的异常置信程度。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311450566.XA CN117202077B (zh) | 2023-11-03 | 2023-11-03 | 一种麦克风智能校正方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311450566.XA CN117202077B (zh) | 2023-11-03 | 2023-11-03 | 一种麦克风智能校正方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN117202077A CN117202077A (zh) | 2023-12-08 |
CN117202077B true CN117202077B (zh) | 2024-03-01 |
Family
ID=88987232
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311450566.XA Active CN117202077B (zh) | 2023-11-03 | 2023-11-03 | 一种麦克风智能校正方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117202077B (zh) |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2000041441A1 (en) * | 1999-01-05 | 2000-07-13 | Oticon A/S | A method and a device for providing improved speech intelligibility |
KR20030016925A (ko) * | 2001-08-23 | 2003-03-03 | 삼성전자주식회사 | 음성 신호 보상 방법 및 그 장치 |
CN101031956A (zh) * | 2004-07-22 | 2007-09-05 | 索福特迈克斯有限公司 | 用于嘈杂环境中语音信号分离的头戴式耳机 |
CN101166017A (zh) * | 2006-10-20 | 2008-04-23 | 松下电器产业株式会社 | 用于声音产生设备的自动杂音补偿方法及装置 |
JP2010054728A (ja) * | 2008-08-27 | 2010-03-11 | Hitachi Ltd | 音源抽出装置 |
CN106897509A (zh) * | 2017-02-16 | 2017-06-27 | 大连理工大学 | 一种动态非高斯结构监测数据异常识别方法 |
CN107113521A (zh) * | 2015-01-07 | 2017-08-29 | 谷歌公司 | 用辅助键座麦克风来检测和抑制音频流中的键盘瞬态噪声 |
WO2019094562A1 (en) * | 2017-11-08 | 2019-05-16 | Google Llc | Neural network based blind source separation |
CN111986695A (zh) * | 2019-05-24 | 2020-11-24 | 中国科学院声学研究所 | 一种无重叠子带划分快速独立向量分析语音盲分离方法及系统 |
CN114863944A (zh) * | 2022-02-24 | 2022-08-05 | 中国科学院声学研究所 | 一种低时延音频信号超定盲源分离方法及分离装置 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20120045068A1 (en) * | 2010-08-20 | 2012-02-23 | Korea Institute Of Science And Technology | Self-fault detection system and method for microphone array and audio-based device |
-
2023
- 2023-11-03 CN CN202311450566.XA patent/CN117202077B/zh active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2000041441A1 (en) * | 1999-01-05 | 2000-07-13 | Oticon A/S | A method and a device for providing improved speech intelligibility |
KR20030016925A (ko) * | 2001-08-23 | 2003-03-03 | 삼성전자주식회사 | 음성 신호 보상 방법 및 그 장치 |
CN101031956A (zh) * | 2004-07-22 | 2007-09-05 | 索福特迈克斯有限公司 | 用于嘈杂环境中语音信号分离的头戴式耳机 |
CN101166017A (zh) * | 2006-10-20 | 2008-04-23 | 松下电器产业株式会社 | 用于声音产生设备的自动杂音补偿方法及装置 |
JP2010054728A (ja) * | 2008-08-27 | 2010-03-11 | Hitachi Ltd | 音源抽出装置 |
CN107113521A (zh) * | 2015-01-07 | 2017-08-29 | 谷歌公司 | 用辅助键座麦克风来检测和抑制音频流中的键盘瞬态噪声 |
CN106897509A (zh) * | 2017-02-16 | 2017-06-27 | 大连理工大学 | 一种动态非高斯结构监测数据异常识别方法 |
WO2019094562A1 (en) * | 2017-11-08 | 2019-05-16 | Google Llc | Neural network based blind source separation |
CN111986695A (zh) * | 2019-05-24 | 2020-11-24 | 中国科学院声学研究所 | 一种无重叠子带划分快速独立向量分析语音盲分离方法及系统 |
CN114863944A (zh) * | 2022-02-24 | 2022-08-05 | 中国科学院声学研究所 | 一种低时延音频信号超定盲源分离方法及分离装置 |
Non-Patent Citations (2)
Title |
---|
fMRI盲信号分离中的时间和空间独立成分分析法的时空特性比较;高欣;边倩;熊金虎;;中国医疗设备(第08期);全文 * |
基于ICA的异常数据挖掘算法研究;王莉君;何政伟;冯平兴;;电子科技大学学报(第02期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN117202077A (zh) | 2023-12-08 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Zhang et al. | ADL-MVDR: All deep learning MVDR beamformer for target speech separation | |
CN107479030B (zh) | 基于分频和改进的广义互相关双耳时延估计方法 | |
EP3751560B1 (en) | Automatic speech recognition system with integrated perceptual based adversarial audio attacks | |
Zhao et al. | Analyzing noise robustness of MFCC and GFCC features in speaker identification | |
Stern et al. | Hearing is believing: Biologically inspired methods for robust automatic speech recognition | |
CN112786064B (zh) | 一种端到端的骨气导语音联合增强方法 | |
CN113571047B (zh) | 一种音频数据的处理方法、装置及设备 | |
US20240177726A1 (en) | Speech enhancement | |
JP2015096921A (ja) | 音響信号処理装置および方法 | |
US20240221769A1 (en) | Voice optimization in noisy environments | |
Mack et al. | Single-Channel Dereverberation Using Direct MMSE Optimization and Bidirectional LSTM Networks. | |
Hazrati et al. | Leveraging automatic speech recognition in cochlear implants for improved speech intelligibility under reverberation | |
CN105869656B (zh) | 一种语音信号清晰度的确定方法及装置 | |
CN117202077B (zh) | 一种麦克风智能校正方法 | |
Aroudi et al. | Cognitive-driven convolutional beamforming using EEG-based auditory attention decoding | |
WO2023287782A1 (en) | Data augmentation for speech enhancement | |
JP6753329B2 (ja) | フィルタ生成装置、及びフィルタ生成方法 | |
Ohlenbusch et al. | Speech-dependent Data Augmentation for Own Voice Reconstruction with Hearable Microphones in Noisy Environments | |
Ceolini et al. | Speaker Activity Detection and Minimum Variance Beamforming for Source Separation. | |
Bispo et al. | A cepstral method to estimate the stable optimal solution for feedforward occlusion cancellation in hearing aids | |
CN112037759A (zh) | 抗噪感知敏感度曲线建立及语音合成方法 | |
US20240363131A1 (en) | Speech enhancement | |
Fang et al. | Partially adaptive multichannel joint reduction of ego-noise and environmental noise | |
Kates | Extending the Hearing-Aid Speech Perception Index (HASPI): Keywords, sentences, and context | |
US20240144936A1 (en) | System and method for single channel distant speech processing |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |