CN112242150A - 一种检测立体声的方法及其系统 - Google Patents
一种检测立体声的方法及其系统 Download PDFInfo
- Publication number
- CN112242150A CN112242150A CN202011057691.0A CN202011057691A CN112242150A CN 112242150 A CN112242150 A CN 112242150A CN 202011057691 A CN202011057691 A CN 202011057691A CN 112242150 A CN112242150 A CN 112242150A
- Authority
- CN
- China
- Prior art keywords
- data
- channel
- sound
- value
- module
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 29
- 238000010606 normalization Methods 0.000 claims abstract description 17
- 238000009432 framing Methods 0.000 claims abstract description 16
- 238000013507 mapping Methods 0.000 claims abstract description 16
- 238000005070 sampling Methods 0.000 claims abstract description 16
- 238000012952 Resampling Methods 0.000 claims abstract description 11
- 238000012935 Averaging Methods 0.000 claims abstract description 7
- 238000013139 quantization Methods 0.000 claims abstract description 7
- 238000004364 calculation method Methods 0.000 claims description 21
- 238000012545 processing Methods 0.000 claims description 10
- 238000011156 evaluation Methods 0.000 claims description 8
- 238000000926 separation method Methods 0.000 claims description 5
- 238000012544 monitoring process Methods 0.000 abstract description 6
- 238000001514 detection method Methods 0.000 abstract description 5
- 238000003491 array Methods 0.000 abstract description 3
- 230000000694 effects Effects 0.000 abstract description 3
- 238000001228 spectrum Methods 0.000 description 8
- 238000006243 chemical reaction Methods 0.000 description 6
- 238000004891 communication Methods 0.000 description 6
- 238000013459 approach Methods 0.000 description 4
- 230000005236 sound signal Effects 0.000 description 4
- 238000004519 manufacturing process Methods 0.000 description 3
- 230000000737 periodic effect Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 2
- 102100029469 WD repeat and HMG-box DNA-binding protein 1 Human genes 0.000 description 1
- 101710097421 WD repeat and HMG-box DNA-binding protein 1 Proteins 0.000 description 1
- 238000004458 analytical method Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000002093 peripheral effect Effects 0.000 description 1
- 230000001131 transforming effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/27—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Stereophonic System (AREA)
Abstract
本申请涉及一种检测立体声的方法及其系统,其包括以下步骤:将输入源的左右声道PCM数据进行分离,各自生成独立的数组;将PCM数据统一重采样到48k采样率;将左右声道的PCM数据进行浮点归一化,量化范围为‑1~1;对归一化后的PCM数据进行分帧和加窗处理,每帧数据为2048采样;对每帧数据进行FFT运算,将时域数据转化为频域数据;取FFT前1024个复数数据,计算其各个值在复平面的相位角度;取前1024个复数的模,并分别计算每个值相对于总和的比例w;将左右声道各自的1024个相位角相减,再做一次余弦运算,并按步骤G中的比例w进行加权平均;加权平均后得出一个‑1~1之间的映射值。本申请具有能够在广播监控领域提供一种大规模并行立体声检测方案的效果。
Description
技术领域
本申请涉及广电音频质量监控的领域,尤其是涉及一种检测立体声的方法及其系统。
背景技术
节目录制与制作时离不开双声道立体声或者5.1/7.1声道,双声道立体声或者5.1/7.1声道已经成为所有视音频流媒体的标准。但真实的音频质量则很大程度上取决于节目录制与制作时的数据采集。有些节目为了节省经费,在制作过程中将单声道音频数据直接转成多声道。
针对上述中的相关技术,发明人认为这样的做法无疑降低了声音的质量,因为观众无法听出任何立体声的效果。对于音频质量监控来说,这是一个巨大的挑战,因为检测人员无法对所有节目的声音人为做一个判断,因此,一种能够运用于音频监控领域,可以做到检测立体声的方法成为一种重要的需求。
发明内容
为了能够在广播监控领域提供一种大规模并行立体声检测方案,本申请提供一种检测立体声的方法及其系统。
本申请的目的一提供的一种检测立体声的方法采用如下的技术方案:
一种检测立体声的方法,包括以下步骤:
A,将输入源的左右声道PCM数据进行分离,各自生成独立的数组;
B,将PCM数据统一重采样到48k采样率;
C,将左右声道的PCM数据进行浮点归一化,量化范围为-1~1;
D,对归一化后的PCM数据进行分帧和加窗处理,每帧数据为2048采样;
E,对每帧数据进行FFT运算,将时域数据转化为频域数据;
F,取FFT前1024个复数数据,计算其各个值在复平面的相位角度;
G,取FFT前1024个复数的模,并分别计算每个值相对于总和的比例w;
H,将左右声道各自的1024个相位角相减,再做一次余弦运算,并按步骤G中的比例w进行加权平均;
I,加权平均后得出一个-1~1之间的映射值。
通过采用上述技术方案,对输入源的左右声道PCM数据进行分离,将左右声道的PCM数据进行浮点归一化,并对数据进行分帧和加窗处理,然后把数据进行FFT运算,获得频谱,根据频谱数据计算分别计算左右声道的相位信息,将左右声道的相位偏差映射到-1~1之间,在设定时间段T内相位映射值为1或接近1的比例越高,则说明该声音是非立体声的概率越高,最后以一段时间内的数值统计来判断是否为立体声。
可选的,复平面的相位角度的计算方法如下:在复平面上,当复数a满足|a|=1时,由欧拉公式得a=ejθ=cos(θ)+jsin(θ),θa即为复数a的相位角,θb为复数b的相位角,进一步得b=ejθejφ=ej(θ+φ)。
通过采用上述技术方案,DFT转换的频域信号是在复数域,所以每个对应的值都可以计算其相位角。
通过采用上述技术方案,通过一维离散傅里叶变换DFT对原始音频数据进行频域转换。
通过采用上述技术方案,频域数据还可以变换回时域数据。
可选的,声音相位差的评估值计算方法如下:其中wk为频域中各个数据的加权值,N为采样数据量的一半,Xk为频域数据;其中P为音频相位的评估值,P的值域区间为[-1,1],为左右声道的各个频域数据相位角的差分值。
通过采用上述技术方案,评估值越接近1,则相位趋近于相同,音频为非立体声的可能性越高,通过声音相位差的评估值计算,得出的评估值越接近1,则相位趋近于相同,音频为非立体声的可能性越高。
可选的,步骤I中,多次取设定时间段T内的数值,平均值用于判断是否为立体声。
通过采用上述技术方案,多次取平均值可以得到更加精确的数值,从而更加有利于判断该声音是非立体声的概率越高。
可选的,所述FFT运算可采用微处理器中的快速FFT运算。
通过采用上述技术方案,FFT是DFT的算法优化,二者是等价的,相对于DFT的计算速度较快,能够分析处理数据。
可选的,所述步骤D中,每帧数据为2048采样。
通过采用上述技术方案,保证每帧的采样数据足够,利于后续计算的进行。
可选的,所述第一采样率为48k采样率。
通过采用上述技术方案,保证每帧的采样数据足够,利于后续计算结果的真实可用性。
本申请的目的二提供的一种检测立体声的系统采用如下的技术方案:
一种检测立体声的系统,包括包括声音处理模块以及处理器,所述声音处理器用于获取输入源的左右声道PCM数据,并将左右声道PCM数据发送至处理器;
所述处理器包括:
分离数据模块,用于分离所述左右声道PCM数据,生成一个对应于左声道PCM数据的左声道数组,以及一个对应于右声道PCM数据的右声道数组;
重采样模块,用于将PCM数据重采样至48k采样率;
浮点归一化模块,用于将左声道数据内的数据以及右声道数组内的数据进行浮点归一化,量化范围为-1~1;
分帧加窗模块,用于对归一化后的PCM数据进行分帧和加窗处理,每帧数据为2048采样;FFT运算模块,用于对每帧数据进行FFT运算,将时域数据转化为频域数据;
相位角度计算模块,用于取FFT前1024个复数数据,计算其各个值在复平面的相位角度;比例计算模块,用于取FFT前1024个复数的模,并分别计算每个值相对于总和的比例w;相位角计算模块,用于将左右声道各自的1024个相位角相减,再做一次余弦运算,并按步骤G中的比例w进行加权平均;以及,
映射模块,用于在加权平均后得出一个-1~1之间的映射值。
通过采用上述技术方案,分离数据模块对输入源的左右声道PCM数据进行分离,浮点归一化模块将左右声道的PCM数据进行浮点归一化,分帧加窗模块对数据进行分帧和加窗处理,FFT运算模块对数据进行FFT运算,获得频谱,相位角计算模块根据频谱数据计算分别计算左右声道的相位信息,将左右声道的相位偏差映射到-1~1之间,在设定时间段T内相位映射值为1或接近1的比例越高,则说明该声音是非立体声的概率越高,最后以一段时间内的数值统计来判断是否为立体声。
综上所述,本申请包括以下至少一种有益技术效果:
1.通过相位分析来检测立体声,可大规模执行,便于检测广播监控领域的立体声;
2.采用快速FFT运算将时域数据转换为频域数据,提高了计算机中FFT处理的速度。
附图说明
图1是本申请实施例的方法步骤流程图;
图2是本申请实施例中,复平面相位角的示意图;
图3是本申请实施例中,一维时域声音信号的切片;
图4是本申请实施例中,将一维时域声音信号的切片经过频域转换得到的图像;
图5是本申请实施例的系统框图。
附图标记:1、声音处理模块;2、处理器;3、分离数据模块;4、重采样模块;5、浮点归一化模块;6、分帧加窗模块;7、FFT运算模块;8、相位角度计算模块;9、比例计算模块;10、相位角计算模块;11、映射模块。
具体实施方式
以下结合附图1-4对本申请作进一步详细说明。
本申请实施例公开一种检测立体声的方法。参照图1,一种检测立体声的方法,,该方法包含以下步骤:
A,通过麦克风采集输入源的声音至数据处理器的音源信号输入端,将输入源的左右声道PCM数据进行分离,各自生成独立的数组;
B,将PCM数据统一重采样到48k采样率;
C,将左右声道的PCM数据进行浮点归一化,量化范围为-1~1;
D,对归一化后的PCM进行分帧处理,每帧数据为2048采样。
E,对每帧数据进行FFT运算,FFT运算可采用微处理器中的快速FFT运算,将时域数据转化为频域数据;
F,取FFT前1024个复数数据,计算其各个值在复平面的相位角度;
G,取FFT前1024个复数的模,并分别计算每个值相对于总和的比例w;
H,将左右声道各自的1024个相位角相减,再做一次余弦运算,并按步骤G中的比例进行加权平均;从横向和纵向两个方面对音频数据进行分析比较。
I,加权平均后将得到一个-1~1之间的映射值,在设定时间段T内相位映射值为1或接近1的比例越高,则说明该声音是非立体声的概率越高。
其中,关于复平面相位角的计算:参照图2,在复平面上,当复数a满足|a|=1时,由欧拉公式得a=ejθ=cos(θ)+jsin(θ),如图,θa即为负数a的相位角,θb为负数b的相位角,进一步得b=ejθejφ=ej(θ+φ)。
关于音频信号频域转换的方式:通过一维离散傅里叶变换DFT对原始音频数据进行频域转换公式如下:其中(0≤k≤N-1)。也可以通过下面的公式将频域数据变换回时域数据,其中(0≤n≤N-1);快速傅里叶变换FFT是DFT的常用快速算法,其结果可以认为与DFT等效。
上述公式中,N为总离散采样数,x为时域数据序列,X为频域数据序列。参照图3,是一典型一维时域声音信号的切片,经过频域转换,可以在显示屏得到图4的图像,即可以看出是2个正弦周期信号的叠加。经过DFT转换的频域信号是在复数域的,所以每个对应的值都可以计算其相位角。
快速傅里叶变换FFT:采用这种算法能使计算机计算离散傅里叶变换所需要的乘法次数大为减少,特别是被变换的抽样点数N越多,FFT算法计算量的节省就越显著。
离散傅里叶变换DFT:是傅里叶变换在时域和频域上都呈现离散的形式,将时域信号的采样变换为在离散时间傅里叶变换(DTFT)频域的采样。在形式上,变换两端(时域和频域上)的序列是有限长的,而实际上这两组序列都应当被认为是离散周期信号的主值序列。即使对有限长的离散信号作DFT,也应当将其看作经过周期延拓成为周期信号再作变换。在实际应用中通常采用快速傅里叶变换以高效计算DFT。
关于声音相位差的评估值计算:其中wk为频域中各个数据的加权值,N为采样数据量的一半,Xk为频域数据其中P为音频相位的评估值,P的值域区间为[-1,1],值越接近1,则相位趋近于相同,音频为非立体声的可能性越高。为左右声道的各个频域数据相位角的差分值。
步骤I中,多次取设定时间段T内的数值,平均值用于判断是否为立体声数据处理可在客户端、终端,也可以在PLC运行。
客户端:
客户端可采用运行有安卓系统或者IOS系统的智能设备,智能设备内设有GPS、蓝牙、WIFI以及GPRS等通信模组,智能设备内还设有用于显示数据以及接收输入的触摸屏。
终端:
终端可采用安卓系统或者IOS系统的智能设备、MCU单片机、PLC或者FPGA及它们外围电路组成的控制中心,控制中心数据连接有GPS、蓝牙、WIFI以及GPRS等通信模组,控制中心上设有接收通信信号的引脚,并通过引脚数据连接有兼容同样通信协议的传感器或者连有多个传感器的其它控制中心,通信协议可为IIC、IIS、SPI、UART或者CAN等现场通信协议。
本申请实施例一种检测立体声的方法的实施原理为:对输入源的左右声道PCM数据进行分离,将左右声道的PCM数据进行浮点归一化,并对数据进行分帧和加窗处理,然后把数据进行FFT运算,获得频谱,根据频谱数据计算分别计算左右声道的相位信息,将左右声道的相位偏差映射到-1~1之间,最后以一段时间内的数值统计来判断是否为立体声。
本申请实施例公开一种检测立体声的系统,如图5所示,包括声音处理模块以及处理器,其特征在于:所述声音处理器用于获取输入源的左右声道PCM数据,并将左右声道PCM数据发送至处理器。
处理器包括:分离数据模块,用于分离所述左右声道PCM数据,生成一个对应于左声道PCM数据的左声道数组,以及一个对应于右声道PCM数据的右声道数组。
重采样模块,用于将PCM数据重采样至48k采样率。
浮点归一化模块,用于将左声道数据内的数据以及右声道数组内的数据进行浮点归一化,量化范围为-1~1。
分帧加窗模块,用于对归一化后的PCM数据进行分帧和加窗处理,每帧数据为2048采样。
FFT运算模块,用于对每帧数据进行FFT运算,将时域数据转化为频域数据。
相位角度计算模块,用于取FFT前1024个复数数据,计算其各个值在复平面的相位角度。
比例计算模块,用于取FFT前1024个复数的模,并分别计算每个值相对于总和的比例w。
相位角计算模块,用于将左右声道各自的1024个相位角相减,再做一次余弦运算,并按步骤G中的比例w进行加权平均。
以及,
映射模块,用于在加权平均后得出一个-1~1之间的映射值。
分离数据模块对输入源的左右声道PCM数据进行分离,浮点归一化模块将左右声道的PCM数据进行浮点归一化,分帧加窗模块对数据进行分帧和加窗处理,FFT运算模块对数据进行FFT运算,获得频谱,相位角计算模块根据频谱数据计算分别计算左右声道的相位信息,将左右声道的相位偏差映射到-1~1之间,在设定时间段T内相位映射值为1或接近1的比例越高,则说明该声音是非立体声的概率越高,最后以一段时间内的数值统计来判断是否为立体声。
以上均为本申请的较佳实施例,并非依此限制本申请的保护范围,故:凡依本申请的结构、形状、原理所做的等效变化,均应涵盖于本申请的保护范围之内。
Claims (10)
1.一种检测立体声的方法,其特征在于:包括以下步骤:
声音处理模块获取输入源的左右声道PCM数据,并将左右声道PCM数据发送至处理器;
A,所述处理器分离所述左右声道PCM数据,生成一个对应于左声道PCM数据的左声道数组,以及一个对应于右声道PCM数据的右声道数组;
B,将PCM数据重采样至第一采样率;
C,将左声道数据内的数据以及右声道数组内的数据进行浮点归一化,量化范围为-1~1;
D,对归一化后的PCM数据进行分帧和加窗处理;
E,对每帧数据进行FFT运算,将时域数据转化为频域数据;
F,取FFT前1024个复数数据,计算其各个值在复平面的相位角度;
G,取FFT前1024个复数的模,并分别计算每个值相对于总和的比例w;
H,将左右声道各自的1024个相位角相减,再做一次余弦运算,并按步骤G中的比例w进行加权平均;
I,加权平均后得出一个-1~1之间的映射值。
6.根据权利要求1所述的一种检测立体声的方法,其特征在于:步骤I中,多次取设定时间段T内的数值,平均值用于判断是否为立体声。
7.根据权利要求1所述的一种检测立体声的方法,其特征在于:所述FFT运算采用微处理器中的快速FFT运算。
8.根据权利要求1所述的一种检测立体声的方法,其特征在于:所述步骤D中,每帧数据为2048采样。
9.根据权利要求1所述的一种检测立体声的方法,其特征在于:所述第一采样率为48k采样率。
10.一种检测立体声的系统,包括声音处理模块以及处理器,其特征在于:所述声音处理器用于获取输入源的左右声道PCM数据,并将左右声道PCM数据发送至处理器;
所述处理器包括:
分离数据模块,用于分离所述左右声道PCM数据,生成一个对应于左声道PCM数据的左声道数组,以及一个对应于右声道PCM数据的右声道数组;
重采样模块,用于将PCM数据重采样至48k采样率;
浮点归一化模块,用于将左声道数据内的数据以及右声道数组内的数据进行浮点归一化,量化范围为-1~1;
分帧加窗模块,用于对归一化后的PCM数据进行分帧和加窗处理,每帧数据为2048采样;
FFT运算模块,用于对每帧数据进行FFT运算,将时域数据转化为频域数据;
相位角度计算模块,用于取FFT前1024个复数数据,计算其各个值在复平面的相位角度;
比例计算模块,用于取FFT前1024个复数的模,并分别计算每个值相对于总和的比例w;
相位角计算模块,用于将左右声道各自的1024个相位角相减,再做一次余弦运算,并按步骤G中的比例w进行加权平均;以及,
映射模块,用于在加权平均后得出一个-1~1之间的映射值。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011057691.0A CN112242150B (zh) | 2020-09-30 | 2020-09-30 | 一种检测立体声的方法及其系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011057691.0A CN112242150B (zh) | 2020-09-30 | 2020-09-30 | 一种检测立体声的方法及其系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112242150A true CN112242150A (zh) | 2021-01-19 |
CN112242150B CN112242150B (zh) | 2024-04-12 |
Family
ID=74172196
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011057691.0A Active CN112242150B (zh) | 2020-09-30 | 2020-09-30 | 一种检测立体声的方法及其系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112242150B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113257278A (zh) * | 2021-04-29 | 2021-08-13 | 杭州联汇科技股份有限公司 | 一种带阻尼系数的音频信号瞬时相位的检测方法 |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20030236583A1 (en) * | 2002-06-24 | 2003-12-25 | Frank Baumgarte | Hybrid multi-channel/cue coding/decoding of audio signals |
CN102157152A (zh) * | 2010-02-12 | 2011-08-17 | 华为技术有限公司 | 立体声编码的方法、装置 |
CN103026406A (zh) * | 2010-09-28 | 2013-04-03 | 华为技术有限公司 | 用于对已解码多通道音频信号或已解码立体声信号进行后处理的装置和方法 |
CN104506853A (zh) * | 2014-12-31 | 2015-04-08 | 成都东方盛行电子有限责任公司 | 一种音视频技审系统及方法 |
CN204305344U (zh) * | 2014-11-21 | 2015-04-29 | 浙江广播电视集团 | 5.1环绕声音频制作中扬声器的配置结构 |
CN105139865A (zh) * | 2015-06-19 | 2015-12-09 | 中央电视台 | 一种确定左右声道音频相关系数的方法及装置 |
CN109243488A (zh) * | 2018-10-30 | 2019-01-18 | 腾讯音乐娱乐科技(深圳)有限公司 | 音频检测方法、装置及存储介质 |
CN109327608A (zh) * | 2018-09-12 | 2019-02-12 | 广州酷狗计算机科技有限公司 | 歌曲分享的方法、终端、服务器和系统 |
WO2019193070A1 (en) * | 2018-04-05 | 2019-10-10 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus, method or computer program for estimating an inter-channel time difference |
WO2019209930A1 (en) * | 2018-04-27 | 2019-10-31 | Dolby Laboratories Licensing Corporation | Blind detection of binauralized stereo content |
CN111261194A (zh) * | 2020-04-29 | 2020-06-09 | 浙江百应科技有限公司 | 一种基于pcm技术的音量分析方法 |
-
2020
- 2020-09-30 CN CN202011057691.0A patent/CN112242150B/zh active Active
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20030236583A1 (en) * | 2002-06-24 | 2003-12-25 | Frank Baumgarte | Hybrid multi-channel/cue coding/decoding of audio signals |
CN102157152A (zh) * | 2010-02-12 | 2011-08-17 | 华为技术有限公司 | 立体声编码的方法、装置 |
CN103026406A (zh) * | 2010-09-28 | 2013-04-03 | 华为技术有限公司 | 用于对已解码多通道音频信号或已解码立体声信号进行后处理的装置和方法 |
CN204305344U (zh) * | 2014-11-21 | 2015-04-29 | 浙江广播电视集团 | 5.1环绕声音频制作中扬声器的配置结构 |
CN104506853A (zh) * | 2014-12-31 | 2015-04-08 | 成都东方盛行电子有限责任公司 | 一种音视频技审系统及方法 |
CN105139865A (zh) * | 2015-06-19 | 2015-12-09 | 中央电视台 | 一种确定左右声道音频相关系数的方法及装置 |
WO2019193070A1 (en) * | 2018-04-05 | 2019-10-10 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus, method or computer program for estimating an inter-channel time difference |
WO2019209930A1 (en) * | 2018-04-27 | 2019-10-31 | Dolby Laboratories Licensing Corporation | Blind detection of binauralized stereo content |
CN109327608A (zh) * | 2018-09-12 | 2019-02-12 | 广州酷狗计算机科技有限公司 | 歌曲分享的方法、终端、服务器和系统 |
CN109243488A (zh) * | 2018-10-30 | 2019-01-18 | 腾讯音乐娱乐科技(深圳)有限公司 | 音频检测方法、装置及存储介质 |
CN111261194A (zh) * | 2020-04-29 | 2020-06-09 | 浙江百应科技有限公司 | 一种基于pcm技术的音量分析方法 |
Non-Patent Citations (3)
Title |
---|
施建华: "多种不同格式信号的同阵切换", 数字卫星微波网络, pages 1 - 3 * |
王彤;林岩;张烽;: "基于FFT的广播信号声音检测", 电子技术与软件工程, no. 08, pages 101 - 102 * |
赵保忠 等: "立体声音乐节目后期制作中声像定位的探讨", 演艺科技, pages 38 - 43 * |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113257278A (zh) * | 2021-04-29 | 2021-08-13 | 杭州联汇科技股份有限公司 | 一种带阻尼系数的音频信号瞬时相位的检测方法 |
CN113257278B (zh) * | 2021-04-29 | 2022-09-20 | 杭州联汇科技股份有限公司 | 一种带阻尼系数的音频信号瞬时相位的检测方法 |
Also Published As
Publication number | Publication date |
---|---|
CN112242150B (zh) | 2024-04-12 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Katz et al. | A comparative study of interaural time delay estimation methods | |
US7590248B1 (en) | Head related transfer function filter generation | |
Benichoux et al. | On the variation of interaural time differences with frequency | |
CN109285556B (zh) | 音频处理方法、装置、设备以及存储介质 | |
CN102857852B (zh) | 一种声场定量重现控制系统的扬声器回放阵列控制信号的处理方法 | |
CN112017693B (zh) | 一种音频质量评估方法及装置 | |
CN101401450A (zh) | 声音采集/再现方法和设备 | |
CN110068388A (zh) | 一种基于视觉和盲源分离的振动检测方法 | |
CN103546853A (zh) | 一种基于短时傅里叶变换的扬声器异常音检测方法 | |
EP3206415B1 (en) | Sound processing device, method, and program | |
CN109658951B (zh) | 混合信号检测方法及系统 | |
WO2015192395A1 (zh) | 人声语音质量评分方法及系统 | |
CN107170465A (zh) | 一种音频质量检测方法及音频质量检测系统 | |
CN109597021B (zh) | 一种波达方向估计方法及装置 | |
CN112242150B (zh) | 一种检测立体声的方法及其系统 | |
JP5000297B2 (ja) | 音場の表現を求めるためのシステムおよび方法 | |
CN109186752A (zh) | 基于图形处理器的水下声学信号采集、传输和检测系统 | |
CN102487451A (zh) | 数字电视接收终端的音频测试方法及系统 | |
CN118155654A (zh) | 模型训练方法、音频成分缺失识别方法、装置及电子设备 | |
CN117029900B (zh) | 一种基于动态多路同步检测的计量仪表检测方法 | |
RU174044U1 (ru) | Аудиовизуальный многоканальный детектор наличия голоса | |
CN113093106A (zh) | 一种声源定位方法及系统 | |
CN112328676A (zh) | 一种估计个性化头相关传输函数的方法及相关设备 | |
CN103399724B (zh) | 一种数字音频响度测量卡 | |
CN206313861U (zh) | 一种基于ni板卡串口控制的音频检测系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |