CN112242150B - 一种检测立体声的方法及其系统 - Google Patents

一种检测立体声的方法及其系统 Download PDF

Info

Publication number
CN112242150B
CN112242150B CN202011057691.0A CN202011057691A CN112242150B CN 112242150 B CN112242150 B CN 112242150B CN 202011057691 A CN202011057691 A CN 202011057691A CN 112242150 B CN112242150 B CN 112242150B
Authority
CN
China
Prior art keywords
data
frequency domain
value
phase
pcm data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011057691.0A
Other languages
English (en)
Other versions
CN112242150A (zh
Inventor
陈志强
宋晹
施建华
惠新标
王相锋
陈青
施小明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Radio and Television Group of Zhejiang
Shanghai Baibei Science And Technology Development Co ltd
Original Assignee
Radio and Television Group of Zhejiang
Shanghai Baibei Science And Technology Development Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Radio and Television Group of Zhejiang, Shanghai Baibei Science And Technology Development Co ltd filed Critical Radio and Television Group of Zhejiang
Priority to CN202011057691.0A priority Critical patent/CN112242150B/zh
Publication of CN112242150A publication Critical patent/CN112242150A/zh
Application granted granted Critical
Publication of CN112242150B publication Critical patent/CN112242150B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/48Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
    • G10L25/51Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/27Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Stereophonic System (AREA)

Abstract

本申请涉及一种检测立体声的方法及其系统,其包括以下步骤:将输入源的左右声道PCM数据进行分离,各自生成独立的数组;将PCM数据统一重采样到48k采样率;将左右声道的PCM数据进行浮点归一化,量化范围为‑1~1;对归一化后的PCM数据进行分帧和加窗处理,每帧数据为2048采样;对每帧数据进行FFT运算,将时域数据转化为频域数据;取FFT前1024个复数数据,计算其各个值在复平面的相位角度;取前1024个复数的模,并分别计算每个值相对于总和的比例w;将左右声道各自的1024个相位角相减,再做一次余弦运算,并按步骤G中的比例w进行加权平均;加权平均后得出一个‑1~1之间的映射值。本申请具有能够在广播监控领域提供一种大规模并行立体声检测方案的效果。

Description

一种检测立体声的方法及其系统
技术领域
本申请涉及广电音频质量监控的领域,尤其是涉及一种检测立体声的方法及其系统。
背景技术
节目录制与制作时离不开双声道立体声或者5.1/7.1声道,双声道立体声或者5.1/7.1声道已经成为所有视音频流媒体的标准。但真实的音频质量则很大程度上取决于节目录制与制作时的数据采集。有些节目为了节省经费,在制作过程中将单声道音频数据直接转成多声道。
针对上述中的相关技术,发明人认为这样的做法无疑降低了声音的质量,因为观众无法听出任何立体声的效果。对于音频质量监控来说,这是一个巨大的挑战,因为检测人员无法对所有节目的声音人为做一个判断,因此,一种能够运用于音频监控领域,可以做到检测立体声的方法成为一种重要的需求。
发明内容
为了能够在广播监控领域提供一种大规模并行立体声检测方案,本申请提供一种检测立体声的方法及其系统。
本申请的目的一提供的一种检测立体声的方法采用如下的技术方案:
一种检测立体声的方法,包括以下步骤:
A,将输入源的左右声道PCM数据进行分离,各自生成独立的数组;
B,将PCM数据统一重采样到48k采样率;
C,将左右声道的PCM数据进行浮点归一化,量化范围为-1~1;
D,对归一化后的PCM数据进行分帧和加窗处理,每帧数据为2048采样;
E,对每帧数据进行FFT运算,将时域数据转化为频域数据;
F,取FFT前1024个复数数据,计算其各个值在复平面的相位角度;
G,取FFT前1024个复数的模,并分别计算每个值相对于总和的比例w;
H,将左右声道各自的1024个相位角相减,再做一次余弦运算,并按步骤G中的比例w进行加权平均;
I,加权平均后得出一个-1~1之间的映射值。
通过采用上述技术方案,对输入源的左右声道PCM数据进行分离,将左右声道的PCM数据进行浮点归一化,并对数据进行分帧和加窗处理,然后把数据进行FFT运算,获得频谱,根据频谱数据计算分别计算左右声道的相位信息,将左右声道的相位偏差映射到-1~1之间,在设定时间段T内相位映射值为1或接近1的比例越高,则说明该声音是非立体声的概率越高,最后以一段时间内的数值统计来判断是否为立体声。
可选的,复平面的相位角度的计算方法如下:在复平面上,当复数a满足|a|=1时,由欧拉公式得a=e=cos(θ)+jsin(θ),θa即为复数a的相位角,θb为复数b的相位角,进一步得b=ee=ej(θ+φ)
通过采用上述技术方案,DFT转换的频域信号是在复数域,所以每个对应的值都可以计算其相位角。
可选的,通过一维离散傅里叶变换DFT对原始音频数据进行频域转换,公式如下:其中(0≤k≤N-1),N为总离散采样数,x为时域数据序列,X为频域数据序列。
通过采用上述技术方案,通过一维离散傅里叶变换DFT对原始音频数据进行频域转换。
可选的,频域数据变换回时域数据的方法如下:其中(0≤n≤N-1),N为总离散采样数,x为时域数据序列,X为频域数据序列。
通过采用上述技术方案,频域数据还可以变换回时域数据。
可选的,声音相位差的评估值计算方法如下:其中wk为频域中各个数据的加权值,N为采样数据量的一半,Xk为频域数据;/>其中P为音频相位的评估值,P的值域区间为[-1,1],/>为左右声道的各个频域数据相位角的差分值。
通过采用上述技术方案,评估值越接近1,则相位趋近于相同,音频为非立体声的可能性越高,通过声音相位差的评估值计算,得出的评估值越接近1,则相位趋近于相同,音频为非立体声的可能性越高。
可选的,步骤I中,多次取设定时间段T内的数值,平均值用于判断是否为立体声。
通过采用上述技术方案,多次取平均值可以得到更加精确的数值,从而更加有利于判断该声音是非立体声的概率越高。
可选的,所述FFT运算可采用微处理器中的快速FFT运算。
通过采用上述技术方案,FFT是DFT的算法优化,二者是等价的,相对于DFT的计算速度较快,能够分析处理数据。
可选的,所述步骤D中,每帧数据为2048采样。
通过采用上述技术方案,保证每帧的采样数据足够,利于后续计算的进行。
可选的,所述第一采样率为48k采样率。
通过采用上述技术方案,保证每帧的采样数据足够,利于后续计算结果的真实可用性。
本申请的目的二提供的一种检测立体声的系统采用如下的技术方案:
一种检测立体声的系统,包括包括声音处理模块以及处理器,所述声音处理器用于获取输入源的左右声道PCM数据,并将左右声道PCM数据发送至处理器;
所述处理器包括:
分离数据模块,用于分离所述左右声道PCM数据,生成一个对应于左声道PCM数据的左声道数组,以及一个对应于右声道PCM数据的右声道数组;
重采样模块,用于将PCM数据重采样至48k采样率;
浮点归一化模块,用于将左声道数据内的数据以及右声道数组内的数据进行浮点归一化,量化范围为-1~1;
分帧加窗模块,用于对归一化后的PCM数据进行分帧和加窗处理,每帧数据为2048采样;FFT运算模块,用于对每帧数据进行FFT运算,将时域数据转化为频域数据;
相位角度计算模块,用于取FFT前1024个复数数据,计算其各个值在复平面的相位角度;比例计算模块,用于取FFT前1024个复数的模,并分别计算每个值相对于总和的比例w;相位角计算模块,用于将左右声道各自的1024个相位角相减,再做一次余弦运算,并按步骤G中的比例w进行加权平均;以及,
映射模块,用于在加权平均后得出一个-1~1之间的映射值。
通过采用上述技术方案,分离数据模块对输入源的左右声道PCM数据进行分离,浮点归一化模块将左右声道的PCM数据进行浮点归一化,分帧加窗模块对数据进行分帧和加窗处理,FFT运算模块对数据进行FFT运算,获得频谱,相位角计算模块根据频谱数据计算分别计算左右声道的相位信息,将左右声道的相位偏差映射到-1~1之间,在设定时间段T内相位映射值为1或接近1的比例越高,则说明该声音是非立体声的概率越高,最后以一段时间内的数值统计来判断是否为立体声。
综上所述,本申请包括以下至少一种有益技术效果:
1.通过相位分析来检测立体声,可大规模执行,便于检测广播监控领域的立体声;
2.采用快速FFT运算将时域数据转换为频域数据,提高了计算机中FFT处理的速度。
附图说明
图1是本申请实施例的方法步骤流程图;
图2是本申请实施例中,复平面相位角的示意图;
图3是本申请实施例中,一维时域声音信号的切片;
图4是本申请实施例中,将一维时域声音信号的切片经过频域转换得到的图像;
图5是本申请实施例的系统框图。
附图标记:1、声音处理模块;2、处理器;3、分离数据模块;4、重采样模块;5、浮点归一化模块;6、分帧加窗模块;7、FFT运算模块;8、相位角度计算模块;9、比例计算模块;10、相位角计算模块;11、映射模块。
具体实施方式
以下结合附图1-4对本申请作进一步详细说明。
本申请实施例公开一种检测立体声的方法。参照图1,一种检测立体声的方法,,该方法包含以下步骤:
A,通过麦克风采集输入源的声音至数据处理器的音源信号输入端,将输入源的左右声道PCM数据进行分离,各自生成独立的数组;
B,将PCM数据统一重采样到48k采样率;
C,将左右声道的PCM数据进行浮点归一化,量化范围为-1~1;
D,对归一化后的PCM进行分帧处理,每帧数据为2048采样。
E,对每帧数据进行FFT运算,FFT运算可采用微处理器中的快速FFT运算,将时域数据转化为频域数据;
F,取FFT前1024个复数数据,计算其各个值在复平面的相位角度;
G,取FFT前1024个复数的模,并分别计算每个值相对于总和的比例w;
H,将左右声道各自的1024个相位角相减,再做一次余弦运算,并按步骤G中的比例进行加权平均;从横向和纵向两个方面对音频数据进行分析比较。
I,加权平均后将得到一个-1~1之间的映射值,在设定时间段T内相位映射值为1或接近1的比例越高,则说明该声音是非立体声的概率越高。
其中,关于复平面相位角的计算:参照图2,在复平面上,当复数a满足|a|=1时,由欧拉公式得a=e=cos(θ)+jsin(θ),如图,θa即为负数a的相位角,θb为负数b的相位角,进一步得b=ee=ej(θ+φ)
关于音频信号频域转换的方式:通过一维离散傅里叶变换DFT对原始音频数据进行频域转换公式如下:其中(0≤k≤N-1)。也可以通过下面的公式将频域数据变换回时域数据,/>其中(0≤n≤N-1);快速傅里叶变换FFT是DFT的常用快速算法,其结果可以认为与DFT等效。
上述公式中,N为总离散采样数,x为时域数据序列,X为频域数据序列。参照图3,是一典型一维时域声音信号的切片,经过频域转换,可以在显示屏得到图4的图像,即可以看出是2个正弦周期信号的叠加。经过DFT转换的频域信号是在复数域的,所以每个对应的值都可以计算其相位角。
快速傅里叶变换FFT:采用这种算法能使计算机计算离散傅里叶变换所需要的乘法次数大为减少,特别是被变换的抽样点数N越多,FFT算法计算量的节省就越显著。
离散傅里叶变换DFT:是傅里叶变换在时域和频域上都呈现离散的形式,将时域信号的采样变换为在离散时间傅里叶变换(DTFT)频域的采样。在形式上,变换两端(时域和频域上)的序列是有限长的,而实际上这两组序列都应当被认为是离散周期信号的主值序列。即使对有限长的离散信号作DFT,也应当将其看作经过周期延拓成为周期信号再作变换。在实际应用中通常采用快速傅里叶变换以高效计算DFT。
关于声音相位差的评估值计算:其中wk为频域中各个数据的加权值,N为采样数据量的一半,Xk为频域数据/>其中P为音频相位的评估值,P的值域区间为[-1,1],值越接近1,则相位趋近于相同,音频为非立体声的可能性越高。/>为左右声道的各个频域数据相位角的差分值。
步骤I中,多次取设定时间段T内的数值,平均值用于判断是否为立体声数据处理可在客户端、终端,也可以在PLC运行。
客户端:
客户端可采用运行有安卓系统或者IOS系统的智能设备,智能设备内设有GPS、蓝牙、WIFI以及GPRS等通信模组,智能设备内还设有用于显示数据以及接收输入的触摸屏。
终端:
终端可采用安卓系统或者IOS系统的智能设备、MCU单片机、PLC或者FPGA及它们外围电路组成的控制中心,控制中心数据连接有GPS、蓝牙、WIFI以及GPRS等通信模组,控制中心上设有接收通信信号的引脚,并通过引脚数据连接有兼容同样通信协议的传感器或者连有多个传感器的其它控制中心,通信协议可为IIC、IIS、SPI、UART或者CAN等现场通信协议。
本申请实施例一种检测立体声的方法的实施原理为:对输入源的左右声道PCM数据进行分离,将左右声道的PCM数据进行浮点归一化,并对数据进行分帧和加窗处理,然后把数据进行FFT运算,获得频谱,根据频谱数据计算分别计算左右声道的相位信息,将左右声道的相位偏差映射到-1~1之间,最后以一段时间内的数值统计来判断是否为立体声。
本申请实施例公开一种检测立体声的系统,如图5所示,包括声音处理模块以及处理器,其特征在于:所述声音处理器用于获取输入源的左右声道PCM数据,并将左右声道PCM数据发送至处理器。
处理器包括:分离数据模块,用于分离所述左右声道PCM数据,生成一个对应于左声道PCM数据的左声道数组,以及一个对应于右声道PCM数据的右声道数组。
重采样模块,用于将PCM数据重采样至48k采样率。
浮点归一化模块,用于将左声道数据内的数据以及右声道数组内的数据进行浮点归一化,量化范围为-1~1。
分帧加窗模块,用于对归一化后的PCM数据进行分帧和加窗处理,每帧数据为2048采样。
FFT运算模块,用于对每帧数据进行FFT运算,将时域数据转化为频域数据。
相位角度计算模块,用于取FFT前1024个复数数据,计算其各个值在复平面的相位角度。
比例计算模块,用于取FFT前1024个复数的模,并分别计算每个值相对于总和的比例w。
相位角计算模块,用于将左右声道各自的1024个相位角相减,再做一次余弦运算,并按步骤G中的比例w进行加权平均。
以及,
映射模块,用于在加权平均后得出一个-1~1之间的映射值。
分离数据模块对输入源的左右声道PCM数据进行分离,浮点归一化模块将左右声道的PCM数据进行浮点归一化,分帧加窗模块对数据进行分帧和加窗处理,FFT运算模块对数据进行FFT运算,获得频谱,相位角计算模块根据频谱数据计算分别计算左右声道的相位信息,将左右声道的相位偏差映射到-1~1之间,在设定时间段T内相位映射值为1或接近1的比例越高,则说明该声音是非立体声的概率越高,最后以一段时间内的数值统计来判断是否为立体声。
以上均为本申请的较佳实施例,并非依此限制本申请的保护范围,故:凡依本申请的结构、形状、原理所做的等效变化,均应涵盖于本申请的保护范围之内。

Claims (9)

1.一种检测立体声的方法,其特征在于:包括以下步骤:
声音处理模块获取输入源的左右声道PCM数据,并将左右声道PCM数据发送至处理器;
A,所述处理器分离所述左右声道PCM数据,生成一个对应于左声道PCM数据的左声道数组,以及一个对应于右声道PCM数据的右声道数组;
B,将PCM数据重采样至第一采样率;
C,将左声道数组内的数据以及右声道数组内的数据进行浮点归一化,量化范围为-1~1;
D,对归一化后的PCM数据进行分帧和加窗处理;
E,对每帧数据进行FFT运算,将时域数据转化为频域数据;
F,取FFT前1024个复数数据,计算其各个值在复平面的相位角度;
G,取FFT前1024个复数的模,并分别计算每个值相对于总和的比例w;
H,将左右声道各自的1024个相位角相减,再做一次余弦运算,并按步骤G中的比例w进行加权平均;
I,加权平均后将得到一个-1-1之间的映射值,在设定时间段T内相位映射值为1或接近1的比例越高,则说明该声音是非立体声的概率越高;
声音相位差的评估值计算方法如下:其中Wk为频域中各个数据的加权值,N为采样数据量的一半,Xk为频域数据;/>其中P为音频相位的评估值,P的值域区间为[-1,1],/>为左右声道的各个频域数据相位角的差分值。
2.根据权利要求1所述的一种检测立体声的方法,其特征在于:复平面的相位角度的计算方法如下:在复平面上,当复数a满足|a|=1时,由欧拉公式得a=e=cos(θ)+jsin(θ),θa即为复数a的相位角,θb为复数b的相位角,b=ee=ej(θ+Φ)
3.根据权利要求1所述的一种检测立体声的方法,其特征在于:通过一维离散傅里叶变换DFT对原始音频数据进行频域转换,公式如下:其中,0≤k≤N-1,N为总离散采样数,x为时域数据序列,X为频域数据序列。
4.根据权利要求1所述的一种检测立体声的方法,其特征在于:频域数据变换回时域数据的方法如下:其中0≤k≤N-1,N为总离散采样数,x为时域数据序列,X为频域数据序列。
5.根据权利要求1所述的一种检测立体声的方法,其特征在于:步骤I中,多次取设定时间段T内的数值,平均值用于判断是否为立体声。
6.根据权利要求1所述的一种检测立体声的方法,其特征在于:所述FFT运算采用微处理器中的快速FFT运算。
7.根据权利要求1所述的一种检测立体声的方法,其特征在于:所述步骤D中,每帧数据为2048采样。
8.根据权利要求1所述的一种检测立体声的方法,其特征在于:所述第一采样率为48K采样率。
9.一种检测立体声的系统,其特征在于:包括声音处理模块以及处理器,其特征在于:所述声音处理模块用于获取输入源的左右声道PCM数据,并将左右声道PCM数据发送至处理器;
所述处理器包括:
分离数据模块,用于分离所述左右声道PCM数据,生成一个对应于左声道PCM数据的左声道数组,以及一个对应于右声道PCM数据的右声道数组;
重采样模块,用于将PCM数据重采样至48k采样率;
浮点归一化模块,用于将左声道数组内的数据以及右声道数组内的数据进行浮点归一化,量化范围为-1~1;
分帧加窗模块,用于对归一化后的PCM数据进行分帧和加窗处理,每帧数据为2048采样;
FFT运算模块,用于对每帧数据进行FFT运算,将时域数据转化为频域数据;
相位角度计算模块,用于取FFT前1024个复数数据,计算其各个值在复平面的相位角度;
比例计算模块,用于取FFT前1024个复数的模,并分别计算每个值相对于总和的比例w;声音相位差的评估值计算方法如下:其中Wk为频域中各个数据的加权值,N为采样数据量的一半,Xk为频域数据;/>其中P为音频相位的评估值,P的值域区间为[-1,1],/>为左右声道的各个频域数据相位角的差分值;
相位角计算模块,用于将左右声道各自的1024个相位角相减,再做一次余弦运算,并按步骤G中的比例w进行加权平均;以及,
映射模块,用于在加权平均后得出一个-1~1之间的映射值,在设定时间段T内相位映射值为1或接近1的比例越高,则说明该声音是非立体声的概率越高。
CN202011057691.0A 2020-09-30 2020-09-30 一种检测立体声的方法及其系统 Active CN112242150B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011057691.0A CN112242150B (zh) 2020-09-30 2020-09-30 一种检测立体声的方法及其系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011057691.0A CN112242150B (zh) 2020-09-30 2020-09-30 一种检测立体声的方法及其系统

Publications (2)

Publication Number Publication Date
CN112242150A CN112242150A (zh) 2021-01-19
CN112242150B true CN112242150B (zh) 2024-04-12

Family

ID=74172196

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011057691.0A Active CN112242150B (zh) 2020-09-30 2020-09-30 一种检测立体声的方法及其系统

Country Status (1)

Country Link
CN (1) CN112242150B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113257278B (zh) * 2021-04-29 2022-09-20 杭州联汇科技股份有限公司 一种带阻尼系数的音频信号瞬时相位的检测方法

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102157152A (zh) * 2010-02-12 2011-08-17 华为技术有限公司 立体声编码的方法、装置
CN103026406A (zh) * 2010-09-28 2013-04-03 华为技术有限公司 用于对已解码多通道音频信号或已解码立体声信号进行后处理的装置和方法
CN104506853A (zh) * 2014-12-31 2015-04-08 成都东方盛行电子有限责任公司 一种音视频技审系统及方法
CN204305344U (zh) * 2014-11-21 2015-04-29 浙江广播电视集团 5.1环绕声音频制作中扬声器的配置结构
CN105139865A (zh) * 2015-06-19 2015-12-09 中央电视台 一种确定左右声道音频相关系数的方法及装置
CN109243488A (zh) * 2018-10-30 2019-01-18 腾讯音乐娱乐科技(深圳)有限公司 音频检测方法、装置及存储介质
CN109327608A (zh) * 2018-09-12 2019-02-12 广州酷狗计算机科技有限公司 歌曲分享的方法、终端、服务器和系统
WO2019193070A1 (en) * 2018-04-05 2019-10-10 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method or computer program for estimating an inter-channel time difference
WO2019209930A1 (en) * 2018-04-27 2019-10-31 Dolby Laboratories Licensing Corporation Blind detection of binauralized stereo content
CN111261194A (zh) * 2020-04-29 2020-06-09 浙江百应科技有限公司 一种基于pcm技术的音量分析方法

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7292901B2 (en) * 2002-06-24 2007-11-06 Agere Systems Inc. Hybrid multi-channel/cue coding/decoding of audio signals

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102157152A (zh) * 2010-02-12 2011-08-17 华为技术有限公司 立体声编码的方法、装置
CN103026406A (zh) * 2010-09-28 2013-04-03 华为技术有限公司 用于对已解码多通道音频信号或已解码立体声信号进行后处理的装置和方法
CN204305344U (zh) * 2014-11-21 2015-04-29 浙江广播电视集团 5.1环绕声音频制作中扬声器的配置结构
CN104506853A (zh) * 2014-12-31 2015-04-08 成都东方盛行电子有限责任公司 一种音视频技审系统及方法
CN105139865A (zh) * 2015-06-19 2015-12-09 中央电视台 一种确定左右声道音频相关系数的方法及装置
WO2019193070A1 (en) * 2018-04-05 2019-10-10 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus, method or computer program for estimating an inter-channel time difference
WO2019209930A1 (en) * 2018-04-27 2019-10-31 Dolby Laboratories Licensing Corporation Blind detection of binauralized stereo content
CN109327608A (zh) * 2018-09-12 2019-02-12 广州酷狗计算机科技有限公司 歌曲分享的方法、终端、服务器和系统
CN109243488A (zh) * 2018-10-30 2019-01-18 腾讯音乐娱乐科技(深圳)有限公司 音频检测方法、装置及存储介质
CN111261194A (zh) * 2020-04-29 2020-06-09 浙江百应科技有限公司 一种基于pcm技术的音量分析方法

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
基于FFT的广播信号声音检测;王彤;林岩;张烽;;电子技术与软件工程(第08期);第101-102页 *
多种不同格式信号的同阵切换;施建华;数字卫星微波网络;第1-3页 *
立体声音乐节目后期制作中声像定位的探讨;赵保忠 等;演艺科技;第38-43页 *

Also Published As

Publication number Publication date
CN112242150A (zh) 2021-01-19

Similar Documents

Publication Publication Date Title
US9357306B2 (en) Multichannel audio calibration method and apparatus
TWI480855B (zh) 聲音訊號之特徵指紋擷取與匹配
CN102857852B (zh) 一种声场定量重现控制系统的扬声器回放阵列控制信号的处理方法
Benichoux et al. On the variation of interaural time differences with frequency
WO2016152511A1 (ja) 音源分離装置および方法、並びにプログラム
US20170359669A1 (en) Apparatus And Method For Reproducing Recorded Audio With Correct Spatial Directionality
CN109285556B (zh) 音频处理方法、装置、设备以及存储介质
EP3133833B1 (en) Sound field reproduction apparatus, method and program
CN101401450A (zh) 声音采集/再现方法和设备
EP3206415B1 (en) Sound processing device, method, and program
CN105723743A (zh) 声场再现设备和方法以及程序
CN112017693B (zh) 一种音频质量评估方法及装置
CN109186752B (zh) 基于图形处理器的水下声学信号采集、传输和检测系统
CN112242150B (zh) 一种检测立体声的方法及其系统
CN109658951B (zh) 混合信号检测方法及系统
CN105659631A (zh) 音场测量装置、音场测量方法和音场测量程序
CN110875056A (zh) 语音转录设备、系统、方法、及电子设备
CN110650426A (zh) 麦克风阵列的非线性谐波失真检测方法、装置和存储介质
CN108353228B (zh) 一种信号分离的方法、系统和存储介质
JP2007500962A (ja) 音場の表現を求めるためのシステムおよび方法
CN113093106A (zh) 一种声源定位方法及系统
WO2018053050A1 (en) Audio signal processor and generator
CN111261194A (zh) 一种基于pcm技术的音量分析方法
CN115174818A (zh) 基于声音定位的目标跟踪方法、电子设备及可读存储介质
CN111028857B (zh) 基于深度学习的多通道音视频会议降噪的方法及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant