CN108182947A - 一种声道混合处理方法及装置 - Google Patents

一种声道混合处理方法及装置 Download PDF

Info

Publication number
CN108182947A
CN108182947A CN201611122299.3A CN201611122299A CN108182947A CN 108182947 A CN108182947 A CN 108182947A CN 201611122299 A CN201611122299 A CN 201611122299A CN 108182947 A CN108182947 A CN 108182947A
Authority
CN
China
Prior art keywords
channel
audio data
sound channel
source audio
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201611122299.3A
Other languages
English (en)
Other versions
CN108182947B (zh
Inventor
徐超
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Baosheng China Technology Industry Co ltd
Original Assignee
Wuhan Douyu Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Wuhan Douyu Network Technology Co Ltd filed Critical Wuhan Douyu Network Technology Co Ltd
Priority to CN201611122299.3A priority Critical patent/CN108182947B/zh
Publication of CN108182947A publication Critical patent/CN108182947A/zh
Application granted granted Critical
Publication of CN108182947B publication Critical patent/CN108182947B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Mathematical Physics (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Stereophonic System (AREA)

Abstract

本发明实施例公开了一种声道混合处理方法及装置,所述方法包括:分别对源音频数据的左声道、右声道、左环绕声道和右环绕声道进行数据采样;将同一采样时刻对应的源音频数据的左声道和左环绕声道的采样值进行叠加,源音频数据的右声道和右环绕声道的采样值进行叠加,得到各采样时刻的左声道混合音频数据和右声道混合音频数据;根据预设声道混合系数分别对所述左声道混合音频数据和右声道混合音频数据进行强度调节,得到目标音频数据的左声道音频数据和右声道音频数据。本发明实施例提出的声道混合处理方法及装置,能够简单有效地实现具有多声道格式的音频数据的声道混合。

Description

一种声道混合处理方法及装置
技术领域
本发明涉及音频数据处理技术领域,尤其涉及一种声道混合处理方法及装置。
背景技术
目前,在windows下不同的声卡和音乐文件可以输出不同的音频格式。对于双声道立体声格式的音频数据而言,如何把每个声音(声道)都混合到两个声道(左右声道)中对于音频相关应用程序的开发,如直播、视频聊天等软件,具有重要意义,如:当用户想构建一副完整的声音图景时,需要背景音乐和歌词演唱进行混合的场景。
现有技术中,常用的方法是在采集到PCM数据后统一做一次重采样处理。但是该方法的实现过程比较复杂。因此,如何提供一种能够简单有效地实现具有多声道的音频数据的声道混合方法具有重要意义。
发明内容
鉴于上述问题,本发明实施例提出了一种声道混合处理方法及装置,能够简单有效地实现具有多声道格式的音频数据的声道混合。
本发明的一个方面,提供了一种声道混合处理方法,所述方法包括:
分别对源音频数据的左声道、右声道、左环绕声道和右环绕声道进行数据采样;
将同一采样时刻对应的源音频数据的左声道和左环绕声道的采样值进行叠加,源音频数据的右声道和右环绕声道的采样值进行叠加,得到各采样时刻的左声道混合音频数据和右声道混合音频数据;
根据预设声道混合系数分别对所述左声道混合音频数据和右声道混合音频数据进行强度调节,得到目标音频数据的左声道音频数据和右声道音频数据,其中,0<预设声道混合系数<1。
可选地,所述分别对源音频数据的左声道、右声道、左环绕声道和右环绕声道进行数据采样之后,所述方法还包括:
根据预设衰减系数对所述源音频数据的左环绕声道的采样值和右环绕声道的采样值进行调节,其中,0<预设衰减系数<1;
将所述源音频数据在对应采样时刻的左环绕声道的采样值和右环绕声道的采样值分别更新为调节后的数据。
可选地,所述方法还包括:
根据所述预设衰减系数计算或更新所述预设声道混合系数,公式如下:
预设声道混合系数=1/(1+预设衰减系数)。
可选地,所述分别对源音频数据的左声道、右声道、左环绕声道和右环绕声道进行数据采样,包括:
将所述源音频数据从时域信号转换到频域信号;
根据预设采样频率分别对源音频数据的左声道、右声道、左环绕声道和右环绕声道的频域信号进行数据采样。
可选地,所述分别对源音频数据的左声道、右声道、左环绕声道和右环绕声道进行数据采样之前,所述方法还包括:
根据所述源音频数据的文件属性判定所述源音频数据是否为双声道立体声格式;
若所述源音频数据为双声道立体声格式,则执行所述分别对源音频数据的左声道、右声道、左环绕声道和右环绕声道进行数据采样的步骤。
本发明的又一个方面,提供了一种声道混合处理装置,所述装置包括:
采样模块,用于分别对源音频数据的左声道、右声道、左环绕声道和右环绕声道进行数据采样;
混合模块,用于将同一采样时刻对应的源音频数据的左声道和左环绕声道的采样值进行叠加,源音频数据的右声道和右环绕声道的采样值进行叠加,得到各采样时刻的左声道混合音频数据和右声道混合音频数据;
调节模块,用于根据预设声道混合系数分别对所述左声道混合音频数据和右声道混合音频数据进行强度调节,得到目标音频数据的左声道音频数据和右声道音频数据,其中,0<预设声道混合系数<1。
可选地,所述调节模块,还用于在所述采样模块分别对源音频数据的左声道、右声道、左环绕声道和右环绕声道进行数据采样之后,根据预设衰减系数对所述源音频数据的左环绕声道的采样值和右环绕声道的采样值进行调节,其中,0<预设衰减系数<1,并将所述源音频数据在对应采样时刻的左环绕声道的采样值和右环绕声道的采样值分别更新为调节后的数据。
可选地,所述装置还包括:
计算模块,用于根据所述预设衰减系数计算或更新所述预设声道混合系数,公式如下:
预设声道混合系数=1/(1+预设衰减系数)。
可选地,所述采样模块,包括:
信号转换单元,用于将所述源音频数据从时域信号转换到频域信号;
数据采样单元,用于根据预设采样频率分别对源音频数据的左声道、右声道、左环绕声道和右环绕声道的频域信号进行数据采样。
可选地,所述装置还包括:
判断模块,用于在所述采样模块分别对源音频数据的左声道、右声道、左环绕声道和右环绕声道进行数据采样之前,根据所述源音频数据的文件属性判定所述源音频数据是否为双声道立体声格式;
所述采样模块,具体用于当判断模块的判定结果为所述源音频数据为双声道立体声格式时,执行所述分别对源音频数据的左声道、右声道、左环绕声道和右环绕声道进行数据采样的操作。
本发明实施例提供的声道混合处理方法及装置,通过将同一采样时刻对应的源音频数据的左声道和左环绕声道的采样值进行叠加,右声道和右环绕声道的采样值进行叠加,并根据预设声道混合系数对叠加后得到的各采样时刻的左声道混合音频数据和右声道混合音频数据进行强度调节,得到目标音频数据的左声道音频数据和右声道音频数据,实现声道混合。本发明实施例通过对源音频数据各声道采样值的叠加,并根据预设声道混合系数进行强度调节,能够简单有效地实现具有多声道格式的音频数据的声道混合。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1为本发明实施例的一种声道混合处理方法的流程图;
图2为本发明实施例的另一种声道混合处理方法的流程图;
图3为本发明实施例的另一种声道混合处理方法的流程图;
图4为本发明实施例的另一种声道混合处理方法的流程图;
图5为本发明实施例的一种声道混合处理装置的结构示意图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
本技术领域技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语),具有与本发明所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语,应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非被特定定义,否则不会用理想化或过于正式的含义来解释。
图1示意性示出了本发明实施例一种声道混合处理方法的流程图。参照图1,本发明实施例的声道混合处理方法具体包括以下步骤:
S11、分别对源音频数据的左声道、右声道、左环绕声道和右环绕声道进行数据采样。
本发明实施例中的源音频数据为双声道立体声格式音频数据,包括有左声道、右声道、左环绕声道和右环绕声道。
本发明实施例中可以预先设定采样频率,并根据预先设定的采样频率对源音频数据的左声道、右声道、左环绕声道和右环绕声道进行数据采样。其中,采样频率具体可根据实际应用场景的采用精度进行设置,本发明对此不作具体限定。
数字音频的质量取决于采样频率、量化位数和声道数三个因素。采样频率是指一秒钟时间内采样的次数。在计算机多媒体音频处理中,采样频率通常采用三种:11.025KHz(语音效果)、22.05KHz(音乐效果)、44.1KHz(高保真效果)。在实际应用中,可根据对音频数量的质量要求设定采样频率的具体取值。
S12、将同一采样时刻对应的源音频数据的左声道和左环绕声道的采样值进行叠加,并将同一采样时刻对应的源音频数据的右声道和右环绕声道的采样值进行叠加,得到各采样时刻的左声道混合音频数据和右声道混合音频数据。
S13、根据预设声道混合系数分别对所述左声道混合音频数据和右声道混合音频数据进行强度调节,得到目标音频数据的左声道音频数据和右声道音频数据,其中,0<预设声道混合系数<1。
本发明实施例提供的声道混合处理方法,通过将同一采样时刻对应的源音频数据的左声道和左环绕声道的采样值进行叠加,右声道和右环绕声道的采样值进行叠加,并根据预设声道混合系数对叠加后得到的各采样时刻的左声道混合音频数据和右声道混合音频数据进行强度调节,得到目标音频数据的左声道音频数据和右声道音频数据,实现声道混合。本发明通过对源音频数据各声道采样值的叠加,并根据预设声道混合系数进行强度调节,能够简单有效地实现双声道立体声格式音频数据的声道混合。
图2示意性示出了本发明另一实施例一种声道混合处理方法的流程图。参照图2,本发明实施例的声道混合处理方法具体包括以下步骤:
S21、分别对源音频数据的左声道、右声道、左环绕声道和右环绕声道进行数据采样。
本实施例中步骤S21与上一实施例中的步骤S11的实现方式相同,此处不再具体陈述。
S22、根据预设衰减系数对所述源音频数据的左环绕声道的采样值和右环绕声道的采样值进行调节,其中,0<预设衰减系数<1。
S23、将所述源音频数据在对应采样时刻的左环绕声道的采样值和右环绕声道的采样值分别更新为调节后的数据。
S24、将同一采样时刻对应的源音频数据的左声道和更新后的左环绕声道的采样值进行叠加,并将同一采样时刻对应的源音频数据的右声道和更新后的右环绕声道的采样值进行叠加,得到各采样时刻的左声道混合音频数据和右声道混合音频数据。
S25、根据预设声道混合系数分别对所述左声道混合音频数据和右声道混合音频数据进行强度调节,得到目标音频数据的左声道音频数据和右声道音频数据,其中,0<预设声道混合系数<1。
本发明实施例中,所述方法还包括根据所述预设衰减系数surroundMix4计算或更新所述预设声道混合系数attn4dotX的步骤。本实施例中,可以预先根据预设衰减系数surroundMix4计算声道混合系数attn4dotX,并将计算结果作为预设声道混合系数,也可以预先设置默认的衰减系数surroundMix4和声道混合系数attn4dotX,然后在后续处理流程中,根据衰减系数surroundMix4的调整实时更新声道混合系数attn4dotX的取值,已达到更好的声道混合效果。
具体的可通过以下公式根据预设衰减系数计算预设声道混合系数,公式如下:
预设声道混合系数=1/(1+预设衰减系数)。
通过大量的试验表明,当surroundMix4系数取值越接近于1时经过上述的处理后,混合后左、右环绕声道对左右声道的声音干扰越严重,所以如果想降低干扰,则可以将surroundMix4系数调低,如果想加强环绕效果可以将系数提高。例如在播放音乐如果想加强环绕效果(背景音乐)就需提高surroundMix4系数,如果想加强歌词或独白效果那就需调低surroundMix4系数,当surroundMix4处在0到1之间适应性比较好。
需要说明的是,如果环绕声道的电平很高,在混合时对前方声道的声音干扰严重,则可以修改系数或者直接将环绕声道完全关闭,以降低或避免环绕声道的干扰。
在一个具体实施例中,可以将衰减系数surroundMix4设为0.5,因此,通过大量的实际操作表明,当surroundMix4设为0.5时效果是最好的。
本发明实施例中,首先,根据所述源音频数据的文件属性判定所述源音频数据是否为双声道立体声格式,若所述源音频数据为双声道立体声格式,则将所述源音频数据从时域信号转换到频域信号,并根据预设采样频率分别对源音频数据的左声道、右声道、左环绕声道和右环绕声道的频域信号进行数据采样,并将采样结果进行保存。
由于,大多数环绕声道的声音都不像前方声道(左右声道)那么重要,而衰减可以避免过多的环绕声对前声道造成干扰,所以本发明实施例中,预先设置衰减系数surroundMix4,通过分别将衰减系数与源音频数据的左环绕声道采样值和右环绕声道采样值相乘然后,分别将源音频数据在对应采样时刻的左环绕声道的采样值和右环绕声道的采样值更新为调节后的数据,以避免由于过多的环绕声对前方左、右声道造成的干扰。其中,surroundMix4系数的取值范围为0到1之间。然后按照左环绕声道进入左声道原则,右环绕声道进入右声道原则,把左声道和左环绕声道采样值相加后乘以预设声道混合系数attn4dotX,并将计算的值作为目标音频数据的左声道音频数据赋值到对应的目标数据缓存中。同时,把右声道和右环绕声道采样值相加后乘以预设声道混合系数attn4dotX,并将计算的值作为目标音频数据的右声道音频数据赋值到对应的目标数据缓存中。其中,这里attn4dotX系数的取值范围为0到1之间。通过根据上述方法对源音频数据对应的所有采样值进行处理,直到处理完所有的采样值,进而实现了双声道立体声格式音频数据的声道混合。
图3示意性示出了本发明另一实施例一种声道混合处理方法的流程图。参照图3,本发明实施例的声道混合处理方法具体包括以下步骤:
S31、分别对源音频数据的左声道、右声道、中声道、左环绕声道和右环绕声道进行数据采样。
本发明实施例中的源音频数据为5.1声道音频数据,包括有左声道、右声道、中声道、左环绕声道、右环绕声道和低频增强声道。其中,低频增强声道被称为LFE声道的0.1声道,为120Hz以下信号提供了更高的峰值储备。由于人耳对该频段的敏感度较低,需要更大的升压级数来获得和中频相同的响度感觉,因此,本发明实施例在混合中不对其进行做处理。
本发明实施例中可以预先设定采样频率,并根据预先设定的采样频率对源音频数据的左声道、右声道、左环绕声道和右环绕声道进行数据采样。其中,采样频率具体可根据实际应用场景的采用精度进行设置,本发明对此不作具体限定。
数字音频的质量取决于采样频率、量化位数和声道数三个因素。采样频率是指一秒钟时间内采样的次数。在计算机多媒体音频处理中,采样频率通常采用三种:11.025KHz(语音效果)、22.05KHz(音乐效果)、44.1KHz(高保真效果)。在实际应用中,可根据对音频数量的质量要求设定采样频率的具体取值。
S32、将同一采样时刻对应的源音频数据的左声道、中声道和左环绕声道的采样值进行叠加,源音频数据的右声道、中声道和右环绕声道的采样值进行叠加,得到各采样时刻的左声道混合音频数据和右声道混合音频数据。
S33、根据预设声道混合系数分别对所述左声道混合音频数据和右声道混合音频数据进行强度调节,得到目标音频数据的左声道音频数据和右声道音频数据,其中,0<预设声道混合系数<1。
本发明实施例提供的声道混合处理方法,通过将同一采样时刻对应的源音频数据的左声道、中声道和左环绕声道的采样值进行叠加,右声道、中声道和右环绕声道的采样值进行叠加,并根据预设声道混合系数对叠加后得到的各采样时刻的左声道混合音频数据和右声道混合音频数据进行强度调节,得到目标音频数据的左声道音频数据和右声道音频数据,实现声道混合。本发明实施例通过对源音频数据各声道采样值的叠加,并根据预设声道混合系数进行强度调节,能够简单有效地实现5.1声道音频数据的声道混合。
图4示意性示出了本发明另一实施例一种声道混合处理方法的流程图。参照图4,本发明实施例的声道混合处理方法具体包括以下步骤:
S41、分别对源音频数据的左声道、右声道、中声道、左环绕声道和右环绕声道进行数据采样。
本实施例中步骤S41与上一实施例中的步骤S31的实现方式相同,此处不再具体陈述。
S42、根据第一预设衰减系数对所述源音频数据的左环绕声道的采样值和右环绕声道的采样值进行调节,其中,0<第一预设衰减系数<1;并根据第二预设衰减系数对所述源音频数据的中声道的采样值进行调节,其中,0<第二预设衰减系数<1;
S43、将所述源音频数据在对应采样时刻的中声道的采样值、左环绕声道的采样值和右环绕声道的采样值分别更新为调节后的数据。
S44、将同一采样时刻对应的源音频数据的左声道、更新后的中声道和左环绕声道的采样值进行叠加,源音频数据的右声道、更新后的中声道和右环绕声道的采样值进行叠加,得到各采样时刻的左声道混合音频数据和右声道混合音频数据;
S45、根据预设声道混合系数分别对所述左声道混合音频数据和右声道混合音频数据进行强度调节,得到目标音频数据的左声道音频数据和右声道音频数据,其中,0<预设声道混合系数<1。
本发明实施例中,所述方法还包括根据所述第一预设衰减系数surroundMix和第二预设衰减系数centerMix计算或更新所述预设声道混合系数attn5dot1的步骤。本实施例中,可以预先根据第一预设衰减系数surroundMix和第二预设衰减系数centerMix计算声道混合系数attn5dot1,并将计算结果作为预设声道混合系数;也可以预先设置默认的第一预设衰减系数surroundMix、第二预设衰减系数centerMix和声道混合系数attn5dot1,然后在后续处理流程中,根据第一预设衰减系数surroundMix和或第二预设衰减系数centerMix的调整实时更新声道混合系数attn5dot1的取值,已达到更好的声道混合效果。
其中,第一预设衰减系数surroundMix为左、右环绕声道对应的衰减系数;第二预设衰减系数centerMix为中声道对应的衰减系数。
具体的可通过以下公式根据第一预设衰减系数和第二预设衰减系数计算声道混合系数,公式如下:
预设声道混合系数=1/(1+第一预设衰减系数+第二预设衰减系数)。
通过大量的试验表明,surroundMix和centerMix越接近于1是该声道在混合后表现的效果越明显,因此可以通过改变这两个系数来适应不同的开发需求。
此外,通过大量的实际操作还表明:surroundMix设为0.7071067811865476(ITU-RBS.775-1获取),centerMix设为0.5时效果最好。
在一个具体实施例中,可以将衰减系数surroundMix设为0.7071067811865476,衰减系数centerMix设为0.5,已达到最好的声道混合效果。
本发明实施例中,首先,根据所述源音频数据的文件属性判定所述源音频数据是否为5.1声道的音频数据;若所述源音频数据为5.1声道的音频数据,则将所述源音频数据从时域信号转换到频域信号,根据预设采样频率分别对源音频数据的左声道、右声道、中声道、左环绕声道和右环绕声道的频域信号进行数据采样,并将采样结果进行保存。
由于,大多数环绕声道和中声道的声音都不像前方声道(左右声道)那么重要,而衰减可以避免过多的环绕声对前声道造成干扰,因此,本发明实施例中,预先设置了环绕声道对应的衰减系数surroundMix,通过分别将衰减系数与源音频数据的左环绕声道采样值和右环绕声道采样值相乘然后,并分别将源音频数据在对应采样时刻的左环绕声道的采样值和右环绕声道的采样值更新为调节后的数据,以避免由于过多的环绕声对前方左、右声道造成的干扰。此外,本发明实施例中还预先设置了中声道对应的衰减系数centerMix系数,将centerMix系数与源音频数据的中声道的采样值相乘然后,并将源音频数据在对应采样时刻的中声道的采样值更新为调节后的数据,以避免由于过多的中声道造成的干扰。其中,surroundMix系数和centerMix系数的取值范围均为0到1之间。
然后按照中声道和左环绕声道进入左声道原则,中声道和右环绕声道进入右声道原则,把中声道、左声道和左环绕声道采样值相加后乘以预设声道混合系数attn5dot1,并将计算的值作为目标音频数据的左声道音频数据赋值到对应的目标数据缓存中。同时,把中声道、右声道和右环绕声道采样值相加后乘以预设声道混合系数attn5dot1,并将计算的值作为目标音频数据的右声道音频数据赋值到对应的目标数据缓存中。其中,这里attn5dot1系数值为0到1之间。通过根据上述方法对源音频数据对应的所有采样值进行处理,直到处理完所有的采样值,进而实现了双声道立体声格式音频数据的声道混合。
对于方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明实施例并不受所描述的动作顺序的限制,因为依据本发明实施例,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作并不一定是本发明实施例所必须的。
图5示意性示出了本发明实施例的一种声道混合处理装置的结构示意图。参照图5,本发明实施例的声道混合处理装置具体包括采样模块501、混合模块502以及调节模块503,其中:所述的采样模块501,用于分别对源音频数据的左声道、右声道、左环绕声道和右环绕声道进行数据采样;所述的混合模块502,用于将同一采样时刻对应的源音频数据的左声道和左环绕声道的采样值进行叠加,源音频数据的右声道和右环绕声道的采样值进行叠加,得到各采样时刻的左声道混合音频数据和右声道混合音频数据;所述的调节模块503,用于根据预设声道混合系数分别对所述左声道混合音频数据和右声道混合音频数据进行强度调节,得到目标音频数据的左声道音频数据和右声道音频数据,其中,0<预设声道混合系数<1。
本发明实施例提供的声道混合处理装置,通过将同一采样时刻对应的源音频数据的左声道和左环绕声道的采样值进行叠加,右声道和右环绕声道的采样值进行叠加,并根据预设声道混合系数对叠加后得到的各采样时刻的左声道混合音频数据和右声道混合音频数据进行强度调节,得到目标音频数据的左声道音频数据和右声道音频数据,实现声道混合。本发明通过对源音频数据各声道采样值的叠加,并根据预设声道混合系数进行强度调节,能够简单有效地实现双声道立体声格式音频数据的声道混合。
在本发明的一个可选实施例中,所述调节模块503,还用于在所述采样模块501分别对源音频数据的左声道、右声道、左环绕声道和右环绕声道进行数据采样之后,根据预设衰减系数对所述源音频数据的左环绕声道的采样值和右环绕声道的采样值进行调节,其中,0<预设衰减系数<1,并将所述源音频数据在对应采样时刻的左环绕声道的采样值和右环绕声道的采样值分别更新为调节后的数据。
本发明实施例中,所述装置还包括附图中未示出的计算模块,所述的计算模块,用于根据所述预设衰减系数计算或更新所述预设声道混合系数,公式如下:
预设声道混合系数=1/(1+预设衰减系数)。
本发明实施例中,所述采样模块501,包括信号转换单元和数据采样单元,其中,所述的信号转换单元,用于将所述源音频数据从时域信号转换到频域信号;所述的数据采样单元,用于根据预设采样频率分别对源音频数据的左声道、右声道、左环绕声道和右环绕声道的频域信号进行数据采样。
进一步地,所述装置还包括附图中未示出的判断模块,所述的判断模块,用于在所述采样模块501分别对源音频数据的左声道、右声道、左环绕声道和右环绕声道进行数据采样之前,根据所述源音频数据的文件属性判定所述源音频数据是否为双声道立体声格式;
所述采样模块501,具体用于当判断模块的判定结果为所述源音频数据为双声道立体声格式时,执行所述分别对源音频数据的左声道、右声道、左环绕声道和右环绕声道进行数据采样的操作。
在本发明的另一实施例中,当源音频数据为5.1声道音频数据,包括有左声道、右声道、中声道、左环绕声道、右环绕声道和低频增强声道时,所述的采样模块501,用于分别对源音频数据的左声道、右声道、中声道、左环绕声道和右环绕声道进行数据采样;所述的混合模块502,用于将同一采样时刻对应的源音频数据的左声道、中声道和左环绕声道的采样值进行叠加,以及,源音频数据的右声道、中声道和右环绕声道的采样值进行叠加,得到各采样时刻的左声道混合音频数据和右声道混合音频数据;所述的调节模块503,用于根据预设声道混合系数分别对所述左声道混合音频数据和右声道混合音频数据进行强度调节,得到目标音频数据的左声道音频数据和右声道音频数据,其中,0<预设声道混合系数<1。
本发明实施例提供的声道混合处理装置,通过将同一采样时刻对应的源音频数据的左声道、中声道和左环绕声道的采样值进行叠加,右声道、中声道和右环绕声道的采样值进行叠加,并根据预设声道混合系数对叠加后得到的各采样时刻的左声道混合音频数据和右声道混合音频数据进行强度调节,得到目标音频数据的左声道音频数据和右声道音频数据,实现声道混合。本发明实施例通过对源音频数据各声道采样值的叠加,并根据预设声道混合系数进行强度调节,能够简单有效地实现5.1声道音频数据的声道混合。
在本发明实施例中,所述调节模块503,还用于在所述采样模块501分别对源音频数据的左声道、右声道、中声道、左环绕声道和右环绕声道进行数据采样之后,根据第一预设衰减系数对所述源音频数据的左环绕声道的采样值和右环绕声道的采样值进行调节,其中,0<第一预设衰减系数<1;根据第二预设衰减系数对所述源音频数据的中声道的采样值进行调节,其中,0<第二预设衰减系数<1;并将所述源音频数据在对应采样时刻的中声道的采样值、左环绕声道的采样值和右环绕声道的采样值分别更新为调节后的数据。
本发明实施例中,所述的计算模块,还用于根据所述第一预设衰减系数和第二预设衰减系数计算或更新所述预设声道混合系数,公式如下:
预设声道混合系数=1/(1+第一预设衰减系数+第二预设衰减系数)。
本发明实施例中,所述采样模块,包括信号转换单元和数据采样单元,其中,所述的信号转换单元,用于将所述源音频数据从时域信号转换到频域信号;所述的数据采样单元,用于根据预设采样频率分别对源音频数据的左声道、右声道、中声道、左环绕声道和右环绕声道的频域信号进行数据采样。
进一步地,所述的判断模块,还用于在所述采样模块分别对源音频数据的左声道、右声道、中声道、左环绕声道和右环绕声道进行数据采样之前,根据所述源音频数据的文件属性判定所述源音频数据是否为5.1声道的音频数据;
所述采样模块501,具体还用于当所述判断模块的判定结果为所述源音频数据为5.1声道的音频数据时,执行所述分别对源音频数据的左声道、右声道、中声道、左环绕声道和右环绕声道进行数据采样的操作。
对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
本发明实施例提供的声道混合处理方法及装置,通过将同一采样时刻对应的源音频数据的左声道和左环绕声道的采样值进行叠加,右声道和右环绕声道的采样值进行叠加,并根据预设声道混合系数对叠加后得到的各采样时刻的左声道混合音频数据和右声道混合音频数据进行强度调节,得到目标音频数据的左声道音频数据和右声道音频数据,实现声道混合。本发明实施例通过对源音频数据各声道采样值的叠加,并根据预设声道混合系数进行强度调节,能够简单有效地实现具有多声道格式的音频数据的声道混合。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
此外,本领域的技术人员能够理解,尽管在此的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (10)

1.一种声道混合处理方法,其特征在于,所述方法包括:
分别对源音频数据的左声道、右声道、左环绕声道和右环绕声道进行数据采样;
将同一采样时刻对应的源音频数据的左声道和左环绕声道的采样值进行叠加,源音频数据的右声道和右环绕声道的采样值进行叠加,得到各采样时刻的左声道混合音频数据和右声道混合音频数据;
根据预设声道混合系数分别对所述左声道混合音频数据和右声道混合音频数据进行强度调节,得到目标音频数据的左声道音频数据和右声道音频数据,其中,0<预设声道混合系数<1。
2.根据权利要求1所述的方法,其特征在于,所述分别对源音频数据的左声道、右声道、左环绕声道和右环绕声道进行数据采样之后,所述方法还包括:
根据预设衰减系数对所述源音频数据的左环绕声道的采样值和右环绕声道的采样值进行调节,其中,0<预设衰减系数<1;
将所述源音频数据在对应采样时刻的左环绕声道的采样值和右环绕声道的采样值分别更新为调节后的数据。
3.根据权利要求2所述的方法,其特征在于,所述方法还包括:
根据所述预设衰减系数计算或更新所述预设声道混合系数,公式如下:
预设声道混合系数=1/(1+预设衰减系数)。
4.根据权利要求1所述的方法,其特征在于,所述分别对源音频数据的左声道、右声道、左环绕声道和右环绕声道进行数据采样,包括:
将所述源音频数据从时域信号转换到频域信号;
根据预设采样频率分别对源音频数据的左声道、右声道、左环绕声道和右环绕声道的频域信号进行数据采样。
5.根据权利要求1-4任一项所述的方法,其特征在于,所述分别对源音频数据的左声道、右声道、左环绕声道和右环绕声道进行数据采样之前,所述方法还包括:
根据所述源音频数据的文件属性判定所述源音频数据是否为双声道立体声格式;
若所述源音频数据为双声道立体声格式,则执行所述分别对源音频数据的左声道、右声道、左环绕声道和右环绕声道进行数据采样的步骤。
6.一种声道混合处理装置,其特征在于,所述装置包括:
采样模块,用于分别对源音频数据的左声道、右声道、左环绕声道和右环绕声道进行数据采样;
混合模块,用于将同一采样时刻对应的源音频数据的左声道和左环绕声道的采样值进行叠加,源音频数据的右声道和右环绕声道的采样值进行叠加,得到各采样时刻的左声道混合音频数据和右声道混合音频数据;
调节模块,用于根据预设声道混合系数分别对所述左声道混合音频数据和右声道混合音频数据进行强度调节,得到目标音频数据的左声道音频数据和右声道音频数据,其中,0<预设声道混合系数<1。
7.根据权利要求6所述的装置,其特征在于,所述调节模块,还用于在所述采样模块分别对源音频数据的左声道、右声道、左环绕声道和右环绕声道进行数据采样之后,根据预设衰减系数对所述源音频数据的左环绕声道的采样值和右环绕声道的采样值进行调节,其中,0<预设衰减系数<1,并将所述源音频数据在对应采样时刻的左环绕声道的采样值和右环绕声道的采样值分别更新为调节后的数据。
8.根据权利要求7所述的装置,其特征在于,所述装置还包括:
计算模块,用于根据所述预设衰减系数计算或更新所述预设声道混合系数,公式如下:
预设声道混合系数=1/(1+预设衰减系数)。
9.根据权利要求6所述的装置,其特征在于,所述采样模块,包括:
信号转换单元,用于将所述源音频数据从时域信号转换到频域信号;
数据采样单元,用于根据预设采样频率分别对源音频数据的左声道、右声道、左环绕声道和右环绕声道的频域信号进行数据采样。
10.根据权利要求6-9任一项所述的装置,其特征在于,所述装置还包括:
判断模块,用于在所述采样模块分别对源音频数据的左声道、右声道、左环绕声道和右环绕声道进行数据采样之前,根据所述源音频数据的文件属性判定所述源音频数据是否为双声道立体声格式;
所述采样模块,具体用于当判断模块的判定结果为所述源音频数据为双声道立体声格式时,执行所述分别对源音频数据的左声道、右声道、左环绕声道和右环绕声道进行数据采样的操作。
CN201611122299.3A 2016-12-08 2016-12-08 一种声道混合处理方法及装置 Active CN108182947B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201611122299.3A CN108182947B (zh) 2016-12-08 2016-12-08 一种声道混合处理方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201611122299.3A CN108182947B (zh) 2016-12-08 2016-12-08 一种声道混合处理方法及装置

Publications (2)

Publication Number Publication Date
CN108182947A true CN108182947A (zh) 2018-06-19
CN108182947B CN108182947B (zh) 2020-12-15

Family

ID=62544846

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201611122299.3A Active CN108182947B (zh) 2016-12-08 2016-12-08 一种声道混合处理方法及装置

Country Status (1)

Country Link
CN (1) CN108182947B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112752199A (zh) * 2019-10-31 2021-05-04 通号通信信息集团上海有限公司 一种基于alsa框架的声卡左右声道独立控制装置及方法

Citations (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1575045A (zh) * 2003-06-02 2005-02-02 富士通天株式会社 环绕声电路、环绕声装置、音响装置、声场调整装置
US20050063551A1 (en) * 2003-09-18 2005-03-24 Yiou-Wen Cheng Multi-channel surround sound expansion method
US20060008094A1 (en) * 2004-07-06 2006-01-12 Jui-Jung Huang Wireless multi-channel audio system
US20070027682A1 (en) * 2005-07-26 2007-02-01 Bennett James D Regulation of volume of voice in conjunction with background sound
CN1942024A (zh) * 2005-09-28 2007-04-04 三星电子株式会社 音频矩阵解码的方法和装置
US20070223740A1 (en) * 2006-02-14 2007-09-27 Reams Robert W Audio spatial environment engine using a single fine structure
CN101188525A (zh) * 2007-11-27 2008-05-28 华为技术有限公司 一种语音流的处理方法及装置
CN101350197A (zh) * 2007-07-16 2009-01-21 华为技术有限公司 立体声音频编/解码方法及编/解码器
CN101695151A (zh) * 2009-10-12 2010-04-14 清华大学 多声道音频信号变换为双声道音频信号的方法和设备
CN101695150A (zh) * 2009-10-12 2010-04-14 清华大学 多声道音频编码方法、编码器、解码方法和解码器
CN101902679A (zh) * 2009-05-31 2010-12-01 比亚迪股份有限公司 立体声音频信号模拟5.1声道音频信号的处理方法
CN102005206A (zh) * 2010-11-16 2011-04-06 上海华平信息技术股份有限公司 多路音频的混音方法
CN102395097A (zh) * 2011-09-29 2012-03-28 深圳市万兴软件有限公司 一种多声道音频信号缩混方法及系统
CN102428513A (zh) * 2009-03-18 2012-04-25 三星电子株式会社 多声道信号的编码/解码装置及方法
CN102915738A (zh) * 2011-08-03 2013-02-06 三星电子株式会社 用于对多声道音频信号进行缩混的方法和设备
CN202750228U (zh) * 2012-06-29 2013-02-20 新奥特(北京)视频技术有限公司 一种环绕声到立体声变换的装置
CN103002384A (zh) * 2011-09-08 2013-03-27 比亚迪股份有限公司 四扬声器虚拟环绕声的信号处理装置及方法
CN104010264A (zh) * 2013-02-21 2014-08-27 中兴通讯股份有限公司 双声道音频信号处理的方法和装置
CN104303523A (zh) * 2012-01-26 2015-01-21 无线电广播技术研究所有限公司 将多声道音频信号转换为双声道音频信号的方法和设备
CN105593930A (zh) * 2013-07-22 2016-05-18 弗朗霍夫应用科学研究促进协会 用于增强的空间音频对象编码的装置及方法
US9363603B1 (en) * 2013-02-26 2016-06-07 Xfrm Incorporated Surround audio dialog balance assessment
CN106101819A (zh) * 2016-06-21 2016-11-09 武汉斗鱼网络科技有限公司 一种基于语音识别的直播视频敏感内容过滤方法及装置

Patent Citations (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1575045A (zh) * 2003-06-02 2005-02-02 富士通天株式会社 环绕声电路、环绕声装置、音响装置、声场调整装置
US20050063551A1 (en) * 2003-09-18 2005-03-24 Yiou-Wen Cheng Multi-channel surround sound expansion method
US20060008094A1 (en) * 2004-07-06 2006-01-12 Jui-Jung Huang Wireless multi-channel audio system
US20070027682A1 (en) * 2005-07-26 2007-02-01 Bennett James D Regulation of volume of voice in conjunction with background sound
CN1942024A (zh) * 2005-09-28 2007-04-04 三星电子株式会社 音频矩阵解码的方法和装置
US20070223740A1 (en) * 2006-02-14 2007-09-27 Reams Robert W Audio spatial environment engine using a single fine structure
CN101350197A (zh) * 2007-07-16 2009-01-21 华为技术有限公司 立体声音频编/解码方法及编/解码器
CN101188525A (zh) * 2007-11-27 2008-05-28 华为技术有限公司 一种语音流的处理方法及装置
CN102428513A (zh) * 2009-03-18 2012-04-25 三星电子株式会社 多声道信号的编码/解码装置及方法
CN101902679A (zh) * 2009-05-31 2010-12-01 比亚迪股份有限公司 立体声音频信号模拟5.1声道音频信号的处理方法
CN101695150A (zh) * 2009-10-12 2010-04-14 清华大学 多声道音频编码方法、编码器、解码方法和解码器
CN101695151A (zh) * 2009-10-12 2010-04-14 清华大学 多声道音频信号变换为双声道音频信号的方法和设备
CN102005206A (zh) * 2010-11-16 2011-04-06 上海华平信息技术股份有限公司 多路音频的混音方法
CN102915738A (zh) * 2011-08-03 2013-02-06 三星电子株式会社 用于对多声道音频信号进行缩混的方法和设备
CN103002384A (zh) * 2011-09-08 2013-03-27 比亚迪股份有限公司 四扬声器虚拟环绕声的信号处理装置及方法
CN102395097A (zh) * 2011-09-29 2012-03-28 深圳市万兴软件有限公司 一种多声道音频信号缩混方法及系统
CN104303523A (zh) * 2012-01-26 2015-01-21 无线电广播技术研究所有限公司 将多声道音频信号转换为双声道音频信号的方法和设备
CN202750228U (zh) * 2012-06-29 2013-02-20 新奥特(北京)视频技术有限公司 一种环绕声到立体声变换的装置
CN104010264A (zh) * 2013-02-21 2014-08-27 中兴通讯股份有限公司 双声道音频信号处理的方法和装置
US9363603B1 (en) * 2013-02-26 2016-06-07 Xfrm Incorporated Surround audio dialog balance assessment
CN105593930A (zh) * 2013-07-22 2016-05-18 弗朗霍夫应用科学研究促进协会 用于增强的空间音频对象编码的装置及方法
CN106101819A (zh) * 2016-06-21 2016-11-09 武汉斗鱼网络科技有限公司 一种基于语音识别的直播视频敏感内容过滤方法及装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
吴继伟: "双声道混合音频系统的设计与实现", 《电子科技》 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112752199A (zh) * 2019-10-31 2021-05-04 通号通信信息集团上海有限公司 一种基于alsa框架的声卡左右声道独立控制装置及方法
CN112752199B (zh) * 2019-10-31 2022-11-04 通号通信信息集团上海有限公司 一种基于alsa框架的声卡左右声道独立控制装置及方法

Also Published As

Publication number Publication date
CN108182947B (zh) 2020-12-15

Similar Documents

Publication Publication Date Title
CN103329571B (zh) 沉浸式音频呈现系统
KR101805110B1 (ko) 사운드 스테이지 강화를 위한 장치 및 방법
EP2939443B1 (en) System and method for variable decorrelation of audio signals
EP2856777B1 (en) Adaptive bass processing system
JP2005318598A (ja) 信号処理におけるまたはそれに関する改善
WO2015080994A1 (en) Audio signal processing
US10178491B2 (en) Apparatus and a method for manipulating an input audio signal
DE102012017296B4 (de) Erzeugung von Mehrkanalton aus Stereo-Audiosignalen
CN106572419A (zh) 一种立体声音效增强系统
CN107426651B (zh) 多通道的混音方法及装置
US11736863B2 (en) Subband spatial processing and crosstalk cancellation system for conferencing
US20170272881A1 (en) Audio signal processing apparatus and method for modifying a stereo image of a stereo signal
EP3171362B1 (en) Bass enhancement and separation of an audio signal into a harmonic and transient signal component
JP6482880B2 (ja) ミキシング装置、信号ミキシング方法、及びミキシングプログラム
US20200029155A1 (en) Crosstalk cancellation for speaker-based spatial rendering
CN108182947A (zh) 一种声道混合处理方法及装置
Romoli et al. A novel decorrelation approach for multichannel system identification
CN112567766B (zh) 信号处理装置、信号处理方法和介质
US8059824B2 (en) Joint sound synthesis and spatialization
CN106648525A (zh) 一种音频信号的自动增益控制方法和装置
US9680437B2 (en) Equalization contouring by a control curve
CN111512366B (zh) 频率响应方法和装置
US10587238B2 (en) Sound processing method
JP5915249B2 (ja) 音響処理装置および音響処理方法
CN107529113B (zh) 使用多个频带的信号处理器

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20240622

Address after: 100000 616, floor 6, 33 Suzhou street, Haidian District, Beijing

Patentee after: Baosheng (China) Technology Industry Co.,Ltd.

Country or region after: China

Address before: 430000 East Lake Development Zone, Wuhan City, Hubei Province, No. 1 Software Park East Road 4.1 Phase B1 Building 11 Building

Patentee before: WUHAN DOUYU NETWORK TECHNOLOGY Co.,Ltd.

Country or region before: China

TR01 Transfer of patent right