CN1941073B - 用于消除音频信号中的人声分量的设备和方法 - Google Patents
用于消除音频信号中的人声分量的设备和方法 Download PDFInfo
- Publication number
- CN1941073B CN1941073B CN200610159501XA CN200610159501A CN1941073B CN 1941073 B CN1941073 B CN 1941073B CN 200610159501X A CN200610159501X A CN 200610159501XA CN 200610159501 A CN200610159501 A CN 200610159501A CN 1941073 B CN1941073 B CN 1941073B
- Authority
- CN
- China
- Prior art keywords
- channel signals
- channel
- unit
- input signal
- generate
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 230000001755 vocal effect Effects 0.000 title claims abstract description 60
- 230000005236 sound signal Effects 0.000 title claims abstract description 29
- 238000000034 method Methods 0.000 title claims abstract description 25
- 238000001914 filtration Methods 0.000 claims description 23
- 230000008030 elimination Effects 0.000 claims description 17
- 238000003379 elimination reaction Methods 0.000 claims description 17
- 238000005070 sampling Methods 0.000 claims description 4
- 230000003111 delayed effect Effects 0.000 abstract 2
- 239000000203 mixture Substances 0.000 description 10
- 230000000694 effects Effects 0.000 description 4
- 238000013500 data storage Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 1
- 230000002950 deficient Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H1/00—Details of electrophonic musical instruments
- G10H1/36—Accompaniment arrangements
- G10H1/361—Recording/reproducing of accompaniment for use with an external source, e.g. karaoke systems
- G10H1/366—Recording/reproducing of accompaniment for use with an external source, e.g. karaoke systems with means for modifying or correcting the external signal, e.g. pitch correction, reverberation, changing a singer's voice
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S1/00—Two-channel systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H1/00—Details of electrophonic musical instruments
- G10H1/0091—Means for obtaining special acoustic effects
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R1/00—Details of transducers, loudspeakers or microphones
- H04R1/20—Arrangements for obtaining desired frequency or directional characteristics
- H04R1/32—Arrangements for obtaining desired frequency or directional characteristics for obtaining desired directional characteristic only
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S1/00—Two-channel systems
- H04S1/002—Non-adaptive circuits, e.g. manually adjustable or static, for enhancing the sound image or the spatial distribution
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H2210/00—Aspects or methods of musical processing having intrinsic musical character, i.e. involving musical theory or musical parameters or relying on musical knowledge, as applied in electrophonic musical tools or instruments
- G10H2210/155—Musical effects
- G10H2210/265—Acoustic effect simulation, i.e. volume, spatial, resonance or reverberation effects added to a musical sound, usually by appropriate filtering or delays
- G10H2210/295—Spatial effects, musical uses of multiple audio channels, e.g. stereo
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H2210/00—Aspects or methods of musical processing having intrinsic musical character, i.e. involving musical theory or musical parameters or relying on musical knowledge, as applied in electrophonic musical tools or instruments
- G10H2210/155—Musical effects
- G10H2210/265—Acoustic effect simulation, i.e. volume, spatial, resonance or reverberation effects added to a musical sound, usually by appropriate filtering or delays
- G10H2210/295—Spatial effects, musical uses of multiple audio channels, e.g. stereo
- G10H2210/301—Soundscape or sound field simulation, reproduction or control for musical purposes, e.g. surround or 3D sound; Granular synthesis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0208—Noise filtering
- G10L2021/02087—Noise filtering the noise being separate speech, e.g. cocktail party
Landscapes
- Physics & Mathematics (AREA)
- Engineering & Computer Science (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Otolaryngology (AREA)
- Stereophonic System (AREA)
- Reverberation, Karaoke And Other Acoustics (AREA)
Abstract
一种消除人声分量的设备和方法,包括:第一人声消除单元,用于将左和右声道输入信号的每一个延迟预定时间,并对所延迟的左和右声道信号与左和右声道输入信号进行前馈交叉混合;音场加宽单元,用于将从第一人声消除单元输出的左和右声道信号的每一个延迟预定时间,并对每个所延迟的声道信号的信号与左和右声道信号进行反馈交叉混合;和第二人声消除单元,用于对从音场加宽单元输出的左和右声道信号进行低通滤波,并对经过低通滤波的左和右低频分量与左和右声道之间的差值的高频分量进行混合,以从音频信号中消除人声分量。
Description
相关申请的交叉引用
本申请要求2005年9月26日向韩国知识产权局提交的韩国专利申请第10-2005-0089504号在35 U.S.C.119(a)下的优先权,通过引用而在这里全部合并其公开。
技术领域
本一般发明构思涉及卡拉OK系统,并更具体地,涉及卡拉OK系统中的人声消除设备和消除人声分量的方法。
背景技术
一般来说,卡拉OK系统使用伴奏,其中从例如卡式唱机、致密盘播放器或调谐器的音频装置输出音频信号,并且其中仅消除了人的人声分量。大多数人声分量存在于音频信号中的200Hz到4kHz的频带中。人声信号是音频系统中的单信号,即单声道信号。包括乐器的声音的音乐信号被分离为左声道和右声道。因此,除了单声道信号之外,输入到左声道端的音频信号和输入到右声道端的音频信号的波形彼此不同。所以,如果从输入到右声道的音频信号中减去输入到左声道的音频信号,则可生成其中消除了人声信号的音频信号。一般来说,在消除立体声音乐文件中的人声分量的方法中,获得左和右声道之间的差值以消除人声分量,因为人声分量(即歌唱者的语音)位于音频信号的中心通道。
美国专利第6690799B1号公开了与人声消除电路相关的“立体声信号处理设备”。
图1是图示了传统人声消除设备的方框图。参考图1,右声道滤波单元121和122从右声道信号Rin中提取低频信号和高频信号。左声道滤波单元111和112从左声道信号Lin中提取低频信号和高频信号。减法单元131通过从左声道信号Lin中减去右声道信号Rin,而生成人声消除信号。左加法单元113通过将来自左声道滤波单元111和112的左声道的低频信号和高频信号与来自减法单元131的人声消除信号相加,而生成左声道输出信号Lout。右加法单元123通过将来自右声道滤波单元121和122的右声道的低频信号和高频信号与来自减法单元131的人声消除信号相加,而生成右声道输出信号Rout。
因此,图1的人声消除电路将低频分量和高频分量添加到根据这两个声道信号之间的差值而获得的信号上。然而存在这样的缺陷,即应该总是相对于声源而精确地设置低通滤波器和高通滤波器的截止频率。而且,当处于人耳敏感的频带200Hz到4kHz的信号变为单声道信号时,该信号就输出与原始声音相比非常生硬的声音。
发明内容
本一般发明构思提供了一种人声消除设备和方法,其能够通过在立体声声道音频信号中利用交叉混合结构削弱人声分量,而利用普通立体声文件容易地实现卡拉OK模式。
本一般发明构思还提供了一种卡拉OK系统,其能够通过在立体声声道音频信号中利用交叉混合结构削弱人声分量,而利用普通立体声文件容易地实现卡拉OK模式。
本一般发明构思的其它方面和优点将部分地在以下的描述中阐明,部分地根据该描述而清楚,或可通过本一般发明构思的实践而得知。
本一般发明构思的以上和/或其它方面可通过提供一种消除人声分量的设备而实现,该设备包括:第一人声消除单元,用于将左和右声道输入信号的每一个延迟预定时间,并对所延迟的左和右声道输入信号与右和左声道输入信号进行前馈交叉混合;音场(sound stage)加宽单元,用于将从第一人声消除单元输出的左和右声道信号的每一个延迟预定时间,并对所延迟的左和右声道信号与右和左声道信号进行反馈交叉混合,以生成第二左和右声道信号;和第二人声消除单元,用于对从音场加宽单元输出的第二左和右声道信号进行低通滤波,并通过对具有低频分量的经过低通滤波的左和右声道信号与第二左和右声道信号之间的差值的高频分量进行混合而消除人声分量,以生成最终左和右声道信号。
本一般发明构思的以上和/或其它方面还可通过提供一种卡拉OK系统而实现,该系统包括:音频源生成单元,用于生成音频源作为左和右声道;解码器单元,用于根据预定信号格式对该音频源生成单元中生成的音频源进行解码;和人声消除单元,用于对该解码器单元中解码的左和右声道输入信号与预定延迟进行前馈交叉混合以生成左和右声道信号,对所混合的左和右声道信号与预定延迟进行反馈交叉混合以生成第二左和右声道信号,对该第二左和右声道信号进行低通滤波,并对低频分量的经过低通滤波的左和右声道信号、与第二左和右声道信号之间的差值的高频分量进行混合。
本一般发明构思的以上和/或其它方面还可通过提供一种用于消除人声分量的方法而实现,该方法包括:延迟左和右声道输入信号的一个声道信号,并通过对所延迟的左和右声道输入信号与右和左声道输入信号进行前馈交叉混合以消除人声分量,从而消除人声分量的一部分,延迟所述左和右声道信号,并通过对所延迟的左和右声道信号与右和左声道信号进行反馈交叉相加,以加宽音场,和对所输出的左和右声道信号进行低通滤波,并通过对具有低频分量的经过低通滤波的左和右声道信号与第二左和右声道信号之间的差值的高频分量进行混合,以消除人声分量的第二部分。
本一般发明构思的以上和/或其它方面还可通过提供一种计算机可读记录介质而实现,该介质包括执行方法的计算机可读代码,该方法包括:延迟左和右声道输入信号,并对所延迟的左和右声道输入信号与右和左声道输入信号进行前馈交叉混合,以从左和右声道输入信号中消除第一人声分量,从而生成左和右声道信号;延迟所述左和右声道信号,并对所延迟的左和右声道信号与右和左声道信号进行反馈交叉混合,以加宽音场,从而生成第二左和右声道信号;和对所述第二左和右声道信号进行低通滤波,并对低频分量的经过低通滤波的第二左和右声道信号与第二左和右声道之间的差值的高频分量进行混合,以消除人声分量,从而生成最终左和右声道信号。
本一般发明构思的以上和/或其它方面还可通过提供一种从音频信号中消除人声分量的设备而实现,包括:第一人声消除单元,用于对左和右声道输入信号进行延迟或增益控制,将经过延迟或增益控制的左和右声道输入信号分别与右和左声道输入信号相加,以生成左和右声道信号;和第二人声消除单元,用于从左和右声道信号获得低频分量,从左和右声道信号的差值中获得高频分量,将该高频分量与左和右声道信号的每个低频分量相加,以生成最终左和右声道信号。
本一般发明构思的以上和/或其它方面还可通过提供一种从音频信号中消除人声分量的设备而实现,该设备包括:音场加宽单元,用于对左和右声道信号进行延迟或增益控制,将经过延迟或增益控制的左和右声道信号与右和左声道信号相加,以生成第二左和右声道信号;和人声消除单元,用于从第二左和右声道信号获得低频分量,从第二左和右声道信号之间的差值中获得高频分量,将该高频分量与第二左和右声道信号的每个低频分量相加,以生成最终左和右声道信号。
本一般发明构思的以上和/或其它方面还可通过提供一种从音频信号中消除人声分量的设备而实现,该设备包括:第一人声消除单元,用于从左和右声道输入信号中消除第一人声分量,以生成左和右声道信号;音场加宽单元,用于加宽左和右声道信号的音场,以生成第二左和右声道信号;和第二人声消除单元,用于从第二左和右声道信号中消除第二人声分量,以生成音频信号的最终左和右声道信号。
附图说明
通过结合附图对实施例的以下描述,本一般发明构思的这些和/或其它方面和优点将变得明显并且将更易于理解,其中:
图1是图示了传统人声消除设备的方框图;
图2是图示了根据本一般发明构思的实施例的具有人声消除设备的整个卡拉OK系统的方框图;
图3是图示了根据本一般发明构思的实施例的人声消除设备的方框图;和
图4是图示了图3的人声消除设备的详图。
具体实施方式
现在将详细参考在附图中图示了其示例的本一般发明构思的实施例,其中相同的附图标记始终表示相同的元件。下面通过参考附图来描述这些实施例,以便解释本一般发明构思。
图2是图示了根据本一般发明构思的实施例的具有人声消除设备的整个卡拉OK系统的方框图。
参考图2,音频源生成单元210可以是音频再现设备,例如卡式唱机、致密盘播放器或调谐器。音频源生成单元210输出具有2个声道(例如左和右声道)的音频源信号。
解码器单元220根据例如MP3格式的信号格式对音频源生成单元210中生成的左和右声道音频源信号进行解码,并输出信号作为脉码调制(PCM)数据。
人声消除单元230通过具有增益和延迟的前馈交叉混合结构而消除在解码器单元220中解码的左和右声道输入信号的第一人声分量,加宽通过反馈交叉混合结构消除其第一人声分量的信号的立体声音场,对加宽的左和右声道信号进行低通滤波,并通过混合经过低通滤波的左和右声道的低频分量以及左和右声道之间的差值的高频分量而消除第二人声分量。
音调缩放单元240调整在人声消除单元230中消除了其人声分量的音频信号的音调。
加法单元250将通过麦克风270和模数变换器(ADC)单元280输入的语音信号和从音调缩放单元240输出的音频信号相加,以生成数字音频信号。
数模变换器(DAC)单元260将从加法单元250输出的数字音频信号变换为具有两个声道(例如左和右声道)的模拟音频信号。
左扬声器292和右扬声器294分别再现从DAC单元260输出的左和右声道模拟音频信号。
图3是图示了根据本一般发明构思的实施例的人声消除设备的方框图。
参考图3,该人声消除设备包括第一人声消除单元310、音场加宽单元320、和第二人声消除单元330。
第一人声消除单元310具有前馈交叉混合结构,该结构具有短长度的延迟值(Z-n)、和增益值(G0)。第一人声消除单元310将左和右声道输入信号的每一个延迟一段短时间,并对每一延迟声道的信号与另一声道的输入信号进行前馈交叉混合,以消除第一人声分量,并因此生成左和右声道信号。
音场加宽单元320具有反馈交叉混合结构,该结构具有适当的长度的第二延迟值(Z-n)、和第二增益值(G1)。音场加宽单元320将从第一人声消除单元310输出的左和右声道信号的每一个延迟一段适当的时间,并对每一延迟声道的信号与另一声道的输入信号进行反馈交叉混合,以加宽左和右声道信号的音场。
第一人声消除单元310和音场加宽单元320降低了低频分量,并提高了高频分量。因此,由于高频分量(例如3kHz)的增加增加了人声分量的清晰度,所以应该通过低通滤波器限制大于或等于预定频率的频率分量。而且,由于经过低通滤波的左和右声道信号降低了声音的真实性和立体声加宽效果,所以根据左和右声道信号之间的差值获得的信号的高频分量被添加到经过低通滤波的左和右声道信号上。也就是说,第二人声消除单元330对从音场加宽单元320输出的左和右声道信号进行低通滤波,并混合经过低通滤波的左和右声道的低频分量以及左和右声道信号之间的差值的高频分量。
图4是图示了图3的人声消除设备的详图。
参考图3和4,现将解释第一人声消除单元310。
为了调整语音频带的增益降低,第一和第二增益调整器411和413分别调整输入到左和右声道L和K的信号的增益。第一和第二增益调整器411和413具有预定增益值(G0)。
为了留下在语音频带中包括的低频分量和高频分量,第一和第二延迟单元412和414将其增益在第一和第二增益调整器411和413中得到调整的左和右声道输入信号延迟预定时间。第一和第二延迟单元412和414可具有左和右声道输入信号的1到2个采样时间的短延迟值(Z-n)。
第一左减法器416从左声道输入信号中减去经过增益调整和延迟的右声道输入信号。第一右减法器418从右声道输入信号中减去经过增益调整和延迟的左声道输入信号。
因此,第一人声消除单元310消除其相对于时间具有声道之间的高相似度的分量。第一人声消除单元310通过利用具有短延迟的交叉混合技术获得两个声道之间的差值,而仅消除固定分量(即人声分量)。因此,在第一左减法器416和第一右减法器418中不消除不固定(或非等同特性)分量,从而可加宽音场。
现在将解释音场加宽单元320。
第三和第四增益调整器421和422调整输入到左和右声道的信号的增益。
第三和第四增益调整器421和423具有第二预定增益值(G1)。
第三和第四延迟单元422和423将其增益在在第三和第四增益调整器421和423中得到调整的左和右声道输入信号延迟预定时间。第三和第四延迟单元422和423可具有比第一人声消除单元310的延迟单元412和414的延迟值长的延迟值(Z-m)。
第二左加法器426将左声道信号和经过增益调整和延迟的右声道信号相加。第二右加法器428将右声道输入信号和经过增益调整和延迟的左声道信号相加。
因此,通过用适当的延迟交叉混合这两个声道信号,音场加宽单元320稍稍加宽了在第一人声消除单元310中变窄的音场。该延迟值(Z-m)可比第一人声消除单元310中的延迟值长,从而可获得足够的音场。
现在将解释第二人声消除单元330。
左和右减法器430通过执行从音场加宽单元320输出的左声道信号和右声道信号的相减,而消除人声分量。
高通滤波器432使得从左和右减法器430输出的信号的高频分量通过。
左低通滤波器431使得低频分量通过,以便限制从音场加宽单元320输出的左声道信号的高频分量。因此,左低通滤波器431可通过降低由高频分量引起的清晰度,而消除充分的人声分量。
右低通滤波器433使得低频分量通过,以便限制从音场加宽单元320输出的右声道信号的高频分量。因此,右低通滤波器431可通过降低由高频分量引起的清晰度,而消除充分的人声分量。
第五、第六和第七增益调整器434、435和436调整分别从左低通滤波器431、高通滤波器432、和右低通滤波器433输出的信号的增益。第五、第六和第七增益调整器434、435和436具有相应的预定增益值(G2、G3、G2)。
为了增加声音的真实性和宽立体声效果,第三左加法器437将低频带的从第五增益调整器434输出的信号与高频带的从第六增益调整器435输出的信号相加,并输出最终左声道信号(L’)。
为了增加声音的真实性和宽立体声效果,第三右加法器437将低频带的从第七增益调整器436输出的信号与高频带的从第六增益调整器435输出的信号相加,并输出最终右声道信号(R’)。
因此,第三左加法器437和第三右加法器438通过将经过低通滤波的信号与两个声道之间的差值的频率分量混合,而增加声音的真实性和宽立体声效果。
本一般发明构思也可被实施为计算机可读记录介质上的计算机可读代码。计算机可读记录介质是可存储可稍后由计算机系统读取的数据的任何数据存储装置。计算机可读记录介质的例子包括只读存储器(ROM)、随机存取存储器(RAM)、CD-ROM、磁带、软盘、光学数据存储装置、和载波(例如通过因特网的数据传输)。计算机可读记录介质也可通过网络耦接的计算机系统分发,从而以分布的方式存储和运行该计算机可读代码。
根据本一般发明构思,该人声消除设备可包括第一人声消除单元和第二人声消除单元,该第一人声消除单元对左和右声道输入信号进行延迟或增益控制,将经过延迟或增益控制的左和右声道输入信号分别与右和左声道输入信号相加,以生成左和右声道信号,该第二人声消除单元从左和右声道信号获得低频分量,从左和右声道信号的差值中获得高频分量,将该高频分量与左和右声道信号的每个低频分量相加,以生成其中已去除了左和右声道输入信号的人声分量的最终左和右声道信号。
该人声消除设备可包括音场加宽单元和第二人声消除单元,该音场加宽单元对左和右声道信号进行延迟或增益控制,将经过延迟或增益控制的左和右声道输入信号与右和左声道信号相加,以生成第二左和右声道信号,该第二人声消除单元从第二左和右声道信号获得低频分量,从第二左和右声道信号的差值中获得高频分量,将该高频分量与第二左和右声道信号的每个低频分量相加,以生成其中已去除了左和右声道输入信号的人声分量的最终左和右声道信号。
尽管本实施例图示了两个声道输入信号和两个最终声道信号,但是本一般发明构思不限于此。可能在例如卡拉OK系统的音频系统的人声消除设备中利用两个或更多声道输入信号,而生成三个或更多最终声道信号
尽管已示出和描述了本一般发明构思的几个实施例,但是本领域普通技术人员应该理解,在不脱离由所附权利要求及其等效限定其范围的本一般发明构思的原理和精神的情况下,可对这些实施例进行改变。
Claims (17)
1.一种从音频信号中消除人声分量的设备,包括:
第一人声消除单元,用于将左和右声道输入信号的每一个延迟预定时间,并对所延迟的左和右声道输入信号与右和左声道输入信号进行前馈交叉混合,以生成左和右声道信号;
音场加宽单元,用于将从第一人声消除单元输出的左和右声道信号的每一个延迟预定时间,并对所延迟的左和右声道信号与右和左声道信号进行反馈交叉混合,以生成第二左和右声道信号;和
第二人声消除单元,用于对从音场加宽单元输出的第二左和右声道信号进行低通滤波,并对低频分量的经过低通滤波的左和右声道信号与第二左和右声道信号之间的差值的高频分量进行混合,而消除第二人声分量,以生成最终左和右声道信号。
2.根据权利要求1的设备,其中该第一人声消除单元包括:
第一左和右增益调整单元,用于调整左和右声道输入信号的增益;
第一左和右信号延迟单元,用于将在所述第一左和右增益调整单元中调整的经过增益调整的左和右声道输入信号延迟预定时间;
第一左减法单元,用于从左声道输入信号中减去在第一右延迟单元中延迟的经过延迟的右声道输入信号,以消除左声道的人声分量;和
第一右减法单元,用于从右声道输入信号中减去在第一左延迟单元中延迟的经过延迟的左声道输入信号,以消除右声道的人声分量。
3.根据权利要求2的设备,其中所述第一左和右信号延迟单元将输入信号延迟所述左和右声道输入信号的预定采样周期。
4.根据权利要求1的设备,其中该音场加宽单元包括:
第二左和右增益调整单元,用于调整所述左和右声道信号的增益;
第二左和右信号延迟单元,用于延迟在所述第二左和右增益调整单元中调整的经过增益调整的左和右声道信号;
第二左加法单元,用于将左声道信号与通过第二左信号延迟单元反馈延迟的经过延迟的右声道信号相加,以加宽左声道信号的音场;和
第二右加法单元,用于将右声道信号与通过第二右信号延迟单元反馈延迟的经过延迟的左声道信号相加,以加宽右声道信号的音场。
5.根据权利要求1的设备,其中该第二人声消除单元包括:
信号减法单元,用于从第二右声道信号中减去第二左声道信号;
左低通滤波器,用于使得第二左声道信号的低频分量通过;
右低通滤波器,用于使得第二右声道信号的低频分量通过;
高通滤波器,用于使得从信号减法单元输出的信号的高频分量通过;
第三左加法单元,用于将从左低通滤波器和高通滤波器输出的信号相加;和
第三右加法单元,用于将从右低通滤波器和高通滤波器输出的信号相加。
6.一种用于从音频信号中消除人声分量的方法,该方法包括:
延迟左和右声道输入信号,并对所延迟的左和右声道输入信号与右和左声道输入信号进行前馈交叉混合,以从左和右声道输入信号中消除第一人声分量,从而生成左和右声道信号;
延迟所述左和右声道信号,并对所延迟的左和右声道信号与右和左声道信号进行反馈交叉混合,以加宽音场,从而生成第二左和右声道信号;和
对所述第二左和右声道信号进行低通滤波,并对低频分量的经过低通滤波的第二左和右声道信号与第二左和右声道信号之间的差值的高频分量进行混合,以消除人声分量,从而生成最终左和右声道信号。
7.根据权利要求6的方法,其中消除第一人声分量的步骤包括:
通过执行左声道输入信号和延迟了预定采样周期的经过延迟的右声道输入信号的相减,而消除左声道输入信号的第一人声分量;和
通过执行右声道输入信号和延迟了预定采样周期的经过延迟的左声道输入信号的相减,而消除右声道输入信号的第一人声分量。
8.根据权利要求6的方法,其中加宽音场的步骤包括:
通过将左声道信号和经过反馈延迟的右声道信号相加,而加宽左声道的音场;和
通过将右声道信号和经过反馈延迟的左声道信号相加,而加宽右声道信号的音场。
9.根据权利要求6的方法,其中消除第二人声分量的步骤包括:
从第二右声道信号中减去第二左声道信号,以生成相减后的信号;
使得相减后的信号的高频分量通过;
将经过低通滤波的第二左声道与该高频分量相加,以输出其中消除了第二人声分量的最终左声道信号;和
将经过低通滤波的第二右声道与该高频分量相加,以输出其中消除了第二人声分量的最终右声道信号。
10.一种用于从音频信号中消除人声分量的卡拉OK系统,包括:
音频源生成单元,用于生成音频源作为左和右声道;
解码器单元,用于根据预定信号格式对该音频源生成单元中生成的音频源进行解码,以生成左和右声道输入信号;和
人声消除单元,用于以预定延迟对该解码器单元中解码的左和右声道输入信号进行前馈交叉混合,以生成左和右声道信号,以预定延迟对该左和右声道信号进行反馈交叉混合,以生成第二左和右声道信号,对该第二左和右声道信号进行低通滤波,并对低频分量的经过低通滤波的第二左和右声道信号与第二左和右声道信号之间的差值的高频分量进行混合,以生成最终左和右声道信号。
11.一种从音频信号中消除人声分量的设备,包括:
第一人声消除单元,用于对左和右声道输入信号进行延迟或增益控制,将经过延迟或增益控制的左和右声道输入信号分别与右和左声道输入信号相加,以生成左和右声道信号;
音场加宽单元,用于对左和右声道信号进行延迟或增益控制,将经过延迟或增益控制的左和右声道信号与右和左声道信号相加,以生成第二左和右声道信号;以及
第二人声消除单元,用于从第二左和右声道信号获得低频分量,从第二左和右声道信号之间的差值中获得高频分量,将该高频分量与第二左和右声道信号的每个低频分量相加,以生成最终左和右声道信号。
12.根据权利要求11的设备,其中该音场加宽单元对第二左和右声道信号进行延迟或增益控制,以获得经过延迟或增益控制的左和右声道信号。
13.根据权利要求11的设备,该音场加宽单元包括:
第三延迟器和第三增益控制器中的至少一个,用于对第二左声道信号进行延迟或增益控制,以生成经过延迟或增益控制的左声道信号;
第四延迟器和第四增益控制器中的至少一个,用于对第二右声道信号进行延迟或增益控制,以生成经过延迟或增益控制的右声道信号;
左加法器,用于将左声道信号与经过延迟或增益控制的右声道信号相加,以生成第二左声道信号;和
右加法器,用于将右声道信号与经过延迟或增益控制的左声道信号相加,以生成第二右声道信号。
14.根据权利要求11的设备,其中该第一人声消除单元包括:
第一延迟器和第一增益控制器中的至少一个,用于对左声道输入信号进行延迟或增益控制;
第二延迟器和第二增益控制器中的至少一个,用于对右声道输入信号进行延迟或增益控制;
第一加法器,用于将经过延迟或增益控制的右声道信号与左声道输入信号相加,以生成左声道信号;和
第二加法器,用于将经过延迟或增益控制的左声道信号与右声道信号相加,以生成右声道信号。
15.一种从音频信号中消除人声分量的设备,包括:
人声消除单元,用于从音频信号的左和右声道输入信号中消除人声分量,以生成左和右声道信号;
音场加宽单元,用于对所述左和右声道信号进行延迟或增益控制,将经过延迟或增益控制的左和右声道信号与右和左声道信号相加,以生成第二左和右声道信号;和
另一人声消除单元,用于从第二左和右声道信号获得低频分量,从第二左和右声道信号之间的差值中获得高频分量,将该高频分量与第二左和右声道信号的每个低频分量相加,以生成最终左和右声道信号。
16.根据权利要求15的设备,其中该音场加宽单元对所述第二左和右声道信号进行延迟或增益控制,以生成经过延迟或增益控制的左和右声道信号。
17.一种从音频信号中消除人声分量的设备,包括:
第一人声消除单元,用于从左和右声道输入信号中消除第一人声分量,以生成左和右声道信号;
音场加宽单元,用于加宽左和右声道信号的音场,以生成第二左和右声道信号;和
第二人声消除单元,用于从第二左和右声道信号中消除第二人声分量,以生成音频信号的最终左和右声道信号,
其中:
该第一人声消除单元对所述左和右声道输入信号进行前馈混合,以生成左和右声道信号;和
该音场加宽单元对所述左和右声道信号进行反馈混合,以生成第二左和右声道信号。
Applications Claiming Priority (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR89504/05 | 2005-09-26 | ||
KR1020050089504A KR100636248B1 (ko) | 2005-09-26 | 2005-09-26 | 보컬 제거 장치 및 방법 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1941073A CN1941073A (zh) | 2007-04-04 |
CN1941073B true CN1941073B (zh) | 2010-10-13 |
Family
ID=37621474
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN200610159501XA Expired - Fee Related CN1941073B (zh) | 2005-09-26 | 2006-09-25 | 用于消除音频信号中的人声分量的设备和方法 |
Country Status (4)
Country | Link |
---|---|
US (1) | US8036389B2 (zh) |
KR (1) | KR100636248B1 (zh) |
CN (1) | CN1941073B (zh) |
NL (1) | NL1032500C2 (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108781331A (zh) * | 2016-01-19 | 2018-11-09 | 云加速360公司 | 用于头戴式扬声器的音频增强 |
US10721564B2 (en) | 2016-01-18 | 2020-07-21 | Boomcloud 360, Inc. | Subband spatial and crosstalk cancellation for audio reporoduction |
US10764704B2 (en) | 2018-03-22 | 2020-09-01 | Boomcloud 360, Inc. | Multi-channel subband spatial processing for loudspeakers |
US10841728B1 (en) | 2019-10-10 | 2020-11-17 | Boomcloud 360, Inc. | Multi-channel crosstalk processing |
Families Citing this family (25)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TWI351683B (en) | 2008-01-16 | 2011-11-01 | Mstar Semiconductor Inc | Speech enhancement device and method for the same |
CN101221767B (zh) * | 2008-01-23 | 2012-05-30 | 晨星半导体股份有限公司 | 人声语音加强装置与应用于其上的方法 |
CN101577117B (zh) * | 2009-03-12 | 2012-04-11 | 无锡中星微电子有限公司 | 伴奏音乐提取方法及装置 |
CN101609667B (zh) * | 2009-07-22 | 2012-09-05 | 福州瑞芯微电子有限公司 | Pmp播放器中实现卡拉ok功能的方法 |
KR101591704B1 (ko) * | 2009-12-04 | 2016-02-04 | 삼성전자주식회사 | 스테레오 신호로부터 보컬 신호를 제거하는 방법 및 장치 |
CN102103853B (zh) * | 2009-12-18 | 2014-02-12 | 康佳集团股份有限公司 | 一种消弱歌曲中人声的方法 |
JP5957446B2 (ja) * | 2010-06-02 | 2016-07-27 | コーニンクレッカ フィリップス エヌ ヴェKoninklijke Philips N.V. | 音響処理システム及び方法 |
JP5899865B2 (ja) * | 2011-11-22 | 2016-04-06 | ヤマハ株式会社 | 音響信号加工装置及びプログラム |
CN102568454B (zh) * | 2011-12-13 | 2015-08-05 | 北京百度网讯科技有限公司 | 一种分析音乐bpm的方法和装置 |
US9071900B2 (en) | 2012-08-20 | 2015-06-30 | Nokia Technologies Oy | Multi-channel recording |
CN103915086A (zh) * | 2013-01-07 | 2014-07-09 | 华为技术有限公司 | 信息处理的方法、装置和系统 |
CN105991102A (zh) * | 2015-02-11 | 2016-10-05 | 冠捷投资有限公司 | 具有语音增强功能的媒体播放装置 |
CN106162417A (zh) * | 2015-04-15 | 2016-11-23 | 徐文波 | 音频设备 |
WO2017056781A1 (ja) * | 2015-09-30 | 2017-04-06 | ソニー株式会社 | 信号処理装置、信号処理方法、及びプログラム |
CN107197405B (zh) * | 2017-06-28 | 2019-12-13 | 成都共同进步信息技术有限公司 | 数字电路对模拟音频电路干扰的解决方法 |
US10542153B2 (en) | 2017-08-03 | 2020-01-21 | Bose Corporation | Multi-channel residual echo suppression |
US10200540B1 (en) * | 2017-08-03 | 2019-02-05 | Bose Corporation | Efficient reutilization of acoustic echo canceler channels |
US10594869B2 (en) | 2017-08-03 | 2020-03-17 | Bose Corporation | Mitigating impact of double talk for residual echo suppressors |
WO2019070722A1 (en) | 2017-10-03 | 2019-04-11 | Bose Corporation | SPACE DIAGRAM DETECTOR |
CN108389568B (zh) * | 2018-05-07 | 2023-11-10 | 深圳乐华高科实业有限公司 | 一种自动消人声的卡拉ok系统 |
CN108711415B (zh) * | 2018-06-11 | 2021-10-08 | 广州酷狗计算机科技有限公司 | 纠正伴奏和干音之间的时延的方法、装置及存储介质 |
JP7243052B2 (ja) * | 2018-06-25 | 2023-03-22 | カシオ計算機株式会社 | オーディオ抽出装置、オーディオ再生装置、オーディオ抽出方法、オーディオ再生方法、機械学習方法及びプログラム |
US10964305B2 (en) | 2019-05-20 | 2021-03-30 | Bose Corporation | Mitigating impact of double talk for residual echo suppressors |
CN111261175A (zh) * | 2020-01-17 | 2020-06-09 | 北京塞宾科技有限公司 | 一种蓝牙音频信号传输方法和装置 |
CN113099373B (zh) * | 2021-03-29 | 2022-09-23 | 腾讯音乐娱乐科技(深圳)有限公司 | 声场宽度扩展的方法、装置、终端及存储介质 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4139728A (en) * | 1976-04-13 | 1979-02-13 | Victor Company Of Japan, Ltd. | Signal processing circuit |
US5701344A (en) * | 1995-08-23 | 1997-12-23 | Canon Kabushiki Kaisha | Audio processing apparatus |
CN1592499A (zh) * | 2003-09-01 | 2005-03-09 | 扬智科技股份有限公司 | 立体声之人声消除方法及相关装置 |
Family Cites Families (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH0321200A (ja) | 1989-06-19 | 1991-01-29 | Pioneer Electron Corp | ボイスキャンセル回路 |
JPH05191894A (ja) * | 1992-01-16 | 1993-07-30 | Fujitsu Ten Ltd | 残響付加装置 |
JPH07311585A (ja) | 1994-05-17 | 1995-11-28 | Sony Corp | ボーカルキャンセル回路 |
KR100194658B1 (ko) | 1995-08-23 | 1999-06-15 | 윤종용 | 음성 제거 장치 |
JP3560087B2 (ja) | 1995-09-13 | 2004-09-02 | 株式会社デノン | 音信号処理装置およびサラウンド再生方法 |
US6449368B1 (en) * | 1997-03-14 | 2002-09-10 | Dolby Laboratories Licensing Corporation | Multidirectional audio decoding |
JPH11161266A (ja) * | 1997-11-25 | 1999-06-18 | Kawai Musical Instr Mfg Co Ltd | 楽音補正装置及び楽音補正方法 |
JP3381219B2 (ja) * | 1999-06-09 | 2003-02-24 | 日本マランツ株式会社 | ステレオ信号処理装置 |
JP3381062B2 (ja) | 1999-06-22 | 2003-02-24 | 日本マランツ株式会社 | ステレオ信号処理装置 |
JP4371621B2 (ja) * | 2001-03-22 | 2009-11-25 | 新日本無線株式会社 | サラウンド再生回路 |
JP3925274B2 (ja) * | 2002-03-29 | 2007-06-06 | ソニー株式会社 | 収音装置及びステレオ演算方法 |
JP2004336609A (ja) | 2003-05-12 | 2004-11-25 | Sanyo Electric Co Ltd | ステレオ化処理回路 |
TWI231722B (en) * | 2003-08-21 | 2005-04-21 | Mediatek Inc | Method and related apparatus for generating stereo output of vocal cancellation |
JP4509686B2 (ja) * | 2004-07-29 | 2010-07-21 | 新日本無線株式会社 | 音響信号処理方法および装置 |
-
2005
- 2005-09-26 KR KR1020050089504A patent/KR100636248B1/ko not_active IP Right Cessation
-
2006
- 2006-08-08 US US11/500,295 patent/US8036389B2/en not_active Expired - Fee Related
- 2006-09-14 NL NL1032500A patent/NL1032500C2/nl not_active IP Right Cessation
- 2006-09-25 CN CN200610159501XA patent/CN1941073B/zh not_active Expired - Fee Related
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4139728A (en) * | 1976-04-13 | 1979-02-13 | Victor Company Of Japan, Ltd. | Signal processing circuit |
US5701344A (en) * | 1995-08-23 | 1997-12-23 | Canon Kabushiki Kaisha | Audio processing apparatus |
CN1592499A (zh) * | 2003-09-01 | 2005-03-09 | 扬智科技股份有限公司 | 立体声之人声消除方法及相关装置 |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10721564B2 (en) | 2016-01-18 | 2020-07-21 | Boomcloud 360, Inc. | Subband spatial and crosstalk cancellation for audio reporoduction |
CN108781331A (zh) * | 2016-01-19 | 2018-11-09 | 云加速360公司 | 用于头戴式扬声器的音频增强 |
CN108781331B (zh) * | 2016-01-19 | 2020-11-06 | 云加速360公司 | 用于头戴式扬声器的音频增强 |
US10764704B2 (en) | 2018-03-22 | 2020-09-01 | Boomcloud 360, Inc. | Multi-channel subband spatial processing for loudspeakers |
US10841728B1 (en) | 2019-10-10 | 2020-11-17 | Boomcloud 360, Inc. | Multi-channel crosstalk processing |
US11284213B2 (en) | 2019-10-10 | 2022-03-22 | Boomcloud 360 Inc. | Multi-channel crosstalk processing |
Also Published As
Publication number | Publication date |
---|---|
US20070076891A1 (en) | 2007-04-05 |
CN1941073A (zh) | 2007-04-04 |
US8036389B2 (en) | 2011-10-11 |
NL1032500C2 (nl) | 2008-07-08 |
KR100636248B1 (ko) | 2006-10-19 |
NL1032500A1 (nl) | 2007-03-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1941073B (zh) | 用于消除音频信号中的人声分量的设备和方法 | |
CN101366177B (zh) | 音频供给量控制 | |
TWI489887B (zh) | 用於喇叭或耳機播放之虛擬音訊處理技術 | |
CN100381016C (zh) | 信号处理装置、信号处理方法 | |
CN101609667B (zh) | Pmp播放器中实现卡拉ok功能的方法 | |
CN1151077A (zh) | 音频信号再现方法及其装置 | |
US5241604A (en) | Sound effect apparatus | |
CN103262573B (zh) | 声音再生装置、再生音调整方法、音响特性调整装置、音响特性调整方法及计算机程序 | |
JP3351905B2 (ja) | 音声信号処理装置 | |
CN1321545C (zh) | 环场音效耳机输出信号生成装置 | |
JP5055967B2 (ja) | オーディオ再生装置 | |
JPH11113097A (ja) | オーディオ装置 | |
JP2007006432A (ja) | バイノーラル再生装置 | |
US20090116653A1 (en) | Audio signal processing device, audio signal processing method, program thereof, and recording meduim containing the program | |
JP4435452B2 (ja) | 信号処理装置、信号処理方法、プログラムおよび記録媒体 | |
US8195317B2 (en) | Data reproduction apparatus and data reproduction method | |
JP2506570Y2 (ja) | ディジタルオ―ディオ信号処理装置 | |
Bhalani et al. | Karaoke Machine implementation and validation using Out of Phase Stereo method | |
JP2000308200A (ja) | 音響信号処理回路及び増幅装置 | |
KR100691534B1 (ko) | 다채널 앰프를 갖는 노래반주기 | |
CN118413767A (zh) | 一种多通道的听湿录干系统及音箱设备 | |
KR101118466B1 (ko) | Vcd 모노 음악의 스테레오 변환 장치 및 그 방법 | |
JPH03219799A (ja) | 音響効果装置 | |
RU2384973C1 (ru) | Устройство и способ синтезирования трех выходных каналов, используя два входных канала | |
JP2006174078A (ja) | オーディオ信号処理方法及び装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20101013 Termination date: 20150925 |
|
EXPY | Termination of patent right or utility model |