CN1573920A - 使用独立分量分析算法分离音乐与语音的装置与方法 - Google Patents
使用独立分量分析算法分离音乐与语音的装置与方法 Download PDFInfo
- Publication number
- CN1573920A CN1573920A CNA2004100465518A CN200410046551A CN1573920A CN 1573920 A CN1573920 A CN 1573920A CN A2004100465518 A CNA2004100465518 A CN A2004100465518A CN 200410046551 A CN200410046551 A CN 200410046551A CN 1573920 A CN1573920 A CN 1573920A
- Authority
- CN
- China
- Prior art keywords
- signal
- current
- coefficient
- system number
- sound channel
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 45
- 238000012880 independent component analysis Methods 0.000 title claims abstract description 43
- 229910002059 quaternary alloy Inorganic materials 0.000 claims description 34
- 238000001914 filtration Methods 0.000 claims description 26
- 239000011159 matrix material Substances 0.000 claims description 21
- 238000000926 separation method Methods 0.000 claims description 3
- 102000015925 Proto-oncogene Mas Human genes 0.000 description 12
- 108050004181 Proto-oncogene Mas Proteins 0.000 description 12
- XMXLVNVGGJBUPF-UHFFFAOYSA-N 2-amino-n,n-diethyl-1,3-benzothiazole-6-carboxamide Chemical compound CCN(CC)C(=O)C1=CC=C2N=C(N)SC2=C1 XMXLVNVGGJBUPF-UHFFFAOYSA-N 0.000 description 11
- 101000577080 Homo sapiens Mitochondrial-processing peptidase subunit alpha Proteins 0.000 description 11
- 102100025321 Mitochondrial-processing peptidase subunit alpha Human genes 0.000 description 11
- 238000007792 addition Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000017105 transposition Effects 0.000 description 2
- 101100289989 Drosophila melanogaster alpha-Man-Ia gene Proteins 0.000 description 1
- 101150021286 MAS1 gene Proteins 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000008030 elimination Effects 0.000 description 1
- 238000003379 elimination reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B31/00—Arrangements for the associated working of recording or reproducing apparatus with related apparatus
- G11B31/02—Arrangements for the associated working of recording or reproducing apparatus with related apparatus with automatic musical instruments
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0272—Voice signal separating
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H1/00—Details of electrophonic musical instruments
- G10H1/02—Means for controlling the tone frequencies, e.g. attack or decay; Means for producing special musical effects, e.g. vibratos or glissandos
- G10H1/06—Circuits for establishing the harmonic content of tones, or other arrangements for changing the tone colour
- G10H1/12—Circuits for establishing the harmonic content of tones, or other arrangements for changing the tone colour by filtering complex waveforms
- G10H1/125—Circuits for establishing the harmonic content of tones, or other arrangements for changing the tone colour by filtering complex waveforms using a digital filter
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H1/00—Details of electrophonic musical instruments
- G10H1/36—Accompaniment arrangements
- G10H1/361—Recording/reproducing of accompaniment for use with an external source, e.g. karaoke systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H2210/00—Aspects or methods of musical processing having intrinsic musical character, i.e. involving musical theory or musical parameters or relying on musical knowledge, as applied in electrophonic musical tools or instruments
- G10H2210/031—Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal
- G10H2210/046—Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal for differentiation between music and non-music signals, based on the identification of musical parameters, e.g. based on tempo detection
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H2210/00—Aspects or methods of musical processing having intrinsic musical character, i.e. involving musical theory or musical parameters or relying on musical knowledge, as applied in electrophonic musical tools or instruments
- G10H2210/031—Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal
- G10H2210/056—Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal for extraction or identification of individual instrumental parts, e.g. melody, chords, bass; Identification or separation of instrumental parts by their characteristic voices or timbres
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Quality & Reliability (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Stereophonic System (AREA)
- Reverberation, Karaoke And Other Acoustics (AREA)
- Signal Processing For Digital Recording And Reproducing (AREA)
- Signal Processing Not Specific To The Method Of Recording And Reproducing (AREA)
Abstract
提供了一种使用对于二维前向网络的独立分量分析方法的分离音乐与语音的装置与方法。该分离音乐与语音的装置通过使用所述独立分量分析方法可以在较短的收敛时间内从混合信号中分离语音信号与音乐信号,其中每个信号都可以被独立地录制,所述独立分量分析方法根据传感器录制位置的差异来估计信号混合处理。由此,用户可以容易地从其自己的密致盘(CD)、数字视频盘(DVD)、或音频磁带、或FM无线电中选择伴奏,并且实时地聆听质量被改进的音乐。相应地,用户可以只是倾听音乐伴奏或者与之一起唱。另外,该方法在数字信号处理器(DSP)芯片、微处理器等等之中易于实现。
Description
技术领域
本发明涉及一种歌曲伴奏装置与方法,更具体地,涉及一种从音乐与语音信号的混合信号中消除语音信号的歌曲伴奏装置与方法。
背景技术
具有卡拉OK功能的歌曲伴奏装置被广泛应用于歌唱和/或娱乐。歌曲伴奏装置一般输出(例如演奏)人们可以随之一起唱的歌曲伴奏。可替换地,人们可以只欣赏音乐而不一起唱。此处所使用的名词“歌曲伴奏”指没有语音伴随的音乐。在此类歌曲伴奏装置中,一般使用存储器来存储用户所选择的歌曲伴奏。因此,对于给定的歌曲伴奏装置,歌曲伴奏的数目可能受限于该存储器的容量。另外,此类歌曲伴奏装置一般较昂贵。
对于只输出歌曲伴奏的密致盘(CD)播放器、数字视频盘(DVD)播放器、以及磁带播放器可以容易地实现卡拉OK功能。类似地,如果从FM音频广播输出消除了语音从而只有歌曲伴奏输出,则也可以容易地实现卡拉OK功能。用户可以播放其所喜爱的无线电台。
从CD播放器、DVD播放器、磁带播放器、以及FM无线电输出的声学信号包含音乐与语音信号的混合信号。用来从该混合信号中消除语音信号的技术还远未完善。从混合信号中消除语音信号的一般方法包括将声学信号转换到频域,并去除语音信号所在的特定频带。到频域的转换一般使用快速傅立叶(FFT)或者子频带过滤来完成。在1994年12月20日提交的美国专利5375188中公开了一种使用这种频率转换从混合信号中消除语音信号的方法。
然而,因为某些音乐信号分量被包含在与语音信号一样的频带中,其在几kHZ的范围内,当去除这些频带时将丢失一些音乐信号,由此降低了输出伴奏的质量。为了减少混合信号中音乐信号的损失,人们已经试图检测语音信号的音调频率(pitch frequency),并且只去除该音调的频域。但是,由于音乐信号的影响而不容易检测语音信号的音调,所以这种方法并不十分可靠。
发明内容
本发明提供了一种通过使用对于二维前向网络的独立分量分析方法、在较短的收敛时间内从音乐与语音信号的混合信号中分离音乐与语音信号的装置。该装置根据传感器录制位置的差异来估计信号混合处理。
本发明提供了一种通过使用对于二维前向网络的独立分量分析算法、在较短的收敛时间内从音乐与语音信号的混合信号中分离音乐与语音信号的方法。该方法根据传感器录制位置的差异来估计信号混合处理。
根据本发明的一方面,提供了一种用于从混合信号中分离音乐与语音的装置,包括:独立分量分析器,音乐信号选择器,滤波器,以及转接器。
所述独立分量分析器用来接收包含音乐与语音分量的第一过滤后信号与第二过滤后信号,并且输出当前第一系数、当前第二系数、当前第三系数、以及当前第四系数,这些系数使用独立分量分析方法来确定。
所述音乐信号选择器用来作为对所述第二系数的最高有效位与所述第三系数的最高有效位的响应输出转接器控制信号。
所述滤波器用来接收表示可听音响信号的R声道信号与L声道信号,并输出第一过滤后信号与第二过滤后信号
所述转接器用来作为对所述转接器控制信号的响应选择性地输出所述第一过滤后信号或第二过滤后信号。
所述滤波器还包括:第一乘法器,用来将所述R声道信号乘以所述第一系数,并输出第一乘积信号;第二乘法器,用来将所述R声道信号乘以所述第二系数,并输出第二乘积信号;第三乘法器,用来将所述L声道信号乘以所述第三系数,并输出第三乘积信号;第四乘法器,用来将所述L声道信号乘以所述第四系数,并输出第四乘积信号;第一加法器,用来将所述第一乘积信号与所述第三乘积信号相加,以确定所述第一过滤后信号;以及第二加法器,用来将所述第二乘积信号与所述第四乘积信号相加,以确定所述第二过滤后信号。
所述独立分量分析器根据以下公式确定所述当前第一系数、当前第二系数、当前第三系数、以及当前第四系数:
Wn=Wn-1+(I-2tanh(u)uT)Wn-1
其中,Wn为包含当前第一系数、当前第二系数、当前第三系数、以及当前第四系数的2×2矩阵,Wn-1为包含先前第一系数、先前第二系数、先前第三系数、以及先前第四系数的2×2矩阵,I为2×2单位矩阵,u为包含所述第一过滤后信号与第二过滤后信号的2×1列矩阵,uT为行矩阵,uT为列矩阵u的转置。
所述当前第一系数、当前第二系数、当前第三系数、以及当前第四系数分别为Wn11、Wn21、Wn12、与Wn22,所述先前第一系数、先前第二系数、先前第三系数、以及先前第四系数分别为Wn-111、Wn-121、Wn-112、与Wn-122,并且所述第一过滤后信号与第二过滤后信号分别为u1与u2。
所述R声道信号与L声道信号可以无区别地互换。
所述R声道信号与L声道信号为从包括CD播放器、DVD播放器、磁带播放器、以及FM无线电广播接收器的音响系统输出的二声道立体声数字信号。
根据本发明的另一方面,提供了一种用于从混合信号中分离音乐与语音的方法,包括以下步骤:(a)在独立分量分析器处,接收包含音乐与语音分量的第一过滤后信号与第二过滤后信号,并且输出当前第一系数、当前第二系数、当前第三系数、以及当前第四系数;(b)作为对所述第二系数的最高有效位与所述第三系数的最高有效位的响应输出转接器控制信号;(c)接收表示可听音响信号的R声道信号与L声道信号,并输出第一过滤后信号与第二过滤后信号;以及(d)作为对所述转接器控制信号的响应选择性地输出所述第一过滤后信号或第二过滤后信号。
在步骤(c)中,进一步包括以下步骤:(i)通过将所述R声道信号乘以所述第一系数,生成第一乘积信号;(ii)通过将所述R声道信号乘以所述第二系数,生成第二乘积信号;(iii)通过将所述L声道信号乘以所述第三系数,生成第三乘积信号;(iv)通过将所述L声道信号乘以所述第四系数,生成第四乘积信号;(v)通过将所述第一乘积信号与所述第三乘积信号相加,生成所述第一过滤后信号;以及(vi)通过将所述第二乘积信号与所述第四乘积信号相加,生成所述第二过滤后信号。
所述独立分量分析器根据以下公式确定所述当前第一系数、当前第二系数、当前第三系数、以及当前第四系数:
Wn=Wn-1+(I-2tanh(u)uT)Wn-1
其中,Wn为包含当前第一系数、当前第二系数、当前第三系数、以及当前第四系数的2×2矩阵,Wn-1为包含先前第一系数、先前第二系数、先前第三系数、以及先前第四系数的2×2矩阵,I为2×2单位矩阵,u为包含所述第一过滤后信号与第二过滤后信号的2×1列矩阵,uT为行矩阵,uT为列矩阵u的转置。
所述当前第一系数、当前第二系数、当前第三系数、以及当前第四系数分别为Wn11、Wn21、Wn12、与Wn22,所述先前第一系数、先前第二系数、先前第三系数、以及先前第四系数分别为Wn-111、Wn-121、Wn-112、与Wn-122,并且所述第一过滤后信号与第二过滤后信号分别为u1与u2。
所述R声道信号与L声道信号可以无区别地互换。
所述R声道信号与L声道信号为从包括CD播放器、DVD播放器、磁带播放器、以及FM无线电广播接收器的音响系统输出的二声道立体声数字信号。
附图说明
结合附图,从以下描述中可以更详细地理解本发明的优选实施方式,其中:
图1为根据本发明优选实施方式的、用于分离音乐与语音的装置的方框图;以及
图2为根据本发明优选实施方式的、独立分量分析方法的流程图。
具体实施方式
下面将参照附图更全面地描述本发明的优选实施方式,在附图中显示了本发明的优选实施方式。然而,本发明可以用不同形式实施,并且不应该被理解为局限于此处所列出的实施方式。提供这些实施方式只是为了使本公开彻底、完整,并且向本领域技术人员完整阐述本发明的范围。
参照图1,其显示了根据本发明优选实施方式的、用来分离音乐与语音的装置100的方框图。装置100包括独立分量分析器110、音乐信号选择器120、滤波器130、以及转接器140。
独立分量分析器110接收第一输出信号MAS1与第二输出信号MAS2,其中每个都包含音乐信号与语音信号。独立分量分析器110输出当前系数Wn11、当前第二系数Wn21、当前第三系数Wn12、以及当前第四系数Wn22。这些当前系数使用独立分量分析方法来计算。下标n表示独立分量分析方法的当前迭代次数。
如下详细所述,该独立分量方法将混合的声学信号分离为分离的语音信号与音乐信号。语音信号与音乐信号之间的无关性被最大化。即,语音信号与音乐信号被恢复到其被混合前的原始状态。该混合信号可以从(例如)一个或更多个传感器获得。
音乐信号选择器120输出转接器控制信号,其具有第一逻辑状态(例如低逻辑状态)与第二逻辑状态(例如高逻辑状态)。作为对第二系数Wn21的最高有效位的第二逻辑状态的响应,输出第一逻辑状态。作为对第三系数Wn12的最高有效位的第二逻辑状态的响应,输出第二逻辑状态。第二系数Wn21与第三系数Wn12的最高有效位具有表示负值或正值的符号。当这些最高有效位处于第二逻辑状态时,第二系数Wn21与第三系数Wn12具有负值。此处第一输出信号MAS1与第二输出信号MAS2位经过消除的音乐信号。
滤波器130接收R声道信号RAS与L声道信号LAS,其中每个都表示可听音响信号。第一乘法器131将R声道信号RAS乘以当前系数Wn11并输出第一乘法结果。第三乘法器135将L声道信号LAS乘以当前第三系数Wn12并输出第三乘法结果。第一乘法结果与第三乘法结果由第一加法器138相加,以生成第一输出信号MAS1。
第二乘法器133将R声道信号RAS乘以当前第二系数Wn21并输出第二乘法结果。第四乘法器137将L声道信号LAS乘以当前第四系数Wn12并输出第四乘法结果。第二乘法结果与第四乘法结果由第二加法器139相加,以生成第二输出信号MAS2。
R声道信号RAS与L声道信号LAS可以是从诸如密致盘(CD)播放器、数字视频盘(DVD)播放器、音频磁带播放器、FM接收器等音响系统输出的二声道数字信号。如果R声道信号RAS与L声道信号LAS的值互换将产生同样的输出。即,R声道信号RAS与L声道信号LAS的值可以互换而没有任何后果。
响应于转接器控制信号的逻辑状态,转接器140输出第一输出信号MAS1或第二输出信号MAS2。如上所述,第一与第二输出信号MAS1与MAS2为没有语音信号的音乐信号(即,歌曲伴奏)。例如,用户可以通过扬声器聆听音乐伴奏。
参照图2,其中显示了根据本发明优选实施方式的独立分量分析方法200的流程图。该流程图显示了对于二维前向网络的独立分量分析方法200,如图1所示。该独立分量分析方法200可以由图1的独立分量分析器110来完成。
图2的独立分量分析方法200控制图1的当前第一系数Wn11、当前第二系数Wn21、当前第三系数Wn12、以及当前第四系数Wn22。该独立分量分析方法200被实现为包含图1的输出信号MAS1与MAS2的矩阵u的非线性函数(tanh(u)),如以下公式(1)所示。如上所述,输出信号MAS1与MAS2包括音乐信号与语音信号
Wn=Wn-1+(I-2tanh(u)uT)Wn-1, ......(1)
Wn为包含当前四个系数(即Wn11、Wn21、Wn12、与Wn22)的2×2矩阵,Wn-1为包含先前四个系数(即Wn-111、Wn-121、Wn-112、与Wn-122)的2×2矩阵,I为2×2单位矩阵,u为包含输出信号的2×1列矩阵,uT为行矩阵,其为列矩阵u的转置。
在公式(1)中,当Wn表示为包含当前四个系数Wn11、Wn21、Wn12、与Wn22的2×2矩阵时,就确立了下面的表达式(2)。类似地,在公式(1)中,当Wn-1表示为包含包含先前四个系数Wn-111、Wn-121、Wn-112、与Wn-122的2×2矩阵时,就确立了下面的表达式(3)。因为I为2×2单位矩阵,所以确立下面的表达式(4)。因为u为包含输出两个信号MAS1与MAS2的2×1列矩阵,所以确立下面的表达式(5)。因为uT为行矩阵,其为列矩阵u的转置,所以确立下面的表达式(6)。根据表达式(2)与表达式(5),当前第一系数Wn11、当前第二系数Wn21、当前第三系数Wn12、以及当前第四系数Wn22为构成矩阵Wn的元素。第一输出信号MAS1与第二输出信号MAS2分别为构成矩阵u的u1与u2。
[u1 u2]=[MAS1 MAS2]......(6)
当开通用于分离音乐与语音的装置100,图1的独立分量分析器110在步骤S211复位该装置。在步骤S213,例如当n=1时,在复位时识别初始状态。并且,在步骤S215,接收四个系数Wo11、Wo21、Wo12、与Wo22,这些系数在步骤S215预先被设置为初始值。另外,在步骤S217,独立分量分析器110接收公式(1)的I与u。
接着,在步骤S219,图1的独立分量分析器110计算以上的公式(1),并且在步骤S221,输出当前4个系数Wn11、Wn21、Wn12、与Wn22。在步骤S223,确定独立分量分析器110是否被关断。如果在步骤S223确定独立分量分析器110未被关闭,则在步骤S225独立分量分析器110将n加1,然后再次进行S215到S221的步骤。
图2的独立分量分析方法200以较短收敛时间进行。因此,当图1的用于分离音乐与语音的装置100被安装在音响系统上并且通过该独立分量分析方法200所估计的纯粹的音乐信号(即没有语音信号)从扬声器输出时,用户可以实时地聆听质量被改进的纯粹的音乐信号。
如上所述,根据本发明优选实施方式的图1的用于分离音乐与语音的装置100包括独立分量分析器110,其接收的包含音乐信号与声音信号的输出信号MAS1与MAS2,并输出使用所述独立分量分析方法所计算的当前第一系数Wn11、当前第二系数Wn21、当前第三系数Wn12、以及当前第四系数Wn22,从而根据第一、第二、第三、以及第四系数(即分别为Wn11、Wn21、Wn12、Wn22)处理当前输入声学信号RAS与LAS。结果,从混合信号中估计出音乐信号与语音信号,并且可以确定纯粹的音乐信号。
通过使用所述独立分量分析方法,根据本发明优选实施方式的图1的用于分离音乐与语音的装置100可以以较短的收敛时间从混合信号中分离出音乐信号与语音信号。可以分离地录制混合信号的音乐信号与语音信号。图2的独立分量分析方法200根据传感器的录制位置的差异来估计信号混合处理。由此,用户可以轻易地从其自己的CD、DVD、或音频磁带、或FM无线电中选择伴奏音乐,并且实时聆听质量被改进的音乐。用户可以只是倾听音乐伴奏或者与之一起唱(即加上其自己的歌词)。另外,因为用于分离音乐与语音的独立分量分析方法200相对较简单,并且进行该独立分量分析方法200所需的时间一般不长,所以该方法可以轻易地实现于数字信号处理器(DSP)芯片、微处理器等等之中。
虽然参照附图描述了一些示范性实施方式,但应该理解本发明并不局限于这些实施方式的精确形式,本领域技术人员可以在不脱离本发明原理与范围的前提下进行各种修改与变动。所有这些修改与变动都包括在权利要求所限定的范围之内。
Claims (14)
1.一种用于从混合信号中分离音乐与语音的装置,包括:
独立分量分析器,用来接收包含音乐与语音分量的第一过滤后信号与第二过滤后信号,并且输出当前第一系数、当前第二系数、当前第三系数、以及当前第四系数;
音乐信号选择器,用来作为对所述第二系数的最高有效位与所述第三系数的最高有效位的响应,输出转接器控制信号;
滤波器,用来接收表示可听音响信号的R声道信号与L声道信号,并输出第一过滤后信号与第二过滤后信号;以及
转接器,用来作为对所述转接器控制信号的响应,选择性地输出所述第一过滤后信号或第二过滤后信号。
2.如权利要求1所述的装置,其中所述滤波器包括:
第一乘法器,用来将所述R声道信号乘以所述第一系数,并输出第一乘积信号;
第二乘法器,用来将所述R声道信号乘以所述第二系数,并输出第二乘积信号;
第三乘法器,用来将所述L声道信号乘以所述第三系数,并输出第三乘积信号;
第四乘法器,用来将所述L声道信号乘以所述第四系数,并输出第四乘积信号;
第一加法器,用来将所述第一乘积信号与所述第三乘积信号相加,以确定所述第一过滤后信号;以及
第二加法器,用来将所述第二乘积信号与所述第四乘积信号相加,以确定所述第二过滤后信号。
3.如权利要求1所述的装置,其中所述独立分量分析器根据以下公式确定所述当前第一系数、当前第二系数、当前第三系数、以及当前第四系数:
Wn=Wn-1+(I-2tanh(u)uT)Wn-1,
其中,Wn为包含当前第一系数、当前第二系数、当前第三系数、以及当前第四系数的2×2矩阵,Wn-1为包含先前第一系数、先前第二系数、先前第三系数、以及先前第四系数的2×2矩阵,I为2×2单位矩阵,u为包含所述第一过滤后信号与第二过滤后信号的2×1列矩阵,uT为行矩阵,uT为列矩阵u的转置。
4.如权利要求3所述的装置,其中所述当前第一系数、当前第二系数、当前第三系数、以及当前第四系数分别为Wn11、Wn21、Wn12、与Wn22,所述先前第一系数、先前第二系数、先前第三系数、以及先前第四系数分别为Wn-111、Wn-121、Wn-112、与Wn-122,并且所述第一过滤后信号与第二过滤后信号分别为u1与u2。
5.如权利要求1所述的装置,其中所述R声道信号与L声道信号可以无区别地互换。
6.如权利要求1所述的装置,其中所述R声道信号与L声道信号为从音响系统输出的二声道立体声数字信号。
7.如权利要求6所述的装置,其中所述音响系统为以下之一:密致盘播放器、数字视频盘播放器、磁带播放器、以及FM接收器。
8.一种用于从混合信号中分离音乐与语音的方法,包括以下步骤:
(a)在独立分量分析器处,接收包含音乐与语音分量的第一过滤后信号与第二过滤后信号,并且输出当前第一系数、当前第二系数、当前第三系数、以及当前第四系数;
(b)作为对所述第二系数的最高有效位与所述第三系数的最高有效位的响应,生成转接器控制信号;
(c)接收表示可听音响信号的R声道信号与L声道信号,并输出第一过滤后信号与第二过滤后信号;以及
(d)作为对所述转接器控制信号的响应,选择性地输出所述第一过滤后信号或第二过滤后信号。
9.如权利要求8所述的方法,其中,在步骤(c)中,进一步包括以下步骤:
(i)通过将所述R声道信号乘以所述第一系数,生成第一乘积信号;
(ii)通过将所述R声道信号乘以所述第二系数,生成第二乘积信号;
(iii)通过将所述L声道信号乘以所述第三系数,生成第三乘积信号;
(iv)通过将所述L声道信号乘以所述第四系数,生成第四乘积信号;
(v)通过将所述第一乘积信号与所述第三乘积信号相加,生成所述第一过滤后信号;以及
(vi)通过将所述第二乘积信号与所述第四乘积信号相加,生成所述第二过滤后信号。
10.如权利要求8所述的方法,其中,所述独立分量分析器根据以下公式确定所述当前第一系数、当前第二系数、当前第三系数、以及当前第四系数:
Wn=Wn-1+(I-2tanh(u)uT)Wn-1
其中,Wn为包含当前第一系数、当前第二系数、当前第三系数、以及当前第四系数的2×2矩阵,Wn-1为包含先前第一系数、先前第二系数、先前第三系数、以及先前第四系数的2×2矩阵,I为2×2单位矩阵,u为包含所述第一过滤后信号与第二过滤后信号的2×1列矩阵,uT为行矩阵,uT为列矩阵u的转置。
11.如权利要求10所述的方法,其中,所述当前第一系数、当前第二系数、当前第三系数、以及当前第四系数分别为Wn11、Wn21、Wn12、与Wn22,所述先前第一系数、先前第二系数、先前第三系数、以及先前第四系数分别为Wn-111、Wn-121、Wn-112、与Wn-122,并且所述第一过滤后信号与第二过滤后信号分别为u1与u2。
12.如权利要求8所述的方法,其中所述R声道信号与L声道信号可以无区别地互换。
13.如权利要求8所述的方法,其中所述R声道信号与L声道信号为从音响系统输出的二声道立体声数字信号。
14.如权利要求13所述的方法,其中所述音响系统为以下之一:密致盘播放器、数字视频盘播放器、磁带播放器、以及FM接收器。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR35304/03 | 2003-06-02 | ||
KR35304/2003 | 2003-06-02 | ||
KR1020030035304A KR100555499B1 (ko) | 2003-06-02 | 2003-06-02 | 2차 전방향 네트워크에 독립 해석 알고리즘을 이용하는반주/보이스 분리 장치 및 그 방법 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1573920A true CN1573920A (zh) | 2005-02-02 |
CN100587805C CN100587805C (zh) | 2010-02-03 |
Family
ID=34056782
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN200410046551A Expired - Lifetime CN100587805C (zh) | 2003-06-02 | 2004-06-02 | 使用独立分量分析算法分离音乐与语音的装置与方法 |
Country Status (5)
Country | Link |
---|---|
US (1) | US7122732B2 (zh) |
JP (1) | JP4481729B2 (zh) |
KR (1) | KR100555499B1 (zh) |
CN (1) | CN100587805C (zh) |
TW (1) | TWI287789B (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101577117B (zh) * | 2009-03-12 | 2012-04-11 | 无锡中星微电子有限公司 | 伴奏音乐提取方法及装置 |
CN101345047B (zh) * | 2007-07-12 | 2012-09-05 | 英业达股份有限公司 | 人声自动校正的混音系统及其混音方法 |
CN104134444A (zh) * | 2014-07-11 | 2014-11-05 | 福建星网视易信息系统有限公司 | 一种基于mmse的歌曲去伴奏方法和装置 |
CN104269174A (zh) * | 2014-10-24 | 2015-01-07 | 百度在线网络技术(北京)有限公司 | 一种音频信号的处理方法及装置 |
US11501752B2 (en) | 2021-01-20 | 2022-11-15 | International Business Machines Corporation | Enhanced reproduction of speech on a computing system |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7409375B2 (en) * | 2005-05-23 | 2008-08-05 | Knowmtech, Llc | Plasticity-induced self organizing nanotechnology for the extraction of independent components from a data stream |
FI119133B (fi) | 2005-04-28 | 2008-07-31 | Elekta Ab | Menetelmä ja laite häiriön poistamiseksi sähkömagneettisesta monikanavamittauksesta |
FR2891651B1 (fr) * | 2005-10-05 | 2007-11-09 | Sagem Comm | Systeme de karaoke pour l'affichage du texte correspondant a la partie vocale d'un flux audiovisuel sur un ecran d'un systeme audiovisuel |
US7928307B2 (en) * | 2008-11-03 | 2011-04-19 | Qnx Software Systems Co. | Karaoke system |
KR101615262B1 (ko) | 2009-08-12 | 2016-04-26 | 삼성전자주식회사 | 시멘틱 정보를 이용한 멀티 채널 오디오 인코딩 및 디코딩 방법 및 장치 |
CN105869617A (zh) * | 2016-03-25 | 2016-08-17 | 北京海尔集成电路设计有限公司 | 一种基于中国数字音频广播的卡拉ok装置 |
CN110232931B (zh) * | 2019-06-18 | 2022-03-22 | 广州酷狗计算机科技有限公司 | 音频信号的处理方法、装置、计算设备及存储介质 |
Family Cites Families (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3204034A (en) * | 1962-04-26 | 1965-08-31 | Arthur H Ballard | Orthogonal polynomial multiplex transmission systems |
US4587620A (en) * | 1981-05-09 | 1986-05-06 | Nippon Gakki Seizo Kabushiki Kaisha | Noise elimination device |
US5210366A (en) * | 1991-06-10 | 1993-05-11 | Sykes Jr Richard O | Method and device for detecting and separating voices in a complex musical composition |
US5340317A (en) * | 1991-07-09 | 1994-08-23 | Freeman Michael J | Real-time interactive conversational apparatus |
US5353376A (en) * | 1992-03-20 | 1994-10-04 | Texas Instruments Incorporated | System and method for improved speech acquisition for hands-free voice telecommunication in a noisy environment |
US5377302A (en) * | 1992-09-01 | 1994-12-27 | Monowave Corporation L.P. | System for recognizing speech |
US5649234A (en) * | 1994-07-07 | 1997-07-15 | Time Warner Interactive Group, Inc. | Method and apparatus for encoding graphical cues on a compact disc synchronized with the lyrics of a song to be played back |
JP2882364B2 (ja) * | 1996-06-14 | 1999-04-12 | 日本電気株式会社 | 雑音消去方法及び雑音消去装置 |
JP3496411B2 (ja) * | 1996-10-30 | 2004-02-09 | ソニー株式会社 | 情報符号化方法及び復号化装置 |
KR100231449B1 (ko) | 1996-11-29 | 1999-11-15 | 전주범 | 오디오신호의 음성 및 배경음악 분리회로 |
JP3152292B2 (ja) * | 1997-04-15 | 2001-04-03 | 日本電気株式会社 | 多チャネルエコー除去方法及び装置 |
US5898119A (en) * | 1997-06-02 | 1999-04-27 | Mitac, Inc. | Method and apparatus for generating musical accompaniment signals, and method and device for generating a video output in a musical accompaniment apparatus |
US6144937A (en) * | 1997-07-23 | 2000-11-07 | Texas Instruments Incorporated | Noise suppression of speech by signal processing including applying a transform to time domain input sequences of digital signals representing audio information |
JP3890692B2 (ja) * | 1997-08-29 | 2007-03-07 | ソニー株式会社 | 情報処理装置及び情報配信システム |
US6038535A (en) * | 1998-03-23 | 2000-03-14 | Motorola, Inc. | Speech classifier and method using delay elements |
JP3351352B2 (ja) * | 1998-09-24 | 2002-11-25 | ヤマハ株式会社 | 映像切換装置 |
WO2000046789A1 (fr) * | 1999-02-05 | 2000-08-10 | Fujitsu Limited | Detecteur de la presence d'un son et procede de detection de la presence et/ou de l'absence d'un son |
ATE403932T1 (de) * | 1999-08-18 | 2008-08-15 | Sony Corp | Wiedergabevorrichtung |
US7072833B2 (en) * | 2000-06-02 | 2006-07-04 | Canon Kabushiki Kaisha | Speech processing system |
US6985858B2 (en) * | 2001-03-20 | 2006-01-10 | Microsoft Corporation | Method and apparatus for removing noise from feature vectors |
KR100429896B1 (ko) * | 2001-11-22 | 2004-05-03 | 한국전자통신연구원 | 잡음 환경에서의 음성신호 검출방법 및 그 장치 |
-
2003
- 2003-06-02 KR KR1020030035304A patent/KR100555499B1/ko active IP Right Grant
-
2004
- 2004-05-27 TW TW093115048A patent/TWI287789B/zh not_active IP Right Cessation
- 2004-06-01 JP JP2004163722A patent/JP4481729B2/ja not_active Expired - Lifetime
- 2004-06-02 US US10/859,469 patent/US7122732B2/en active Active
- 2004-06-02 CN CN200410046551A patent/CN100587805C/zh not_active Expired - Lifetime
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101345047B (zh) * | 2007-07-12 | 2012-09-05 | 英业达股份有限公司 | 人声自动校正的混音系统及其混音方法 |
CN101577117B (zh) * | 2009-03-12 | 2012-04-11 | 无锡中星微电子有限公司 | 伴奏音乐提取方法及装置 |
CN104134444A (zh) * | 2014-07-11 | 2014-11-05 | 福建星网视易信息系统有限公司 | 一种基于mmse的歌曲去伴奏方法和装置 |
CN104134444B (zh) * | 2014-07-11 | 2017-03-15 | 福建星网视易信息系统有限公司 | 一种基于mmse的歌曲去伴奏方法和装置 |
CN104269174A (zh) * | 2014-10-24 | 2015-01-07 | 百度在线网络技术(北京)有限公司 | 一种音频信号的处理方法及装置 |
CN104269174B (zh) * | 2014-10-24 | 2018-02-09 | 北京音之邦文化科技有限公司 | 一种音频信号的处理方法及装置 |
US11501752B2 (en) | 2021-01-20 | 2022-11-15 | International Business Machines Corporation | Enhanced reproduction of speech on a computing system |
Also Published As
Publication number | Publication date |
---|---|
US7122732B2 (en) | 2006-10-17 |
JP2004361957A (ja) | 2004-12-24 |
CN100587805C (zh) | 2010-02-03 |
TW200514039A (en) | 2005-04-16 |
JP4481729B2 (ja) | 2010-06-16 |
US20050056140A1 (en) | 2005-03-17 |
TWI287789B (en) | 2007-10-01 |
KR100555499B1 (ko) | 2006-03-03 |
KR20040103683A (ko) | 2004-12-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1181468C (zh) | 数字音频信号的连续可变时间标度改变技术 | |
US8027478B2 (en) | Method and system for sound source separation | |
CN1941073B (zh) | 用于消除音频信号中的人声分量的设备和方法 | |
CN1573920A (zh) | 使用独立分量分析算法分离音乐与语音的装置与方法 | |
Farina et al. | Ambiophonic principles for the recording and reproduction of surround sound for music | |
CN1714599A (zh) | 立体声扩展网络中的输出均衡 | |
CN1148230A (zh) | 卡拉ok计分的方法和系统 | |
US20050286725A1 (en) | Pseudo-stereo signal making apparatus | |
CN1839663A (zh) | 音频立体声处理方法、设备和系统 | |
CN1457216A (zh) | 数组式环场音效译码装置 | |
CN1321545C (zh) | 环场音效耳机输出信号生成装置 | |
KR100574942B1 (ko) | 최소 자승 알고리즘을 이용하는 신호 분리 장치 및 그 방법 | |
CN1327705A (zh) | 立体声信号处理装置 | |
CN100527635C (zh) | 数字信号处理装置和数字信号处理方法 | |
CN1554014A (zh) | 利用同步信息重放midi的方法和装置 | |
JP3560087B2 (ja) | 音信号処理装置およびサラウンド再生方法 | |
CN100592383C (zh) | 360度环绕立体声音乐制作方法 | |
US20080225680A1 (en) | Data reproduction apparatus and data reproduction method | |
KR100667814B1 (ko) | 전기 기타의 톤 및 이펙터 기능을 갖는 휴대용 오디오 재생장치 | |
WO2023156578A1 (fr) | Procédé de traitement d'un signal sonore numérique pour émulation de disques vinyle | |
Djukic et al. | The influence of impulse response length and transition bandwidth of magnitude complementary crossover on perceived sound quality | |
Day | Choosing between DVD-audio and super audio CD?[Tools & Toys] | |
TWI243356B (en) | Method and related apparatus for determining vocal channel by occurrences frequency of zeros-crossing | |
JPH0771358B2 (ja) | オーディオ信号処理装置 | |
Bretz | Two-way radios for the masses [Tools & Toys] |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
CX01 | Expiry of patent term |
Granted publication date: 20100203 |
|
CX01 | Expiry of patent term |