TWI287789B - Apparatus and method for separating music and voice using independent component analysis algorithm for two-dimensional forward network - Google Patents
Apparatus and method for separating music and voice using independent component analysis algorithm for two-dimensional forward network Download PDFInfo
- Publication number
- TWI287789B TWI287789B TW093115048A TW93115048A TWI287789B TW I287789 B TWI287789 B TW I287789B TW 093115048 A TW093115048 A TW 093115048A TW 93115048 A TW93115048 A TW 93115048A TW I287789 B TWI287789 B TW I287789B
- Authority
- TW
- Taiwan
- Prior art keywords
- signal
- coefficient
- current
- music
- sound
- Prior art date
Links
- 238000000034 method Methods 0.000 title claims abstract description 47
- 238000012880 independent component analysis Methods 0.000 title abstract description 21
- 239000011159 matrix material Substances 0.000 claims description 47
- 230000004044 response Effects 0.000 claims description 6
- 230000008569 process Effects 0.000 abstract description 5
- 230000005236 sound signal Effects 0.000 description 26
- 101000577080 Homo sapiens Mitochondrial-processing peptidase subunit alpha Proteins 0.000 description 11
- 102100025321 Mitochondrial-processing peptidase subunit alpha Human genes 0.000 description 11
- XMXLVNVGGJBUPF-UHFFFAOYSA-N 2-amino-n,n-diethyl-1,3-benzothiazole-6-carboxamide Chemical compound CCN(CC)C(=O)C1=CC=C2N=C(N)SC2=C1 XMXLVNVGGJBUPF-UHFFFAOYSA-N 0.000 description 9
- 102000015925 Proto-oncogene Mas Human genes 0.000 description 9
- 108050004181 Proto-oncogene Mas Proteins 0.000 description 9
- 230000006870 function Effects 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000001914 filtration Methods 0.000 description 2
- 238000000926 separation method Methods 0.000 description 2
- 241000218691 Cupressaceae Species 0.000 description 1
- 101100289989 Drosophila melanogaster alpha-Man-Ia gene Proteins 0.000 description 1
- 101150021286 MAS1 gene Proteins 0.000 description 1
- 241000282376 Panthera tigris Species 0.000 description 1
- 241000287107 Passer Species 0.000 description 1
- 238000007429 general method Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B31/00—Arrangements for the associated working of recording or reproducing apparatus with related apparatus
- G11B31/02—Arrangements for the associated working of recording or reproducing apparatus with related apparatus with automatic musical instruments
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/0272—Voice signal separating
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H1/00—Details of electrophonic musical instruments
- G10H1/02—Means for controlling the tone frequencies, e.g. attack or decay; Means for producing special musical effects, e.g. vibratos or glissandos
- G10H1/06—Circuits for establishing the harmonic content of tones, or other arrangements for changing the tone colour
- G10H1/12—Circuits for establishing the harmonic content of tones, or other arrangements for changing the tone colour by filtering complex waveforms
- G10H1/125—Circuits for establishing the harmonic content of tones, or other arrangements for changing the tone colour by filtering complex waveforms using a digital filter
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H1/00—Details of electrophonic musical instruments
- G10H1/36—Accompaniment arrangements
- G10H1/361—Recording/reproducing of accompaniment for use with an external source, e.g. karaoke systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H2210/00—Aspects or methods of musical processing having intrinsic musical character, i.e. involving musical theory or musical parameters or relying on musical knowledge, as applied in electrophonic musical tools or instruments
- G10H2210/031—Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal
- G10H2210/046—Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal for differentiation between music and non-music signals, based on the identification of musical parameters, e.g. based on tempo detection
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10H—ELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
- G10H2210/00—Aspects or methods of musical processing having intrinsic musical character, i.e. involving musical theory or musical parameters or relying on musical knowledge, as applied in electrophonic musical tools or instruments
- G10H2210/031—Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal
- G10H2210/056—Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal for extraction or identification of individual instrumental parts, e.g. melody, chords, bass; Identification or separation of instrumental parts by their characteristic voices or timbres
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Signal Processing (AREA)
- Quality & Reliability (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Stereophonic System (AREA)
- Reverberation, Karaoke And Other Acoustics (AREA)
- Signal Processing For Digital Recording And Reproducing (AREA)
- Signal Processing Not Specific To The Method Of Recording And Reproducing (AREA)
Description
I2877^99pif.doc 九、發明說明: 【發明所屬之技術領域】 本發明是有關於-種歌曲伴奏裂置及方法,且較特別 的是,有關於-種可消除音樂及聲音訊號的混合訊號中的 聲音訊號的歌曲伴奏裝置及方法。 【先前技術】 具卡拉OK(kara〇ke)功能的歌曲伴奏裝置(s〇ng accompaniment apparatus),目前已廣泛用在歌唱和/或娛樂 方面歌曲伴奏裝置通常會輪出歌曲伴奏部分(so% 謂mpaniment) ’以供使用者跟唱。另一方面,使用 I不 只欣f其中的音樂部分—•在此所用 斑往矣奏係代表沒有聲音部分(Voice acc〇mpaniment) 的曰木伴奏部分。在這種歌曲伴奏裝置中,一般都合使用 記憶體來儲存使用者所選取的歌: t定:歌曲伴奏裝置中的歌曲伴奏部分的: 是相己儲存容量。所以像這樣的歌曲伴奏裝置一般都 di% C_;器卡=普通光碟(c—t 放4供。使用者可播放自己擁有的CDs p = 页。同樣地,如果可從調頻汗馗)聲 s以 音機)中消除聲音,使口有歌隸矣的輪出(例如從收 地提供卡嫌功能使二則亦可輕易 使用者可播放自己喜愛的 12877视 9pi f.doc 收音機頻道的歌曲。 從CD播放器、DVD播放器、卡帶播放器、以&FM收 音機所輸出的聲音訊號(acoustic signals),一般會包含一個 音樂及聲音訊號的混合訊號(mixture)。目前所用的各種從 混合訊號中消除聲音訊號的技術,都不盡完善。從混合訊 號中消除聲音訊號的一般方法包括:將聲音訊號轉換為頻 域(frequency domains),並且移除出現聲音訊號的特定波段 (bands)。一般是使用一種快速傅立葉轉換(fast F〇urier transform,FFT)或是次波段(subband)過濾的方式,執行頻域 轉換。美國專利第5,375,188號(1994年12月24曰)揭露一種 使用這種頻率轉換方法,從混合訊號中移除聲音訊號之方 法0 然而,因為某些音樂訊號構件是包含在與聲音訊號相 同的頻率波段中,當移除該些頻率波段時,在數KHz範圍 中的某些音樂訊號也會遺失’因此會降低輸出伴奏的品 質。為降低混合訊號中的音樂訊號流失,目前已經嘗試使 用一種方式來偵測聲音訊號的音調頻率(pitch frequency),並且只移除該音調(pitch)的頻域(frequenCy domain)。然而,因為音樂訊號的影響,所以很難彳貞測聲音 訊號的音調,因此這種方法並非相當可靠。 【發明内容】 有鑑於此,本發明提供一種使用在二維前向式網路 (two-dimensional forward network)中所用的獨立構件分析 演算法(independent component analysis algorithm),在一個 1287789 1 3799pif.doc 很短的收斂時間(convergence time)之内,從聲音及音樂訊 5虎的一混合訊5虎中’分離聲音訊號與音樂訊號之裝置。該 裝置根據感測器(sensors)的記錄位置差異,估算一訊號混 合處理(signal mixing process) 〇 本發明提供一種使用在二維前向式網路中所用的獨 立構件分析演算法,在一個很短的收斂時間之内,從聲音 及音樂訊號的一混合訊號中,分離聲音訊號與音樂訊號之 方法。該方法根據感測器的記錄位置差異,估算一訊號混 合處理。 根據本發明的一觀點,本發明提供一種從一混合訊號 中分離音樂與聲音之裝置。該裝置包括一個獨立構件分析 器、一個音樂訊號選擇器、一個過濾器、以及一個多工器 (multiplexer) 〇 獨立構件分析器接收‘組成音樂及聲音構件的一個第 一已過濾訊號(first filtered signal)及一個第二已過濾訊號 (second filtered signal),並且輸出使用一個獨立構件分析法 所決定的一個目前第一係數(current first coefficient)、一個 目前第二係數(current second coefficient)、一個目前第三係 數(current third coefficient)、以及一個目前第四係數 (current fourth coefficient)。 響應苐^一係數的一個最而有效位元(most significant bit)與第三係數的一個最高有效位元,音樂訊號選擇器會輸 出一個多工器控制訊號(multiplexer control signal)。 過戚器接收代表可聽訊號(audible signals)的右通道訊 12877视 9pif 號(R channel signal)與左通道訊號(L channel signal),並且 輸出一個第一已過濾訊號及一個第二已過濾訊號。 多工器響應多工器控制訊號的一邏輯狀態,選擇性地 輸出第一已過濾訊號或第二已過濾訊號。 過滤1§可更加包括一個第一乘法器(multiplier),將右 通道訊號與第一係數相乘,並且輸出一個第一乘積訊號 (product signal); —個第二乘法器,將右通道訊號與第二係 數相乘,並且輸出一個第二乘積訊號;一個第三乘法器, 將左通道訊號與第三係數相乘,並且輸出一個第三乘積訊 號;一個第四乘法器,將左通道訊號與第四係數相乘,並 且輸出一個第四乘積訊號;一個第一加法器(adder),將第 一乘積訊號與第三乘積訊號相加,以決定第一已過濾訊 號;以及一個第二加法器,將第二乘積訊號與第四乘積訊 號相加,以決定第二已過濾訊號。 獨立構件分析器可從下列公式,計算目前第一係數、 目前第二係數、目前第三係數、以及目前第四係數:
Wn = Wn-1 +(1- 2tanh(u)uT)Wn-l5 其中,Wn為一個由目前第一係數、目前第二係數、 目前第三係數、以及目前第四係數所組成的2χ2矩陣 (matrix) ’ Wn_l為一個由先前第一係數、先前第二係數、 先前第三係數、以及先前第四係數所組成的2X2矩陣,I為 一個2x2單位矩陣(unit matrix),u為一個由第一已過濾訊號 及第二已過濾訊號所組成的2x1行矩陣(c〇iumn matrix),而 且111為一個列矩陣(row matrix),其中uT為行矩陣u的一個 I28778,9799pi, 轉置矩陣(transpose)。 目前第一係數、目前第二係數、目前第三係數、以及 目前第四係數分別為Wnll,Wn21, Wnl2,及Wn22,先前第 一係數、先前第二係數、先前第三係數、以及先前第四係 數分別為Wn-111,Wn-121,Wn-112,及Wn-122,而且第 _ 已 過遽Λ號及苐二已過滤> 訊號分別為u 1及u2。 右通道訊號與左通道訊號可互相交換,而結果不變。 右通道訊號與左通道訊號,可為從包括一.CD播放 器、一個DVD播放器、一個聲音卡帶播放器、或一個?]^ 聲音廣播接收器的一個音響系統(audi〇 system)所輪出的2 通道立體聲數位訊號。 ' 根據本發明的另一觀點,本發明提供一種分離音樂與 箄音之方法。該方法包括··由獨立構件分析器接收組成 音樂及聲音構件的一個第一已過濾訊號及一個第二已過 濾訊號,並且輸出一個目前第一係數、一個目前第二係 數 個目剞苐二係數、以及一個目前第四係數;⑴)響應i 第二係數的一個最高有效位元與第三係數的一個最高有 效位兀’ I生-個多卫器控制訊號;(c)接收代表可聽訊號 的一個右,道訊號與一個左通道訊號,並且輸出第一已過 滤訊號及Ϊ二已過濾訊號;以及(d)響應多卫11控制訊號的 it輯狀L ’選擇性地輸出第一已過濾訊號或第二已過濾 訊號。 y驟((〇可更加包括:⑴藉由將右通道訊號乘以目前第 -係數’產生-個第—乘積訊號;⑼藉由將右通道訊號乘 12877晛 9pif 以目前第二係數,產生一個第二乘積訊號;(iii)藉由將左 通道訊號乘以目前第三係數,產生一個第三乘積訊號;(|ν) 藉由將左通道訊號乘以目前第四係數,產生一個第四乘積 訊號;(V)藉由將第一乘積訊號加上第三乘積訊號,產生第 一已過濾訊號;以及(vi)藉由將第二乘積訊號加上第四乘 積訊號,產生第二已過濾訊號。 獨立構件分析器可從下列公式,計算目前第一係數、 目前第二係數、目前第三係數、以及目前第四係數:
Wn = Wn-1 + (I - 2tanh(u)uT)Wn-l, 其中,Wn為一個由目前第一係數、目前第二係數、 目前第三係數、以及目前第四係數所組成的2x2矩陣,Wn-1 為一個由先前第一係數、先前第二係數、先前第三係數、 以及先前第四係%所組成的2x2矩陣,I為一個2x2單位矩 陣,u為一個由第一已過濾訊號及第二已過濾訊號所組成 的2x1行矩陣,而且UT為一個列矩陣,其中UT為行矩陣u的 一個轉置矩陣。 目前第一係數、目前第二係數、目前第三係數、以及 目前第四係數分別為Wnll,Wn21,Wnl2,及Wn22,先前第 一係數、先前第二係數、先前第三係數、以及先前第四係 數分別為 Wn-111,Wn-121,Wn-112,及Wn-122,而且第一已 過濾訊號及第二已過濾訊號分別為ul及u2。 右通道訊號與左通道訊號可互相交換,而結果不變。 右通道訊號與左通道訊號,可為從包括一個CD播放 器、一個DVD播放器、一個聲音卡帶播放器、或一個fm 1287789 1 3799pif.doc 聲音廣播接收器的-個音響系統所輸出的2通道立 位訊號。 為讓本發明之上述和其他目的、特徵、和優點能更明 顯易懂’下域吨佳實闕,並配合所關式,作詳細 說明如下: 【實施方式】 以下參考所附繪圖,詳細說明本發明的較佳實施例, e亥些繪圖係繪示本發明的較佳實施例。雖然如此,本發明 亦可以各種不同形式貫現,並不以在此所說明的實施例為 限。在此所提供的實施例係為提供熟習相關技藝者,更加 了解本發明的細節與範疇之用。 請參考第1圖所示,其係繪示一個根據本發明一較佳 實施例的一個音樂與聲音分離裝置10()的方塊圖。該裝置 100包括一個獨立構件分析器11〇、一個音樂訊號選擇器 120、一個過濾器130、以及一個多工器14〇。 獨立構件分析器11〇接收一個第一輸出訊及 一個第二輸出訊號MAS2,且每一輸出訊號都是由一個音 樂吼號與一個聲音訊號所構成。獨立構件分析器11〇輸出 一個目前第一係數Wnll、一個目前第二係數Wn2卜一個 目前第三係數Wnl2、以及一個目前第四係數Wn22。而且 该些目别的係數都是使用獨立構件分析法計算而得。下標 η係代表獨立構件分析法的一個目前的重覆個數 (iteration)。 如下文的詳細說明,獨立構件分析法可將一個混合聲 1287789 1 3 7 99pi f. doc 音訊號,分離成個別的聲音訊號與音樂訊號。而且會儘量 放大聲音訊號與音樂訊號之間的獨立性。換言之,會將聲 音訊號與音樂訊號,恢復成其在混合之前的原始狀態。 該混合聲音訊號可藉由一或多個感測器感測而得。 音樂訊號選擇器120輸出一個具有一第一邏輯狀態 (如邏輯低狀態)及一第二邏輯狀態(如邏輯高狀態)的多工 器控制訊號。響應第二係數Wn21的最高有效位元的一第 二邏輯狀態,會輸出第一邏輯狀態。響應第三係數Wnl2 的最高有效位元的一第二邏輯狀態,會輸出第二邏輯狀 態。第二係數Wn21及第三係數Wnl2的最高有效位元, 具有代表正值或負值的正負符號(signs)。當該些最高有效 位元都在第二邏輯狀態時,第二係數Wn21及第三係數 Wnl2皆為負值。其中,第一輸出訊號MAS1及第二輸出 訊號MAS2,係為估算的音樂訊號。 過濾器130接收各自代表可聽訊號的一個右通道訊號 RAS及一個左通道訊號LAS。一個第一乘法器131將右通 道sfl號RAS與目前第一係數Wnl 1相乘,並且輸出一個第 一乘積結果。一個第三乘法器135將左通道訊號LAS與目 前第三係數Wnl2相乘,並且輸出一個第三乘積結果。一 個第一加法器138將第一乘積結果與第三乘積結果相加, 以產生第一輸出訊號MAS1。 一個第二乘法器133將右通道訊號RAS與目前第二 係數Wn21相乘,並且輸出一個第二乘積結果。一個第四 乘古态137將左通道訊號LAS與目前第四係數Wn22相 13 1287789 1 3799pif. 乘,並且輸出一個第四乘積結果。一個第二加法器139將 第二乘積結果與第四乘積結果相加,以產生第二輸出訊號 MAS2 〇 右通道訊號RAS與左通道訊號LAS,可為從包括一 個CD播放器、一個DVD播放器、一個聲音卡帶播放器、 或一個FM聲音廣播接收器的一個音響系統所輸出的2通 道立體聲數位訊號。如果將右通道訊號RAS與左通道訊號 LAS的數值交換,也會產生相同的結果。換言之,右通道 訊號RAS與左通道訊號LAS可互相交換,而結果不變。 多工器140響應多工器控制訊號的一邏輯狀態,輸出 第一輸出訊號MAS1或第二輸出訊號MAS2。如前所述, 第一輸出訊號MAS1及第二輸出訊號MAS2,係為不包含 聲音訊號的音樂訊號(即為歌曲伴奏部分)。使用者可經由 揚聲器(speaker),跨聽歌曲伴奏部分。 請參考第2圖所示,其係繪示一個用來說明根據本發 明一較佳實施例的一個獨立構件分析方法2〇〇的流程圖。 該流程圖係繪示用於如第1圖所示的二維前向式網路的一 種獨立構件分析法200。該獨立構件分析法2〇〇可藉由第 1圖的獨立構件分析器110執行。 第2圖的獨立構件分析法2〇〇控制如第1圖所示的一 個目前第一係數Wnll、一個目前第二係數Wn21、一個目 前第二係數Wnl2、以及一個目前第四係數%^]。獨立構 件分析法是以一個如在下列公式(1)中,如第丨圖所示的輸 出訊號MAS1及MAS2所組成的一個矩陣u的一個非線性 1287789 1 3799pi f.d 函數(tanh(u))。如上所述,輸出訊號MAS1及MAS2是由 一個音樂訊號及一個聲音訊號所組成。
Wn = Wn_ 1 + (I — 2tanh(u)uT) Wn-1, ......( 1) 其中,Wn為由目前的四個係數(亦即Wnll,Wn21, Wnl2,及Wn22)所組成的一個2x2矩陣,Wn-1為由先前的 四個係數(亦即 Wn-111,Wn-121,Wn-112,及 Wn-122)所組 成的一個2x2矩陣,I為一個2x2單位矩陣,u為一個由輸 出訊號所組成的2x1行矩陣,uT為一個列矩陣,而且UT 為行矩陣u的一個轉置矩陣。 在公式(1)中,當Wn是以具有目前的四個係數Wnll, Wn21,Wnl2,及Wn22所組成的一個2x2矩陣代表時,會 成立下列的公式(2)。同樣地,在公式(1)中,當wn-i是以 具有先前的四個係數Wn-111,Wn-121, Wn_l 12,及Wn_122 所組成的一個2x2矩陣代表時,會成立下列的公式(3)。因 為I為一個2x2單位矩陣,所以會成立下列的公式(句。因 為11為一個由輸出訊號MAS 1及MAS2所組成的2x 1行矩 陣,因此會成立下列的公式(5)。因為uT為行矩陣u的一 個轉置矩陣的列矩陣,所以會成立下列的公式(6)。根據公 式(2)及公式(5) ’目前第一係數Wnll、目前第二係數 Wn2卜目前第三係數Wnl2、以及目前第四係數Wn22, 係為組成矩陣Wn的元件。第一輸出訊號MAS1及第二輸 出號MAS2 ’各為組成矩陣u的及u2。 ……(2) 1287789 1 3 799pif.doc
Wn\\ W\2 Wn2\ Wn22_ 11 12' W^ll Wn_x22\ ...... (3) 1 0" 0 1 ul ~ MASl u2 — MAS2 (4) (5) [ul ul] = [mASI MASl] ...... (6) 在步驟S211中,當該裝置啟動之後,第1圖的獨立 構件分析器110會重置(reset)該裝置100,以分離音樂與聲 音。在步驟S213中,辨識當n=l重置時的一個初始狀態 (initial state)。在步驟S215中,接收預先設定為初始值 (initial value)的四個係數 W011,W021,W012,及 W022。接 下來在步驟S217中,獨立構件分析器110會接收公式(1) 的I及u。 接下來在步驟S219中,第1圖的獨立構件分析器110 會計算公式(1),並且在步驟S221中,輸出目前的四個係 數Wnll,Wn21,Wnl2,及Wn22。在步驟S223中,決定獨 立構件分析器110是否關閉。如果在步驟S223中決定獨 立構件分析器110並未關閉,則在步驟S225中,獨立構 件分析器110會將η的值加一,並且接下來重覆執行步驟 S215 到 S22卜 1287789 1 3799pif.doc 第2圖的獨立構件分析法200,是在一個很短的收斂 時間之内所執行。因此,當用來分離音樂與聲音的第1圖 的裝置100,被安裝在一個音響系統之上時,經由獨立構 件分析法2⑻估算所得的一個純音樂訊號(亦即沒有聲音 訊號的音樂訊號),會經由揚聲器輸出,因此使用者可即時 跨聽品質改善後的純音樂訊號。 士如上所述,根據本發明一較佳實施例,用來分離音樂 與聲音的第1圖的裝i 100,包括獨立構件分析器11〇, 用來接收組成音樂訊號及聲音訊號的輸出訊號MAS1及 MAS2,並且輸出由獨立構件分析法計算所得的目前第— 係數w^、目前第二係數Wn21、目前第三係數制2、 以及目前第四係數Wn22,以根據第一、第二、第三、及 第四係數(亦即各自為Wnll,Wn21,Wnl2,及Wn22),處理 輸入的聲音訊號RAS及LAS。因此,可從—混合訊號中 估出-音樂訊號與-聲音訊號,並且決定—純音樂訊號。 根據本發明一較佳實施例,用來分離音樂與聲音的第 1圖的裝置100,可選用獨立構件分析法,在一個很短的 收斂時間之内,從一混合訊號中,分離出一聲音訊號與一 音樂訊號。混合訊號的音樂訊號與聲音訊號,可各自獨立 記錄。第2圖的獨立構件分析法2〇〇,可根據在感測器記 錄位置中的差異,估算一個訊號混合處理。因此,使用者 可從其擁有的CDs、DVDs、聲音卡帶、4FM收音機中, 輕易地選擇伴奏部分,並且即時地聆聽品質改善過後的音 樂。使用者可單獨聆聽歌曲伴奏部分,或隨著伴奏部分跟 1287789 1 3799pif. 曰(也就疋加人自己所唱的歌詞)。此外,因為用來分離音 樂與聲音的獨立構件分析法相當簡單,*且用來執行 獨立構件分析法細所需的時間,—般而言不會太長,所 以=方法可輕易地由數位訊號處理器(Dsp)晶片或微處理 器實現。 雖然本發明已以較佳實施例揭露如上,然其並非用以 限定本發明,任何熟習此技藝者,在不脫離本發明之精神 ^範圍内,當可作各種之更動與潤飾,因此本發明之保護 範圍當視後附之申請專利範圍所界定者為準。 【圖式簡單說明】 第1圖係繪示一個根據本發明一較佳實施例的一個音 樂與聲音分離裝置的方塊圖。 第2圖係繪示一個流程圖,用來說明根據本發明一較 佳貫施例的一個獨立構件分析方法。 【主要元件符號說明】 100 :音樂與聲音分離裝置 11〇 :獨立構件分析器 120 :音樂訊號選擇器 13〇 :過濾器 131 :第一乘法器 133 :第二乘法器 135 :第三乘法器 137 :第四乘法器 138 :第一加法器 1 3799pif.doc 1287789 139 :第二加法器 140 :多工器 S211〜S225 ··流程步驟
Claims (1)
128778^⑽ 十、申請專利範圍: 1·一種從一混合訊號中分離音樂與聲音之裝置,該裝 置包括: ^衣 一獨立構件分析器,用來接收組成音樂與聲音構件的 一第一已過濾訊號及一第二已過濾訊號,並且輸出一目前 第一係數、一目前第二係數、一目前第三係數、以及一目 前第四係數; 一音樂訊號選擇器,響應該第二係數的一最高有效位 元與$亥第二係數的一最南有效位元’輸出一多工器控制訊 號; 一過濾器,接收代表可聽訊號的一右通道訊號及一左 通道訊號’並且輸出一第一已過滤訊號及一第二已過濾、訊 號;以及 一多工器,響應該多工器控制訊號,選擇性地輸出該 第/已過濾訊號或該第二已過濾訊號。 2·如申請專利範圍第1項所述之從一混合訊號中分離 音難與聲音之裝置,其中該過濾器更加包括: 一第一乘法器,將該右通道訊號乘以該第一係數,並 且輸出一第一乘積訊號; 一第二乘法器,將該右通道訊號乘以該第二係彰:,並 且輸出一第二乘積訊號; 一第三乘法器,將該左通道訊號乘以該第三係數,並 且輸出一第三乘積訊號; 一第四乘法器,將該左通道訊號乘以該第四係數,並 20 I2877^799pif. 且輸出一第四乘積訊號; 一第一加法器,將該第一乘積訊號加上該第三乘積气 號,以決定該第一已過濾訊號;以及 一弟^一加法器’將該第二乘積訊號加上該第四乘積气 號,以決定該第二已過濾訊號。 3·如申請專利範圍第1項所述之從一混合訊號中分離 音樂與聲音之裝置,其中該獨立構件分析器可從下列公 式,決定該目前第一係數、該目前第二係數、該目前第三 係數、以及該目前第四係數: Wn = Wn-1 +(1- 2tanh(u)uT)Wn-l? 其中,Wn為一由該目前第一係數、該目前第二係數、 該目前第三係數、以及該目前第四係數所組成的2χ2矩 陣,Wn-Ι為一由一先前第一係數、一先前第二係數、一 先前第三係數、以及一先前第四係數所組成的2χ2矩陣, I為一 2x2單位矩陣,u為一由該第一已過濾訊號及該第二 已過濾訊號所組成的2x1行矩陣,且uT為一列矩陣,其 中uT為該行矩陣u的一轉置矩陣。 4·如申請專利範圍第3項所述之從一混合訊號中分離 音樂與聲音之裝置,其中該目前第一係數、該目前第二係 數、該目前第三係數、以及該目前第四係數分別為Wnll, Wn21,Wnl2,及Wn22,該先前第一係數、該先前第二係 數、該先前第三係數、以及該先前第四係數分別為Wn-lu, Wn-121,Wn-112,及Wn-122,而且該第一已過濾訊號及該 弟二已過濾訊號分別為ul及u2。 Ι2877^99ρι 5·如申請專利範圍第1項所述之從一混合訊號中分離 音樂與聲音之裝置,其中該右通道訊號與該左通道訊號可 互相交換,而結果不 變。 6·如申請專利範圍第1項所述之從一混合訊號中分離 :樂與聲音之裝置,其中該右通道訊號與該左通道訊號, 可為從一音響系統所輸出的2通道立體聲數位訊號。 7.如申请專利範圍第6項所述之從一混合訊號中分離 音樂與聲音之裝置,其中該音響系統係為一 CD播放器、 一 DVD播放器、一聲音卡帶播放器、及一 FM聲音廣播 接收器的其中之一。 8·一種從一混合訊號中分離音樂與聲音之方法,該方 法包括: 々(a)由一獨立構件分析器接收組成音樂及聲音構件的 #第一已過濾訊號及一第二已過濾訊號,並且輸出一目前 ^ #係數 目鈿弟二係數、一目前第三係數、以及一目 前第四係數; 、(b)響應该第二係數的一最高有效位元與該第三係數 的一最高有效位元,產生一多工器控制訊號; (C)接收代表可聽訊號的一右通道訊號與一左通道訊 =,並且輸出該第一已過濾訊號及該第二已過濾訊號;以 及 響應该多工器控制訊號的一邏輯狀態,選擇性地輸 出該第一已過濾訊號或該第二已過濾訊號。 9.如申請專利範圍第8項所述之從一混合訊號中分離 22 1287789 13799pif.doc 音樂與聲音之方法,其中該步驟(C)更加包括: ⑴藉由將該右通道訊號乘以該目前第一係數,產生一 苐一乘積訊號; (ii) 藉由將該右通道訊號乘以該目前第二係數,產生一 苐'一乘積訊號, (iii) 藉由將該左通道訊號乘以該目前第三係數,產生 一第三乘積訊號; (iv) 藉由將該左通道訊號乘以該目前第四係數,產生 一第四乘積訊號; (v) 藉由將該第一乘積訊號加上該第三乘積訊號,產生 該第一已過濾、訊號;以及 (vi) 藉由將該第二乘積訊號加上該第四乘積訊號,產 生該第二已過濾訊號。 10.如申請專利範圍第8項所述之從一混合訊號中分 離音樂與聲音之方法,其中該獨立構件分析器可從下列公 式,決定該目前第一係數、該目前第二係數、該目前第三 係數、以及該目前第四係數: Wn = Wn-1 + (I 一 2tanh(u)uT)Wn-l, 其中,Wn為一由該目前第一係數、該目前第二係數、 該目前第三係數、以及該目前第四係數所組成的2χ2矩 陣,Wn-Ι為一由該先前第一係數、該先前第二係數、該先 前第三係數、以及該先前第四係數所組成的2χ2矩陣,;[為 一2x2單位矩陣’ u為一由該第一已過濾訊號及該第二已過 滤§fl號所組成的2x1行矩陣,且ut為一列矩陣,其中uTg 23 12877耽㈣.- 該行矩陣U的一轉置矩陣。 11·如申請專利範圍第10項所述之從一混合汛號中刀 離音樂與聲音之方法,其中該目前第/係數、該目前第二 係數、該目前第三係數、以及該目前第四係數分別為德11, Wn2l, Wnl2,及Wn22,該先前第〆係數、該先前第二係 數、該先前第三係數、以及該先前第四係數分別為Wn-111, Wn_121,Wn_112,及Wn-122,而且該第一已過濾訊號及該 第二已過濾訊號分別gul&u2。 12·如申請專利範圍第8項所述之從一混合訊號中分 離音樂與聲音之方法,其中該右通道訊號與該左通道訊號 可互相交換,而結果不變。 13.如申請專利範圍第8項所述之從一混合訊號中分 離音樂與聲音之方法,其中該右通道訊號與該左通道訊 號,可為從一音響系統所輸出的2通道立體聲數位訊號。 14·如申明專利範圍第13項所述之從一混合訊號中分 離音樂與1之方法,其巾該音響系統係為—CD播放器、 DVD播放ϋ、_聲音卡帶播放器、及—疆 收器的其中之一。 ~
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020030035304A KR100555499B1 (ko) | 2003-06-02 | 2003-06-02 | 2차 전방향 네트워크에 독립 해석 알고리즘을 이용하는반주/보이스 분리 장치 및 그 방법 |
Publications (2)
Publication Number | Publication Date |
---|---|
TW200514039A TW200514039A (en) | 2005-04-16 |
TWI287789B true TWI287789B (en) | 2007-10-01 |
Family
ID=34056782
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
TW093115048A TWI287789B (en) | 2003-06-02 | 2004-05-27 | Apparatus and method for separating music and voice using independent component analysis algorithm for two-dimensional forward network |
Country Status (5)
Country | Link |
---|---|
US (1) | US7122732B2 (zh) |
JP (1) | JP4481729B2 (zh) |
KR (1) | KR100555499B1 (zh) |
CN (1) | CN100587805C (zh) |
TW (1) | TWI287789B (zh) |
Families Citing this family (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7409375B2 (en) * | 2005-05-23 | 2008-08-05 | Knowmtech, Llc | Plasticity-induced self organizing nanotechnology for the extraction of independent components from a data stream |
FI119133B (fi) | 2005-04-28 | 2008-07-31 | Elekta Ab | Menetelmä ja laite häiriön poistamiseksi sähkömagneettisesta monikanavamittauksesta |
FR2891651B1 (fr) * | 2005-10-05 | 2007-11-09 | Sagem Comm | Systeme de karaoke pour l'affichage du texte correspondant a la partie vocale d'un flux audiovisuel sur un ecran d'un systeme audiovisuel |
CN101345047B (zh) * | 2007-07-12 | 2012-09-05 | 英业达股份有限公司 | 人声自动校正的混音系统及其混音方法 |
US7928307B2 (en) * | 2008-11-03 | 2011-04-19 | Qnx Software Systems Co. | Karaoke system |
CN101577117B (zh) * | 2009-03-12 | 2012-04-11 | 无锡中星微电子有限公司 | 伴奏音乐提取方法及装置 |
KR101615262B1 (ko) | 2009-08-12 | 2016-04-26 | 삼성전자주식회사 | 시멘틱 정보를 이용한 멀티 채널 오디오 인코딩 및 디코딩 방법 및 장치 |
CN104134444B (zh) * | 2014-07-11 | 2017-03-15 | 福建星网视易信息系统有限公司 | 一种基于mmse的歌曲去伴奏方法和装置 |
CN104269174B (zh) * | 2014-10-24 | 2018-02-09 | 北京音之邦文化科技有限公司 | 一种音频信号的处理方法及装置 |
CN105869617A (zh) * | 2016-03-25 | 2016-08-17 | 北京海尔集成电路设计有限公司 | 一种基于中国数字音频广播的卡拉ok装置 |
CN110232931B (zh) * | 2019-06-18 | 2022-03-22 | 广州酷狗计算机科技有限公司 | 音频信号的处理方法、装置、计算设备及存储介质 |
US11501752B2 (en) | 2021-01-20 | 2022-11-15 | International Business Machines Corporation | Enhanced reproduction of speech on a computing system |
Family Cites Families (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3204034A (en) * | 1962-04-26 | 1965-08-31 | Arthur H Ballard | Orthogonal polynomial multiplex transmission systems |
US4587620A (en) * | 1981-05-09 | 1986-05-06 | Nippon Gakki Seizo Kabushiki Kaisha | Noise elimination device |
US5210366A (en) * | 1991-06-10 | 1993-05-11 | Sykes Jr Richard O | Method and device for detecting and separating voices in a complex musical composition |
US5340317A (en) * | 1991-07-09 | 1994-08-23 | Freeman Michael J | Real-time interactive conversational apparatus |
US5353376A (en) * | 1992-03-20 | 1994-10-04 | Texas Instruments Incorporated | System and method for improved speech acquisition for hands-free voice telecommunication in a noisy environment |
US5377302A (en) * | 1992-09-01 | 1994-12-27 | Monowave Corporation L.P. | System for recognizing speech |
US5649234A (en) * | 1994-07-07 | 1997-07-15 | Time Warner Interactive Group, Inc. | Method and apparatus for encoding graphical cues on a compact disc synchronized with the lyrics of a song to be played back |
JP2882364B2 (ja) * | 1996-06-14 | 1999-04-12 | 日本電気株式会社 | 雑音消去方法及び雑音消去装置 |
JP3496411B2 (ja) * | 1996-10-30 | 2004-02-09 | ソニー株式会社 | 情報符号化方法及び復号化装置 |
KR100231449B1 (ko) | 1996-11-29 | 1999-11-15 | 전주범 | 오디오신호의 음성 및 배경음악 분리회로 |
JP3152292B2 (ja) * | 1997-04-15 | 2001-04-03 | 日本電気株式会社 | 多チャネルエコー除去方法及び装置 |
US5898119A (en) * | 1997-06-02 | 1999-04-27 | Mitac, Inc. | Method and apparatus for generating musical accompaniment signals, and method and device for generating a video output in a musical accompaniment apparatus |
US6144937A (en) * | 1997-07-23 | 2000-11-07 | Texas Instruments Incorporated | Noise suppression of speech by signal processing including applying a transform to time domain input sequences of digital signals representing audio information |
JP3890692B2 (ja) * | 1997-08-29 | 2007-03-07 | ソニー株式会社 | 情報処理装置及び情報配信システム |
US6038535A (en) * | 1998-03-23 | 2000-03-14 | Motorola, Inc. | Speech classifier and method using delay elements |
JP3351352B2 (ja) * | 1998-09-24 | 2002-11-25 | ヤマハ株式会社 | 映像切換装置 |
WO2000046789A1 (fr) * | 1999-02-05 | 2000-08-10 | Fujitsu Limited | Detecteur de la presence d'un son et procede de detection de la presence et/ou de l'absence d'un son |
ATE403932T1 (de) * | 1999-08-18 | 2008-08-15 | Sony Corp | Wiedergabevorrichtung |
US7072833B2 (en) * | 2000-06-02 | 2006-07-04 | Canon Kabushiki Kaisha | Speech processing system |
US6985858B2 (en) * | 2001-03-20 | 2006-01-10 | Microsoft Corporation | Method and apparatus for removing noise from feature vectors |
KR100429896B1 (ko) * | 2001-11-22 | 2004-05-03 | 한국전자통신연구원 | 잡음 환경에서의 음성신호 검출방법 및 그 장치 |
-
2003
- 2003-06-02 KR KR1020030035304A patent/KR100555499B1/ko active IP Right Grant
-
2004
- 2004-05-27 TW TW093115048A patent/TWI287789B/zh not_active IP Right Cessation
- 2004-06-01 JP JP2004163722A patent/JP4481729B2/ja not_active Expired - Lifetime
- 2004-06-02 US US10/859,469 patent/US7122732B2/en active Active
- 2004-06-02 CN CN200410046551A patent/CN100587805C/zh not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
US7122732B2 (en) | 2006-10-17 |
JP2004361957A (ja) | 2004-12-24 |
CN100587805C (zh) | 2010-02-03 |
TW200514039A (en) | 2005-04-16 |
JP4481729B2 (ja) | 2010-06-16 |
CN1573920A (zh) | 2005-02-02 |
US20050056140A1 (en) | 2005-03-17 |
KR100555499B1 (ko) | 2006-03-03 |
KR20040103683A (ko) | 2004-12-09 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
TWI287789B (en) | Apparatus and method for separating music and voice using independent component analysis algorithm for two-dimensional forward network | |
KR100458021B1 (ko) | 기록/재생용 다중 채널 오디오 강화 시스템 및 그 제공 방법 | |
US20050286725A1 (en) | Pseudo-stereo signal making apparatus | |
JP2002508616A (ja) | オーディオ信号処理方法および装置 | |
TW201119420A (en) | Virtual audio processing for loudspeaker or headphone playback | |
JP5577787B2 (ja) | 信号処理装置 | |
EP1459596A2 (en) | Circuit and method for enhancing a stereo signal | |
CN1321545C (zh) | 环场音效耳机输出信号生成装置 | |
US20040246862A1 (en) | Method and apparatus for signal discrimination | |
WO2020057050A1 (zh) | 直达声与背景声提取方法、扬声器系统及其声重放方法 | |
JP3271532B2 (ja) | 電気弦楽器の音像定位装置 | |
WO2006022248A1 (ja) | 音処理装置、音処理方法、音処理プログラムおよび音処理プログラムを記録した記録媒体 | |
Bhalani et al. | Karaoke Machine implementation and validation using Out of Phase Stereo method | |
JPH1118199A (ja) | 音響処理装置 | |
JP4435452B2 (ja) | 信号処理装置、信号処理方法、プログラムおよび記録媒体 | |
KR100667814B1 (ko) | 전기 기타의 톤 및 이펙터 기능을 갖는 휴대용 오디오 재생장치 | |
JP2007181135A (ja) | 特定楽器信号分離方法ならびに装置、およびこれらを備えた楽器スピーカシステムならびに音楽再生システム | |
JPS5927160B2 (ja) | 擬似ステレオ音再生装置 | |
JPH11331982A (ja) | 音響処理装置 | |
KR200164977Y1 (ko) | 다채널오디오재생시스템의 보컬(vocal)레벨조정장치 | |
JPH06153300A (ja) | ステレオ信号処理装置 | |
JP2583300Y2 (ja) | 音場制御装置 | |
JPH08331700A (ja) | 疑似ステレオ化方法及び装置 | |
JP2013182188A (ja) | 情報処理装置、情報処理方法およびプログラム | |
JPH08331699A (ja) | 疑似ステレオ化方法及び装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
MM4A | Annulment or lapse of patent due to non-payment of fees |