TWI287789B - Apparatus and method for separating music and voice using independent component analysis algorithm for two-dimensional forward network - Google Patents

Apparatus and method for separating music and voice using independent component analysis algorithm for two-dimensional forward network Download PDF

Info

Publication number
TWI287789B
TWI287789B TW093115048A TW93115048A TWI287789B TW I287789 B TWI287789 B TW I287789B TW 093115048 A TW093115048 A TW 093115048A TW 93115048 A TW93115048 A TW 93115048A TW I287789 B TWI287789 B TW I287789B
Authority
TW
Taiwan
Prior art keywords
signal
coefficient
current
music
sound
Prior art date
Application number
TW093115048A
Other languages
English (en)
Other versions
TW200514039A (en
Inventor
Nam-Ik Cho
Jun-Won Choi
Hyung-Il Koo
Original Assignee
Samsung Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Samsung Electronics Co Ltd filed Critical Samsung Electronics Co Ltd
Publication of TW200514039A publication Critical patent/TW200514039A/zh
Application granted granted Critical
Publication of TWI287789B publication Critical patent/TWI287789B/zh

Links

Classifications

    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B31/00Arrangements for the associated working of recording or reproducing apparatus with related apparatus
    • G11B31/02Arrangements for the associated working of recording or reproducing apparatus with related apparatus with automatic musical instruments
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0272Voice signal separating
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H1/00Details of electrophonic musical instruments
    • G10H1/02Means for controlling the tone frequencies, e.g. attack or decay; Means for producing special musical effects, e.g. vibratos or glissandos
    • G10H1/06Circuits for establishing the harmonic content of tones, or other arrangements for changing the tone colour
    • G10H1/12Circuits for establishing the harmonic content of tones, or other arrangements for changing the tone colour by filtering complex waveforms
    • G10H1/125Circuits for establishing the harmonic content of tones, or other arrangements for changing the tone colour by filtering complex waveforms using a digital filter
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H1/00Details of electrophonic musical instruments
    • G10H1/36Accompaniment arrangements
    • G10H1/361Recording/reproducing of accompaniment for use with an external source, e.g. karaoke systems
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H2210/00Aspects or methods of musical processing having intrinsic musical character, i.e. involving musical theory or musical parameters or relying on musical knowledge, as applied in electrophonic musical tools or instruments
    • G10H2210/031Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal
    • G10H2210/046Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal for differentiation between music and non-music signals, based on the identification of musical parameters, e.g. based on tempo detection
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H2210/00Aspects or methods of musical processing having intrinsic musical character, i.e. involving musical theory or musical parameters or relying on musical knowledge, as applied in electrophonic musical tools or instruments
    • G10H2210/031Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal
    • G10H2210/056Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal for extraction or identification of individual instrumental parts, e.g. melody, chords, bass; Identification or separation of instrumental parts by their characteristic voices or timbres

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Quality & Reliability (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Stereophonic System (AREA)
  • Reverberation, Karaoke And Other Acoustics (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)
  • Signal Processing Not Specific To The Method Of Recording And Reproducing (AREA)

Description

I2877^99pif.doc 九、發明說明: 【發明所屬之技術領域】 本發明是有關於-種歌曲伴奏裂置及方法,且較特別 的是,有關於-種可消除音樂及聲音訊號的混合訊號中的 聲音訊號的歌曲伴奏裝置及方法。 【先前技術】 具卡拉OK(kara〇ke)功能的歌曲伴奏裝置(s〇ng accompaniment apparatus),目前已廣泛用在歌唱和/或娛樂 方面歌曲伴奏裝置通常會輪出歌曲伴奏部分(so% 謂mpaniment) ’以供使用者跟唱。另一方面,使用 I不 只欣f其中的音樂部分—•在此所用 斑往矣奏係代表沒有聲音部分(Voice acc〇mpaniment) 的曰木伴奏部分。在這種歌曲伴奏裝置中,一般都合使用 記憶體來儲存使用者所選取的歌: t定:歌曲伴奏裝置中的歌曲伴奏部分的: 是相己儲存容量。所以像這樣的歌曲伴奏裝置一般都 di% C_;器卡=普通光碟(c—t 放4供。使用者可播放自己擁有的CDs p = 页。同樣地,如果可從調頻汗馗)聲 s以 音機)中消除聲音,使口有歌隸矣的輪出(例如從收 地提供卡嫌功能使二則亦可輕易 使用者可播放自己喜愛的 12877视 9pi f.doc 收音機頻道的歌曲。 從CD播放器、DVD播放器、卡帶播放器、以&FM收 音機所輸出的聲音訊號(acoustic signals),一般會包含一個 音樂及聲音訊號的混合訊號(mixture)。目前所用的各種從 混合訊號中消除聲音訊號的技術,都不盡完善。從混合訊 號中消除聲音訊號的一般方法包括:將聲音訊號轉換為頻 域(frequency domains),並且移除出現聲音訊號的特定波段 (bands)。一般是使用一種快速傅立葉轉換(fast F〇urier transform,FFT)或是次波段(subband)過濾的方式,執行頻域 轉換。美國專利第5,375,188號(1994年12月24曰)揭露一種 使用這種頻率轉換方法,從混合訊號中移除聲音訊號之方 法0 然而,因為某些音樂訊號構件是包含在與聲音訊號相 同的頻率波段中,當移除該些頻率波段時,在數KHz範圍 中的某些音樂訊號也會遺失’因此會降低輸出伴奏的品 質。為降低混合訊號中的音樂訊號流失,目前已經嘗試使 用一種方式來偵測聲音訊號的音調頻率(pitch frequency),並且只移除該音調(pitch)的頻域(frequenCy domain)。然而,因為音樂訊號的影響,所以很難彳貞測聲音 訊號的音調,因此這種方法並非相當可靠。 【發明内容】 有鑑於此,本發明提供一種使用在二維前向式網路 (two-dimensional forward network)中所用的獨立構件分析 演算法(independent component analysis algorithm),在一個 1287789 1 3799pif.doc 很短的收斂時間(convergence time)之内,從聲音及音樂訊 5虎的一混合訊5虎中’分離聲音訊號與音樂訊號之裝置。該 裝置根據感測器(sensors)的記錄位置差異,估算一訊號混 合處理(signal mixing process) 〇 本發明提供一種使用在二維前向式網路中所用的獨 立構件分析演算法,在一個很短的收斂時間之内,從聲音 及音樂訊號的一混合訊號中,分離聲音訊號與音樂訊號之 方法。該方法根據感測器的記錄位置差異,估算一訊號混 合處理。 根據本發明的一觀點,本發明提供一種從一混合訊號 中分離音樂與聲音之裝置。該裝置包括一個獨立構件分析 器、一個音樂訊號選擇器、一個過濾器、以及一個多工器 (multiplexer) 〇 獨立構件分析器接收‘組成音樂及聲音構件的一個第 一已過濾訊號(first filtered signal)及一個第二已過濾訊號 (second filtered signal),並且輸出使用一個獨立構件分析法 所決定的一個目前第一係數(current first coefficient)、一個 目前第二係數(current second coefficient)、一個目前第三係 數(current third coefficient)、以及一個目前第四係數 (current fourth coefficient)。 響應苐^一係數的一個最而有效位元(most significant bit)與第三係數的一個最高有效位元,音樂訊號選擇器會輸 出一個多工器控制訊號(multiplexer control signal)。 過戚器接收代表可聽訊號(audible signals)的右通道訊 12877视 9pif 號(R channel signal)與左通道訊號(L channel signal),並且 輸出一個第一已過濾訊號及一個第二已過濾訊號。 多工器響應多工器控制訊號的一邏輯狀態,選擇性地 輸出第一已過濾訊號或第二已過濾訊號。 過滤1§可更加包括一個第一乘法器(multiplier),將右 通道訊號與第一係數相乘,並且輸出一個第一乘積訊號 (product signal); —個第二乘法器,將右通道訊號與第二係 數相乘,並且輸出一個第二乘積訊號;一個第三乘法器, 將左通道訊號與第三係數相乘,並且輸出一個第三乘積訊 號;一個第四乘法器,將左通道訊號與第四係數相乘,並 且輸出一個第四乘積訊號;一個第一加法器(adder),將第 一乘積訊號與第三乘積訊號相加,以決定第一已過濾訊 號;以及一個第二加法器,將第二乘積訊號與第四乘積訊 號相加,以決定第二已過濾訊號。 獨立構件分析器可從下列公式,計算目前第一係數、 目前第二係數、目前第三係數、以及目前第四係數:
Wn = Wn-1 +(1- 2tanh(u)uT)Wn-l5 其中,Wn為一個由目前第一係數、目前第二係數、 目前第三係數、以及目前第四係數所組成的2χ2矩陣 (matrix) ’ Wn_l為一個由先前第一係數、先前第二係數、 先前第三係數、以及先前第四係數所組成的2X2矩陣,I為 一個2x2單位矩陣(unit matrix),u為一個由第一已過濾訊號 及第二已過濾訊號所組成的2x1行矩陣(c〇iumn matrix),而 且111為一個列矩陣(row matrix),其中uT為行矩陣u的一個 I28778,9799pi, 轉置矩陣(transpose)。 目前第一係數、目前第二係數、目前第三係數、以及 目前第四係數分別為Wnll,Wn21, Wnl2,及Wn22,先前第 一係數、先前第二係數、先前第三係數、以及先前第四係 數分別為Wn-111,Wn-121,Wn-112,及Wn-122,而且第 _ 已 過遽Λ號及苐二已過滤> 訊號分別為u 1及u2。 右通道訊號與左通道訊號可互相交換,而結果不變。 右通道訊號與左通道訊號,可為從包括一.CD播放 器、一個DVD播放器、一個聲音卡帶播放器、或一個?]^ 聲音廣播接收器的一個音響系統(audi〇 system)所輪出的2 通道立體聲數位訊號。 ' 根據本發明的另一觀點,本發明提供一種分離音樂與 箄音之方法。該方法包括··由獨立構件分析器接收組成 音樂及聲音構件的一個第一已過濾訊號及一個第二已過 濾訊號,並且輸出一個目前第一係數、一個目前第二係 數 個目剞苐二係數、以及一個目前第四係數;⑴)響應i 第二係數的一個最高有效位元與第三係數的一個最高有 效位兀’ I生-個多卫器控制訊號;(c)接收代表可聽訊號 的一個右,道訊號與一個左通道訊號,並且輸出第一已過 滤訊號及Ϊ二已過濾訊號;以及(d)響應多卫11控制訊號的 it輯狀L ’選擇性地輸出第一已過濾訊號或第二已過濾 訊號。 y驟((〇可更加包括:⑴藉由將右通道訊號乘以目前第 -係數’產生-個第—乘積訊號;⑼藉由將右通道訊號乘 12877晛 9pif 以目前第二係數,產生一個第二乘積訊號;(iii)藉由將左 通道訊號乘以目前第三係數,產生一個第三乘積訊號;(|ν) 藉由將左通道訊號乘以目前第四係數,產生一個第四乘積 訊號;(V)藉由將第一乘積訊號加上第三乘積訊號,產生第 一已過濾訊號;以及(vi)藉由將第二乘積訊號加上第四乘 積訊號,產生第二已過濾訊號。 獨立構件分析器可從下列公式,計算目前第一係數、 目前第二係數、目前第三係數、以及目前第四係數:
Wn = Wn-1 + (I - 2tanh(u)uT)Wn-l, 其中,Wn為一個由目前第一係數、目前第二係數、 目前第三係數、以及目前第四係數所組成的2x2矩陣,Wn-1 為一個由先前第一係數、先前第二係數、先前第三係數、 以及先前第四係%所組成的2x2矩陣,I為一個2x2單位矩 陣,u為一個由第一已過濾訊號及第二已過濾訊號所組成 的2x1行矩陣,而且UT為一個列矩陣,其中UT為行矩陣u的 一個轉置矩陣。 目前第一係數、目前第二係數、目前第三係數、以及 目前第四係數分別為Wnll,Wn21,Wnl2,及Wn22,先前第 一係數、先前第二係數、先前第三係數、以及先前第四係 數分別為 Wn-111,Wn-121,Wn-112,及Wn-122,而且第一已 過濾訊號及第二已過濾訊號分別為ul及u2。 右通道訊號與左通道訊號可互相交換,而結果不變。 右通道訊號與左通道訊號,可為從包括一個CD播放 器、一個DVD播放器、一個聲音卡帶播放器、或一個fm 1287789 1 3799pif.doc 聲音廣播接收器的-個音響系統所輸出的2通道立 位訊號。 為讓本發明之上述和其他目的、特徵、和優點能更明 顯易懂’下域吨佳實闕,並配合所關式,作詳細 說明如下: 【實施方式】 以下參考所附繪圖,詳細說明本發明的較佳實施例, e亥些繪圖係繪示本發明的較佳實施例。雖然如此,本發明 亦可以各種不同形式貫現,並不以在此所說明的實施例為 限。在此所提供的實施例係為提供熟習相關技藝者,更加 了解本發明的細節與範疇之用。 請參考第1圖所示,其係繪示一個根據本發明一較佳 實施例的一個音樂與聲音分離裝置10()的方塊圖。該裝置 100包括一個獨立構件分析器11〇、一個音樂訊號選擇器 120、一個過濾器130、以及一個多工器14〇。 獨立構件分析器11〇接收一個第一輸出訊及 一個第二輸出訊號MAS2,且每一輸出訊號都是由一個音 樂吼號與一個聲音訊號所構成。獨立構件分析器11〇輸出 一個目前第一係數Wnll、一個目前第二係數Wn2卜一個 目前第三係數Wnl2、以及一個目前第四係數Wn22。而且 该些目别的係數都是使用獨立構件分析法計算而得。下標 η係代表獨立構件分析法的一個目前的重覆個數 (iteration)。 如下文的詳細說明,獨立構件分析法可將一個混合聲 1287789 1 3 7 99pi f. doc 音訊號,分離成個別的聲音訊號與音樂訊號。而且會儘量 放大聲音訊號與音樂訊號之間的獨立性。換言之,會將聲 音訊號與音樂訊號,恢復成其在混合之前的原始狀態。 該混合聲音訊號可藉由一或多個感測器感測而得。 音樂訊號選擇器120輸出一個具有一第一邏輯狀態 (如邏輯低狀態)及一第二邏輯狀態(如邏輯高狀態)的多工 器控制訊號。響應第二係數Wn21的最高有效位元的一第 二邏輯狀態,會輸出第一邏輯狀態。響應第三係數Wnl2 的最高有效位元的一第二邏輯狀態,會輸出第二邏輯狀 態。第二係數Wn21及第三係數Wnl2的最高有效位元, 具有代表正值或負值的正負符號(signs)。當該些最高有效 位元都在第二邏輯狀態時,第二係數Wn21及第三係數 Wnl2皆為負值。其中,第一輸出訊號MAS1及第二輸出 訊號MAS2,係為估算的音樂訊號。 過濾器130接收各自代表可聽訊號的一個右通道訊號 RAS及一個左通道訊號LAS。一個第一乘法器131將右通 道sfl號RAS與目前第一係數Wnl 1相乘,並且輸出一個第 一乘積結果。一個第三乘法器135將左通道訊號LAS與目 前第三係數Wnl2相乘,並且輸出一個第三乘積結果。一 個第一加法器138將第一乘積結果與第三乘積結果相加, 以產生第一輸出訊號MAS1。 一個第二乘法器133將右通道訊號RAS與目前第二 係數Wn21相乘,並且輸出一個第二乘積結果。一個第四 乘古态137將左通道訊號LAS與目前第四係數Wn22相 13 1287789 1 3799pif. 乘,並且輸出一個第四乘積結果。一個第二加法器139將 第二乘積結果與第四乘積結果相加,以產生第二輸出訊號 MAS2 〇 右通道訊號RAS與左通道訊號LAS,可為從包括一 個CD播放器、一個DVD播放器、一個聲音卡帶播放器、 或一個FM聲音廣播接收器的一個音響系統所輸出的2通 道立體聲數位訊號。如果將右通道訊號RAS與左通道訊號 LAS的數值交換,也會產生相同的結果。換言之,右通道 訊號RAS與左通道訊號LAS可互相交換,而結果不變。 多工器140響應多工器控制訊號的一邏輯狀態,輸出 第一輸出訊號MAS1或第二輸出訊號MAS2。如前所述, 第一輸出訊號MAS1及第二輸出訊號MAS2,係為不包含 聲音訊號的音樂訊號(即為歌曲伴奏部分)。使用者可經由 揚聲器(speaker),跨聽歌曲伴奏部分。 請參考第2圖所示,其係繪示一個用來說明根據本發 明一較佳實施例的一個獨立構件分析方法2〇〇的流程圖。 該流程圖係繪示用於如第1圖所示的二維前向式網路的一 種獨立構件分析法200。該獨立構件分析法2〇〇可藉由第 1圖的獨立構件分析器110執行。 第2圖的獨立構件分析法2〇〇控制如第1圖所示的一 個目前第一係數Wnll、一個目前第二係數Wn21、一個目 前第二係數Wnl2、以及一個目前第四係數%^]。獨立構 件分析法是以一個如在下列公式(1)中,如第丨圖所示的輸 出訊號MAS1及MAS2所組成的一個矩陣u的一個非線性 1287789 1 3799pi f.d 函數(tanh(u))。如上所述,輸出訊號MAS1及MAS2是由 一個音樂訊號及一個聲音訊號所組成。
Wn = Wn_ 1 + (I — 2tanh(u)uT) Wn-1, ......( 1) 其中,Wn為由目前的四個係數(亦即Wnll,Wn21, Wnl2,及Wn22)所組成的一個2x2矩陣,Wn-1為由先前的 四個係數(亦即 Wn-111,Wn-121,Wn-112,及 Wn-122)所組 成的一個2x2矩陣,I為一個2x2單位矩陣,u為一個由輸 出訊號所組成的2x1行矩陣,uT為一個列矩陣,而且UT 為行矩陣u的一個轉置矩陣。 在公式(1)中,當Wn是以具有目前的四個係數Wnll, Wn21,Wnl2,及Wn22所組成的一個2x2矩陣代表時,會 成立下列的公式(2)。同樣地,在公式(1)中,當wn-i是以 具有先前的四個係數Wn-111,Wn-121, Wn_l 12,及Wn_122 所組成的一個2x2矩陣代表時,會成立下列的公式(3)。因 為I為一個2x2單位矩陣,所以會成立下列的公式(句。因 為11為一個由輸出訊號MAS 1及MAS2所組成的2x 1行矩 陣,因此會成立下列的公式(5)。因為uT為行矩陣u的一 個轉置矩陣的列矩陣,所以會成立下列的公式(6)。根據公 式(2)及公式(5) ’目前第一係數Wnll、目前第二係數 Wn2卜目前第三係數Wnl2、以及目前第四係數Wn22, 係為組成矩陣Wn的元件。第一輸出訊號MAS1及第二輸 出號MAS2 ’各為組成矩陣u的及u2。 ……(2) 1287789 1 3 799pif.doc
Wn\\ W\2 Wn2\ Wn22_ 11 12' W^ll Wn_x22\ ...... (3) 1 0" 0 1 ul ~ MASl u2 — MAS2 (4) (5) [ul ul] = [mASI MASl] ...... (6) 在步驟S211中,當該裝置啟動之後,第1圖的獨立 構件分析器110會重置(reset)該裝置100,以分離音樂與聲 音。在步驟S213中,辨識當n=l重置時的一個初始狀態 (initial state)。在步驟S215中,接收預先設定為初始值 (initial value)的四個係數 W011,W021,W012,及 W022。接 下來在步驟S217中,獨立構件分析器110會接收公式(1) 的I及u。 接下來在步驟S219中,第1圖的獨立構件分析器110 會計算公式(1),並且在步驟S221中,輸出目前的四個係 數Wnll,Wn21,Wnl2,及Wn22。在步驟S223中,決定獨 立構件分析器110是否關閉。如果在步驟S223中決定獨 立構件分析器110並未關閉,則在步驟S225中,獨立構 件分析器110會將η的值加一,並且接下來重覆執行步驟 S215 到 S22卜 1287789 1 3799pif.doc 第2圖的獨立構件分析法200,是在一個很短的收斂 時間之内所執行。因此,當用來分離音樂與聲音的第1圖 的裝置100,被安裝在一個音響系統之上時,經由獨立構 件分析法2⑻估算所得的一個純音樂訊號(亦即沒有聲音 訊號的音樂訊號),會經由揚聲器輸出,因此使用者可即時 跨聽品質改善後的純音樂訊號。 士如上所述,根據本發明一較佳實施例,用來分離音樂 與聲音的第1圖的裝i 100,包括獨立構件分析器11〇, 用來接收組成音樂訊號及聲音訊號的輸出訊號MAS1及 MAS2,並且輸出由獨立構件分析法計算所得的目前第— 係數w^、目前第二係數Wn21、目前第三係數制2、 以及目前第四係數Wn22,以根據第一、第二、第三、及 第四係數(亦即各自為Wnll,Wn21,Wnl2,及Wn22),處理 輸入的聲音訊號RAS及LAS。因此,可從—混合訊號中 估出-音樂訊號與-聲音訊號,並且決定—純音樂訊號。 根據本發明一較佳實施例,用來分離音樂與聲音的第 1圖的裝置100,可選用獨立構件分析法,在一個很短的 收斂時間之内,從一混合訊號中,分離出一聲音訊號與一 音樂訊號。混合訊號的音樂訊號與聲音訊號,可各自獨立 記錄。第2圖的獨立構件分析法2〇〇,可根據在感測器記 錄位置中的差異,估算一個訊號混合處理。因此,使用者 可從其擁有的CDs、DVDs、聲音卡帶、4FM收音機中, 輕易地選擇伴奏部分,並且即時地聆聽品質改善過後的音 樂。使用者可單獨聆聽歌曲伴奏部分,或隨著伴奏部分跟 1287789 1 3799pif. 曰(也就疋加人自己所唱的歌詞)。此外,因為用來分離音 樂與聲音的獨立構件分析法相當簡單,*且用來執行 獨立構件分析法細所需的時間,—般而言不會太長,所 以=方法可輕易地由數位訊號處理器(Dsp)晶片或微處理 器實現。 雖然本發明已以較佳實施例揭露如上,然其並非用以 限定本發明,任何熟習此技藝者,在不脫離本發明之精神 ^範圍内,當可作各種之更動與潤飾,因此本發明之保護 範圍當視後附之申請專利範圍所界定者為準。 【圖式簡單說明】 第1圖係繪示一個根據本發明一較佳實施例的一個音 樂與聲音分離裝置的方塊圖。 第2圖係繪示一個流程圖,用來說明根據本發明一較 佳貫施例的一個獨立構件分析方法。 【主要元件符號說明】 100 :音樂與聲音分離裝置 11〇 :獨立構件分析器 120 :音樂訊號選擇器 13〇 :過濾器 131 :第一乘法器 133 :第二乘法器 135 :第三乘法器 137 :第四乘法器 138 :第一加法器 1 3799pif.doc 1287789 139 :第二加法器 140 :多工器 S211〜S225 ··流程步驟

Claims (1)

128778^⑽ 十、申請專利範圍: 1·一種從一混合訊號中分離音樂與聲音之裝置,該裝 置包括: ^衣 一獨立構件分析器,用來接收組成音樂與聲音構件的 一第一已過濾訊號及一第二已過濾訊號,並且輸出一目前 第一係數、一目前第二係數、一目前第三係數、以及一目 前第四係數; 一音樂訊號選擇器,響應該第二係數的一最高有效位 元與$亥第二係數的一最南有效位元’輸出一多工器控制訊 號; 一過濾器,接收代表可聽訊號的一右通道訊號及一左 通道訊號’並且輸出一第一已過滤訊號及一第二已過濾、訊 號;以及 一多工器,響應該多工器控制訊號,選擇性地輸出該 第/已過濾訊號或該第二已過濾訊號。 2·如申請專利範圍第1項所述之從一混合訊號中分離 音難與聲音之裝置,其中該過濾器更加包括: 一第一乘法器,將該右通道訊號乘以該第一係數,並 且輸出一第一乘積訊號; 一第二乘法器,將該右通道訊號乘以該第二係彰:,並 且輸出一第二乘積訊號; 一第三乘法器,將該左通道訊號乘以該第三係數,並 且輸出一第三乘積訊號; 一第四乘法器,將該左通道訊號乘以該第四係數,並 20 I2877^799pif. 且輸出一第四乘積訊號; 一第一加法器,將該第一乘積訊號加上該第三乘積气 號,以決定該第一已過濾訊號;以及 一弟^一加法器’將該第二乘積訊號加上該第四乘積气 號,以決定該第二已過濾訊號。 3·如申請專利範圍第1項所述之從一混合訊號中分離 音樂與聲音之裝置,其中該獨立構件分析器可從下列公 式,決定該目前第一係數、該目前第二係數、該目前第三 係數、以及該目前第四係數: Wn = Wn-1 +(1- 2tanh(u)uT)Wn-l? 其中,Wn為一由該目前第一係數、該目前第二係數、 該目前第三係數、以及該目前第四係數所組成的2χ2矩 陣,Wn-Ι為一由一先前第一係數、一先前第二係數、一 先前第三係數、以及一先前第四係數所組成的2χ2矩陣, I為一 2x2單位矩陣,u為一由該第一已過濾訊號及該第二 已過濾訊號所組成的2x1行矩陣,且uT為一列矩陣,其 中uT為該行矩陣u的一轉置矩陣。 4·如申請專利範圍第3項所述之從一混合訊號中分離 音樂與聲音之裝置,其中該目前第一係數、該目前第二係 數、該目前第三係數、以及該目前第四係數分別為Wnll, Wn21,Wnl2,及Wn22,該先前第一係數、該先前第二係 數、該先前第三係數、以及該先前第四係數分別為Wn-lu, Wn-121,Wn-112,及Wn-122,而且該第一已過濾訊號及該 弟二已過濾訊號分別為ul及u2。 Ι2877^99ρι 5·如申請專利範圍第1項所述之從一混合訊號中分離 音樂與聲音之裝置,其中該右通道訊號與該左通道訊號可 互相交換,而結果不 變。 6·如申請專利範圍第1項所述之從一混合訊號中分離 :樂與聲音之裝置,其中該右通道訊號與該左通道訊號, 可為從一音響系統所輸出的2通道立體聲數位訊號。 7.如申请專利範圍第6項所述之從一混合訊號中分離 音樂與聲音之裝置,其中該音響系統係為一 CD播放器、 一 DVD播放器、一聲音卡帶播放器、及一 FM聲音廣播 接收器的其中之一。 8·一種從一混合訊號中分離音樂與聲音之方法,該方 法包括: 々(a)由一獨立構件分析器接收組成音樂及聲音構件的 #第一已過濾訊號及一第二已過濾訊號,並且輸出一目前 ^ #係數 目鈿弟二係數、一目前第三係數、以及一目 前第四係數; 、(b)響應该第二係數的一最高有效位元與該第三係數 的一最高有效位元,產生一多工器控制訊號; (C)接收代表可聽訊號的一右通道訊號與一左通道訊 =,並且輸出該第一已過濾訊號及該第二已過濾訊號;以 及 響應该多工器控制訊號的一邏輯狀態,選擇性地輸 出該第一已過濾訊號或該第二已過濾訊號。 9.如申請專利範圍第8項所述之從一混合訊號中分離 22 1287789 13799pif.doc 音樂與聲音之方法,其中該步驟(C)更加包括: ⑴藉由將該右通道訊號乘以該目前第一係數,產生一 苐一乘積訊號; (ii) 藉由將該右通道訊號乘以該目前第二係數,產生一 苐'一乘積訊號, (iii) 藉由將該左通道訊號乘以該目前第三係數,產生 一第三乘積訊號; (iv) 藉由將該左通道訊號乘以該目前第四係數,產生 一第四乘積訊號; (v) 藉由將該第一乘積訊號加上該第三乘積訊號,產生 該第一已過濾、訊號;以及 (vi) 藉由將該第二乘積訊號加上該第四乘積訊號,產 生該第二已過濾訊號。 10.如申請專利範圍第8項所述之從一混合訊號中分 離音樂與聲音之方法,其中該獨立構件分析器可從下列公 式,決定該目前第一係數、該目前第二係數、該目前第三 係數、以及該目前第四係數: Wn = Wn-1 + (I 一 2tanh(u)uT)Wn-l, 其中,Wn為一由該目前第一係數、該目前第二係數、 該目前第三係數、以及該目前第四係數所組成的2χ2矩 陣,Wn-Ι為一由該先前第一係數、該先前第二係數、該先 前第三係數、以及該先前第四係數所組成的2χ2矩陣,;[為 一2x2單位矩陣’ u為一由該第一已過濾訊號及該第二已過 滤§fl號所組成的2x1行矩陣,且ut為一列矩陣,其中uTg 23 12877耽㈣.- 該行矩陣U的一轉置矩陣。 11·如申請專利範圍第10項所述之從一混合汛號中刀 離音樂與聲音之方法,其中該目前第/係數、該目前第二 係數、該目前第三係數、以及該目前第四係數分別為德11, Wn2l, Wnl2,及Wn22,該先前第〆係數、該先前第二係 數、該先前第三係數、以及該先前第四係數分別為Wn-111, Wn_121,Wn_112,及Wn-122,而且該第一已過濾訊號及該 第二已過濾訊號分別gul&u2。 12·如申請專利範圍第8項所述之從一混合訊號中分 離音樂與聲音之方法,其中該右通道訊號與該左通道訊號 可互相交換,而結果不變。 13.如申請專利範圍第8項所述之從一混合訊號中分 離音樂與聲音之方法,其中該右通道訊號與該左通道訊 號,可為從一音響系統所輸出的2通道立體聲數位訊號。 14·如申明專利範圍第13項所述之從一混合訊號中分 離音樂與1之方法,其巾該音響系統係為—CD播放器、 DVD播放ϋ、_聲音卡帶播放器、及—疆 收器的其中之一。 ~
TW093115048A 2003-06-02 2004-05-27 Apparatus and method for separating music and voice using independent component analysis algorithm for two-dimensional forward network TWI287789B (en)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020030035304A KR100555499B1 (ko) 2003-06-02 2003-06-02 2차 전방향 네트워크에 독립 해석 알고리즘을 이용하는반주/보이스 분리 장치 및 그 방법

Publications (2)

Publication Number Publication Date
TW200514039A TW200514039A (en) 2005-04-16
TWI287789B true TWI287789B (en) 2007-10-01

Family

ID=34056782

Family Applications (1)

Application Number Title Priority Date Filing Date
TW093115048A TWI287789B (en) 2003-06-02 2004-05-27 Apparatus and method for separating music and voice using independent component analysis algorithm for two-dimensional forward network

Country Status (5)

Country Link
US (1) US7122732B2 (zh)
JP (1) JP4481729B2 (zh)
KR (1) KR100555499B1 (zh)
CN (1) CN100587805C (zh)
TW (1) TWI287789B (zh)

Families Citing this family (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7409375B2 (en) * 2005-05-23 2008-08-05 Knowmtech, Llc Plasticity-induced self organizing nanotechnology for the extraction of independent components from a data stream
FI119133B (fi) 2005-04-28 2008-07-31 Elekta Ab Menetelmä ja laite häiriön poistamiseksi sähkömagneettisesta monikanavamittauksesta
FR2891651B1 (fr) * 2005-10-05 2007-11-09 Sagem Comm Systeme de karaoke pour l'affichage du texte correspondant a la partie vocale d'un flux audiovisuel sur un ecran d'un systeme audiovisuel
CN101345047B (zh) * 2007-07-12 2012-09-05 英业达股份有限公司 人声自动校正的混音系统及其混音方法
US7928307B2 (en) * 2008-11-03 2011-04-19 Qnx Software Systems Co. Karaoke system
CN101577117B (zh) * 2009-03-12 2012-04-11 无锡中星微电子有限公司 伴奏音乐提取方法及装置
KR101615262B1 (ko) 2009-08-12 2016-04-26 삼성전자주식회사 시멘틱 정보를 이용한 멀티 채널 오디오 인코딩 및 디코딩 방법 및 장치
CN104134444B (zh) * 2014-07-11 2017-03-15 福建星网视易信息系统有限公司 一种基于mmse的歌曲去伴奏方法和装置
CN104269174B (zh) * 2014-10-24 2018-02-09 北京音之邦文化科技有限公司 一种音频信号的处理方法及装置
CN105869617A (zh) * 2016-03-25 2016-08-17 北京海尔集成电路设计有限公司 一种基于中国数字音频广播的卡拉ok装置
CN110232931B (zh) * 2019-06-18 2022-03-22 广州酷狗计算机科技有限公司 音频信号的处理方法、装置、计算设备及存储介质
US11501752B2 (en) 2021-01-20 2022-11-15 International Business Machines Corporation Enhanced reproduction of speech on a computing system

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3204034A (en) * 1962-04-26 1965-08-31 Arthur H Ballard Orthogonal polynomial multiplex transmission systems
US4587620A (en) * 1981-05-09 1986-05-06 Nippon Gakki Seizo Kabushiki Kaisha Noise elimination device
US5210366A (en) * 1991-06-10 1993-05-11 Sykes Jr Richard O Method and device for detecting and separating voices in a complex musical composition
US5340317A (en) * 1991-07-09 1994-08-23 Freeman Michael J Real-time interactive conversational apparatus
US5353376A (en) * 1992-03-20 1994-10-04 Texas Instruments Incorporated System and method for improved speech acquisition for hands-free voice telecommunication in a noisy environment
US5377302A (en) * 1992-09-01 1994-12-27 Monowave Corporation L.P. System for recognizing speech
US5649234A (en) * 1994-07-07 1997-07-15 Time Warner Interactive Group, Inc. Method and apparatus for encoding graphical cues on a compact disc synchronized with the lyrics of a song to be played back
JP2882364B2 (ja) * 1996-06-14 1999-04-12 日本電気株式会社 雑音消去方法及び雑音消去装置
JP3496411B2 (ja) * 1996-10-30 2004-02-09 ソニー株式会社 情報符号化方法及び復号化装置
KR100231449B1 (ko) 1996-11-29 1999-11-15 전주범 오디오신호의 음성 및 배경음악 분리회로
JP3152292B2 (ja) * 1997-04-15 2001-04-03 日本電気株式会社 多チャネルエコー除去方法及び装置
US5898119A (en) * 1997-06-02 1999-04-27 Mitac, Inc. Method and apparatus for generating musical accompaniment signals, and method and device for generating a video output in a musical accompaniment apparatus
US6144937A (en) * 1997-07-23 2000-11-07 Texas Instruments Incorporated Noise suppression of speech by signal processing including applying a transform to time domain input sequences of digital signals representing audio information
JP3890692B2 (ja) * 1997-08-29 2007-03-07 ソニー株式会社 情報処理装置及び情報配信システム
US6038535A (en) * 1998-03-23 2000-03-14 Motorola, Inc. Speech classifier and method using delay elements
JP3351352B2 (ja) * 1998-09-24 2002-11-25 ヤマハ株式会社 映像切換装置
WO2000046789A1 (fr) * 1999-02-05 2000-08-10 Fujitsu Limited Detecteur de la presence d'un son et procede de detection de la presence et/ou de l'absence d'un son
ATE403932T1 (de) * 1999-08-18 2008-08-15 Sony Corp Wiedergabevorrichtung
US7072833B2 (en) * 2000-06-02 2006-07-04 Canon Kabushiki Kaisha Speech processing system
US6985858B2 (en) * 2001-03-20 2006-01-10 Microsoft Corporation Method and apparatus for removing noise from feature vectors
KR100429896B1 (ko) * 2001-11-22 2004-05-03 한국전자통신연구원 잡음 환경에서의 음성신호 검출방법 및 그 장치

Also Published As

Publication number Publication date
US7122732B2 (en) 2006-10-17
JP2004361957A (ja) 2004-12-24
CN100587805C (zh) 2010-02-03
TW200514039A (en) 2005-04-16
JP4481729B2 (ja) 2010-06-16
CN1573920A (zh) 2005-02-02
US20050056140A1 (en) 2005-03-17
KR100555499B1 (ko) 2006-03-03
KR20040103683A (ko) 2004-12-09

Similar Documents

Publication Publication Date Title
TWI287789B (en) Apparatus and method for separating music and voice using independent component analysis algorithm for two-dimensional forward network
KR100458021B1 (ko) 기록/재생용 다중 채널 오디오 강화 시스템 및 그 제공 방법
US20050286725A1 (en) Pseudo-stereo signal making apparatus
JP2002508616A (ja) オーディオ信号処理方法および装置
TW201119420A (en) Virtual audio processing for loudspeaker or headphone playback
JP5577787B2 (ja) 信号処理装置
EP1459596A2 (en) Circuit and method for enhancing a stereo signal
CN1321545C (zh) 环场音效耳机输出信号生成装置
US20040246862A1 (en) Method and apparatus for signal discrimination
WO2020057050A1 (zh) 直达声与背景声提取方法、扬声器系统及其声重放方法
JP3271532B2 (ja) 電気弦楽器の音像定位装置
WO2006022248A1 (ja) 音処理装置、音処理方法、音処理プログラムおよび音処理プログラムを記録した記録媒体
Bhalani et al. Karaoke Machine implementation and validation using Out of Phase Stereo method
JPH1118199A (ja) 音響処理装置
JP4435452B2 (ja) 信号処理装置、信号処理方法、プログラムおよび記録媒体
KR100667814B1 (ko) 전기 기타의 톤 및 이펙터 기능을 갖는 휴대용 오디오 재생장치
JP2007181135A (ja) 特定楽器信号分離方法ならびに装置、およびこれらを備えた楽器スピーカシステムならびに音楽再生システム
JPS5927160B2 (ja) 擬似ステレオ音再生装置
JPH11331982A (ja) 音響処理装置
KR200164977Y1 (ko) 다채널오디오재생시스템의 보컬(vocal)레벨조정장치
JPH06153300A (ja) ステレオ信号処理装置
JP2583300Y2 (ja) 音場制御装置
JPH08331700A (ja) 疑似ステレオ化方法及び装置
JP2013182188A (ja) 情報処理装置、情報処理方法およびプログラム
JPH08331699A (ja) 疑似ステレオ化方法及び装置

Legal Events

Date Code Title Description
MM4A Annulment or lapse of patent due to non-payment of fees