TWI497486B - 呈現相容於不連續傳輸編解碼器之音樂信號的方法及實施此方法的裝置 - Google Patents

呈現相容於不連續傳輸編解碼器之音樂信號的方法及實施此方法的裝置 Download PDF

Info

Publication number
TWI497486B
TWI497486B TW099123655A TW99123655A TWI497486B TW I497486 B TWI497486 B TW I497486B TW 099123655 A TW099123655 A TW 099123655A TW 99123655 A TW99123655 A TW 99123655A TW I497486 B TWI497486 B TW I497486B
Authority
TW
Taiwan
Prior art keywords
signal
initial
silent
period
silent period
Prior art date
Application number
TW099123655A
Other languages
English (en)
Other versions
TW201129971A (en
Inventor
Jean-Yves Grand
Original Assignee
Alcatel Lucent
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alcatel Lucent filed Critical Alcatel Lucent
Publication of TW201129971A publication Critical patent/TW201129971A/zh
Application granted granted Critical
Publication of TWI497486B publication Critical patent/TWI497486B/zh

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • G10L19/265Pre-filtering, e.g. high frequency emphasis prior to encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10HELECTROPHONIC MUSICAL INSTRUMENTS; INSTRUMENTS IN WHICH THE TONES ARE GENERATED BY ELECTROMECHANICAL MEANS OR ELECTRONIC GENERATORS, OR IN WHICH THE TONES ARE SYNTHESISED FROM A DATA STORE
    • G10H2210/00Aspects or methods of musical processing having intrinsic musical character, i.e. involving musical theory or musical parameters or relying on musical knowledge, as applied in electrophonic musical tools or instruments
    • G10H2210/031Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal
    • G10H2210/046Musical analysis, i.e. isolation, extraction or identification of musical elements or musical parameters from a raw acoustic signal or from an encoded audio signal for differentiation between music and non-music signals, based on the identification of musical parameters, e.g. based on tempo detection
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/012Comfort noise or silence coding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • G10L2025/783Detection of presence or absence of voice signals based on threshold decision
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/78Detection of presence or absence of voice signals
    • G10L25/81Detection of presence or absence of voice signals for discriminating voice from music

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Computational Linguistics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Electrophonic Musical Instruments (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Telephone Function (AREA)
  • Signal Processing For Digital Recording And Reproducing (AREA)

Description

呈現相容於不連續傳輸編解碼器之音樂信號的方法及實施此方法的裝置 【發明所屬之技術領域】及【先前技術】
本發明關於呈現相容於不連續傳輸編解碼器之音樂信號的方法,諸如於電信網路中發現的編解碼器,特別係使用該網際網路協定的網路。編解碼器具有將音訊信號轉換為數位信號的特別功能。部分編解碼器稱為不連續傳輸編解碼器,因為彼等包括偵測無聲週期並防止將該等無聲週期期間之音訊信號編碼的語音活動偵測器。因此,避免使用資源傳輸實際上僅代表背景雜訊的資料。更精確地說,傳輸簡短的無聲指示,其為了聽者的舒適,命令在遠端解碼器產生人造雜訊。
若期望在經過此種不連續傳輸編解碼器的音訊頻道內傳輸音樂信號,該音樂信號在該語音活動偵測電路每次將幅振中的下降解釋為無聲時中斷。因此此種編解碼器與音樂信號的傳輸不相容。例如,若期望在廣告訊息期間或當使用者等候接聽時傳輸音樂,此係非常麻煩的。
一種解決方案係由從產生音樂信號之應用程式對該編解碼器下令所組成,以在該應用程式傳送音樂信號至該編解碼器之同時阻止對無聲週期的偵測。然而,此解決方案僅可應用在產生音樂信號的該應用程式可傳送此種指令信號至該編解碼器時。此在該編解碼器在遠端時係不可能的。
本發明的目的係呈現相容於不連續傳輸編解碼器之音樂信號,即使產生該信號的該應用程式在該應用程式傳送音樂信號至該編解碼器之同時不能在該編解碼器內阻止無聲週期的偵測。
本發明的目的係一種用於呈現相容於不連續傳輸編解碼器之音樂信號的方法,包含以下步驟:
-偵測初始音樂信號中的無聲週期,
-藉由不連續傳輸編解碼器產生輔助音訊信號,其振幅少於在該等無聲週期期間之該初始信號的振幅,但足以可不被偵測為無聲,
-以及在該無聲週期期間以該輔助信號置換該初始音樂信號。
因此該方法之特徵為呈現相容於不連續傳輸編解碼器之音樂信號,因為該最終信號仍具有充份的振幅,不被不連續傳輸編解碼器偵測為無聲。
本發明之另一目的係呈現相容於不連續傳輸編解碼器之音樂信號的裝置,其包含用於實作本發明方法的機構。
圖1描繪:
-初始音樂信號SI的圖形,
-輔助信號SA1的圖形,一種正弦波,其用於實作本發明方法的第一變化,
-以及在本發明方法實作後的最終音樂信號SF1的圖形。
在無聲週期S期間,最終信號SF1係藉由以輔助信號SA1置換該初始信號SI(背景雜訊)而得到,該輔助信號係預定振幅比初始信號SI之振幅更低且固定頻率,等於2100Hz加減15Hz,的正弦波信號為佳(該信號習知地用於阻隔回聲抵銷器)。在另一範例中,所使用的頻率等於2093Hz並對應於第七個八度中的音符MI。輔助信號SA1係藉由習知機構產生,例如,執行習知程式的信號處理器。
圖2描繪:
-初始音樂信號SI的圖形,
-輔助信號SA2的圖形,一種正弦波,其用於實作本發明方法的第二變化,
-以及在實作本發明方法之第二變化後的最終音樂信號SF1之圖形。
在無聲週期S期間,最終信號SF2係藉由以輔助信號SA2置換該初始信號SI(背景雜訊)而得到,該輔助信號優先係其振幅比初始信號SI更低、且其頻率可變成等於1/T的正弦波信號,其中T係恰在無聲週期S之前的該初始信號SI的基本頻率週期。
此頻率習知地係藉由信號處理器,經由傅立葉轉換判定。其次,此處理器藉由運行習知程式,在該頻率產生正弦波信號。此輔助信號SA2在該無聲週期期間置換初始信號SI。
根據另一實施例,該輔助信號係週期信號,而非正弦波信號,其係多個正弦波信號的和,該等正弦波信號各者具有比初始信號SI更低的振幅,及分別等於1/T之倍數的頻率:1/T、2/T、3/T等。
圖3描繪:
-初始音樂信號SI的圖形,
-輔助信號SA3的圖形,其用於實作本發明方法的第三變化,
-以及在本發明方法之第三變化實作後的最終音樂信號SF3的圖形。
在無聲週期S期間,最終信號SF3係藉由以輔助信號置換該初始信號SI(背景雜訊)而得到,該輔助信號優先等於恰在無聲週期S之前的該初始信號SI,但具有大幅減少的振幅。
根據一實施例,此輔助信號係藉由記錄在滑動時間窗中的該初始信號SI,並藉由從此記錄擷取恰在無聲週期S之前發生的音樂信號週期AB而判定。以習知方式藉由信號處理器偵測二個連續零通過,當偵測到無聲週期S時,判定記錄中之恰在無聲週期S之前的音樂信號週期AB。其次,該處理器重複地讀取週期AB的記錄,並以已降低之振幅重播,以填充整體無聲週期S。
根據另一實施例,輔助信號SA3係藉由以習知反響電路運行初始信號SI而得到,將該反響持續期間選擇成大於該無聲週期的最大持續期間。此輔助信號SA3在該無聲週期期間置換初始信號SI。
在所有此等實施例中,在該無聲週期外側,該輔助信號的振幅少於初始信號SI的指幅,但高到足以不被不連續傳輸編解碼器偵測為無聲。該輔助信號的相對等級可能係,例如,-31dB。
圖4功能地描繪本發明之用於呈現相容於不連續傳輸編解碼器之音樂信號的裝置(DCOMP)的範例實施例,其包含:接收初始信號SI的輸入,用於偵測無聲週期的裝置DPS,用於產生輔助信號的裝置DPA,具有第一及第二輸入、輸出、以及指令輸入的切換裝置C,-以及提供最終信號SF的輸出。
將最終信號SI施加至用於偵測無聲週期之裝置DPS的輸入、至用於產生輔助信號之裝置DPA的輸入、以及切換裝置C的第一輸入。將用於偵測無聲週期之裝置DPS的輸出連接至切換裝置C之指令的輸入。將用於產生輔助信號之裝置DPA的輸出連接至用於偵測無聲週期之裝置DPS的第二輸入。切換裝置C之輸出構成提供最終信號SF的該輸出。
當用於偵測無聲週期之裝置DPS未偵測到無聲週期時,其命令切換裝置C傳輸最終信號SI至裝置DCOMP的輸出。
當用於偵測無聲週期的裝置DPS偵測到無聲週期時, 其命令切換裝置C在該整體無聲週期持續期間將該輔助信號傳輸至裝置DCOMP的輸出。
此等裝置DPS及DPA可能以配有程式之信號處理器的形式,或以有線電路的形式構成。如上文所述,用於產生輔助信號的該裝置包含用於實作本發明方法之該等變化之一者的機構。
AB‧‧‧音樂信號週期
C‧‧‧切換裝置
DCOMP、DPA、DPS‧‧‧裝置
S‧‧‧無聲週期
SA‧‧‧輔助音訊信號
SI‧‧‧初始信號
SF‧‧‧最終信號
T‧‧‧基本頻率週期
藉由以下描述及該等隨附圖式的協助,將更好地理解本發明且其他特徵將變得更明顯。
圖1描繪說明本發明方法之第一變化的圖。
圖2描繪說明本發明方法之第二變化的圖。
圖3描繪說明本發明方法之第三變化的圖。
圖4描繪本發明裝置的範例實施例。

Claims (7)

  1. 一種用於呈現相容於不連續傳輸編解碼器之音樂信號的方法,包含以下步驟:偵測在初始音樂信號(SI)內的無聲週期(S),藉由不連續傳輸編解碼器產生輔助音訊信號,其振幅少於在該等無聲週期之外之該初始信號的振幅,但足以可不被偵測為無聲,並在該無聲週期(S)期間以該輔助信號(SA1;SA2;SA3)置換該初始音樂信號(SI)。
  2. 如申請專利範圍第1項之方法,其中輔助音訊信號的製造包含產生具有預定頻率之正弦波信號的該步驟。
  3. 如申請專利範圍第1項之方法,其中輔助音訊信號的製造包含以下步驟:判定恰在該無聲週期(S)之前的該初始信號(SI)週期之持續時間T,以及產生具有等於1/T之頻率的正弦波信號。
  4. 如申請專利範圍第1項之方法,其中輔助音訊信號的製造包含以下步驟:判定恰在無聲週期(S)之前的該初始信號(SI)週期之該初始(SI)的持續時間T,產生具有分別等於1/T的倍數之頻率的複數個正弦波信號,以及將此等信號共同相加以構成該輔助信號。
  5. 如申請專利範圍第1項之方法,其中輔助音訊信 號的製造包含:記錄該初始信號(SI)的步驟,以及在該初始信號(SI)的無聲週期(S)期間,讀取該記錄之一部分的步驟,該部分對應於恰在該無聲週期之前的該初始信號。
  6. 如申請專利範圍第5項之方法,其中該記錄之一部分的讀取包含以下步驟,該部分對應於恰該無聲週期之前的該初始信號:判定該初始信號(SI)的二連續零值通過,用於限定恰在該無聲週期(S)之前的該初始信號(SI)中的音樂信號週期(T),以及重複地讀取該音樂信號週期(T)的該記錄,以填滿該整個無聲週期(S)。
  7. 一種用於呈現相容於不連續傳輸編解碼器之音樂信號的裝置,包含用於實施如申請專利範圍第1至6項之任何一項之方法的機構。
TW099123655A 2009-09-02 2010-07-19 呈現相容於不連續傳輸編解碼器之音樂信號的方法及實施此方法的裝置 TWI497486B (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
FR0955963A FR2949582B1 (fr) 2009-09-02 2009-09-02 Procede pour rendre un signal musical compatible avec un codec a transmission discontinue ; et dispositif pour la mise en ?uvre de ce procede

Publications (2)

Publication Number Publication Date
TW201129971A TW201129971A (en) 2011-09-01
TWI497486B true TWI497486B (zh) 2015-08-21

Family

ID=42045385

Family Applications (1)

Application Number Title Priority Date Filing Date
TW099123655A TWI497486B (zh) 2009-09-02 2010-07-19 呈現相容於不連續傳輸編解碼器之音樂信號的方法及實施此方法的裝置

Country Status (10)

Country Link
US (1) US9251801B2 (zh)
EP (1) EP2473996B1 (zh)
JP (1) JP5384741B2 (zh)
KR (1) KR101347506B1 (zh)
CN (1) CN102640214B (zh)
BR (1) BR112012004769A2 (zh)
ES (1) ES2526125T3 (zh)
FR (1) FR2949582B1 (zh)
TW (1) TWI497486B (zh)
WO (1) WO2011026685A1 (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9065576B2 (en) 2012-04-18 2015-06-23 2236008 Ontario Inc. System, apparatus and method for transmitting continuous audio data
US9479887B2 (en) * 2012-09-19 2016-10-25 Nokia Technologies Oy Method and apparatus for pruning audio based on multi-sensor analysis
TWI476679B (zh) * 2012-11-21 2015-03-11 C Media Electronics Inc 虛擬訊號源產生裝置及其方法
US10225290B2 (en) * 2016-07-15 2019-03-05 Genband Us Llc Systems and methods for extending DSP capability of existing computing devices

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008003834A1 (en) * 2006-07-07 2008-01-10 Nokia Corporation Method and system for enhancing the discontinuous transmission functionality
TW200809771A (en) * 2006-06-30 2008-02-16 Fraunhofer Ges Forschung Audio encoder, audio decoder and audio processor having a dynamically variable warping characteristic
WO2008049590A1 (en) * 2006-10-25 2008-05-02 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for generating audio subband values and apparatus and method for generating time-domain audio samples
US20080312914A1 (en) * 2007-06-13 2008-12-18 Qualcomm Incorporated Systems, methods, and apparatus for signal encoding using pitch-regularizing and non-pitch-regularizing coding
US20100241433A1 (en) * 2006-06-30 2010-09-23 Fraunhofer Gesellschaft Zur Forderung Der Angewandten Forschung E. V. Audio encoder, audio decoder and audio processor having a dynamically variable warping characteristic

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6633841B1 (en) * 1999-07-29 2003-10-14 Mindspeed Technologies, Inc. Voice activity detection speech coding to accommodate music signals
JP3912389B2 (ja) * 2004-03-24 2007-05-09 ソニー株式会社 ディジタル信号処理装置及びディジタル信号処理方法
US7171245B2 (en) * 2004-05-06 2007-01-30 Chunghwa Telecom Co., Ltd. Method for eliminating musical tone from becoming wind shear sound
JP2008176110A (ja) * 2007-01-19 2008-07-31 Sanyo Electric Co Ltd オーディオ信号処理装置及びオーディオ信号処理方法
WO2009104402A1 (ja) * 2008-02-22 2009-08-27 パナソニック株式会社 音楽再生装置、音楽再生方法、音楽再生プログラム、及び集積回路

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TW200809771A (en) * 2006-06-30 2008-02-16 Fraunhofer Ges Forschung Audio encoder, audio decoder and audio processor having a dynamically variable warping characteristic
US20100241433A1 (en) * 2006-06-30 2010-09-23 Fraunhofer Gesellschaft Zur Forderung Der Angewandten Forschung E. V. Audio encoder, audio decoder and audio processor having a dynamically variable warping characteristic
WO2008003834A1 (en) * 2006-07-07 2008-01-10 Nokia Corporation Method and system for enhancing the discontinuous transmission functionality
WO2008049590A1 (en) * 2006-10-25 2008-05-02 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for generating audio subband values and apparatus and method for generating time-domain audio samples
TW200837719A (en) * 2006-10-25 2008-09-16 Fraunhofer Ges Forschung Apparatus and method for generating audio subband values and apparatus and method for generating time-domain audio samples
US20080312914A1 (en) * 2007-06-13 2008-12-18 Qualcomm Incorporated Systems, methods, and apparatus for signal encoding using pitch-regularizing and non-pitch-regularizing coding
TW200912897A (en) * 2007-06-13 2009-03-16 Qualcomm Inc Systems, methods, and apparatus for signal encoding using pitch-regularizing and non-pitch-regularizing coding

Also Published As

Publication number Publication date
KR101347506B1 (ko) 2014-01-02
ES2526125T3 (es) 2015-01-07
US20120158164A1 (en) 2012-06-21
FR2949582A1 (fr) 2011-03-04
EP2473996A1 (fr) 2012-07-11
JP5384741B2 (ja) 2014-01-08
US9251801B2 (en) 2016-02-02
BR112012004769A2 (pt) 2019-09-24
FR2949582B1 (fr) 2011-08-26
JP2013504083A (ja) 2013-02-04
CN102640214B (zh) 2013-08-28
CN102640214A (zh) 2012-08-15
WO2011026685A1 (fr) 2011-03-10
TW201129971A (en) 2011-09-01
KR20120043038A (ko) 2012-05-03
EP2473996B1 (fr) 2014-10-22

Similar Documents

Publication Publication Date Title
TWI459828B (zh) 在多頻道音訊中決定語音相關頻道的音量降低比例的方法及系統
KR101500254B1 (ko) 잔향의 지각 레벨에 대한 측정을 결정하는 장치, 방법 및 컴퓨터로 읽을 수 있는 저장 매체와, 직접 신호 성분으로부터 혼합 신호를 생성하기 위한 오디오 프로세서, 오디오 신호를 처리하는 방법 및 컴퓨터로 읽을 수 있는 저장 매체
US7881460B2 (en) Configuration of echo cancellation
JP4745916B2 (ja) 雑音抑圧音声品質推定装置、方法およびプログラム
RU2010112890A (ru) Устройство и способ для генерации многоканального сигнала, использующие обработку голосового сигнала
JP2002237785A (ja) 人間の聴覚補償によりsidフレームを検出する方法
TWI497486B (zh) 呈現相容於不連續傳輸編解碼器之音樂信號的方法及實施此方法的裝置
JP2007133035A (ja) デジタル録音装置,デジタル録音方法,そのプログラムおよび記憶媒体
CN102165792A (zh) 环路增益推定装置以及啸叫防止装置
JP2006146226A (ja) 音声信号処理装置の音声区間検出装置及び方法
CN102318325A (zh) 使音频设备的行为适配当前声学环境条件的控制
US10101962B2 (en) User input through transducer
JP2008076636A (ja) オーディオ信号補間方法及びオーディオ信号補間装置
RU2411595C2 (ru) Улучшение разборчивости речи в мобильном коммуникационном устройстве путем управления работой вибратора в зависимости от фонового шума
CN110534129A (zh) 干声和环境声音的分离
JP2015222847A (ja) 音声処理装置、音声処理方法および音声処理プログラム
JP2002366178A (ja) オーディオ信号の帯域拡張方法及び帯域拡張装置
JP2010026323A (ja) 話速検出装置
JP6995442B2 (ja) 故障診断装置および方法
TW201123936A (en) Audio volume controlling circuit and method thereof
JP2012094945A (ja) 音声通信システム、及び、音声通信装置
JP3995040B2 (ja) 騒音振動測定における音の録音方法及びそれを用いた装置
US20230269546A1 (en) Method for eliminating acoustic reverberation in an audio signal, and hearing instrument
CN103680516B (zh) 音频信号的处理方法和装置
JP2014199343A5 (ja) 信号処理装置及び方法

Legal Events

Date Code Title Description
MM4A Annulment or lapse of patent due to non-payment of fees