TW201234352A - Concealment signal generating device, concealment signal generation method and concealment signal generation program - Google Patents

Concealment signal generating device, concealment signal generation method and concealment signal generation program Download PDF

Info

Publication number
TW201234352A
TW201234352A TW100141295A TW100141295A TW201234352A TW 201234352 A TW201234352 A TW 201234352A TW 100141295 A TW100141295 A TW 100141295A TW 100141295 A TW100141295 A TW 100141295A TW 201234352 A TW201234352 A TW 201234352A
Authority
TW
Taiwan
Prior art keywords
signal
packet
decoded
covert
accumulated
Prior art date
Application number
TW100141295A
Other languages
English (en)
Inventor
Kimitaka Tsutsumi
Kei Kikuiri
Original Assignee
Ntt Docomo Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ntt Docomo Inc filed Critical Ntt Docomo Inc
Publication of TW201234352A publication Critical patent/TW201234352A/zh

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Detection And Prevention Of Errors In Transmission (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

201234352 六、發明說明: 【發明所屬之技術領域】 本發明係有關於經由IP網或移動體通訊網而傳輸聲音 封包之際的錯誤隱蔽,更詳言之是有關於,生成錯誤隱蔽 所需之隱蔽訊號的隱蔽訊號生成裝置、隱蔽訊號生成方法 及隱蔽訊號生成程式。 【先前技術】 在ip網或移動體通訊中傳輸聲音•音響訊號(以下總 稱爲「聲音訊號」)之際,是將聲音訊號予以編碼以較少 位元數來表現而分割成聲音封包,將該聲音封包經由通訊 網路而傳輸。透過通訊網所收取到的聲音封包,係在收訊 側的伺服器、MCU、終端等中被解碼,獲得解碼聲音訊號 〇 透過通訊網而傳輸聲音封包之際,係由於通訊網之壅 塞狀態等,而會造成一部分聲音封包遺失或聲音封包中所 被寫入之資訊的一部分發生錯誤的現象(亦即所謂的封包 遺失)。在此種情況下,由於在收訊側無法正確地將聲音 封包予以解碼,因此無法獲得所望之解碼聲音訊號。又, 由於發生封包遺失的聲音封包所對應的解碼聲音訊號係被 感覺成雜音,因此對收聽的人而言,會顯著減損主觀品質 〇 作爲頻率領域中的封包遺失隱蔽方法係有,關於「改 良過的頻率領域之錯誤隱蔽技術」的下記專利文獻1。該 201234352 手法係爲’將過去正常收訊之封包中所含之頻率領域(傅 立葉級數)所表現的解碼聲音,積存在緩衝區中,當偵測 到封包遺失時,根據緩衝區裡所積存的解碼聲音來推定最 佳之增益,將該當最佳增益,乘算至最近收訊的封包中所 含之解碼聲音’藉此而將封包遺失所對應之部分的訊號, 予以復原。 又,作爲將封包遺失而喪失部分的聲音•音響訊號予 以內插的錯誤隱蔽技術,係有ITU-T G.711 Appendix 1( 非專利文獻1 )爲人所知。該技術係將正常收取到的解碼 聲音•音響訊號之一部分,記憶在緩衝區裡,當發生了封 包遺失時,重複從緩衝區中以音高單位來取出波形,藉此 而合成出對應於遺失部分的訊號。 作爲更進階之錯誤隱蔽技術係有,關於「隱蔽訊號生 成裝置、隱蔽訊號生成方法、隱蔽訊號生成程式」的下記 專利文獻2。該當發明係針對過去正常收取之封包解碼所 得之訊號,一直監視著訊號的定常性,被認爲有定常性的 訊號(以下稱作「定常訊號」)係記錄至緩衝區。當發生 錯誤時,係判定錯誤發生前的訊號是否爲定常訊號,若是 定常訊號則針對緩衝區中的定常訊號,使用表示訊號之定 常性的參數來決定將訊號予以複製之範圍,複製到喪失部 分的手法。通常,封包遺失持續時,會因爲同一波形的重 複而產生像是蟲鳴的雜音,但若使用該當發明則可減少同 —波形的重複次數,因此可減低上述的雜音。 〔先前技術文獻〕 -6- 201234352 〔專利文獻〕 [專利文獻1]日本專利第399980 7號公報 [專利文獻2]日本特開2008-203783號公報 〔非專利文獻〕
[非專利文獻 1]ITU-T G.71 1 Appendix I 【發明內容】 〔發明所欲解決之課題〕 然而,包含上記專利文獻1之技術的先前之頻率領域 中的封包遺失隱蔽,是藉由重複過去正常收訊的解碼訊號 來生成隱蔽訊號,但由於重複的單位係爲1訊框之訊號, 因此當已取出之訊框裡有母音與子音這類性質互異之訊號 混合存在時,結果,所被隱蔽之訊號裡也會有性質互異之 訊號混合存在,無法充分發揮隱蔽效果,存在如此課題。 又,在不把重複單位限定爲1訊框、作爲可彈性選擇 之技術而進行隱蔽訊號之生成的專利文獻2的技術中,雖 然可某種程度地避免性質互異之訊號的混合存在,但隱蔽 訊號之生成基準是限定成訊號的定常性及音高週期,使用 功率或頻譜之變化等來決定要重複之波形這類的彈性處理 ,係爲困難。又,該當發明係爲有關於時間領域中的封包 遺失隱蔽方法之發明,因此爲了與在頻率領域或時間頻率 領域上的聲音編碼•解碼裝置做組合,必須要先進行解_ 處理然後轉換成時間領域之訊號,從演算量的觀點來看, 並不實際。 201234352 如以上所述,使用緩衝區中所積存的解碼聲音來生成 隱蔽訊號之際,要隨著功率之變化或功率頻譜之性質變化 等而有彈性地求出重複單位而生成隱蔽訊號,是有困難的 。尤其是,當解碼聲音是以頻率領域來表現時,由於重複 的單位無法比1訊框還短,因此難以避免性質互異之訊號 被混合在隱蔽訊5^中而存在。 本發明的目的是解決上記課題,防止封包遺失隱蔽所 需之隱蔽訊號的音質低落。 〔用以解決課題之手段〕 本發明之一側面所述之隱蔽訊號生成裝置,作爲第一 樣態,係屬於將含有聲音碼之已被接收的封包的封包錯誤 或封包遺失之偵測結果、及聲音碼解碼所得之解碼訊號, 從外部加以收取,針對封包遺失部分所對應的解碼訊號, 進行封包遺失之隱蔽的隱蔽訊號生成裝置,其特徵爲,具 備:解碼訊號積存部,係將從前記偵測結果爲正常之封包 中所含之聲音碼所得到的解碼訊號,予以積存;和訊號識 別部’係當前記偵測結果爲異常時,偵測出所被積存的解 碼訊號之功率變化與功率頻譜之性質變化的雙方或一方, 將表示該當偵測結果之訊號識別資訊,予以輸出;和第— 隱蔽訊號生成部’係基於前記訊號識別資訊、和已被前記 解碼訊號積存部所積存的解碼訊號,而生成用來將封包遺 失部分所對應之解碼訊號進行內插所需的隱蔽訊號。 上記的訊號識別部係亦可偵測出功率劇烈變化之時點 -8- 201234352 與功率頻譜劇烈變化之時點的雙方或一方。又,上記的訊 號識別部係亦可將有關變化之開始的資訊與有關變化之結 束的資訊之雙方或一方,當作訊號識別資訊而予以輸出。 本發明之一側面所述之隱蔽訊號生成裝置,作爲第二 樣態,係屬於將含有聲音碼之已被接收的封包的封包錯誤 或封包遺失之偵測結果、及聲音碼解碼所得之解碼訊號, 從外部加以收取,針對封包遺失部分所對應的解碼訊號, 進行封包遺失之隱蔽的隱蔽訊號生成裝置,其特徵爲,具 備:解碼訊號積存部,係將從前記偵測結果爲正常之封包 中所含之聲音碼所得到的解碼訊號,予以積存;和訊號識 別部,係當前記偵測結果爲正常時,則將表示從聲音碼所 得到之解碼訊號之功率變化與功率頻譜之性質變化的雙方 或一方之偵測結果用的訊號識別資訊,從外部加以收取並 積存,當前記偵測結果爲異常時,則將已被積存之訊號識 別資訊予以輸出;和第一隱蔽訊號生成部,係基於前記訊 號識別資訊、和已被前記解碼訊號積存部所積存的解碼訊 號’而生成用來將封包遺失部分所對應之解碼訊號進行內 插所需的隱蔽訊號。 於上述第一樣態及第二樣態各者中,第一隱蔽訊號生 成部’係亦可將在前記解碼訊號積存部中使用訊號識別資 訊所指定之範圍的解碼訊號予以重複所得之訊號,當作隱 蔽訊號而予以生成。 又,於上述第一樣態及第二樣態各者中,第一隱蔽訊 號生成部,係亦可將在前記解碼訊號積存部中使用訊號識 -9- 201234352 別資訊所指定之範圍的解碼訊號予以重複然後調整功率所 得之訊號,當作隱蔽訊號而予以生成。 可是,前述的隱蔽訊號生成裝置所述之發明,係可視 爲涉及隱蔽訊號生成方法之發明、以及涉及隱蔽訊號生成 程式之發明,而可描述如以下。 本發明之一側面所述之隱蔽訊號生成方法,作爲第一 樣態,係屬於將含有聲音碼之已被接收的封包的封包錯誤 或封包遺失之偵測結果、及聲音碼解碼所得之解碼訊號, 從外部加以收取,針對封包遺失部分所對應的解碼訊號, 進行封包遺失之隱蔽的隱蔽訊號生成裝置,所執行的隱蔽 訊號生成方法,其特徵爲,具備:解碼訊號積存步驟,係 將從前記偵測結果爲正常之封包中所含之聲音碼所得到的 解碼訊號,予以積存;和訊號識別步驟,係當前記偵測結 果爲異常時,偵測出所被積存的解碼訊號之功率變化與功 率頻譜之性質變化的雙方或一方,將表示該當偵測結果之 訊號識別資訊,予以輸出:和第一隱蔽訊號生成步驟,係 基於前記訊號識別資訊、和已被前記解碼訊號積存步驟所 積存的解碼訊號,而生成用來將封包遺失部分所對應之解 碼訊號進行內插所需的隱蔽訊號。 本發明之一側面所述之隱蔽訊號生成方法,作爲第二 樣態,係屬於將含有聲音碼之已被接收的封包的封包錯誤 或封包遺失之偵測結果、及聲音碼解碼所得之解碼訊號, 從外部加以收取,針對封包遺失部分所對應的解碼訊號, 進行封包遺失之隱蔽的隱蔽訊號生成裝置,所執行的隱蔽 -10- 201234352 訊號生成方法,其特徵爲,具備:解碼訊號積存步驟,係 將從前記偵測結果爲正常之封包中所含之聲音碼所得到的 解碼訊號,予以積存;和訊號識別步驟,係當前記偵測結 果爲正常時,則將表示從聲音碼所得到之解碼訊號之功率 變化與功率頻譜之性質變化的雙方或一方之偵測結果用的 訊號識別資訊,從外部加以收取並積存,當前記偵測結果 爲異常時,則將已被積存之訊號識別資訊予以輸出:和第 一隱蔽訊號生成步驟,係基於前記訊號識別資訊、和已被 前記解碼訊號積存步驟所積存的解碼訊號,而生成用來將 封包遣失部分所對應之解碼訊號進行內插所需的隱蔽訊號 0 本發明之一側面所述之隱蔽訊號生成程式,作爲第一 樣態,係一種隱蔽訊號生成程式,其特徵爲,係用以使電 腦發揮機能成爲:解碼訊號積存部,係將含有聲音碼之已 被接收的封包的封包錯誤或封包遺失之偵測結果爲正常的 封包中所含有之聲音碼進行解碼所得到之解碼訊號,加以 積存;和訊號識別部’係當前記偵測結果爲異常時,偵測 出所被積存的解碼訊號之功率變化與功率頻譜之性質變化 的雙方或一方’將表示該當偵測結果之訊號識別資訊,予 以輸出;和第一隱蔽訊號生成部,係基於前記訊號識別資 訊、和已被前記解碼訊號積存部所積存的解碼訊號,而生 成用來將封包遺失部分所對應之解碼訊號進行內插所需的 隱蔽訊號。 本發明之一側面所述之隱蔽訊號生成程式,作爲第二 -11 - 201234352 樣態,係一種隱蔽訊號生成程式,其特徵爲,係用以使電 腦發揮機能成爲:解碼訊號積存部,係將含有聲音碼之已 被接收的封包的封包錯誤或封包遺失之偵測結果爲正常的 封包中所含有之聲音碼進行解碼所得到之解碼訊號,加以 積存;和訊號識別部,係當前記偵測結果爲正常時,則將 表示從聲音碼所得到之解碼訊號之功率變化與功率頻譜之 性質變化的雙方或一方之偵測結果用的訊號識別資訊,從 外部加以收取並積存,當前記偵測結果爲異常時,則將已 被積存之訊號識別資訊予以輸出;和第一隱蔽訊號生成部 ,係基於前記訊號識別資訊、和已被前記解碼訊號積存部 所積存的解碼訊號,而生成用來將封包遺失部分所對應之 解碼訊號進行內插所需的隱蔽訊號。 如以上所述,由於可使隱蔽訊號生成時的訊號之重複 單位,比先前使用MDCT或FFT之頻率領域訊號還短,因此 可避免爲了隱蔽而輸出之訊號中混雜有性質互異之訊號, 可防止封包遺失隱蔽訊號的音質低落。 〔發明效果〕 若依據上述本發明的一側面,則可防止封包遺失隱蔽 所需之隱蔽訊號的音質低落。 【實施方式】 以下,使用圖面來說明涉及本發明之各種實施形態。 -12- 201234352 〔第1實施形態〕 首先使用圖1來說明本發明所想定的系統環境。如圖1 所示,透過麥克風等感測器所得到之聲音訊號,係以數位 形式而被表現,被輸入至編碼部1。 編碼部1,係每當既定樣本數的聲音訊號,在內藏的 緩衝區積存到所定量時,就將緩衝區內的數位訊號,進行 編碼。上記的所定量、亦即所積存的樣本數,稱作訊框長 ;編碼對象之數位訊號的集合,則稱作訊框。例如,以 32kHz之取樣頻率進行收音之際,若設成20ms之訊框長時 ,則會將640樣本的數位訊號,積存在緩衝區中》此外, 亦可在緩衝區中積存多餘的先讀部分之數位訊號。作爲進 行編碼的時序,係可用訊框長單位來進行編碼,也可在訊 框間帶有某種長度之重疊而進行編碼。編碼係可使用任何 種類的編碼方式。 封包構成部2,係對編碼部1所得到的聲音碼,附加上 RTP標頭等通訊上所必須之資訊,生成聲音封包。已被生 成之聲音封包係透過網路而被送往收訊側。 封包分離部3,係將透過網路所接收到的聲音封包, 分離成RTP標頭與聲音碼,將表示聲音封包之錯誤狀態的 錯誤旗標附加至聲音碼而生成位元串流,將位元串流輸出 至解碼部4。 解碼部4 ’係如圖2所示,具有錯誤/遺失偵測部4 1、 聲音解碼部42、及隱蔽訊號生成部43。解碼部4係藉由錯 誤/遺失偵測部4 1識別出錯誤旗標的狀態以偵測出聲音封 -13- 201234352 包中的異常(封包錯誤或封包遺失),若正常(無異常) 時則以聲音解碼部42進行聲音碼之解碼而輸出解碼訊號。 另一方面’若偵測到異常(封包錯誤或封包遺失)時則以 隱蔽訊號生成部43生成隱蔽訊號,將隱蔽訊號當作解碼訊 號而予以輸出。此外,從解碼部4係每一訊框地輸出解碼 聲音。該解碼聲音係被送往音訊緩衝區等而透過揚聲器等 被再生’或是被積存在記憶體或硬碟等之記錄媒體中。 以下說明解碼部4的動作。錯誤/遺失偵測部4 1,係藉 由將位元串流中所含之錯誤旗標的狀態加以識別,以偵測 出聲音封包中的異常(封包錯誤或封包遺失)。 此處’若錯誤旗標中被設定了表示聲音封包正常的値 ’則錯誤/遺失偵測部4 1係將錯誤旗標送往聲音解碼部42 及隱蔽訊號生成部43 (具體而言係爲後述之解碼訊號積存 部431與訊號識別部4 3 4 ),並且將聲音碼送往聲音解碼部 42。然後’聲音解碼部42係將聲音碼予以解碼而生成解碼 訊號,當作解碼聲音而予以輸出。此時,聲音解碼部42係 也將解碼訊號送往隱蔽訊號生成部43。 另一方面,若錯誤旗標中被設定了表示聲音封包異常 的値’則錯誤/遺失偵測部4 1係將錯誤旗標送往隱蔽訊號 生成部43 (具體而言係爲後述之解碼訊號積存部43 1與訊 號識別部43 4 )。隱蔽訊號生成部43,係根據過去正常收 取到的聲音封包所對應的解碼訊號,來生成隱蔽訊號。隱 蔽訊號生成部43的動作細節將於後述。 以上所述的圖1之全體構成及圖2的解碼部4的錯誤/遺 201234352 失偵測部41與聲音解碼部42之動作’係在後述的第2〜第5 實施形態皆相同,因此在第2〜第5實施形態中係省略重複 的說明。 以下詳細說明隱蔽訊號生成部4 3的構成、動作。在第 1實施形態中’係在隱蔽訊號生成部4 3裡’將時間領域之 訊號的功率劇烈變化’當作訊號識別資訊來使用。 如圖2所示,隱蔽訊號生成部43係具備:解碼訊號積 存部431、訊號識別部434、及第一隱蔽訊號生成部433。 解碼訊號積存部431,係若錯誤旗標中被設定了表示 聲音封包正常的値,則將從聲音解碼部42所輸入的解碼訊 號,予以積存。所積存的解碼訊號之樣本數’係爲過去數 訊框的份量(d訊框份量),較爲理想(此處假設爲x(〇), …,x(dL)。此外,將1訊框的長度假設爲L)。 訊號識別部4 3 4,係如圖3所示’具備:解碼訊號積存 部4340、時間包絡算出部4341、訊號識別資訊生成部4342 。其中,解碼訊號積存部4340係若錯誤旗標中被設定了表 示聲音封包正常的値,則進行和解碼訊號積存部4 3 1同樣 的動作。 時間包絡算出部4341係若錯誤旗標中被設定了表示聲 音封包異常的値,則從解碼訊號積存部43 40中,讀出所被 積存的解碼訊號(以下稱作「積存解碼訊號」),算出有 關每一積存解碼訊號之功率的資訊亦即時間包絡資訊。此 外,作爲變形例,亦可構成爲不設置解碼訊號積存部4340 ,取而代之,改爲是由時間包絡算出部434 1從解碼訊號積 -15- 201234352 存部43 1中讀出積存解碼訊號。 作爲此處的時間包絡資訊之算出方法,係可考慮針對 複數小區間分別使用振幅的最大値來算出時間包絡資訊的 方法,或使用分散度來算出時間包絡資訊的方法等各種方 法,但例如,依照以下的式子來算出時間包絡資訊。此外 ,此處假設是針對K個小區間來算出時間包絡資訊。 [數1] 2Qi〇gi〇(c-L+iz^ ι〇 幻 i2) X (k)係表示第k個樣本的値。此處,k1 s t a M係表示第1個小區 間的開始位置,係表示第1個小區間的結束位置。又, 此處雖然設,但亦可爲小區間彼此是帶有 重疊。 訊號識別資訊生成部43 42係偵測出功率的劇烈變化, 隨著結果而輸出訊號識別資訊。具體而言,算出功率的分 散値,藉由比較該當分散値與閾値以偵測出功率劇烈變化 等,可使用各式各樣的方法,但在本實施形態中係例如以 下般地偵測出功率劇烈變化。 步驟1 :將Env(l)平滑化後的包絡penv(l),藉由下式 而予以算出。其中,α係爲滿足〇<α<1之定數。
Penv(l) = a · Penv(l-1) + (1-α) · Env(l) 步驟2 :使用Εην(1)與Penv(l),比較Εην(1)與( β · Penν(1))以偵測出功率劇烈變化。其中,β係爲定數。 -16- 201234352 亦即’當Ε η v (1) > β · p e n v⑴時,就判定樣本1中功率有劇烈 變化。 以上所示的方法係基於功率的變化而偵測訊號變化的 單純例’亦可藉由其他更複雜的方法來進行訊號變化偵測 。上記處理的結果’若偵測到功率劇烈變化時,則將變化 開始之樣本的索引lstart ’當作訊號識別資訊而予以輸出 。未偵測到功率劇烈變化之訊號時,則亦可將從緩衝區之 最後減去1訊框份之樣本數而得的値,當作索引lstart。此 外’亦可採用將緩衝區開頭之索引或緩衝區最後之索引當 作lstart等的單純之方法,也可算出音高週期而將從緩衝 區之最後減去音高週期而得的値當作lstart。 第一隱蔽訊號生成部433,係使用訊號識別資訊及積 存解碼訊號來生成隱蔽訊號。具體而言係用以下程序來生 成隱蔽訊號。第一隱蔽訊號生成部43 3之動作示於圖4。 圖4的步驟SI 1中,第一隱蔽訊號生成部43 3係參照訊 號識別資訊而求出索引lstart,又,將緩衝區中所儲存的 積存解碼訊號的最後樣本的索引,當作lend。此處’將 lend-1 start的値,設定至變數L’。 步驟S 1 2中,第一隱蔽訊號生成部4 3 3係從解碼訊號積 存部43 1複製積存解碼訊號。進行複製之際,係將13以^至 lend的樣本,重複複製直到滿足1訊框中所含之樣本數^^爲 止。例如,首先將變數i重置成〇 (步驟s 1 2 1 ),依照以下 的式子,作爲對應於封包遺失部分的隱蔽訊號V(i) ’而 將解碼訊號積存部431中所積存的積存解碼訊號’予以複 -17- 201234352 製(步驟S 1 2 2 )。 v(i)=b(lstart+i%L’ ) 此處,b(i)係意指解碼訊號積存部431中所積存的積存解碼 訊號,(i%L’)係表示i除以L’後的餘數。 然後,若變數i未滿樣本數N (步驟S124中YES ),則 將變數i計數增値1 (步驟S 1 23 ),針對計數增値過的變數i ,進行步驟S122之處理。其後,重複步驟S122及S123,直 到變數i等於樣本數N (步驟S124中變成NO)爲止。藉此 ,就可將lstart至lend的樣本,進行複製直到滿足1訊框中 所含之樣本數N爲止。 接著,在步驟S1 3中,第一隱蔽訊號生成部43 3係將已 複製之積存解碼訊號對每一樣本算出平均平方振幅而進行 正規化之後,對封包遺失之前的樣本的平均平方振幅,乘 上衰減係數的次方數,以生成隱蔽訊號。例如,首先將變 數i重置成〇(步驟S131),將對應於封包遺失部分的隱蔽 訊號v,依照下式而予以生成(步驟S 1 32 ) » v(iL’ +k) = v(iL’ +k)/10伽⑴/2) 10(Env(K-”/« γί 此處,Env(i)係表示第i個小區間的時間包絡(Κ係爲小區 間之數目),v(i)係表示對應於封包遺失部分的隱蔽訊號 ,γ係表示衰減常數。 然後,若變數i未滿樣本數Ν (步驟S134中YES),則 將變數i計數增値1 (步驟S133 ),針對計數增値過的變數i ,進行步驟S132之處理。其後,重複步驟S132及S133,直 到變數i等於樣本數N (步驟S134中變成NO)爲止。藉此 -18- 201234352 ,就生成隱蔽訊號。 然後,在步驟S14中,第一隱蔽訊號生成部43 3係將已 生成之隱蔽訊號,予以輸出。 此外,除了上記所說明的以外,亦可藉由預測來生成 隱蔽訊號。具體而言,亦可使用如以下之方法。 步驟1 ’·參照訊號識別資訊,求出索引1 s t a r t。又,將 緩衝區中所儲存之積存解碼訊號的最後樣本的索引,當作 lend β 步驟2:將解碼訊號積存部431中的積存解碼訊號,從 1 s t a r t至1 e n d予以複製,進行線性預測分析。 步驟3 :將步驟2所得的殘差訊號,重複直到滿足1訊 框中所含之樣本數N爲止。 步驟4 :以步驟2所得到之線性預測係數,將步驟3所 得到之訊號進行逆過濾之後,將預定之衰減係數,對每一 樣本進行乘算。將如此所得到之訊號,當作隱蔽訊號。 如以上所述,在第1實施形態中,係可在隱蔽訊號生 成部43裡,使用時間領域之訊號的功率劇烈變化來生成訊 號識別資訊並加以輸出。 〔第2實施形態〕 在第1實施形態中雖然是使用功率劇烈變化來進行訊 號識別資訊的輸出,但在第2實施形態中則是說明,使用 功率頻譜的劇烈變化來生成訊號識別資訊的例子。 此外,在本實施形態中雖然作爲解碼訊號是假定了時 -19- 201234352 間領域之訊號,但若解碼訊號是會獲得頻率領域之訊號( 例如QMF係數等)的情況下,則亦可構成爲,按照頻率領 域中的表現而直接將解碼訊號予以積存在解碼訊號積存部 中,並省略掉時間頻率轉換部。 以下說明隱蔽訊號生成部43的動作。 圖2所示的解碼訊號積存部431的動作,係和第1實施 形態相同。 訊號識別部434,係如圖5所示,具備:解碼訊號積存 部43 40、時間頻率轉換部4343、轉換增益算出部4344、訊 號識別資訊生成部4342。其中解碼訊號積存部4340的動作 ,係和第1實施形態相同》 關於錯誤旗標中被設定了表示聲音封包異常的値時所 動作的時間頻率轉換部4343、轉換增益算出部4344、訊號 識別資訊生成部4342,使用圖6而說明如下。 時間頻率轉換部43 43,係從解碼訊號積存部43 40讀出 積存解碼訊號,將已轉換成頻率領域的積存頻率訊號予以 輸出(圖6的步驟S21)。轉換係可採用FFT( Fast Fourier Transform ) ,也可採用 M D C T ( Μ o d i f i e d Discrete Transform),或用QMF。又,作爲變形例,亦可構成爲不 設置解碼訊號積存部43 40,取而代之改爲從解碼訊號積存 部431讀出積存解碼訊號。 在本實施形態中是展示了,例如使用QMF來進行時間 頻率轉換的例子。此處,令積存解碼訊號爲x(n)。 -20- 201234352 [數2] Ι> 叩,/) = Ο».又⑻ cos 其中,例如若說到v(k,l)的樣本1Q時則爲 [數3] V{k,l0\{0<k<K-\) 假設會出現此種頻率柱之集合。E係表示時間方向的子樣 本數,K係表示頻率柱的數目。k係爲頻率柱的索引(〇$k ^ K-1 ) ,1係爲子樣本的索引(0S1SL-1)。又,pA(n) 係表示分析時所用的窗函數。 轉換增益算出部4344,係針對已進行時間頻率轉換的 積存解碼訊號,將(相加平均/相乘平均)之値(以後將 該値稱作「U (1)」,而記作「相加平均/相乘平均u (1)」) 予以算出(圖6的步驟S22 )。 [數4] ⑽=〔去Σ3障,/)丨2)/〔姐障,〇|2] 此外,在本實施例中雖然是使用所有頻率柱來算出U(l), 但亦可僅使用一部分的頻率柱來算出相加平均/相乘平均 -21 - 201234352 U(l)。 訊號識別資訊生成部4342,係將相加平均/相乘平均 U(l)超過某閩値Th的子樣本1,當作訊號識別資訊Istart而 予以測出(圖6的步驟S23 )。例如,首先將子樣本的索引 1重置成〇 (步驟S231 ),判斷相加平均/相乘平均U(l)是否 超過閾値Th (步驟S2 3 2 )。若相加平均/相乘平均u(l)未超 過閾値Th,則前進至步驟S23 5,若相加平均/相乘平均U ( 1 )超過閩値Th,則將此時的索弓丨1設定成訊號識別資訊 lstart (步驟S23 3 ),前進至步驟S 2 3 5。 然後,若步驟S235中索引1未達L (步驟S235中YES) ,則將索引1計數增値1 (步驟S234 ),針對計數增値過的 索引丨,進行步驟S232及S233之處理。其後,重複步驟 S232〜S234,直到索弓丨1等於L (步驟S235中變成NO)爲 止。藉此,就可將相加平均/相乘平均U(l)超過某閾値Th的 子樣本1,當作訊號識別資訊lstart而予以測出。 然後,訊號識別資訊生成部4342係將步驟S23所得到 的訊號識別資訊lstart,予以輸出(圖6的步驟S24)。 第一隱蔽訊號生成部433,係使用訊號識別資訊及積 存解碼訊號來生成隱蔽訊號。具體而言係用以下程序來生 成隱蔽訊號。第一隱蔽訊號生成部433之動作示於圖7 ° 圖7的步驟S25中,第一隱蔽訊號生成部43 3係參照訊 號識別資訊而求出索引lstart,又,將緩衝區中所儲存的 積存解碼訊號的最後樣本的索引,當作lend °此處’將 lend-lstart的値,設定至變數L,。 -22- 201234352 步驟S26中,第一隱蔽訊號生成部43 3係從解碼訊號積 存部43 1複製積存解碼訊號。進行複製之際,係將lstart至 lend的樣本,一直複製直到滿足1訊框中所含之樣本數N爲 止。例如,首先將變數i重置成〇 (步驟S261 ),依照以下 的式子,作爲對應於封包遺失部分的隱蔽訊號V(k,i),而 將解碼訊號積存部43 1中所積存的積存解碼訊號,予以複 製(步驟S262 )。 V(k, i)=B(k, lstart+i^ ) 此處,B(k,i)係表示將解碼訊號積存部431中所積存的積存 解碼訊號進行過時間頻率轉換而成的訊號,V(k,i)係表示 對應於封包遺失部分之隱蔽訊號,(i%L’)係表示i除以 L ’後的餘數。 然後,若變數i未滿樣本數N (步驟S264中YES ),則 將變數i計數增値1 (步驟S263 ),針對計數增値過的變數i ,進行步驟S262之處理。其後,重複步驟S262及S263,直 到變數i等於樣本數N (步驟S2 64中變成NO )爲止。藉此 ,就可將lstart至lend的樣本,進行複製直到滿足1訊框中 所含之樣本數N爲止。 步驟S27中,第一隱蔽訊號生成部43 3係算出子樣本的 功率 Env(l)。 [數5] -23- 201234352 在步驟S28中’第一隱蔽訊號生成部433係將已複製之 積存解碼訊號對每一樣本算出平均平方振幅而進行正規化 之後’對封包遺失之前的樣本的平均平方振幅,乘上衰減 係數的次方數’以生成隱蔽訊號。例如,首先將變數i重 置成〇(步驟S281),將對應於封包遺失部分的隱蔽訊號V ’依照下式而予以生成(步驟S282)。 V(k, ΐ) = V(k, j)//10(E"v(i)/2) . 10(Env(L-〇/2) . y , 此處’ Env⑴係表示第i個小區間的時間包絡(κ係爲小區 間之數目),V(k,i)係表示對應於封包遺失部分的隱蔽訊 號,γ係表示衰減常數。 然後,若變數i未滿樣本數Ν (步驟S284中YES),則 將變數i計數增値1 (步驟S2 8 3 ),針對計數增値過的變數i ,進行步驟S282之處理。其後,重複步驟S282及S283,直 到變數i等於樣本數N (步驟S2 84中變成NO )爲止。藉此 ,就生成隱蔽訊號》 然後,步驟S29中,第一隱蔽訊號生成部43 3係將對應 於封包遺失部分的隱蔽訊號V(k,i),藉由合成QMF而進行 逆轉換,以生成時間領域的隱蔽訊號y(kL + i)並輸出。 [數6] y(k-L + i) = ^ps(n) V(kyi)cos -(n+-~ —){k+-) 此處,i ( 0 S i<L )係爲時間領域之訊號的索引’ k ( 0 S k<K-l )係爲子訊框的索引。 -24- 201234352 如以上所述,在第2實施形態中,可使用功率頻譜的 劇烈變化來生成訊號識別資訊並輸出。 〔第3實施形態〕 在第1實施形態中雖然是使用功率劇烈變化來算出訊 號識別資訊,在第2實施形態中是使用功率頻譜的劇烈變 化來算出訊號識別資訊,但在第3實施形態則是說明使用 其雙方來算出訊號識別資訊的例子。 此外,在本實施形態中雖然作爲解碼訊號是假定了時 間領域之訊號,但若解碼訊號是會獲得頻率領域之訊號( 例如QMF係數等)的情況下,則亦可構成爲,按照頻率領 域中的表現而直接將解碼訊號予以積存在解碼訊號積存部 中,並省略掉時間頻率轉換部。 以下說明隱蔽訊號生成部43的動作。 圖2所示的解碼訊號積存部43 1的動作,係和第1實施 形態相同。 訊號識別部43 4,係如圖8所示,具備:解碼訊號積存 部43 40、時間包絡算出部434 1、時間頻率轉換部4343、轉 換增益算出部4344、訊號識別資訊生成部4342。其中,解 碼訊號積存部4340係若錯誤旗標中被設定了表示聲音封包 異常的値,則進行和解碼訊號積存部43 1同樣的動作。 以下,關於錯誤旗標中被設定了表示聲音封包異常的 値時所動作的時間頻率轉換部4343、時間包絡算出部4341 、轉換增益算出部4344、訊號識別資訊生成部43 42,使用 -25- 201234352 圖9而說明如下。 時間頻率轉換部4343,係從解碼訊號積存部43 40讀出 積存解碼訊號,將已轉換成頻率領域的積存頻率訊號予以 輸出(圖9的步驟S 3 1 )。作爲變形例,亦可構成爲不設置 解碼訊號積存部4340,改爲從解碼訊號積存部431讀出積 存解碼訊號。此處,令積存解碼訊號爲x(n)。 [數7] π 1 Κ、η 1 ' J^+2~JKk+l\ 其中,例如若說到V ( k,l )的樣本1G時則爲 [數8] V(kJ0U〇<k<K-l) 假設會出現此種頻率柱之集合。E係表示時間方向的子樣 本數’ K係表不頻率柱的數目。k係爲頻率柱的索引(〇$k ^ K-1 ),丨係爲子樣本的索引(0各1各L-1 )。又,PA ( n )係表示分析時所用的窗函數。 時間包絡算出部4 3 4 1 ’係將時間包絡例如依照下式而 予以算出(圖9的步驟S32)。 -26- 201234352 [數9]
Penv{l) = aPenvil -1) + (1- α)Εην{1) 轉換增益算出部4344,係針對積存頻率訊號,算出相 加平均/相乘平均U(l)(圖9的步驟S33)。 [數 10]
此外,在本實施例中雖然是使用所有頻率柱來算出U(l), 但亦可僅使用一部分的頻率柱來算出相加平均/相乘平均 U(l) 〇 訊號識別資訊生成部4342,係將相加平均/相乘平均 U(I)超過某閩値Th的子樣本1,當作訊號識別資訊lstart而 予以測出,之後,藉由比較Env(l)與(β · Penv(l))以偵測 出功率劇烈變化,因應需要而進行lstart之更新,藉此而 生成訊號識別資訊lstart (圖9的步驟S34 )。其中,β係爲 定數。亦可當Εην(1)>β · Penv(l)時,就判定樣本I中功率有 劇烈變化而算出lstart。此外,亦可對轉換增益和時間包 絡進行加權,將這些轉換增益與時間包絡進行組合以生成 訊號識別資訊。 -27- 201234352 具體而言,在步驟S34中,訊號識別資訊生成部4342 ’係如圖9所示,首先將子樣本的索引1重置成〇 (步驟 S341 ),判斷相加平均/相乘平均u(l)是否超過閩値Th (步 驟S3 42 )。若相加平均/相乘平均u(l)未超過閩値Th,則前 進至步驟S 345,若相加平均/相乘平均U(i)超過閾値Th,則 將此時的索引1設定成訊號識別資訊lstart (步驟S3 43 ), 前進至步驟S34 5。 然後,若步驟S345中索引1未達L (步驟S345中YES) ,則將索弓丨1計數增値1 (步驟S344 ),針對計數增値過的 索引1’進行步驟S342及S343之處理。其後,重複步驟 S342〜S344 ’直到索引1等於L (步驟S345中變成NO)爲 止。藉此’就可將相加平均/相乘平均U(1)超過某閾値Th的 子樣本1,當作訊號識別資訊lstart而予以測出。 接著’將索弓丨1重置成0 (步驟S346 ),將Env(l)與(β • Penv(l))進行比較(步驟S347),若Env(l)未超過(β • Penv(l)),則前進至步驟S34A,若Env(l)超過(β · Penv(l)),則將此時的索弓丨1設定成訊號識別資訊istart ( 步驟S3 48 ),前進至步驟S34A。 然後’若步驟S34A中索弓丨1未達L (步驟S34A中YES) ,則將索弓丨1計數增値1 (步驟S 3 4 9 ),針對計數增値過的 索引1’進行步驟S347及S348之處理。其後,重複步驟 S347〜S349’直到索弓丨1等於L (步驟S34A中變成NO)爲 止。藉此’就可將功率有劇烈變化的子樣本1,偵測成爲 訊號識別資訊丨start。 -28- 201234352 然後,訊號識別資訊生成部4 3 4 2係將步驟s 3 4所得到 的訊號識別資訊lstart,予以輸出(圖9的步驟S35)。 此外,第3實施形態中的第一隱蔽訊號生成部43 3 ’係 進行和第2實施形態同樣的動作》 如以上所述,在第3實施形態中,可使用功率劇烈變 化與功率頻譜之劇烈變化之雙方,來生成訊號識別資訊並 輸出。 〔第4實施形態〕 在第4實施形態中係說明,與第1〜第3實施形態不同 地,從外部取得訊號識別資訊時的處理例。此外,作爲訊 號識別資訊的輸入方法,係有例如使用解碼過程中輔助性 所得之參數的方法。 以下說明,使用 TS26.401 (enhanced aacPlus)來作 爲編碼方法時,將解碼時所得的參數當作訊號識別資訊而 進行封包遺失隱蔽的例子。 TS26.401 係藉由 SBR( Spectral Band Replication ), 將高頻訊號以較少之位元量而進行編碼。SBR的解碼中, 係使用從SBR編碼側所送來的輔助資訊、與低頻之解碼訊 號,來生成高頻訊號。輔助資訊裡係含有,訊框內的時間 交界之資訊。具體而言,係爲TS 2 6.404的3.2節所定義的tE 之參數。訊框內的時間交界,係在功率劇烈變大的部分、 或功率頻譜的性質變化之際,在SBR編碼部中被插入。 在本實施形態中係說明,於圖2的隱蔽訊號生成部43 -29- 201234352 中,使用上記訊框內的時間交界tE來進行隱蔽訊號之生成 的情形。此外,解碼訊號積存部43 1的動作係和第1實施形 態相同。 訊號識別部434,係如圖1 0所示,具備有訊號識別資 訊積存部43 45。訊號識別資訊積存部43 45,係若錯誤旗標 中被設定了表示聲音封包正常的値,則將從聲音解碼部42 所輸入的訊號識別資訊,予以積存。訊號識別資訊,係爲 上述的訊框內的時間交界tE。若錯誤旗標中被設定了表示 聲音封包異常(例如封包錯誤或封包遺失)的値,則已被 積存之訊號識別資訊(以下稱作「積存訊號識別資訊」) 會被從訊號識別資訊積存部43 45輸出至第一隱蔽訊號生成 部 43 3 〇 第一隱蔽訊號生成部43 3,係使用積存訊號識別資訊 及積存解碼訊號,用以下的程序來生成隱蔽訊號。第一隱 蔽訊號生成部433之動作示於圖11。 圖1 1的步驟S41中,第一隱蔽訊號生成部43 3係參照積 存訊號識別資訊,依照下式而求出索引lstart及索引lend。 此處,tE係表示,被包含在訊號識別資訊積存部中所積存 之訊號識別資訊當中最近收訊的封包中》L’係爲被訊框內 的時間交界所區隔的區間數。 [數 1 1] lstart = tE(L/-l) lend = tE(L’) -30- 201234352 步驟S42中,第一隱蔽訊號生成部43 3係從解碼訊號積 存部43 1複製積存解碼訊號。進行複製之際,係將1^3^至 lend的子樣本,一直複製直到滿足1訊框中所含之子樣本 數爲止。例如,首先將變數i重置成0 (步驟S421 ),依照 以下的式子,作爲對應於封包遺失部分的隱蔽訊號V(k,i) ,而將解碼訊號積存部431中所積存的積存解碼訊號,予 以複製(步驟S422 )。 V(k, i)=B(k, Istart+iXL* ) 此處,B(k,i)係表示將解碼訊號積存部431中所積存的積存 解碼訊號進行過時間頻率轉換而成的訊號,V(k,i)係表示 對應於封包遺失部分之隱蔽訊號,(i%L’)係表示i除以 L ’後的餘數。 然後,若變數i未滿樣本數N (步驟S424中YES ),則 將變數i計數增値1 (步驟S 4 2 3 ),針對計數增値過的變數i ,進行步驟S422之處理。其後,重複步驟S422及S423 ’直 到變數i等於樣本數N (步驟S424中變成NO)爲止。藉此 ,就可將lstart至lend的子樣本,進行複製直到滿足1訊框 中所含之子樣本數爲止。 步驟S43中,第一隱蔽訊號生成部43 3係算出子樣本的 功率 Env(l)。 IB 12]
Env(l) = 20\oglo(^Kk:l\V(k,lf) -31 - 201234352 在步驟S44中’第一隱蔽訊號生成部43 3係將已複製之 積存解碼訊號對每一樣本算出平均平方振幅而進行正規化 之後,對封包遺失之前的樣本的平均平方振幅,乘上衰減 係數的次方數’以生成隱蔽訊號。例如,首先將變數i重 置成〇(步驟S441),將對應於封包遺失部分的隱蔽訊號V ,依照下式而予以生成(步驟S442)。 V(k, i) = V(k, · 10(En»(L-l)/2) . y \ 此處,Env(i)係表示第i個小區間的時間包絡(K係爲小區 間之數目),V(k,i)係表示對應於封包遺失部分的隱蔽訊 號,γ係表示衰減常數。 然後,若變數i未滿樣本數Ν (步驟S444中YES ),則 將變數i計數增値1 (步驟S443 ),針對計數增値過的變數i ,進行步驟S442之處理。其後,重複步驟S442及S443 ’直 到變數i等於樣本數N (步驟S444中變成NO )爲止。藉此 ,就生成隱蔽訊號。 然後,步驟S45中,第一隱蔽訊號生成部43 3係將對應 於封包遺失部分的隱蔽訊號V(k,i),藉由合成QMF而進行 逆轉換,以生成時間領域的隱蔽訊號y(kL + i)並輸出。 [數 13] y(k^L+i) = ^^Kk~lps(ή)·V(k,i)cos ^(n+^-+-) 此處,i ( 0 S i<L )係爲時間領域之訊號的索引’ k ( 0 $ -32- 201234352 k<K-l )係爲子訊框的索引。 如以上所述,在第4實施形態中,即使是從外部取得 訊號識別資訊的情況下,仍可生成隱蔽訊號並輸出。 〔第5實施形態〕 在第5實施形態中是說明,和第4實施形態不同地,根 據解碼過程中輔助性獲得之參數而算出訊號識別資訊的例 子。 在本實施形態中,係可使用例如,在編碼中使用了 A AC時的尺度因子、或其他編碼方式中的解碼訊號之時間 頻率領域表現等。例如藉由對以下所述的例子中的V(k,l) 代入這些參數,就可利用以下的例子。亦可使用可根據這 些時間頻率領域表現而算出之參數,來進行同樣的處理。 在本實施形態中,以下係說明,使用TS26.40 1 ( enhanced aacPlus )來作爲編碼方法時,根據解碼時所得 的參數而算出訊號識別資訊,進行封包遺失隱蔽之例子。 在本實施形態中,是根據TS26.404的輔助資訊中所含 之功率頻譜包絡的資訊,而算出訊號識別資訊。上記所謂 TS26.404的輔助資訊,具體而言係爲TS26.404的3.2節所定 義的作爲Ε。^的表示功率頻譜包絡之功率的參數,和作爲 fTableHigh的表示功率頻譜包絡之頻帶交界的參數。圖13中係 圖示了這些參數之關係的例子。此外,上記參數係在解碼 的過程中被算出。 於是,在本實施形態中係說明,使用上記來進行隱蔽 -33- 201234352 訊號之生成的情形。此外,圖2的隱蔽訊號生成部43中, 解碼訊號積存部4 3 1的動作係和第1實施形態相同。 訊號識別部434’係如圖12所示,具備:輔助資訊積 存部4346、功率頻譜包絡算出部4347、時間包絡算出部 4341、轉換增益算出部43 44、訊號識別資訊生成部43 42。 其中’輔助資訊積存部4346,係若錯誤旗標中被設定 了表示聲音封包正常的値,則將從聲音解碼部42所輸入的 作爲EoHg的功率頻譜包絡之功率及作爲fTableHigh的功率頻譜包 絡之頻帶交界,予以積存。 功率頻譜包絡算出部43 47係若錯誤旗標中被設定了表 示聲音封包異常的値,則從輔助資訊積存部43 4 6讀出上記 功率頻譜包絡之功率及功率頻譜包絡之頻帶交界,如下述 般地算出訊號識別資訊。亦即,如下述般地從E。^與fTableHigh 而算出功率頻譜包絡V(k,l)。 [數 14]
tE{p) <l<tE(p +1),0<p<LE V(kJ) = Ε^(/ · nhigh + k) ^ < fTabieHigh{q + i)s〇 < q < nMgh 此處,假設將全頻帶分割成nhigh個頻帶。 此外,時間包絡算出部434 1、轉換增益算出部4344、 及訊號識別資訊生成部43 42的動作,係和第3實施形態相 同。又,第一隱蔽訊號生成部43 3的動作也和第3實施形態 相同。 以上雖然說明了,使用解碼過程中所得之作爲E。^的 -34- 201234352 功率頻譜包絡之功率及作爲fTableHigh的功率頻譜包絡之頻帶 交界來算出訊號識別資訊的例子,但亦可使用其他解碼過 程中所得之參數來算出訊號識別資訊,根據所得到的訊號 識別資訊來生成隱蔽訊號的任意手法。 如以上所述,在第5實施形態中,係可根據解碼過程 中輔助性獲得的參數而算出訊號識別資訊,基於該當訊號 識別資訊來生成隱蔽訊號並輸出。 〔關於隱蔽訊號生成程式〕 首先說明,令電腦成爲本發明所述之隱蔽訊號生成裝 置而動作的隱蔽訊號生成程式。 圖16係一實施形態所述之隱蔽訊號生成程式之構成的 圖示。圖1 4係一實施形態所述之電腦的硬體構成圖。圖1 5 係一實施形態所述之電腦的外觀圖。圖1 6所示的隱蔽訊號 生成程式P43,係可使圖14及圖1 5所示的電腦C10,成爲隱 蔽訊號生成部43而動作。此外,本說明書中所說明的程式 ,係不限定於圖1 4及圖1 5所示的電腦,亦可使行動電話、 攜帶型資訊終端、攜帶型個人電腦這類任意的資訊處理裝 置,依照該當程式而動作。 隱蔽訊號生成程式P43,係可被儲存在記錄媒體μ中 來提供。此外,作爲記錄媒體Μ則例如有,軟碟片、c D · ROM、DVD、或ROM等記錄媒體,或是半導體記億體等。 如圖1 4所示’電腦C 1 0係具備:軟碟片驅動裝置、c D -ROM驅動裝置、DVD驅動裝置等讀取裝置C12、作業用記 201234352 憶體(RAM ) C 1 4、用來記憶記錄媒體Μ中所記憶之程式 的記憶體C16、顯示器這類顯示裝置C18、屬於輸入裝置的 滑鼠C20及鍵盤C22、進行資料收送訊用的通訊裝置C24、 控制著程式之執行的中央演算部(CPU) C26。 電腦CIO,係一旦記錄媒體Μ被插入至讀取裝置C12, 則可從讀取裝置C12存取記錄媒體Μ中所儲存的隱蔽訊號 生成程式Ρ4 3,藉由隱蔽訊號生成程式Ρ4 3,就可成爲本發 明所述之隱蔽訊號生成裝置而作動。 如圖15所示,隱蔽訊號生成程式Ρ43,係可以被重疊 於載波之電,腦資料訊號W的方式,透過網路而提供。此時 ,電腦c 1 0,係可將通訊裝置C24所接收到的隱蔽訊號生成 程式Ρ43儲存在記憶體C16,執行隱蔽訊號生成程式Ρ43。 如圖16所示,隱蔽訊號生成程式Ρ43,係具備:解碼 訊號積存模組Ρ43 1、訊號識別模組Ρ434、及第一隱蔽訊號 生成模組Ρ43 3。這些解碼訊號積存模組Ρ431、訊號識別模 組Ρ43 4、及第一隱蔽訊號生成模組Ρ43 3,係令與前述之解 碼訊號積存部431、訊號識別部434 '及第一隱蔽訊號生成 部43 3各自相同之機能,被電腦C 1 0所執行。若依據所述之 隱蔽訊號生成程式Ρ43,則電腦C10係可成爲本發明所述之 隱蔽訊號生成裝置而動作。 藉由以上說明的各種實施形態,以隱蔽訊號生成爲目 的而根據緩衝區內的訊號來求出要作爲重複單位之波形之 際,可採用功率的時間變化或功率頻譜的時間變化。甚至 ,使用藉由採用 QMF ( Quadrature Mirror Filter )之時間 -36- 201234352 頻率轉換所得到的頻率領域訊號,來進行隱蔽訊號之生成 。在這些情況下’由於可使隱蔽訊號生成時的訊號之重複 單位’比先前使用MDCT或FFT之頻率領域訊號還短,因此 可避免爲了隱蔽而輸出之訊號中混雜有性質互異之訊號, 可防止封包遺失隱蔽訊號的音質低落。 【圖式簡單說明】 [圖1 ]發明之一實施形態中的系統環境之圖示。 [圖2]解碼部的構成圖。 [圖3]第1實施形態中的訊號識別部的構成圖。 [圖4]第1實施形態中的第一隱蔽訊號生成部之動作的 流程圖。 [圖5]第2實施形態中的訊號識別部的構成圖。 [圖6]第2實施形態中的訊號識別部之動作的流程圖。 [圖7]第2實施形態中的第一隱蔽訊號生成部之動作的 流程圖。 [圖8]第3實施形態中的訊號識別部的構成圖。 [圖9]第3實施形態中的訊號識別部之動作的流程圖。 [圖10]第4實施形態中的訊號識別部的構成圖。 [圖11]第4實施形態中的第一隱蔽訊號生成部之動作的 流程圖。 [圖12]第5實施形態中的訊號識別部的構成圖。 [圖13]第5實施形態中的輔助資訊之關係的圖示。 [圖14]電腦的硬體構成圖。 -37- 201234352 [圖1 5 ]電腦的外觀圖。 [圖16]隱蔽訊號生成程式之構成的圖示。 【主要元件符號說明】 1 :編碼部 2 :封包構成部 3 =封包分離部 4 :解碼部 41 :錯誤/遺失偵測部 42 :聲音解碼部 43 :隱蔽訊號生成部 431 :解碼訊號積存部 43 3 :第一隱蔽訊號生成部 434 :訊號識別部 4340 :解碼訊號積存部 434 1 :時間包絡算出部 4342 :訊號識別資訊生成部 4343 :時間頻率轉換部 4344 :轉換增益算出部 4345 :訊號識別資訊積存部 4346 :輔助資訊積存部 4347 :功率頻譜包絡算出部 C 1 0 :電腦 C 1 2 :讀取裝置 -38- 201234352 c 1 4 ’·作業用記憶體 C 1 6 :記憶體 C 1 8 :顯示器 C20 :滑鼠 C22 :鍵盤 C24 :通訊裝置
C26 : CPU Μ :記錄媒體 W :電腦資料訊號 Ρ43:聲音編碼程式 Ρ431 :解碼訊號積存模組 Ρ43 3 :第一隱蔽訊號生成模組 Ρ434 :訊號識別模組 -39-

Claims (1)

  1. 201234352 七、申請專利範圍: 1. 一種隱蔽訊號生成裝置,係屬於將含有聲音碼之 已被接收的封包的封包錯誤或封包遺失之偵測結果、及聲 音碼解碼所得之解碼訊號,從外部加以收取,針對封包遺 失部分所對應的解碼訊號,進行封包遺失之隱蔽的隱蔽訊 號生成裝置,其特徵爲,具備: 解碼訊號積存部,係將從前記偵測結果爲正常之封包 中所含之聲音碼所得到的解碼訊號,予以積存;和 訊號識別部,係當前記偵測結果爲異常時,偵測出所 被積存的解碼訊號之功率變化與功率頻譜之性質變化的雙 方或一方,將表示該當偵測結果之訊號識別資訊,予以輸 出;和 第一隱蔽訊號生成部,係基於前記訊號識別資訊、和 已被前記解碼訊號積存部所積存的解碼訊號,而生成用來 將封包遺失部分所對應之解碼訊號進行內插所需的隱蔽訊 號。 2 ·如請求項1所記載之隱蔽訊號生成裝置,其中,前 記訊號識別部,係偵測出功率劇烈變化之時點與功率頻譜 劇烈變化之時點的雙方或一方。 3. 如請求項2所記載之隱蔽訊號生成裝置,其中,前 記訊號識別部,係將有關變化之開始的資訊與有關變化之 結束的資訊之雙方或一方,當作訊號識別資訊而予以輸出 〇 4. 一種隱蔽訊號生成裝置,係屬於將含有聲音碼之 -40- 201234352 已被接收的封包的封包錯誤或封包遺失之偵測結果、及聲 音碼解碼所得之解碼訊號,從外部加以收取,針對封包遺 失部分所對應的解碼訊號,進行封包遺失之隱蔽的隱蔽訊 號生成裝置,其特徵爲,具備: 解碼訊號積存部,係將從前記偵測結果爲正常之封包 中所含之聲音碼所得到的解碼訊號,予以積存;和 訊號識別部,係當前記偵測結果爲正常時,則將表示 從聲音碼所得到之解碼訊號之功率變化與功率頻譜之性質 變化的雙方或一方之偵測結果用的訊號識別資訊,從外部 加以收取並積存,當前記偵測結果爲異常時,則將已被積 存之訊號識別資訊予以輸出;和 第一隱蔽訊號生成部,係基於前記訊號識別資訊、和 已被前記解碼訊號積存部所積存的解碼訊號,而生成用來 將封包遺失部分所對應之解碼訊號進行內插所需的隱蔽訊 號。 5.如請求項1〜4之任一項所記載之隱蔽訊號生成裝 置,其中’前記第一隱蔽訊號生成部,係將在前記解碼訊 號積存部中使用前記訊號識別資訊所指定之範圍的解碼訊 號予以重複所得之訊號,當作隱蔽訊號而予以生成。 6 ·如請求項1〜4之任一項所記載之隱蔽訊號生成裝 置’其中’前記第一隱蔽訊號生成部,係將在前記解碼訊 號積存部中使用前記訊號識別資訊所指定之範圍的解碼訊 號予以重複然後調整功率所得之訊號,當作隱蔽訊號而予 以生成。 -41 - 201234352 7. 一種隱蔽訊號生成方法,係屬於將含有 已被接收的封包的封包錯誤或封包遺失之偵測結 音碼解碼所得之解碼訊號,從外部加以收取,針 失部分所對應的解碼訊號,進行封包遺失之隱蔽 號生成裝置所執行的隱蔽訊號生成方法,其特徵 解碼訊號積存步驟,係將從前記偵測結果爲 包中所含之聲音碼所得到的解碼訊號,予以積存 訊號識別步驟,係當前記偵測結果爲異常時 所被積存的解碼訊號之功率變化與功率頻譜之性 雙方或一方,將表示該當偵測結果之訊號識別資 輸出;和 第一隱蔽訊號生成步驟,係基於前記訊號識 和已被前記解碼訊號積存步驟所積存的解碼訊號 用來將封包遺失部分所對應之解碼訊號進行內插 蔽訊號。 8. 一種隱蔽訊號生成方法,係屬於將含有 已被接收的封包的封包錯誤或封包遺失之偵測結 音碼解碼所得之解碼訊號,從外部加以收取,針 失部分所對應的解碼訊號,進行封包遺失之隱蔽 號生成裝置所執行的隱蔽訊號生成方法,其特徵 解碼訊號積存步驟,係將從前記偵測結果爲 包中所含之聲音碼所得到的解碼訊號,予以積存 聲音碼之 果、及聲 對封包遺 的隱蔽訊 爲,具備 正常之封 :和 ,偵測出 質變化的 訊,予以 別資訊、 ,而生成 所需的隱 聲音碼之 果、及聲 對封包遺 的隱蔽訊 爲,具備 正常之封 :和 -42- 201234352 訊號識別步驟,係當前記偵測結 示從聲音碼所得到之解碼訊號之功率 質變化的雙方或一方之偵測結果用的 部加以收取並積存,當前記偵測結果 積存之訊號識別資訊予以輸出;和 第一隱蔽訊號生成步驟,係基於 和已被前記解碼訊號積存步驟所積存 用來將封包遺失部分所對應之解碼訊 蔽訊號。 9- 一種隱蔽訊號生成程式,其 腦發揮機能成爲: 解碼訊號積存部,係將含有聲音 的封包錯誤或封包遺失之偵測結果爲 之聲音碼進行解碼所得到之解碼訊號 訊號識別部,係當前記偵測結果 被積存的解碼訊號之功率變化與功率 方或一方,將表示該當偵測結果之訊 出;和 第一隱蔽訊號生成部,係基於前 已被前記解碼訊號積存部所積存的解 將封包遺失部分所對應之解碼訊號進 號。 10. —種隱蔽訊號生成程式,其 腦發揮機能成爲: 果爲正常時,則將表 變化與功率頻譜之性 訊號識別資訊,從外 爲異常時,則將已被 前記訊號識別資訊、 的解碼訊號,而生成 號進行內插所需的隱 特徵爲,係用以使電 碼之已被接收的封包 正常的封包中所含有 ,加以積存;和 爲異常時,偵測出所 頻譜之性質變化的雙 號識別資訊,予以輸 記訊號識別資訊、和 碼訊號,而生成用來 行內插所需的隱蔽訊 特徵爲,係用以使電 -43- 201234352 解碼訊號積存部,係將含有聲音碼之已被接收的封包 的封包錯誤或封包遺失之偵測結果爲正常的封包中所含有 之聲音碼進行解碼所得到之解碼訊號,加以積存;和 訊號識別部,係當前記偵測結果爲正常時,則將表示 從聲音碼所得到之解碼訊號之功率變化與功率頻譜之性質 變化的雙方或一方之偵測結果用的訊號識別資訊,從外部 加以收取並積存,當前記偵測結果爲異常時,則將已被積 存之訊號識別資訊予以輸出;和 第一隱蔽訊號生成部,係基於前記訊號識別資訊、和 已被前記解碼訊號積存部所積存的解碼訊號,而生成用來 將封包遺失部分所對應之解碼訊號進行內插所需的隱蔽訊 號。 -44-
TW100141295A 2010-11-26 2011-11-11 Concealment signal generating device, concealment signal generation method and concealment signal generation program TW201234352A (en)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010264094A JP5694745B2 (ja) 2010-11-26 2010-11-26 隠蔽信号生成装置、隠蔽信号生成方法および隠蔽信号生成プログラム

Publications (1)

Publication Number Publication Date
TW201234352A true TW201234352A (en) 2012-08-16

Family

ID=46145697

Family Applications (1)

Application Number Title Priority Date Filing Date
TW100141295A TW201234352A (en) 2010-11-26 2011-11-11 Concealment signal generating device, concealment signal generation method and concealment signal generation program

Country Status (3)

Country Link
JP (1) JP5694745B2 (zh)
TW (1) TW201234352A (zh)
WO (1) WO2012070340A1 (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI831939B (zh) * 2019-03-25 2024-02-11 新加坡商雷蛇(亞太)私人有限公司 在音訊錯誤消除中使用遞增搜尋序列之方法及設備

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101452635B1 (ko) 2013-06-03 2014-10-22 충북대학교 산학협력단 Lms 예측기를 이용한 패킷 손실 은닉 방법 및 이를 기록한 기록매체
CN104347076B (zh) * 2013-08-09 2017-07-14 中国电信股份有限公司 网络音频丢包掩蔽方法和装置
JP5981408B2 (ja) 2013-10-29 2016-08-31 株式会社Nttドコモ 音声信号処理装置、音声信号処理方法、及び音声信号処理プログラム
WO2017153299A2 (en) * 2016-03-07 2017-09-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Error concealment unit, audio decoder, and related method and computer program fading out a concealed audio frame out according to different damping factors for different frequency bands
CN113763974B (zh) * 2021-08-31 2023-05-16 易兆微电子(杭州)股份有限公司 一种丢包补偿方法、装置、电子设备及存储介质

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001228896A (ja) * 2000-02-14 2001-08-24 Iwatsu Electric Co Ltd 欠落音声パケットの代替置換方式
EP1589330B1 (en) * 2003-01-30 2009-04-22 Fujitsu Limited Audio packet vanishment concealing device, audio packet vanishment concealing method, reception terminal, and audio communication system
SE527669C2 (sv) * 2003-12-19 2006-05-09 Ericsson Telefon Ab L M Förbättrad felmaskering i frekvensdomänen
EP1775717B1 (en) * 2004-07-20 2013-09-11 Panasonic Corporation Speech decoding apparatus and compensation frame generation method
JP2006276877A (ja) * 2006-05-22 2006-10-12 Nec Corp 変換符号化されたデータの復号方法及び変換符号化されたデータの復号装置
JP5123516B2 (ja) * 2006-10-30 2013-01-23 株式会社エヌ・ティ・ティ・ドコモ 復号装置、符号化装置、復号方法及び符号化方法
JP4504389B2 (ja) * 2007-02-22 2010-07-14 富士通株式会社 隠蔽信号生成装置、隠蔽信号生成方法および隠蔽信号生成プログラム
CN101542593B (zh) * 2007-03-12 2013-04-17 富士通株式会社 语音波形内插装置及方法
CN101207665B (zh) * 2007-11-05 2010-12-08 华为技术有限公司 一种衰减因子的获取方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI831939B (zh) * 2019-03-25 2024-02-11 新加坡商雷蛇(亞太)私人有限公司 在音訊錯誤消除中使用遞增搜尋序列之方法及設備

Also Published As

Publication number Publication date
JP5694745B2 (ja) 2015-04-01
WO2012070340A1 (ja) 2012-05-31
JP2012113235A (ja) 2012-06-14

Similar Documents

Publication Publication Date Title
KR101001170B1 (ko) 오디오 코딩
US10096323B2 (en) Frame error concealment method and apparatus and decoding method and apparatus using the same
JP4991743B2 (ja) オーディオコーディングのためのエンコーダ支援フレーム損失隠蔽技術
RU2690775C1 (ru) Устройство кодирования аудио, способ кодирования аудио, программа кодирования аудио, устройство декодирования аудио, способ декодирования аудио и программа декодирования аудио
US7805297B2 (en) Classification-based frame loss concealment for audio signals
TW201234352A (en) Concealment signal generating device, concealment signal generation method and concealment signal generation program
US8065141B2 (en) Apparatus and method for processing signal, recording medium, and program
KR101690899B1 (ko) 오디오 신호의 불연속 전송에서 높은 스펙트럼-시간 해상도를 가진 편안한 잡음의 생성
JP2004046179A (ja) 少計算量で高周波数成分を復元するオーディオデコーディング法及び装置
JP2009539132A (ja) オーディオ信号の線形予測符号化
JP2008261904A (ja) 符号化装置、復号化装置、符号化方法および復号化方法
JP2007333785A (ja) オーディオ信号符号化装置およびオーディオ信号符号化方法
JP4723490B2 (ja) 多チャンネルオーディオシステムにおけるチャンネル信号隠蔽
JP4947145B2 (ja) 復号装置、復号方法、及びプログラム
US20200126575A1 (en) Audio coding
JP6713424B2 (ja) 音声復号装置、音声復号方法、プログラム、および記録媒体
RU2776261C1 (ru) Устройство кодирования аудио, способ кодирования аудио, программа кодирования аудио, устройство декодирования аудио, способ декодирования аудио и программа декодирования аудио
JP2005532585A (ja) オーディオコーディング
RU2792658C1 (ru) Устройство кодирования аудио, способ кодирования аудио, программа кодирования аудио, устройство декодирования аудио, способ декодирования аудио и программа декодирования аудио
RU2759092C1 (ru) Аудиодекодер, поддерживающий набор разных инструментов маскирования потерь
JP2006023658A (ja) オーディオ信号符号化装置及びオーディオ信号符号化方法
JP4539180B2 (ja) 音響復号装置及び音響復号方法
JP4438654B2 (ja) 符号化装置、復号装置、符号化方法及び復号方法