TW201510986A - 在加水印聲訊訊號所接收版本一段內水印符號之檢測方法及裝置 - Google Patents

在加水印聲訊訊號所接收版本一段內水印符號之檢測方法及裝置 Download PDF

Info

Publication number
TW201510986A
TW201510986A TW103125609A TW103125609A TW201510986A TW 201510986 A TW201510986 A TW 201510986A TW 103125609 A TW103125609 A TW 103125609A TW 103125609 A TW103125609 A TW 103125609A TW 201510986 A TW201510986 A TW 201510986A
Authority
TW
Taiwan
Prior art keywords
correlation
time
audio signal
received
watermark symbol
Prior art date
Application number
TW103125609A
Other languages
English (en)
Inventor
Xiaoming Chen
Peter Georg Baum
Michael Arnold
Ulrich Gries
Original Assignee
Thomson Licensing
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Thomson Licensing filed Critical Thomson Licensing
Publication of TW201510986A publication Critical patent/TW201510986A/zh

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/018Audio watermarking, i.e. embedding inaudible data in the audio signal
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/32Circuits or arrangements for control or supervision between transmitter and receiver or between image input and image output device, e.g. between a still-image camera and its memory or between a still-image camera and a printer device
    • H04N1/32101Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title
    • H04N1/32144Display, printing, storage or transmission of additional information, e.g. ID code, date and time or title embedded in the image data, i.e. enclosed or integrated in the image, e.g. watermark, super-imposed logo or stamp
    • H04N1/32149Methods relating to embedding, encoding, decoding, detection or retrieval operations
    • H04N1/3232Robust embedding or watermarking

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Editing Of Facsimile Originals (AREA)

Abstract

在為加水印聲訊訊號之水印符號檢測中,使用相關性和統計檢測,計算複雜。所以,在相關性之前,可用縮減取樣。然而,如果加水印聲訊訊號係經感音途徑傳送,無縮減取樣時的檢測速率,遠比含有縮減取樣相關性輸入訊號時之檢測速率高。在計算複雜性和檢測牢靠性之間有所權衡。按照本發明,進行相關性結果數值之插值法,供輸入至統計檢測器,以概算相關性之檢測牢靠性,不需縮減取樣。

Description

在加水印聲訊訊號所接收版本一段內水印符號之檢測方法及裝置
本發明係關於在加水印聲訊訊號所接收版本一段內水印符號之檢測方法及裝置,其中加水印聲訊訊號所接收版本,可含雜訊和/或迴音。
聲訊加水印因內嵌隱藏資訊,改善聲訊訊號或軌道。若水印內嵌發生在頻率域,則內嵌用頻率範圍通常會受限制,例如從300Hz至10kHz,因鑑於採用低通過濾之感受透通性和對抗聲訊壓縮之牢靠性。就在48kHz或44.1kHz取樣之聲訊訊號言,以因數2之減縮取樣會減少複雜性,又不減對抗通常訊號處理步驟之牢靠性。
EP 2175444 A1和WO 2011/141292 A1揭示統計檢測器,改善跨越感音途徑(即揚聲器→微音器)的聲訊加水印牢靠性,致使例如第二顯示幕應用,成功部署聲訊加水印系統。此等統計檢測器使用加水因訊號和參照訊號間之相關性高峰量數值,並為水印符號檢測計算相對應假正機率(false positive probabilities)。
為有效實施,EP 2175444 A1統計檢測器使用循環相關性,代替常態相關性。循環相關性之效率係基於快速傅立葉轉換式(FFT)和逆快速傅立葉轉換式(IFFT)。FFT是為所接收加水印訊號和參照訊號而進行。俟一頻譜與另一頻譜之共軛複數相乘後,進行IFFT,得此等二訊號之循環相關性。進行此等相關性,計算上相當辛苦。
在第1圖所示水印解碼器處理中,所接到加水印訊號RWAS是在獲得或接收段步驟或階段11再取樣,然後可通過預處理步驟或階段12,在此進行頻譜整形和/或白化。在後續相關性步驟或階段13,是逐段 與一或以上參照圖形REFP相關化。符號檢測或決定步驟或階段14,決定是否有相對性水印符號DSYM存在。
在水印編碼器側,使用祕密關鍵詞產生擬似隨機相,由此產生相關參照圖形位元序列(亦稱為符號),用於對聲訊訊號加水印。在水印解碼器側,在相對應步驟或階段15,基於同樣祕密關鍵詞,以同樣方式產生此等擬似隨機相。在參照圖形產生步驟或階段16,從擬似隨機相產生相關候選參照圖形或符號REFP,在步驟/階段13用來核對,於所接收聲訊訊號之訊號段內,是否有相關水印符號存在。
與減縮取樣聯合之已知統計檢測器,在第2圖內以簡化方式繪示。在時間域內以因數'2'減縮取樣時,於循環相關性內可採用半長度之FFT和IFFT,造成複雜性較低。若採用全長FFT和IFFT,則此等複雜性降低更加明顯。對於使用聲訊水印檢測器之第二顯示幕應用而言,重點在減少手持式裝置之電力耗費。
在第2圖中,所接收加水印訊號RWAS和參照圖形REFP,分別通過2:1減縮取樣步驟或階段21和22。減縮取樣接著是循環相關性步驟或階段23,包含在輸入之FFT和結果輸出前之IFFT,以及統計水印檢測器25。在步驟/階段23,一頻譜是乘以其他頻譜之共軛複數,並進行IFFT處理,得二訊號RWAS和REFP之循環相關性結果。
然而,為跨越感音途徑傳送之加水印聲訊訊號或軌道,已發現無減縮取樣時,檢測速率遠比含有減縮取樣輸入訊號之檢測速率快。即計算複雜性和檢測牢靠性之間,有所權衡。
本發明待解決之問題為,在相關性之前不用減縮取樣,以達成類似統計檢測器之檢測牢靠性,同時使用減縮取樣達成減少統計檢測器之計算牢靠性。此問題係利用申請專利範圍第1項揭示之方法解決。利用此方法之裝置則揭示於申請專利範圍第2項。
按照本發明,為了在輸入之前不用減縮取樣,概算循環相關性之檢測牢靠性,在循環相關性和統計檢測器之間,插入時間插值步驟。
可惜由於減縮取樣,減少相關性結果峰值之數量,但時間插值增加相關結果峰值數量,因而達成改進水印檢測信賴性。如果實施插值, 例如長度短的FIR濾波器,修飾檢測器之計算複雜性,仍然遠比不用輸入值減縮取樣之檢測器為低。
本發明提供比無論用或不用減縮取樣之先前技術檢測器,更佳的檢測牢靠性/計算費神之權衡。
原則上,本發明方法適於檢測在加水印聲訊訊號所接收版本一段內之水印符號,其中該加水印聲訊訊號之該所接收版本,可含雜訊和/或迴音,且其中水印符號是藉修飾該聲訊訊號相對於至少二不同參照資料序列,內嵌於該聲訊訊號內,該方法包含步驟為:˙在時間上減縮取樣該所接收加水印聲訊訊號,並以相對應方式在時間上減縮取樣該候選參照資料序列;˙在各情況下,令該所接收加水印聲訊訊號的該段之減縮取樣版本,與該參照資料序列的該候選之減縮取樣版本相關化,其中該相關化係一種循環相關性,以獲得相關性結果數值之相對應集合;˙在時間上插值該相關性結果數值集合;˙根據為該聲訊訊號段的時間上插值相關性結果數值集合內之高峰量數值,於統計檢測器內檢測在該所接收聲訊訊號段內,存在有哪一相對應候選水印符號,以便輸出所接收聲訊訊號段之相對應檢測水印符號。
原則上,本發明裝置適於檢測在加水印聲訊訊號所接收版本一段內之水印符號,其中該加水印聲訊訊號之該所接收聲訊訊號,可含雜訊和/或迴音,且其中水印符號是藉修飾該聲訊訊號相對於至少二不同參照資料序列,內嵌於該聲訊訊號內,該裝置包含:˙機構適於在時間上減縮取樣該所接收加水印聲訊訊號,並以相對應方式在時間上減縮取樣該候選參照資料序列;˙機構適於在各情況下,令該所接收加水印聲訊訊號的該段之減縮取樣版本,與該參照資料序列的該候選之減縮取樣版本相關化,其中該相關化係一種循環相關性,以獲得相關性結果數值之相對應集合;˙機構適於在時間上插值該相關性結果數值集合;˙機構適於根據時間上插值相關性結果數值集合內之高峰量數值,為統計檢測器內之該聲訊訊號段,檢測在該所接收聲訊訊號段內,存在有哪一相對應候選水印符號,以便輸出所接收聲訊訊號段之相對應檢測水印符 號。
本發明有益之其餘具體例,揭示於申請專利範圍附屬項內。
41,42‧‧‧減縮取樣
43‧‧‧循環相關性
44‧‧‧插值器
45‧‧‧統計檢測器
第1圖為已知水印檢測器之方塊圖;第2圖為已知統計水印檢測器使用減縮取樣和循環相關性之處理;第3圖為有/無減縮取樣的相關性數值之比較;第4圖為本發明統計水印檢測器之處理。
第3圖繪示進入統計檢測器的一小段循環相關性數值之快照,不論有無減縮取樣,其中加水印聲訊訊號已傳送跨越感音途徑。虛線繪示在相關性之前無減縮取樣之相關性結果數值,而實線繪示減縮取樣後之相關性結果數值。在無減縮取樣的檢測器循環相關性內使用長度16384之FFTs/IFFTs,而在有減縮取樣的檢測器內循環相關性內使用長度8192之FFTs/IFFTs。為使8192長度和16384長度循環相關性之間方便比較起見,8192長度循環相關性之流轉指數乘以'2',故在第3圖內呈現二個16k相關性結果數值,與一個8k相關性結果數值比較。由第3圖可見,有些相關性結果數值高峰量值,由於減縮取樣而損失,如第3圖上二箭頭所指。然而,對統計檢測器而言,相關性結果數值高峰量值之評估乃本質性,以便改善檢測效益,詳見EP 2175444 A1所述。即平均而言,在引進畸變、迴音和/或混響之感音途徑存在下,減縮取樣降低檢測牢靠性。
如上所述,內嵌之頻率範圍可受限制。因而只有此頻率範圍與水印檢測有關。因此,在循環相關性計算的乘法步驟當中,只有相關頻率範圍才有必要乘法,於是在循環相關性後之輸出訊號,亦限於相關頻率範圍。
在因時間上減縮取樣而不可得之循環相關性數值,至少部份可利用時間上插值法重建,只要減縮取樣不在相關頻率範圍內引進化名(alias)。例如,若所接收訊號RWAS和參照訊號REFP在48kHz取樣,而相關頻率範圍限於10kHz,則減縮取樣因數'2'不會造成循環相關性後續輸出訊號內之任何頻譜化名。相對應時間插值器的頻率回應通帶,涵蓋內嵌 水印符號所用頻率範圍,而所用插值型式在於復原時間上介於相關性結果數值間之額外高峰數值。
此等時間插值型式載於F.M.Gardner著《數位數據機之插值:第1部基礎篇》,IEEE,Trans.of Commun.,第41卷第3期,1993年3月,第501-507頁,和L.Erup,F.M.Gardner和R.A.Harris合著《數位數據機之插值:第2部實施和效益篇》,IEEE,Trans.of Commun.,第41卷第6期,1993年6月,第998-1008頁。
所以,按照本發明和第4圖所示,插值步驟或階段44,配置在循環相關性步驟或階段43(接減縮取樣步驟或階段41和42),和統計檢測器45之間,其插值近似無減縮取樣情況之循環相關性。由於插值可利用低階FIR濾波完成(例如6-標位Lagrange插值器提供充分良好結果),此項解決方案對聲訊加水印檢測系統,提供檢測牢靠性和計算複雜性間之更佳權衡。此6-標位Lagrange插值器載於J.J.Wang新加坡國立大學博士論文《數位記錄系統之計時復原技術》,2002年,第139-140頁。
一方面,因為在統計檢測器45內只有使用相關性結果數值高峰,故步驟/階段44之插值,只有在循環相關性步驟/階段43輸出訊號中接近高峰量數值之訊號部位才有必要。此舉可進一步降低計算複雜性。
另方面,接續應用時間插值,可更加改善檢測牢靠性,因為此舉增加相關性結果高峰數值之數量,但減縮取樣輸入訊號之循環相關性,加上例如二次接續插值,仍然需要比無減縮取樣輸入訊號的循環相關性總共較少之計算複雜性。雖然,增加計算複雜性,且有可能基於可行之計算功率,進一步調節檢測牢靠性/計算複雜性權衡。
本發明可把用於加水印聲訊輸入訊號,以相對應方式改用於加水印視訊輸入訊號。
於核對輸入訊號之現時段後,以後續段輸入訊號,繼續上述處理。
本發明於若應用輸入訊號減縮取樣,則可應用任何相關性為基礎之水印檢測。
本發明處理可利用單一處理器或電子電路進行,或以並式操作和/或對本發明處理之不同組件操作之若干處理器或電子電路為之。
41,42‧‧‧減縮取樣
43‧‧‧循環相關性
44‧‧‧插值器
45‧‧‧統計檢測器

Claims (9)

  1. 一種在加水印聲訊訊號所接收版本(11,RWAS)一段內水印符號之檢測(14,45)方法,其中該加水印聲訊訊號之該所接收版本,可含雜訊和/或迴音,且其中水印符號是藉修飾該聲訊訊號相對於至少二不同參照資料序列(REFP),內嵌於該聲訊訊號內,該方法包含步驟為:˙在時間上減縮取樣(41)該所接收加水印聲訊訊號(RWAS),並以相對應方式在時間上減縮取樣(42)該候選參照資料序列(REFP);˙在各情況下,令該所接收加水印聲訊訊號(RWAS)的該段之減縮取樣版本,與該參照資料序列(REFP)的該候選之減縮取樣版本相關化(13,43),其中該相關化(13,43)係一種循環相關性,以獲得相關性結果數值之相對應集合;該方法之特徵為下列步驟:˙在時間上插值(44)該相關性結果數值集合;˙根據為該聲訊訊號段的時間上插值相關性結果數值集合內之高峰量數值,於統計檢測器(14,45)內檢測在該所接收聲訊訊號段內,存在有哪一相對應候選水印符號,以便輸出所接收聲訊訊號段之相對應檢測水印符號(DSYM)者。
  2. 一種在加水印聲訊訊號所接收版本(11,RWAS)一段內水印符號之檢測(14,45)裝置,其中該加水印聲訊訊號之該所接收聲訊訊號,可含雜訊和/或迴音,且其中水印符號是藉修飾該聲訊訊號相對於至少二不同參照資料序列(REFP),內嵌於該聲訊訊號內,該裝置包含:˙機構(41,42)適於在時間上減縮取樣該所接收加水印聲訊訊號(RWAS),並以相對應方式在時間上減縮取樣該候選參照資料序列(REFP);˙機構(13,43)適於在各情況下,令該所接收加水印聲訊訊號(RWAS)的該段之減縮取樣版本,與該參照資料序列(REFP)的該候選之減縮取樣版本相關化,其中該相關化係一種循環相關性,以獲得相關性結果數值之相對應集合;˙機構(44)適於在時間上插值該相關性結果數值集合;˙機構(14,45)適於根據時間上插值相關性結果數值集合內之高峰量數值,為統計檢測器內之該聲訊訊號段,檢測在該所接收聲訊訊號段內,存 在有哪一相對應候選水印符號,以便輸出所接收聲訊訊號段之相對應檢測水印符號(DSYM)者。
  3. 如申請專利範圍第1項之方法,或申請專利範圍第2項之裝置,其中該循環相關性(43)係在輸入使用FFT,和在結果輸出前使用IFFT進行者。
  4. 如申請專利範圍第1或3項之方法,或申請專利範圍第2或3項之裝置,其中內嵌水印符號所用頻率範圍,係比該聲訊訊號之總頻率範圍小者。
  5. 如申請專利範圍第1,3,4項之一項方法,或申請專利範圍第2至4項之一項裝置,其中非因在該循環相關性前的該時間上減縮取樣所產生之循環相關性結果數值,係利用時間插值(44)重建,復原該相對應結果數值之附加高峰數值,因而相對應時間插值器的頻率回應通帶,涵蓋內嵌水印符號所用頻率範圍者。
  6. 如申請專利範圍第5項之方法,或申請專利範圍第5項之裝置,其中該時間插值(44)係低階FIR濾波者。
  7. 如申請專利範圍第6項之方法,或申請專利範圍第6項之裝置,其中該時間插值(44)係使用6-標位Lagrange插值器進行者。
  8. 如申請專利範圍第1和3至7項之一項方法,或申請專利範圍第2至7項之一項裝置,其中該時間插值(44)係只在相關性結果數值集合之高峰量值附近進行者。
  9. 如申請專利範圍第1和3至8項之一項方法,或申請專利範圍第2至8項之一項裝置,其中該時間減縮取樣(41,42)係2:1減縮取樣,而該時間插值(44)係1:2插值者。
TW103125609A 2013-08-08 2014-07-28 在加水印聲訊訊號所接收版本一段內水印符號之檢測方法及裝置 TW201510986A (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
EP13306138.2A EP2835799A1 (en) 2013-08-08 2013-08-08 Method and apparatus for detecting a watermark symbol in a section of a received version of a watermarked audio signal

Publications (1)

Publication Number Publication Date
TW201510986A true TW201510986A (zh) 2015-03-16

Family

ID=49083617

Family Applications (1)

Application Number Title Priority Date Filing Date
TW103125609A TW201510986A (zh) 2013-08-08 2014-07-28 在加水印聲訊訊號所接收版本一段內水印符號之檢測方法及裝置

Country Status (4)

Country Link
US (1) US20160217798A1 (zh)
EP (2) EP2835799A1 (zh)
TW (1) TW201510986A (zh)
WO (1) WO2015018668A1 (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10236031B1 (en) * 2016-04-05 2019-03-19 Digimarc Corporation Timeline reconstruction using dynamic path estimation from detections in audio-video signals
CN111462765B (zh) * 2020-04-02 2023-08-01 宁波大学 一种基于一维卷积核的自适应音频复杂度表征方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2003083859A2 (en) * 2002-03-28 2003-10-09 Koninklijke Philips Electronics N.V. Watermark time scale searching
EP2175443A1 (en) 2008-10-10 2010-04-14 Thomson Licensing Method and apparatus for for regaining watermark data that were embedded in an original signal by modifying sections of said original signal in relation to at least two different reference data sequences
EP2387033A1 (en) 2010-05-11 2011-11-16 Thomson Licensing Method and apparatus for detecting which one of symbols of watermark data is embedded in a received signal

Also Published As

Publication number Publication date
EP3031049A1 (en) 2016-06-15
WO2015018668A1 (en) 2015-02-12
US20160217798A1 (en) 2016-07-28
EP2835799A1 (en) 2015-02-11

Similar Documents

Publication Publication Date Title
Wang et al. A novel synchronization invariant audio watermarking scheme based on DWT and DCT
CN110739002A (zh) 基于生成对抗网络的复数域语音增强方法、系统及介质
US8428756B2 (en) Data embedding device, data embedding method, data extraction device, and data extraction method
JP5567150B2 (ja) 差分符号化を用いたウォーターマーク生成器、ウォーターマーク復号器、バイナリーメッセージデータに基づいてウォーターマーク信号を提供する方法、ウォーターマーク済み信号に基づいてバイナリーメッセージデータを提供する方法及びコンピュータプログラム
KR101729634B1 (ko) 키보드 타이핑 탐지 및 억제
KR20030015373A (ko) 오디오 신호를 재샘플링하는 튼튼한 워터마크의 생성 및검출
EP2936487A1 (en) Generation of a comfort noise with high spectro-temporal resolution in discontinuous transmission of audio signals
Dehkordi et al. Robust LSB watermarking optimized for local structural similarity
Hu et al. A dual cepstrum-based watermarking scheme with self-synchronization
CN104658544A (zh) 一种语音中瞬态噪声抑制的方法
JP5665886B2 (ja) バイナリーメッセージデータを提供するウォーターマーク復号器および方法
TW201510986A (zh) 在加水印聲訊訊號所接收版本一段內水印符號之檢測方法及裝置
EP1493154A1 (en) Time domain watermarking of multimedia signals
Malik et al. Robust data hiding in audio using allpass filters
JP6316288B2 (ja) 電子透かし埋め込み装置、電子透かし検出装置、電子透かし埋め込み方法、電子透かし検出方法、電子透かし埋め込みプログラム、及び電子透かし検出プログラム
CN115760535A (zh) 基于局部均值分解的自适应音频盲水印嵌入与提取方法
Wu et al. Analysis-by-synthesis echo hiding scheme using mirrored kernels
JP2005521909A (ja) マルチメディア信号の透かしに関するウィンドウ・シェーピング関数
Karantaidis et al. Efficient Capon-based approach exploiting temporal windowing for electric network frequency estimation
KR20030016381A (ko) 워터마킹
EP1695337B1 (en) Method and apparatus for detecting a watermark in a signal
JP4290014B2 (ja) ウォーターマークされた情報信号のデコーディング
Banitalebi et al. Robust lsb watermarking optimized for local structural similarity
Wu et al. Comparison of two speech content authentication approaches
TW201316684A (zh) 用於切換目的之數位切換信號序列、用於將該數位切換信號序列包含於數位音訊資訊信號內之裝置及用於接收具有切換信號序列之資訊信號之裝置