TW201501118A - 所接收含有回聲、混響和/或雜訊的聲頻訊號中水印符號之決定方法和裝置 - Google Patents

所接收含有回聲、混響和/或雜訊的聲頻訊號中水印符號之決定方法和裝置 Download PDF

Info

Publication number
TW201501118A
TW201501118A TW103111573A TW103111573A TW201501118A TW 201501118 A TW201501118 A TW 201501118A TW 103111573 A TW103111573 A TW 103111573A TW 103111573 A TW103111573 A TW 103111573A TW 201501118 A TW201501118 A TW 201501118A
Authority
TW
Taiwan
Prior art keywords
value
peak
watermark
probability
audio signal
Prior art date
Application number
TW103111573A
Other languages
English (en)
Inventor
Xiaoming Chen
Peter Georg Baum
Michael Arnold
Ulrich Gries
Original Assignee
Thomson Licensing
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Thomson Licensing filed Critical Thomson Licensing
Publication of TW201501118A publication Critical patent/TW201501118A/zh

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/018Audio watermarking, i.e. embedding inaudible data in the audio signal
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/00086Circuits for prevention of unauthorised reproduction or copying, e.g. piracy
    • G11B20/00884Circuits for prevention of unauthorised reproduction or copying, e.g. piracy involving a watermark, i.e. a barely perceptible transformation of the original data which can nevertheless be recognised by an algorithm
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/00086Circuits for prevention of unauthorised reproduction or copying, e.g. piracy
    • G11B20/00884Circuits for prevention of unauthorised reproduction or copying, e.g. piracy involving a watermark, i.e. a barely perceptible transformation of the original data which can nevertheless be recognised by an algorithm
    • G11B20/00891Circuits for prevention of unauthorised reproduction or copying, e.g. piracy involving a watermark, i.e. a barely perceptible transformation of the original data which can nevertheless be recognised by an algorithm embedded in audio data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F21/00Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
    • G06F21/10Protecting distributed programs or content, e.g. vending or licensing of copyrighted material ; Digital rights management [DRM]
    • G06F21/106Enforcing content protection by specific content processing
    • G06F21/1063Personalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Computer Security & Cryptography (AREA)
  • Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • Editing Of Facsimile Originals (AREA)
  • Complex Calculations (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Abstract

於水印聲頻訊號傳輸越過聲徑,造成回聲、混響和/或雜訊後,水印檢測相關結果峰值集中在主相關結果峰值周圍之有限時間範圍內,其有限時間範圍遠比總相關長度為小。水印檢測根據如下:設np為未標記內容相關結果數值的平均或期望機率分佈之相關結果峰值ν=(ν1,ν2,...,□),機率之計算是在涵蓋有限時間範圍內,有np或更多數值來自大於或等於此等峰值ν之相關結果數值集合。

Description

所接收含有回聲、混響和/或雜訊的聲頻訊號中水印符號之決定方法和裝置
本發明係關於所接收含有回聲、混響和/或雜訊的聲頻訊號中水印符號之決定方法和裝置。
聲頻加水印法是在聲頻訊號內,以無聞方式內嵌附加資訊之過程。內嵌是以改變聲頻訊號方式進行,例如增加擬似隨機雜訊或回聲。為進行無聞內嵌,是以聲頻訊號之音質分析,控制內嵌強度。
WO 2011/141292 A1載說水印檢測聲頻訊號(例如由微音器接收之揚聲器聲音)內存在回聲、混響和/或雜訊。此等回聲造成具有水印符號(即參考訊號)的相關結果數值序列長度N內之複數峰值,用來改進水印檢測可靠性。統計檢測器之基本步驟為:對各候選水印符號,找出相關結果序列內之峰值ν=(ν 1,ν 2,...,),其中ν 1 ...,而n p 是考慮在內的相關結果峰值數;遞歸式計算正待內嵌的候選水印符號之假正機率P (k)k=1,...,n p ;選擇造成最低P (k)值之候選水印符號。
P (k)是假性接收候選水印符號之機率。說明k之機率,或來自無水印訊號段節大於或等於考慮中實際k峰值之更多相關結果數值。
統計檢測器解決下列問題:
(a)如何遞歸式評估機率,其所考慮峰值數k可逐漸增加。
(b)如何藉再使用業已進行之計算,把計算複雜性減到最低。
統計檢測器使用數個相關結果峰值,以改進檢測性能。若加水印軌道傳輸越過聲徑,因回聲造成多路徑檢測,則此項改進尤其有利。 計算P (k)所用n p 峰值ν 1 ...,是取自全部相關結果數值序列長度N
然而,此項處理並未以最佳方式反映物理現實,因為相關結果數值序列內之附加峰值,係源自混響,所以在主峰值周圍附近組群。亦即會相對於揚聲器和檢測裝置微音器間之直接路徑延時,但只在有限時期內。若水印檢測裝置接到聲音跨越路徑,與聲源之距離為d s (在樣本s內測量),則傳播距離為d m =d s cT,其中cT視聲音在一抽樣間距內之傳播距離,T=1/f是抽樣率,c是聲速。例如,若對直接路徑為,間接路徑為 ,則直接路徑主峰值和因反映的鄰區峰值間的樣本內之距離 為,其中。在典型的設定中,相關長度N=16k樣本(其中1k≡1024)。所以,峰值可在窗內搜尋,例如規模為在主峰值或諸峰值周圍L 1k樣本(即,L<<N),即可計算相對應假正機率。因主相關結果峰值位在N相關結果數值現時集合之某處,假正機率是就規模N的緩衝器內規模L的窗全部可能之N-L+1移位而計算。
本發明所欲解決的問題是,比已知統計水印檢測器更佳考慮多路徑接收之物理學,因此改進假正機率計算和水印檢測性能。此問題是由申請專利範圍第1項之方法解決。利用此方法之裝置載於申請專利範圍第2項。
如上所述,接著傳輸加水印聲頻訊號跨越聲徑,造成回聲、混響和/或雜訊,水印檢測相關結果峰值一般係集中在有限時間範圍內的主相關結果峰值周圍,其最大尺寸標示為L,遠較總共相關長度N為小。水印檢測之相關課題可格式化如下:為未標記聲頻訊號內容,在相關結果數值平均或期望機率分佈內,設n p 峰值ν=(ν 1,ν 2,...,),如何計算在長度L之滑窗內有n p 或來自大於或等於此等峰值ν的現時長度N相關結果數值集合更多峰值之機率P FP (n p ,L,ν)?
測量顯示對未標記內容的相關結果數值之此等平均或期望機率分佈,相當於或類似高斯(Gaussian)分佈。
附註:當逐一樣本移位參考形態越過現時輸入聲頻訊號段節,以進行相關時,此相關之N數值結果有正峰值和負峰值,一起稱為「峰量值」。
為簡化如下說明,引進一些註記:c j (c j ,c j+1,...,c j+L-1)指在長度L的第j個滑窗在N內位置j開始的L相關結果數值。
c j ν指在向量c j 內,於未標記內容的相關結果數值之平均或期望機率分佈中,有n p 或更多現時相關結果數值大於或等於n p 峰值ν
c j ν意指向量c j 內,於未標內容的相關結果數值之平均或期望分佈中,有低於n p 現時相關結果數值大於或等於n p 峰值ν
備註:c j νc j ν互補,Pr{c j ν}+Pr{c j ν}=1其中Pr意指機率。
令長度L的滑窗移位通過N相關結果數值。如上所述,所需FP(假正)機率,是在無水印聲頻訊號內容相關結果數值之平均或期望機率分佈中,一次或多次滑窗含n p 或更多相關結果量數值大於或等於n p 峰值之機率。為FP機率互補情況是,在無水印聲頻訊號內容相關結果數值之平均或期望機率分佈中,無含n p 或更多相關結果量數值大於或等於n p 峰值,即c j ν,。因此,Pr{c j ν,}是假正機率Pr{(1,...,N-L+1),c j ν}(以j指一或以上窗)之互補機率。
最後FP機率計算可表達為(詳後):
L=N而言(在此情況c 1c=(c 1,c 2,...,c N ))),鑑於上述'c j ν'定義中的備註,此通式可縮小到WO 2011/141292統計檢測器中遞歸計算之情況:Pr{c 1 ν}=1-Pr{c 1 ν}。
Pr{c 1 ν}之計算載於WO 2011/141292內為統計檢測器所述:基於現時訊號段節相關結果數值內之峰值,可使這種水印符號假正機率之有關數值,檢測候選符號之一存在於現時訊號段節內,其中假正機率是以遞歸方式計算,而指定數量的相關結果峰值之總共假正機率,起先是使用較少數量的相關結果峰值之假正基率評估,並按照所需檢測可靠性,逐漸提高所考慮相關結果峰值之數量。
所以,下述假正機率之計算映射到計算Pr{c 2 ν,c 1 ν}之問 題:對指定數n p 之峰值,此機率可從n p -1峰值之機率,以峰值i=1,2開始,按遞歸方式計算(參見下述具體例之說明)。
雖然本發明改進WO 2011/141292統計水印檢測處理之檢測性能,大為減少假正檢測決定,仍保有WO 2011/141292水印檢測之全部優點。
本發明宜用在第二顯示幕場景,使用者在此看電視,並經由加水印電視聲音,聽到水印資訊,例如供圖板電腦,使用水印資訊基本上同步下載和呈現與現時電視節目有關的附加資訊。
原則上,本發明方法適於決定在所接收聲頻訊號內之水印符號,可含回聲、混響和/或雜訊,該方法包含步驟為:令所接收聲頻訊號之現時段節,與關係到相對應不同候選水印符號is的至少二個不同候選參考形態訊號相關,以便為各候選水印符號is,在各情況下產生N相關結果數值c is ;為各候選水印符號is,決定該相關結果數值c is 內之M峰值;為各候選水印符號is,從該M推衍相關結果峰值,不是為該接收聲頻訊號之該現時段節,由該候選水印訊號is決定水印符號,便是決定未檢測到水印符號;其中該水印符號決定又包含如下步驟:為註明為全局峰值的各該M峰值和各候選水印符號is,從現時相關結果數值c is ,決定各長度LM窗內n p 峰值之相對應向量,各長度L窗包含該M全局峰值之一,而全部長度L窗之合計長度小於N,其中k=1,...,M;為各該長度LM窗,從現時相關結果數值c is ,計算假正機率FP(),相當於一倍或多倍之機率,使長度L窗含n p 或更多相關結果數值,大於或等於為無水印聲頻訊號相關結果數值之平均或期望機率分佈之n p 峰值;為該接收聲頻訊號之現時段節,選擇候選水印符號is,做為所檢測水印符號,具有最低假正機率數值min is (min k (FP()))。
原則上,本發明裝置適於決定含回聲、混響和/或雜訊的接收聲頻訊號內之水印符號,該裝置包含: 機構係適於使接收聲頻訊號之現時段節,與攸關相對應不同候選水印符號is之至少二不同候選參考形態訊號相關,以便在各情況下,為各候選水印符號is產生N現時相關結果數值c is ;機構係適於為各候選水印符號is,決定該相關結果數值c is 內之M峰值,並由各候選水印符號is之該M相關結果峰值,為該接收聲頻訊號之該現時段節推衍,從該候選水印符號is決定水印符號,或決定未檢測到水印符號;其中為註明為全局峰值的各該M峰值,和各候選水印符號is,從現時相關結果數值c is ,決定長度L之各M窗內n p 峰值相對應向量,各長度L窗包含該M全局峰值之一,而全部長度L窗之合計長度小於N,其中k=1,...,M;且其中為長度L的該M窗之各一,從現時相關結果數值c is ,計算假正機率FP()數值,相當於一倍或數倍之機率,使長度L窗含n p 或以上相關結果數值,在無水印聲頻訊號相對應結果數值之平均或期望機率分佈中,大於或等於n p 峰值;又其中為該接收聲頻訊號之現時段節,選擇候選水印符號is,做為檢測水印符號,具有最小假正機率數值min is (min k (FP()))。
本發明有益之其他具體例,載於申請專利範圍各附屬項內。
41‧‧‧獲取步驟
42‧‧‧預處理步驟
43‧‧‧全部參考形態相關步驟
44‧‧‧水印符號檢測步驟
45‧‧‧隨機相發生步驟
46‧‧‧參考形態訊號發生步驟
50‧‧‧接收輸入相關區塊c is
51‧‧‧按照其幅度分序相對應相關結果數值之集合c is 以決定M最大量值步驟
52‧‧‧決定各全局峰值周圍原有相關結果數值±L/2範圍內峰量值之相對應向量步驟
53‧‧‧比較步驟
54‧‧‧從現時相關結果數值計算假正機率FP()步驟
55‧‧‧如果FP()比預定臨限值Tmin小即假設已找到正確候選水印符號步驟
56‧‧‧比較步驟
57‧‧‧比較步驟
58‧‧‧決定最後假正機率fpmin is (min k (FP()))之候選水印符號步驟
59‧‧‧藉比較fp數值與又一臨限值Tmax核對是否已檢測到水印符號步驟
第1圖為大於或等於三個相關結果峰值ν 3,ν 2,ν 1的三個或以上相關數值之脫開可能性;第2圖為具有二數值 ν之脫開可能性,即相對應表示式向量[0,1,1],[0,0,2],[m 2,0],[m 1,1,0],[m 1,0,1]以及零補償過之表示式向量[[0,1,1]],[[0,1,1]],[[1,m 1,0]],[[m 1,0],[[m 1,0,1];第3圖為'm '情況之通常數值分佈;第4圖為本發明處理之方塊圖;第5圖為本發明處理之流程圖;第6圖為所繪示三個長度L窗之相關結果。
茲參照附圖說明本發明具體例。
具體例之說明
A.假正(FP)機率之定義
在根據交互相關的水印檢測中,公知使用單一相關結果峰值,以決定內嵌水印資訊。然而,本發明記載最適水印檢測,採用複數相關結果峰量值。為評估FP機率,假設:任何未標記訊號段節內容與參考形態或水印符號間之相關數值,是獨立的識別上分佈之隨機變數;就特殊相關結果峰值ν,已知如何計算相對應機率分佈之尾項機率p Pr{c ν},其中c註明經受到特殊分佈,像高斯分佈之相關數值。
對長度N的現時相關結果內之單一峰值ν言,FP機率是在未標記內容的相關結果數值之平均或期望機率分佈中,N相關數值有一或以上數值不低於峰值ν之機率。
同理,對於n p 峰值ν 1 ν 2 ...,假正機率界定為,在未標記內容的相關結果數值之平均或期望機率分佈中,有n p 或更多相關結果數值大於或等於此等峰值ν 1,ν 2,...,之機率,其中相對應尾項機率界定為p i Pr{c ν i },1 i n p
指定特殊相關結果向量樣本[c 1,...,c L ],按照分序(指明向量聚集序列數值x,指數從n 1n 2),即c 1 c 2 ... c L ,可決定是否具有或更多數值大於或等於:nGT=0;for i=1:np if ci>=vi nGT=nGT+1;end end
若nGT=np,具有n p 或更多數值大於或等於,結果標記為。就之情況,劃分成脫開事件。最後FP機率是個別發生事件的機率總和。
A.1相關數值分佈,與複數峰值比較
為了把相關結果數值與複數峰值比較起見,把全範圍的相關結果量值,分成n p +1間距:
然後進行相關數值分佈,計數有多少相關結果量值位在個別間距內,可記載為表示式向量。因為某些間距內有許多數值,對FP機率評估無關,故表示式向量可有不同長度。所以,在此說明中,表示式向量最右元件始終相當於間距[ν 1,+∞),而最左元件稱為第一元件。
第1圖表示不同情況之相關數值分佈,其中n p =3或以上相關結果數值大於或等於三個峰值ν 3 ν 2 ν 1
P 1情況可以表示式向量[m 3]說明,表示在間距[ν 1,+∞)內有3個或以上相關結果數值,而其他L-m相關結果數值低於峰值ν 1。一方面,不管間距[ν 3,ν 2)或[ν 2,ν 1)內有多少數值,此等情況全部包含在L-m相關結果數值低於ν 1之條件內。另方面,為與三個峰值比較,宜核對有多少相關結果數值是位在特殊間距[ν 3,ν 2),[ν 2,ν 1),[ν 1,∞)內。對表示式向量[m 3]而言,最壞情況是,相關結果數值既不在間距[ν 3,ν 2)內,也不在間距[ν 2,ν 1)內,相當於表示式向量[0,0,m 3]。
對於此情況,由於ν 1 ν 2,ν 1 ν 3,仍然至少有一數值 ν 1,一數值 ν 2,和一數值 ν 3。此可解釋為,與間距[ν 3,ν 2)和[ν 2,ν 1)關聯之二個零,在間距[ν 1,∞)以m 3補償。為簡明起見,在此情況標記[[...]]的「零補償表示式向量」,可界定為[[1,1,m 1]],以原先表示式向量[m 3]推衍。除非另有說明,對間距[,+∞)使用長度n p 之零補償表示式向量。
例如以P 2情況而言,在[ν 1,∞)內有二相關結果數值,在間距[ν 2,ν 1)內有零相關結果數值,在間距[ν 3,ν 2)內有m 1相關結果數值,而低於ν 3L-2-m相關結果數值。
設表示式向量a=[a n,...,a 2,a 1],其相對應零補償之抗衡件,推衍如下:把向量a展開到長度n p ,增加n p -n零:a'=[,α];在a'內找到大於'1'的元件,如{a j(t),1 t T};對於t=1,2,...,T,進行零補償:如果在a j(t)左側有零,從右到左頂 多補償a j(t)-1個零。於零補償之際,零元件和相對應a j(t)即接續更新。每次補償'0'時,其在a'內之值,即變成'1',而a'內之a j(t)即減。
所得向量a'是a的零補償表示式向量。須知k n的任何間距[ν k ,+∞)之零補償表示式向量,同樣只要把n p 改為k即可得之。
例如對第1圖所列情況,表示式向量及其零補償表示式向量分別為:[m 3],[m 1,0,2],[m 1,2],[m 2,1],[m 1,1,1]和[[1,1,m 1]],[[m 1,1,1]],[[1,m 1,1]],[[1,m 1,1],[[m 1,1,1]]顯然,從表示式向量映射到相對應零補償表示式向量,是獨一無二,而對於逆映射,可能非真。
好處是,引進如此零補償表示式向量,即變得更容易比較包含複數峰值之相關結果數值。
具體而言,若在零補償表示式向量內無零元件,即可假設聚集N相關數值,標註為=(c 1,c 2,...,c N )之相關向量,大於或等於n p 峰值,扼要標註為。再者,若在零補償表示式向量內有k零,可稱確實有n p -k
按照第1圖所示數值分佈,個別事件之機率可計算如: 而最後機率為P FP =P 1+P 2+P 3+P 4+P 5。因數(p i -p i-1 )是獲得相關結果峰值在[ν i ,ν i-1 ]範圍內之機率,而(1-p i )是得到峰值在範圍(-∞,ν i ]內之機率。
B.在有限範圍內相關結果峰值之機率
如前所述,對於訊號傳輸跨越聲徑而言,相關結果峰量值一般是集中在最大規模L的有限時間範圍內,遠比相關長度N為小。因此,對出之於N相關結果數值的長度L現時窗內之n p 峰量值而言,要計算在未標記內容相關結果數值之平均或期望機率分佈內,於此現時長度L窗內有大於或等於n p 峰量值的n p 或以上相關結果量值之機率。
B.1本發明FP機率計算處理
c j (c j ,c j+1,...,c j+L-1),c j νc j ν的定義如上所述。
對含有一倍或以上n p 或更多數次大於或等於n p 期望峰值的滑窗之相輔情況是,無含有n p 或更多數值大於或等於n p 期望峰值之滑窗,即c j ν,。因此,對FP機率之相輔機率為:
使用鏈式規則,聯合機率Pr{c 1 ν,c 2 ν,...,c N-L+1 ν}可利用條件機率計算:
對相關向量c j 言,只有最後先型c j-1在條件機率中有關Pr{c j ν|c j-1 ν,...,c 1 ν},因為其所含幾乎就是c j 一新元件:
所以,聯合機率Pr{c 1 ν,c 2 ν,...,c N-L+1 ν}可以改寫成:
此外,L相關樣本之子集業已表示全部N樣本之表示式集合,因為L夠大,導致恒等式: 代入式(2)內:
因為已知如何評估Pr{c 1 ν},FP機率計算即減少條件機率Pr{c 2 ν|c 1 ν}之評估。
B.2條件機率評估
條件機率Pr{c 2 ν|c 1 ν}可以使用條件機率定義再公式化。設二事件AB,而P(B)>0,A特定B之條件機率界定為:
所以Pr{c 2 ν|c 1 ν}可以寫成:
因此,FP機率可評估為:
L=N而言,此通式縮減到WO 2011/141292統計水印檢測處理中的遞歸式計算情況(在此情況c 1 [c 1,...,c N ]):
LN情況中,為計算方程式(6),進行斷裂,如下節所述。
B.3根據相關數值分佈之聯合機率評估
聯合機率Pr{c 2 ν,c 1 ν}可表示為:Pr{c 2 ν,c 1 ν}={具有確實(n p -1)值 ν,於c L+1成為c 2 ν,於c 1成為c 1 ν} (7)
具有確實(n p -1)值 ν之情況,再分成二離開組群:
在間距[,+∞)內具有確實(n p -1)值,且在間距[,)內無數值。為此情況,間距[,+∞)之相對應零補償表示式向量,將無零元件,同時只有'1'元件。否則,在間距[,)內之零會受到補償,即與具有確實(n p -1)值 ν之拘限矛盾。
在間距[,+∞)內具有確實(n p -1)值,和在間距[,+∞)內具有確實(n p -1)值 ν,相當於在數值分佈之某些間距內'm b'之情況。此從下述實施例即可明顯。
n p =3情況而言,在間距[ν 2,+∞)內具有確實n p -2=1值。意即間距[ν 2,+∞)之全部零補償表示式向量,具有一零元件。更具體而言,[[0,1]]和[[m 1,0]]是n p =3之相對應零補償表示式向量。
‧就[[0,1]]而言,為了在間距[ν 3,+∞)內具有確實(n p -1)=2值 ν,在間距[ν 3,ν 2)內必須有一或以上數值。因此,間距[ν 3,+∞)之零補償 表示式向量變成[[m 1,0,1]],意即在[ν 3,ν 2)內有m 1數值。
‧就[[m 1,0]]而言,可進一步分成[[1,0]]或[[m 2,0]]。就[[1,0]]而言,零補償表示式向量必須是[[m 1,1,0]],故在間距[ν 3,+∞)內具有確實(n p -1)=2值 ν。就[[m 2,0]]而言,相對應表示式向量為[m 2,0],而在間距[ν 3,ν 2)內不必再要求數值數量,以符合具有確實(n p -1)=2值 ν之條件。
第2圖列出具有確實二數值 ν之情況。P 1P 2相當於在間距[ν 3,ν 2)內無數值之情況。P 3,P 4P 5情況在一間距內有'm b'。對第2圖之五種情況,全部零補償表示式向量均只有單一零元件。所以,可為c L+1c 1直接了當選擇數值範圍,使對c L+1成為c 2 ν,而對c 1成為c 1 ν
例如P 2相當於零補償表示式向量[[0,1,1]]。若c 1<ν 3,於c 1,得。另方面,若c L+1 ν 3,於c L+1,則得
因此,個別機率可計算成:
一般而言,計算P 3,P 4,P 5機率之和項,可採用二項式定理重定公式:
n 1n 2-n 1,則大為減少計算上之複雜性。
此外,以'm b'情況言,諸如第2圖所示P 3,P 4,P 5,可建構查表,以減少計算複雜性。
第3圖表示'm b'情況之一般數值分佈。間距[ν q,∞)內之數值數量以s標記,而在間距[ν q+1,∞)內有m數值。因此,1 q n p -1,0 s n p -2,而b=n p -1-s。設峰值數n p ,依賴qs的查表,可建構如下:
具備了具有確實(n p -1)值 ν的全部脫離情況之表示式向量,即可直接了當評估FP機率。
B.4遞歸表示式向量建構
使用表示式和零補償向量,來計算假正機率FP()。若此等向量已知,可將機率P 1P 5之方程式公式化,見說明第2圖時之實施例。因此,FP()之計算映射到指定峰值數n p 全部向量之建構問題。以下說明如何以遞歸式獲得表示式向量。如前所述,第2圖之全部情況均可以相對應表示式向量表示:[0,1,1],[0,0,2],[m 2,0],[m 1,1,0],[m 1,0,1]。前二向亮可以遞歸式決定,已如上述。關於遞歸式建構後三個向量,最後三個向量有二性能:‧'m b'元件始終是最先元件;‧全部元件之和為m 2。
換言之,設表示式向量之剩餘原件不含'm b',則可推論'm b':參見第3圖,其中設定s,則b=n p -1-s。所以,第2圖內P 3,P 4,P 5 情況之表示式向量,推論出[0],[1,0],[0,1]。而問題變換成如何為n p 峰值找出此等簡化之表示式向量。
由於第3圖的動機,此等表示式向量按照s {0,1,...,n p -2}數值,分成不同集合。為s設表示式向量,即可藉展開和添加單位向量,建構s+1之相對應表示式向量。
B.4.1初始化:
s=0言,表示式向量集合為{[0]},而就s=1而言,表示式向量集合為{[0,1],[1,0]}。
B.4.2更新1 s n p -3:
s集合內個別表示式向量之長度lj,按不同方式建構s+1之現時遞歸:
‧若長度lj<s+1,找出表示式向量中的首先非零元件。令i為首先非零元件之位置。於表示式向量添加單位向量e 1,...,e i ,得新表示式向量。單位向量實施例為e i =(0,...,0,1,0,...,0),其中第一個零位置'1',第二個零位置'i-1',而'1'的位置'i',第三個零位置'i+1',最後的零位置'lj'。
‧若長度lj=s+1,開始即添加一個零,以展開表示式向量。在展開之表示式向量中,找出第一個非零元件,並添加單位向量。然而,若表示式向量的零補償表示式向量內之'0'元件,是在表示式向量內第一個非零元件之右側,為此表示式向量進行找出和添加程序,不需展開。
B.4.3實施例1
更新s=1:用二表示式向量[1,0]和[0,1],二者長度為lj=s+1=2。就向量[0,1]言,在第一個非零元件之後,無零元件。所以,獲得新的表示式向量為[0,0,2],[0,1,1],[1,0,1]。另方面,就[1,0]言,在其第一個非零元件之後,無零元件,而在零補償後,留有一零。所以,新表示式向量即展開,並添加單位向量:[0,2,0],[1,1,0],以及添加單位向量不需展開:[2,0]。
B.4.4實施例2
更新s=2,使用表示式向量集合{[0,0,2],[0,1,1],[1,0,1],[0,2,0],[1,1,0],[2,0]}。按照上述說明,得s=3之表示式向量為:[0,0,2] → [0,0,0,3],[0,0,1,2],[0,1,0,2],[1,0,0,2]
[0,1,1] → [0,0,2,1],[0,1,1,1],[1,0,1,1]
[1,0,1] → [0,2,0,1],[1,1,0,1],[2,0,1]
[0,2,0] → [0,0,3,0],[0,1,2,0],[1,0,2,0],[0,3,0],[1,2,0]
[1,1,0] → [0,2,1,0],[1,1,1,0],[2,1,0]
[2,0] → [3,0]
對[0,1,0,2]以[[0,1,1,1]]為其零補償表示式向量,於零補償後,在其第一個非零元件之右側無零,而對[1,0,0,2]以[[1,0,1,1]]為其零補償表示式向量,即使在於零補償後,在其第一個非零元件右側,仍留有一零。因此,對[0,1,0,2]和[1,0,0,2]進行不同的更新程序,得s=4之表示式向量。
在第4圖所示本發明水印解碼器之方塊圖中,於獲取或接收段節步驟或階段41,抽樣所接收聲頻訊號,然後通過預處理步驟或階段42(可進行例如頻譜白化),至相關步驟或階段43,所接收聲頻訊號之現時段節於此,與來自參考形態訊號發生步驟或階段46之至少二個不同候選參考形態訊號is相關,並攸關相對應不同水印符號,在各種情況下,為各候選水印符號is產生N現時相關結果數值c is 。不同候選參考形態訊號is總數為nSymbols,例如nSymbols=2。在隨機相發生步驟或階段45,使用密語關鍵詞發生相對應擬似隨機相訊號,此擬似隨機相訊號控制在步驟/階段46內之參考形態訊號發生。在相關步驟/階段43後得之水印符號檢測步驟或階段44內,於現時N相關結果數值c is M主相關結果峰值周圍核對長度L之窗,並按上述參照第5圖進行處理,以決定和輸出相對應水印符號。
在第5圖之流程圖中,對步驟50所接收輸入相關區塊c is ,把參數is設定於'1'。例如is=1相當於候選水印符號'0',而is=2相當於候選水印符號'1'。對各候選水印符號is,在步驟51按照其幅度分序相對應相關結果數值之集合c is ,以決定M最大量值(即全局峰值量),例如M=3和k=1,2,3。在步驟52,為各全局峰量值k=1,...,M和現時候選水印符號is,決定各全局峰值(即包含各全局峰值)周圍原有相關結果數值±L/2範圍(即在長度L窗)內n p 峰量值之相對應向量。在比較步驟53控制下,參數is在'1'至'nSymbols'的環路內運轉。
因為L遠比N為小,全部長度L窗之合計長度,比長度N 小。實務上,L<<N致使LN小至少一位數,即N/L>10。例如N=16k而L=1k。
然後,鍵入is=1從運轉至nSymbols的外環路,以及從k=1運轉至M的內環路,分別利用比較步驟57和56控制。在內環路,於步驟54從現時相關結果數值計算假正機率FP(),接著是比較步驟55、k增量、比較步驟56,而在外環路是is增量和比較步驟57。假正機率FP()數值相當於無水印聲頻訊號相關結果量數值的平均或期望機率分佈中,含n p 或更多相關結果量值大於或等於n p 峰值的長度L窗一倍或數倍機率。
比較步驟57之後,在步驟58決定最後假正機率fpmin is (min k (FP()))之候選水印符號is。步驟59藉比較fp數值與又一臨限值Tmax,核對是否已檢測到水印符號。若然,即輸出所檢測水印符號。否則,即未檢測到水印符號。
在比較步驟55中,如果FP()比預定臨限值Tmin小,即假設已找到正確候選水印符號is,二個環路均保留,以節省計算時間,並將水印符號輸出。
第6圖顯示之實施例描繪長度N以及k=1,2,3三個長度L窗之相關結果。各長度L窗配置在N相關結果數值的峰值周圍。在N內首先可能長度L窗位置是j=1,而最後可能長度L窗位置是j=N-L+1。
本發明處理可利用單一處理器或電子電路,或若干處理器或電子電路並聯操作和/或在本發明處理之不同組件上進行。
41‧‧‧獲取步驟
42‧‧‧預處理步驟
43‧‧‧全部參考形態相關步驟
44‧‧‧水印符號檢測步驟
45‧‧‧隨機相發生步驟
46‧‧‧參考形態訊號發生步驟

Claims (8)

  1. 一種在所接收含有回聲、混響和/或雜訊的聲頻訊號中水印符號之決定方法,該方法包含步驟為:令所接收聲頻訊號之段節,與關係到相對應不同候選水印符號is的至少二個不同候選參考形態訊號(46)相關化(43),為各候選水印符號is,在各情況下,產生N相關結果數值c is ;為各候選水印符號is,決定(51)該相關結果數值c is 內之M峰值;其中該水印符號決定(44;58,59)之特徵為下列步驟:為註明為全局峰值之各該M峰值,以及各候選水印符號is,從相關結果數值c is ,決定(52)長度L之各M窗內n p 峰值之相對應向量,各長度L窗含該M全局峰值之一,而全部長度L窗之合計長度小於N,其中k=1,...,M;為各該長度LM窗,根據峰值之向量,以及無水印聲頻訊號相關結果數值之平均或期望機率分佈,計算(54)假正機率數值FP(),其中假正機率數值FP()界定為,在無水印聲頻訊號內容相關數值之平均或期望機率分佈中,使該長度L窗含有n p 或更多相關結果絕對值大於或等於n p 峰值一倍或多倍之機率;為該接收聲頻訊號之段節,選擇(58)候選水印符號is,做為所檢測水印符號,具有最低假正機率數值min is (min k (FP())),該最低假正機率數值min is (min k (FP()))小於預定臨限值(Tmax),否則即假設未檢測到水印訊號者。
  2. 如申請專利範圍第1項之方法,其中若在該假正機率FP()數值之該項計算(54)中,數值比又一預定臨限值(Tmin)小,即假定(55)已找到正確候選水印符號is,並省略進一步處理,又其中該預定臨限值(Tmax)大於該又一預定臨限值(Tmin)者。
  3. 如申請專利範圍第1或2項之方法,其中M=3者。
  4. 如申請專利範圍第1至3項之一項方法,其中具有二個不同候選水印符號者。
  5. 一種在所接收含有回聲、混響和/或雜訊的聲頻訊號中水印符號之決定裝置,該裝置包含: 機構(45),適於使接收聲頻訊號之段節,與攸關相對應不同候選水印符號is之至少二不同候選參考形態訊號(46)相關,以便在各情況下,為各候選水印符號is產生N現時相關結果數值c is ;機構(44,51,52,54,58,59),係適於為各候選水印符號is,決定該相關結果數值c is 內之M峰值,並由各候選水印符號is之該M相關結果峰值,為該接收聲頻訊號之該段節推衍,從該候選水印符號is決定水印符號;其中為註明為全局峰值的各該M峰值,和各候選水印符號is,從相關結果數值c is ,決定(52)長度L之各M窗內n p 峰值相對應向量,各長度L窗包含該M全局峰值之一,而全部長度L窗之合計長度小於N,其中k=1,...,M;且其中,為長度L的該M窗之各一,根據峰值之向量,以及無水印聲頻訊號相關結果數值之平均或期望機率分佈,計算(54)假正機率數值FP(),其中假正機率數值FP()界定為,使長度L窗含n p 或以上相關結果數值,在無水印聲頻訊號相對應結果數值之平均或期望機率分佈中,大於或等於n p 峰值一倍或數倍之機率;又其中為該接收聲頻訊號之段節,選擇(58)候選水印符號is,做為檢測水印符號,具有最低假正機率數值min is (min k (FP())),該最低假正機率數值min is (min k (FP()))係小於預定臨限值(Tmax),否則即假設未檢測到水印訊號者。
  6. 如申請專利範圍第5項之裝置,其中若在該假正機率FP()數值之該項計算(54)中,數值比又一預定臨限值(Tmin)小,即假定(55)已找到正確候選水印符號is,並省略進一步處理,又其中該預定臨限值(Tmax)大於該又一預定臨限值(Tmin)者。
  7. 如申請專利範圍第5或6項之裝置,其中M=3者。
  8. 如申請專利範圍第5至7項之一項裝置,其中具有二個不同候選水印符號者。
TW103111573A 2013-04-02 2014-03-28 所接收含有回聲、混響和/或雜訊的聲頻訊號中水印符號之決定方法和裝置 TW201501118A (zh)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
EP13305425.4A EP2787504A1 (en) 2013-04-02 2013-04-02 Method and Apparatus for determining watermark symbols in a received audio signal that can contain echoes, reverberation and/or noise

Publications (1)

Publication Number Publication Date
TW201501118A true TW201501118A (zh) 2015-01-01

Family

ID=48141876

Family Applications (1)

Application Number Title Priority Date Filing Date
TW103111573A TW201501118A (zh) 2013-04-02 2014-03-28 所接收含有回聲、混響和/或雜訊的聲頻訊號中水印符號之決定方法和裝置

Country Status (8)

Country Link
US (1) US9607623B2 (zh)
EP (2) EP2787504A1 (zh)
JP (1) JP2016515721A (zh)
KR (1) KR20150136491A (zh)
CN (1) CN105103223A (zh)
CA (1) CA2902840A1 (zh)
TW (1) TW201501118A (zh)
WO (1) WO2014161785A1 (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102403194B1 (ko) * 2015-06-26 2022-05-27 삼성디스플레이 주식회사 표시 장치
CN106601261A (zh) * 2015-10-15 2017-04-26 中国电信股份有限公司 基于数字水印的回声抑制方法和系统
US10236031B1 (en) * 2016-04-05 2019-03-19 Digimarc Corporation Timeline reconstruction using dynamic path estimation from detections in audio-video signals
JP7013093B2 (ja) * 2018-05-01 2022-01-31 アルパイン株式会社 故障検出装置、移動体搭載装置、故障検出方法
US11170793B2 (en) * 2020-02-13 2021-11-09 Adobe Inc. Secure audio watermarking based on neural networks

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3946268B2 (ja) * 1997-09-02 2007-07-18 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ ウォーターマークを検出するための方法及び装置
GB0403331D0 (en) * 2004-02-14 2004-03-17 Koninkl Philips Electronics Nv Watermark detection
EP1837875A1 (en) * 2006-03-22 2007-09-26 Deutsche Thomson-Brandt Gmbh Method and apparatus for correlating two data sections
US8315835B2 (en) * 2007-06-14 2012-11-20 Thomson Licensing Method and apparatus for setting a detection threshold given a desired false probability
EP2081187A1 (en) * 2008-01-21 2009-07-22 Deutsche Thomson OHG Method and apparatus for determining whether or not a reference pattern is present in a received and possibly water-marked signal
EP2175443A1 (en) * 2008-10-10 2010-04-14 Thomson Licensing Method and apparatus for for regaining watermark data that were embedded in an original signal by modifying sections of said original signal in relation to at least two different reference data sequences
EP2387033A1 (en) 2010-05-11 2011-11-16 Thomson Licensing Method and apparatus for detecting which one of symbols of watermark data is embedded in a received signal

Also Published As

Publication number Publication date
EP2787504A1 (en) 2014-10-08
JP2016515721A (ja) 2016-05-30
WO2014161785A1 (en) 2014-10-09
CN105103223A (zh) 2015-11-25
US20160049154A1 (en) 2016-02-18
US9607623B2 (en) 2017-03-28
CA2902840A1 (en) 2014-10-09
EP2981957A1 (en) 2016-02-10
KR20150136491A (ko) 2015-12-07

Similar Documents

Publication Publication Date Title
TW201501118A (zh) 所接收含有回聲、混響和/或雜訊的聲頻訊號中水印符號之決定方法和裝置
RU2016105519A (ru) Способ для обработки аудиосигнала в соответствии с импульсной характеристикой помещения, блок обработки сигналов, аудиокодер, аудиодекодер и устройство бинаурального рендеринга
CN111785288B (zh) 语音增强方法、装置、设备及存储介质
JP4263623B2 (ja) モノビットラン頻度オンラインランダム性テスト
CN111914516B (zh) 一种网络数据预测序列生成方法、装置、设备及存储介质
JP5232668B2 (ja) 受信され、電子透かしがおそらく埋め込まれた信号にリファレンスパターンが存在するか否かを判定する方法及び装置
CN107393549A (zh) 时延估计方法及装置
CN112530450A (zh) 频域中的样本精度延迟识别
JP5994639B2 (ja) 有音区間検出装置、有音区間検出方法、及び有音区間検出プログラム
WO2015165233A1 (zh) 音频编码方法及相关装置
JP2007298607A (ja) 音響信号分析装置、音響信号分析方法、及び音響信号分析用プログラム
CA2304749C (en) Signal processing
JP6501999B2 (ja) パケットフォーマット推定装置およびパケットフォーマット推定プログラム
TWI390862B (zh) 虛擬雜訊碼追蹤電路與虛擬雜訊碼追蹤方法
JP5508922B2 (ja) フレーム同期のためのシステム及び方法
JP2015200685A (ja) アタック位置検出プログラムおよびアタック位置検出装置
JP2013239949A (ja) 映像解析処理装置、映像解析処理方法、および映像解析処理用プログラム
WO2021062705A1 (zh) 一种单声道鲁棒性的语音关键词实时检测方法
JP6575365B2 (ja) 音源検出装置、音源検出方法、及びプログラム
CN113436641B (zh) 一种音乐转场时间点检测方法、设备及介质
Candy Broadband processing in a noisy shallow ocean environment: a particle filtering approach
JPWO2018117171A1 (ja) 生体音解析方法、プログラム、記憶媒体及び生体音解析装置
CN112200170B (zh) 图像识别方法、装置、电子设备和计算机可读介质
JP2007043559A (ja) 符号化方式判定装置
Jonker et al. Time-frequency or time-scale representation fission and fusion rules