KR20110014871A - Apparatus and method for embedding audio watermark, and apparatus and method for detecting audio watermark - Google Patents
Apparatus and method for embedding audio watermark, and apparatus and method for detecting audio watermark Download PDFInfo
- Publication number
- KR20110014871A KR20110014871A KR1020090072453A KR20090072453A KR20110014871A KR 20110014871 A KR20110014871 A KR 20110014871A KR 1020090072453 A KR1020090072453 A KR 1020090072453A KR 20090072453 A KR20090072453 A KR 20090072453A KR 20110014871 A KR20110014871 A KR 20110014871A
- Authority
- KR
- South Korea
- Prior art keywords
- watermark
- coefficients
- peak
- fft
- subset
- Prior art date
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/018—Audio watermarking, i.e. embedding inaudible data in the audio signal
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
- G06F17/14—Fourier, Walsh or analogous domain transformations, e.g. Laplace, Hilbert, Karhunen-Loeve, transforms
- G06F17/141—Discrete Fourier transforms
- G06F17/142—Fast Fourier transforms, e.g. using a Cooley-Tukey type algorithm
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0212—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
- G10L19/0216—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation using wavelet decomposition
Abstract
Description
본 발명은 오디오 워터마크 삽입장치 및 방법, 그리고, 오디오 워터마크 검출장치 및 방법에 관한 것으로, 더욱 상세하게는 주요 주파수 피크에 워터마크를 삽입하는 오디오 워터마크 삽입장치 및 방법, 그리고, 오디오 워터마크 검출장치 및 방법에 관한 것이다.The present invention relates to an audio watermark embedding apparatus and method, and an audio watermark detecting apparatus and method, and more particularly, to an audio watermark embedding apparatus and method for embedding a watermark at a main frequency peak, and an audio watermark. A detection apparatus and method are provided.
오디오 워터마킹(robust watermarking) 기술은 원 오디오 신호의 저작권을 보호하기 위한 기법 중 하나로서, 저작물에 저작권정보, 즉, 워터마크를 삽입하며, 삽입된 워터마크는 저작물의 다양한 변형에 의해서도 사라지지 않으므로 소유권을 주장할 수 있는 증거물로 사용된다. 오디오 워터마킹은 압축, 샘플링 등의 신호 처리에 강인해야 하며, 동시에 인간의 청각에 들리지 않도록 오디오 품질을 유지해야 한다.Robust watermarking technology is one of the techniques for protecting the copyright of the original audio signal, and inserts copyright information, that is, a watermark into the work, and the inserted watermark does not disappear even by various modifications of the work. Used as evidence for claiming ownership. Audio watermarking must be robust to signal processing such as compression and sampling, while at the same time maintaining audio quality so that it is inaudible to human hearing.
그러나, 종래의 워터마킹 기술은 신호처리시 충분한 강인성(robustness)을 보여주지 못한다. 이는, 워터마크를 삽입할 최상의 변환 영역(transform domain) 계수를 선택하는데 어려움이 따르기 때문이다. 따라서, 신호 처리에 강인하며 워터마크의 삽입 및 검출이 용이한 방식이 필요하다.However, conventional watermarking techniques do not show sufficient robustness in signal processing. This is because it is difficult to select the best transform domain coefficient to insert the watermark. Therefore, there is a need for a method that is robust to signal processing and that is easy to insert and detect a watermark.
따라서, 본 발명의 목적은 디지털 오디오신호에 워터마크를 삽입 후에도 오디오 신호의 음질을 유지하면서 신호처리에 강인하며, 디지털 오디오신호에 삽입된 워터마크를 손쉽게 검출할 수 있는 오디오 워터마크 삽입장치 및 그 방법, 그리고, 워터마크 검출장치 및 그 방법을 제공하고자 하는 데 있다.Accordingly, an object of the present invention is an audio watermark embedding apparatus, which is robust to signal processing while maintaining the sound quality of an audio signal even after embedding a watermark in a digital audio signal, and which can easily detect a watermark embedded in the digital audio signal, and the same. A method, and a watermark detection apparatus and method thereof are provided.
상기 목적을 달성하기 위한 본 발명에 따른 오디오 워터마크 삽입장치는, 원오디오 신호에 DWT(Discrete Wavelet Transform)를 적용하여 분리되는 다수의 주파수 대역 중 특정 주파수 대역을 선택하는 대역 선택부; 상기 선택된 특정 주파수 대역의 웨이블렛 계수들을 다수의 서브세트로 분리하고, 상기 각 서브세트의 피크에 대응하는 웨이블렛 계수인 피크 계수를 선택하는 피크 계수 선택부; 상기 서브세트 별로 선택되는 피크 계수에 워터마크를 삽입하는 워터마크 삽입부; 및 상기 워터마크가 삽입된 피크 계수와 상기 대역 선택부에서 선택되지 않은 주파수 대역들에 IDWT(Inverse Discrete Wavelet Transform)를 적용하여 워터마크가 삽입된 오디오 신호를 복원하는 재구성부;를 포함한다. An audio watermark embedding apparatus according to the present invention for achieving the above object comprises: a band selector for selecting a specific frequency band from a plurality of frequency bands separated by applying a DWT (Discrete Wavelet Transform) to the original audio signal; A peak coefficient selector for separating the wavelet coefficients of the selected specific frequency band into a plurality of subsets and selecting a peak coefficient that is a wavelet coefficient corresponding to the peak of each subset; A watermark embedding unit for embedding a watermark in the peak coefficients selected for each subset; And a reconstruction unit reconstructing the watermark-embedded audio signal by applying an IDWT (Inverse Discrete Wavelet Transform) to the peak coefficient having the watermark embedded therein and frequency bands not selected by the band selection unit.
상기 원오디오 신호의 스펙트럼 중 최대 에너지를 포함하는 주요 주파수 대역을 추정하는 대역 추정부;를 더 포함하며, 상기 대역 선택부는 상기 다수의 주파수 대역 중 상기 추정된 주요 주파수 대역을 포함하는 대역을 상기 특정 주파수 대역으로 선택한다.And a band estimator for estimating a major frequency band including a maximum energy of the spectrum of the original audio signal, wherein the band selector is configured to identify a band including the estimated major frequency band among the plurality of frequency bands. Select the frequency band.
상기 대역 추정부는 Wigner Distribution 방식과 STFT(Short-time Fourier transform) 방식을 이용하여 상기 스펙트럼을 산출한다.The band estimator calculates the spectrum using a Wigner Distribution method and a Short-time Fourier transform (STFT) method.
대역 선택부는 상기 원오디오 신호에 DWT를 적용하여 상기 다수의 주파수 대역으로 분리하는 DWT부; 상기 다수의 주파수 대역 중 상기 특정 주파수 대역을 선택하는 선택부; 및 상기 선택된 특정 주파수 대역의 웨이블렛 계수들에 IDWT를 적용하여 재구성된 웨이블렛 계수들을 생성하는 IDWT부;를 포함한다.The band selector includes: a DWT unit for separating the plurality of frequency bands by applying DWT to the original audio signal; A selection unit for selecting the specific frequency band from the plurality of frequency bands; And an IDWT unit for generating reconstructed wavelet coefficients by applying IDWT to the wavelet coefficients of the selected specific frequency band.
상기 피크 계수 선택부는, 상기 재구성된 웨이블렛 계수들에 FFT(Fast Fourier transform)를 적용하여 FFT 계수들을 생성하는 FFT부; 및 상기 획득된 FFT 계수들을 각각 n개의 계수를 포함하는 상기 다수의 서브세트로 분리하고, 상기 각 서브세트 별로 피크를 확인한 후, 상기 확인된 각 피크에 대응하는 피크 계수들을 선택하는 선택부;를 포함한다.The peak coefficient selector may include: an FFT unit configured to generate FFT coefficients by applying a fast fourier transform (FFT) to the reconstructed wavelet coefficients; And a selector for separating the obtained FFT coefficients into the plurality of subsets each including n coefficients, identifying peaks for each subset, and then selecting peak coefficients corresponding to the identified peaks. Include.
상기 재구성부는, 상기 워터마크가 삽입된 피크 계수들과 상기 워터마크가 삽입되지 않은 웨이블렛 계수들을 결합한 후 IFFT(Inverse Fast Fourier transform)를 적용하여 상기 각 서브세트를 복원하는 IFFT부; 상기 복원된 각 서브세트에 상기 DWT를 적용하여 새로운 웨이블렛 계수를 생성하는 DWT부; 및 상기 다수의 주파수 대역에서 선택되지 않은 주파수 대역들의 웨이블렛 계수들과 상기 새로운 웨이블렛 계수들에 상기 IDWT를 적용하여 워터마크가 삽입된 오디오 신호를 출력하는 IDWT부;를 포함한다.The reconstruction unit may include: an IFFT unit reconstructing each subset by applying an inverse fast fourier transform (IFFT) after combining the watermarked peak coefficients and the watermarked wavelet coefficients; A DWT unit generating a new wavelet coefficient by applying the DWT to each of the restored subsets; And an IDWT unit for outputting a watermark-embedded audio signal by applying the IDWT to wavelet coefficients of the frequency bands not selected in the plurality of frequency bands and the new wavelet coefficients.
상기 목적을 달성하기 위한 본 발명에 따른 오디오 워터마크 삽입방법은, 원오디오 신호에 DWT(Discrete Wavelet Transform)를 적용하여 분리되는 다수의 주파수 대역 중 특정 주파수 대역을 선택하는 단계; 상기 선택된 특정 주파수 대역의 웨이블렛 계수들을 다수의 서브세트로 분리하고, 상기 각 서브세트의 각 피크에 대 응하는 웨이블렛 계수인 피크 계수를 선택하는 단계; 상기 서브세트 별로 선택되는 피크 계수에 워터마크를 삽입하는 단계; 및 상기 워터마크가 삽입된 피크 계수와 상기 대역 선택부에서 선택되지 않은 주파수 대역들에 IDWT(Inverse Discrete Wavelet Transform)를 적용하여 워터마크가 삽입된 오디오 신호를 출력하는 단계;를 포함한다.An audio watermark embedding method according to the present invention for achieving the above object comprises the steps of selecting a specific frequency band from a plurality of frequency bands separated by applying a DWT (Discrete Wavelet Transform) to the original audio signal; Separating the wavelet coefficients of the selected specific frequency band into a plurality of subsets, and selecting peak coefficients that are wavelet coefficients corresponding to each peak of each subset; Inserting a watermark into the peak coefficients selected for each subset; And outputting a watermark-embedded audio signal by applying an IDWT (Inverse Discrete Wavelet Transform) to the watermark-embedded peak coefficients and frequency bands not selected by the band selector.
상기 원오디오 신호의 스펙트럼 중 최대 에너지를 포함하는 주요 주파수 대역을 추정하는 단계;를 더 포함하며, 상기 대역을 선택하는 단계는, 상기 분리되는 다수의 주파수 대역 중 상기 추정된 주요 주파수 대역을 포함하는 대역을 상기 특정 주파수 대역으로 선택한다.Estimating a major frequency band including a maximum energy of the spectrum of the original audio signal; wherein selecting the band includes the estimated major frequency band of the plurality of separated frequency bands; A band is selected as the specific frequency band.
상기 추정하는 단계는. Wigner Distribution 방식과 STFT(Short-time Fourier transform) 방식을 이용하여 상기 스펙트럼을 산출한다.The estimating step. The spectrum is calculated using the Wigner Distribution method and the Short-time Fourier transform (STFT) method.
상기 특정 주파수 대역을 선택하는 단계는, 상기 원오디오 신호에 DWT를 적용하여 상기 다수의 주파수 대역으로 분리하는 단계; 상기 다수의 주파수 대역 중 상기 특정 주파수 대역을 선택하는 단계; 및 상기 선택된 특정 주파수 대역의 웨이블렛 계수들에 IDWT를 적용하여 재구성된 웨이블렛 계수들을 생성하는 단계;를 포함한다.The selecting of the specific frequency band may include separating the plurality of frequency bands by applying DWT to the original audio signal; Selecting the specific frequency band from the plurality of frequency bands; And generating reconstructed wavelet coefficients by applying IDWT to the wavelet coefficients of the selected specific frequency band.
상기 피크 계수를 선택하는 단계는, 상기 재구성된 웨이블렛 계수들에 FFT(Fast Fourier transform)를 적용하여 FFT 계수들을 생성하는 단계; 및 상기 획득된 FFT 계수를 각각 n개의 계수를 포함하는 상기 다수의 서브세트로 분리하고, 상기 각 서브세트 별로 피크를 확인한 후, 상기 확인된 각 피크에 대응하는 피크 계수들을 선택하는 단계;를 포함한다.The selecting of the peak coefficients may include: generating FFT coefficients by applying a fast fourier transform (FFT) to the reconstructed wavelet coefficients; And dividing the obtained FFT coefficients into the plurality of subsets each including n coefficients, identifying peaks for each subset, and then selecting peak coefficients corresponding to the identified peaks. do.
상기 출력하는 단계는, 상기 워터마크가 삽입된 피크 계수들과 상기 워터마크가 삽입되지 않은 웨이블렛 계수들을 결합한 후 IFFT(Inverse Fast Fourier transform)를 적용하여 상기 각 서브세트를 복원하는 단계; 상기 복원된 각 서브세트에 상기 DWT를 적용하여 새로운 웨이블렛 계수를 생성하는 단계; 및 상기 다수의 주파수 대역에서 선택되지 않은 주파수 대역들의 웨이블렛 계수들과 상기 새로운 상기 새로운 웨이블렛 계수들에 상기 IDWT(Inverse Discrete Wavelet Transform)를 적용하여 워터마크가 삽입된 오디오 신호를 출력하는 단계;를 포함한다.The outputting may include: reconstructing each subset by applying an inverse fast fourier transform (IFFT) after combining the watermarked peak coefficients and the watermarked wavelet coefficients; Generating a new wavelet coefficient by applying the DWT to each reconstructed subset; And applying the IDWT (Inverse Discrete Wavelet Transform) to the wavelet coefficients of the frequency bands not selected in the plurality of frequency bands and the new wavelet coefficients to output a watermarked audio signal. do.
상기 목적을 달성하기 위한 본 발명에 따른 오디오 워터마크 검출장치는, 원오디오 신호와 워터마크된 오디오 신호 각각에 DWT(Discrete Wavelet Transform)를 적용하여 분리되는 다수의 주파수 대역으로부터 제1특정 주파수 대역과 제2특정 주파수 대역을 각각 선택하는 대역 선택부; 상기 선택된 제1 및 제2특정 주파수 대역에 대해 FFT(Fast Fourier transform)를 적용하여 제1 및 제2FFT 계수를 획득하는 FFT부; 상기 제1FFT 계수를 다수의 제1서브세트로 분리하고, 상기 각 제1서브세트의 피크에 대응하는 제1FFT 피크 계수를 선택하며, 상기 제2FFT 계수를 다수의 제2서브세트로 분리하고, 상기 각 제2서브 세트의 피크에 대응하는 제2FFT 피크 계수를 선택하는 피크 계수 선택부; 및 상기 선택되는 제1 및 제2FFT 피크 계수를 비교하여 상기 워터마크를 검출하는 워터마크 검출부;를 포함한다.In accordance with another aspect of the present invention, an audio watermark detection apparatus includes a first specific frequency band from a plurality of frequency bands separated by applying a discrete wavelet transform (DWT) to each of an original audio signal and a watermarked audio signal. A band selector which selects a second specific frequency band respectively; An FFT unit configured to obtain first and second FFT coefficients by applying a fast fourier transform (FFT) to the selected first and second specific frequency bands; Separating the first FFT coefficients into a plurality of first subsets, selecting a first FFT peak coefficient corresponding to the peak of each first subset, separating the second FFT coefficients into a plurality of second subsets, and A peak coefficient selector selecting a second FFT peak coefficient corresponding to the peak of each second sub set; And a watermark detector configured to detect the watermark by comparing the selected first and second FFT peak coefficients.
상기 워터마크 검출부는 다음 조건에 의해 상기 워터마크를 검출한다.The watermark detection unit detects the watermark under the following conditions.
Wij'=1, if Cij'-Cij≥0, 그리고,W ij '= 1, if C ij ' -C ij ≥ 0, and
Wij'=0, if Cij'-Cij<0W ij '= 0, if C ij ' -C ij <0
(i=1, 2, …, I, 그리고, j=1, 2, …, J)(i = 1, 2,…, I, and j = 1, 2,…, J)
여기서, Wij'는 워터마크, Cij는 상기 각 제1서브세트 중 i번째 서브세트에서 선택된 제1FFT 피크 계수, Cij'는 상기 각 제2서브세트 중 i번째 서브세트에서 선택된 제2FFT 피크 계수, j는 i번째 서브세트에서 각 제1 및 제2FFT 피그 계수의 위치이다.Where W ij 'is the watermark, C ij is the first FFT peak coefficient selected from the i th subset of the first subset, and C ij ' is the second FFT peak selected from the i th subset of the second subset. The coefficient, j, is the location of each of the first and second FFT pig coefficients in the i th subset.
상기 목적을 달성하기 위한 본 발명에 따른 오디오 워터마크 검출방법은, 원오디오 신호와 워터마크된 오디오 신호 각각에 DWT(Discrete Wavelet Transform)를 적용하여 분리되는 다수의 주파수 대역으로부터 제1특정 주파수 대역과 제2특정 주파수 대역을 각각 선택하는 단계; 상기 선택된 제1 및 제2특정 주파수 대역에 대해 FFT(Fast Fourier transform)를 적용하여 제1 및 제2FFT 계수를 획득하는 단계; 상기 제1FFT 계수를 다수의 제1서브세트로 분리하고, 상기 각 제1서브세트의 피크에 대응하는 제1FFT 피크 계수를 선택하며, 상기 제2FFT 계수를 다수의 제2서브세트로 분리하고, 상기 각 제2서브 세트의 피크에 대응하는 제2FFT 피크 계수를 선택하는 단계;및 상기 선택되는 제1 및 제2FFT 피크 계수를 비교하여 상기 워터마크를 검출하는 단계;를 포함한다.The audio watermark detection method according to the present invention for achieving the above object comprises a first specific frequency band from a plurality of frequency bands separated by applying a DWT (Discrete Wavelet Transform) to each of the original audio signal and the watermarked audio signal; Selecting a second specific frequency band, respectively; Obtaining first and second FFT coefficients by applying a fast fourier transform (FFT) to the selected first and second specific frequency bands; Separating the first FFT coefficients into a plurality of first subsets, selecting a first FFT peak coefficient corresponding to the peak of each first subset, separating the second FFT coefficients into a plurality of second subsets, and Selecting a second FFT peak coefficient corresponding to the peak of each second sub set; and comparing the selected first and second FFT peak coefficients to detect the watermark.
이하 첨부된 도면들을 참조하여 본 발명의 일 실시예를 보다 상세하게 설명 한다. 다만, 본 발명을 설명함에 있어서, 관련된 공지 기능 혹은 구성에 대한 구체적인 설명이 본 발명의 요지를 불필요하게 흐릴 수 있다고 판단되는 경우 그에 대한 상세한 설명은 생략한다.Hereinafter, an embodiment of the present invention will be described in detail with reference to the accompanying drawings. However, in describing the present invention, when it is determined that a detailed description of a related known function or configuration may unnecessarily obscure the subject matter of the present invention, a detailed description thereof will be omitted.
도 1은 본 발명의 실시예에 따른 오디오 워터마크 삽입장치를 도시한 블록도이다.1 is a block diagram showing an audio watermark embedding apparatus according to an embodiment of the present invention.
도 1을 참조하면, 오디오 워터마크 삽입장치(100)는 대역 추정부(110), 대역 선택부(120), 피크 계수 선택부(130), 워터마크 삽입부(140) 및 재구성부(150)를 포함한다. Referring to FIG. 1, the audio
대역 추정부(110)는 원오디오 신호(S)의 스펙트럼 중 최대 에너지를 포함하는 주요 주파수 대역(the important frequency band, A)을 추정한다. The
대역 추정부(110)는 Wigner Distribution 방식과 STFT(Short-time Fourier transform) 방식을 이용하여 생성된 Advanced Wigner Distribution 방식을 이용하여 원오디오 신호(S)의 스펙트럼을 산출한다.The
먼저, 오디오 신호의 스펙트럼을 제공하는 방식은 다양하며 일 예로 FFT(Fast Fourier transform) 방식, STFT(Short-time Fourier transform) 방식, Wigner Distribution 방식, Wavelet 방식을 들 수 있다. FFT 방식과 STFT 방식은 정확한 스펙트럼을 제공하나 다른 방식에 비해 거칠므로(rough), 신호가 스무스할 때 선택하는 것이 어렵다. Wigner Distribution 방식은 스무스한 스펙트럼을 제공하나, cross-term appearance가 스펙트럼을 부정확하게 한다. 따라서, 최상의 결과를 획득하기 위하여, 본 발명에서는 Wigner Distribution 방식과 STFT 방식의 장 점을 이용하며, 이로써 새로운 Advanced Wigner Distribution 방식을 제안한다.First, a method of providing a spectrum of an audio signal is various, and examples thereof include a fast fourier transform (FFT) method, a short-time fourier transform (STFT) method, a Wigner distribution method, and a wavelet method. The FFT and STFT methods provide accurate spectra but are rougher than others, making it difficult to select when the signal is smooth. The Wigner Distribution method provides a smooth spectrum, but the cross-term appearance makes the spectrum inaccurate. Therefore, in order to obtain the best results, the present invention uses the advantages of the Wigner Distribution method and the STFT method, thereby suggesting a new Advanced Wigner Distribution method.
Advanced Wigner Distribution 방식은 다음 과정에 의해 산출된다.The Advanced Wigner Distribution method is calculated by the following process.
먼저, STFT는 다음과 같이 정의된다. First, STFT is defined as follows.
[수학식 1]에 의한 스펙트로그램은 상기 STFT 트랜스폼의 절대값으로 정의되며, [수학식 2]로 표현한다.The spectrogram according to [Equation 1] is defined as the absolute value of the STFT transform and is expressed by [Equation 2].
[수학식 1] 및 [수학식 2]에서 FSP는 STFT 함수, h(t)는 윈도우, s(t)는 아날로그 신호, STFT(t,w)는 FSP의 스펙트로그램이다. 본 발명의 실시예에서는 각 주파수(angular frequency)인 w를 사용하며, j는 -1의 제곱근인 과 동일한 허수 단위이다. In
Wigner distribution 함수는 시간 도메인과 주파수 도메인에서 [수학식 3]과 같이 표현될 수 있다.The Wigner distribution function may be expressed in
여기서, s(t)와 S(w)는 각각 시간 및 주파수 도메인에서의 신호이며, S*(w)는 S(w)의 complex conjugate이다.Where s (t) and S (w) are signals in the time and frequency domain, respectively, and S * (w) is a complex conjugate of S (w).
PWD(Pseudo-Wigner Distribution)은 시간 도메인에서 다음과 같이 설명된다.Pseudo-Wigner Distribution (PWD) is described in the time domain as follows.
상술한 STFT, PWD 및 a narrow window P(Θ)를 사용한 Advanced wigner distribution은 다음과 같이 정의된다. Advanced wigner distribution using the above-described STFT, PWD and a narrow window P (Θ) is defined as follows.
스펙트로그램의 이산형태(discrete form)는 다음 [수학식 6]과 같다.The discrete form of the spectrogram is shown in
여기서, s(n)은 이산 신호, h(i)는 윈도우 h(t)의 이산 형태, N은 신호 s(n)에 있는 Fourier Transform Windows의 개수이다. Where s (n) is a discrete signal, h (i) is a discrete form of window h (t), and N is the number of Fourier Transform windows in signal s (n).
Discrete advanced Wigner method의 산출은 [수학식 7]과 같다The calculation of the Discrete advanced Wigner method is shown in [Equation 7].
p(i)가 직사각형 윈도우라고 가정하는 경우, ADWD(n,k)는 [수학식 8]과 같이 정의된다.Assuming p (i) is a rectangular window, ADWD (n, k) is defined as in Equation (8).
여기서, 2L+1은 discrete 윈도우 p(i)의 길이(length)이다. 상기 수학식에서, p(i)가 이산 델타 함수(discrete delta function)이면, ADWD(n, k)는 STFT로 감소하며, p(i)가 all values of 1(for all i)를 가지면, ADWD(n,k)는 Wigner distribution spectrum이 될 것이다. 도 2를 참조하면, p(i)는 직사각형 윈도우이 고, 2Q+1은 상기 윈도우의 폭(width)이다.2L + 1 is the length of the discrete window p (i). In the above equation, if p (i) is a discrete delta function, ADWD (n, k) decreases to STFT, and if p (i) has all values of 1 (for all i), ADWD ( n, k) will be the Wigner distribution spectrum. 2, p (i) is a rectangular window, and 2Q + 1 is the width of the window.
Standard Wigner distribution에서, cross term은 두 개의 주파수 성분들 중 크로스 산출(computation)의 결과를 나타낸다. Cross term은 실제이며, 사용하지 않는 값이며, 이는 분석의 결과를 심사하기 어렵게 한다. 그러나, 윈도우의 크기를 조정하는 것에 의해, cross term은 완전히 제거될 수 있다.In the Standard Wigner distribution, the cross term represents the result of cross computation of two frequency components. Cross terms are real and unused values that make it difficult to examine the results of the analysis. However, by adjusting the size of the window, the cross term can be completely eliminated.
실험에서, 1초당 44,100 샘플의 샘플링 주파수를 가지는 음악 파일의 신호에 FFT, STFT, Wigner distribution 및 Advanced Wigner distribution을 적용하였다. 도 3a 내지 도 3d는 상기 4가지 방식들의 스펙트럼 결과를 보여준다. 도 3a 내지 도 3d에서, magnitude는 스펙트럼 에너지의 크기, frequency는 주파수, time은 시간을 나타낸다. Advanced Wigner Distribution 방식은 다른 방식에 비해 보다 스무스하고 더 가시적인 스펙트럼(visible spectrum)을 보여준다.In the experiment, the FFT, STFT, Wigner distribution, and Advanced Wigner distribution were applied to a signal of a music file having a sampling frequency of 44,100 samples per second. 3A-3D show the spectral results of the four schemes. 3A to 3D, magnitude represents the magnitude of spectral energy, frequency represents frequency, and time represents time. Advanced Wigner Distribution shows a smoother and more visible spectrum than other methods.
원오디오 신호(S)의 스펙트럼 결과가 도 3d와 같은 경우, 대역 추정부(110)는 가장 큰 에너지를 포함하는 밴드를 주요 주파수 대역(A)으로 추정한다. 여기서, 주요 주파수 대역(A)은 가장 큰 에너지만을 포함하거나, 또는, 가장 큰 에너지가 속하는 대역일 수 있다. 가장 큰 에너지를 포함하는 주요 주파수 대역(A)은 설계시 엔지니어에 의해 조정될 수 있다.When the spectral result of the original audio signal S is as shown in FIG. 3D, the
대역 선택부(120)는 원오디오 신호(S)를 레벨 L에서 분리하기 위하여, 원오디오 신호(S)에 DWT(Discrete Wavelet Transform)를 적용하여 원오디오 신호(S)를 다수의 주파수 대역으로 분리하며, 분리되는 다수의 주파수 대역 중 특정 주파수 대역(the most significant frequency band)을 선택한다. 특히, 대역 선택부(120) 는 분리되는 다수의 주파수 대역 중 대역 추정부(110)에서 추정된 주요 주파수 대역(A)을 포함(cover)하는 대역을 특정 주파수 대역(A')으로 선택한다. 이를 위하여 대역 선택부(120)는 도 4에 도시된 바와 같이 DWT부(121), 선택부(122) 및 IDWT부(123)를 포함한다.The
DWT부(121)는 원오디오 신호(S)에 DWT를 적용하여 도 5에 도시된 바와 같이 원오디오 신호(S)를 멀티플 주파수 대역으로, 즉, 고주파 대역과 저주파 대역으로 분리한다. 도 5의 경우, 원오디오 신호(S)는 6개의 주파수 대역으로 분리되었다.The
선택부(122)는 분리된 다수의 주파수 대역 중 특정 주파수 대역(A')을 선택한다. 특정 주파수 대역(A')은 분리된 다수의 주파수 대역 중 대역 추정부(110)에서 추정된 주요 주파수 대역(A)을 커버, 즉, 포함하는 대역을 의미한다.The
IDWT부(123)는 선택된 특정 주파수 대역(A')의 웨이블렛 계수들, 즉, DWT 계수들에 IDWT(Inverse Discrete Wavelet Transform)를 적용하며, 그 결과 DWT 계수들로부터 재구성된 웨이블렛 계수들(B)을 생성한다. The
다시 도 1을 참조하면, 피크 계수 선택부(130)는 대역 선택부(120)에서 선택된 특정 주파수 대역(A')의 웨이블렛 계수들(B)을 다수의 서브세트(Ci)로 분리하고, 각 서브세트(Ci)의 피크에 대응하는 웨이블렛 계수를 선택한다. 이하에서는 각 서브세트(Ci)의 피크(즉, the important frequency peak)에 대응하는 웨이블렛 계수를 피크 계수라 한다.Referring back to FIG. 1, the
이를 위하여, 피크 계수 선택부(130)는 도 6에 도시된 바와 같이 FFT부(131) 및 선택부(132)를 포함한다. FFT부(131)는 IDWT부(123)에서 재구성된 웨이블렛 계수들(B)에 FFT(Fast Fourier transform)를 적용하여 FFT 계수들을 생성한다. 이하에서는 FFT 계수들을 FFT 계수 세트(C)라 한다.To this end, the
선택부(132)는 획득된 FFT 계수 세트(C)를 각각 n개의 계수(샘플)를 포함하는 다수의 서브세트(Ci)로 분리하고, 각 서브세트(Ci) 별로 피크(the important frequency peak)를 확인한 후, 확인된 각 피크에 대응하는 피크 계수들(Cij)을 선택한다.The
예를 들어, 선택부(132)는 FFT 계수 세트(C)를 200-sample 서브세트로 분리하며, 이로써 I개의 서브세트를 획득한다. Ci(i=1, 2, …, I)는 총 I개의 서브세트 중 i번째의 서브세트에 있는 계수들 세트로 가정할 수 있다. 선택부(132)는 서브세트 Ci에 포함된 다수의 계수들 중 피크를 확인하고, 확인된 피크에 대응하는 계수를 피크 계수(Cij)로 선택한다. 여기서 j(j=1, 2, …, J)는 i번째의 서브세트에 있는 계수들 중 선택된 피크 계수가 j번째에 위치함을 의미한다.For example, the
선택부(132)는 각 서브세트(Ci) 별로 임계값 이상의 크기를 가지는 계수를 피그 계수로 선택할 수 있다. 따라서, 선택부(132)는 각 서브세트(Ci) 별로 다수의 피크 계수(Cij)를 선택할 수 있으며, 임계값은 메모리(미도시)에 저장된다.The
워터마크 삽입부(140)는 서브세트(Ci) 별로 선택되는 각 피크 계수(Cij)에 워 터마크를 삽입한다. 삽입되는 워터마크는 멀티비트 워터마크로서, 0 또는 1의 값을 가지며, 워터마크 삽입부(140)는 다음 조건에 따라 멀티비트 워터마크를 각 피크 계수(Cij)에 삽입한다.The
[수학식 9], [수학식 10]에서 Cij'는 워터마크가 삽입된 피크 계수, Cij는 워터마크가 삽입되기 이전에 피크 계수, λ는 설계자에 의해 선택가능한 상수, abs(Cij)는 Cij의 절대값이다.In
구체적으로, 워터마크 삽입부(140)는 멀티비트 워터마크를 주파수 도메인에서 주요 대역의 웨이블렛 계수에 삽입하는 것을 특징으로 한다. The important frequency peaks는 특정 주파수 대역(A')에서 추출된다. 각 피크, 다시 말하면, 각 피크에 대응하는 웨이블렛 계수에 대하여, 1비트의 워터마크는 [수학식 9] 및 [수학식 10]에서와 같이 피크의 크기(magnitude)를 변경하는 것에 의해 삽입된다. 워터마크된 오디오 신호는 재구성부(150)에서 변경된 계수와 변경되지 않은 계수를 재구성(reconstruction)함으로써 획득된다.In detail, the
재구성부(150)는 워터마크가 삽입된 피크 계수들(Cij')과 대역 선택부(120) 에서 선택되지 않은 그 외 주파수 대역들에 IDWT를 적용하여, 워터마크가 삽입된 오디오 신호(S')로 재구성한다. 도 7을 참조하면, 재구성부(150)는 IFFT부(151), DWT부(152) 및 IDWT부(153)를 포함한다.The
IFFT부(151)는 워터마크가 삽입된 피크 계수들(Cij')과 워터마크가 삽입되지 않은 웨이블렛 계수들을 결합한 후, 결합된 신호에 대해 IFFT(Inverse Fast Fourier transform)를 적용하여 각 서브세트를 재구성(reconstruction)한다. 워터마크가 삽입되지 않은 웨이블렛 계수들은 서브세트(Ci)에서 피크가 아닌 웨이블렛 계수들이며, 재구성에 의해 출력되는 각 서브세트들에 해당하는 신호(B)는 특정 주파수 대역(A')을 이루는 신호(B)가 된다.The
DWT부(152)는 재구성에 의해 출력되는 신호(B)에 DWT를 적용하여 새로운 웨이블렛 계수(C')를 생성한다.The
IDWT부(153)는 대역 선택부(120)에서 선택되지 않은 주파수 대역들, 즉 다수의 주파수 대역들 중 특정 주파수 대역(A')을 제외한 나머지 주파수 대역들의 웨이블렛 계수들과 새로운 웨이블렛 계수들(C')에 IDWT를 적용하여 워터마크가 삽입된 오디오 신호(S')를 출력한다.The
도 8은 도 1에 의한 오디오 워터마크 삽입방법을 설명하기 위한 흐름도이다.FIG. 8 is a flowchart illustrating an audio watermark embedding method of FIG. 1.
도 8을 참조하면, 대역 추정부(110)는 원오디오 신호(S)의 스펙트럼으로부터 주요 주파수 대역(A)을 추정한다(S810). 대역 추정부(110)는 상술한 Advanced Wigner Distribution 방식을 이용하여 원오디오 신호(S)의 스펙트럼을 산출한다.Referring to FIG. 8, the
대역 선택부(120)는 원오디오 신호(S)에 DWT를 적용하여 원오디오 신호(S)를 다수의 주파수 대역으로 분리하며(S820), 분리되는 다수의 주파수 대역 중 주요 주파수 대역(A)을 포함하는 특정 주파수 대역(A')을 선택한다(S830). The
그리고, 대역 선택부(120)는 선택된 특정 주파수 대역(A')의 웨이블렛 계수들에 IDWT를 적용하여 재구성된 웨이블렛 계수들(B)을 생성한다(S840). In operation S840, the
피크 계수 선택부(130)는 IDWT에 의해 생성된 웨이블렛 계수들(B)에 FFT를 적용하여 FFT 계수 세트(C)를 생성한다(S850).The
피크 계수 선택부(130)는 획득된 FFT 계수 세트(C)를 다수의 서브세트(Ci)로 분리하고, 각 서브세트(Ci) 별로 피크(the important frequency peak)에 대응하는 피크 계수(Cij)를 선택한다(S860).The
워터마크 삽입부(140)는 각 서브세트(Ci) 별로 선택되는 각 피크 계수(Cij)에 워터마크를 [수학식 9] 또는 [수학식 10]을 이용하여 삽입한다(S870).The
재구성부(150)는 워터마크가 삽입된 피크 계수들(Cij')과 워터마크가 삽입되지 않은 웨이블렛 계수들을 결합한 후, 결합된 신호에 대해 IFFT를 적용하여 각 서브세트를 재구성(reconstruction)한다(S880). The
재구성부(150)는 재구성된 신호(B), 즉, 재구성된 다수의 서브세트와 S830단계에서 선택되지 않은 나머지 주파수 대역들을 이용하여 워터마크가 삽입된 오디오 신호(S')를 생성 및 출력한다(S890). 이는, 다수의 서브세트는 특정 주파수 대 역(A')을 이루는 신호이기 때문이다. The
도 9는 본 발명의 실시예에 따른 오디오 워터마크 검출장치를 도시한 블록도이다.9 is a block diagram showing an audio watermark detection apparatus according to an embodiment of the present invention.
워터마크가 삽입된 오디오 신호(S')로부터 워터마크를 추출하는 것은 삽입된 워터마크 알고리즘의 역처리에 해당한다고 할 수 있다. 본 발명에서는 워터마크를 검출하기 위하여 원오디오 신호를 이용한다. 공격을 당한 후에, 불법 복제와 같은 공격이 있은 후, 워터마크가 삽입된 오디오 신호는 S', 원오디오 신호는 S, 원 멀티비트 워터마크는 W라 한다. 본 발명에서 제안하는 알고리즘에서, bits(W') 시퀀스는 S'에서 추출되며, 연속적으로 원워터마크 W와 비교된다. 상기 비트는, W와 W'가 동일한 경우 검출된다.Extracting the watermark from the watermark-embedded audio signal S 'corresponds to reverse processing of the embedded watermark algorithm. In the present invention, the original audio signal is used to detect the watermark. After the attack, after an attack such as illegal copying, the audio signal with the watermark embedded there is S ', the original audio signal is S, and the original multibit watermark is W. In the algorithm proposed by the present invention, a sequence of bits (W ') is extracted at S' and continuously compared with the one watermark W. The bit is detected when W and W 'are the same.
이를 위하여, 오디오 워터마크 검출장치(900)는 대역 선택부(910), FFT부(920), 피크 계수 선택부(930) 및 워터마크 검출부(940)를 포함한다. To this end, the audio
대역 선택부(910)는 원오디오 신호(S)를 레벨 L에서 분리하기 위하여, 원오디오 신호(S)에 DWT를 적용하여 다수의 주파수 대역으로 분리한 후, 분리된 다수의 주파수 대역으로부터 제1특정 주파수 대역(B)을 선택한다. 또한, 대역 선택부(120)는 워터마크된 오디오 신호(S')를 레벨 L에서 분리하기 위하여, 워터마크된 오디오 신호(S')에 DWT를 적용하여 다수의 주파수 대역으로 분리한 후, 분리되는 다수의 주파수 대역으로부터 제2특정 주파수 대역(B')을 선택한다. In order to separate the original audio signal S at the level L, the
제1 및 제2특정 주파수 대역(B, B')을 선택하는 알고리즘은 도 1을 참조하여 설명한 바와 같이, 각각의 the most significant frequency band를 포함하는 제1 및 제2특정 주파수 대역(B, B')을 선택하는 것이며, 이를 위하여 Advanced Wigner Distribution을 사용한다. 이에 대한 상세한 설명은 생략한다.The algorithm for selecting the first and second specific frequency bands B and B 'may include the first and second specific frequency bands B and B, each of which includes the most significant frequency band, as described with reference to FIG. ') Is selected and Advanced Wigner Distribution is used for this. Detailed description thereof will be omitted.
FFT부(920)는 선택된 제1 및 제2특정 주파수 대역(B, B')에 대해 FFT를 적용하여 각각 제1 및 제2FFT 계수(C, C')를 획득한다.The
피크 계수 선택부(930)는 제1특정 주파수 대역(B)으로부터 획득된 제1FFT 계수(C)를 다수의 제1서브세트로 분리하고, 각 제1서브세트의 피크에 대응하는 제1FFT 피크 계수(Cij)를 선택하며, 제2특정 주파수 대역(B')으로부터 획득된 제2FFT 계수(C')를 다수의 제2서브세트로 분리하고, 각 제2서브세트의 피크에 대응하는 제2FFT 피크 계수(Cij')를 선택한다. J 피크들이 이러한 서브세트에 대해 생성된다. j번째 피크는 Cij와 Cij'로 정의한다(i=1, 2, …, I, j=1, 2, …, J).The
따라서, 제1 및 제2FFT 피크 계수는 각각 제1 및 제2서브세트의 개수만큼 선택된다. 또는, 도 1의 워터마크 삽입장치(100)에서 각 서브세트 별로 m개의 피크를 선택한 경우, 피크 계수 선택부(930)는 각각 m개의 제1 및 제2FFT 피크 계수를 선택한다.Thus, the first and second FFT peak coefficients are selected by the number of first and second subsets, respectively. Alternatively, when m peaks are selected for each subset in the
예를 들어, 피크 계수 선택부(930)는 C와 C'를 200-샘플 서브세트로 분리하여 각각 I개의 서브세트를 획득한다. 이는, C와 C'가 동일한 길이(same length)를 가지며, 동일한 서브세트의 개수가 리턴되기 때문이다). i=1, 2, …, I인 Ci와 Ci'를 가정하며, I는 각각 두 경우에 있어서, i번째 서브세트 내 계수들의 세트라 한다.For example, the
워터마크 검출부(940)는 선택된 제1FFT 계수와 제2FFT 피크 계수를 비교하여 워터마크(W')를 검출한다. 워터마크 검출부(940)는 다음 조건에 의해 워터마크(또는 워터마크 비트)를 검출한다.The
(i=1, 2, …, I, 그리고, j=1, 2, …, J)(i = 1, 2,…, I, and j = 1, 2,…, J)
(i=1, 2, …, I, 그리고, j=1, 2, …, J)(i = 1, 2,…, I, and j = 1, 2,…, J)
여기서, Wij'는 워터마크, Cij는 각 제1서브세트 중 i번째 서브세트에서 선택된 제1FFT 피크 계수, Cij'는 상기 각 제2서브세트 중 i번째 서브세트에서 선택된 제2FFT 피크 계수, j는 i번째 서브세트에서 각 제1 및 제2FFT 피그 계수의 위치이다.Where W ij 'is the watermark, C ij is the first FFT peak coefficient selected from the i th subset of each first subset, and C ij ' is the second FFT peak coefficient selected from the i th subset of each second subset , j is the position of each of the first and second FFT pig coefficients in the i th subset.
도 10은 도 9에 의한 오디오 워터마크 검출방법을 설명하기 위한 흐름도이다.10 is a flowchart for explaining an audio watermark detection method of FIG. 9.
도 10을 참조하면, 대역 선택부(910)는 원오디오 신호(S)와 워터마크가 삽입된 오디오 신호(S')에 DWT를 적용하여 다수의 주파수 대역으로 분리한 후, 분리된 다수의 주파수 대역으로부터 제1 및 제2특정 주파수 대역(B, B')을 선택한다(S1010).Referring to FIG. 10, the
FFT부(920)는 선택된 제1 및 제2특정 주파수 대역(B, B')에 대해 FFT를 적용하여 각각 제1 및 제2FFT 계수(C, C')를 획득한다(S1020).The
피크 계수 선택부(930)는 제1FFT 계수(C)를 다수의 제1서브세트로 분리하고, 각 제1서브세트의 피크에 대응하는 제1FFT 피크 계수를 선택하며, 제2FFT 계수(C')를 다수의 제2서브세트로 분리하고, 각 제2서브 세트의 피크에 대응하는 제2FFT 피크 계수를 선택한다(S1030, S1040).The
워터마크 검출부(940)는 선택된 제1FFT 계수와 제2FFT 피크 계수를 [수학식 12] 및 [수학식 13]을 토대로 비교하여 워터마크(W')를 검출한다(S1050).The
상술한 과정은 모든 숨겨진 워터마크가 검출될 때까지 반복된다. 검출된 워터마크(W')는 워터마크의 강인성(robustness)를 추정하기 위하여 원 워터마크(W)와 비교되는데 사용된다.The above process is repeated until all hidden watermarks are detected. The detected watermark W 'is used to compare with the original watermark W in order to estimate the robustness of the watermark.
[표 1]은 상수 λ와 검출된 워터마크 비트의 probability 사이의 관계를 보여준다.Table 1 shows the relationship between the constant λ and the probability of detected watermark bits.
[표 1]을 참조하면, λ가 작을수록 검출 확률이 높아지고, 비지각성(imperceptibility)이 향상됨을 알 수 있다. λ=0.1인 경우, 멀티비트 워터마크의 검출이 보다 정확하게 검출되면서 [수학식 11]을 만족시키도록 한다. λ는 적용되는 알고리즘, 어플리케이션 뿐만 아니라, 퍼포먼스의 결과에 의존하여 0.05~0.1 내에서 가변할 수 있다. Referring to [Table 1], it can be seen that the smaller the λ, the higher the detection probability and the improved the imperceptibility. [lambda] = 0.1, the detection of the multi-bit watermark is more accurately detected, thereby satisfying [Equation 11]. λ may vary within 0.05-0.1 depending on the algorithm and application applied as well as the result of the performance.
멀티비트 워터마크를 원오디오 신호의 the important frequency peaks에 상술한 알고리즘을 이용하여 삽입하여 워터마크가 삽입된 오디오 신호를 획득할 수 있다. 원오디오 신호와 워터마크가 삽입된 오디오 신호의 각 스펙트럼 사이에는 작은 차이가 있으나, 두 신호의 사운드는 도 11a 및 도 11b에 도시된 바와 같이 거의 동일하다. 다시 말해서, 본원의 워터마킹 알고리즘은 상당히 강인함을 의미한다. 도 11a 및 도 11b는 Advanced Wigner Distribution을 사용한 원오디오 신호와 워터마크된 오디오 신호의 스펙트럼을 보여준다.The multi-bit watermark may be inserted into the important frequency peaks of the original audio signal by using the above-described algorithm to obtain an audio signal having the watermark embedded therein. Although there is a small difference between each spectrum of the original audio signal and the watermarked audio signal, the sounds of the two signals are almost the same as shown in Figs. 11A and 11B. In other words, the watermarking algorithm of the present application is quite robust. 11A and 11B show the spectrum of the original audio signal and the watermarked audio signal using Advanced Wigner Distribution.
오디오 파일이 방송되면, 오디오 파일은 다양한 dispersion 또는 강력한 공격(예를 들어, 불법 복제)을 당할 수 있다. 워터마킹 기술의 주요 목적은 공격에 대한 강인성에 있으며, 강인성의 개념은 명료하다. 즉, 사용되지 않는 공격된 데이터를 렌더링하지 않아도 워터마크가 손상(impair)되지 않으면, 이 워터마크는 강인하다. 워터마크 손상(impairment)은 오율(miss probability), 비트 에러의 확률 또는 채널 용량과 같은 기준에 의해 측정될 수 있다. 멀티미디어에서, 공격된 데이터의 유용성은 그것의 지각 품질(perceptual quality) 또는 왜곡(distortion)을 고려하여 평가될 수 있다. 따라서, 강인성은 워터마크의 손상과 공격당한 데이터의 왜곡을 고려하여 동시에 평가될 수 있다. 공격당한 데이터의 지각 품질을 유지하는 동안 수용가능한 제한 내에서 워터마크가 손상되면, 공격은 성공하게 된다. 따라서, 워터마킹을 위한 좋은 방식은 the high embedded watermark message를 추출하기 위하여 이러한 강한 공격을 처리해야만 한다.When an audio file is broadcast, the audio file may be subject to various dispersions or powerful attacks (eg, piracy). The main purpose of watermarking technology is the robustness to attack, and the concept of robustness is clear. In other words, the watermark is robust unless the watermark is impaired without rendering unused attacked data. Watermark impairment can be measured by criteria such as miss probability, probability of bit error or channel capacity. In multimedia, the usefulness of an attacked data can be assessed taking into account its perceptual quality or distortion. Therefore, the robustness can be evaluated simultaneously considering the damage of the watermark and the distortion of the attacked data. If the watermark is compromised within acceptable limits while maintaining the perceptual quality of the attacked data, the attack is successful. Thus, a good approach for watermarking must deal with such a strong attack in order to extract the high embedded watermark message.
워터마크 메시지의 강인성은 다양한 방식(MP3 압축, 리샘플링, 로패스 필터링, 노이즈 추가 등)으로 워터마크 메시지를 공격함으로써 평가된다. 공격 이후 검출되는 비트의 개수는 워터마크의 강인성에 직접 비례한다. The robustness of a watermark message is evaluated by attacking the watermark message in various ways (MP3 compression, resampling, low pass filtering, noise addition, etc.). The number of bits detected after the attack is directly proportional to the robustness of the watermark.
도 12 내지 도 15는 다양한 공격에 따른 테스트 실시예를 설명하기 위한 도면이다.12 to 15 are diagrams for describing a test embodiment according to various attacks.
도 12는 MP3 압축 공격을 테스트하는 모델을 보여주는 도면이다. 도 12를 참조하면, 이 모델에서, *.wav 파일 형태의 워터마크된 오디오 신호(S')는 MP3 압축(128kbps)에 의해 압축되어 MP3 파일로 생성된다. 생성된 MP3 파일은 웨이브 파일로 디코딩된다. 따라서, 워터마크가 삽입된 파일이 웨이브 파일로 변환되면, MP3 압축 공격에 직면하게 된다.12 shows a model for testing an MP3 compression attack. Referring to Fig. 12, in this model, the watermarked audio signal S 'in the form of a * .wav file is compressed by MP3 compression (128 kbps) to generate an MP3 file. The generated MP3 file is decoded into a wave file. Thus, if the file with the watermark embedded is converted into a wave file, it will face an MP3 compression attack.
도 13은 잡음 추가 공격을 테스트하는 모델을 보여주는 도면이다. 도 13을 참조하면, 잡음 추가 공격의 경우, 백색 가우시안 잡음이 워터마크가 삽입된 오디오 신호(S')에 낮은 노이즈 레벨로 추가되어, 원오디오 신호와 변경된 신호가 구별될 수 없도록 한다. 따라서, 본 발명에서는 SNR=30인 가우시안 잡음 추가를 선택된다.13 shows a model for testing a noise add attack. Referring to FIG. 13, in the case of a noise addition attack, white Gaussian noise is added to the watermark-embedded audio signal S 'at a low noise level so that the original audio signal and the changed signal cannot be distinguished. Therefore, in the present invention, Gaussian noise addition with SNR = 30 is selected.
도 14는 필터링 공격을 테스트하는 모델을 보여준다. 도 14를 참조하면, 하이 또는 로우 주파수 대역은 LPF(Low Pass Filter) 또는 HPF(High Pass Filter)를 사용하여 분리된다. 사운드 품질에 기인하여, the most significant frequency band는 컷오프(cut off)될 수 없으나, 사운드는 변경된다. 본 발명에서는, 워터마크가 삽입된 오디오 파일(S')을 위하여 Butterworth LPF가 사용되며, 여기서 컷오프 주파수(Wn)는 0.9이다.14 shows a model for testing a filtering attack. Referring to FIG. 14, a high or low frequency band is separated using a low pass filter (LPF) or a high pass filter (HPF). Due to the sound quality, the most significant frequency band cannot be cut off, but the sound is changed. In the present invention, a Butterworth LPF is used for the watermarked audio file S ', where the cutoff frequency Wn is 0.9.
도 15는 리샘플링 공격을 테스트하는 모델을 도시한 도면이다. 도 15를 참조하면, 샘플링의 업 또는 다운은 원오디오 신호의 샘플링 주파수를 변경할 수 있다. 본 발명의 테스트에서, 워터마크가 삽입된 오디오 파일(S')은 44100에서 22100Hz로 리샘플된다. 15 shows a model for testing a resampling attack. Referring to FIG. 15, up or down sampling may change a sampling frequency of an original audio signal. In the test of the present invention, the watermarked audio file S 'is resampled from 44100 to 22100 Hz.
도 12 내지 도 15를 참조하여 설명한 공격들로부터 획득되는 웨이브 파일은, 멀티비트 워터마크 메시지를 검출하기 위하여, 본 발명에서 제안된 검출 알고리즘에 적용된다. 각 공격에 대하여, 각각의 검출된 비트는 원워터마크 메시지와 비교된다. 검출된 비트가 원워터마크 비트와 동일한 값(0 또는 1)이면, 비트가 검출된 것을 의미한다. The wave file obtained from the attacks described with reference to FIGS. 12 to 15 is applied to the detection algorithm proposed in the present invention in order to detect a multibit watermark message. For each attack, each detected bit is compared with the one watermark message. If the detected bit is the same value (0 or 1) as the one watermark bit, it means that the bit is detected.
다음 [표 2]는 상기 테스트들의 결과를 보여준다. Table 2 below shows the results of the tests.
[표 2]를 참조하면, 각 공격으로부터 검출된 비트의 개수가 많으므로, 상기 결과는 워터마크의 강인성이 좋음을 보여준다. 즉, 본원에서 제안하는 워터마킹 방식은 노이즈 추가, 필터링, 리샘플링 및 MP3 압축 공격과 같은 강한 공격에도 강인함을 알 수 있다.Referring to Table 2, since the number of bits detected from each attack is large, the results show that the watermarks have good robustness. In other words, it can be seen that the watermarking scheme proposed herein is robust to strong attacks such as noise addition, filtering, resampling, and MP3 compression attacks.
한편, 기술의 발전에 따라, 음악 성능은 방송국, 인터넷 등을 통해 직접 전파된다. 상기 성능의 품질 및 지적 재산권 보호는 확립되어야 한다. 이를 위하여 이용되는 본 오디오 워터마킹 기술의 경우, 실시간 동작을 위한 효율적인 computational complexity가 요구된다. 따라서, 본원은 다른 기술에 상대적인 computational complexity를 고려하는 것에 의해, 실시간 동작을 위한 워터마킹 기술의 효율성을 추정한다.On the other hand, with the development of technology, music performance is directly propagated through broadcasting stations, the Internet, and the like. The quality of performance and protection of intellectual property must be established. For this audio watermarking technique used for this, efficient computational complexity for real-time operation is required. Thus, the present application estimates the efficiency of watermarking techniques for real-time operation by considering computational complexity relative to other techniques.
본원은 Advanced Wigner distribution 프로세스와 삽입된 워터마크 프로세스를 고려한다. Advanced Wigner 프로세스의 경우, Advanced Wigner distribution와 원 Wigner distribution 사이의 비교가, 필요한 산술 동작의 개수에 관해서 제공된다. Advanced Wigner distribution의 이산 형태는 [수학식 7]과 [수학식 8]에서 보여진다. Advanced Wigner 방식을 산출하기 위하여, 시간 n에서 STFT의 산출이 필요한다. 이는 시간 n-1에서 구해된 이전 STFT의 값으로부터, 회귀식(resursive formula)에 의해 수행될 수 있다.The present application contemplates the Advanced Wigner distribution process and the embedded watermark process. For the Advanced Wigner process, a comparison between the Advanced Wigner distribution and the original Wigner distribution is provided in terms of the number of arithmetic operations required. Discrete forms of the Advanced Wigner distribution are shown in
본원은 실시예에서, [수학식 1]에서 정의한 윈도우 h(i)가 상승 코사인 윈도우(raised consine window)이고 N개의 샘플을 포함하는 것으로 가정한다. 상기 STFT 계수에 대한 회귀식은 다음 [수학식 14]와 같이 정의된다.In the present example, it is assumed that the window h (i) defined in
[수학식 8] 및 [수학식 14](Papoulis, 1977)로부터, Advanced Wigner 방식의 복소수 승산(Complex Multiplication)과 복소수 가산(Complex addition)은 각각 'N(3+Q)/2'와 'N(6+Q)/2'이다. 여기서, Q는 [수학식 8]에 의해 정의된다. 그러나, Original Wigner Distribution의 복소수 승산과 복소수 가산은 각각 'N(4_log2N)/2'와 'N(log22N)'이다(Mecklenbrauker and Hlawatsch, 1997). Q는 N보다 작으며, 따라서, Advanced Wigner 방식은 보다 효율적인 complexity를 제공한다. 본 발명의 실험에서 N=256, Q=4이다.From
제안된 워터마킹 삽입 프로세스의 computational complexity를 고려하기 위하여, 본원은 제안된 워터마킹 기술과 standard watermark-embedding practices를 비교한다. 일반적인 watermark-embedding 기술에서, 워터마크 메시지는 오리지널 신호의 각 FFT 계수에 삽입된다. 그러나, 본원의 알고리즘에서는, 워터마크 메시지는 the importane peaks에 삽입된다. 이러한 피크를 발견하기 위하여, 본원은 서로 인접하는 적어도 3개의 샘플(즉, 계수)을 사용한다. 따라서, 샘플의 절반 이하가 워터마크 메시지를 삽입하는데 사용된다.In order to consider the computational complexity of the proposed watermarking insertion process, we compare the proposed watermarking technique with standard watermark-embedding practices. In a typical watermark-embedding technique, a watermark message is inserted into each FFT coefficient of the original signal. However, in our algorithm, the watermark message is inserted at the importane peaks. To find these peaks, we use at least three samples (ie coefficients) that are adjacent to each other. Thus, less than half of the sample is used to insert a watermark message.
또한, the most imporant frequency band는 레벨 L의 웨이블렛을 사용한 후에 사용되므로, 오리지널 신호가 P개의 샘플을 포함하면, the most imporant frequency band는 P/2L개의 샘플을 포함한다(Strand and Nguyen, 1997). 본 발명에서는, 오리지널 신호로 삽입되는 P 워터마크 메시지를 사용하는 대신, 단지 P/2L+1 워터마크 메시지가 사용된다. 따라서, Computational Time이 단축될 수 있다. In addition, since the most imporant frequency band is used after using the wavelet of level L, if the original signal includes P samples, the most imporant frequency band includes P / 2 L samples (Strand and Nguyen, 1997). . In the present invention, instead of using the P watermark message embedded in the original signal, only the P / 2 L + 1 watermark message is used. Thus, the Computational Time can be shortened.
상술한 설명에서 워터마크, 멀티비트 워터마크, 워터마크 비트, 워터마크 메시지 등은 동일한 것이며, 또한, Adavnced Wigner Distribution, Adavnced Wigner 방식 등의 표현 역시 동일한 것이며, 설명의 편의상 다양하게 사용된다. In the above description, the watermark, the multibit watermark, the watermark bit, the watermark message, and the like are the same, and the expressions of the Adavnced Wigner Distribution, the Adavnced Wigner method, etc. are also the same, and various descriptions are used for convenience of description.
한편, 결과적으로, 본 발명은 원오디오 신호의 주파수 도메인에서 변하지 않는 특징을 이용하는 오디오 워터마킹 기술을 제공한다. 이용되는 불변의 특징들은 피크 계수, 즉, the important frequency peaks이다. 또한, The Advanced Wigner Distribution은 사운드의 특성을 보여주는 특정 주파수 대역(the most significant frequency band)를 추정하는데 사용된다. 제안된 워터마킹 기술에서, 멀티비트 워터마크는 the important frequency peaks의 크기(magnitude)를 미세하기 조정함으로써 the important frequency peaks에 삽입(embeded)된다. 본 발명에서 제안하는 알고리즘에 의한 테스트 결과는 워터마킹 기술이 노이즈 추가, 필터링, 리샘플링 및 MP3 압축 공격과 같은 강한 공격에도 강인함을 보여준다. 또한, 본원의 효율적인 computational complexity는 실시간 응용에 효과가 크다.On the other hand, as a result, the present invention provides an audio watermarking technique that uses a feature that does not change in the frequency domain of the original audio signal. The constant features used are the peak coefficients, ie the important frequency peaks. The Advanced Wigner Distribution is also used to estimate the most significant frequency band that characterizes the sound. In the proposed watermarking technique, a multi-bit watermark is embedded in the important frequency peaks by fine-tuning the magnitude of the important frequency peaks. Test results by the algorithm proposed by the present invention show that the watermarking technique is robust against strong attacks such as noise addition, filtering, resampling, and MP3 compression attacks. In addition, the efficient computational complexity of the present application is very effective for real-time applications.
이상에서는 본 발명의 바람직한 실시예에 대하여 도시하고 설명하였지만, 본 발명은 상술한 특정의 실시예에 한정되지 아니하며, 청구범위에서 청구하는 본 발명의 요지를 벗어남이 없이 당해 발명이 속하는 기술분야에서 통상의 지식을 가진자에 의해 다양한 변형실시가 가능한 것은 물론이고, 이러한 변형 실시예들은 본 발명의 기술적 사상이나 전망으로부터 개별적으로 이해되어져서는 안될 것이다.While the above has been shown and described with respect to preferred embodiments of the present invention, the present invention is not limited to the specific embodiments described above, it is usually in the technical field to which the invention belongs without departing from the spirit of the invention claimed in the claims. Various modifications may be made by those skilled in the art, and these modifications should not be individually understood from the technical spirit or the prospect of the present invention.
도 1은 본 발명의 실시예에 따른 오디오 워터마크 삽입장치를 도시한 블록도,1 is a block diagram showing an audio watermark embedding apparatus according to an embodiment of the present invention;
도 2는 직사각형 윈도우(p(i))의 일 예를 도시한 도면,2 shows an example of a rectangular window p (i),
도 3a 내지 도 3d는 상기 4가지 방식들의 스펙트럼 결과를 보여주는 도면,3a to 3d show spectral results of the four schemes,
도 4는 도 1의 대역 선택부를 자세히 도시한 도면,4 is a view illustrating in detail the band selector of FIG. 1;
도 5는 도 4의 DWT부에 의해 멀티플 주파수 대역으로 분리되는 과정을 설명하기 위한 도면,5 is a view for explaining a process of separating into multiple frequency bands by the DWT unit of FIG.
도 6는 도 1의 피크 계수 선택부를 자세히 도시한 도면,6 is a view illustrating in detail the peak coefficient selector of FIG.
도 7은 도 1의 복원부를 자세히 도시한 도면,7 is a detailed view of the restoration unit of FIG. 1;
도 8은 도 1에 의한 오디오 워터마크 삽입방법을 설명하기 위한 흐름도,8 is a flowchart for explaining an audio watermark embedding method according to FIG. 1;
도 9는 본 발명의 실시예에 따른 오디오 워터마크 검출장치를 도시한 블록도,9 is a block diagram showing an audio watermark detection apparatus according to an embodiment of the present invention;
도 10은 도 9에 의한 오디오 워터마크 검출방법을 설명하기 위한 흐름도,10 is a flowchart for explaining an audio watermark detection method according to FIG. 9;
도 11a 및 도 11b는 Advanced Wigner Distribution을 사용한 원오디오 신호와 워터마크된 오디오 신호의 스펙트럼을 도시한 도면, 그리고,11A and 11B show spectra of an original audio signal and a watermarked audio signal using Advanced Wigner Distribution, and
도 12 내지 도 15는 다양한 공격에 따른 테스트 실시예를 설명하기 위한 도면이다.12 to 15 are diagrams for describing a test embodiment according to various attacks.
* 도면의 주요부분에 대한 부호의 설명 *Explanation of symbols on the main parts of the drawings
100 : 오디오 워터마크 삽입장치 110 : 추정부100: audio watermark insertion device 110: estimator
120 : 대역 선택부 130 : 피크 계수 선택부120: band selector 130: peak coefficient selector
140 : 워터마크 삽입부 150 : 재구성부140: watermark insertion unit 150: reconstruction unit
Claims (16)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020090072453A KR101201076B1 (en) | 2009-08-06 | 2009-08-06 | Apparatus and method for embedding audio watermark, and apparatus and method for detecting audio watermark |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
KR1020090072453A KR101201076B1 (en) | 2009-08-06 | 2009-08-06 | Apparatus and method for embedding audio watermark, and apparatus and method for detecting audio watermark |
Publications (2)
Publication Number | Publication Date |
---|---|
KR20110014871A true KR20110014871A (en) | 2011-02-14 |
KR101201076B1 KR101201076B1 (en) | 2012-11-20 |
Family
ID=43773861
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
KR1020090072453A KR101201076B1 (en) | 2009-08-06 | 2009-08-06 | Apparatus and method for embedding audio watermark, and apparatus and method for detecting audio watermark |
Country Status (1)
Country | Link |
---|---|
KR (1) | KR101201076B1 (en) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102496367A (en) * | 2011-12-06 | 2012-06-13 | 北京邮电大学 | Audio blind watermark algorithm based on combination of discrete wavelet transformation (DWT), discrete cosine transformation (DCT) and singular value decomposition (SVD) |
WO2014010780A1 (en) * | 2012-07-11 | 2014-01-16 | 조선대학교산학협력단 | Audio-encoding method |
WO2015108535A1 (en) * | 2014-01-17 | 2015-07-23 | Intel Corporation | Mechanism for facilitating watermarking-based management of echoes for content transmission at communication devices |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR102651318B1 (en) | 2022-10-28 | 2024-03-26 | 주식회사 뮤즈블라썸 | A transient-based sidechain audio watermark coding system |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4310145B2 (en) | 2003-07-29 | 2009-08-05 | 学校法人明治大学 | Audio data watermark information embedding method, embedding program, and detection method |
-
2009
- 2009-08-06 KR KR1020090072453A patent/KR101201076B1/en not_active IP Right Cessation
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102496367A (en) * | 2011-12-06 | 2012-06-13 | 北京邮电大学 | Audio blind watermark algorithm based on combination of discrete wavelet transformation (DWT), discrete cosine transformation (DCT) and singular value decomposition (SVD) |
WO2014010780A1 (en) * | 2012-07-11 | 2014-01-16 | 조선대학교산학협력단 | Audio-encoding method |
WO2015108535A1 (en) * | 2014-01-17 | 2015-07-23 | Intel Corporation | Mechanism for facilitating watermarking-based management of echoes for content transmission at communication devices |
Also Published As
Publication number | Publication date |
---|---|
KR101201076B1 (en) | 2012-11-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Lei et al. | Blind and robust audio watermarking scheme based on SVD–DCT | |
KR100458492B1 (en) | Watermark embedding and extracting method for protecting digital audio contents copyright and preventing duplication and apparatus using thereof | |
Özer et al. | An SVD-based audio watermarking technique | |
Kirovski et al. | Spread-spectrum watermarking of audio signals | |
Al-Haj et al. | DWT-based audio watermarking. | |
CN102142258A (en) | Wavelet transform and Arnold based adaptive gray-scale watermark embedded method | |
Orović et al. | Time-frequency-based speech regions characterization and eigenvalue decomposition applied to speech watermarking | |
Wang et al. | A robust digital audio watermarking scheme using wavelet moment invariance | |
Yassine et al. | A secure and high robust audio watermarking system for copyright protection | |
KR101201076B1 (en) | Apparatus and method for embedding audio watermark, and apparatus and method for detecting audio watermark | |
Ansari et al. | Data-hiding in audio using frequency-selective phase alteration | |
Zhao et al. | A robust audio watermarking algorithm based on SVD-DWT | |
Malik et al. | Robust audio watermarking using frequency-selective spread spectrum | |
Li et al. | An audio watermarking technique that is robust against random cropping | |
Bibhu et al. | Secret key watermarking in WAV audio file in perceptual domain | |
Stanković et al. | Robust speech watermarking procedure in the time-frequency domain | |
JP6316288B2 (en) | Digital watermark embedding device, digital watermark detection device, digital watermark embedding method, digital watermark detection method, digital watermark embedding program, and digital watermark detection program | |
He et al. | A high capacity watermarking technique for stereo audio | |
Singh et al. | Multiplicative watermarking of audio in DFT magnitude | |
He et al. | Efficiently synchronized spread-spectrum audio watermarking with improved psychoacoustic model | |
Li et al. | A novel audio watermarking in wavelet domain | |
Fujimoto et al. | A method of high bit-rate data hiding in music using spline interpolation | |
Saraswathi | Speech authentication based on audio watermarking | |
Khalil et al. | Improved watermark extraction exploiting undeterminated source separation methods | |
Esmaili et al. | A novel spread spectrum audio watermarking scheme based on time-frequency characteristics |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A201 | Request for examination | ||
E902 | Notification of reason for refusal | ||
E90F | Notification of reason for final refusal | ||
E701 | Decision to grant or registration of patent right | ||
GRNT | Written decision to grant | ||
FPAY | Annual fee payment |
Payment date: 20150922 Year of fee payment: 4 |
|
FPAY | Annual fee payment |
Payment date: 20161021 Year of fee payment: 5 |
|
LAPS | Lapse due to unpaid annual fee |