WO2014199449A1 - 電子透かし埋め込み装置、電子透かし検出装置、電子透かし埋め込み方法、電子透かし検出方法、電子透かし埋め込みプログラム、及び電子透かし検出プログラム - Google Patents

電子透かし埋め込み装置、電子透かし検出装置、電子透かし埋め込み方法、電子透かし検出方法、電子透かし埋め込みプログラム、及び電子透かし検出プログラム Download PDF

Info

Publication number
WO2014199449A1
WO2014199449A1 PCT/JP2013/066109 JP2013066109W WO2014199449A1 WO 2014199449 A1 WO2014199449 A1 WO 2014199449A1 JP 2013066109 W JP2013066109 W JP 2013066109W WO 2014199449 A1 WO2014199449 A1 WO 2014199449A1
Authority
WO
WIPO (PCT)
Prior art keywords
band
watermark
embedding
unit
digital
Prior art date
Application number
PCT/JP2013/066109
Other languages
English (en)
French (fr)
Inventor
匡伸 中村
Original Assignee
株式会社東芝
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 株式会社東芝 filed Critical 株式会社東芝
Priority to PCT/JP2013/066109 priority Critical patent/WO2014199449A1/ja
Priority to CN201380077328.7A priority patent/CN105283915B/zh
Priority to JP2015522297A priority patent/JP6316288B2/ja
Publication of WO2014199449A1 publication Critical patent/WO2014199449A1/ja
Priority to US14/964,038 priority patent/US10424310B2/en

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/018Audio watermarking, i.e. embedding inaudible data in the audio signal

Definitions

  • Embodiments described herein relate generally to a digital watermark embedding device, a digital watermark detection device, a digital watermark embedding method, a digital watermark detection method, a digital watermark embedding program, and a digital watermark detection program.
  • An embodiment of the present invention has been made in view of the above, and is an electronic device that is resistant to various distortions and is excellent in confidentiality of additional information with respect to call voice of a fixed telephone or a mobile phone.
  • An object of the present invention is to provide a watermark embedding device and a detection device therefor.
  • an embodiment of the present invention includes a first band that is a pair of at least one frequency band in which a digital watermark bit is embedded using an input key random number, and a first band A generation unit that outputs a filter that determines two bands; and when the digital watermark bits are embedded in a unit frame of an input audio signal, the amplitude spectrum intensity sum of the first band is the amplitude spectrum intensity of the second band And an embedding unit that changes an amplitude spectrum intensity sum of at least one of the first band and the second band so as to be larger than the sum.
  • FIG. 1 is a block diagram illustrating a digital watermark embedding device according to an embodiment.
  • 1 is a block diagram illustrating a digital watermark detection apparatus according to an embodiment.
  • FIG. 5 is a view for explaining a watermark embedding method in an embedding unit according to the embodiment. The figure explaining the production
  • the block diagram which illustrates the digital watermark embedding device concerning the modification of an embodiment.
  • FIG. 1 is a block diagram showing a functional configuration of the digital watermark embedding apparatus.
  • the digital watermark embedding device 1 includes an extraction unit 101, a conversion application unit 102, an embedding unit 103, an inverse conversion application unit 104, a recombination unit 105, and a generation unit 106.
  • the digital watermark embedding apparatus 1 receives the audio signal 10 and the key random number 16 and outputs a synthesized voice 15 in which the digital watermark is embedded.
  • the extraction unit 101 acquires an audio signal 10 input from the outside.
  • the input of the audio signal 10 is performed by an input device such as a microphone.
  • the time length 2T is also called an analysis window width.
  • the extraction unit 101 cuts out a speech waveform having a time length of 2T, removes a DC component of the cut-out voice waveform, emphasizes high-frequency components of the cut-out voice waveform, and extracts a window function (for example, A process of multiplying the sine window may be performed.
  • the extraction unit 101 outputs the unit audio frame 11 to the conversion application unit 102.
  • the conversion application unit 102 receives the unit audio frame 11 from the extraction unit 101 as an input.
  • the transform application unit 102 applies orthogonal transform to the unit speech frame 11 and projects it to the frequency domain.
  • a transform method such as discrete Fourier transform, discrete cosine transform, modified discrete cosine transform, sine transform, or discrete wavelet transform may be used.
  • the transform application unit 102 outputs the unit frame 12 after the orthogonal transform is applied to the embedding unit 103.
  • the generation unit 106 receives the key random number 16 as an input.
  • the generation unit 106 generates the subband filter 17 based on the input key random number 16.
  • the subband filter 17 is a filter in which the widths of the P group and the N group, which are frequency bands in which the digital watermark is embedded, are randomly determined by a random number sequence.
  • the P group band corresponds to the first band
  • the N group band corresponds to the second band, and it is possible to embed one watermark bit in the unit frame 12.
  • the processing flow of the generation unit 106 will be described later.
  • the generation unit 106 outputs the generated subband filter 17 to the embedding unit 103.
  • the embedding unit 103 receives the unit frame 12 and the subband filter 17 from the conversion applying unit 102 as inputs.
  • the embedding unit 103 embeds a digital watermark in the subband designated by the subband filter 17 for each unit frame 12. A method for embedding a digital watermark will be described later.
  • the embedding unit 103 outputs the watermarked unit frame 13 to the inverse transformation applying unit 104.
  • the inverse transform application unit 104 receives the watermarked unit frame 13 from the embedding unit 103 as an input.
  • the inverse transformation application unit 104 applies inverse orthogonal transformation to the watermarked unit frame 13 and returns it to the time domain.
  • an inverse discrete Fourier transform, an inverse discrete cosine transform, an inverse modified discrete cosine transform, an inverse discrete sine transform, an inverse discrete wavelet transform, or the like may be used, but the orthogonal transform used in the transform application unit 102 may be used.
  • a corresponding inverse orthogonal transform is desirable.
  • the inverse transform application unit 104 outputs the unit frame 14 after applying the inverse orthogonal transform to the recombination unit 105.
  • the re-synthesis unit 105 receives the unit frame 14 after applying the inverse orthogonal transform from the inverse transform application unit 104 as an input.
  • the re-synthesizing unit 105 generates the watermarked synthesized speech 15 by overlapping the previous and subsequent frames with the unit frame 14 after the inverse orthogonal transform is applied.
  • the extraction unit 101 performs a process other than cutting out a speech waveform, it is appropriate to perform a process reverse to these processes. That is, when the process of removing the DC component of the cut out speech waveform is performed, the process of returning the removed DC component to the unit frame 14 and the process of enhancing the high frequency component of the cut out speech waveform are performed.
  • a process of restoring the emphasized high frequency component of the unit frame 14, a process of multiplying the unit frame 14 by a window function (for example, a sine window) when the extracted speech waveform is multiplied by a window function, and the like are performed.
  • the frames before and after the unit frame 14 are overlapped by a time length T that is half of the analysis window length 2T, for example.
  • the digital watermark detection apparatus 2 includes an extraction unit 101, a conversion application unit 102, a watermark detection unit 107, and a generation unit 106.
  • the extraction unit 101, the conversion application unit 102, and the generation unit 106 have the same configuration as the digital watermark embedding device 1 shown in FIG.
  • the digital watermark detection device 2 receives the watermarked synthetic speech 15 and the key random number 16 and outputs a watermark bit string 18 embedded in the inputted synthetic speech 15. Then, the united frame 12 projected to the frequency domain is extracted from the input synthesized speech 15 with watermark through the extraction unit 101 and the conversion application unit 102.
  • the watermark detection unit 107 receives the unit frame 12 from the conversion application unit 102 as an input.
  • the watermark detection unit 107 extracts the watermark information from the frequency band specified by the subband filter 17 for each unit frame 12. A method for detecting digital watermark information will be described later.
  • the watermark detection unit 107 outputs a watermark bit string 18.
  • the subband filter generation unit 106 has a role of improving the confidentiality of the digital watermark information.
  • the generation unit 106 generates a subband filter 17 unique to digital data in which a watermark is embedded.
  • the subband filter 17 is a filter in which the widths of the P group and the N group, which are frequency bands in which the digital watermark is embedded, are randomly determined by a random number sequence.
  • the subband filter 17 is generated by a processing flow as shown in FIG.
  • the subband filter 17 regards the determined representative frequency boundary E of each representative frequency bin as a subband boundary, and generates a subband filter.
  • determining the representative frequency bins for example, a method in which all frequency bins are linearly divided and the centers thereof are selected, and a method in which the frequency axis is equally divided on a log scale and the centers are selected. Conceivable. Note that the process of creating subband filters with different subband boundaries by the key random number 16 can be performed by methods other than the method of determining the representative frequency bin in advance as described above.
  • A method to determine the division ratio of all frequency bins based on the number of random number sequences prepared as many as the number of frequency bands to embed the digital watermark, and to determine the subband boundaries ⁇
  • Prepare multiple subband filters with different subband boundaries A method of determining a subband filter to be applied by the key random number 16 can be considered.
  • the embedding unit 103 selects a band that actually includes the frequency bands set as the P group and the N group.
  • FIG. 3 a method of embedding a digital watermark in the embedding unit 103 is shown in FIG.
  • the left diagram in FIG. 3 represents the unit frame 12 output from the conversion application unit 102.
  • the horizontal axis represents frequency and the vertical axis represents amplitude spectrum intensity.
  • two types of bands, P group and N group are set in FIG.
  • the band includes at least two adjacent frequency bins.
  • the entire frequency band may be divided in advance into a designated number of bands based on a specific rule and then selected from the obtained bands.
  • the P group and the N group may be set to be the same in all the unit frames 12 or may be changed for each unit frame 12.
  • one watermark bit ⁇ 0, 1 ⁇ is embedded in each unit frame 12.
  • when a set of ⁇ p of all frequency bins belonging to the P group, the amplitude spectrum of all frequency bins belonging to the P group.
  • S N (t) represents the sum of amplitude spectrum intensities of all frequency bins belonging to the N group
  • S P (t) represents the sum of amplitude spectrum intensities of all frequency bins belonging to the P group.
  • the method of embedding a watermark in all the unit frames 12 is exemplified.
  • the watermark of the unit frame 12 always satisfies either formula when the watermark detection process is performed, so that ⁇ 0, 1 ⁇ tends to appear randomly with almost equal probability in the detected bit string.
  • the arrangement of watermark bits to be embedded may be determined in advance or may be automatically generated according to a specific algorithm.
  • the watermark embedded by the digital watermark embedding apparatus 1 is detected by the digital watermark detection apparatus 2. For this purpose, it is necessary to use a watermark bit array common to both.
  • the watermark detection process in the present embodiment is a process of taking out one embedded bit from the P group and N group that are bands designated by the input subband filter 17 for each unit frame 12.
  • the subsequent watermark detection processing is performed for each pair, and two or more embedded watermark bits are extracted.
  • S P (t) the sum of the amplitude spectrum intensities of the frequency bins belonging to the P group
  • S N (t) the sum of the amplitude spectrum intensities of the frequency bins belonging to the N group
  • S P (t ) And S N (t) are used to detect the embedded bits.
  • the embedded 1-bit watermark is extracted based on the magnitude relationship of the amplitude spectrum intensity sum of each band of the P group and the N group. For this reason, if the digital watermark detection apparatus 2 does not have the same key random number 16 as that used in the digital watermark embedding apparatus 1 and the subband boundary between the P group and the N group is unknown, the magnitude of the amplitude spectrum intensity sum is large or small. Even if the comparison is performed, it becomes difficult to accurately detect the watermark bits.
  • a conventional digital watermark embedding method will be described.
  • a typical method there is a method of changing the amplitude spectrum intensity of a specific frequency bin.
  • the MDCT coefficient (amplitude) of a specific frequency bin is used for each unit speech frame calculated by the modified discrete cosine transform (MDCT) according to the watermark bits ⁇ 0, 1 ⁇ to be embedded. (Spectral intensity) is changed.
  • MDCT modified discrete cosine transform
  • This method has the advantage that the embedding efficiency is high because the watermark is embedded only in the specific frequency bin, but has the disadvantage that the noise resistance is relatively weak.
  • the quantization width is increased to improve the noise resistance and the watermark strength is increased, the value of the specific frequency bin changes greatly, which causes a decrease in the imperceptibility of the digital watermark.
  • a method of selecting a set of two frequency bins in each unit frame and defining watermark bits ⁇ 0, 1 ⁇ according to the magnitude relation of the sum of amplitude spectrum in each band There is.
  • a plurality of frequency bins included in a certain band are divided into an even number and an odd number, and when “1” is embedded in a watermark bit, the even-numbered amplitude spectrum intensity sum is an odd number. It is defined to be larger than that and to be smaller when “0” is embedded in the watermark bit.
  • one or a plurality of frequency bins are selected according to the random number value extracted from the key random number, and the MDCT coefficient of the selected frequency bin is changed. If this method is used, it is difficult to obtain watermark information unless the cracker obtains a key random number.
  • the present embodiment Compared with these conventional digital watermark embedding and detection methods, the present embodiment has the following advantages. In other words, rather than embedding watermarks in specific frequency bins, embedding digital watermarks in multiple bands improves noise immunity, leading to codec distortion, additive noise, multiplicative distortion, etc. for fixed phones and mobile phones. Improves resistance.
  • the embedded watermark is defined by comparing the magnitudes of the amplitude spectrum intensity sums in a plurality of bands. Therefore, if the key random number is different, the bandwidth in which the watermark is embedded is different and the sum of the amplitude spectrum intensities is also different, so that it is difficult to accurately extract the embedded watermark.
  • the perception of digital watermarks is high.
  • a frequency bin (or band) in which a watermark is embedded by a random number sequence there is a possibility that a frequency band that is easy for humans to listen to is selected by the random number sequence.
  • the representative frequency bins in a frequency band that is difficult for humans to listen to are specified, the imperceptibility of the digital watermark is not significantly degraded by the random number sequence.
  • the subband filter is generated using the key random number.
  • a subband filter control unit 508 may be provided.
  • the digital watermark embedding device 3 includes a subband filter control unit 508 in addition to the configuration shown in the above embodiment.
  • the generation unit 506 generates one or more subband filters 57 based on the input key random number 16 and outputs the generated subband filters 57 to the subband filter control unit 508.
  • the subband filter control unit 508 receives one or more subband filters 57 from the generation unit 506 as input.
  • the subband filter control unit 508 outputs one subband filter 58 to be applied in each unit frame 12.
  • the subband filter control unit 508 selects one to be applied among one or a plurality of subband filters when embedding a watermark in each unit frame 12. There are various selection methods. For example, a method of changing the subband filter every N frames (N is an integer of 1 or more) can be considered. In order not to embed a digital watermark in a certain unit frame 12, the subband filter control unit 508 may output a control signal to which the subband filter is not applied.
  • the digital watermark detection apparatus 4 is also provided with a similar subband filter control unit 508 as shown in FIG. .
  • the subband filter control unit 508 applies a subband filter to the unit frame 12 to be detected according to the same algorithm as that of the digital watermark embedding apparatus 3.
  • one or a plurality of subband filters generated using a key random number can be selected and applied to each unit frame 12, and the confidentiality of the applied subband filter can be improved. Is possible.
  • FIG. 7 is an explanatory diagram illustrating a hardware configuration of the digital watermark embedding device and the detection device according to the embodiment.
  • the digital watermark embedding device and the detection device include a control device such as a CPU (Central Processing Unit) 51, a storage device such as a ROM (Read Only Memory) 52 and a RAM (Random Access Memory) 53, and a network.
  • a control device such as a CPU (Central Processing Unit) 51
  • a storage device such as a ROM (Read Only Memory) 52 and a RAM (Random Access Memory) 53
  • a communication I / F 54 that performs communication by connection and a bus 61 that connects each unit are provided.
  • the program executed by the digital watermark embedding device and the detection device according to the embodiment is provided by being incorporated in advance in the ROM 52 or the like.
  • the program executed by the digital watermark embedding device and the detection device is a file in an installable format or an executable format, and is a CD-ROM (Compact Disk Read Only Memory), a flexible disk (FD), a CD- It may be configured to be recorded on a computer-readable recording medium such as R (Compact Disk Recordable) or DVD (Digital Versatile Disk) and provided as a computer program product.
  • CD-ROM Compact Disk Read Only Memory
  • FD flexible disk
  • CD- It may be configured to be recorded on a computer-readable recording medium such as R (Compact Disk Recordable) or DVD (Digital Versatile Disk) and provided as a computer program product.
  • the electronic watermark embedding device may be stored on a computer connected to a network such as the Internet and provided by being downloaded via the network. Good. Further, the digital watermark embedding device according to the embodiment and the program executed by the detection device may be provided or distributed via a network such as the Internet.
  • the program executed by the digital watermark embedding device and the detection device according to the embodiment may cause the computer to function as each unit described above.
  • the CPU 51 can read a program from a computer-readable storage medium onto a main storage device and execute the program.
  • the present embodiment is not limited to the above-described embodiment as it is, and can be embodied by modifying the components without departing from the scope of the invention in the implementation stage.
  • various inventions can be formed by appropriately combining a plurality of constituent elements disclosed in the embodiment. For example, some components may be deleted from all the components shown in the embodiment. Furthermore, constituent elements over different embodiments may be appropriately combined.

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Editing Of Facsimile Originals (AREA)
  • Image Processing (AREA)

Abstract

 電子透かし埋め込み装置は、入力された鍵乱数を用いて、電子透かしビットを埋め込む少なくとも1つの周波数帯域のペアである第1帯域、及び第2帯域を決定するフィルタを出力する生成部と、入力された音声信号の単位フレームに前記電子透かしビットを埋め込む場合に、前記第1帯域の振幅スペクトル強度和が、前記第2帯域の振幅スペクトル強度和より大きくなるよう、前記第1帯域、及び第2帯域の少なくとも一方の振幅スペクトル強度和を変更する埋め込み部と、を備える。

Description

電子透かし埋め込み装置、電子透かし検出装置、電子透かし埋め込み方法、電子透かし検出方法、電子透かし埋め込みプログラム、及び電子透かし検出プログラム
 本発明の実施形態は、電子透かし埋め込み装置、電子透かし検出装置、電子透かし埋め込み方法、電子透かし検出方法、電子透かし埋め込みプログラム、及び電子透かし検出プログラムに関する。
 近年の音声信号処理技術では様々な音声を合成することが可能となっており、例えば合成した音声によって知人の音声を用いたなりすましや、著名人の音声の不正利用などの危険性が生じている。これらの犯罪を未然に防止するため、合成した音声に付加情報を埋め込み、不正利用を検知する需要が出てきている。例えば、付加情報の埋め込み方法としては、聴覚上のマスキング現象を利用した電子透かしの埋め込み法、量子化雑音に見せかけて電子透かしを埋め込む方法などが知られている。また、音声データのスペクトル分布の周波数振幅特性に付加情報信号を埋め込む方法などが存在する。
特開2006-171110号公報
岩切、松井「スペクトル拡散と変形離散コサイン変換による高品質デジタル音声のための電子透かし法」電子情報通信学会論文誌 Vol.39 No.9 1998
 しかしながら、固定電話や携帯電話などを通じた会話にあっては、元々音声に対して、コーデック歪みなどが生じることにより埋め込んだ透かしが消失しやすく、付加情報の検出が難しくなるという問題があった。
 本発明の実施形態は、上記に鑑みてなされたものであって、固定電話や携帯電話などの通話音声に対して、各種歪みに対して耐性を有し、付加情報の秘匿性に優れた電子透かしの埋め込み装置と、その検出装置を提供することを目的とする。
 上述した課題を解決し、目的を達成するために、本発明の実施形態は、入力された鍵乱数を用いて、電子透かしビットを埋め込む少なくとも1つの周波数帯域のペアである第1帯域、及び第2帯域を決定するフィルタを出力する生成部と、入力された音声信号の単位フレームに前記電子透かしビットを埋め込む場合に、前記第1帯域の振幅スペクトル強度和が、前記第2帯域の振幅スペクトル強度和より大きくなるよう、前記第1帯域、及び第2帯域の少なくとも一方の振幅スペクトル強度和を変更する埋め込み部と、を備えることを特徴とする。
実施形態に係る電子透かし埋め込み装置を例示するブロック図。 実施形態に係る電子透かし検出装置を例示するブロック図。 実施形態に係る埋め込み部での透かしの埋め込み方法を説明する図。 実施形態に係る生成部でのサブバンドフィルタの生成方法を説明する図。 実施形態の変形例に係る電子透かし埋め込み装置を例示するブロック図。 実施形態の変形例に係る電子透かし検出装置を例示するブロック図。 実施形態のハードウェア構成を示す図。
 以下、図面を参照しながら本実施形態の電子透かし埋め込み装置、及び検出装置について説明する。図1は、電子透かし埋め込み装置の機能構成を示すブロック図である。図1に示されるように、電子透かし埋め込み装置1は、抽出部101、変換適用部102、埋め込み部103、逆変換適用部104、再合成部105、及び生成部106を備える。電子透かし埋め込み装置1には、音声信号10と鍵乱数16が入力され、電子透かしを埋め込んだ合成音声15が出力される。
 抽出部101は、外部から入力された音声信号10を取得する。なお、音声信号10の入力は、例えばマイクなどの入力装置によって行われる。抽出部101は、音声信号10から単位時間毎に時間長2T(例えば、2T=64ミリ秒)の音声波形を切り出すことによって、時刻(t)での単位音声フレーム11を生成する。なお、以降の説明において、時間長2Tは分析窓幅とも呼ばれる。抽出部101は、時間長2Tの音声波形を切り出す処理とともに、切り出した音声波形の直流成分を除去する処理、切り出した音声波形の高周波成分を強調する処理、切り出した音声波形に窓関数(例えば、サイン窓)を乗算する処理などを行ってもよい。抽出部101は、単位音声フレーム11を変換適用部102へと出力する。
 変換適用部102は、抽出部101からの単位音声フレーム11を入力とする。変換適用部102は、単位音声フレーム11に直交変換を適用し周波数領域に射影する。直交変換には離散フーリエ変換、離散コサイン変換、修正離散コサイン変換、サイン変換、離散ウェーブレット変換などの変換方式を用いてもよい。変換適用部102は、直交変換適用後の単位フレーム12を埋め込み部103へと出力する。
 生成部106は、鍵乱数16を入力とする。生成部106は、入力された鍵乱数16によってサブバンドフィルタ17を生成する。サブバンドフィルタ17とは、電子透かしを埋め込む周波数の帯域であるP群とN群の幅を、乱数系列によってランダムに決定したフィルタである。本実施形態では、P群の帯域が第1帯域に、N群の帯域が第2帯域に相当し、単位フレーム12に1ビットの透かしビットを埋め込むことを可能にする。ただし、単位フレーム12に2ビット以上の透かしビットを埋め込む場合には、P群とN群は、2つのペア以上設定することが望ましい。なお、生成部106の処理フローは後述する。生成部106は、生成したサブバンドフィルタ17を埋め込み部103へと出力する。
 埋め込み部103は、変換適用部102からの単位フレーム12と、サブバンドフィルタ17とを入力とする。埋め込み部103は、単位フレーム12ごとに、サブバンドフィルタ17によって指定されたサブバンドに電子透かしを埋め込む。なお、電子透かしの埋め込み方法は後述する。埋め込み部103は、透かし入り単位フレーム13を逆変換適用部104へと出力する。
 逆変換適用部104は、埋め込み部103からの透かし入り単位フレーム13を入力とする。逆変換適用部104は、透かし入り単位フレーム13に逆直交変換を適用し時間領域に戻す。逆直交変換には、逆離散フーリエ変換、逆離散コサイン変換、逆修正離散コサイン変換、逆離散サイン変換、逆離散ウェーブレット変換などを用いてもよいが、変換適用部102で用いられた直交変換に対応する逆直交変換が望ましい。逆変換適用部104は、逆直交変換適用後の単位フレーム14を、再合成部105へと出力する。
 再合成部105は、逆変換適用部104からの逆直交変換適用後の単位フレーム14を入力とする。再合成部105は、逆直交変換適用後の単位フレーム14に対し、前後のフレームを重複させて和を取ることで、透かし入り合成音声15を生成する。なお、抽出部101において音声波形を切り出す以外の処理を行った場合には、それらと逆の処理を行うことが相応しい。すなわち、切り出した音声波形の直流成分を除去する処理を行った場合には、除去した直流成分を単位フレーム14に戻す処理、切り出した音声波形の高周波成分を強調する処理を行った場合には、強調された単位フレーム14の高周波成分を元に戻す処理、切り出した音声波形に窓関数を乗算した場合には、単位フレーム14に窓関数(例えば、サイン窓)を乗算する処理、などを行う。単位フレーム14の前後のフレームは、例えば分析窓長2Tの半分である時間長Tだけ重複させる。
 続いて、図1で示した電子透かし埋め込み装置1が埋め込んだ音声の電子透かしを検出する電子透かし検出装置2について図2を参照して説明する。図2に示されるように、電子透かし検出装置2は、抽出部101、変換適用部102、透かし検出部107、生成部106を備える。抽出部101、変換適用部102、生成部106は、図1で示した電子透かし埋め込み装置1と同様の構成である。電子透かし検出装置2は、透かし入り合成音声15と鍵乱数16とを入力し、入力された合成音声15に埋め込まれている透かしビット列18を出力する。そして、入力された透かし入り合成音声15は、抽出部101、及び変換適用部102を通じて、周波数領域に射影された単位フレーム12が抽出される。
 透かし検出部107は、変換適用部102からの単位フレーム12を入力とする。透かし検出部107は、単位フレーム12ごとに、サブバンドフィルタ17によって指定された周波数の帯域から透かし情報を取り出す。電子透かし情報の検出方法は後述する。透かし検出部107は、透かしビット列18を出力する。
 続いて、生成部106でのサブバンドフィルタの生成方法について述べる。サブバンドフィルタ生成部106は、電子透かし情報の秘匿性を向上させる役割を持つ。生成部106は、透かしを埋め込むデジタルデータ固有のサブバンドフィルタ17を生成する。サブバンドフィルタ17は、電子透かしを埋め込む周波数の帯域であるP群とN群の幅を、乱数系列によってランダムに決定したフィルタである。サブバンドフィルタ17は、図4に示されるような処理フローによって生成される。
 サブバンドフィルタ17は、まずK個(例えばK=21)の代表周波数ビンを決める。続いて、サブバンドフィルタ17は、これらの各代表周波数ビンが各帯域の内部に属するよう、K+1個の乱数系列によって各代表周波数ビンの代表周波数境界Eをランダムに決定する。例えば、入力された鍵乱数16を用いてK+1個の乱数系列を生成し、各乱数値によって代表周波数ビンの境界を決定する。
 サブバンドフィルタ17は、決定された各代表周波数ビンの代表周波数境界Eをサブバンド境界とみなし、サブバンドフィルタを生成する。代表周波数ビンの決め方としては、例えば全周波数ビンを線形に等分割し、それらの中心を選択する方法や、周波数軸をlogスケールで等分割しそれらの中心を選択する方法など、種々の方法が考えられる。なお、鍵乱数16によってサブバンド境界の異なるサブバンドフィルタを作成する処理は、上記のようにあらかじめ代表周波数ビンを決める方法以外でも可能である。
 例えば、
・電子透かしを埋め込む周波数の帯域の数だけ用意した乱数系列の値によって全周波数ビンの分割比を求め、サブバンド境界を決定する方法
・サブバンド境界の異なる複数のサブバンドフィルタをあらかじめ用意しておき、適用するサブバンドフィルタを鍵乱数16によって決定する方法
などが考えられる。
 そして、このようにして生成された帯域のうち、実際にP群とN群として設定された周波数帯域を含むものが埋め込み部103によって選択される。
 次に、埋め込み部103における電子透かしの埋め込み方法を図3に示す。図3の左図は、変換適用部102から出力された単位フレーム12を表している。横軸は周波数、縦軸は振幅スペクトルの強度を表している。本実施形態では、図3においてP群とN群という2種類の帯域を設定する。帯域には少なくとも2つ以上隣接した周波数ビンが含まれる。P群とN群の設定方法として、図4で示したように予め全周波数帯域を特定のルールに基づいて指定個数の帯域に分割した後に、得られた帯域の中から選択してもよい。また、P群とN群は全ての単位フレーム12において同一のものを設定しても良いし、単位フレーム12ごとに変更してもよい。
 電子透かしによる付加情報として、各単位フレーム12に1ビットの透かしビット{0、1}を埋め込む。ある時刻tにおけるk番目の周波数ビンWの振幅スペクトル強度を|X(W)|、P群に属する全周波数ビンの集合をΩとした時、P群に属する全周波数ビンの振幅スペクトル強度和は以下の数式1で表せる。
Figure JPOXMLDOC01-appb-M000001
 同様に、N群に属する全周波数ビンの振幅スペクトル強度和をS(t)と、P群に属する全周波数ビンの振幅スペクトル強度和をS(t)表す。この時、以下の式を満たすように埋め込む透かしビットに応じてS(t)とS(t)の大小関係を変更する。
 透かしビット“1”を埋め込むならばS(t)≧S(t)
 透かしビット“0”を埋め込むならばS(t)<S(t)
 例として、全単位フレーム12に電子透かしビット“1”を埋め込むケースを考える。全ての単位フレーム12で透かしビット“1”を埋め込むならば、全単位フレームで振幅スペクトル強度和の大小関係がS(t)≧S(t)となるように各周波数ビンの強度を変更する。例えば、図3の右下に示されるように、P群に属する全周波数ビンの振幅スペクトル強度を増加させ、かつN群に属する全周波数ビンの振幅スペクトル強度のみを減少させる方法が考えられる。振幅スペクトル強度の増加値もしくは減少値は、聴覚心理モデルを用いて、各周波数ビンに応じて知覚されにくい値を設定する方法が望ましい。なお、上記では全ての単位フレーム12に透かしを埋め込む方法を例示したが、透かしを埋め込まない単位フレーム12があってもよい。なお、透かしを埋め込まない場合、透かし検出処理を行うと、単位フレーム12の帯域が必ずどちらかの式を満たすため、検出されたビット列は{0、1}がほぼ等確率でランダムに出現する傾向がある。したがって、電子透かしを埋め込むためには、“00000・・・”や“01010・・・”など、単位フレームごとに何らかの規則性を持たせたビット配列を埋め込むことが望ましい。埋め込まれる透かしビットの配列は予め決められていてもよいし、特定のアルゴリズムに従い自動で生成されるようにしてもよいが、電子透かし埋め込み装置1で埋め込んだ透かしを電子透かし検出装置2で検出するためには、双方に共通の透かしビット配列を用いる必要がある。
 次に、透かし検出部107における電子透かし(付加情報)の検出方法について述べる。本実施形態における透かし検出処理は、単位フレーム12ごとに、入力されたサブバンドフィルタ17によって指定された帯域であるP群とN群から、埋め込まれた1ビットを取り出す処理である。なお、P群とN群のペアが2つ以上ある場合には、以降の透かし検出処理をそのペアごとに行い、埋め込まれた2つ以上の透かしビットを取り出すものとする。P群に属する周波数ビンの振幅スペクトル強度和をS(t)、N群に属する周波数ビンの振幅スペクトル強度和をS(t)とした場合に、以下の式にしたがって、S(t)とS(t)を用いて埋め込まれたビットを検出する。
 S(t)≧S(t)ならば埋め込まれた透かしビットは“1”
 S(t)<S(t)ならば埋め込まれた透かしビットは“0”
 すなわち、P群とN群という各帯域の振幅スペクトル強度和の大小関係により、埋め込まれた1ビットの透かしを抽出する方法を取っている。そのため、電子透かし検出装置2において、電子透かし埋め込み装置1において用いられたものと同様の鍵乱数16を持っておらずP群とN群のサブバンド境界が分からなければ、振幅スペクトル強度和の大小比較を行っても透かしビットを正確に検出することが困難になる。
 ここで、従来の電子透かしの埋め込み方式について説明する。代表的な手法の一つとして、特定周波数ビンの振幅スペクトル強度を変更する方法が挙げられる。この手法にあっては、修正離散コサイン変換(Modified Discrete Cosine Transform:MDCT)により算出された各単位音声フレームに対し、埋め込む透かしビット{0、1}に応じて、特定周波数ビンのMDCT係数(振幅スペクトル強度)を変更する。透かしビット{0、1}に応じてMDCT係数を量子化することで、各単位音声フレームに1ビットの付加情報を埋め込んでいる。
 この方式では、特定周波数ビンにのみ透かしを埋め込んでいるため埋め込み効率が高いという利点があるものの、耐雑音性が比較的弱いという欠点がある。しかし耐雑音性向上のために量子化幅を大きくして透かしの強度を上げると、特定周波数ビンの値が大きく変化するため、電子透かしの知覚不可能性が低下する原因となる。
 また、耐雑音性を改善した方法の一つとして、各単位フレームにおいて2つの周波数ビンの集合を選択し、各帯域における振幅スペクトル強度和の大小関係によって透かしビット{0、1}を定義する方法がある。この方法では、各単位フレームにおいて、ある帯域に含まれる複数の周波数ビンを偶数番目と奇数番目に分け、透かしビットに“1”を埋め込む場合には偶数番目の振幅スペクトル強度和が、奇数番目のそれよりも大きくし、透かしビットに“0”を埋め込む場合には小さくする、と定義している。周波数ビンごとに振幅スペクトル強度を変更するよりも、このように帯域単位で変更することで、加法性雑音や乗法性歪みなどにも比較的頑健に付加情報を埋め込むことが可能となる。
 しかしながら、この場合埋め込まれた透かし情報の秘匿性が低いという欠点がある。すなわち、クラッカーによって透かし情報が埋め込まれている帯域(P群とN群)の情報が漏洩した場合、透かし情報の不正取得が可能になることを意味している。そこで秘匿性を向上させる代表的な手法の一つとして、以下の方法が従来採られている。
 具体的には、各単位フレームにおいてMDCT係数を変更する際に、鍵乱数から抽出した乱数値に応じて1つまたは複数個の周波数ビンを選択し、選択された周波数ビンのMDCT係数を変更する。この方法を使えば、クラッカーが鍵乱数を取得しない限り、透かし情報の取得は困難となる。
 しかし、鍵乱数によって埋め込む周波数ビンを選択する方法では、電子透かしの知覚不可能性が低下する可能性がある。MPEGなどのメディア圧縮技術に多用されている聴覚心理モデルによれば、人間の聴覚には聴き取りやすい周波数帯域とそうでない帯域があるため、鍵乱数によってランダムで選択された周波数ビンが人間に聴き取られやすい周波数帯である可能性は否定できない。
 これらの従来の電子透かしの埋め込み、及び検出方法と比較して、本実施形態においては以下の点で優位性を備えている。すなわち、特定周波数ビンに透かしを埋め込むのではなく、複数の帯域に電子透かしを埋め込むことで、耐雑音性が向上し、固定電話や携帯電話などのコーデック歪み、加法性雑音、乗法性歪みなどへの耐性が向上する。
 また、電子透かしを埋め込む帯域を決定するために鍵乱数を用いているため、透かし情報が埋め込まれている帯域の情報が漏洩しても、第三者による情報の不正取得の可能性を低く抑えることができる。また、埋め込まれる電子透かしは、複数帯域での各振幅スペクトル強度和の大小比較によって定義される。そのため、鍵乱数が異なれば透かしの埋め込まれる帯域幅が異なり、振幅スペクトル強度和も異なるため、埋め込まれた透かしを正確に取り出すことは困難になる。
 さらには、電子透かしの知覚不可能性が高い。乱数系列によって透かしを埋め込む周波数ビン(もしくは帯域)を決定する従来の方法では、乱数系列によって人間の聴き取りやすい周波数帯域が選択される可能性がある。一方、本実施形態では人間が聴き取りにくい周波数帯域の代表周波数ビンを指定しているため、乱数系列によって電子透かしの知覚不可能性が大きく劣化することは無い。
 (変形例)
 本実施形態では、鍵乱数を用いてサブバンドフィルタを生成することとしたが、更に秘匿性を高めるために、サブバンドフィルタ制御部508を設けることもできる。図5に示されるように、電子透かし埋め込み装置3は、上記実施形態で示した構成に加えて、サブバンドフィルタ制御部508を備える。生成部506は、入力された鍵乱数16によって1つまたは複数のサブバンドフィルタ57を生成し、サブバンドフィルタ制御部508へと出力する。サブバンドフィルタ制御部508は、生成部506からの1つまたは複数のサブバンドフィルタ57を入力とする。サブバンドフィルタ制御部508は、各単位フレーム12において、適用する1つのサブバンドフィルタ58を出力する。
 サブバンドフィルタ制御部508は、各単位フレーム12において透かしを埋め込む際に、1つまたは複数のサブバンドフィルタの中で適用するものを1つ選択する。選択方法には種々の方法があり得るが、例えばNフレームごとにサブバンドフィルタを変更する方法(Nは1以上の整数)などが考えられる。なお、ある単位フレーム12に電子透かしを埋め込まないためには、サブバンドフィルタ制御部508において、サブバンドフィルタを適用しない制御信号を出力してもよい。
 なお、このように適用されるサブバンドフィルタが、単位フレーム12ごとに選択される場合、図6に示されるように、電子透かし検出装置4にも、同様のサブバンドフィルタ制御部508が設けられる。サブバンドフィルタ制御部508は、電子透かし埋め込み装置3と同様のアルゴリズムに従い、検出対象の単位フレーム12に対して、サブバンドフィルタを適用する。
 以上の構成によれば、鍵乱数を用いて生成した1つまたは複数のサブバンドフィルタを選択し、各単位フレーム12に適用することができ、適用されるサブバンドフィルタの秘匿性を向上させることが可能になる。
 次に、各実施形態にかかる電子透かし埋め込み装置、および検出装置のハードウェア構成について図7を用いて説明する。図7は、実施形態にかかる電子透かし埋め込み装置、および検出装置のハードウェア構成を示す説明図である。
 実施形態にかかる電子透かし埋め込み装置、および検出装置は、CPU(Central Processing Unit)51などの制御装置と、ROM(Read Only Memory)52やRAM(Random Access Memory)53などの記憶装置と、ネットワークに接続して通信を行う通信I/F54と、各部を接続するバス61を備えている。
 実施形態にかかる電子透かし埋め込み装置、および検出装置で実行されるプログラムは、ROM52等に予め組み込まれて提供される。
 実施形態にかかる電子透かし埋め込み装置、および検出装置で実行されるプログラムは、インストール可能な形式または実行可能な形式のファイルでCD-ROM(Compact Disk Read Only Memory)、フレキシブルディスク(FD)、CD-R(Compact Disk Recordable)、DVD(Digital Versatile Disk)等のコンピュータで読み取り可能な記録媒体に記録してコンピュータプログラムプロダクトとして提供されるように構成してもよい。
 さらに、実施形態にかかる電子透かし埋め込み装置、および検出装置で実行されるプログラムを、インターネット等のネットワークに接続されたコンピュータ上に格納し、ネットワーク経由でダウンロードさせることにより提供するように構成してもよい。また、実施形態にかかる電子透かし埋め込み装置、および検出装置で実行されるプログラムをインターネット等のネットワーク経由で提供または配布するように構成してもよい。
 実施形態にかかる電子透かし埋め込み装置、および検出装置で実行されるプログラムは、コンピュータを上述した各部として機能させうる。このコンピュータは、CPU51がコンピュータ読取可能な記憶媒体からプログラムを主記憶装置上に読み出して実行することができる。
 なお、本実施形態は、上記実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化することができる。また、上記実施形態に開示されている複数の構成要素の適宜な組み合わせにより、種々の発明を形成することができる。例えば、実施形態に示される全構成要素からいくつかの構成要素を削除してもよい。さらに、異なる実施形態にわたる構成要素を適宜組み合わせてもよい。
 1 電子透かし埋め込み装置
 2 電子透かし検出装置
 3 電子透かし埋め込み装置
 4 電子透かし検出装置
 10 音声信号
 11 単位音声フレーム
 12 単位フレーム
 13 透かし入り単位フレーム
 14 単位フレーム
 15 合成音声
 16 鍵乱数
 17 サブバンドフィルタ
 18 透かしビット列
 57 サブバンドフィルタ
 58 サブバンドフィルタ
 101 抽出部
 102 変換適用部
 103 埋め込み部
 104 逆変換適用部
 105 再合成部
 106 サブバンドフィルタ生成部
 107 透かし検出部
 506 生成部
 508 サブバンドフィルタ制御部

Claims (10)

  1.  入力された鍵乱数を用いて、電子透かしビットを埋め込む少なくとも1つの周波数帯域のペアである第1帯域、及び第2帯域を決定するフィルタを出力する生成部と、
     入力された音声信号の単位フレームに前記電子透かしビットを埋め込む場合に、前記第1帯域の振幅スペクトル強度和が、前記第2帯域の振幅スペクトル強度和より大きくなるよう、前記第1帯域、及び第2帯域の少なくとも一方の振幅スペクトル強度和を変更する埋め込み部と、
     を備える電子透かし埋め込み装置。
  2.  前記埋め込み部は、前記第1帯域、及び第2帯域における前記振幅スペクトル強度和の増減幅を、各周波数ビンに応じて知覚されにくい値に設定する
     ことを特徴とする請求項1に記載の電子透かし埋め込み装置。
  3.  前記電子透かしビットを、規則性を有するように配列する
     ことを特徴とする請求項1に記載の電子透かし埋め込み装置。
  4.  前記生成部は、複数の前記フィルタを出力し、
     前記単位フレームごとに、適用する前記フィルタを選択する制御部と、
     を更に備えることを特徴とする請求項1に記載の電子透かし埋め込み装置。
  5.  入力された鍵乱数を用いて、電子透かしビットを埋め込んだ少なくとも1つの周波数帯域のペアである第1帯域、及び第2帯域を決定するフィルタを出力する生成部と、
     入力された音声信号の単位フレームにおいて、適用された前記フィルタに基づいて指定される前記第1帯域の振幅スペクトル強度和と、前記第2帯域の振幅スペクトル強度和とを比較し、大小関係から、前記単位フレームに埋め込まれた前記電子透かしビットを検出する透かし検出部と、
     を備える電子透かし検出装置。
  6.  前記生成部は、複数の前記フィルタを出力し、
     前記単位フレームごとに、適用する前記フィルタを選択する制御部と、
     を更に備えることを特徴とする請求項5に記載の電子透かし検出装置。
  7.  入力された鍵乱数を用いて、電子透かしビットを埋め込む少なくとも1つの周波数帯域のペアである第1帯域、及び第2帯域を決定するフィルタを出力する生成ステップと、
     入力された音声信号の単位フレームに前記電子透かしビットを埋め込む場合に、前記第1帯域の振幅スペクトル強度和が、前記第2帯域の振幅スペクトル強度和より大きくなるよう、前記第1帯域、及び第2帯域の少なくとも一方の振幅スペクトル強度和を変更する埋め込みステップと、
     を含む電子透かし埋め込み方法。
  8.  入力された鍵乱数を用いて、電子透かしビットを埋め込んだ少なくとも1つの周波数帯域のペアである第1帯域、及び第2帯域を決定するフィルタを出力する生成ステップと、
     入力された音声信号の単位フレームにおいて、適用された前記フィルタに基づいて指定される前記第1帯域の振幅スペクトル強度和と、前記第2帯域の振幅スペクトル強度和とを比較し、大小関係から、前記単位フレームに前記電子透かしビットが埋め込まれているか否かを検出する検出ステップと、
     を含む電子透かし検出方法。
  9.  コンピュータに、
     入力された鍵乱数を用いて、電子透かしビットを埋め込む少なくとも1つの周波数帯域のペアである第1帯域、及び第2帯域を決定するフィルタを出力する生成ステップと、
     入力された音声信号の単位フレームに前記電子透かしビットを埋め込む場合に、前記第1帯域の振幅スペクトル強度和が、前記第2帯域の振幅スペクトル強度和より大きくなるよう、前記第1帯域、及び第2帯域の少なくとも一方の振幅スペクトル強度和を変更する埋め込みステップと、
     を実行させるための電子透かし埋め込みプログラム。
  10.  コンピュータに、
     入力された鍵乱数を用いて、電子透かしビットを埋め込んだ少なくとも1つの周波数帯域のペアである第1帯域、及び第2帯域を決定するフィルタを出力する生成ステップと、
     入力された音声信号の単位フレームにおいて、適用された前記フィルタに基づいて指定される前記第1帯域の振幅スペクトル強度和と、前記第2帯域の振幅スペクトル強度和とを比較し、大小関係から、前記単位フレームに前記電子透かしビットが埋め込まれているか否かを検出する検出ステップと、
     を実行させるための電子透かし検出プログラム。
PCT/JP2013/066109 2013-06-11 2013-06-11 電子透かし埋め込み装置、電子透かし検出装置、電子透かし埋め込み方法、電子透かし検出方法、電子透かし埋め込みプログラム、及び電子透かし検出プログラム WO2014199449A1 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
PCT/JP2013/066109 WO2014199449A1 (ja) 2013-06-11 2013-06-11 電子透かし埋め込み装置、電子透かし検出装置、電子透かし埋め込み方法、電子透かし検出方法、電子透かし埋め込みプログラム、及び電子透かし検出プログラム
CN201380077328.7A CN105283915B (zh) 2013-06-11 2013-06-11 数字水印嵌入装置及方法以及数字水印检测装置及方法
JP2015522297A JP6316288B2 (ja) 2013-06-11 2013-06-11 電子透かし埋め込み装置、電子透かし検出装置、電子透かし埋め込み方法、電子透かし検出方法、電子透かし埋め込みプログラム、及び電子透かし検出プログラム
US14/964,038 US10424310B2 (en) 2013-06-11 2015-12-09 Digital watermark embedding device, digital watermark detecting device, digital watermark embedding method, digital watermark detecting method, computer-readable recording medium containing digital watermark embedding program, and computer-readable recording medium containing digital watermark detecting program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/JP2013/066109 WO2014199449A1 (ja) 2013-06-11 2013-06-11 電子透かし埋め込み装置、電子透かし検出装置、電子透かし埋め込み方法、電子透かし検出方法、電子透かし埋め込みプログラム、及び電子透かし検出プログラム

Related Child Applications (1)

Application Number Title Priority Date Filing Date
US14/964,038 Continuation US10424310B2 (en) 2013-06-11 2015-12-09 Digital watermark embedding device, digital watermark detecting device, digital watermark embedding method, digital watermark detecting method, computer-readable recording medium containing digital watermark embedding program, and computer-readable recording medium containing digital watermark detecting program

Publications (1)

Publication Number Publication Date
WO2014199449A1 true WO2014199449A1 (ja) 2014-12-18

Family

ID=52021785

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2013/066109 WO2014199449A1 (ja) 2013-06-11 2013-06-11 電子透かし埋め込み装置、電子透かし検出装置、電子透かし埋め込み方法、電子透かし検出方法、電子透かし埋め込みプログラム、及び電子透かし検出プログラム

Country Status (4)

Country Link
US (1) US10424310B2 (ja)
JP (1) JP6316288B2 (ja)
CN (1) CN105283915B (ja)
WO (1) WO2014199449A1 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017016363A1 (zh) * 2015-07-27 2017-02-02 李庆成 数字音频信号处理的方法

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP4336496A1 (en) * 2022-09-08 2024-03-13 Utopia Music AG Digital data embedding and extraction in music and other audio signals
CN115910080B (zh) * 2023-01-09 2023-06-02 北京承启通科技有限公司 一种通信音频数字水印写入、读取方法及装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000172282A (ja) * 1998-09-29 2000-06-23 Internatl Business Mach Corp <Ibm> オ―ディオデ―タへ付加情報を埋め込む方法およびシステム
JP2003143390A (ja) * 2001-11-02 2003-05-16 Kowa Co 電子透かしの埋め込みおよび抽出
JP2006171110A (ja) * 2004-12-13 2006-06-29 Amk:Kk 音声データへの付加情報埋め込み方法、音声データからの付加情報埋読み取り方法及びそれらの装置
JP2006330256A (ja) * 2005-05-25 2006-12-07 Kddi Corp オーディオ信号に対する電子透かし埋込み方法および検出方法
JP2008529046A (ja) * 2005-01-21 2008-07-31 アンリミテッド メディア ゲーエムベーハー 電子透かしを有用信号に埋め込む方法
JP2013101284A (ja) * 2011-11-10 2013-05-23 Fujitsu Ltd 音データ送受信システム、送信装置、受信装置、音データ送信方法及び受信方法

Family Cites Families (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1022895A3 (en) * 1999-01-22 2001-04-04 Matsushita Electric Industrial Co., Ltd. Apparatus for and method of embedding and extracting digital information, and medium having program for carrying out the method recorded thereon
US6385329B1 (en) * 2000-02-14 2002-05-07 Digimarc Corporation Wavelet domain watermarks
JP2002244685A (ja) 2001-02-22 2002-08-30 Kowa Co 電子透かしの埋め込みおよび検出
KR20040066165A (ko) * 2001-12-14 2004-07-23 코닌클리케 필립스 일렉트로닉스 엔.브이. 멀티미디어 신호들의 양자화 인덱스 변조(큐아이엠)디지털 워터마킹
US6904151B2 (en) * 2002-01-17 2005-06-07 Deguillaume Frederic Method for the estimation and recovering of general affine transform
JP4357791B2 (ja) 2002-03-29 2009-11-04 株式会社東芝 電子透かし入り音声合成システム、合成音声の透かし情報検出システム及び電子透かし入り音声合成方法
CN1148961C (zh) * 2002-04-30 2004-05-05 中山大学 一种数字水印的嵌入方法
EP1553775A4 (en) * 2002-07-29 2007-07-11 Ibm DEVICE AND METHOD FOR GENERATING WATERMARK SIGNALS, COMPUTER-EXECUTABLE PROGRAM FOR EXECUTING THE METHOD OF GENERATING WATERMARK SIGNALS, COMPUTER-READABLE RECORDING MEDIUM CONTAINING THE RECORDED PROGRAM, DIGITAL WATERPROGRAMMING DEVICE, AND TEL STATION
KR100492743B1 (ko) * 2003-04-08 2005-06-10 주식회사 마크애니 신호의 특성값의 양자화에 의한 워터마크 삽입 및 검출방법
KR100556848B1 (ko) * 2003-05-13 2006-03-10 엘지전자 주식회사 디지털 워터마킹을 이용한 동영상 부호화/복호화 장치 및방법
KR100554680B1 (ko) * 2003-08-20 2006-02-24 한국전자통신연구원 크기 변화에 강인한 양자화 기반 오디오 워터마킹 장치 및방법
TWI228376B (en) * 2003-12-23 2005-02-21 Ind Tech Res Inst Watermark encoding method and recording medium thereof
JP2006251676A (ja) * 2005-03-14 2006-09-21 Akira Nishimura 振幅変調を用いた音響信号への電子透かしデータの埋め込み・検出装置
JP4343179B2 (ja) * 2006-02-17 2009-10-14 株式会社東芝 電子透かし検出方法及び装置
FR2918239A1 (fr) * 2007-06-29 2009-01-02 Thomson Licensing Sas Procede de selection de pixels d'image a tatouer et procede de tatouage utilisant cette selection
WO2011052992A2 (ko) * 2009-10-29 2011-05-05 엘지전자 주식회사 컨텐트에 워터마크를 삽입하고 삽입된 워터마크를 검출하는 방법 및 장치
CN201965906U (zh) * 2010-04-01 2011-09-07 北京邮电大学 适用于数字水印技术的语音信号处理装置
US9401153B2 (en) * 2012-10-15 2016-07-26 Digimarc Corporation Multi-mode audio recognition and auxiliary data encoding and decoding
CN103778918B (zh) * 2012-10-26 2016-09-07 华为技术有限公司 音频信号的比特分配的方法和装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000172282A (ja) * 1998-09-29 2000-06-23 Internatl Business Mach Corp <Ibm> オ―ディオデ―タへ付加情報を埋め込む方法およびシステム
JP2003143390A (ja) * 2001-11-02 2003-05-16 Kowa Co 電子透かしの埋め込みおよび抽出
JP2006171110A (ja) * 2004-12-13 2006-06-29 Amk:Kk 音声データへの付加情報埋め込み方法、音声データからの付加情報埋読み取り方法及びそれらの装置
JP2008529046A (ja) * 2005-01-21 2008-07-31 アンリミテッド メディア ゲーエムベーハー 電子透かしを有用信号に埋め込む方法
JP2006330256A (ja) * 2005-05-25 2006-12-07 Kddi Corp オーディオ信号に対する電子透かし埋込み方法および検出方法
JP2013101284A (ja) * 2011-11-10 2013-05-23 Fujitsu Ltd 音データ送受信システム、送信装置、受信装置、音データ送信方法及び受信方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2017016363A1 (zh) * 2015-07-27 2017-02-02 李庆成 数字音频信号处理的方法

Also Published As

Publication number Publication date
CN105283915B (zh) 2019-05-07
JP6316288B2 (ja) 2018-04-25
JPWO2014199449A1 (ja) 2017-02-23
US10424310B2 (en) 2019-09-24
US20160093309A1 (en) 2016-03-31
CN105283915A (zh) 2016-01-27

Similar Documents

Publication Publication Date Title
EP1814105B1 (en) Audio processing
Delforouzi et al. Adaptive digital audio steganography based on integer wavelet transform
US8032361B2 (en) Audio processing apparatus and method for processing two sampled audio signals to detect a temporal position
Bhat K et al. A new audio watermarking scheme based on singular value decomposition and quantization
Dhar et al. Blind SVD-based audio watermarking using entropy and log-polar transformation
CN102142255B (zh) 一种在音频信号中嵌入及提取数字水印的方法
Lalitha et al. DWT—Arnold Transform based audio watermarking
CN113782041A (zh) 一种基于音频变频域的嵌入和定位水印的方法
JP6316288B2 (ja) 電子透かし埋め込み装置、電子透かし検出装置、電子透かし埋め込み方法、電子透かし検出方法、電子透かし埋め込みプログラム、及び電子透かし検出プログラム
Budiman et al. QIM-based audio watermarking with combined techniques of SWT-DST-QR-CPT using SS-based synchronization
Attari et al. Robust audio watermarking algorithm based on DWT using Fibonacci numbers
Zhao et al. A robust audio watermarking algorithm based on SVD-DWT
Gupta Banik et al. Blind key based attack resistant audio steganography using cocktail party effect
Kanhe et al. A QIM-based energy modulation scheme for audio watermarking robust to synchronization attack
KR101201076B1 (ko) 오디오 워터마크 삽입장치 및 방법, 그리고, 오디오 워터마크 검출장치 및 방법
Zhang et al. Robust and transparent audio watermarking based on improved spread spectrum and psychoacoustic masking
Pooyan et al. Adaptive and robust audio watermarking in wavelet domain
Singh et al. Multiplicative watermarking of audio in DFT magnitude
Khalil et al. Informed audio watermarking based on adaptive carrier modulation
Attari et al. Robust and blind audio watermarking in wavelet domain
El-Khamy et al. Chaos-based image hiding scheme between silent intervals of high quality audio signals using feature extraction and image bits spreading
Singh et al. Multiplicative Watermarking of Audio in Spectral Domain
Patila et al. Adaptive Audio Watermarking techniques: A literature Review
Koz et al. Adaptive selection of embedding locations for spread spectrum watermarking of compressed audio
Garlapati et al. A symbol based watermarking approach for spread spectrum audio watermarking methods

Legal Events

Date Code Title Description
WWE Wipo information: entry into national phase

Ref document number: 201380077328.7

Country of ref document: CN

121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 13886871

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 2015522297

Country of ref document: JP

Kind code of ref document: A

NENP Non-entry into the national phase

Ref country code: DE

122 Ep: pct application non-entry in european phase

Ref document number: 13886871

Country of ref document: EP

Kind code of ref document: A1