JP6193395B2 - 電子透かし検出装置、方法及びプログラム - Google Patents
電子透かし検出装置、方法及びプログラム Download PDFInfo
- Publication number
- JP6193395B2 JP6193395B2 JP2015546269A JP2015546269A JP6193395B2 JP 6193395 B2 JP6193395 B2 JP 6193395B2 JP 2015546269 A JP2015546269 A JP 2015546269A JP 2015546269 A JP2015546269 A JP 2015546269A JP 6193395 B2 JP6193395 B2 JP 6193395B2
- Authority
- JP
- Japan
- Prior art keywords
- phase
- digital watermark
- detection apparatus
- watermark detection
- audio signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000001514 detection method Methods 0.000 title claims description 44
- 238000000034 method Methods 0.000 title description 26
- 230000005236 sound signal Effects 0.000 claims description 28
- 238000004458 analytical method Methods 0.000 claims description 27
- 238000000819 phase cycle Methods 0.000 claims description 18
- 238000000605 extraction Methods 0.000 claims description 15
- 238000010183 spectrum analysis Methods 0.000 claims description 2
- 230000015572 biosynthetic process Effects 0.000 description 14
- 238000003786 synthesis reaction Methods 0.000 description 14
- 238000012986 modification Methods 0.000 description 12
- 230000004048 modification Effects 0.000 description 12
- 238000010586 diagram Methods 0.000 description 9
- 239000000284 extract Substances 0.000 description 7
- 238000004364 calculation method Methods 0.000 description 5
- 238000005516 engineering process Methods 0.000 description 3
- 210000001260 vocal cord Anatomy 0.000 description 3
- 238000001914 filtration Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 1
- 230000001755 vocal effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/018—Audio watermarking, i.e. embedding inaudible data in the audio signal
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/48—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use
- G10L25/51—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 specially adapted for particular use for comparison or discrimination
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/78—Detection of presence or absence of voice signals
- G10L25/87—Detection of discrete points within a voice signal
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L25/00—Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
- G10L25/90—Pitch determination of speech signals
Landscapes
- Engineering & Computer Science (AREA)
- Computational Linguistics (AREA)
- Signal Processing (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Editing Of Facsimile Originals (AREA)
Description
次に、電子透かし検出装置1の変形例について説明する。図5は、電子透かし検出装置1の変形例の構成を例示するブロック図である。電子透かし検出装置1の変形例は、残差信号抽出部101、有声区間推定部202、記憶部103、位相推定部204及び透かし判定部105を有する。なお、図5に示した電子透かし検出装置1の変形例において、図1に示した電子透かし検出装置1を構成する部分と実質的に同一の部分には同一の符号が付してある。
Claims (16)
- 音声信号から残差信号を抽出する残差信号抽出部と、
前記音声信号に基づいて有声区間を推定する有声区間推定部と、
予め複数の異なる位相に変調された複数のパルス信号を記憶する記憶部と、
前記有声区間を予め定められた長さの分析フレームごとに切り出し、前記分析フレームにおける前記残差信号と、前記複数のパルス信号とのパターンマッチングを行うことにより、前記音声信号の位相を推定する位相推定部と、
前記位相推定部が推定した位相の系列に基づいて、前記音声信号における電子透かしの有無を判定する透かし判定部と、
を有する電子透かし検出装置。 - 前記有声区間推定部は、
前記残差信号のパルス間隔を用いて有声区間を推定する
請求項1に記載の電子透かし検出装置。 - 前記残差信号抽出部は、
線形予測係数分析、部分自己相関係数分析、又は線スペクトル分析を用いて残差信号を抽出する
請求項1に記載の電子透かし検出装置。 - 前記有声区間推定部は、
前記音声信号の基本周波数の逆数と同じ周期で有効な有声区間を推定し、
前記位相推定部は、
前記有効な有声区間を前記分析フレームとして切り出してパターンマッチングを行うことにより、前記音声信号の位相を推定する
請求項1に記載の電子透かし検出装置。 - 前記有声区間推定部は、
前記残差信号の振幅値が所定の閾値以上である場合に、前記残差信号それぞれの時刻に対応する時刻系列を生成し、前記時刻系列に基づいて有声区間を推定する
請求項2に記載の電子透かし検出装置。 - 前記記憶部は、
−πからπまでの位相を複数の位相値に量子化して変調された複数のパルス信号を記憶する
請求項1に記載の電子透かし検出装置。 - 前記位相推定部は、
前記残差信号により定まるピッチマークそれぞれを中心とする前記分析フレームごとにパターンマッチングを行うことにより、前記音声信号の位相系列を推定する
請求項1に記載の電子透かし検出装置。 - 前記位相推定部は、
先頭ピッチマークの位相を推定した後、ピッチマークごとにパターンマッチングを行うことにより、前記音声信号の位相系列を推定する
請求項1に記載の電子透かし検出装置。 - 前記位相推定部は、
前記分析フレーム内で前記残差信号の振幅が最大となる時刻、又は前記分析フレーム内で前記残差信号の傾きの絶対値が最大となる時刻に基づいて、前記先頭ピッチマークを決定する
請求項8に記載の電子透かし検出装置。 - 前記位相推定部は、
前記残差信号により定まるピッチマークそれぞれを中心とする前記分析フレームごとにパターンマッチングを行うことにより、前記音声信号の位相系列を推定する
請求項8に記載の電子透かし検出装置。 - 前記位相推定部は、
時間領域波形に対してパターンマッチングを行う
請求項1に記載の電子透かし検出装置。 - 前記位相推定部は、
前記残差信号に対する相関係数が最大となる前記複数のパルス信号のいずれかの位相値を前記音声信号の位相として推定する
請求項11に記載の電子透かし検出装置。 - 前記位相推定部は、
前記残差信号に対する振幅値の差分が最小となる前記複数のパルス信号のいずれかの位相値を前記音声信号の位相として推定する
請求項11に記載の電子透かし検出装置。 - 前記透かし判定部は、
前記位相推定部が推定した位相の傾きの最頻値に基づいて、前記音声信号における電子透かしの有無を判定する
請求項11に記載の電子透かし検出装置。 - 音声信号から残差信号を抽出する工程と、
前記音声信号に基づいて有声区間を推定する工程と、
前記有声区間を予め定められた長さの分析フレームごとに切り出し、前記分析フレームにおける前記残差信号と、予め複数の異なる位相に変調された複数のパルス信号とのパターンマッチングを行うことにより、前記音声信号の位相を推定する工程と、
推定した位相の系列に基づいて、前記音声信号における電子透かしの有無を判定する工程と、
を含む電子透かし検出方法。 - 音声信号から残差信号を抽出するステップと、
前記音声信号に基づいて有声区間を推定するステップと、
前記有声区間を予め定められた長さの分析フレームごとに切り出し、前記分析フレームにおける前記残差信号と、予め複数の異なる位相に変調された複数のパルス信号とのパターンマッチングを行うことにより、前記音声信号の位相を推定するステップと、
推定した位相の系列に基づいて、前記音声信号における電子透かしの有無を判定するステップと、
をコンピュータに実行させるための電子透かし検出プログラム。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/JP2013/080466 WO2015068310A1 (ja) | 2013-11-11 | 2013-11-11 | 電子透かし検出装置、方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2015068310A1 JPWO2015068310A1 (ja) | 2017-03-09 |
JP6193395B2 true JP6193395B2 (ja) | 2017-09-06 |
Family
ID=53041110
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2015546269A Active JP6193395B2 (ja) | 2013-11-11 | 2013-11-11 | 電子透かし検出装置、方法及びプログラム |
Country Status (3)
Country | Link |
---|---|
US (1) | US9747907B2 (ja) |
JP (1) | JP6193395B2 (ja) |
WO (1) | WO2015068310A1 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2014199450A1 (ja) * | 2013-06-11 | 2014-12-18 | 株式会社東芝 | 電子透かし埋め込み装置、電子透かし埋め込み方法、及び電子透かし埋め込みプログラム |
US10347247B2 (en) | 2016-12-30 | 2019-07-09 | Google Llc | Modulation of packetized audio signals |
KR102067979B1 (ko) * | 2017-12-01 | 2020-01-21 | 웰빙소프트 주식회사 | 심전도 측정 장치 |
CN108053360B (zh) * | 2017-12-18 | 2021-06-15 | 辽宁师范大学 | 基于多相关hmt模型的数字图像水印检测方法 |
Family Cites Families (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
GB9500285D0 (en) * | 1995-01-07 | 1995-03-01 | Central Research Lab Ltd | A method of labelling an audio signal |
JP2002169579A (ja) * | 2000-12-01 | 2002-06-14 | Takayuki Arai | オーディオ信号への付加データ埋め込み装置及びオーディオ信号からの付加データ再生装置 |
JP2003044067A (ja) * | 2001-08-03 | 2003-02-14 | Univ Tohoku | 位相の周期偏移によるディジタルデータの埋めこみ・検出装置 |
CN100505061C (zh) * | 2002-03-28 | 2009-06-24 | 皇家飞利浦电子股份有限公司 | 生成、嵌入和检测水印信号的方法和设备 |
GB0710211D0 (en) | 2007-05-29 | 2007-07-11 | Intrasonics Ltd | AMR Spectrography |
US9401153B2 (en) * | 2012-10-15 | 2016-07-26 | Digimarc Corporation | Multi-mode audio recognition and auxiliary data encoding and decoding |
US9305559B2 (en) * | 2012-10-15 | 2016-04-05 | Digimarc Corporation | Audio watermark encoding with reversing polarity and pairwise embedding |
JP6017591B2 (ja) | 2013-01-18 | 2016-11-02 | 株式会社東芝 | 音声合成装置、電子透かし情報検出装置、音声合成方法、電子透かし情報検出方法、音声合成プログラム及び電子透かし情報検出プログラム |
-
2013
- 2013-11-11 JP JP2015546269A patent/JP6193395B2/ja active Active
- 2013-11-11 WO PCT/JP2013/080466 patent/WO2015068310A1/ja active Application Filing
-
2016
- 2016-05-10 US US15/150,520 patent/US9747907B2/en active Active
Also Published As
Publication number | Publication date |
---|---|
US9747907B2 (en) | 2017-08-29 |
US20160254003A1 (en) | 2016-09-01 |
JPWO2015068310A1 (ja) | 2017-03-09 |
WO2015068310A1 (ja) | 2015-05-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5621783B2 (ja) | 音声認識システム、音声認識方法および音声認識プログラム | |
JP5870476B2 (ja) | 雑音推定装置、雑音推定方法および雑音推定プログラム | |
JP6017591B2 (ja) | 音声合成装置、電子透かし情報検出装置、音声合成方法、電子透かし情報検出方法、音声合成プログラム及び電子透かし情報検出プログラム | |
JP6193395B2 (ja) | 電子透かし検出装置、方法及びプログラム | |
CN112133277B (zh) | 样本生成方法及装置 | |
US9881623B2 (en) | Digital watermark embedding device, digital watermark embedding method, and computer-readable recording medium | |
KR101666521B1 (ko) | 입력 신호의 피치 주기 검출 방법 및 그 장치 | |
Ding et al. | A DCT-based speech enhancement system with pitch synchronous analysis | |
AU2020227065B2 (en) | Method for forming the excitation signal for a glottal pulse model based parametric speech synthesis system | |
KR20150032390A (ko) | 음성 명료도 향상을 위한 음성 신호 처리 장치 및 방법 | |
JP4454591B2 (ja) | 雑音スペクトル推定方法、雑音抑圧方法及び雑音抑圧装置 | |
JP2005157363A (ja) | フォルマント帯域を利用したダイアログエンハンシング方法及び装置 | |
JP2014219607A (ja) | 音楽信号処理装置および方法、並びに、プログラム | |
JP6347536B2 (ja) | 音合成方法及び音合成装置 | |
JPWO2011013244A1 (ja) | 音声処理装置 | |
EP3113180A1 (en) | Method for performing audio inpainting on a speech signal and apparatus for performing audio inpainting on a speech signal | |
JP5949634B2 (ja) | 音声合成システム、及び音声合成方法 | |
JP2015031913A (ja) | 音声処理装置、音声処理方法、及びプログラム | |
JP5245962B2 (ja) | 音声合成装置、音声合成方法、プログラム及び記録媒体 | |
CN112420004A (zh) | 生成歌曲的方法、装置、电子设备及计算机可读存储介质 | |
JP6502099B2 (ja) | 声門閉鎖時刻推定装置、ピッチマーク時刻推定装置、ピッチ波形接続点推定装置、その方法及びプログラム | |
JP6213217B2 (ja) | 音声合成装置及び音声合成用コンピュータプログラム | |
JP2014130211A (ja) | 音声出力装置、音声出力方法、およびプログラム | |
Ghazvini et al. | Pitch period detection using second generation wavelet transform | |
JP2009237015A (ja) | 音声素片接続装置及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20170711 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20170809 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 6193395 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
S111 | Request for change of ownership or part of ownership |
Free format text: JAPANESE INTERMEDIATE CODE: R313114 Free format text: JAPANESE INTERMEDIATE CODE: R313111 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |