JP2010169766A - 電子透かし情報の埋め込みおよび抽出を行うための装置およびプログラム - Google Patents
電子透かし情報の埋め込みおよび抽出を行うための装置およびプログラム Download PDFInfo
- Publication number
- JP2010169766A JP2010169766A JP2009010284A JP2009010284A JP2010169766A JP 2010169766 A JP2010169766 A JP 2010169766A JP 2009010284 A JP2009010284 A JP 2009010284A JP 2009010284 A JP2009010284 A JP 2009010284A JP 2010169766 A JP2010169766 A JP 2010169766A
- Authority
- JP
- Japan
- Prior art keywords
- embedded
- spectrum
- unit
- noise signal
- signal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Editing Of Facsimile Originals (AREA)
Abstract
【解決手段】 埋め込み装置100の埋め込み雑音合成部120は、埋め込み先の合成音声信号と同様のスペクトラムエンベロープを有する埋め込み雑音信号を電子透かし情報のシンボルを示す擬似雑音信号を用いて合成する。加算器130は、元の合成音声信号に埋め込み雑音信号を加算し、埋め込み済み合成音声信号とする。抽出装置200では、埋め込み済み合成音声信号の複素スペクトラム列を生成し、この複素スペクトラム列の振幅を平坦化する。そして、平坦化された複素スペクトラム列と所定のシンボルを示す擬似雑音信号の複素スペクトラム列との相互相関係数に基づきシンボルを判定する。
【選択図】図1
Description
図1は、この発明の第1実施形態による電子透かし情報の埋め込み装置100を含む音声合成装置の構成を示すブロック図である。この音声合成装置は、音声合成部10と、本実施形態による埋め込み装置100とにより構成されている。音声合成部10は、入力されるテキスト情報に基づいて音声信号を合成する装置である。埋め込み装置100は、音声合成部10が出力する合成音声信号を用いて、電子透かし情報が埋め込まれた音声信号を合成し、この合成した音声信号を元の合成音声信号に加算し、埋め込み済み合成音声信号として出力する装置である。なお、音声合成装置またはその一部である埋め込み装置100は、電子透かし情報の埋め込まれた合成音声信号を生成する処理または音声信号に電子透かし情報を埋め込む処理を実行する専用のハードウェアとして実現してもよいし、そのような処理をコンピュータに実行させるコンピュータプログラムとして実現してもよい。
a1.フィルタ係数列f(n)(n=−N〜N−1)の後にN−1個の0値サンプルを追加して3N−1個のフィルタ係数列とし、この3N−1個のフィルタ係数列に3N−1点FFTを施して、3N−1個のフーリエ変換係数を生成する。
b1.畳み込み演算の対象となる1シンボルフレーム(Nサンプル)分の擬似雑音信号のサンプル列の後に2N−1個の0値サンプルを追加して、3N−1個のサンプル列とし、この3N−1個のサンプル列に3N−1点FFTを施して、3N−1個のフーリエ変換係数を生成する。
c1.上記a1.により得られる3N−1個のフーリエ変換係数と上記b1.により得られる3N−1個のフーリエ変換係数とを同一周波数に対応したもの同士乗算し、乗算結果である3N−1個のフーリエ変換係数にIFFTを施し、時間領域の3N−1個のサンプルの列を生成する。
d1.上記a1.〜c1.が繰り返される毎に得られる3N−1個のサンプルの列の最後尾に1個の0値サンプルを追加して3N個のサンプルの列とし、先行するサンプル列と後続のサンプル列を時間軸上においてNサンプルだけオーバラップさせて出力する。
α=√{(Ps/Pw)10−SWR/10} ……(1)
ここで、Psは、1フレーム分の合成音声信号の平均パワー、具体的には絶対値算出部123により算出された全ての振幅スペクトラムの平均2乗和である。また、Pwは、擬似雑音生成部110が出力する擬似雑音信号の平均パワーである。そして、SWRは、埋め込み先である合成音声信号のパワーを基準とした埋め込み雑音信号のパワーの減衰量の目標値であり、例えば20dBである。
以上が本実施形態による抽出装置200の詳細である。
本実施形態は、特許文献4に開示された歌唱合成装置に電子透かし情報の埋め込み装置としての機能を付加したものである。図5は、本実施形態による歌唱合成装置の構成を示すブロック図である。この歌唱合成装置は、音声を出力する機能を有するパーソナルコンピュータなどのコンピュータに対し、歌唱合成プログラムと透かし埋め込みプログラムをインストールしたものである。図5において、CPU1は、この歌唱合成装置の各部を制御する制御中枢である。ROM2は、ローダなど、この歌唱合成装置の基本的な動作を制御するための制御プログラムを記憶した読み出し専用メモリである。表示部3は、装置の動作状態や入力データおよび操作者に対するメッセージなどを表示するための装置である。操作部4は、ユーザからコマンドや各種の情報を受け取るための手段であり、キーボードやマウスなどの各種の操作子により構成されている。インタフェース群5は、ネットワークを介して他の装置との間でデータ通信を行うためのネットワークインタフェースや、磁気ディスクやCD−ROMなどの外部記憶媒体との間でデータの授受を行うためのドライバなどにより構成されている。HDD(ハードディスク装置)6は、各種のプログラムやデータベースなどの情報を記憶するための不揮発性記憶装置である。RAM7は、CPU1によってワークエリアとして使用される揮発性メモリである。CPU1は、操作部4を介して与えられる指令に従い、HDD6内のプログラムをRAM7にロードして実行する。サウンドシステム8は、この歌唱合成装置において合成された音声を出力する手段であり、合成音声のサンプルデータであるデジタル音声信号をアナログ音声信号に変換するD/A変換器と、このアナログ音声信号を増幅するアンプと、このアンプの出力信号を音として出力するスピーカ等により構成されている。
なお、以上説明した歌唱合成プログラム64の詳細については特許文献4を参照されたい。
以上、この発明の第1および第2実施形態を説明したが、この発明には、他にも各種の実施形態が考えられる。例えば次の通りである。
Claims (7)
- 埋め込み対象である電子透かし情報のシンボルを示す擬似雑音信号を生成する擬似雑音生成手段と、
埋め込み先である音声信号と同様のスペクトラムエンベロープを有する埋め込み雑音信号を前記擬似雑音信号を用いて合成する埋め込み雑音合成手段と、
前記埋め込み雑音信号を前記音声信号に加算して出力する加算手段と
を具備することを特徴とする電子透かし情報の埋め込み装置。 - 音声合成手段が出力する合成音声信号を埋め込み先とし、前記埋め込み雑音合成手段は、前記音声合成手段から音声信号のスペクトラムエンベロープを示すスペクトラムエンベロープデータを取得し、このスペクトラムエンベロープデータを用いて前記埋め込み雑音信号を合成することを特徴とする請求項1に記載の電子透かし情報の埋め込み装置。
- 前記擬似雑音生成手段は、各々音声の発声者の各グループに対応付けられた擬似雑音信号を生成する機能を備え、前記音声合成手段から音声合成に用いる音声素片の発声者が属するグループに関する通知を受け、前記シンボルを示す擬似雑音信号として、前記音声合成手段から通知されたグループに対応付けられた擬似雑音信号を生成することを特徴とする請求項1に記載の電子透かし情報の埋め込み装置。
- 電子透かし情報の埋め込まれた音声信号に時間/周波数変換を施し、スペクトラム列を生成する時間/周波数変換手段と、
前記時間/周波数変換手段により生成されたスペクトラム列の振幅を平坦化するスペクトラム振幅平坦化手段と、
前記スペクトラム振幅平坦化手段により振幅が平坦化されたスペクトラム列と、所定のシンボルを示す擬似雑音信号のスペクトラム列との相互相関係数を算出する相関算出手段と、
前記相関算出手段により算出される相互相関係数に基づき、前記音声信号に埋め込まれた電子透かし情報のシンボルを判定するシンボル判定手段と
を具備することを特徴とする電子透かし情報の抽出装置。 - 前記電子透かし情報の埋め込まれた音声信号の発声者が複数の発声者のグループのいずれに属するかを判定する音声認識手段と、
前記複数の発声者のグループの各グループに対応付けられた擬似雑音信号のスペクトラム列を生成する機能を備え、前記所定のシンボルを示す擬似雑音信号のスペクトラム列として、前記音声認識手段が判定したグループに対応付けられた擬似雑音信号のスペクトラム列を生成する手段と
を具備することを特徴とする請求項4に記載の電子透かし情報の抽出装置。 - コンピュータを、
埋め込み対象である電子透かし情報のシンボルを示す擬似雑音信号を生成する擬似雑音生成手段と、
埋め込み先である音声信号と同様のスペクトラムエンベロープを有する埋め込み雑音信号を前記擬似雑音信号を用いて合成する埋め込み雑音合成手段と、
前記埋め込み雑音信号を前記音声信号に加算して出力する加算手段と
して機能させることを特徴とするプログラム。 - コンピュータを、
電子透かし情報の埋め込まれた音声信号に時間/周波数変換を施し、スペクトラム列を生成する時間/周波数変換手段と、
前記時間/周波数変換手段により生成されたスペクトラム列の振幅を平坦化するスペクトラム振幅平坦化手段と、
前記スペクトラム振幅平坦化手段により振幅が平坦化されたスペクトラム列と、所定のシンボルを示す擬似雑音信号のスペクトラム列との相互相関係数を算出する相関算出手段と、
前記相関算出手段により算出される相互相関係数に基づき、前記音声信号に埋め込まれた電子透かし情報のシンボルを判定するシンボル判定手段と
して機能させることを特徴とするプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009010284A JP5168165B2 (ja) | 2009-01-20 | 2009-01-20 | 電子透かし情報の埋め込みおよび抽出を行うための装置およびプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009010284A JP5168165B2 (ja) | 2009-01-20 | 2009-01-20 | 電子透かし情報の埋め込みおよび抽出を行うための装置およびプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2010169766A true JP2010169766A (ja) | 2010-08-05 |
JP5168165B2 JP5168165B2 (ja) | 2013-03-21 |
Family
ID=42702009
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009010284A Expired - Fee Related JP5168165B2 (ja) | 2009-01-20 | 2009-01-20 | 電子透かし情報の埋め込みおよび抽出を行うための装置およびプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5168165B2 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103582913A (zh) * | 2011-04-28 | 2014-02-12 | 杜比国际公司 | 有效内容分类及响度估计 |
WO2014112110A1 (ja) * | 2013-01-18 | 2014-07-24 | 株式会社東芝 | 音声合成装置、電子透かし情報検出装置、音声合成方法、電子透かし情報検出方法、音声合成プログラム及び電子透かし情報検出プログラム |
JP2021157128A (ja) * | 2020-03-30 | 2021-10-07 | Kddi株式会社 | 音声波形合成装置、方法及びプログラム |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
RU2746708C1 (ru) * | 2020-07-29 | 2021-04-19 | Закрытое акционерное общество "Перспективный мониторинг" | Способ и устройство ввода водяного знака в аудиосигнал |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2000058928A1 (fr) * | 1999-03-31 | 2000-10-05 | Sony Corporation | Procede et dispositif de traitement de signaux |
JP2003263183A (ja) * | 2002-03-11 | 2003-09-19 | Univ Tohoku | 電子透かしシステム |
JP2003295878A (ja) * | 2002-03-29 | 2003-10-15 | Toshiba Corp | 電子透かし入り音声合成システム、合成音声の透かし情報検出システム及び電子透かし入り音声合成方法 |
JP2005503621A (ja) * | 2001-09-20 | 2005-02-03 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | コンテンツ素材をプロテクトするための複数の透かしの使用 |
JP2007104598A (ja) * | 2005-10-07 | 2007-04-19 | Ntt Docomo Inc | 変調装置、変調方法、復調装置、及び復調方法 |
JP2007156169A (ja) * | 2005-12-06 | 2007-06-21 | Canon Inc | 音声合成装置及び音声合成方法 |
-
2009
- 2009-01-20 JP JP2009010284A patent/JP5168165B2/ja not_active Expired - Fee Related
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2000058928A1 (fr) * | 1999-03-31 | 2000-10-05 | Sony Corporation | Procede et dispositif de traitement de signaux |
JP2005503621A (ja) * | 2001-09-20 | 2005-02-03 | コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ | コンテンツ素材をプロテクトするための複数の透かしの使用 |
JP2003263183A (ja) * | 2002-03-11 | 2003-09-19 | Univ Tohoku | 電子透かしシステム |
JP2003295878A (ja) * | 2002-03-29 | 2003-10-15 | Toshiba Corp | 電子透かし入り音声合成システム、合成音声の透かし情報検出システム及び電子透かし入り音声合成方法 |
JP2007104598A (ja) * | 2005-10-07 | 2007-04-19 | Ntt Docomo Inc | 変調装置、変調方法、復調装置、及び復調方法 |
JP2007156169A (ja) * | 2005-12-06 | 2007-06-21 | Canon Inc | 音声合成装置及び音声合成方法 |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103582913A (zh) * | 2011-04-28 | 2014-02-12 | 杜比国际公司 | 有效内容分类及响度估计 |
US9135929B2 (en) | 2011-04-28 | 2015-09-15 | Dolby International Ab | Efficient content classification and loudness estimation |
WO2014112110A1 (ja) * | 2013-01-18 | 2014-07-24 | 株式会社東芝 | 音声合成装置、電子透かし情報検出装置、音声合成方法、電子透かし情報検出方法、音声合成プログラム及び電子透かし情報検出プログラム |
JP6017591B2 (ja) * | 2013-01-18 | 2016-11-02 | 株式会社東芝 | 音声合成装置、電子透かし情報検出装置、音声合成方法、電子透かし情報検出方法、音声合成プログラム及び電子透かし情報検出プログラム |
US9870779B2 (en) | 2013-01-18 | 2018-01-16 | Kabushiki Kaisha Toshiba | Speech synthesizer, audio watermarking information detection apparatus, speech synthesizing method, audio watermarking information detection method, and computer program product |
US10109286B2 (en) | 2013-01-18 | 2018-10-23 | Kabushiki Kaisha Toshiba | Speech synthesizer, audio watermarking information detection apparatus, speech synthesizing method, audio watermarking information detection method, and computer program product |
JP2021157128A (ja) * | 2020-03-30 | 2021-10-07 | Kddi株式会社 | 音声波形合成装置、方法及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP5168165B2 (ja) | 2013-03-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4207902B2 (ja) | 音声合成装置およびプログラム | |
US7379873B2 (en) | Singing voice synthesizing apparatus, singing voice synthesizing method and program for synthesizing singing voice | |
JP2006145867A (ja) | 音声処理装置およびプログラム | |
US20030159568A1 (en) | Singing voice synthesizing apparatus, singing voice synthesizing method and program for singing voice synthesizing | |
JP5168165B2 (ja) | 電子透かし情報の埋め込みおよび抽出を行うための装置およびプログラム | |
US11087727B2 (en) | Auto-generated accompaniment from singing a melody | |
Luo et al. | Singing voice correction using canonical time warping | |
US8492639B2 (en) | Audio processing apparatus and method | |
JP7359164B2 (ja) | 音信号合成方法およびニューラルネットワークの訓練方法 | |
JP5782972B2 (ja) | 情報処理システム,プログラム | |
JP3447221B2 (ja) | 音声変換装置、音声変換方法、および音声変換プログラムを記録した記録媒体 | |
JP3540159B2 (ja) | 音声変換装置及び音声変換方法 | |
JP4218624B2 (ja) | 楽音データ生成方法及び装置 | |
JP5552794B2 (ja) | 音響信号の符号化方法および装置 | |
JP2010169889A (ja) | 音声合成装置、およびプログラム | |
JP5459069B2 (ja) | 音声信号に埋め込まれた電子透かし情報を除去する装置、および音声信号に電子透かし情報を埋め込む装置 | |
JP2000003200A (ja) | 音声信号処理装置及び音声信号処理方法 | |
JP5569307B2 (ja) | プログラム、及び編集装置 | |
JP5510121B2 (ja) | キャリア信号に埋め込まれた電子透かし情報を抽出する抽出装置、およびキャリア信号に電子透かし情報を埋め込む埋め込み装置 | |
JP2004061753A (ja) | 歌唱音声を合成する方法および装置 | |
Peimani | Pitch correction for the human voice | |
CN114005461A (zh) | 音乐伴奏的分离方法和装置 | |
JP5533021B2 (ja) | 音響信号の符号化方法および装置 | |
Chatfield | Techniques for Virtual Instrument Development | |
TWI385644B (zh) | 歌唱聲合成方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20111121 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20120830 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20120911 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20121102 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20121127 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20121210 |
|
LAPS | Cancellation because of no payment of annual fees |