JP4357791B2 - 電子透かし入り音声合成システム、合成音声の透かし情報検出システム及び電子透かし入り音声合成方法 - Google Patents

電子透かし入り音声合成システム、合成音声の透かし情報検出システム及び電子透かし入り音声合成方法 Download PDF

Info

Publication number
JP4357791B2
JP4357791B2 JP2002097052A JP2002097052A JP4357791B2 JP 4357791 B2 JP4357791 B2 JP 4357791B2 JP 2002097052 A JP2002097052 A JP 2002097052A JP 2002097052 A JP2002097052 A JP 2002097052A JP 4357791 B2 JP4357791 B2 JP 4357791B2
Authority
JP
Japan
Prior art keywords
speech
unit
pitch
pitch mark
waveform
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP2002097052A
Other languages
English (en)
Other versions
JP2003295878A (ja
Inventor
博 松浦
岳彦 籠嶋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP2002097052A priority Critical patent/JP4357791B2/ja
Publication of JP2003295878A publication Critical patent/JP2003295878A/ja
Application granted granted Critical
Publication of JP4357791B2 publication Critical patent/JP4357791B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Description

【0001】
【発明の属する技術分野】
本発明は、電子透かし入り音声合成システム、電子透かし入り音声合成方法などに関する。
【0002】
【従来の技術】
任意の文章に基づき人工的に音声を作り出す音声合成は、最近、品質の向上が著しい。それゆえ、例えば誘拐事件などに悪用される危険性なども現実のものとなってきた。また、書籍などをこの合成音声で朗読したものを流通させることも考えられるようになり、その場合の著作権の保護という観点からもこれら合成音声情報に透かし情報を組み込む需要が出てきている。しかし、これまで合成音声に透かし情報を組み込む良い方法が存在しなかった。
【0003】
【発明が解決しようとする課題】
本発明は、従来の上述のような問題点に鑑みてなされたもので、テキスト合成音声に透かし情報を組み込むシステムと方法などを提供することを目的とする。
【0004】
【課題を解決するための手段】
本発明の請求項1によれば、人工的な音声を生成する音声合成システムであって、音声のピッチを規定するピッチマークを生成するピッチマーク生成部と、音韻記号に基づき音声素片辞書から音声素片を選択する音声素片選択部と、この音声素片選択部出力の音声波形データに、透かし情報としての符号データを振幅の修正として付与する振幅修正部と、この振幅修正部により修正された音声素片を含む音声信号を、前記ピッチマーク生成部出力のピッチマークに従って波形を重畳する波形重畳部とを備えて成ることを特徴とする電子透かし入り音声合成システムを提供する。
【0005】
本発明の請求項2によれば、人工的な音声を生成する音声合成システムであって、音声のピッチを規定するピッチマークを生成するピッチマーク生成部と、音韻記号に基づき音声素片辞書から音声素片を選択する音声素片選択部と、この音声素片選択部出力の音声波形データに、透かし情報としての符号データを音声素片の位相の修正として付与する位相修正部と、この位相修正部により修正された音声素片を含む音声信号を、前記ピッチマーク生成部出力のピッチマークに従って波形を重畳する波形重畳部とを備えて成ることを特徴とする電子透かし入り音声合成システムを提供する。
【0006】
本発明の請求項3によれば、人工的な音声を生成する音声合成システムであって、音韻記号に基づき音声素片辞書から音声素片を選択する音声素片選択部と、音声のピッチを規定するピッチマークを生成するピッチマーク生成部と、このピッチマーク生成部出力のピッチマークデータに、透かし情報としての符号データをピッチの修正として付与するピッチ修正部と、このピッチ修正部により修正されたピッチマークに従って、前記音声素片選択部出力の音声素片を含む音声信号を重畳する波形重畳部とを備えて成ることを特徴とする電子透かし入り音声合成システムを提供する。
【0007】
本発明の請求項4によれば、透かし情報が音声素片に振幅として埋め込まれている合成音声から、音声素片を抽出する手段と、この手段により抽出された音声素片のパターンを該当する音声素片の典型的なパターンと比較することにより、振幅に埋め込まれている透かし情報を取り出す手段とを備えて成ることを特徴とする、合成音声の透かし情報検出システムを提供する。
【0008】
本発明の請求項5によれば、透かし情報が音声素片に位相として埋め込まれている合成音声から、ピッチマークを抽出する手段と、この手段により抽出されたピッチマークからピッチ波形を切り出す手段と、この手段により切り出されたピッチ波形の位相を判定することにより、位相に埋め込まれている透かし情報を取り出す手段とを備えて成ることを特徴とする、合成音声の透かし情報検出システムを提供する。
【0009】
本発明の請求項6によれば、透かし情報が音声素片に振幅として埋め込まれている合成音声から、そのピッチマークを検出する手段と、この手段により検出されたピッチマークを通常のピッチマークと比較することにより、前記ピッチマークに埋め込まれている透かし情報を取り出す手段とを備えて成ることを特徴とする、合成音声の透かし情報検出システムを提供する。
【0010】
本発明の請求項7によれば、人工的な音声を生成する音声合成方法であって、音声のピッチを規定するピッチマークを生成するピッチマーク生成ステップと、音韻記号に基づき音声素片辞書から音声素片を選択する音声素片選択ステップと、この音声素片選択ステップにより選択された音声波形データに、透かし情報としての符号データを振幅の修正として付与する振幅修正ステップと、この振幅修正ステップにより修正された音声素片を含む音声信号を前記ピッチマーク生成ステップにより生成されたピッチマークに従って波形を重畳する波形重畳ステップとを有することを特徴とする電子透かし入り音声合成方法を提供する。
【0011】
本発明の請求項8によれば、人工的な音声を生成する音声合成方法であって、音声のピッチを規定するピッチマークを生成するピッチマーク生成ステップと、音韻記号に基づき音声素片辞書から音声素片を選択する音声素片選択ステップと、この音声素片選択ステップにより選択された音声波形データに、透かし情報としての符号データを音声素片の修正として付与する位相修正ステップと、この位相修正ステップにより修正された音声素片を含む音声信号を前記ピッチマーク生成ステップにより生成されたピッチマークに従って波形を重畳する波形重畳ステップとを有することを特徴とする電子透かし入り音声合成方法を提供する。
【0012】
本発明の請求項9によれば、人工的な音声を生成する音声合成方法であって、音韻記号に基づき音声素片辞書から音声素片を選択する音声素片選択ステップと、音声のピッチを規定するピッチマークを生成するピッチマーク生成ステップと、このピッチマーク生成ステップにより生成されたピッチマークデータに、透かし情報としての符号データをピッチの修正として付与するピッチ修正ステップと、このピッチ修正ステップにより修正されたピッチマークに従って、前記音声素片選択ステップにより選択された音声素片を含む音声信号を重畳する波形重畳ステップとを有することを特徴とする電子透かし入り音声合成方法を提供する。
【0013】
【発明の実施の形態】
以下、本発明の実施形態について図面を用いて説明する。
【0014】
音声素片の振幅に1,0の符号列を入れる、本発明の第1の実施形態のシステムの構成例を図1に示す。このエンコーダシステム10は、合成音声のピッチマークを生成するピッチマーク生成部11と、文章(テキスト)の各音韻記号列から該当音声素片を選択して出力する音声素片選択部12と、音韻記号に対応する音声素片を格納する音声素片辞書13と、透かし情報の符号を音声素片情報に反映させる符号付与部14と、ピッチマークと透かし情報符号付与済の音声素片を重畳する波形重畳部15から成る。
【0015】
まず音声素片選択部12は、テキスト、即ち音韻記号列の各音韻記号に対応する音声素片を音声素片辞書13から選択し出力する。この音声素片は、母音、子音などの基本となる小さな単位の特徴パラメータや音声波形データなどから成り、図2に示した例における音声素片21のようなものである。
【0016】
符号付与部14は、透かし情報として組み入れたい符号(例えば“0101・・・・")の各ビットに対応した音声素片(音声波形データ)の振幅を、符号のビット値が“0"ならば実際の振幅に対して0.9倍、ビット値が“1"ならば1.1倍して符号付与済み音声素片22として出力する。この振幅変更の対象となる音声波形データにおける箇所は、極めて狭い範囲の周波数帯域とし予め決められたものとする。
【0017】
符号付与済みの音声素片22は、音節のピッチを設定するピッチマーク生成部11からのピッチマークと、音韻継続時間長などの情報と共に波形重畳部15により時間軸上に重畳されて合成出力される。
【0018】
上記処理の手順を、図3に示すフローチャートを用いて説明する。まず、ステップS31では音声素片選択部12が、入力された音韻記号に対応する音声素片を音声素片辞書13より検索・選択して出力することにより、音韻記号から音声素片への変換を行う。
【0019】
ステップS32では、符号付与部14において入力された符号情報をもとに、図2の22で示したように、音声素片(音声波形データ)の特定部分(予め決められた極めて狭い範囲の周波数帯域)の振幅を0.9、または1.1倍することにより変更し出力する。
【0020】
一方、ステップS33でピッチマーク生成部11において音節のピッチパターンよりピッチマークデータを作成する。
【0021】
ステップS34では、波形重畳部15においてステップS42で生成された符号付与済みの音声波形データを、ピッチマーク生成部11で生成されたピッチマークと音韻継続時間長などと共に重畳し、ステップS35において合成音声として出力する。
【0022】
このようにして合成音声中に、聴視者の耳には分からないように透かし情報を組み込むことができる。
【0023】
その結果は、図4に示すように、例えば「あらゆる」の合成音声のなかの「a」の母音に上記符号列を入れるとすると、「あ」の音声素片41や「ら」の音声素片42の波形の振幅に上記符号の影響が現れることになる。
【0024】
透かしの情報は、1ピッチに1ビットを埋め込むようにしてもよいし、数ピッチを1ブロックとして、1ブロックに1ビットを埋め込むようにしてもよい。また、1音韻に1ビットを埋め込むようにしてもよい。透かし情報は、出力する音声の先頭から1回だけ順次埋め込むようにしてもよいし、ポーズが入った場合にその直後から毎回埋め込むようにしても良い。
【0025】
上述した実施形態では、合成する際にその都度透かし情報を埋め込むようにしたが、予め音声素片に埋め込んでおくようにしても良い。図10は、標準版音声素片辞書に透かし情報を埋め込んで、透かし入り音声素片辞書を作成する実施形態を表している。透かしデータの各ビットが、どの音韻に埋め込まれるかを規定する透かしデータ挿入情報を予め決めておき、この情報と透かしデータに従って標準版音声素片辞書の振幅を変更し、透かし入り音声素片辞書を生成する。この例では、透かしデータの先頭から1ビット目のデータ"1"が素片/sa/に挿入されるため、/sa/の素片の母音部分の波形が1.1倍されており、同様に先頭から2ビット目のデータ"0"が素片/si/に挿入されるため、/si/の素片の母音部分の波形が0.9倍されている。このように予め音声素片に透かしを埋め込んだ場合は、図1の符号付与部14は不要であり、選択された素片をそのまま重畳すればよい。
【0026】
このようにして透かし情報が組み込まれた音声は、その音声素片の振幅が微妙に典型的な音声素片と違っているから、合成音声の音声素片を典型的な音声素片と比較することにより、組み込まれている1,0のデータを取り出すことができる。
【0027】
次に、上記のように透かし情報が組み込まれた合成音声から、この透かし情報を取り出す(デコード)方法について説明する。図5に透かし情報組み込み済み合成音声のデコーダシステムの構成例を示す。
【0028】
このデコードシステム50は、典型的な音声素片を生成する音声素片発生器51と、合成音声を入力し、各音声素片に分解して抽出する音声素片抽出部52と、典型パターンの音声素片と抽出パターンの音声素片のタイミングを調整するタイミング制御部53と、前記2つの音声素片の増幅率を調整するゲイン制御部54と、2つの音声素片を比較して符号を抽出する符号抽出部55とから成る。
【0029】
上記のように音声素片の振幅に透かし情報が組み込まれた合成音声は、音声素片抽出部52に入力され、各音声素片に分解・抽出され抽出パターン音声素片として出力される。この音声素片の原形である典型パターン音声素片は音声素片発生器51において生成されあるいは引き出される。
【0030】
タイミング制御部53では、上記抽出パターンと典型パターンを時間軸上で合わせるように波形データのタイミング(位相)を合わせる。次に、ゲイン制御部54において、上記抽出パターンと典型パターンの振幅を同じ増幅率で増幅し、符号抽出部55の入力とされる。符号抽出部55では、典型パターン音声素片と抽出パターン音声素片の振幅を比較し、その差分を抽出して透かし情報符号列を取り出す。
【0031】
このようにして、合成音声に透かし情報を聴視者の耳には分からないように組み込むと同時に、容易に透かし組み込み合成音声からの透かし情報の抽出を行うことができる。
【0032】
また、音声素片に予め透かし情報を埋め込んだ場合には、図12に示されるように、差分によって抽出された"0"または"1"の情報と、その情報が埋め込まれていた音韻を特定するための音韻時刻情報、および透かしデータ挿入情報を参照して、透かし情報符号列の各ビットを復号すればよい。
【0033】
ところで、上述の実施形態では、音声素片の振幅に透かし情報を符号として組み込む方法を示したが、音声素片の位相に符号を組み入れるようにすることもできる。この場合、図1に示した符号付与部14では、波形のパワースペクトルはそのままに、位相特性を変更することにより符号を埋め込む。この場合の符号付与部14の具体的な実施例を、図9を用いて説明する。まず入力された波形にフーリエ変換を行って、周波数スペクトルに変換する。次に、周波数スペクトルの振幅を変更せずに、位相のみを全てゼロとする。具体的には、スペクトルの実部をxとし、虚部をyとすると、ゼロ位相化されたスペクトルの実部x'と虚部y'は次の式で求めることができる。
x' = (x*x+y*y)0.5
y' = 0
全ての周波数でゼロ位相化した後に、逆フーリエ変換によってゼロ位相化した波形を生成する。ゼロ位相化した波形は、その形状が左右対称となっており、元の波形と明確に区別することが可能であるが、ゼロ位相化によって合成音の聞こえ方は変化しない。
【0034】
このように、位相に透かし情報を埋め込んだ場合は、合成音声から透かし情報を抽出する際に、典型パターンと比較する必要が無いという利点がある。
【0035】
図13を用いて、位相に埋め込まれた透かし情報を抽出する、本発明の実施形態について説明する。まずピッチマーク抽出部で合成音声にピッチ分析を行って、ピッチマークを抽出する。次に、ピッチ波形切り出し部において、ピッチマーク位置を中心としピッチ周期の2倍の長さのハニング窓を用いて、各ピッチマークからピッチ波形を切り出す。次に位相特性判定部において、切り出されたピッチ波形の位相を判定する。波形が左右対称に近いゼロ位相化された波形であれば符号"1"を、そうでなければ符号"0"を出力する。この例では、3ピッチを1ブロックとして符号を埋め込んでおり、透かしデコード部において3つの符号を1つにまとめて透かし情報符号列を出力する。
【0036】
このように数ピッチを1ブロックとすることにより、頻繁な位相変化による音質劣化を防ぐと共に、ノイズなどの混入に対して頑健なデコードを実現することができる効果がある。
【0037】
ところで、上述の実施形態では、音声素片の振幅に透かし情報を符号として組み込む方法を示したが、音声素片のピッチに符号を組み入れるようにすることもできる。このピッチの変更は、合成音声内の各音声素片のピッチを時間軸上の前後に動かすことによって実現する。次に、この種の本発明の第2の実施形態について説明する。
【0038】
図6に、ピッチ調整によって透かし情報の符号付与を行う、エンコーダシステム60の構成例を示す。このシステムは図1と比較して符号付与部14を省き、代わりに符号をピッチに反映するピッチ調整部61と、調整情報をピッチパターンに組み入れる符号付与部62を追加したものである。
【0039】
音声素片のピッチを微妙に変化させて符号を入れる方法は、図7に示した例のように各典型パターン71の音声素片(音声波形データ)を時間軸上で一定値以上位相を前に動かしたものを“0"とし、後に動かしたものを“1"として符号を組み入れて出力パターン72の合成音声を生成する。
【0040】
図8に処理の流れをフローチャートで示す。ステップS81で音声素片選択部12が音韻記号を、音声素片辞書13を用いて音声素片に変換する。
【0041】
一方、ステップS82では、ピッチマーク生成部11がピッチパターンからピッチマークを生成する。ステップS83で、ピッチ調整部61では入力された透かし情報の符号によってピッチ調整情報を生成し、符号付与部62によりピッチマークを符号の値により変更する。
【0042】
ステップS84で波形重畳部15が音声素片を符号化されたピッチマークと音韻継続時間長をもとに重畳し、ステップS85において合成音声として出力する。
【0043】
本発明のこの実施形態、即ちピッチ調整によって透かし情報を付加する方法では、前述の第1の実施形態の場合よりも、聴視者に聞き分けることのできない符合組み込みを行うことができる利点がある。
【0044】
【発明の効果】
以上述べたように本発明によれば、合成音声に透かし情報を組み込むことが可能なシステムと方法を得ることができる効果がある。
【図面の簡単な説明】
【図1】本発明における一実施形態のエンコーダの構成例を示す図。
【図2】本発明における一実施形態の原理を説明するための図。
【図3】本発明における一実施形態の動作を説明するためのフローチャートを示す図。
【図4】本発明における一実施形態の具体例を説明するための図。
【図5】本発明における一実施形態のデコーダの構成例を示す図。
【図6】本発明の他の実施形態におけるエンコーダの構成例を示す図。
【図7】本発明の他の実施形態における透かし情報符号列の埋め込み方法を説明するための図。
【図8】本発明における他の実施形態の動作を説明するためのフローチャートを示す図。
【図9】本発明において、透かし情報を音声素片の位相に入れる場合の実施形態を説明するための図。
【図10】本発明の一実施形態において、透かし情報を予め埋め込んでおく例を説明するための図。
【図11】本発明の一実施形態において、透かし情報組み込み済み合成音声のデコーダシステムの構成例を示す図。
【図12】本発明の一実施形態において、透かし情報を検出する構成例を示す図。
【図13】本発明の他の実施形態において位相に埋め込まれた透かし情報を抽出する場合の構成例を説明するための図。
【符号の説明】
11・・・ピッチマーク生成部、12・・・音声素片選択部、13・・・音声素片辞書、14・・・符号付与部、15・・・波形重畳部、21・・・音声素片、22・・・符号付与済み音声素片、51・・・音声素片発生部、52・・・音声素片抽出部、53・・・タイミング制御部、54・・・ゲイン制御部、55・・・符号抽出部、61・・・ピッチ調整部、62・・・符号付与部。

Claims (9)

  1. 人工的な音声を生成する音声合成システムであって、
    音声のピッチを規定するピッチマークを生成するピッチマーク生成部と、
    音韻記号に基づき音声素片辞書から音声素片を選択する音声素片選択部と、
    この音声素片選択部出力の音声波形データに、透かし情報としての符号データを振幅の修正として付与する振幅修正部と、
    この振幅修正部により修正された音声素片を含む音声信号を、前記ピッチマーク生成部出力のピッチマークに従って波形を重畳する波形重畳部とを備えて成ることを特徴とする電子透かし入り音声合成システム。
  2. 人工的な音声を生成する音声合成システムであって、
    音声のピッチを規定するピッチマークを生成するピッチマーク生成部と、
    音韻記号に基づき音声素片辞書から音声素片を選択する音声素片選択部と、
    この音声素片選択部出力の音声波形データに、透かし情報としての符号データを音声素片の位相の修正として付与する位相修正部と、
    この位相修正部により修正された音声素片を含む音声信号を、前記ピッチマーク生成部出力のピッチマークに従って波形を重畳する波形重畳部とを備えて成ることを特徴とする電子透かし入り音声合成システム。
  3. 人工的な音声を生成する音声合成システムであって、
    音韻記号に基づき音声素片辞書から音声素片を選択する音声素片選択部と、
    音声のピッチを規定するピッチマークを生成するピッチマーク生成部と、
    このピッチマーク生成部出力のピッチマークデータに、透かし情報としての符号データをピッチの修正として付与するピッチ修正部と、
    このピッチ修正部により修正されたピッチマークに従って、前記音声素片選択部出力の音声素片を含む音声信号を重畳する波形重畳部とを備えて成ることを特徴とする電子透かし入り音声合成システム。
  4. 透かし情報が音声素片に振幅として埋め込まれている合成音声から、音声素片を抽出する手段と、
    この手段により抽出された音声素片のパターンを該当する音声素片の典型的なパターンと比較することにより、振幅に埋め込まれている透かし情報を取り出す手段とを備えて成ることを特徴とする、合成音声の透かし情報検出システム。
  5. 透かし情報が音声素片に位相として埋め込まれている合成音声から、ピッチマークを抽出する手段と、
    この手段により抽出されたピッチマークからピッチ波形を切り出す手段と、
    この手段により切り出されたピッチ波形の位相を判定することにより、位相に埋め込まれている透かし情報を取り出す手段とを備えて成ることを特徴とする、合成音声の透かし情報検出システム。
  6. 透かし情報が音声素片にピッチマークとして埋め込まれている合成音声から、そのピッチマークを検出する手段と、
    この手段により検出されたピッチマークを通常のピッチマークと比較することにより、前記ピッチマークに埋め込まれている透かし情報を取り出す手段とを備えて成ることを特徴とする、合成音声の透かし情報検出システム。
  7. 人工的な音声を生成する音声合成方法であって、
    音声のピッチを規定するピッチマークを生成するピッチマーク生成ステップと、
    音韻記号に基づき音声素片辞書から音声素片を選択する音声素片選択ステップと、
    この音声素片選択ステップにより選択された音声波形データに、透かし情報としての符号データを振幅の修正として付与する振幅修正ステップと、
    この振幅修正ステップにより修正された音声素片を含む音声信号を前記ピッチマーク生成ステップにより生成されたピッチマークに従って波形を重畳する波形重畳ステップとを有することを特徴とする電子透かし入り音声合成方法。
  8. 人工的な音声を生成する音声合成方法であって、
    音声のピッチを規定するピッチマークを生成するピッチマーク生成ステップと、
    音韻記号に基づき音声素片辞書から音声素片を選択する音声素片選択ステップと、
    この音声素片選択ステップにより選択された音声波形データに、透かし情報としての符号データを音声素片の修正として付与する位相修正ステップと、
    この位相修正ステップにより修正された音声素片を含む音声信号を前記ピッチマーク生成ステップにより生成されたピッチマークに従って波形を重畳する波形重畳ステップとを有することを特徴とする電子透かし入り音声合成方法。
  9. 人工的な音声を生成する音声合成方法であって、
    音韻記号に基づき音声素片辞書から音声素片を選択する音声素片選択ステップと、
    音声のピッチを規定するピッチマークを生成するピッチマーク生成ステップと、
    このピッチマーク生成ステップにより生成されたピッチマークデータに、透かし情報としての符号データをピッチの修正として付与するピッチ修正ステップと、
    このピッチ修正ステップにより修正されたピッチマークに従って、前記音声素片選択ステップにより選択された音声素片を含む音声信号を重畳する波形重畳ステップとを有することを特徴とする電子透かし入り音声合成方法。
JP2002097052A 2002-03-29 2002-03-29 電子透かし入り音声合成システム、合成音声の透かし情報検出システム及び電子透かし入り音声合成方法 Expired - Lifetime JP4357791B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002097052A JP4357791B2 (ja) 2002-03-29 2002-03-29 電子透かし入り音声合成システム、合成音声の透かし情報検出システム及び電子透かし入り音声合成方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002097052A JP4357791B2 (ja) 2002-03-29 2002-03-29 電子透かし入り音声合成システム、合成音声の透かし情報検出システム及び電子透かし入り音声合成方法

Publications (2)

Publication Number Publication Date
JP2003295878A JP2003295878A (ja) 2003-10-15
JP4357791B2 true JP4357791B2 (ja) 2009-11-04

Family

ID=29239802

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002097052A Expired - Lifetime JP4357791B2 (ja) 2002-03-29 2002-03-29 電子透かし入り音声合成システム、合成音声の透かし情報検出システム及び電子透かし入り音声合成方法

Country Status (1)

Country Link
JP (1) JP4357791B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9870779B2 (en) 2013-01-18 2018-01-16 Kabushiki Kaisha Toshiba Speech synthesizer, audio watermarking information detection apparatus, speech synthesizing method, audio watermarking information detection method, and computer program product
US10424310B2 (en) 2013-06-11 2019-09-24 Kabushiki Kaisha Toshiba Digital watermark embedding device, digital watermark detecting device, digital watermark embedding method, digital watermark detecting method, computer-readable recording medium containing digital watermark embedding program, and computer-readable recording medium containing digital watermark detecting program

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005119650A1 (ja) 2004-06-04 2005-12-15 Matsushita Electric Industrial Co., Ltd. 音声合成装置
EP2133871A1 (en) * 2007-03-20 2009-12-16 Fujitsu Limited Data embedding device, data extracting device, and audio communication system
JP5332602B2 (ja) * 2008-12-26 2013-11-06 ヤマハ株式会社 サービス提供装置
JP5168165B2 (ja) * 2009-01-20 2013-03-21 ヤマハ株式会社 電子透かし情報の埋め込みおよび抽出を行うための装置およびプログラム
JP5486839B2 (ja) * 2009-05-14 2014-05-07 株式会社日立製作所 小型検出窓を利用した電子透かし埋め込み検出方法
US10468013B2 (en) * 2017-03-31 2019-11-05 Intel Corporation Methods, apparatus, and articles of manufacture to generate voices for artificial speech based on an identifier represented by frequency dependent bits

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9870779B2 (en) 2013-01-18 2018-01-16 Kabushiki Kaisha Toshiba Speech synthesizer, audio watermarking information detection apparatus, speech synthesizing method, audio watermarking information detection method, and computer program product
US10109286B2 (en) 2013-01-18 2018-10-23 Kabushiki Kaisha Toshiba Speech synthesizer, audio watermarking information detection apparatus, speech synthesizing method, audio watermarking information detection method, and computer program product
US10424310B2 (en) 2013-06-11 2019-09-24 Kabushiki Kaisha Toshiba Digital watermark embedding device, digital watermark detecting device, digital watermark embedding method, digital watermark detecting method, computer-readable recording medium containing digital watermark embedding program, and computer-readable recording medium containing digital watermark detecting program

Also Published As

Publication number Publication date
JP2003295878A (ja) 2003-10-15

Similar Documents

Publication Publication Date Title
US7526430B2 (en) Speech synthesis apparatus
US7627471B2 (en) Providing translations encoded within embedded digital information
US5915237A (en) Representing speech using MIDI
US6892175B1 (en) Spread spectrum signaling for speech watermarking
US10347263B2 (en) Inserting watermarks into audio signals that have speech-like properties
US6999598B2 (en) Systems and methods for embedding data by dimensional compression and expansion
EP1886305B1 (en) Method and apparatus for watermarking an audio or video signal with watermark data using a spread spectrum
Takahashi et al. Multiple watermarks for stereo audio signals using phase-modulation techniques
JP4186531B2 (ja) データ埋め込み方法、データ抽出方法、データ埋め込み抽出方法、及びシステム
JP4357791B2 (ja) 電子透かし入り音声合成システム、合成音声の透かし情報検出システム及び電子透かし入り音声合成方法
San Roman et al. Proactive detection of voice cloning with localized watermarking
Celik et al. Pitch and duration modification for speech watermarking
CN102222504A (zh) 数字音频多层水印植入及提取方法
JP5168165B2 (ja) 電子透かし情報の埋め込みおよび抽出を行うための装置およびプログラム
JP4510631B2 (ja) 音声波形の連結を用いる音声合成
JP5175422B2 (ja) 音声合成における時間幅を制御する方法
Wu et al. Comparison of two speech content authentication approaches
Hatada et al. Digital watermarking based on process of speech production
Hernaez et al. Speech watermarking based on coding of the harmonic phase
JP2001005471A (ja) 著作権情報埋め込み方法及びその情報の検出方法
JP2000089796A (ja) 音響信号へのデータ埋め込み装置およびデータ抽出装置
Tahilramani et al. Security against morphed speech based on speaker verification system
Sakai et al. Digital watermarking based on process of speech production
Liu Audio watermarking through parametric synthesis models
Marquez et al. Algorithms for hiding data in speech signals

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20050401

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050510

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20050713

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20060530

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090615

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090805

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120814

Year of fee payment: 3

R151 Written notification of patent or utility model registration

Ref document number: 4357791

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120814

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120814

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130814

Year of fee payment: 4

EXPY Cancellation because of completion of term