JP2003140678A - 合成音声の音質調整方法と音声合成装置 - Google Patents

合成音声の音質調整方法と音声合成装置

Info

Publication number
JP2003140678A
JP2003140678A JP2001333991A JP2001333991A JP2003140678A JP 2003140678 A JP2003140678 A JP 2003140678A JP 2001333991 A JP2001333991 A JP 2001333991A JP 2001333991 A JP2001333991 A JP 2001333991A JP 2003140678 A JP2003140678 A JP 2003140678A
Authority
JP
Japan
Prior art keywords
information
voice
parameter
sound source
vocal tract
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2001333991A
Other languages
English (en)
Other versions
JP2003140678A5 (ja
JP3900892B2 (ja
Inventor
Yumiko Kato
弓子 加藤
Katsuyoshi Yamagami
勝義 山上
Takahiro Kamai
孝浩 釜井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP2001333991A priority Critical patent/JP3900892B2/ja
Publication of JP2003140678A publication Critical patent/JP2003140678A/ja
Publication of JP2003140678A5 publication Critical patent/JP2003140678A5/ja
Application granted granted Critical
Publication of JP3900892B2 publication Critical patent/JP3900892B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 情報の意味内容を示す単語あるいは部分は明
瞭で強調された声質で合成し、直接には意味内容を示さ
ず構文構造を示す単語あるいは部分はあいまいな声質で
合成する。 【解決手段】 音源−声道モデルに従って音声を合成す
る音声合成装置において、読み情報、アクセント情報に
合わせて品詞情報あるいは音質タグを出力する言語処理
部と読み情報とアクセント情報とから韻律情報を生成す
る韻律制御部と品詞情報あるいは音質タグと韻律情報に
基づき、音源パラメータと声道パラメータを調整して、
声質を変換し、韻律情報に従った音声波形を生成する音
響処理部よりなる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明はテキストを音声に変
換する音声合成方法および音声合成装置に属するもので
ある。
【0002】
【従来の技術】波形重畳方式に代表される、従来の音声
合成装置では、自立語のような発話の意味内容を示すこ
とばと、付属語のような構文構造を示すことばが同じ明
瞭度、同じ強度で発声されたため、聞き手は注意を絞る
ことが出来ず、長時間聴取すると疲労する音声となって
いた。
【0003】
【発明が解決しようとする課題】しかしながら、波形重
畳方式の音声合成では、自立語と付属語の音質を変える
ためには、自立語用音声素片と付属語用音声素片を保持
せねばならず、素片データの容量が大幅に増加するとい
う課題があった。
【0004】この発明は上記の課題を鑑み、データ量を
増加させずに言語情報あるいは意味情報に対応して声質
を変化させる合成音声の音質調整方法と音声合成装置を
提供することを目的とする。
【0005】
【課題を解決するための手段】上記の目的を達成するた
めの第1の手段は声道パラメータと音源パラメータを制
御して音声を合成する音声合成方法において、入力され
た言語情報に基づいて前記声道パラメータと前記音源パ
ラメータとの少なくともいずれか一方を制御して声質を
変換する音質調整方法である。
【0006】第2の手段は声道パラメータと音源パラメ
ータを制御して音声を合成する音声合成方法において、
入力された言語情報と意味情報に基づいて前記声道パラ
メータと前記音源パラメータとの少なくともいずれか一
方を制御して声質を変換する音質調整方法である。
【0007】第3の手段は前記言語情報は品詞情報を含
み、前記品詞情報に基づいて前記音源パラメータのうち
音源開口度パラメータを制御することを特徴とする音質
調整方法である。
【0008】第4の手段は前記言語情報は活用情報を含
み、前記活用情報に基づいて前記音源パラメータのうち
音源開口度パラメータを制御することを特徴とする音質
調整方法である。
【0009】第5の手段は前記言語情報は品詞情報を含
み、前記品詞情報に基づいて前記声道パラメータのうち
ホルマント中心周波数パラメータを制御することを特徴
とする音質調整方法である。
【0010】第6の手段は前記言語情報は活用情報を含
み、前記活用情報に基づいて前記声道パラメータのうち
ホルマント中心周波数パラメータを制御することを特徴
とする音質調整方法である。
【0011】第7の手段は前記言語情報は品詞情報を含
み、前記品詞情報に基づいて前記声道パラメータのうち
ホルマントバンド幅パラメータを制御することを特徴と
する音質調整方法である。
【0012】第8の手段は前記言語情報は活用情報を含
み、前記活用情報に基づいて前記声道パラメータのうち
ホルマントバンド幅パラメータを制御することを特徴と
する音質調整方法である。
【0013】第9の手段は声道パラメータと音源パラメ
ータとに基づいて音声を合成する音声合成装置におい
て、発音記号列と言語情報との少なくともどちらか一方
に基づいて韻律情報を生成する韻律制御手段と、前記言
語情報に基づいて前記声道パラメータと前記音源パラメ
ータとの少なくともどちらか一方を制御して声質を変換
し、前記発音記号列と前記韻律情報とに基づいて音声を
合成する音声生成手段を備えた音声合成装置である。
【0014】第10の手段は声道パラメータと音源パラ
メータとに基づいて音声を合成する音声合成装置におい
て、発音記号列と言語情報と意味情報との少なくともい
ずれか一つに基づいて韻律情報を生成する韻律制御手段
と、前記言語情報と前記意味情報との少なくともいずれ
か一つに基づいて前記声道パラメータと前記音源パラメ
ータとの少なくともいずれか一つを制御して声質を変換
し、前記発音記号列と前記韻律情報とに基づいて音声を
合成する音声生成手段を備えた音声合成装置である。
【0015】
【発明の実施の形態】以下、本発明の音質調整方法と音
声合成装置について、実施例を用いて説明する。
【0016】(実施の形態1)図1は、本発明の実施の
形態1における音声合成装置の概念構成と各部の入出力
データの形式を示した機能ブロック図である。
【0017】図1において110は漢字かな混じりテキ
ストを入力とし、形態素解析および構文解析を行い、読
み、アクセント情報および自立語付属語判断情報を出力
する言語処理部であり、120は言語処理部110より
出力された読み、アクセント情報に従って、音韻ごとの
時間長、ピッチおよびパワー情報(韻律情報)を生成する
韻律制御部であり、130は韻律制御部120より出力
された韻律情報と言語処理部110より出力された、自
立語付属語判別情報に従って、音源-声道モデルのパラ
メータを制御して音声波形を生成する音響処理部であ
る。
【0018】以上のように構成された音声合成装置の動
作を説明する。言語処理110は入力された漢字かな混
じりテキスト(101)「明日は全国的に晴れるところ
が多く、日中の気温は最高気温が30度を超えるところが
多くなる見込みです。」を形態素解析および構文解析
し、読み、アクセント区切り、アクセント、付属語記号
を含む言語情報(102)を出力する。言語情報102
は音韻をカタカナで示し、改行によりアクセント句を示
し、アポストロフィ記号によりアクセントを示し、音韻
記号を中カッコで囲むことで付属語を示している。韻律
制御部は例えば特開平12−075883のようにアク
セント句のモーラ数とアクセント型に従って音韻ごとの
ピッチとパワーを決定し、音韻並びから音韻語との時間
長を特定して、音韻毎に時間長、ピッチ、パワーの韻律
情報を生成する。一方言語処理110より入力された付
属語情報に基づいて、自立語に含まれる音韻は標準の声
質、付属語に含まれる音韻はあいまいな声質を指定する
声質情報を音韻毎に生成し、音韻毎の韻律情報及び声質
情報(103)を出力する。音響処理部130は音韻毎
の韻律情報および声質情報(103)に従って、音声を
合成する。あいまいな声質が指定された音韻に付いて
は、音韻の母音部のホルマント周波数を各母音の特徴的
ホルマント周波数の重心に近づけ、さらにホルマントバ
ンド幅を標準の2倍にする。このときホルマントのエネ
ルギーが標準ホルマントバンド幅の場合と変わらないよ
うにエネルギーを調整する。上記のように標準声質のパ
ラメータを変更することで、あいまい声質の音声を音韻
単位で作り、パラメータを接続し韻律情報に合わせて音
源パラメータを変更して、音声を合成する。
【0019】以上のように、本実施の形態の音声合成装
置により、付属語に含まれる音韻のみをあいまいな声質
で合成することができ、意味内容を伝える自立語を相対
的に明瞭な声質で発声することにより、聴取者が自然に
意味内容に注目でき、自然で疲れにくい合成音声を生成
することが出来る。
【0020】(実施の形態2)図2は、本発明の実施の
形態2における音声合成装置の概念構成と各部の入出力
データの形式を示した機能ブロック図である。
【0021】図2において210はFM電波を受信して電
波に多重変調されている文字データを出力するFM文字放
送受信部であり、220はFM文字放送受信部210が出
力した文字データの中から交通情報を抜き出して出力す
る交通情報抽出部である。230は交通情報の文例と、
文例毎にあらかじめ定められた、強調あるいはあいまい
の声質指定情報とを保持する音質タグ付き文例データベ
ースであり、240は交通情報抽出部220が出力した
交通情報を音質タグ付きデータベース230のデータと
マッチングし、音声出力のための読み、アクセント情報
および音質情報を出力する言語情報出力部である。韻律
制御部120、音響処理部130は図1と同様である。
【0022】以上のように構成された音声合成装置の動
作を説明する。FM文字放送受信部210はFM電波を受信
して文字データを抽出し、出力する。交通情報抽出部2
20はFM文字放送受信部210が出力した文字データよ
り音質タグ付き文例データベース230を参照して交通
情報のパタンを持つ情報のみ抽出し文字列(201)を
出力する。言語情報出力部240は音質タグ付き文例デ
ータベース230を参照して路線、方向、始点等の構成
要素をマッチングし、文字列201に最適な文例を選択
する。交通情報の抽出と文例の選択は例えば、特開平0
8−339490に示されるようなマッチングによって
行うものとする。言語情報出力部240は文例に文字列
201の構成要素を当てはめ、完結した文を生成しその
文の読み、アクセント区切り、アクセント、音質タグを
含む言語情報(202)を出力する。言語情報202は
音韻をカタカナで示し、改行によりアクセント句を示
し、アポストロフィ記号によりアクセントを示し、音韻
記号を<>で囲むことで強調音声を摘要する音韻列を示
し、中カッコで囲むことであいまい音声を適用する音韻
列を示している。韻律制御部は例えば特開平12−07
5883のようにアクセント句のモーラ数とアクセント
型に従って音韻ごとのピッチとパワーを決定し、音韻並
びから音韻語との時間長を特定して、音韻毎に時間長、
ピッチ、パワーの韻律情報を生成する。一方言語情報出
力部240より出力された音質タグに基づいて、強調音
声が指定された音韻については、強調のタグを付与し、
あいまい音声を指定された音韻にはあいまい音声のタグ
を付与して音韻毎の韻律情報及び声質情報(103)を
出力する。音響処理部130は音韻毎の韻律情報および
声質情報(103)に従って、音声を合成する。強調タ
グが付与された音韻に付いては音韻の子音部のパワーを
標準の1.1倍にし、母音部のホルマントバンド幅を標
準の0.8倍にする。あいまいな声質が指定された音韻
に付いては、音韻の母音部のホルマント周波数を各母音
の特徴的ホルマント周波数の重心に近づけ、さらにホル
マントバンド幅を標準の2倍にする。強調、あいまいの
どちらのパラメータ変更についても、ホルマントのエネ
ルギーが標準ホルマントバンド幅の場合と変わらないよ
うにエネルギーを調整する。上記のように標準声質のパ
ラメータを変更することで、強調音声、あいまい声質の
音声を音韻単位で作り、パラメータを接続し韻律情報に
合わせて音源パラメータを変更して、音声を合成する。
【0023】以上のように、本実施の形態の音声合成装
置により、聴取者が注目すべき構成要素に対して強調音
声で、意味内容に関連の小さい部分の音韻はあいまいな
声質で合成することができ、聴取者が自然に意味内容に
注目でき、自然で疲れにくい合成音声を生成することが
出来る。
【0024】
【発明の効果】聴取者が注目すべき意味内容を示す部分
を強調された明瞭な音声で提示し、意味内容を直接示さ
ない部分をあいまいな音声で提示することにより、聴取
者が自然に意味内容を示す部分に注目でき、自然で疲れ
ない合成音声を生成することが出来る。
【図面の簡単な説明】
【図1】実施の形態1の音声合成装置の概念構成と各部
の入出力データ形式を示すブロック図
【図2】実施の形態2の音声合成装置の概念構成と各部
の入出力データ形式を示すブロック図
【符号の説明】
110 言語処理部 120 韻律制御部 130 音響処理部 210 FM文字放送受信部 220 交通情報抽出部 230 音質タグ付き文例データベース
───────────────────────────────────────────────────── フロントページの続き (72)発明者 釜井 孝浩 大阪府門真市大字門真1006番地 松下電器 産業株式会社内 Fターム(参考) 5D045 AA00

Claims (10)

    【特許請求の範囲】
  1. 【請求項1】 声道パラメータと音源パラメータを制御
    して音声を合成する音声合成方法において、入力された
    言語情報に基づいて前記声道パラメータと前記音源パラ
    メータとの少なくともいずれか一方を制御して声質を変
    換する合成音声の音質調整方法。
  2. 【請求項2】 声道パラメータと音源パラメータを制御
    して音声を合成する音声合成方法において、入力された
    言語情報と意味情報に基づいて前記声道パラメータと前
    記音源パラメータとの少なくともいずれか一方を制御し
    て声質を変換する合成音声の音質調整方法。
  3. 【請求項3】 前記言語情報は品詞情報を含み、前記品
    詞情報に基づいて前記音源パラメータのうち音源開口度
    パラメータを制御することを特徴とする請求項1または
    2に記載の合成音声の音質調整方法。
  4. 【請求項4】 前記言語情報は活用情報を含み、前記活
    用情報に基づいて前記音源パラメータのうち音源開口度
    パラメータを制御することを特徴とする請求項1または
    2に記載の合成音声の音質調整方法。
  5. 【請求項5】 前記言語情報は品詞情報を含み、前記品
    詞情報に基づいて前記声道パラメータのうちホルマント
    中心周波数パラメータを制御することを特徴とする請求
    項1または2に記載の合成音声の音質調整方法。
  6. 【請求項6】 前記言語情報は活用情報を含み、前記活
    用情報に基づいて前記声道パラメータのうちホルマント
    中心周波数パラメータを制御することを特徴とする請求
    項1または2に記載の合成音声の音質調整方法。
  7. 【請求項7】 前記言語情報は品詞情報を含み、前記品
    詞情報に基づいて前記声道パラメータのうちホルマント
    バンド幅パラメータを制御することを特徴とする請求項
    1または2に記載の合成音声の音質調整方法。
  8. 【請求項8】 前記言語情報は活用情報を含み、前記活
    用情報に基づいて前記声道パラメータのうちホルマント
    バンド幅パラメータを制御することを特徴とする請求項
    1または2に記載の合成音声の音質調整方法。
  9. 【請求項9】 声道パラメータと音源パラメータとに基
    づいて音声を合成する音声合成装置において、発音記号
    列と言語情報との少なくともどちらか一方に基づいて韻
    律情報を生成する韻律制御手段と、前記言語情報に基づ
    いて前記声道パラメータと前記音源パラメータとの少な
    くともどちらか一方を制御して声質を変換し、前記発音
    記号列と前記韻律情報とに基づいて音声を合成する音声
    生成手段を備えた音声合成装置。
  10. 【請求項10】 声道パラメータと音源パラメータとに
    基づいて音声を合成する音声合成装置において、発音記
    号列と言語情報と意味情報との少なくともいずれか一つ
    に基づいて韻律情報を生成する韻律制御手段と、前記言
    語情報と前記意味情報との少なくともいずれか一つに基
    づいて前記声道パラメータと前記音源パラメータとの少
    なくともいずれか一つを制御して声質を変換し、前記発
    音記号列と前記韻律情報とに基づいて音声を合成する音
    声生成手段を備えた音声合成装置。
JP2001333991A 2001-10-31 2001-10-31 合成音声の音質調整方法と音声合成装置 Expired - Lifetime JP3900892B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001333991A JP3900892B2 (ja) 2001-10-31 2001-10-31 合成音声の音質調整方法と音声合成装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001333991A JP3900892B2 (ja) 2001-10-31 2001-10-31 合成音声の音質調整方法と音声合成装置

Publications (3)

Publication Number Publication Date
JP2003140678A true JP2003140678A (ja) 2003-05-16
JP2003140678A5 JP2003140678A5 (ja) 2005-04-07
JP3900892B2 JP3900892B2 (ja) 2007-04-04

Family

ID=19149186

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001333991A Expired - Lifetime JP3900892B2 (ja) 2001-10-31 2001-10-31 合成音声の音質調整方法と音声合成装置

Country Status (1)

Country Link
JP (1) JP3900892B2 (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005050624A1 (ja) * 2003-11-21 2005-06-02 Matsushita Electric Industrial Co., Ltd. 声質変換装置
JP2005266085A (ja) * 2004-03-17 2005-09-29 Advanced Telecommunication Research Institute International 音声合成装置及び文字割当装置並びにコンピュータプログラム
JP2006208600A (ja) * 2005-01-26 2006-08-10 Brother Ind Ltd 音声合成装置及び音声合成方法
JP2006292930A (ja) * 2005-04-08 2006-10-26 Yamaha Corp 音声合成装置および音声合成プログラム
JP2011203761A (ja) * 2011-07-12 2011-10-13 Yamaha Corp 音声合成装置および音声合成プログラム
WO2013018294A1 (ja) * 2011-08-01 2013-02-07 パナソニック株式会社 音声合成装置および音声合成方法
JP2019179064A (ja) * 2018-03-30 2019-10-17 日本放送協会 音声合成装置、音声モデル学習装置およびそれらのプログラム

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2005050624A1 (ja) * 2003-11-21 2005-06-02 Matsushita Electric Industrial Co., Ltd. 声質変換装置
JP2005266085A (ja) * 2004-03-17 2005-09-29 Advanced Telecommunication Research Institute International 音声合成装置及び文字割当装置並びにコンピュータプログラム
JP4617494B2 (ja) * 2004-03-17 2011-01-26 株式会社国際電気通信基礎技術研究所 音声合成装置及び文字割当装置並びにコンピュータプログラム
JP2006208600A (ja) * 2005-01-26 2006-08-10 Brother Ind Ltd 音声合成装置及び音声合成方法
JP2006292930A (ja) * 2005-04-08 2006-10-26 Yamaha Corp 音声合成装置および音声合成プログラム
JP2011203761A (ja) * 2011-07-12 2011-10-13 Yamaha Corp 音声合成装置および音声合成プログラム
WO2013018294A1 (ja) * 2011-08-01 2013-02-07 パナソニック株式会社 音声合成装置および音声合成方法
JP5148026B1 (ja) * 2011-08-01 2013-02-20 パナソニック株式会社 音声合成装置および音声合成方法
US9147392B2 (en) 2011-08-01 2015-09-29 Panasonic Intellectual Property Management Co., Ltd. Speech synthesis device and speech synthesis method
JP2019179064A (ja) * 2018-03-30 2019-10-17 日本放送協会 音声合成装置、音声モデル学習装置およびそれらのプログラム
JP7033478B2 (ja) 2018-03-30 2022-03-10 日本放送協会 音声合成装置、音声モデル学習装置およびそれらのプログラム

Also Published As

Publication number Publication date
JP3900892B2 (ja) 2007-04-04

Similar Documents

Publication Publication Date Title
US7565291B2 (en) Synthesis-based pre-selection of suitable units for concatenative speech
JPH06332494A (ja) 音声を第1の言語から第2の言語に翻訳する際に音声理解を高めるための装置
JP3587048B2 (ja) 韻律制御方法及び音声合成装置
US7280969B2 (en) Method and apparatus for producing natural sounding pitch contours in a speech synthesizer
JP2003140678A (ja) 合成音声の音質調整方法と音声合成装置
JPH05113795A (ja) 音声合成装置
JPH0887297A (ja) 音声合成システム
JP2003140678A5 (ja)
JPH08335096A (ja) テキスト音声合成装置
JPH11161298A (ja) 音声合成方法及び装置
JPH07200554A (ja) 文章読み上げ装置
JP4056647B2 (ja) 波形接続型音声合成装置および方法
JP3883780B2 (ja) 音声合成装置
JPH06149283A (ja) 音声合成装置
JP3192981B2 (ja) テキスト音声合成装置
JPH06161490A (ja) 音声合成装置の韻律処理方式
JPH02247696A (ja) テキスト音声合成装置
JPH1011083A (ja) テキスト音声変換装置
JP3088211B2 (ja) 基本周波数パタン生成装置
JPH01321496A (ja) 音声合成装置
Chowdhury Concatenative Text-to-speech synthesis: A study on standard colloquial bengali
JP2578876B2 (ja) 文章読み上げ装置
JPH09134195A (ja) 音声合成装置
JPH04243299A (ja) 音声出力装置
JPH08211896A (ja) 音声合成編集方式および装置

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040517

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20040517

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20050701

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20060314

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060322

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060419

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20061212

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20061225

R151 Written notification of patent or utility model registration

Ref document number: 3900892

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110112

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110112

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120112

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130112

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130112

Year of fee payment: 6

EXPY Cancellation because of completion of term