JP3900892B2 - 合成音声の音質調整方法と音声合成装置 - Google Patents
合成音声の音質調整方法と音声合成装置 Download PDFInfo
- Publication number
- JP3900892B2 JP3900892B2 JP2001333991A JP2001333991A JP3900892B2 JP 3900892 B2 JP3900892 B2 JP 3900892B2 JP 2001333991 A JP2001333991 A JP 2001333991A JP 2001333991 A JP2001333991 A JP 2001333991A JP 3900892 B2 JP3900892 B2 JP 3900892B2
- Authority
- JP
- Japan
- Prior art keywords
- speech
- tag
- information
- sound quality
- formant
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Images
Description
【発明の属する技術分野】
本発明はテキストを音声に変換する音声合成方法および音声合成装置に属するものである。
【0002】
【従来の技術】
波形重畳方式に代表される、従来の音声合成装置では、自立語のような発話の意味内容を示すことばと、付属語のような構文構造を示すことばが同じ明瞭度、同じ強度で発声されたため、聞き手は注意を絞ることが出来ず、長時間聴取すると疲労する音声となっていた。
【0003】
【発明が解決しようとする課題】
しかしながら、波形重畳方式の音声合成では、自立語と付属語の音質を変えるためには、自立語用音声素片と付属語用音声素片を保持せねばならず、素片データの容量が大幅に増加するという課題があった。
【0004】
この発明は上記の課題を鑑み、データ量を増加させずに言語情報あるいは意味情報に対応して声質を変化させる合成音声の音質調整方法と音声合成装置を提供することを目的とする。
【0005】
【課題を解決するための手段】
上記の目的を達成するために、本発明の音声合成装置は、FM文字放送受信部と、音質タグ付き文例データベースと、前記音質タグ付き文例データベースを参照して、前記FM文字放送受信部から出力された文字データから交通情報パタンを持つ文字列を出力する交通情報抽出部と、前記音質タグ付き文例データベースを参照して、音質タグを少なくとも含む言語情報を前記文字列に付与する言語情報出力部と、前記音質タグに基づいて生成された韻律情報および声質情報に従って、音声を合成する音響処理部とを備え、前記音声タグは、強調音声とあいまい音声との適用を示すタグである。
【0007】
本発明の音声合成方法は、音質タグ付き文例データベースを参照して、FM文字放送受信部から出力された文字データから交通情報パタンを持つ文字列を交通情報抽出部が出力し、音質タグを少なくとも含む言語情報を前記文字列に言語情報出力部が付与し、前記音声タグに基づいて生成された韻律情報および声質情報に従って、音響処理部が音声を合成する音声合成方法であって、前記音声タグは、強調音声とあいまい音声との適用を示すタグである。
【0015】
【発明の実施の形態】
以下、本発明の音質調整方法と音声合成装置について、実施例を用いて説明する。
【0016】
(実施の形態1)
図1は、本発明の実施の形態1における音声合成装置の概念構成と各部の入出力データの形式を示した機能ブロック図である。
【0017】
図1において110は漢字かな混じりテキストを入力とし、形態素解析および構文解析を行い、読み、アクセント情報および自立語付属語判断情報を出力する言語処理部であり、120は言語処理部110より出力された読み、アクセント情報に従って、音韻ごとの時間長、ピッチおよびパワー情報(韻律情報)を生成する韻律制御部であり、130は韻律制御部120より出力された韻律情報と言語処理部110より出力された、自立語付属語判別情報に従って、音源-声道モデルのパラメータを制御して音声波形を生成する音響処理部である。
【0018】
以上のように構成された音声合成装置の動作を説明する。言語処理110は入力された漢字かな混じりテキスト(101)「明日は全国的に晴れるところが多く、日中の気温は最高気温が30度を超えるところが多くなる見込みです。」を形態素解析および構文解析し、読み、アクセント区切り、アクセント、付属語記号を含む言語情報(102)を出力する。言語情報102は音韻をカタカナで示し、改行によりアクセント句を示し、アポストロフィ記号によりアクセントを示し、音韻記号を中カッコで囲むことで付属語を示している。韻律制御部は例えば特開平12−075883のようにアクセント句のモーラ数とアクセント型に従って音韻ごとのピッチとパワーを決定し、音韻並びから音韻語との時間長を特定して、音韻毎に時間長、ピッチ、パワーの韻律情報を生成する。一方言語処理110より入力された付属語情報に基づいて、自立語に含まれる音韻は標準の声質、付属語に含まれる音韻はあいまいな声質を指定する声質情報を音韻毎に生成し、音韻毎の韻律情報及び声質情報(103)を出力する。音響処理部130は音韻毎の韻律情報および声質情報(103)に従って、音声を合成する。あいまいな声質が指定された音韻に付いては、音韻の母音部のホルマント周波数を各母音の特徴的ホルマント周波数の重心に近づけ、さらにホルマントバンド幅を標準の2倍にする。このときホルマントのエネルギーが標準ホルマントバンド幅の場合と変わらないようにエネルギーを調整する。上記のように標準声質のパラメータを変更することで、あいまい声質の音声を音韻単位で作り、パラメータを接続し韻律情報に合わせて音源パラメータを変更して、音声を合成する。
【0019】
以上のように、本実施の形態の音声合成装置により、付属語に含まれる音韻のみをあいまいな声質で合成することができ、意味内容を伝える自立語を相対的に明瞭な声質で発声することにより、聴取者が自然に意味内容に注目でき、自然で疲れにくい合成音声を生成することが出来る。
【0020】
(実施の形態2)
図2は、本発明の実施の形態2における音声合成装置の概念構成と各部の入出力データの形式を示した機能ブロック図である。
【0021】
図2において210はFM電波を受信して電波に多重変調されている文字データを出力するFM文字放送受信部であり、220はFM文字放送受信部210が出力した文字データの中から交通情報を抜き出して出力する交通情報抽出部である。230は交通情報の文例と、文例毎にあらかじめ定められた、強調あるいはあいまいの声質指定情報とを保持する音質タグ付き文例データベースであり、240は交通情報抽出部220が出力した交通情報を音質タグ付きデータベース230のデータとマッチングし、音声出力のための読み、アクセント情報および音質情報を出力する言語情報出力部である。韻律制御部120、音響処理部130は図1と同様である。
【0022】
以上のように構成された音声合成装置の動作を説明する。FM文字放送受信部210はFM電波を受信して文字データを抽出し、出力する。交通情報抽出部220はFM文字放送受信部210が出力した文字データより音質タグ付き文例データベース230を参照して交通情報のパタンを持つ情報のみ抽出し文字列(201)を出力する。言語情報出力部240は音質タグ付き文例データベース230を参照して路線、方向、始点等の構成要素をマッチングし、文字列201に最適な文例を選択する。交通情報の抽出と文例の選択は例えば、特開平08−339490に示されるようなマッチングによって行うものとする。言語情報出力部240は文例に文字列201の構成要素を当てはめ、完結した文を生成しその文の読み、アクセント区切り、アクセント、音質タグを含む言語情報(202)を出力する。言語情報202は音韻をカタカナで示し、改行によりアクセント句を示し、アポストロフィ記号によりアクセントを示し、音韻記号を<>で囲むことで強調音声を適用する音韻列を示し、中カッコで囲むことであいまい音声を適用する音韻列を示している。韻律制御部は例えば特開平12−075883のようにアクセント句のモーラ数とアクセント型に従って音韻ごとのピッチとパワーを決定し、音韻並びから音韻語との時間長を特定して、音韻毎に時間長、ピッチ、パワーの韻律情報を生成する。一方言語情報出力部240より出力された音質タグに基づいて、強調音声が指定された音韻については、強調のタグを付与し、あいまい音声を指定された音韻にはあいまい音声のタグを付与して音韻毎の韻律情報及び声質情報(203)を出力する。音響処理部130は音韻毎の韻律情報および声質情報(203)に従って、音声を合成する。強調タグが付与された音韻に付いては音韻の子音部のパワーを標準の1.1倍にし、母音部のホルマントバンド幅を標準の0.8倍にする。あいまいな声質が指定された音韻に付いては、音韻の母音部のホルマント周波数を各母音の特徴的ホルマント周波数の重心に近づけ、さらにホルマントバンド幅を標準の2倍にする。強調、あいまいのどちらのパラメータ変更についても、ホルマントのエネルギーが標準ホルマントバンド幅の場合と変わらないようにエネルギーを調整する。上記のように標準声質のパラメータを変更することで、強調音声、あいまい声質の音声を音韻単位で作り、パラメータを接続し韻律情報に合わせて音源パラメータを変更して、音声を合成する。
【0023】
以上のように、本実施の形態の音声合成装置により、聴取者が注目すべき構成要素に対して強調音声で、意味内容に関連の小さい部分の音韻はあいまいな声質で合成することができ、聴取者が自然に意味内容に注目でき、自然で疲れにくい合成音声を生成することが出来る。
【0024】
【発明の効果】
聴取者が注目すべき意味内容を示す部分を強調された明瞭な音声で提示し、意味内容を直接示さない部分をあいまいな音声で提示することにより、聴取者が自然に意味内容を示す部分に注目でき、自然で疲れない合成音声を生成することが出来る。
【図面の簡単な説明】
【図1】実施の形態1の音声合成装置の概念構成と各部の入出力データ形式を示すブロック図
【図2】実施の形態2の音声合成装置の概念構成と各部の入出力データ形式を示すブロック図
【符号の説明】
110 言語処理部
120 韻律制御部
130 音響処理部
210 FM文字放送受信部
220 交通情報抽出部
230 音質タグ付き文例データベース
Claims (6)
- FM文字放送受信部と、
音質タグ付き文例データベースと、
前記音質タグ付き文例データベースを参照して、前記FM文字放送受信部から出力された文字データから交通情報パタンを持つ文字列を出力する交通情報抽出部と、
前記音質タグ付き文例データベースを参照して、音質タグを少なくとも含む言語情報を前記文字列に付与する言語情報出力部と、
前記音質タグに基づいて生成された韻律情報および声質情報に従って、音声を合成する音響処理部と、
を備え、
前記音声タグは、強調音声とあいまい音声との適用を示すタグである、音声合成装置。 - 前記音響処理部は、前記強調音声のタグまたは前記あいまい音声のタグが前記文字列に付与されている場合に、母音部のホルマントバンド幅を変更する、請求項1に記載の音声合成装置。
- 前記母音部のホルマントバンド幅は、変更前の標準ホルマントにおけるホルマントのエネルギーが変化しないように変更される、請求項2に記載の音声合成装置。
- 音質タグ付き文例データベースを参照して、FM文字放送受信部から出力された文字データから交通情報パタンを持つ文字列を交通情報抽出部が出力し、
音質タグを少なくとも含む言語情報を前記文字列に言語情報出力部が付与し、
前記音声タグに基づいて生成された韻律情報および声質情報に従って、音響処理部が音声を合成する、音声合成方法であって、
前記音声タグは、強調音声とあいまい音声との適用を示すタグである、音声合成方法。 - 前記音響処理部は、前記強調音声のタグまたは前記あいまい音声のタグが前記文字列に付与されている場合に、母音部のホルマントバンド幅を変更する、請求項4に記載の音声合成方法。
- 前記母音部のホルマントバンド幅は、変更前の標準ホルマントにおけるホルマントのエネルギーが変化しないように変更される、請求項5に記載の音声合成方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001333991A JP3900892B2 (ja) | 2001-10-31 | 2001-10-31 | 合成音声の音質調整方法と音声合成装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001333991A JP3900892B2 (ja) | 2001-10-31 | 2001-10-31 | 合成音声の音質調整方法と音声合成装置 |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2003140678A JP2003140678A (ja) | 2003-05-16 |
JP2003140678A5 JP2003140678A5 (ja) | 2005-04-07 |
JP3900892B2 true JP3900892B2 (ja) | 2007-04-04 |
Family
ID=19149186
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2001333991A Expired - Lifetime JP3900892B2 (ja) | 2001-10-31 | 2001-10-31 | 合成音声の音質調整方法と音声合成装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3900892B2 (ja) |
Families Citing this family (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007041012A (ja) * | 2003-11-21 | 2007-02-15 | Matsushita Electric Ind Co Ltd | 声質変換装置および音声合成装置 |
JP4617494B2 (ja) * | 2004-03-17 | 2011-01-26 | 株式会社国際電気通信基礎技術研究所 | 音声合成装置及び文字割当装置並びにコンピュータプログラム |
JP2006208600A (ja) * | 2005-01-26 | 2006-08-10 | Brother Ind Ltd | 音声合成装置及び音声合成方法 |
JP5102939B2 (ja) * | 2005-04-08 | 2012-12-19 | ヤマハ株式会社 | 音声合成装置および音声合成プログラム |
JP5310801B2 (ja) * | 2011-07-12 | 2013-10-09 | ヤマハ株式会社 | 音声合成装置および音声合成プログラム |
WO2013018294A1 (ja) * | 2011-08-01 | 2013-02-07 | パナソニック株式会社 | 音声合成装置および音声合成方法 |
JP7033478B2 (ja) * | 2018-03-30 | 2022-03-10 | 日本放送協会 | 音声合成装置、音声モデル学習装置およびそれらのプログラム |
-
2001
- 2001-10-31 JP JP2001333991A patent/JP3900892B2/ja not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
JP2003140678A (ja) | 2003-05-16 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7565291B2 (en) | Synthesis-based pre-selection of suitable units for concatenative speech | |
KR100303411B1 (ko) | 싱글캐스트 대화형 라디오 시스템 | |
US7035794B2 (en) | Compressing and using a concatenative speech database in text-to-speech systems | |
US7124082B2 (en) | Phonetic speech-to-text-to-speech system and method | |
US7979274B2 (en) | Method and system for preventing speech comprehension by interactive voice response systems | |
JPH06332494A (ja) | 音声を第1の言語から第2の言語に翻訳する際に音声理解を高めるための装置 | |
US20070088547A1 (en) | Phonetic speech-to-text-to-speech system and method | |
JP3587048B2 (ja) | 韻律制御方法及び音声合成装置 | |
JP3900892B2 (ja) | 合成音声の音質調整方法と音声合成装置 | |
US7280969B2 (en) | Method and apparatus for producing natural sounding pitch contours in a speech synthesizer | |
JP3518898B2 (ja) | 音声合成装置 | |
JP2003140678A5 (ja) | ||
JPH0887297A (ja) | 音声合成システム | |
JPH08335096A (ja) | テキスト音声合成装置 | |
US8600753B1 (en) | Method and apparatus for combining text to speech and recorded prompts | |
JPH11161298A (ja) | 音声合成方法及び装置 | |
JPH07200554A (ja) | 文章読み上げ装置 | |
JP4260071B2 (ja) | 音声合成方法、音声合成プログラム及び音声合成装置 | |
JP3113101B2 (ja) | 音声合成装置 | |
JP4056647B2 (ja) | 波形接続型音声合成装置および方法 | |
JPH03214197A (ja) | 音声合成装置 | |
JP2001166787A (ja) | 音声合成装置および自然言語処理方法 | |
JPH11344997A (ja) | 音声合成方法 | |
JPH11327594A (ja) | 音声合成辞書作成システム | |
JPH1185196A (ja) | 音声符号化/復号化方式 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20040517 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20040517 |
|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20050701 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20060314 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20060322 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20060419 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20061212 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20061225 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 3900892 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110112 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110112 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120112 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130112 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130112 Year of fee payment: 6 |
|
EXPY | Cancellation because of completion of term |