JPH07134713A - 音声合成装置 - Google Patents

音声合成装置

Info

Publication number
JPH07134713A
JPH07134713A JP5280901A JP28090193A JPH07134713A JP H07134713 A JPH07134713 A JP H07134713A JP 5280901 A JP5280901 A JP 5280901A JP 28090193 A JP28090193 A JP 28090193A JP H07134713 A JPH07134713 A JP H07134713A
Authority
JP
Japan
Prior art keywords
prosodic
unknown word
word
reading
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5280901A
Other languages
English (en)
Inventor
Hiroshi Sano
洋 佐野
Takaaki Arai
孝章 新居
Hiroyuki Tsuboi
宏之 坪井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Toshiba Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Toshiba Corp filed Critical Toshiba Corp
Priority to JP5280901A priority Critical patent/JPH07134713A/ja
Publication of JPH07134713A publication Critical patent/JPH07134713A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)

Abstract

(57)【要約】 【目的】 テキストが表現する情報内容を損なうことな
く、発声速度を変化させ、且つリズムにより音調を変化
させ、且つ文全体のイントネーションの自然性を向上さ
せるなど柔軟な韻律制御を実現する。 【構成】 音声合成装置20の概略の全体システム構成
を示す。このシステムは、入力部1,言語処理部2,音
韻処理部3,音響パラメータ処理部4,音声波形生成部
5,出力部6からなり、言語処理部2は、韻律素解析
部,韻律語形成部,日本語辞書メモリ,韻律語間依存度
処理部,韻律語間結合度決定部,韻律語データメモリか
らなり、音韻処理部3は、韻律句形成部,呼気段落形成
部,音韻記号・韻律記号生成部,言語音声指示部,合成
音声記号例データメモリからなる。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、一定の規則に従って音
声を合成する音声合成装置に関する。
【0002】
【従来の技術】マルチメディア情報機器の開発進展によ
って、文字や画像イメージに加えて、音声や動画像を情
報伝達の手段として利用できるようになってきた。この
中で音声は利用者に分かりやすい情報の伝達の手段とし
て挙げることができる。音声を使ったコミュニケーショ
ンは本来的に人間にとって最も効率のよい情報提供手段
である。音声メディアを使ったコミュニケーションを的
確に行なうためには、語音の明瞭な発声のための音質の
向上と、各語のアクセントや文のリズム及びイントネー
ションの正確な韻律制御が必要である。
【0003】アクセントやイントネーションに限らず、
テキストの韻律的特徴に関わる制御情報は、文章の内容
を正しく把握することによって得られる。テキスト合成
音声の自然性の向上のためには、発声しようとする文の
構文・意味構造と韻律の対応を正しくとらえることが重
要であり、構文・意味処理を行なう言語処理部を利用し
た韻律制御方式の検討が必要である。こうした観点で、
従来から文の構文・意味構造を用いるテキストからの合
成音生成が盛んに行なわれている。
【0004】一般に、テキストは形態素解析技術を利用
することで語の並びに分割される。語の並びは文節にま
とめられ、構文解析技術を用いた文節間の係り受け関係
の分析によりテキストの構文構造が得られる。この構造
はテキストの意味を間接的に表している。そこで、この
構造を手がかりに意味的にまとまっている部分が判明す
る。意味的なまとまりを発話においても連続して発声す
る部分であると見なすことによって、韻律上まとまる文
節の連鎖が判明する。文節を構成する語の並びには、そ
れぞれの語が持つ読みが与えられ、読みは語音に匹敵す
るので、語音と音節との対応から音節音の連鎖が得られ
る。音節音は母音と子音から構成されることから、最終
的にテキストに対する言語音の連鎖を導き出すことがで
きる。このようにして合成すべき音の連鎖についての情
報がテキストから得られる。
【0005】文節は、テキストの構文の処理単位である
と同時に音声の合成においても処理単位であって、音声
特徴と言語特徴を結び付ける共通の単位となっている。
さらに、文節間の境界は韻律上まとまる単位の境界と密
接な関係があるという指摘があり、この文節の境界の性
質を詳しく調べることで、文節間の結合度を設定するこ
とが可能となる。この結合度に基づいて韻律制御を行な
うことができる(箱田和雄、佐藤大和:「文音声合成に
おける音調規則」、電子通信学会論文誌、電子通信学会
論文誌、Vol.J63−D,No9,1980)。テ
キストからの音声合成では、文節という単位を仲介し文
音声の韻律特徴と文の構文構造を結び付けることで韻律
制御を行なっている。
【0006】文節を単位とした韻律制御で問題点となる
のは、構文分析に適切な文節という文法単位が、音声面
の扱いに適した韻律上の単位と必ずしも同一でない点で
ある。
【0007】音声の合成の面から見た場合、一つのテキ
ストをゆっくり、もしくは早く発声するといった制御は
重要であり、どのように変化させるのかを的確に指示す
る音韻情報がテキストから得られることが望ましい。テ
キストからの音声合成では言語音上の特徴抽出に重点が
置かれなければならない。しかし、発声速度の変化に関
わらず一つのテキストに対する構文解析結果は一様であ
る。それは構文解析が言語形態上の特徴抽出を任務とし
ているからである。
【0008】例えば、文にリズム感を与えたり、重要な
語を示したりするには、通常発声とは違う音調上の特徴
が見られるのが通例である。
【0009】
【数1】 上記対話例文X,Yにおいて、Yの発声を考える。尚、
「|」は文節区切りを示している。Yが、ほかでもない
「ぼく」が行くことを明確に伝えたい場合には、文節で
ある「ぼくが」の自立語部分の「ぼく」に相当する音の
ピッチを高くして強調を示す方法の他に、「ぼく」と
「が」の間に小休止を置くことでも同様の効果が得られ
る。
【0010】次に発声速度を遅くすることを考える。文
節個々をゆっくり発声することや、文節間の休止を長く
するという実現の方法の他に、下記の例のように文節内
部の語間に小休止を置いて発声することでも同様の効果
を得る。なお、「‖」は小休止が置かれる境界を示して
いる。
【0011】
【数2】 自立語と付属語の間に休止が置かれるだけでなく、時に
構文上、文法関係しか示さない付属語の音のピッチが強
まることもある。
【0012】柔軟で細かな韻律制御を実現しようとする
と、従来手法によれば、文節を制御単位とする場合、上
記の例で見るように自立語と付属語の間に休止を置くに
は、一度文節という制御単位を分解しなくてはならな
い。文節内部に休止を置く処理は不可能ではないけれど
も、その実現においては文節内部の処理と文節単位の処
理とを分けなければならない。故に複雑なプロセスを必
要とする。
【0013】構文単位としての文節は、概念や観念を示
す自立語と文法的な関係を示す付属後の連鎖として扱わ
れている。それに対して文の韻律上のまとまりは、言語
音として少なくともひとつのピッチ周波数変化が文節音
連鎖に認められるかどうか、換言すれば少なくとも一つ
のアクセント成分を有するかどうかという音調パターン
を基本としている。
【0014】従来は、多くの自立語が自立的なアクセン
ト型を持つことと、付属語の多くが自律的な固有のアク
セント型を持たず、自立語に音調パターン上、他律的に
付随することでアクセント成分を有するまとまりとなる
ことから、近似的に文節という構文単位を韻律上の制御
単位として利用している。しかし、その場合、前述の例
で挙げたような問題が発生する。
【0015】こうした点を鑑みると、書きことばの基本
単位である自立語や付属語ではなく、音調パターンを基
本とする、話しことばの基本単位、韻律素という単位
(自立的なアクセント成分を有するかどうか、それが有
意義の最小言語形式であるかどうかで決まる)を導入
し、文節ではなく韻律語(韻律素連鎖)を制御単位とす
ることで柔軟な韻律制御が実現できる。すなわち音調上
の性質を優先した単位を設定して、それに基づいて構成
的に韻律語を求めて韻律上のまとまりを導き出すこと
で、柔軟で且つ簡易な手段で韻律制御が可能となる。
【0016】また、近年、文字、音声、図形、映像など
のマルチメディアを入力、出力及び加工することで、人
間とコンピュータとの対話(Human−Comput
erInteraction)を様々な形態で行なう研
究が行なわれている。
【0017】人間同士の対話に用いられるメディアの中
で、音声は内容を伝える言語的情報だけでなく、感情な
どの情緒的情報や男性/女性などの個人性情報を含み、
様々な情報を手軽に自由に伝えることができる特徴があ
る。人間とコンピュータとの対話においてもこのような
情報を伝達できることは自然な対話を行なうために重要
である。
【0018】一方、最近になってメモリ容量や計算機の
パワーが飛躍的に向上したことでマルチメディアを扱え
るワークステーションやパーソナルコンピュータが開発
され、高品質の音声や音響信号が特別なハードウエアな
しに標準システムで入出力できるようになってきた。こ
のような状況から計算機の入出力メディアとして音声入
出力技術は重要なものとなっている。
【0019】従来から音声入出力技術の中でも、音声合
成技術と呼ばれる任意の文章あるいは単語の文字を音声
に変換する技術の開発が行なわれてきている。現在で
は、音声規則合成専用のハードウエアが開発され、テキ
ストの読み合わせなどの応用が広がりつつある。このよ
うな技術により、メディア変換として言語的な情報であ
る文字の音声信号への変換が可能となってきた。しかし
ながら、入力された言語情報から読みやアクセント情報
の抽出できなかった場合は、未知語としてその読み及び
アクセントを所定のルールにより決定して音声出力する
が、間違ったアクセントが生成された場合、意味の取り
違えが起こったり、不自然となって内容の理解が容易で
ない。
【0020】音声出力はできるだけ自然で、確実に人間
に認識されることが必要であり、アクセントも認識のた
めの重要な要素である。そこで、未知語のアクセントを
生成する場合に、入力文字列のモーラ数に従って未知語
のアクセントを決定する方法や、どの未知語も固定のア
クセントとする方法、所定の規則を用いることによって
読みからアクセントを生成する方法が行なわれている
が、必ずしも正しいアクセントが生成されるとは限らな
い。
【0021】上記のように各種の方法により文字音声変
換における未知語のアクセント生成の検討がなされてき
た。しかし、従来の音声合成装置では、未知語において
必ずしも正しいアクセントが生成されるとは限らず、間
違ったアクセントが与えられることにより意味を取り違
えたり、不自然な合成音声になることは避けられなかっ
た。
【0022】アクセント辞書作成時においては、異なっ
たアクセントを順に出力させ、正しいアクセントを特定
する手法があるが、通常の読み上げ時において、アクセ
ントを異ならせて順に出力させて正しいアクセントを特
定する手法はない。通常の読み上げ時に利用者が不適切
であると判断した際に、復唱要求を入力して異なるアク
セント型の合成音声を送出し、正しいアクセントが送出
されるまで繰り返すといった手法があるが、利用者の作
業が煩雑となる。
【0023】自然音声では、間違ったアクセントで発声
した場合など言い直したり、明示的に繰り返して発声す
ることにより、正確に発声内容を伝達しようとする場合
がある。
【0024】
【発明が解決しようとする課題】上記したように、柔軟
で細かな韻律制御を実現しようとすると、従来手法によ
れば、文節を制御単位とする場合、上記の例で見るよう
に自立語と付属語の間に休止を置くには、一度文節とい
う制御単位を分解しなくてはならない。文節内部に休止
を置く処理は不可能ではないけれども、その実現におい
ては文節内部の処理と文節単位の処理とを分けなければ
ならない。故に複雑なプロセスを必要とする。
【0025】そこで、第1の発明では、テキストが表現
する情報内容を損なうことなく、発声速度を変化させ、
且つリズムにより音調を変化させ、且つ文全体のイント
ネーションの自然性を向上させるなど柔軟な韻律制御を
実現することを目的とする音声合成装置を提供する。
【0026】また、上記のように各種の方法により文字
音声変換における未知語のアクセント生成の検討がなさ
れてきたが、従来の方法による音声合成装置では、未知
語において必ずしも正しいアクセントが生成されるとは
限らず、間違ったアクセントが与えられることにより意
味を取り違えたり、不自然な合成音声になることは避け
られなかった。
【0027】そこで、第2の発明は、上記事情に鑑みて
なされたもので、通常の読み上げ時に、未知語の発声に
おいてアクセントの異なるものを複数回読み上げる制御
を可能とし、通常の読み上げ時において、指示入力によ
りアクセント情報を特定し登録することを可能とする音
声規則合成の実現手段を提供することを目的とするもの
である。
【0028】
【課題を解決するための手段】第1の発明の音声合成装
置は、テキストを分析する言語処理部と、この言語処理
部による分析結果を基に韻律記号列と音韻記号列を導き
出す音韻処理部と、この音韻処理部の結果を基にして音
声合成の時間変化するパラメータ系列を生成する音響パ
ラメータ生成部と、この音響パラメータ生成部からパラ
メータ系列に基づいて音声信号を生成する音声波形生成
部を備えたものであって、前記言語処理部は、テキスト
を韻律素から構成される韻律語に分割する分割手段と、
分割された各韻律語に対して韻律語固有の音韻情報並び
に言語情報を設定する設定手段と、隣接する韻律語間の
隣接依存度を算出する韻律語間依存度処理部と、隣接す
る韻律語間の結合度を韻律語の構文性質と算出された隣
接依存度とに基づいて算出する韻律語間結合度決定部か
ら構成され、前記音韻処理部は、文全体のリズムや発声
速度など発声情報を指示する言語音声指示部と、この言
語音声指示部から指示された発声情報と前記結合度を用
いて韻律上まとまる韻律語連鎖を求めて音調パターンを
決定する韻律句形成部と、韻律句間の休止長を決定する
呼気段落形成部と、韻律句連鎖と呼気段落の形成情報に
基づいて入力テキストに対応する音韻記号と韻律記号を
作り出す音韻記号・韻律記号生成部から構成される。
【0029】第2の発明の音声合成装置は、入力部から
入力された合成すべき音声の内容情報から言語情報を抽
出する言語処理部と、前記言語情報より音韻情報を生成
する音韻処理部と、韻律情報を生成する韻律処理部と、
前記音韻情報及び韻律情報により合成パラメータを生成
する合成パラメータ生成部と、前記合成パラメータより
音声波形を生成する音声波形生成部を具備したものにお
いて、未知語に対してその読みを決定する未知語読み処
理部と、前記未知語のアクセントを決定する未知語アク
セント処理部と、未知語を読み上げる方法を決定する未
知語読み上げ方法処理部と、前記未知語の読み、アクセ
ント及び読み上げ方法にしたがって前記未知語の読み上
げの制御を行なう未知語制御部と、指示入力により前記
未知語のアクセント情報を特定する指示入力部とを具備
するものである。
【0030】
【作 用】第1の発明の音声合成装置においては、テキ
スト解析を行なう時に、語に代わり、音調を基本とする
単位「韻律素」を分析単位に用いることと、音調パター
ンの処理にあっては、韻律素から構成される韻律語を制
御単位として、文節間の結合度に代えて韻律語間の結合
度を利用する。そして、韻律素を基本の単位としてテキ
ストを分析し、その結果から韻律語を構成し、韻律語ど
うしの依存度と韻律語間に隣接する結合性を設定するこ
とで、それに基づいて構成的に韻律上のまとまりを導き
出すことで、柔軟で且つ簡易な手段で韻律制御が可能と
なる。
【0031】すなわち、言語処理部にあっては、分析単
位として音調パターンを基本とする韻律素を基にテキス
トを解析し、解析された韻律素連鎖から韻律語の並びを
求めて、それら韻律語間に隣接依存度と隣接結合度を設
定することによって韻律句連鎖を導いて音調パターンを
決定する手段と、音声合成装置を構成する音韻処理部に
あっては、言語音声指示部によって指定された情報に従
い、文全体のリズムや発声速度など音韻条件を定め、当
該条件を適切に満たすように言語処理部で算出した韻律
語連鎖を評価計算して音調パターンを再算出する手段に
より、柔軟な韻律制御を実現する。
【0032】第2の発明の音声合成装置では、入力部か
ら入力された合成出力しようとする音声の発声内容情報
を言語処理部で処理し、合成処理に必要な情報を決定
し、音韻処理部、韻律処理部で韻律成分を付加した音韻
記号列を生成する。この記号列から合成パラメータ生成
部で合成パラメータ系列を生成し、音声波形生成部で出
力波形を生成する。また、音声合成装置は、未知語の読
みを決定する未知語読み処理部と、未知語のアクセント
を決定する未知語アクセント処理部と、未知語の読み上
げ方法を決定する未知語読み上げ方法処理部と、未知語
を複数回読み上げる制御を行なう未知語制御部と、指示
入力によりアクセント情報を特定する指示入力部とを有
している。そのため、通常の読み上げ時において、未知
語アクセント処理部で生成された異なるアクセント情報
で未知語を読み上げ、指示入力によりアクセントを特定
することにより、意味の取違えを少なくし、自然な音声
を規則合成することが可能となる。
【0033】
【実施例】以下、第1の発明の音声合成装置20の実施
例を図1〜図6に基づいて説明する。
【0034】図1は、音声合成装置20の概略の全体シ
ステム構成を示す。このシステムは、入力部1,言語処
理部2,音韻処理部3,音響パラメータ処理部4,音声
波形生成部5,出力部6からなる。
【0035】図2は、言語処理部2の内部の詳細構成を
示したものである。言語処理部2は、韻律素解析部7,
韻律語形成部8,日本語辞書メモリ9,韻律語間依存度
処理部10,韻律語間結合度決定部11,韻律語データ
メモリ12からなる。
【0036】図3は、音韻処理部3の内部の詳細構成を
示したものである。音韻処理部3は、韻律句形成部1
3,呼気段落形成部14,音韻記号・韻律記号生成部1
5,言語音声指示部16,合成音声記号例データメモリ
17からなる。
【0037】まず、各構成部分の説明をする前に韻律素
について説明する。
【0038】「韻律素」とは、言語音上、有意義の最小
単位である分節素連鎖をいい、その連鎖中にピッチ変化
が認められるものを自律韻律素と呼び、ピッチ変化が認
められないものを他律韻律素と呼ぶ。
【0039】これに対して「形態素」は、有意義の言語
形態上の最小単位であり、語の構成要素である(森岡健
二,「語彙の形成」,明治書院1987)。そして、形
態素は語基、接辞、助辞に分類される。語基は概念もし
くは観念を示す形態で自由形式と束縛形式がある。前者
は「月,ゆっくり,花」などのそれ自身で意味をなすこ
とのできる形態素である。後者は、「高,静か,食べ」
などのように、それ自身では意味を示すことができず、
助辞とか接辞が接続することによって意味を有する形態
である。接辞と助辞は、語基の前後に接続して語を構成
する働きがある。
【0040】形態素をさらに分解すると音節の連鎖とな
り分節素連鎖に対応する。したがって分節素連鎖を通じ
て形態素と韻律素が対応する。音声合成における音調処
理の基本単位としてこの韻律素を用いる。
【0041】次に、上述の各構成部分について説明す
る。
【0042】韻律素解析部 韻律素解析部7は、入力部から出力された漢字仮名混じ
り文を入力し、入力された漢字仮名混じり文を日本語辞
書メモリ9を参照して、韻律素の表層形態規模が最長の
ものが優先されて一致するか、又は文中の韻律素数が最
小となるよう、あるいは、日本語辞書メモリ9に記載さ
れた韻律素の連接コストに従って、韻律素を選択するコ
スト最小法等を用いてテキストを各韻律素に分割する。
韻律素解析部7は韻律素連鎖を出力し、韻律語形成部8
に送る。
【0043】韻律語形成部 韻律語形成部8は、韻律素連鎖を基に、それぞれの韻律
素が日本語辞書メモリ9に蓄えられている情報を基に、
自律韻律素であるか他律韻律素であるかを判断し、少な
くとも一つの自律韻律素もしくは語基に所属する他律韻
律素と、それに後続するゼロ個以上の助辞,接辞に所属
する他律韻律素を結合して韻律語を構成する。この段階
で韻律素連鎖は韻律語の連鎖となる。日本語辞書メモリ
9には、韻律素毎に、文法カテゴリ名、読み、形態分類
(語基か助辞・接辞かの分類)、韻律素分類(自律韻律
素か他律韻律素かの分類)、自律韻律素である場合に
は、その基本アクセント型が予め格納されている。韻律
語形成部8において、韻律語の読み、アクセント型、文
法カテゴリ、韻律語のモーラ数が設定されて出力され
る。
【0044】韻律語間依存度処理部 韻律語間依存度処理部10では、韻律語連鎖を入力とし
て、韻律語に設定された文法カテゴリ情報を基に、韻律
語データメモリ12に予め蓄えられている。文法カテゴ
リ間相互の依存関係表を参照して、隣合う2つの韻律語
間に依存関係を設定する。図4は、韻律語データメモリ
12に蓄えられている文法カテゴリ間相互の依存関係の
例である。韻律語連鎖の先頭の韻律語から、末尾の韻律
語に至り、すべての隣合う韻律語間に依存関係を設定す
る。この結果を韻律語間結合度決定部11に出力する。
【0045】韻律語間結合度決定部 韻律語間結合度決定部11では、韻律語連鎖の先頭の韻
律語から、末尾の韻律語に至り、すべての隣合う韻律語
間に隣接結合度を設定する。この値は、文法カテゴリ間
相互の結合度表と、既に設定されている依存関係を参照
して、2つの値から算出して、隣合う2つの韻律語間に
結合度を設定する。図5は、韻律語データメモリ12に
蓄えられている文法カテゴリ間相互の依存度の例であ
る。この結果を音韻処理部3に出力する。
【0046】音韻処理部 音韻処理部3では、韻律語連鎖から韻律句の形成を行な
いピッチパターンを求め、さらに言語音声指示部16か
らの指示によって、韻律句連鎖の再調整を行ない最終的
なピッチパターンを求め、それとともに呼気段落間のポ
ーズ長の設定を行なって韻律句連鎖を決定する。音韻記
号生成・韻律記号生成部15は、得られた韻律句連鎖を
基に、韻律記号列と単音記号列を生成し、音響パラメー
タ生成部4に出力する。音響パラメータ生成部4では、
音韻処理部3の結果を基にして、音声合成器を駆動する
ための時間パラメータ系列を生成する。この系列は、音
声波形生成部5に送られて、出力部6を通じて出力され
る。
【0047】韻律句形成部 韻律句形成部13は、一文に対応する韻律語連鎖から韻
律句を形成する。韻律句は1つ以上の韻律語連鎖から構
成されるが、どの韻律語どうしを結合するかは、言語音
声指示部16から指示される値と、既に韻律語間に設定
されている隣接結合度を参照することで決まる。すなわ
ち指示される値よりも大きな隣接結合度を有する2つの
韻律語は融合する。融合した韻律語はアクセント処理が
行なわれ、韻律句を構成する韻律語連鎖をもとに韻律句
全体の読み、ならびにモーラ数が決定される。この結果
は呼気段落形成部14に出力される。
【0048】呼気段落形成部 呼気段落形成部14では、韻律句連鎖の入力に対して、
言語音声指示部16から指示される一呼気に許されるモ
ーラ数と、韻律句に既に設定されているモーラ数を参照
して、該韻律句を呼気段落とするかどうかを判定する。
すなわち、指示される値よりも大きなモーラ数を有する
韻律句は、韻律句を構成している韻律語連鎖の中で、韻
律語間の隣接結合度や、あるいは文法カテゴリを参照す
ることで、ある韻律語間が分離されることになる。逆に
モーラ数が少ない韻律句は、後続の句の文法カテゴリや
隣接結合度を参照することで融合し、一つの呼気段落と
する。このようにして再計算をしながら次々と呼気段落
を求め、最終韻律句の処理が終わるまで続ける。図6
は、呼気段落決定のアルゴリズムを示したものである。
【0049】韻律句連鎖には文頭から番号が付与されて
いる(1〜N,Nは末尾の最終韻律句)。呼気段落の形
成は、1番目の韻律句から処理が始まり、N番目の韻律
句の処理が終了するまで図6に示すアルゴリズムに従っ
て行なわれる。n番目の韻律句の処理を図6に示すアル
ゴリズムに従って説明する。
【0050】(step1)言語音声指示部16が指示
する最大一呼気段落のモーラ数を参照して、当該n番目
の韻律句のモーラ数を検査する。韻律句のモーラ数が大
きい場合にはstep5に進む。
【0051】step5では、当該n番目の韻律句を分
割する。分割する場合に、言語音声指示部16の指示に
従って、例えば、韻律句を構成している韻律語間の結合
度を参照し、最も結合度の小さいものを選択するなどの
処理を行なう。また、韻律句の持つ文法カテゴリによっ
て分割位置が決まる場合もある。次にstep6に進み
韻律句の総数Nを1つ増やす。step1に戻り処理を
続ける。
【0052】韻律句のモーラ数が小さい場合にはste
p2に進む。
【0053】(step2)言語音声指示部が指示する
最小一呼気段落のモーラ数を参照して、当該n番目の韻
律句のモーラ数を検査する。韻律句のモーラ数が小さい
場合にはstep7に進む。
【0054】step7では、当該n番目の韻律句と次
のn+1番目の韻律句を融合する。次にstep8に進
み韻律句の総数Nを1つ減らす。step1に戻り処理
を続ける。
【0055】韻律句のモーラ数が大きい場合にはste
p3に進む。
【0056】(step3)n番目の韻律句の音調パタ
ーンを韻律語連鎖から求める。
【0057】(step4)nが韻律句連鎖の総数Nに
等しいかどうかを検査する。等しい場合には、文末の韻
律句までの処理が終了したので処理を終える。
【0058】nがNに等しくない場合には、n+1番目
の韻律句を処理するためにnを1つ増やし、step1
に戻る。
【0059】音韻記号・韻律記号生成部 音韻記号・韻律記号生成部15は、上述の処理手続で得
られた、テキストを構成する語彙のそれぞれの読み、読
みに対する語音の表層における音調変化、韻律句境界の
音調性質と呼気段落から韻律情報を基にして、音韻記号
と韻律記号列を生成する。語音に対応する音節音の記
号、アクセントを指示する記号、休止区間長を指定する
記号などは、それぞれ合成音声記号列データメモリ17
を参照することで得る。
【0060】言語音声指示部 言語音声指示部16は、文全体のリズム、発声速度、強
調部分の指定など発声情報を言語処理部2と音韻処理部
3に対して指示する。この情報は、テキストの構文・意
味解析結果を参照することで得るほか、もしくは外部か
ら直接指示することによって与える。当該情報を基に言
語音声指示部16は、言語処理部2に対しては入力デー
タに対する韻律語連鎖の個々の属性変更指示を行なう
他、韻律語依存度ならびに韻律語間結合度を臨時に変更
するための指示を発する。音韻処理部3に対しては、韻
律句形成時の音調パターンの変更指示を行なうほか、一
呼気段落に許容されるモーラ数を指示する。
【0061】具 体 例 以下、音声合成装置20による具体例を説明する。
【0062】下記、例文(1)を基に韻律に関わる処理
を例に挙げる。
【0063】
【数3】 図2の入力部1から送られる例文(1)は、同図の韻律
素解析部7において解析される。形態素に替えて韻律素
によって例文(1)を分析すると(2)のようになる。
[ ]は自律韻律素、< >は他律韻律素であることを
示す。
【0064】
【数4】 この結果を基に、図2の韻律語形成部8で一つの自律韻
律素とゼロ個以上の他律韻律素を結び付けて韻律語とす
る音調上の融合処理を行なうと、(3)となる。{ }
は韻律語を示す。
【0065】
【数5】 (3)は基本のアクセントパターンを有する語の連鎖
(韻律語連鎖)となる。次に、韻律語間の依存度と結合
の度合い決定する(韻律語間依存度処理部10と韻律語
間結合度決定部11)。この結合の程度についての情報
は、図4ならびに図5に挙げるように、韻律素の形態的
な、もしくは構文的な性質から判断することができる。
この情報は予め韻律語間データメモリ12に記載してお
く。例では、図5を参照することによって韻律語間に結
合度を設定すると(4)となる。
【0066】
【数6】 ここで、韻律語間に設定される値(A;B)は、依存度
(A)と結合度(B)を示している。依存度1は依存関
係があること、依存度0は非依存関係があることを示し
ている。結合度は小さいほど結合性が強いことを示す。
この結果は、図3の韻律句形成部13に送られる。
【0067】韻律句形成部13では、韻律語間の依存度
が1である韻律語連鎖を韻律句とするとともに音調上の
融合処理を行なう。韻律句連鎖は、呼気段落形成部15
に送られ、図6に示すアルゴリズムに従って呼気段落が
形成され、(5)のような韻律上の単位が決定される。
なお、「‖」は呼気段落境界を示し休止が置かれる位置
である。
【0068】
【数7】 次に入力テキストの構文解析結果、もしくは、外部から
の直接指定によって「新幹線」を強調して発声する場合
を示す。「新幹線」という語のピッチ周波数を高くする
のではなく、「新幹線」と「の」の間に小休止を置くこ
ととする。この情報は言語音声指示部によって言語処理
部に送られる。この指示によって言語処理部2の韻律素
解析部7では、テキストの韻律素解析結果のうち、
「の」を臨時に自律韻律素に変える((6)例)。韻律
語間依存度処理部10では、「新幹線」と「の」の間に
非依存関係を設定する((7)例)。
【0069】
【数8】 上記に示した設定変更を行ない、図3の音韻処理部3に
おける音調処理を再度適用させることで(8)が得られ
る。
【0070】
【数9】 一般に行なわれるような、強調部分の語音のピッチ周波
数を上げる場合、言語音声指示部は音韻処理部3に情報
を送る。韻律句形成部13は、この情報を基に「新幹
線」に対応する語音にピッチ周波数を上げた音調パター
ンを付与する。(9)例に示す。尚、強調文字はピッチ
周波数が通常よりも上がっていることを示す。
【0071】
【数10】 極度に低速で発声する場合を考える。すべての韻律素間
に休止を置く。言語音声指示部は、言語処理部2に対し
て指示を与え、それに従い、韻律語解析部7ではすべて
の他律韻律素を自律韻律素に変えるとともに、韻律語間
依存度処理部10では非依存関係を自律韻律素間に設定
する((10)例)。設定変更の結果は、図3の音韻処
理部において音調処理が再度適用されることで(11)
が得られる。
【0072】
【数11】 本実施例では、いずれの処理も同じ音声合成装置20に
より実現することができる。
【0073】このように韻律語間の隣接結合度を、韻律
語間の依存関係と韻律語が文法カテゴリに基づいて算出
し、さらに、言語音声指示部16によって指示される値
を基に隣接結合度を参照し韻律句を構成する。ピッチな
どの音調パターンは、韻律句を構成する韻律語のアクセ
ント型と依存関係から求める。この韻律句連鎖は、一呼
気段落を構成するモーラ数を指示する言語音声指示部1
6の指令によって再構成され、その都度、音調パターン
が再計算される。このように呼気段落の長さ指定に対し
て、その条件に適合するように、韻律語間の結合度、な
らびに依存関係を使って再計算するために、速度を変化
させる場合にも自然な韻律句が構成されるだけでなく、
韻律語を制御単位とすることから簡便な処理だけで、こ
うした柔軟な韻律制御が可能となる。
【0074】次に、第2の発明の音声合成装置100の
一実施例を図7〜図11に基づいて説明する。
【0075】音声合成装置100は、図7に示すよう
に、入力部102、言語処理部104、音韻処理部10
6、韻律処理部108、合成パラメータ生成部110、
音声波形生成部112と、未知語読み処理部114、未
知語アクセント処理部116、未知語読み上げ方法処理
部118、指示入力部120、未知語制御部122から
構成される。
【0076】入力部102から入力された合成出力しよ
うとする音声の発声内容情報を言語処理部104で処理
し、合成処理に必要な情報を決定し、音韻処理部10
6、韻律処理部108で韻律成分を付加した音韻記号列
を生成する。この記号列から合成パラメータ生成部11
0で合成パラメータ系列を生成し、音声波形生成部11
2で出力波形を生成する。
【0077】また、音声合成装置100は、未知語の読
みを決定する未知語読み処理部114と、未知語のアク
セントを決定する未知語アクセント処理部116と、未
知語の読み上げ方法を決定する未知語読み上げ方法処理
部118と、未知語を複数回読み上げる制御を行なう未
知語制御部122と、指示入力によりアクセント情報を
特定する指示入力部120とを有している。そして、通
常の読み上げ時において、未知語アクセント処理部11
6で生成された異なるアクセント情報で未知語を複数回
読み上げ、指示入力によりアクセントを特定し登録する
ことにより、意味の取違えを少なくし、自然な音声を規
則合成することが可能となる。
【0078】次に各処理部について、詳細に説明する。
【0079】言語処理部 言語処理部104は、文字音声変換の場合には、入力部
102から入力された漢字仮名交じり文を解析し、音声
処理に必要な情報である「語、文節の境界、漢字の読
み、単語のアクセント、係り受け、及び品詞、活用形」
等を決定する。
【0080】例えば、言語処理部104において形態素
解析、構文解析、意味解析などを行なうことにより、音
声処理で必要な情報、すなわち語、文節の境界、漢字の
読み、単語のアクセント、係り受け、品詞、活用形など
の情報を出力することができる。
【0081】形態素解析では、入力文を単語単位に分割
し、それぞれの単語の品詞や活用情報などの文法情報
と、語、文節の境界などを得ることができる。また、形
態素解析における辞書検索結果から漢字の読みや、単語
のアクセントなどを得ることができる。ここでは、辞書
には各単語の読み、アクセントが付加されているものを
用いる。
【0082】構文解析では、形態素解析で得られた語、
文節に対して、構文木などを作成して解析し、各語、文
節間の係り受けや文節間の結合度の情報などを求めるこ
とができる。
【0083】意味解析では、構文解析で得られる単語の
意味属性を含んだ解析結果から、1つ1つの文の意味構
造を出力することができる。
【0084】一方、概念から合成する音声規則合成にお
いては、言語処理部104は合成する内容の概念的な表
現で表わした解析を行ない、統語境界、品詞、読み、ア
クセントなどの情報を出力する。具体的には語の係り受
け処理、述語を中心とした各関係処理、述語の文法処
理、文間の接続処理を行ない、上述した情報を得る。
【0085】また、言語処理部104では、解析におい
て辞書にない単語でその読みとアクセントなどの情報が
得られなかった場合、その単語を未知語として、未知語
読み処理部114及び未知語制御部122にその単語を
出力する。
【0086】未知語読み処理部 未知語読み処理部114では、言語処理部104から出
力されてきた未知語に対して、その読みを決定する。
【0087】未知語に対して、公知の方法でその読みが
決定される。すなわち、未知語のうち漢字未知語は、漢
字1文字毎の読みが予め格納されている漢字辞書を参照
して未知語読み処理部114において一旦読みに変換さ
れた後、未知語アクセント処理部116へ出力される。
また、未知語のうち平仮名、片仮名の未知語は、その平
仮名、片仮名を読みとしてそのまま未知語アクセント処
理部116へ出力される。
【0088】未知語アクセント処理部 未知語アクセント処理部116では、未知語読み処理部
114から出力された読みに対して、所定のルールを用
いることによって読みから異なるアクセントを複数生成
する処理が行なわれる。
【0089】異なるアクセントの複数生成には、規則等
により生成することができ、この方法により生成される
複数のアクセントと、アクセントの生成順番やアクセン
トの妥当性などのアクセント情報を未知語読み上げ方法
処理部118に出力する。
【0090】未知語読み上げ方法処理部 未知語読み上げ方法処理部118では、入力された未知
語の読み及びアクセント情報から、読み上げ回数及び異
なるアクセントの読み上げ順番を決定し、それらの読み
上げ情報を未知語制御部122に出力する。
【0091】未知語の読み上げは、通常の読み上げ時に
おいて、複数回読み上げる度に未知語アクセント処理部
116で生成された異なるアクセントで読み上げられ
る。
【0092】未知語の読み上げ回数は、予め回数を指定
しておくか、または同じ未知語が複数出現する場合は、
2回目以降は指定した回数しか音声出力しないなどの規
則により、読み上げ回数が決定され出力される。読み上
げ回数の決定には、次の読み上げ回数規則の一部あるい
はすべてが設けられる。
【0093】1.生成されたアクセントをすべて読み上
げる。
【0094】2.生成されたアクセントにおいて予め指
定した回数でだけ読み上げる。
【0095】3.先に読み上げた未知語と同じ単語が複
数出現する場合、予め指定した出現回数目以降の読み上
げ回数は予め指定した回数だけ読み上げる。
【0096】未知語の複数のアクセントでの読み上げ順
番は、上記の規則で決定された読み上げ回数にしたがっ
て、次の規則で指定された順番で読み上げられる。読み
上げ順番の決定には、次の読み上げ順番規則の一部ある
いはすべてが設けられる。
【0097】1.アクセントの生成された順で読み上げ
る。
【0098】2.生成された各アクセントに優先順位を
設け、優先順位順に読み上げる。優先順位は、アクセン
ト生成における所定の生成規則により得られる妥当性な
どのアクセント情報から得られた順位とする。
【0099】3.予め指定されたアクセント型の順に従
い読み上げる。
【0100】4.平仮名、または漢字の場合、アクセン
ト型が0型のものを最初に読み上げる。
【0101】以上のようにして生成された複数の異なる
アクセントで未知語を読み上げるための情報を未知語制
御部122に出力する。
【0102】指示入力部 指示入力部120は、通常の読み上げ時において、次に
示す未知語制御部122において未知語のアクセントを
特定するための情報を入力する部分である。
【0103】通常の読み上げ時に、未知語が異なるアク
セントで複数回読み上げられている状態において、キー
入力や音声認識などの入力手段により、対象となってい
る未知語の異なるアクセントのいずれかを特定する情報
を入力する。
【0104】指示入力部120は、指示入力のあったタ
イミング、及び未知語のアクセントを特定するなどの入
力情報を未知語制御部122に出力する。
【0105】未知語制御部 未知語制御部122は、図8に示すように、各処理部か
ら出力された未知語、読み、異なる複数のアクセント情
報、読み上げ回数、読み上げ順番などの読み上げ情報と
いった未知語情報を未知語情報登録バッファに蓄積し、
そのまま音韻処理部106に出力したり、未知語情報登
録バッファに存在する未知語が言語処理部104より出
力された場合は、未知語情報を登録せず、登録バッファ
内から未知語情報を音韻処理部106に出力したり、通
常の読み上げ時において、指示入力部120からの情報
により、未知語のアクセントを特定し登録することによ
り、登録バッファ内の未知語情報を変更して登録された
未知語情報を音韻処理部106に出力する制御を行な
う。
【0106】未知語制御部122では、言語処理部10
4からの出力である未知語と、未知語制御部122前段
からの出力である未知語の読み、アクセント、読み上げ
方法などの未知語情報を未知語情報登録バッファに登録
していく。ただし、既に同じ未知語が登録されている場
合は未知語情報を登録せずに、登録バッファ内の未知語
情報を利用する。
【0107】また、通常の読み上げにおいて、指示入力
部120からの出力である指示入力のタイミングと未知
語の複数の異なるアクセントのいずれかを特定する情報
が与えられた場合、その未知語の特定されたアクセント
を登録バッファに登録し、また読み上げ方法において
も、読み上げは一回のみとするように未知語情報登録バ
ッファに登録する。これにより、指示入力によりアクセ
ントの特定された未知語は、同一の未知語が言語処理部
104より出力された場合、既に登録バッファに登録さ
れているアクセント、読み上げ情報により、特定された
アクセントで読み上げるように未知語情報を音韻処理部
106に出力する。
【0108】音韻処理部 音韻処理部106は、言語処理部104より出力された
漢字の読みや辞書項目などの情報から単語の音韻属性な
どを生成し、これに韻律処理部108からの出力である
フレーズ記号やポーズ記号などや意味的な切れ目などを
示す韻律情報などを用いて鼻音化や無声化、連濁といっ
た一般に良く知られた音韻規則に従って、合成文の各単
語の読みを決定し、単音記号列を出力する。また、韻律
処理部108でのアクセント型の決定のために必要な単
音音韻属性情報などを韻律処理部108に出力する。
【0109】未知語に対しては、未知語制御部122か
らの出力である未知語の読み、アクセント、読み上げ回
数などの未知語情報により、未知語の複数回分の単音記
号列を言語処理部104からの出力情報と合わせて音韻
処理部106で処理して出力し、また、単音音韻属性情
報などを言語処理部104からの出力情報により生成さ
れた単音音韻属性情報などと合わせて韻律処理部108
に出力する。
【0110】韻律処理部 韻律処理部108は、図9に示すように、韻律処理部1
08では、音韻処理部106で生成された単音記号列や
単語音韻属性などの音韻情報と、言語処理部104で出
力された文節の境界、単語のアクセント、及び文法情報
などの言語情報を入力として、基本周波数パターンやパ
ワー、継続時間、ポーズの位置などの韻律成分を決定す
る。
【0111】決定された韻律成分により、韻律処理部1
08で出力された単音記号列を句音声区間に分け、各句
音声区間においてポーズ成分、フレーズ成分の立ち上が
り、立ち下がりなどの韻律情報を示す韻律記号列を付加
した音韻記号列が生成され、合成パラメータ生成部11
0に出力される。
【0112】合成パラメータ生成部 合成パラメータ生成部110は、図10に示すように、
音韻処理部106の処理結果である単音記号及び韻律処
理部108の処理結果であるポーズ記号に基づいて音声
合成器の合成フィルタの特性を制御する伝達特性パラメ
ータ時系列を生成すると同時に韻律処理部108の処理
結果である話調記号、アクセント記号に基づいて音声合
成器の音源周波数を制御する基本周波数時系列を生成す
る。
【0113】すなわち、単音記号、ポーズ記号に対応す
る音節パラメータ系列を記号の連なりに従って接続する
ことによって伝達特性パラメータの時系列を生成し、一
方、アクセント記号、話調記号に従って基本周波数パタ
ーン生成モデルへの指令を生成し、基本周波数パターン
生成モデルに指令を入力することにより基本周波数時系
列を生成する。
【0114】音節パラメータ系列、伝達特性パラメータ
系列は音声合成器の合成フィルタパラメータの系列から
構成されるものであり、音節パラメータでは一定時間間
隔毎の合成フィルタパラメータの系列により各音節の周
波数的な特徴の変化を表わしている。ポーズ区間では音
声出力がないので合成パラメータの音源ゲインがゼロに
設定されている。また、伝達特性パラメータ系列は設定
されている発声速度と音韻継続時間長に従って音節パラ
メータ系列を接続する。接続においては各パラメータが
自然音声と同じように滑らかに変化するようにパラメー
タ間の補間処理が行なわれる。
【0115】韻律処理部108の処理結果である話調成
分とアクセント成分の制御を行なうための話調記号、ア
クセント記号に基づいて音声合成装置の音源周波数を制
御するための基本周波数時系列を生成する。
【0116】音声波形生成部 音声波形生成部112は、合成パラメータ生成部110
の処理結果である音声合成装置のフィルタの特性を制御
する伝達特性パラメータ時系列と音声合成器の音源周波
数を制御する基本周波数時系列に基づいて音声合成装置
の合成フィルタを駆動し音声波形を生成する。
【0117】例えば、図11に示すようなやホルマント
型合成器による音声波形生成の例を説明する。
【0118】ホルマント型合成器は、基本周波数時系列
と伝達特性パラメータ時系列の音源のゲインパラメータ
に基づいて、音声音源の周波数及び有声音源、無声音源
のゲインを制御しながら音源波形を生成する。さらに、
伝達特性パラメータ時系列の合成フィルタの中心周波数
パラメータとバンド幅パラメータに基づいて合成フィル
タを制御しながら音源波形を入力して各フィルタの出力
波形を求め、それぞれの合成フィルタの出力波形の和を
合成器の出力とする。例えば、標本化周波数を12kH
z、8msec毎に合成パラメータを更新し、有声音源
にはインパルスにローパスフィルタをかけたものを、無
声音源には乱数発生機を利用することができる。
【0119】ここではホルマント型合成器による波形成
形について説明したが、合成器の構成、音源の種類、標
本化周波数等も一般的に知られたものを利用することが
できる。
【0120】具 体 例 音声合成装置100について、具体例を用いて説明す
る。
【0121】音声合成装置100では、通常の読み上げ
時において、未知語に対して異なるアクセントで複数回
読み上げる制御を可能とし、通常の読み上げ時に指示入
力により未知語のアクセントを特定し登録することによ
り、意味の取違えが少なく、自然な音声が合成できるこ
とが特徴である。
【0122】自然音声では、間違ったアクセントで発声
した場合など言い直したり、明示的に発声することによ
り、正確に発声内容を伝達しようとする場合があり、合
成音声においても意味の取違えを少なくするためには、
未知語を異なるアクセントで複数回読み上げることが必
要である。さらに、正しいアクセントを登録することに
より、未知語を正しいアクセントで読み上げられるよう
にすることが可能である。
【0123】通常の読み上げ時において、未知語を異な
るアクセントで複数回読み上げるには、未知語の読み及
び異なる複数のアクセント情報から、読み上げ回数及び
複数の異なるアクセントの読み上げ順を決定し、それら
の未知語情報に基づいて音声出力する。その音声出力に
対して、通常の読み上げ時に指示入力により正しいアク
セントを特定することにより、アクセントを登録し、以
後の読み上げにおいて未知語を正しいアクセントで読み
上げることが可能となる。
【0124】通常の読み上げ時において、未知語を異な
るアクセントで複数回読み上げる場合の例について示
す。
【0125】例えば、入力文が「六つに再編した。再編
により…」といった文であり、言語解析部において、
「再編」という単語が未知語であった場合、本発明での
処理は次のようになる。
【0126】言語処理部104から未知語として出力さ
れた単語「再編」は、未知語読み処理部114に送ら
れ、その読みが決定される。未知語の読みは所定の規則
にしたがって決定され、その場合「さいへん」と読みが
決定される。
【0127】次に読みが与えられた未知語に対して、未
知語アクセント処理部116により、複数の異なるアク
セントが生成される。ここでは、アクセント生成におい
て考えられるすべてのアクセントをアクセント型の順
(0型、1型、2型、…)に生成されるものとする。ア
クセントの声の高低を次の記号で示す。
【0128】
【数12】 これにより、未知語アクセント処理部116において生
成された「再編」のアクセントは、次のようになる。
【0129】
【数13】 未知語読み上げ方法処理部118において、前段の処理
部からの出力である未知語の読みと複数の異なるアクセ
ントにより、読み上げにおける読み上げ回数及び読み上
げ順を規則により決定する。ここでは、読み上げ回数規
則に次に示す規則を用いる。
【0130】1.生成されたアクセントをすべて読み上
げる。
【0131】2.先に読み上げた未知語と同じ単語が複
数出現する場合、予め指定した出現回数目以降の読み上
げ回数は予め指定した回数だけ読み上げる。
【0132】3.平仮名、または漢字の場合、アクセン
ト型が0型のものを最初に読み上げる。
【0133】ここでは、未知語の出現回数が2回目以降
は1回だけ読み上げるものとする。また、複数のアクセ
ントの読み上げ順番規則については次の規則を適用す
る。
【0134】1.アクセントの生成された順で読み上げ
る。
【0135】これらの規則により、読み上げ回数は生成
されたアクセント型の個数分である5回となる。また、
読み上げ順は、生成された順であるアクセント型の0
型、1型、2型、3型、4型の順に読み上げることが決
定される。
【0136】未知語読み上げ方法処理部118では、未
知語「再編」に対して、その読み「さいへん」と、未知
語の複数のアクセント型の情報、及び読み上げ回数5回
で未知語の出現回数が2回目以降は1回だけ読み上げ
る、読み上げ順はアクセント型の0型、1型、2型、3
型、4型の順番などの未知語情報を未知語制御部122
に出力する。
【0137】未知語制御部122では、言語処理部10
4からの出力である未知語「再編」と、前段部からの出
力である未知語情報を未知語情報登録バッファに登録す
る。そして、登録されている未知語情報を音韻処理部1
06に出力する。
【0138】また、例文において、次の文における未知
語の「再編」については、言語処理部104からの出力
により、未知語制御部122において、同一未知語の判
別により既に登録されていることから、読み上げのため
の未知語情報は登録バッファの情報を用いる。ここで、
未知語の読み上げ回数は、登録されている読み上げ回数
情報により1回となり、また、読み上げ順番は0型のア
クセントで読み上げることとなり、それらの未知語情報
を音韻処理部106に出力する。
【0139】音韻処理部106では、言語処理部104
から出力された情報と、未知語制御部122から出力さ
れた未知語情報により、入力文の音韻記号列を生成す
る。ここでは、入力文中の未知語「再編」の部分におい
て、未知語制御部122から出力された読み上げ回数及
び読み上げ順の情報に置き換えて、音韻処理が行なわ
れ、韻律処理部108、合成パラメータ生成部110、
音声波形生成部112を通して音声出力される。すなわ
ち、ここで生成される読み上げの読みとアクセント型は
次のようになる。
【0140】
【数14】 このように読み上げられる。
【0141】次に、通常の読み上げ時に上記の例文で音
声出力がなされている状態において、指示入力によりア
クセントの特定が行なわれた場合の例を示す。ここで、
指示入力は、キー入力により数値が入力されるものとす
る。入力された数値は、異なるアクセントで複数回読み
上げられている未知語の何番目であるかを示すものとす
る。
【0142】利用者は、上記の例文において、「再編」
が異なるアクセントで複数回音声出力されている状態
で、正しいアクセントであった一番最初のものを選択す
るために、キーボードから“1”を入力したとする。指
示入力部120では、そのキーの押されたタイミングと
“1”の情報を未知語制御部122に出力する。
【0143】未知語制御部122では、入力されたキー
の押されたタイミングと数値の“1”との指示入力情報
により、未知語である「再編」において、最初に読み上
げられたアクセント型が0型のものが特定されたと判断
する。したがって、指示入力情報により未知語情報登録
バッファに「再編」のアクセント型は0型、及び読み上
げ回数は1回であるといった情報が登録される。これに
より、登録以後の「再編」の読み上げは正しいアクセン
ト型である0型で1回のみの読み上げとなり、音韻処理
部106で処理される。
【0144】ここでは、利用者は音声出力を聞くだけ
で、アクセントを特定しているものとしたが、表示装置
などにより未知語の異なるアクセントを、先に示したア
クセントの声の高低を示す記号などを用いて表示し、そ
れによって指示入力によりアクセントを特定してもよ
い。また、これらを組み合わせて使用しても良い。
【0145】以上のようにすることにより、未知語にお
ける意味の取違えや不自然さを少なくすることができ
る。
【0146】次に、通常の読み上げ時において、未知語
の複数回読み上げる際に、未知語とその前後の文字列と
を合わせた部分を読み上げる場合の実施例について説明
する。
【0147】本実施例は、先に示した実施例において、
未知語を異なるアクセントで複数回読み上げる際にいく
つかの前後の文字列を未知語と合わせて読み上げるよう
にするものである。未知語の前後の文字列とを合わせて
読み上げることにより、前後の環境によるアクセントの
影響を考慮することができるので、未知語の正しいアク
セントの認識が容易となる。
【0148】言語処理部104から出力された未知語に
ついて、先の実施例で示された通りの処理により未知語
の読み、アクセント、読み上げ方法などの未知語情報が
未知語制御部122から音韻処理部106に出力され
る。
【0149】音韻処理部106において、未知語制御部
122からの出力である未知語の読み、アクセント、読
み上げ回数などの未知語情報により、未知語に前後のい
くつかの文字列を合わせたものの複数回分の単音記号列
を言語処理部104からの出力情報と合わせて音韻処理
部106で処理して出力し、また、単音音韻属性情報な
どを言語処理部104からの出力情報により生成された
単音音韻属性情報などと合わせて韻律処理部108に出
力する。
【0150】未知語に合わせて読み上げる前後の文字列
の決定には、次の規則の一部あるいはすべてが設けられ
る。
【0151】1.未知語の前後または一方の指定した文
字数だけの文字列とする。
【0152】2.未知語の前後または一方の指定した単
語数だけの文字列とする。
【0153】3.未知語を含む句に含まれる文字列とす
る。
【0154】4.未知語を含む文に含まれる文字列とす
る。
【0155】5.未知語の前後または一方における指定
したモーラ数の範囲内に存在する文字列とする。
【0156】以上の処理により生成された音韻情報と、
韻律処理部108で生成された韻律情報により合成パラ
メータ生成部110で合成パラメータを生成し、音声波
形生成部112で音声波形を生成出力する。
【0157】具体的に先の実施例で用いた例文により説
明する。ここでは、前後の文字列決定には、未知語に合
わせて読み上げる前後の文字列の決定規則の3、すなわ
ち、未知語を含む文に含まれる文字列を用いるものとす
る。
【0158】この場合、先の例文の「六つに再編した」
が複数読み上げられる対象となり、この文を未知語制御
部122から与えられた未知語情報により読み上げる。
すなわち、以下のように読み上げられる。
【0159】
【数15】 以上のように、通常の読み上げ時において、未知語の前
後の文字列を合わせて読み上げることにより、複数読み
上げる際の未知語の認識が容易となり、また、前後の環
境によるアクセントの影響を考慮することができるの
で、未知語の正しいアクセントの認識が容易となる。こ
のようにして未知語における意味の取違えや不自然さを
少なくすることができる。
【0160】
【発明の効果】第1の発明の音声合成装置は、韻律素を
基本の単位としてテキストを分析し、その結果から韻律
語を構成し、韻律語どうしの依存度と韻律語間に隣接す
る結合性を設定することで、それに基づいて構成的に韻
律上のまとまりを導き出すことで、韻律制御が可能であ
る他、発声速度を変えた場合にも不自然な呼気段落を形
成することなく、自然音声を模擬する韻律句連鎖と呼気
段落をテキストからつくりだすことができる。
【0161】第2の発明の音声合成装置では、未知語を
読み上げて適切なアクセントを指示できるため、従来の
音声合成装置が目的としていた文字音声変換や文書の読
み上げなどの分野を対象としたものばかりでなく、人間
とコンピュータとの対話における音声規則合成などで
も、発話内容の取違えを少なくし、自然な音声を規則合
成することが可能となる。
【0162】そして、計算機との対話や他の様々な利用
における未知語の複数回読み上げ、未知語の韻律の変更
可能な音声合成器の実現により、自然で分かり易い音声
を計算機により合成することが可能となり、計算機の音
声メディアを利用する場合の利用者の負担を軽減するこ
とが可能となる。
【図面の簡単な説明】
【図1】第1の発明の一実施例を示す音声合成装置の構
成図である。
【図2】言語処理部の構成図である。
【図3】音韻処理部の構成図である。
【図4】文法カテゴリ間依存関係表である。
【図5】文法カテゴリ間結合度表である。
【図6】呼気段落決定アルゴリズムである。
【図7】第2の発明の一実施例を示す音声合成装置の構
成図である。
【図8】未知語制御部の構成図である。
【図9】韻律処理部の構成図である。
【図10】合成パラメータ生成部の構成図である。
【図11】ホルマント合成器の構成図である。
【符号の説明】
1 入力部 2 言語処理部 3 音韻処理部 4 音響パラメータ生成部 5 音声波形生成部 6 出力部 7 韻律素解析部 8 韻律語形成処理部 9 日本語辞書メモリ 10 韻律語間依存度処理部 11 韻律語間結合度決定部 12 韻律語データメモリ 13 韻律句形成処理部 14 呼気段落形成部 15 音韻記号・韻律記号生成部 16 言語音声指示部 17 合成音声記号列データメモリ 20 音声合成装置 100 音声合成装置 102 入力部 104 言語処理部 106 音韻処理部 108 韻律処理部 110 合成パラメータ生成部 112 音声波形生成部 114 未知語読み処理部 116 未知語アクセント処理部 118 未知語読み上げ方法処理部 120 指示入力部 122 未知語制御部
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.6 識別記号 庁内整理番号 FI 技術表示箇所 G10L 5/02 J (72)発明者 坪井 宏之 大阪府大阪市北区大淀中一丁目1番30号 梅田スカイビル タワーウエスト 株式会 社東芝関西支社内

Claims (5)

    【特許請求の範囲】
  1. 【請求項1】テキストを分析する言語処理部と、この言
    語処理部による分析結果を基に韻律記号列と音韻記号列
    を導き出す音韻処理部と、この音韻処理部の結果を基に
    して音声合成の時間変化するパラメータ系列を生成する
    音響パラメータ生成部と、この音響パラメータ生成部か
    らパラメータ系列に基づいて音声信号を生成する音声波
    形生成部を具備した音声合成装置において、 前記言語処理部は、テキストを韻律素から構成される韻
    律語に分割する分割手段と、分割された各韻律語に対し
    て韻律語固有の音韻情報並びに言語情報を設定する設定
    手段と、隣接する韻律語間の隣接依存度を算出する韻律
    語間依存度処理部と、隣接する韻律語間の結合度を韻律
    語の構文性質と算出された隣接依存度とに基づいて算出
    する韻律語間結合度決定部から構成され、 前記音韻処理部は、文全体のリズムや発声速度など発声
    情報を指示する言語音声指示部と、この言語音声指示部
    から指示された発声情報と前記結合度を用いて韻律上ま
    とまる韻律語連鎖を求めて音調パターンを決定する韻律
    句形成部と、韻律句間の休止長を決定する呼気段落形成
    部と、韻律句連鎖と呼気段落の形成情報に基づいて入力
    テキストに対応する音韻記号と韻律記号を作り出す音韻
    記号・韻律記号生成部から構成されることを特徴とする
    音声合成装置。
  2. 【請求項2】入力部から入力された合成すべき音声の内
    容情報から言語情報を抽出する言語処理部と、前記言語
    情報より音韻情報を生成する音韻処理部と、韻律情報を
    生成する韻律処理部と、前記音韻情報及び韻律情報によ
    り合成パラメータを生成する合成パラメータ生成部と、
    前記合成パラメータより音声波形を生成する音声波形生
    成部を具備した音声合成装置において、 未知語に対してその読みを決定する未知語読み処理部
    と、 前記未知語のアクセントを決定する未知語アクセント処
    理部と、 前記未知語を読み上げる方法を決定する未知語読み上げ
    方法処理部と、 前記未知語の読み、アクセント及び読み上げ方法にした
    がって前記未知語の読み上げの制御を行なう未知語制御
    部と、 指示入力により前記未知語のアクセント情報を特定する
    指示入力部とを具備することを特徴とする音声合成装
    置。
  3. 【請求項3】前記未知語制御部が、通常の読み上げ時に
    おいて、未知語読み処理部で決定された読みに対して、
    未知語アクセント処理部で生成された異なるアクセント
    情報により、未知語読み上げ方法処理部で決定された読
    み上げ方法で未知語を異なるアクセントで複数回読み上
    げる制御を行なうことを特徴とする請求項2記載の音声
    合成装置。
  4. 【請求項4】前記未知語制御部が、通常の読み上げ時に
    おいて、未知語を異なるアクセントで複数回読み上げる
    際に、未知語とその前後の文字列とを合わせた部分を読
    み上げる制御を行なうことを特徴とする請求項3記載の
    音声合成装置。
  5. 【請求項5】前記未知語制御部が、通常の読み上げ時に
    おいて、未知語を異なるアクセントで複数回読み上げる
    際に、指示入力によりアクセント情報を特定し登録する
    ことを特徴とする請求項3または請求項4記載の音声合
    成装置。
JP5280901A 1993-11-10 1993-11-10 音声合成装置 Pending JPH07134713A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5280901A JPH07134713A (ja) 1993-11-10 1993-11-10 音声合成装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5280901A JPH07134713A (ja) 1993-11-10 1993-11-10 音声合成装置

Publications (1)

Publication Number Publication Date
JPH07134713A true JPH07134713A (ja) 1995-05-23

Family

ID=17631529

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5280901A Pending JPH07134713A (ja) 1993-11-10 1993-11-10 音声合成装置

Country Status (1)

Country Link
JP (1) JPH07134713A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007241052A (ja) * 2006-03-10 2007-09-20 Advanced Telecommunication Research Institute International 音声情報処理装置、およびプログラム
US8234118B2 (en) 2004-05-21 2012-07-31 Samsung Electronics Co., Ltd. Method and apparatus for generating dialog prosody structure, and speech synthesis method and system employing the same

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8234118B2 (en) 2004-05-21 2012-07-31 Samsung Electronics Co., Ltd. Method and apparatus for generating dialog prosody structure, and speech synthesis method and system employing the same
JP2007241052A (ja) * 2006-03-10 2007-09-20 Advanced Telecommunication Research Institute International 音声情報処理装置、およびプログラム
JP4716116B2 (ja) * 2006-03-10 2011-07-06 株式会社国際電気通信基礎技術研究所 音声情報処理装置、およびプログラム

Similar Documents

Publication Publication Date Title
US8219398B2 (en) Computerized speech synthesizer for synthesizing speech from text
US7565291B2 (en) Synthesis-based pre-selection of suitable units for concatenative speech
JP2003114693A (ja) 音声制御情報ストリームに基づいて音声信号を合成する方法
JP3587048B2 (ja) 韻律制御方法及び音声合成装置
JP3616250B2 (ja) 合成音声メッセージ作成方法、その装置及びその方法を記録した記録媒体
JPH0887297A (ja) 音声合成システム
JPH08335096A (ja) テキスト音声合成装置
Javkin et al. A multilingual text-to-speech system
JPH07134713A (ja) 音声合成装置
JP3060276B2 (ja) 音声合成装置
JPH0580791A (ja) 音声規則合成装置および方法
JP3397406B2 (ja) 音声合成装置及び音声合成方法
KR0173340B1 (ko) 텍스트/음성변환기에서 억양패턴 정규화와 신경망 학습을 이용한 억양 생성 방법
JP2977236B2 (ja) 音声合成装置
JPH09292897A (ja) 音声合成装置
JP3522005B2 (ja) 音声合成装置
JPH08328578A (ja) テキスト音声合成装置
JPH06214585A (ja) 音声合成装置
JPH06168265A (ja) 言語処理装置および音声合成装置
Deng et al. Speech Synthesis
JPH04199421A (ja) 文書読上げ装置
Panagopoulos Problems in the implementation of a text-to-speech system
JPH06318093A (ja) 音声合成装置及び読み付与装置
Fadhil et al. Implementation of an unlimited English Speech Synthesizer by Rules
Li et al. Text-to-Speech Synthesis for Mandarin Chinese