JP3522005B2

JP3522005B2 - 音声合成装置

Info

Publication number: JP3522005B2
Application number: JP13511295A
Authority: JP
Inventors: 教幸藤本
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 1995-06-01
Filing date: 1995-06-01
Publication date: 2004-04-26
Anticipated expiration: 2019-04-26
Also published as: JPH08328589A

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は日本語文章から合成音を
作成する音声合成装置に関し、特に文中に空白や改行マ
ーク等を含む如何なる文章形態であっても、不自然さの
ない合成音が得られる音声合成装置に関する。

【０００２】

【従来の技術】図５は従来の構成図であり、図６は従来
と本発明とを比較する説明図である。従来、日本語文章
（テキスト）を解析し、これを音声に変換する技術が実
用化されている。この合成音技術では、以下に説明する
ように長い文章全体を一括して解析するのではなく、文
中の「、」、「。」、「？」、「！」等の記号を文章の
切れ目と見做し、この切れ目毎に個別に解析する。

【０００３】図５において、１は前処理部、２は単語ラ
ティス作成部、３は単語辞書部、４は単語同定部、５は
後処理部、６は漢字辞書部、７はピッチパラメータ生成
部、８はスペクトルパラメータ生成部、９は音声片ファ
イル、１０は音声波形合成部、１１はＤ／Ａ変換部、で
ある。図中の１から６までは文章解析部（言語処理部と
も称する）である。文章解析部は分かち書きされていな
い漢字かな混じり文を入力とし、韻律情報（韻律記号
列）及び発音情報（発音記号列）を出力するものであ
る。前処理では入力された文章を「、」、「。」等の区
切り記号で分割する（分割されたものを解析単位と称す
る）。次に、単語ラティス作成部２は、前処理から入力
された解析単位と単語辞書に格納されている見出しを照
合し、解析単位の一部分と一致した全ての候補単語を抽
出し、単語ラティスを作成する。次に、単語同定部４
は、解析単位の前方から後方へ、全ての候補単語に対し
て隣接単語間の接続の強さを評価値とするＤＰ照合を行
い、最適な単語列を選択する。最後に後処理部５は、同
定された単語に対して単語辞書３から、読み、アクセン
ト、文法を与え、未知語が含まれていた場合には、漢字
辞書６からその読みを与える。さらにそれらの情報を使
い、呼気段落境界、アクセント句境界、アクセント句の
アクセント型を決定し、カナ文字列から発音記号変換を
行っている。なお、漢字辞書６は、単語同定の結果で未
知語が残った場合に当て読みするためのものでなくても
よい。

【０００４】ここで、上述のＤＰ照合法とは、解析単位
中の全ての候補単語に対して各々の直前に位置する候補
単語の中から最良の評価を与えるものを逐次選択するこ
とによって最適な単語列を得る方法である。今、解析単
位中のｉ番目の文字で始まる候補単語集合のうち、ｋ番
目の要素をWik,その直前の要素数ｍの候補単語集合のｊ
番目の要素をW'i-1,j 、総合評価値をGik としたとき、
全てのWik に対して次の式により順に総合評価値Gik を
定める。尚、G'i-1,j は、ｉ〜１番目の文字で終了する
ｊ番目の要素に対する総合評価値とする。

【０００５】 Gik = max [C(Wik, W'i-1,j) + G'i-1,j] + V(Wik) 但し、(1≦j ≦m), (m>0 ) Gik = −無限大 − − − − − − − − − − (m=0) ここで、 C(Wik, Wi-1,j) = C1(Wik, Wi-1,j) + C2(Wik, Wi-1,j) V(Wik) = P(Wik) + F(Wik) + L(Wik) 但し、文頭、文末は区切り記号で表すことから、文頭の
評価値は、G'01 = 0、文末に対しては、P(Wn1) = F(Wn
1) = L(Wn1) = 0 とする。ここで、C1は２方向文法の
接続の強さを表し、文法的に接続不可の場合は、負の評
価値を与える。C2は名前、人称名詞などに対する姓、人
名などの意味的なつながりを表し、その組み合わせが存
在した場合は、高い評価値を与える。P は文字種と文法
によるペナルティを表し、ひらがな表記の名詞などに低
い評価値を与える。L は文節数などの単語の長さに関す
る評価値、F は単語の頻度に関する評価値とする。

【０００６】次に、図中の７から１１までは音響処理部
である。上述のように文章解析部（言語処理部）におい
て、入力された日本語文の単語同定が行われ、単語のか
な表記、文法情報及びアクセント型が得られる。その
後、これらの情報に基づいて後処理部５から韻律記号列
と発音記号列が生成される。韻律制御記号としては、ポ
ーズの位置、フレーズ境界と種別、アクセント句の境界
と種別及びアクセント型である。音響処理部ではこれら
の記号列からピッチパラメータとスペクトルパラメータ
を生成し、以下に説明するように音声波形の合成を行
う。

【０００７】まず、スペクトルパラメータ生成部８は、
スペクトルパラメータを生成するが、その方式は前述の
ＣＶ音節及びＶ音節を合成単位とする方式を用いる。合
成単位の作成に際しては予め設定した時間長に合うよう
に分析周期を調整して分析し、合成単位の時間長を規格
化する。合成単位の時間長の設定値の例として、ＣＶ音
節の場合は、例えば、種別ａは時間長60msec、i,u,e,o,
N 等は50msec、w,j,s,ts等は90msec、h,p,t,k,b,d,g,z,
dz等は80msec、に設定する。一方、Ｖ音節の場合は、種
別ａ，ｅ，ｏは時間長50msec、i,u,N は40msecに設定し
た。即ち、母音部の音量が同一母音では等しくなるよう
に音源振幅を調整する。合成単位の接続に際しては、ま
ず音節の時間長を決定する。音節の時間長は、音節の種
別、フレーズ（句）の長さ、アクセントの位置等により
決定する。ＣＶ音節とＶ音節の時間長の和がそれより短
い場合には母音部を線型補間して接続する。逆に時間長
の和が長い場合にはＣＶ音節とＶ音節を直接接続する。

【０００８】次に、ピッチパラメータ生成部７は、ピッ
チパラメータを生成するが、例えば、藤崎モデル（音響
学会誌,vol-27, p445-457, 1971,参照) を用いて生成す
る方法がある。即ち、フレーズ指令は文頭用が１種、文
中用が２種の正の指令、文末用の１種の負の指令に規格
化する。また、アクセント指令については、頭高型、中
高型、平板型用の３種とし、さらに指令の大きさを強弱
２段階用意した。フレーズ指令、アクセント指令ともに
装置化を考慮して各固有周波数は一定とする。指令の位
置はＣＶ音節又はＶ音節の終端を基準とする相対位置で
規格化する。前述の言語処理部より出力されるフレーズ
とアクセント句にそれぞれ１つのフレーズ指令とアクセ
ント指令が対応し、さらにポーズ又は文末の直前に負の
フレーズ指令を加える。

【０００９】次に、音声波形合成部１０はピッチパラメ
ータ生成部７からのピッチパラメータ及びスペクトルパ
ラメータ生成部８からのスペクトルパラメータに基づい
て音声波形を合成する。この場合、合成音の明瞭性を高
めるために駆動音源に残差を使用する。無声部はパーコ
ール(PARCOR)分析時の残差波形をそのまま駆動音源と
し、有声部は各フレーム毎に固定長(2msec) の残差波形
を切り出し、それをピッチ周期毎に繰り返し使用して駆
動音源とする。切り出す残差波形の長さは実験的に求め
る。また電話系以外の用途を考慮してサンプリング周波
数は例えば12KHzとする。

【００１０】なお、Ｄ／Ａ変換部１１は音声波形合成部
１０のデジタル出力をアナログ出力に変換するものであ
り、その結果、聴き取れる合成音が得られる。図６にお
いて、従来の音声合成と本発明とを比較しているが、本
図より従来の問題点を説明する。なお、前述の前処理部
１における前処理では、文中の空白や改行マークが存在
した場合に、その記号を削除する。その前後の文章をつ
なげるか（つまり、１つの解析単位と見なすか）、別々
にするか（別々の解析単位と見なすか）は両方の方法が
ある。以下の説明では便宜上、つなげる方法を従来例１
とし、別々にする方法を従来例２とする。

【００１１】図６（Ａ）において、文章例「わたしは海
へ行った。」は、１行目の最後まで文字があり正しく改
行されているので、その解析単位例は（わたしは海へ行
った。）となり、音声合成の形態（音声合成のされか
た）は（ワタシワウミエイッタ）となり、正しい音声合
成が行われる。この例は問題が無い場合である。図６
（Ｂ）において、この文章例では１行目の最後の１文字
（ａ部分）が空白になっている場合である。この場合に
は、従来例１では、解析単位は１つの（わたしは海へ彼
は山へ）となり、音声合成の形態は（ワタシワウミエカ
レワヤマエ）となり、音声合成として不適切である。一
方、従来例２では、解析単位は２つの（わたしは海へ
彼は山へ）となり、音声合成の形態は（ワタシワウミエ
カレワヤマエ）となり、音声合成として適切である。
なお、本発明の実施例については後述する。

【００１２】図６（Ｃ）において、この文章では１行目
の最後（ｂ部分）に改行マークがあり、さらに２行目の
最初の文字（ｃ部分）が空白になっている。この場合に
は、従来例１では、解析単位は１つの（彼の家は東京で
す。）となり、音声合成の形態は（カレノイエワトウキ
ョウデス）となり、音声合成として適切である。一方、
従来例２では、解析単位は２つの（彼の家は東京で
す。）となり、音声合成の形態は（カレノイエワヒガシ
キョウデス）となり、音声合成として不適切である。
この例では図中ので示すように、ポーズが入る上に読
みも間違うことになる。なお、本発明の実施例について
は後述する。

【００１３】

【発明が解決しようとする課題】しかし、例えば、行の
最後に空白が存在したり、改行マークが存在した場合に
は、その行と次の行をつながったものとして解析して音
声合成するか、別々に解析して音声合成するかについて
は、上記の説明のように従来から２通りの方法（図６
（Ｂ），（Ｃ）参照）があるが、それぞれに一長一短が
あった。

【００１４】例えば、前者のように、空白や改行マーク
をつながった文章として解析する場合には、個条書きの
ような文章では個条書きがつがって音声合成され、その
結果不自然な合成音となる。逆に、後者のように、空白
や改行マークがあると、その前後を別々のものとして解
析する場合には、本来は滑らかに切れ目なく発声しなけ
ればならない文章が、途切れて音声合成され、その結果
不自然な合成音となる。

【００１５】本発明の目的は、上述の問題に鑑み、文中
に空白や改行マーク等を含む如何なる文章形態であって
も、不自然さのない合成音が得られる音声合成装置を提
供することにある。

【００１６】

【課題を解決するための手段】本発明は、入力した日本
語文章を句読点等の区切り記号で分割し解析単位を得る
前処理部１と、前記前処理部からの解析単位と単語辞書
に格納されてる見出しを照合し解析単位の一部分と一致
した全ての候補単語を抽出し単語ラティスを作成する単
語ラティス部２と、前記解析単位の前方から後方へ全て
の候補単語に対して隣接単語間の接続の強さを評価値と
して単語境界を決定し最適な単語列を選択する単語同定
部４と、同定された単語に対して前記単語辞書から、読
み、アクセント、文法等を与え韻律情報及び発音情報を
発生する後処理部５とを少なくとも備えた音声合成装置
において、前記単語同定部と前記後処理部の間に解析単
位分割部１２を配置し、前記解析単位分割部は、文章中
の改行マークが存在する位置が、前記単語同定部の解析
結果による単語境界に一致しているときは、解析単位と
して文章の分割を行うことを特徴とする。

【００１７】ここで、前記後処理部は前記解析単位分割
部で得られた解析単位の間にポーズ記号を挿入し、解析
単位毎の韻律情報を付与する。さらに、入力した日本語
文章を句読点等の区切り記号で分割し解析単位を得るに
際して行末の空白をつないで解析単位とする第１の前処
理部１ａと、行末の空白をその前後で異なる文節と見な
して解析単位とする第２の前処理部１ｂと、前記第１及
び第２の前処理部からの各々の解析単位と単語辞書に格
納されてる見出しを照合し解析単位の一部分と一致した
全ての候補単語を抽出し単語ラティスを作成する単語ラ
ティス部２と、前記各々の解析単位の前方から後方へ全
ての候補単語に対して隣接単語間の接続の強さを評価値
として単語境界を決定し最適な単語列を選択する第１及
び第２の単語同定部４ａ，４ｂと、前記第１及び第２の
単語同定部の同定結果の評価値を比較し、良好な方の結
果を前記後処理部に出力する同定結果選択部１３を、さ
らに具備することを特徴とする。

【００１８】

【作用】本発明は、音声合成装置において、空白や改行
マーク前後の解析単位をつなげた状態で解析を行い、そ
の結果に基づいて、文章を分割すべきか、つなげるべき
かを判断し、その結果を音声合成し、適切な合成音を得
るものである。

【００１９】

【実施例】図１は本発明の第１の実施例構成図であり、
図２は本発明の第２の実施例構成図である。これらの図
中で図５と同一構成要素には同一番号が付されている。
明らかなように、図１では解析単位分割部１２が単語同
定部４と後処理部５の間に配置される。図２では前処理
部１ａ及び前処理部１ｂとなり、また単語同定部４ａ及
び単語同定部４ｂとなり、さらに同定結果選択部１３が
これら単語同定部と後処理部５の間に配置される。

【００２０】図１において、前処理部１では従来とほぼ
同じ処理を行うが、改行マークを削除した位置情報を含
めて単語ラティス作成部２に渡す。解析単位分割部１２
では改行マークが存在する位置が、単語同定部４の解析
結果による単語境界に一致している場合は、解析単位と
しての分割を行う。ここで分割したことにより、後処理
部では解析単位の間にポーズ記号を挿入し、解析単位毎
の韻律情報を付与することになる。このことは前述の図
６（Ｂ），（Ｃ）の実施例に示している。即ち、（Ｂ）
に示すように行末ａ部分に空白があっても、解析単位は
２つの（わたしは海へ彼は山へ）となり、音声合成の
形態（音声合成のされかた）は（ワタシワウミエカレ
ハヤマエ）となり、適切な合成音が得られる。これは、
に示すように単語境界と空白の位置が一致したのでポ
ーズが入るからである。また、（Ｃ）に示すように、ｂ
部分の改行マークとｃ部分の空白があっても、解析単位
は１つの（彼の家は東京です。）となり、音声合成の形
態は（カレノイエワトウキョウデス）となり、適切な合
成音が得られる。これは、に示すように単語境界では
ないのでポーズが入らないからである。

【００２１】図１の実施例では、句読点等の区切り記号
で文章を分割し解析単位とする場合に、以下の形態が可
能である。 (1)文章中に改行マークが存在した場合に改行マークの
前後の文字列を１つの解析単位とすると同時に改行マー
クの位置情報を保持し、単語同定を行い、単語同定の結
果の単語境界が改行マークの存在していた場所と一致し
た場合には、その部分にポーズを挿入して合成する。

【００２２】(2)文章中に空白が存在した場合に、空白
の前後の文字列を１つの解析単位とすると同時に空白の
位置情報を保持し、単語同定を行い、単語同定の結果の
単語境界が空白の存在していた場所と一致した場合に
は、その部分にポーズを挿入し合成する。 (3)文章中に改行マークと空白が存在した場合に改行マ
ークと空白の前後の文字列を１つの解析単位とすると同
時に改行マークと空白の位置情報を保持し、単語同定を
行い、単語同定の結果の単語境界が改行マーク若しくは
空白の存在していた場所と一致した場合には、その部分
にポーズを挿入し合成する。

【００２３】・文章中に行末の空白が存在した場合に行
末の空白の前後の文字列を１つの解析単位とすると同時
に行末の空白の位置情報を保持し、単語同定を行い、単
語同定の結果の単語境界が行末の空白の存在していた場
合と一致した場合には、その部分にポーズを挿入して合
成する。（・で空白を行末の空白に限定したもの）・文章中に改行マークと行末の空白が存在した場合に改
行マークと行末の空白の前後の文字列を１つの解析単位
とすると同時に、改行マークと行末の空白の位置情報を
保持し、単語同定を行い、単語同定の結果の単語境界が
改行マーク若しくは行末の空白の存在していた場合と一
致した場合には、その部分にポーズを挿入して合成す
る。

【００２４】(6)文章中に行頭の空白が存在した場合
に、行頭の空白の前後の文字列を１つの解析単位とする
と同時に行頭の空白の位置情報を保持し、単語同定を行
い、単語同定の結果の単語境界が行頭の空白の存在して
いた場所と一致した場合には、その部分にポーズを挿入
して合成する。（(2)で空白を行頭に限定したもの） (7)文章中に改行マークと行頭の空白が存在した場合
に、改行マークと行頭の空白の前後の文字列を１つの解
析単位とすると同時に改行マークと行頭の空白の位置情
報を保持し、単語同定を行い、単語同定の結果の単語境
界が改行マークもしくは行頭の空白の存在していた場所
と一致した場合には、その部分にポーズを挿入し合成す
る。（(3)で空白を行頭の空白に限定したもの） (8)文章中に行頭若しくは行末の空白が存在した場合
に、行頭若しくは行末の空白の前後の文字列を１つの解
析単位とすると同時に行頭もしくは行末の空白の位置情
報を保持し、単語同定を行い、単語同定の結果の単語境
界が行頭若しくは行末の空白の存在していた場所と一致
した場合には、その部分にポーズを挿入して合成する。
（(2)で空白を行頭もしくは行末の空白に限定したも
の） (9)文章中に改行マークと行頭若しくは行末の空白が存
在した場合に、改行マークと行頭若しくは行末の空白の
前後の文字列を１つの解析単位とすると同時に改行マー
クと行頭もしくは行末の空白の位置情報を保持し、単語
同定を行い、単語同定の結果の単語境界が改行マーク若
しくは行頭若しくは行末の空白の存在していた場所と一
致した場合には、その部分にポーズを挿入して合成す
る。（(3)で空白を行頭若しくは行末の空白に限定した
もの）図２の実施例について、以下に説明する。前処理１ａは
従来例１と同じ処理を行い、前処理部１ｂでは従来例２
と同じ処理を行うものとする。単語ラティス作成部２で
は２つの前処理部からの出力に基づいて別々の単語ラテ
ィスを生成し、それぞれの単語同定部４ａと単語同定部
４ｂに結果を渡す。それぞれの単語同定部からは、同定
結果とそのスコアが出力される。同定結果選択部１３で
は２つの同定結果のスコアを比較し、良い方の結果を後
処理部に出力する。

【００２５】図２の実施例では、句読点等の区切り記号
で文章を分割し解析単位とする場合に、以下の形態が可
能である。 (1)文章中に改行マークが存在した場合に改行マークの
前後の文字列を１つの解析単位として単語同定を行う一
方、別々の解析単位として単語同定も行い、それぞれの
単語同定結果の評価値に応じてどちらを採用するかを決
定し、その結果を用いて音声合成する。

【００２６】(2)文章中に空白が存在した場合に空白の
前後の文字列を１つの解析単位として単語同定を行う一
方、別々の解析単位として単語同定も行い、それぞれの
単語同定結果の評価値に応じてどちらを採用するかを決
定し、その結果を用いて音声合成する。 (3)文章中に改行マークと空白が存在した場合に改行マ
ークと空白の前後の文字列を１つの解析単位として単語
同定を行う一方、別々の解析単位として単語同定も行
い、それぞれの単語同定結果の評価値に応じてどちらを
採用するかを決定し、その結果を用いて音声合成する。

【００２７】(4)文章中に行末の空白が存在した場合に
行末の空白の前後の文字列を１つの解析単位として単語
同定を行う一方、別々の解析単位として単語同定も行
い、それぞれの単語同定結果の評価値に応じてどちらを
採用するかを決定し、その結果を用いて音声合成する。
（(2)で空白を行末の空白の限定したもの） (5)文章中に改行マークと行末の空白が存在した場合
に、改行マークと行末の空白の前後の文字列を１つの解
析単位として単語同定を行う一方、別々の解析単位とし
て単語同定も行い、それぞれの単語同定結果の評価値に
応じてどちらを採用するかを決定し、その結果を用いて
音声合成する。（(3)で空白を行末の空白の限定したも
の） (6)文章中に行頭の空白が存在した場合に、行頭の空白
の前後の文字列を１つの解析単位として単語同定を行う
一方、別々の解析単位として単語同定も行い、それぞれ
の単語同定結果の評価値に応じてどちらを採用するかを
決定し、その結果を用いて音声合成する。（(2)で空白
を行頭の空白の限定したもの） (7)文章中に改行マークと行頭の空白が存在した場合
に、改行マークと行頭の空白の前後の文字列を１つの解
析単位として単語同定を行う一方、別々の解析単位とし
て単語同定も行い、それぞれの単語同定結果の評価値に
応じてどちらを採用するかを決定し、その結果を用いて
音声合成する。（(3)で空白を行頭の空白の限定したも
の） (8)文章中に行頭若しくは行末の空白が存在した場合
に、行頭若しくは行末の空白の前後の文字列を１つの解
析単位として単語同定を行う一方、別々の解析単位とし
て単語同定も行い、それぞれの単語同定結果の評価値に
応じてどちらを採用するかを決定し、その結果を用いて
音声合成する。（(2)で空白を行頭若しくは行末の空白
の限定したもの） (9)文章中に改行マークと行頭若しくは行末の空白が存
在した場合に、改行マークと行頭若しくは行末の空白の
前後の文字列を１つの解析単位として単語同定を行う一
方、別々の解析単位として単語同定も行い、それぞれの
単語同定結果の評価値に応じてどちらを採用するかを決
定し、その結果を用いて音声合成する。（(3)で空白を
行頭若しくは行末の空白の限定したもの）図３は図２構成における解析単位分割部の動作フローチ
ャートである。単語同定部４から解析単位分割部１２に
渡す情報として、解析単位の文字数（Ｉ）、文字、フラ
グSp(i) 及びフラグWp(i) (i=1,...,I) 等がある。ここ
で、フラグSp(i) は空白のあったところでは１、それ以
外では０となっているフラグであり、フラグWp(i) は単
語境界のあったところでは１、それ以外では０となって
いるフラグである。また、is及びi はポインタである。

【００２８】単語同定部３からこれらが入力されると、
単語同定部における解析単位毎に上記の情報を取り出し
（Ｓ１）、ポインタの初期化を行い（Ｓ２）、各フラグ
Sp(i) 、フラグWp(i) が１か否か判定する（Ｓ３）。１
のときは（YES)、ポインタis...i文字目までを新しい解
析単位として後処理部５に渡し（Ｓ４）、ポインタisを
インクリメントする（Ｓ５）。１でないときは（NO) 、
ポインタｉをインクリメントし（Ｓ６）、ポインタｉと
文字数Ｉが等しいか否か判定する（Ｓ７）。等しいとき
は（YES)、is...I文字目までを新しい解析単位として後
処理部５に渡し処理を終了する（Ｓ８）。なお、等しく
ない時は（NO) 、ステップＳ３に戻り以下を繰り返す。

【００２９】図４は本発明による前述の文章例（わたし
は海へ彼は山へ）の解析例である。（Ａ）の場合は図６
（Ｂ）に対応し、（Ｂ）の場合は図（Ｃ）に対応する。
図３で説明したように、ｉはポインタ、Sp(i) ，Wp(i)
はフラグである。（Ａ）において、矢印で示すｉ＝６に
空白（ａ部分）があり、従って、Sp(6) ＝1 であり、か
つ単語境界になっている(Wp(6)=1) ので分割される。そ
の結果、音声合成の形態は（ワタシワウミエカレワヤ
マエ）となり、適切な合成音が得られる。一方、（Ｂ）
において、矢印に示すｉ＝５に空白（ｂ、部分）があ
り、従って、Sp(5) ＝1 であるが、この場合には単語境
界になっていない(Wp(5)=0) ので分割されない。その結
果、音声合成の形態は（カレノイエワトウキョウデス）
となり、適切な合成音が得られる。

【００３０】

【発明の効果】以上説明したように、本発明による音声
合成装置よれば、文中に空白や改行マーク等を含む如何
なる文章形態であっても、不自然さのない合成音が得ら
れる効果がある。

【図面の簡単な説明】

【図１】本発明の第１の実施例構成図である。

【図２】本発明の第２の実施例構成図である。

【図３】図２構成における解析単位分割部の動作フロー
チャートである。

【図４】本発明による文章の解析例である。

【図５】従来の構成図である。

【図６】従来と本発明とを比較する説明図である。

【符号の説明】

１，１ａ，１ｂ…前処理部２…単語ラティス作成部３…単語辞書４，４ａ，４ｂ…単語同定部５…後処理部６…漢字辞書７…ピッチパラメータ生成部８…スペクトルパラメータ生成部９…音素片（音節）ファイル１０…音声波形合成部１１…Ｄ／Ａ変換部１２…解析単位分割部１３…同定結果選択部

───────────────────────────────────────────────────── フロントページの続き (58)調査した分野(Int.Cl.⁷，ＤＢ名) G10L 13/04 G10L 13/08

Claims

(57)【特許請求の範囲】

【請求項１】入力した日本語文章を句読点等の区切り
記号で分割し解析単位を得る前処理部（１）と、前記前
処理部からの解析単位と単語辞書に格納されている見出
しを照合し解析単位の一部分と一致した全ての候補単語
を抽出し単語ラティスを作成する単語ラティス部（２）
と、前記解析単位の前方から後方へ全ての候補単語に対
して隣接単語間の接続の強さを評価値として単語境界を
決定し最適な単語列を選択する単語同定部（４）と、同
定された単語に対して前記単語辞書から、読み、アクセ
ント、文法等を与え韻律情報及び発音情報を発生する後
処理部（５）とを少なくとも備えた音声合成装置におい
て、前記単語同定部と前記後処理部の間に解析単位分割部
（１２）を配置し、前記解析単位分割部は、文章中の改
行マークまたは空白が存在する位置が、前記単語同定部
の解析結果による単語境界に一致しているときは、解析
単位として文章の分割を行うことを特徴とする音声合成
装置。
【請求項２】入力した日本語文章を句読点等の区切り
記号で分割し解析単位を得る前処理部（１）と、前記前
処理部からの解析単位と単語辞書に格納されている見出
しを照合し解析単位の一部分と一致した全ての候補単語
を抽出し単語ラティスを作成する単語ラティス部（２）
と、前記解析単位の前方から後方へ全ての候補単語に対
して隣接単語間の接続の強さを評価値として単語境界を
決定し最適な単語列を選択する単語同定部（４）と、同
定された単語に対して前記単語辞書から、読み、アクセ
ント、文法等を与え韻律情報及び発音情報を発生する後
処理部（５）とを少なくとも備えた音声合成装置におい
て、入力した日本語文章を句読点等の区切り記号で分割し解
析単位を得るに際して改行マークまたは空白をつないで
解析単位とする第１の前処理部（１ａ）と、改行マーク
または空白をその前後で異なる文節と見なして解析単位
とする第２の前処理部（１ｂ）と、前記第１及び第２の
前処理部からの各々の解析単位と単語辞書に格納されて
いる見出しを照合し解析単位の一部分と一致した全ての
候補単語を抽出し単語ラティスを作成する単語ラティス
部（２）と、前記各々の解析単位の前方から後方へ全て
の候補単語に対して隣接単語間の接続の強さを評価値と
して単語境界を決定し最適な単語列を選択する第１及び
第２の単語同定部（４ａ，４ｂ）と、前記第１及び第２
の単語同定部の同定結果の評価値を比較し、良好な方の
結果を前記後処理部に出力する同定結果選択部（１３）
を、具備することを特徴とする音声合成装置。
【請求項３】前記後処理部は前記解析単位分割部で得
られた解析単位の間にポーズ記号を挿入し、解析単位毎
の韻律情報を付与する請求項１に記載の音声合成装置。
【請求項４】前記後処理部は前記第２の前処理部で得
られた解析単位の間にポーズ信号を挿入し、解析単位毎
の韻律情報を付与する請求項２に記載の音声合成装置。