JP3522005B2 - 音声合成装置 - Google Patents

音声合成装置

Info

Publication number
JP3522005B2
JP3522005B2 JP13511295A JP13511295A JP3522005B2 JP 3522005 B2 JP3522005 B2 JP 3522005B2 JP 13511295 A JP13511295 A JP 13511295A JP 13511295 A JP13511295 A JP 13511295A JP 3522005 B2 JP3522005 B2 JP 3522005B2
Authority
JP
Japan
Prior art keywords
word
unit
analysis unit
analysis
line
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP13511295A
Other languages
English (en)
Other versions
JPH08328589A (ja
Inventor
教幸 藤本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP13511295A priority Critical patent/JP3522005B2/ja
Publication of JPH08328589A publication Critical patent/JPH08328589A/ja
Application granted granted Critical
Publication of JP3522005B2 publication Critical patent/JP3522005B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は日本語文章から合成音を
作成する音声合成装置に関し、特に文中に空白や改行マ
ーク等を含む如何なる文章形態であっても、不自然さの
ない合成音が得られる音声合成装置に関する。
【0002】
【従来の技術】図5は従来の構成図であり、図6は従来
と本発明とを比較する説明図である。従来、日本語文章
(テキスト)を解析し、これを音声に変換する技術が実
用化されている。この合成音技術では、以下に説明する
ように長い文章全体を一括して解析するのではなく、文
中の「、」、「。」、「?」、「!」等の記号を文章の
切れ目と見做し、この切れ目毎に個別に解析する。
【0003】図5において、1は前処理部、2は単語ラ
ティス作成部、3は単語辞書部、4は単語同定部、5は
後処理部、6は漢字辞書部、7はピッチパラメータ生成
部、8はスペクトルパラメータ生成部、9は音声片ファ
イル、10は音声波形合成部、11はD/A変換部、で
ある。図中の1から6までは文章解析部(言語処理部と
も称する)である。文章解析部は分かち書きされていな
い漢字かな混じり文を入力とし、韻律情報(韻律記号
列)及び発音情報(発音記号列)を出力するものであ
る。前処理では入力された文章を「、」、「。」等の区
切り記号で分割する(分割されたものを解析単位と称す
る)。次に、単語ラティス作成部2は、前処理から入力
された解析単位と単語辞書に格納されている見出しを照
合し、解析単位の一部分と一致した全ての候補単語を抽
出し、単語ラティスを作成する。次に、単語同定部4
は、解析単位の前方から後方へ、全ての候補単語に対し
て隣接単語間の接続の強さを評価値とするDP照合を行
い、最適な単語列を選択する。最後に後処理部5は、同
定された単語に対して単語辞書3から、読み、アクセン
ト、文法を与え、未知語が含まれていた場合には、漢字
辞書6からその読みを与える。さらにそれらの情報を使
い、呼気段落境界、アクセント句境界、アクセント句の
アクセント型を決定し、カナ文字列から発音記号変換を
行っている。なお、漢字辞書6は、単語同定の結果で未
知語が残った場合に当て読みするためのものでなくても
よい。
【0004】ここで、上述のDP照合法とは、解析単位
中の全ての候補単語に対して各々の直前に位置する候補
単語の中から最良の評価を与えるものを逐次選択するこ
とによって最適な単語列を得る方法である。今、解析単
位中のi番目の文字で始まる候補単語集合のうち、k番
目の要素をWik,その直前の要素数mの候補単語集合のj
番目の要素をW'i-1,j 、総合評価値をGik としたとき、
全てのWik に対して次の式により順に総合評価値Gik を
定める。尚、G'i-1,j は、i〜1番目の文字で終了する
j番目の要素に対する総合評価値とする。
【0005】 Gik = max [C(Wik, W'i-1,j) + G'i-1,j] + V(Wik) 但し、(1≦j ≦m), (m>0 ) Gik = −無限大 − − − − − − − − − − (m=0) ここで、 C(Wik, Wi-1,j) = C1(Wik, Wi-1,j) + C2(Wik, Wi-1,j) V(Wik) = P(Wik) + F(Wik) + L(Wik) 但し、文頭、文末は区切り記号で表すことから、文頭の
評価値は、G'01 = 0、文末に対しては、P(Wn1) = F(Wn
1) = L(Wn1) = 0 とする。ここで、C1は2方向文法の
接続の強さを表し、文法的に接続不可の場合は、負の評
価値を与える。C2は名前、人称名詞などに対する姓、人
名などの意味的なつながりを表し、その組み合わせが存
在した場合は、高い評価値を与える。P は文字種と文法
によるペナルティを表し、ひらがな表記の名詞などに低
い評価値を与える。L は文節数など単語の長さに関す
る評価値、F は単語の頻度に関する評価値とする。
【0006】次に、図中の7から11までは音響処理部
である。上述のように文章解析部(言語処理部)におい
て、入力された日本語文の単語同定が行われ、単語のか
な表記、文法情報及びアクセント型が得られる。その
後、これらの情報に基づいて後処理部5から韻律記号列
と発音記号列が生成される。韻律制御記号としては、ポ
ーズの位置、フレーズ境界と種別、アクセント句の境界
と種別及びアクセント型である。音響処理部ではこれら
の記号列からピッチパラメータとスペクトルパラメータ
を生成し、以下に説明するように音声波形の合成を行
う。
【0007】まず、スペクトルパラメータ生成部8は、
スペクトルパラメータを生成するが、その方式は前述の
CV音節及びV音節を合成単位とする方式を用いる。合
成単位の作成に際しては予め設定した時間長に合うよう
に分析周期を調整して分析し、合成単位の時間長を規格
化する。合成単位の時間長の設定値の例として、CV音
節の場合は、例えば、種別aは時間長60msec、i,u,e,o,
N 等は50msec、w,j,s,ts等は90msec、h,p,t,k,b,d,g,z,
dz等は80msec、に設定する。一方、V音節の場合は、種
別a,e,oは時間長50msec、i,u,N は40msecに設定し
た。即ち、母音部の音量が同一母音では等しくなるよう
に音源振幅を調整する。合成単位の接続に際しては、ま
ず音節の時間長を決定する。音節の時間長は、音節の種
別、フレーズ(句)の長さ、アクセントの位置等により
決定する。CV音節とV音節の時間長の和がそれより短
い場合には母音部を線型補間して接続する。逆に時間長
の和が長い場合にはCV音節とV音節を直接接続する。
【0008】次に、ピッチパラメータ生成部7は、ピッ
チパラメータを生成するが、例えば、藤崎モデル(音響
学会誌,vol-27, p445-457, 1971,参照) を用いて生成す
る方法がある。即ち、フレーズ指令は文頭用が1種、文
中用が2種の正の指令、文末用の1種の負の指令に規格
化する。また、アクセント指令については、頭高型、中
高型、平板型用の3種とし、さらに指令の大きさを強弱
2段階用意した。フレーズ指令、アクセント指令ともに
装置化を考慮して固有周波数は一定とする。指令の位
置はCV音節又はV音節の終端を基準とする相対位置で
規格化する。前述の言語処理部より出力されるフレーズ
とアクセント句にそれぞれ1つのフレーズ指令とアクセ
ント指令が対応し、さらにポーズ又は文末の直前に負の
フレーズ指令を加える。
【0009】次に、音声波形合成部10はピッチパラメ
ータ生成部7からのピッチパラメータ及びスペクトルパ
ラメータ生成部8からのスペクトルパラメータに基づい
て音声波形を合成する。この場合、合成音の明瞭性を高
めるために駆動音源に残差を使用する。無声部はパーコ
ール(PARCOR)分析時の残差波形をそのまま駆動音源と
し、有声部は各フレーム毎に固定長(2msec) の残差波形
を切り出し、それをピッチ周期毎に繰り返し使用して駆
動音源とする。切り出す残差波形の長さは実験的に求め
る。また電話系以外の用途を考慮してサンプリング周波
数は例えば12KHzとする。
【0010】なお、D/A変換部11は音声波形合成部
10のデジタル出力をアナログ出力に変換するものであ
り、その結果、聴き取れる合成音が得られる。図6にお
いて、従来の音声合成と本発明とを比較しているが、本
図より従来の問題点を説明する。なお、前述の前処理部
1における前処理では、文中の空白や改行マークが存在
した場合に、その記号を削除する。その前後の文章をつ
なげるか(つまり、1つの解析単位と見なすか)、別々
にするか(別々の解析単位と見なすか)は両方の方法が
ある。以下の説明では便宜上、つなげる方法を従来例1
とし、別々にする方法を従来例2とする。
【0011】図6(A)において、文章例「わたしは海
へ行った。」は、1行目の最後まで文字があり正しく改
行されているので、その解析単位例は(わたしは海へ行
った。)となり、音声合成の形態(音声合成のされか
た)は(ワタシワウミエイッタ)となり、正しい音声合
成が行われる。この例は問題が無い場合である。図6
(B)において、この文章例では1行目の最後の1文字
(a部分)が空白になっている場合である。この場合に
は、従来例1では、解析単位は1つの(わたしは海へ彼
は山へ)となり、音声合成の形態は(ワタシワウミエカ
レワヤマエ)となり、音声合成として不適切である。一
方、従来例2では、解析単位は2つの(わたしは海へ
彼は山へ)となり、音声合成の形態は(ワタシワウミエ
カレワヤマエ)となり、音声合成として適切である。
なお、本発明の実施例については後述する。
【0012】図6(C)において、この文章では1行目
の最後(b部分)に改行マークがあり、さらに2行目の
最初の文字(c部分)が空白になっている。この場合に
は、従来例1では、解析単位は1つの(彼の家は東京で
す。)となり、音声合成の形態は(カレノイエワトウキ
ョウデス)となり、音声合成として適切である。一方、
従来例2では、解析単位は2つの(彼の家は東 京で
す。)となり、音声合成の形態は(カレノイエワヒガシ
キョウデス)となり、音声合成として不適切である。
この例では図中ので示すように、ポーズが入る上に読
みも間違うことになる。なお、本発明の実施例について
は後述する。
【0013】
【発明が解決しようとする課題】しかし、例えば、行の
最後に空白が存在したり、改行マークが存在した場合に
は、その行と次の行をつながったものとして解析して音
声合成するか、別々に解析して音声合成するかについて
は、上記の説明のように従来から2通りの方法(図6
(B),(C)参照)があるが、それぞれに一長一短が
あった。
【0014】例えば、前者のように、空白や改行マーク
をつながった文章として解析する場合には、個条書きの
ような文章では個条書きがつがって音声合成され、その
結果不自然な合成音となる。逆に、後者のように、空白
や改行マークがあると、その前後を別々のものとして解
析する場合には、本来は滑らかに切れ目なく発声しなけ
ればならない文章が、途切れて音声合成され、その結果
不自然な合成音となる。
【0015】本発明の目的は、上述の問題に鑑み、文中
に空白や改行マーク等を含む如何なる文章形態であって
も、不自然さのない合成音が得られる音声合成装置を提
供することにある。
【0016】
【課題を解決するための手段】本発明は、入力した日本
語文章を句読点等の区切り記号で分割し解析単位を得る
前処理部1と、前記前処理部からの解析単位と単語辞書
に格納されてる見出しを照合し解析単位の一部分と一致
した全ての候補単語を抽出し単語ラティスを作成する単
語ラティス部2と、前記解析単位の前方から後方へ全て
の候補単語に対して隣接単語間の接続の強さを評価値と
して単語境界を決定し最適な単語列を選択する単語同定
部4と、同定された単語に対して前記単語辞書から、読
み、アクセント、文法等を与え韻律情報及び発音情報を
発生する後処理部5とを少なくとも備えた音声合成装置
において、前記単語同定部と前記後処理部の間に解析単
位分割部12を配置し、前記解析単位分割部は、文章中
の改行マークが存在する位置が、前記単語同定部の解析
結果による単語境界に一致しているときは、解析単位と
して文章の分割を行うことを特徴とする。
【0017】ここで、前記後処理部は前記解析単位分割
部で得られた解析単位の間にポーズ記号を挿入し、解析
単位毎の韻律情報を付与する。さらに、入力した日本語
文章を句読点等の区切り記号で分割し解析単位を得るに
際して行末の空白をつないで解析単位とする第1の前処
理部1aと、行末の空白をその前後で異なる文節と見な
して解析単位とする第2の前処理部1bと、前記第1及
び第2の前処理部からの各々の解析単位と単語辞書に格
納されてる見出しを照合し解析単位の一部分と一致した
全ての候補単語を抽出し単語ラティスを作成する単語ラ
ティス部2と、前記各々の解析単位の前方から後方へ全
ての候補単語に対して隣接単語間の接続の強さを評価値
として単語境界を決定し最適な単語列を選択する第1及
び第2の単語同定部4a,4bと、前記第1及び第2の
単語同定部の同定結果の評価値を比較し、良好な方の結
果を前記後処理部に出力する同定結果選択部13を、さ
らに具備することを特徴とする。
【0018】
【作用】本発明は、音声合成装置において、空白や改行
マーク前後の解析単位をつなげた状態で解析を行い、そ
の結果に基づいて、文章を分割すべきか、つなげるべき
かを判断し、その結果を音声合成し、適切な合成音を得
るものである。
【0019】
【実施例】図1は本発明の第1の実施例構成図であり、
図2は本発明の第2の実施例構成図である。これらの図
中で図5と同一構成要素には同一番号が付されている。
明らかなように、図1では解析単位分割部12が単語同
定部4と後処理部5の間に配置される。図2では前処理
部1a及び前処理部1bとなり、また単語同定部4a及
び単語同定部4bとなり、さらに同定結果選択部13が
これら単語同定部と後処理部5の間に配置される。
【0020】図1において、前処理部1では従来とほぼ
同じ処理を行うが、改行マークを削除した位置情報を含
めて単語ラティス作成部2に渡す。解析単位分割部12
では改行マークが存在する位置が、単語同定部4の解析
結果による単語境界に一致している場合は、解析単位と
しての分割を行う。ここで分割したことにより、後処理
部では解析単位の間にポーズ記号を挿入し、解析単位毎
の韻律情報を付与することになる。このことは前述の図
6(B),(C)の実施例に示している。即ち、(B)
に示すように行末a部分に空白があっても、解析単位は
2つの(わたしは海へ 彼は山へ)となり、音声合成の
形態(音声合成のされかた)は(ワタシワウミエ カレ
ハヤマエ)となり、適切な合成音が得られる。これは、
に示すように単語境界と空白の位置が一致したのでポ
ーズが入るからである。また、(C)に示すように、b
部分の改行マークとc部分の空白があっても、解析単位
は1つの(彼の家は東京です。)となり、音声合成の形
態は(カレノイエワトウキョウデス)となり、適切な合
成音が得られる。これは、に示すように単語境界では
ないのでポーズが入らないからである。
【0021】図1の実施例では、句読点等の区切り記号
で文章を分割し解析単位とする場合に、以下の形態が可
能である。 (1)文章中に改行マークが存在した場合に改行マークの
前後の文字列を1つの解析単位とすると同時に改行マー
クの位置情報を保持し、単語同定を行い、単語同定の結
果の単語境界が改行マークの存在していた場所と一致し
た場合には、その部分にポーズを挿入して合成する。
【0022】(2)文章中に空白が存在した場合に、空白
の前後の文字列を1つの解析単位とすると同時に空白の
位置情報を保持し、単語同定を行い、単語同定の結果の
単語境界が空白の存在していた場所と一致した場合に
は、その部分にポーズを挿入し合成する。 (3)文章中に改行マークと空白が存在した場合に改行マ
ークと空白の前後の文字列を1つの解析単位とすると同
時に改行マークと空白の位置情報を保持し、単語同定を
行い、単語同定の結果の単語境界が改行マーク若しくは
空白の存在していた場所と一致した場合には、その部分
にポーズを挿入し合成する。
【0023】・文章中に行末の空白が存在した場合に行
末の空白の前後の文字列を1つの解析単位とすると同時
に行末の空白の位置情報を保持し、単語同定を行い、単
語同定の結果の単語境界が行末の空白の存在していた場
合と一致した場合には、その部分にポーズを挿入して合
成する。(・で空白を行末の空白に限定したもの) ・文章中に改行マークと行末の空白が存在した場合に改
行マークと行末の空白の前後の文字列を1つの解析単位
とすると同時に、改行マークと行末の空白の位置情報を
保持し、単語同定を行い、単語同定の結果の単語境界が
改行マーク若しくは行末の空白の存在していた場合と一
致した場合には、その部分にポーズを挿入して合成す
る。
【0024】(6)文章中に行頭の空白が存在した場合
に、行頭の空白の前後の文字列を1つの解析単位とする
と同時に行頭の空白の位置情報を保持し、単語同定を行
い、単語同定の結果の単語境界が行頭の空白の存在して
いた場所と一致した場合には、その部分にポーズを挿入
して合成する。((2)で空白を行頭に限定したもの) (7)文章中に改行マークと行頭の空白が存在した場合
に、改行マークと行頭の空白の前後の文字列を1つの解
析単位とすると同時に改行マークと行頭の空白の位置情
報を保持し、単語同定を行い、単語同定の結果の単語境
界が改行マークもしくは行頭の空白の存在していた場所
と一致した場合には、その部分にポーズを挿入し合成す
る。((3)で空白を行頭の空白に限定したもの) (8)文章中に行頭若しくは行末の空白が存在した場合
に、行頭若しくは行末の空白の前後の文字列を1つの解
析単位とすると同時に行頭もしくは行末の空白の位置情
報を保持し、単語同定を行い、単語同定の結果の単語境
界が行頭若しくは行末の空白の存在していた場所と一致
した場合には、その部分にポーズを挿入して合成する。
((2)で空白を行頭もしくは行末の空白に限定したも
の) (9)文章中に改行マークと行頭若しくは行末の空白が存
在した場合に、改行マークと行頭若しくは行末の空白の
前後の文字列を1つの解析単位とすると同時に改行マー
クと行頭もしくは行末の空白の位置情報を保持し、単語
同定を行い、単語同定の結果の単語境界が改行マーク若
しくは行頭若しくは行末の空白の存在していた場所と一
致した場合には、その部分にポーズを挿入して合成す
る。((3)で空白を行頭若しくは行末の空白に限定した
もの) 図2の実施例について、以下に説明する。前処理1aは
従来例1と同じ処理を行い、前処理部1bでは従来例2
と同じ処理を行うものとする。単語ラティス作成部2で
は2つの前処理部からの出力に基づいて別々の単語ラテ
ィスを生成し、それぞれの単語同定部4aと単語同定部
4bに結果を渡す。それぞれの単語同定部からは、同定
結果とそのスコアが出力される。同定結果選択部13で
は2つの同定結果のスコアを比較し、良い方の結果を後
処理部に出力する。
【0025】図2の実施例では、句読点等の区切り記号
で文章を分割し解析単位とする場合に、以下の形態が可
能である。 (1)文章中に改行マークが存在した場合に改行マークの
前後の文字列を1つの解析単位として単語同定を行う一
方、別々の解析単位として単語同定も行い、それぞれの
単語同定結果の評価値に応じてどちらを採用するかを決
定し、その結果を用いて音声合成する。
【0026】(2)文章中に空白が存在した場合に空白の
前後の文字列を1つの解析単位として単語同定を行う一
方、別々の解析単位として単語同定も行い、それぞれの
単語同定結果の評価値に応じてどちらを採用するかを決
定し、その結果を用いて音声合成する。 (3)文章中に改行マークと空白が存在した場合に改行マ
ークと空白の前後の文字列を1つの解析単位として単語
同定を行う一方、別々の解析単位として単語同定も行
い、それぞれの単語同定結果の評価値に応じてどちらを
採用するかを決定し、その結果を用いて音声合成する。
【0027】(4)文章中に行末の空白が存在した場合に
行末の空白の前後の文字列を1つの解析単位として単語
同定を行う一方、別々の解析単位として単語同定も行
い、それぞれの単語同定結果の評価値に応じてどちらを
採用するかを決定し、その結果を用いて音声合成する。
((2)で空白を行末の空白の限定したもの) (5)文章中に改行マークと行末の空白が存在した場合
に、改行マークと行末の空白の前後の文字列を1つの解
析単位として単語同定を行う一方、別々の解析単位とし
て単語同定も行い、それぞれの単語同定結果の評価値に
応じてどちらを採用するかを決定し、その結果を用いて
音声合成する。((3)で空白を行末の空白の限定したも
の) (6)文章中に行頭の空白が存在した場合に、行頭の空白
の前後の文字列を1つの解析単位として単語同定を行う
一方、別々の解析単位として単語同定も行い、それぞれ
の単語同定結果の評価値に応じてどちらを採用するかを
決定し、その結果を用いて音声合成する。((2)で空白
を行頭の空白の限定したもの) (7)文章中に改行マークと行頭の空白が存在した場合
に、改行マークと行頭の空白の前後の文字列を1つの解
析単位として単語同定を行う一方、別々の解析単位とし
て単語同定も行い、それぞれの単語同定結果の評価値に
応じてどちらを採用するかを決定し、その結果を用いて
音声合成する。((3)で空白を行頭の空白の限定したも
の) (8)文章中に行頭若しくは行末の空白が存在した場合
に、行頭若しくは行末の空白の前後の文字列を1つの解
析単位として単語同定を行う一方、別々の解析単位とし
て単語同定も行い、それぞれの単語同定結果の評価値に
応じてどちらを採用するかを決定し、その結果を用いて
音声合成する。((2)で空白を行頭若しくは行末の空白
の限定したもの) (9)文章中に改行マークと行頭若しくは行末の空白が存
在した場合に、改行マークと行頭若しくは行末の空白の
前後の文字列を1つの解析単位として単語同定を行う一
方、別々の解析単位として単語同定も行い、それぞれの
単語同定結果の評価値に応じてどちらを採用するかを決
定し、その結果を用いて音声合成する。((3)で空白を
行頭若しくは行末の空白の限定したもの) 図3は図2構成における解析単位分割部の動作フローチ
ャートである。単語同定部4から解析単位分割部12に
渡す情報として、解析単位の文字数(I)、文字、フラ
グSp(i) 及びフラグWp(i) (i=1,...,I) 等がある。ここ
で、フラグSp(i) は空白のあったところでは1、それ以
外では0となっているフラグであり、フラグWp(i) は単
語境界のあったところでは1、それ以外では0となって
いるフラグである。また、is及びi はポインタである。
【0028】単語同定部3からこれらが入力されると、
単語同定部における解析単位毎に上記の情報を取り出し
(S1)、ポインタの初期化を行い(S2)、各フラグ
Sp(i) 、フラグWp(i) が1か否か判定する(S3)。1
のときは(YES)、ポインタis...i文字目までを新しい解
析単位として後処理部5に渡し(S4)、ポインタisを
インクリメントする(S5)。1でないときは(NO) 、
ポインタiをインクリメントし(S6)、ポインタiと
文字数Iが等しいか否か判定する(S7)。等しいとき
は(YES)、is...I文字目までを新しい解析単位として後
処理部5に渡し処理を終了する(S8)。なお、等しく
ない時は(NO) 、ステップS3に戻り以下を繰り返す。
【0029】図4は本発明による前述の文章例(わたし
は海へ彼は山へ)の解析例である。(A)の場合は図6
(B)に対応し、(B)の場合は図(C)に対応する。
図3で説明したように、iはポインタ、Sp(i) ,Wp(i)
はフラグである。(A)において、矢印で示すi=6に
空白(a部分)があり、従って、Sp(6) =1 であり、か
つ単語境界になっている(Wp(6)=1) ので分割される。そ
の結果、音声合成の形態は(ワタシワウミエ カレワヤ
マエ)となり、適切な合成音が得られる。一方、(B)
において、矢印に示すi=5に空白(b、部分)があ
り、従って、Sp(5) =1 であるが、この場合には単語境
界になっていない(Wp(5)=0) ので分割されない。その結
果、音声合成の形態は(カレノイエワトウキョウデス)
となり、適切な合成音が得られる。
【0030】
【発明の効果】以上説明したように、本発明による音声
合成装置よれば、文中に空白や改行マーク等を含む如何
なる文章形態であっても、不自然さのない合成音が得ら
れる効果がある。
【図面の簡単な説明】
【図1】本発明の第1の実施例構成図である。
【図2】本発明の第2の実施例構成図である。
【図3】図2構成における解析単位分割部の動作フロー
チャートである。
【図4】本発明による文章の解析例である。
【図5】従来の構成図である。
【図6】従来と本発明とを比較する説明図である。
【符号の説明】
1,1a,1b…前処理部 2…単語ラティス作成部 3…単語辞書 4,4a,4b…単語同定部 5…後処理部 6…漢字辞書 7…ピッチパラメータ生成部 8…スペクトルパラメータ生成部 9…音素片(音節)ファイル 10…音声波形合成部 11…D/A変換部 12…解析単位分割部 13…同定結果選択部
───────────────────────────────────────────────────── フロントページの続き (58)調査した分野(Int.Cl.7,DB名) G10L 13/04 G10L 13/08

Claims (4)

    (57)【特許請求の範囲】
  1. 【請求項1】 入力した日本語文章を句読点等の区切り
    記号で分割し解析単位を得る前処理部(1)と、前記前
    処理部からの解析単位と単語辞書に格納されている見出
    しを照合し解析単位の一部分と一致した全ての候補単語
    を抽出し単語ラティスを作成する単語ラティス部(2)
    と、前記解析単位の前方から後方へ全ての候補単語に対
    して隣接単語間の接続の強さを評価値として単語境界を
    決定し最適な単語列を選択する単語同定部(4)と、同
    定された単語に対して前記単語辞書から、読み、アクセ
    ント、文法等を与え韻律情報及び発音情報を発生する後
    処理部(5)とを少なくとも備えた音声合成装置におい
    て、 前記単語同定部と前記後処理部の間に解析単位分割部
    (12)を配置し、前記解析単位分割部は、文章中の改
    行マークまたは空白が存在する位置が、前記単語同定部
    の解析結果による単語境界に一致しているときは、解析
    単位として文章の分割を行うことを特徴とする音声合成
    装置。
  2. 【請求項2】 入力した日本語文章を句読点等の区切り
    記号で分割し解析単位を得る前処理部(1)と、前記前
    処理部からの解析単位と単語辞書に格納されている見出
    しを照合し解析単位の一部分と一致した全ての候補単語
    を抽出し単語ラティスを作成する単語ラティス部(2)
    と、前記解析単位の前方から後方へ全ての候補単語に対
    して隣接単語間の接続の強さを評価値として単語境界を
    決定し最適な単語列を選択する単語同定部(4)と、同
    定された単語に対して前記単語辞書から、読み、アクセ
    ント、文法等を与え韻律情報及び発音情報を発生する後
    処理部(5)とを少なくとも備えた音声合成装置におい
    て、 入力した日本語文章を句読点等の区切り記号で分割し解
    析単位を得るに際して改行マークまたは空白をつないで
    解析単位とする第1の前処理部(1a)と、改行マーク
    または空白をその前後で異なる文節と見なして解析単位
    とする第2の前処理部(1b)と、前記第1及び第2の
    前処理部からの各々の解析単位と単語辞書に格納されて
    いる見出しを照合し解析単位の一部分と一致した全ての
    候補単語を抽出し単語ラティスを作成する単語ラティス
    部(2)と、前記各々の解析単位の前方から後方へ全て
    の候補単語に対して隣接単語間の接続の強さを評価値と
    して単語境界を決定し最適な単語列を選択する第1及び
    第2の単語同定部(4a,4b)と、前記第1及び第2
    の単語同定部の同定結果の評価値を比較し、良好な方の
    結果を前記後処理部に出力する同定結果選択部(13)
    を、具備することを特徴とする音声合成装置。
  3. 【請求項3】 前記後処理部は前記解析単位分割部で得
    られた解析単位の間にポーズ記号を挿入し、解析単位毎
    の韻律情報を付与する請求項1に記載の音声合成装置。
  4. 【請求項4】 前記後処理部は前記第2の前処理部で得
    られた解析単位の間にポーズ信号を挿入し、解析単位毎
    の韻律情報を付与する請求項2に記載の音声合成装置。
JP13511295A 1995-06-01 1995-06-01 音声合成装置 Expired - Fee Related JP3522005B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP13511295A JP3522005B2 (ja) 1995-06-01 1995-06-01 音声合成装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP13511295A JP3522005B2 (ja) 1995-06-01 1995-06-01 音声合成装置

Publications (2)

Publication Number Publication Date
JPH08328589A JPH08328589A (ja) 1996-12-13
JP3522005B2 true JP3522005B2 (ja) 2004-04-26

Family

ID=15144121

Family Applications (1)

Application Number Title Priority Date Filing Date
JP13511295A Expired - Fee Related JP3522005B2 (ja) 1995-06-01 1995-06-01 音声合成装置

Country Status (1)

Country Link
JP (1) JP3522005B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20030068778A (ko) * 2002-02-18 2003-08-25 삼성전기주식회사 음성 합성 출력 장치
CN112735378B (zh) * 2020-12-29 2024-05-31 科大讯飞股份有限公司 泰语语音合成方法、装置以及设备

Also Published As

Publication number Publication date
JPH08328589A (ja) 1996-12-13

Similar Documents

Publication Publication Date Title
US8566099B2 (en) Tabulating triphone sequences by 5-phoneme contexts for speech synthesis
JPH10116089A (ja) 音声合成用の基本周波数テンプレートを収容する韻律データベース
JP3587048B2 (ja) 韻律制御方法及び音声合成装置
WO2004066271A1 (ja) 音声合成装置,音声合成方法および音声合成システム
JPH05165486A (ja) テキスト音声変換装置
KR100373329B1 (ko) 음운환경과 묵음구간 길이를 이용한 텍스트/음성변환 장치 및그 방법
JPH0887297A (ja) 音声合成システム
JP3522005B2 (ja) 音声合成装置
JPH08335096A (ja) テキスト音声合成装置
JP3378547B2 (ja) 音声認識方法及び装置
JP3060276B2 (ja) 音声合成装置
JP2536169B2 (ja) 規則型音声合成装置
JPH05281984A (ja) 音声合成方法および装置
JP3397406B2 (ja) 音声合成装置及び音声合成方法
JP3142160B2 (ja) 発音記号生成装置
JP3883780B2 (ja) 音声合成装置
JP3234371B2 (ja) 音声合成用音声持続時間処理方法及びその装置
JP3308875B2 (ja) 音声合成方法および装置
JP2977236B2 (ja) 音声合成装置
JP2578876B2 (ja) 文章読み上げ装置
JPH0667685A (ja) 音声合成装置
JPH04350699A (ja) テキスト音声合成装置
JPH09292897A (ja) 音声合成装置
JPH02234198A (ja) テキスト音声合成システム
JPH08328578A (ja) テキスト音声合成装置

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20040106

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20040203

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080220

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090220

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090220

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100220

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees