JP3450409B2 - 音声合成装置、及び、音声合成方法 - Google Patents
音声合成装置、及び、音声合成方法Info
- Publication number
- JP3450409B2 JP3450409B2 JP04752594A JP4752594A JP3450409B2 JP 3450409 B2 JP3450409 B2 JP 3450409B2 JP 04752594 A JP04752594 A JP 04752594A JP 4752594 A JP4752594 A JP 4752594A JP 3450409 B2 JP3450409 B2 JP 3450409B2
- Authority
- JP
- Japan
- Prior art keywords
- word
- information
- change
- reading
- reading information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Description
声合成方法に係り、特に、ユーザが入力した文字列に対
応した音声を合成し、出力する音声合成装置、及び、音
声合成方法に関する。
とするために人間にとって自然な表現・会話の手段であ
る音声を情報処理システムのインタフェースとして用い
る技術が開発されている。この技術の一つとしてワープ
ロ、パソコン等により入力された文字列を音声に合成し
て出力する音声合成装置がある。
い合成音声を得るために入力された単語に各単語毎に予
め記憶しておいた読み、アクセント型、接続情報、文法
など、各単語を正しく読むために必要な読み情報と同定
して、正確に再現している。
ト等よりなる読み情報を予め記憶しておくことは困難
で、登録されていない単語については後に登録する必要
がある。したがって、未登録の単語を登録する際に、未
登録の単語を容易に認識し、登録を容易に行なえる構成
が要求されている。また、各単語毎に他の単語と結合し
た時の結合変化情報を付与することにより、より自然性
の高い合成音声が得られるが、この結合変化情報の登録
を容易に行える構成も要求されている。
ロック構成図を示す。入力装置31はワープロ、パソコ
ン等よりなり、音声にしようとする文章を文字として入
力する。
理部32に供給され、入力された文字列が‘( )’や
‘「 」’等の記号処理等の前処理が行なわれる。前処
理部32で各種処理が実行された文字列は単語同定部3
3に供給される。単語同定部33は単語辞書部34まは
た単漢字辞書部35を参照しつつ、供給された文字列を
順次単語辞書部に登録された単語に同定する。 単語同
定部33で同定された単語は単語の読みアクセント型、
接続情報、文法等よりなり、その単語を正しく読むため
の読み情報と共に音声合成部36に供給される。音声合
成部36は読み情報に基づいて所定の単語に同定された
文字列を音声信号に合成し、スピーカ37に供給する。
スピーカ37は音声合成部36から供給された音声信号
に応じて駆動され、入力装置31により入力された文章
に対応した音声を出力する。
語辞書部34に存在しても文法的に前後の単語と接続し
ない単語があると、未登録語として検出される。未登録
語は読み飛すか、または、単漢字辞書部35中の読みで
1文字ずつ置換えられ、読みが正しく音声出力されない
ことが多かった。
が接続されていて、単語辞書部34への新たな単語の登
録が行なえるように構成されていた。
ために、辞書に単語を追加するには、表記,読み,アク
セント型,文法情報等を入力していた。単語の品詞が助
数詞の場合には、前にくる数詞との組み合わせにより、
読み、アクセント型が変化する。以下この情報を読み変
形情報、アクセント変形情報と呼ぶ。
属語であったり、接頭語、接尾語の場合には、前後の単
語のアクセント型の影響を受けるが、そのパターンが単
語毎に異なり、どの変形パターンを持つかを辞書中に情
報として持つ方式が用いられる。以後、この情報をアク
セント変形情報と呼ぶ。
は、ユーザが表などを参照してどのパターンかを判定す
る必要があった。
合成装置は未登録語が入力された場合、入力された未登
録語は読み飛ばされるか又は単漢字毎に夫々の読みで置
換えられ、音声として合成されており、ユーザは合成さ
れた音声を聴いて未登録語を認識し、未登録語の登録を
行っていたため、未登録語の認識が困難で容易には未登
録語の登録を行なうことができない等の問題点があっ
た。
尾語、接頭語などを登録する場合にはユーザがその単語
の前後に単語が結合したときの読みやアクセント型など
の変化パターンを表を参照しながら決定していたため、
登録が困難であると共に、正確性に欠けるため、読み、
アクセント等が不正確になるという問題点があった。
で、容易に音声合成用の単語を単語辞書に登録できる音
声合成装置、及び、音声合成方法を提供することを目的
とする。
該単語を読むのに必要な読み情報、並びに、該単語に他
の単語が結合したときの該読み情報の変化のパターンを
示す結合変化情報が登録される単語辞書部と、前記読み
情報の変化のパターン毎に前記結合変化情報が予め記憶
される結合パターン記憶手段と、前記単語に結合される
前記他の単語、及び、その結合後の読み情報が記憶され
る記憶手段と、前記単語、及び、前記単語の前記読み情
報が入力され、入力された前記単語に結合する他の単語
を結合し、前記記憶手段に記憶された読み情報に基づい
て前記読み情報の変化のパターンを検出し、検出した前
記読み情報の変化のパターンに応じて前記結合パターン
記憶手段により前記結合変化情報を求め、前記結合パタ
ーン記憶手段から求めた結合変化情報を前記単語、及
び、前記単語の読み情報に付与して、前記単語辞書部に
登録する辞書登録部と、前記単語辞書部を参照しつつ、
入力された文書を解析し、前記読み情報、及び、前記結
合変化情報、並びに、前記結合変化情報に基づいて音声
に合成する音声合成手段とを有することを特徴とする。
が入力され、入力された単語に結合する他の単語を結合
し、記憶手段に記憶された読み情報に基づいて読み情報
の変化のパターンを検出し、検出した読み情報の変化の
パターンに応じて結合パターン記憶手段より結合変化情
報を求め、結合パターン記憶手段から求めた結合変化情
報を単語、及び、単語の読み情報に付与して、単語辞書
部に登録することにより、他の単語との結合時に読みが
変化するときに、読み情報を入力する必要がないので、
登録作業を容易に行える。
記憶された他の単語との読み情報により読み情報の変化
のパターンを検出し、結合変化情報の検索を行なうた
め、他の単語との結合による結合読み情報を読み込む必
要がなくなり、登録作業を容易に行ない得る。
(A)は第1実施例の原理ブロック図、図1(B)は第
2実施例の原理ブロック図を示す。 図1(A)におい
て、単語辞書部1は、単語及びその単語を読むのに必要
な読み情報が登録される。単語同定部2は、単語辞書部
1を参照しつつ、入力された文章を解析し、文章の読み
を決定する。音声合成部3は、単語同定部2で決定され
た文章の読みに従って、文章を音声に合成する。 未登録
語提示手段4は、前記単語同定部2で、前記文章に応じ
て前記単語辞書部1を参照した際、前記単語辞書部1に
登録されていない未登録語を検出し、提示する。 入力手
段5は、前記未登録語提示手段4により提示された前記
未登録語の読み情報を前記単語辞書部1に入力する。 図
1(B)において、単語辞書部6は、単語及び単語を読
むのに必要な読み情報及び単語と結合する他の単語が結
合したときの読み情報の変化のパターンを示す結合変化
情報が登録される。 また、結合パターン記憶手段7は、
結合読み情報の変化のパターン毎に前記結合変化情報が
予め記憶される。 辞書登録部8は、単語及びその読み情
報に応じて、単語と結合する他の単語を結合させ、読み
情報の変化のパターンを検出し、検出した読み情報の変
化のパターンに応じて結合パターン記憶手段7より結合
変化情報を求め、登録すべき単語及びその読み情報に付
与して単語辞書部6に登録する。音声合成手段9は、入
力された文章を前記単語辞書部6を参照しつつ、解析
し、読み情報及び結合変化情報に基づいて音声に合成す
る。記憶手段20は、単語に結合される他の単語及び、
その結合後の読み情報が記憶されている。また、単語登
録部8は、記憶手段20に記憶された読み情報に基づい
て変化のパターンを検出する。図2に本発明の第1実施
例のブロック構成図を示す。同図中、11は入力装置を
示す。入力装置11はワードプロセッサ、パソコン等に
より構成され、音声に合成しようとする文章を文字列と
して入力すると共に未登録語の表示及び未登録語の読
み、アクセント型、文法等の音声合成に必要な情報であ
る読み情報を入力する。
処理部12に供給される。前処理部12では、‘(
)’や‘「 」’等の処理を行なう記号処理等が行な
われ、単語同定部13に送出する。
12から供給された文字列を辞書部14と照合すること
により各単語毎の読み、アクセント型、接続情報、文法
等の単語を読むために必要な読み情報を付与して音声合
成部15に供給すると共に、辞書部14に存在しない単
語である未登録語の検出を行なう。
された読み、アクセント型、接続情報、文法等の読み情
報に従って、合成音声信号を生成し、スピーカ16に供
給する。スピーカ16は音声合成部15で生成された合
成音声信号に応じて駆動され、音声を出力する。
トを示す。単語同定部13は前処理部12から入力され
た文章の文字を入力された順に入力する。次に単語同定
部13は入力された文字から始まる単語で単語辞書部1
4aを参照する(ステップS2−1)。このとき、入力
された文字が単語辞書部14aに登録されている場合に
は単語辞書部14aに登録されている単語で文字列の単
語を決定するための単語ラティスを作成し、次の文字を
入力する(ステップS2−2,S2−3,S2−4)。
ずれも単語辞書部14aに登録されていない場合には単
漢字辞書部14bを参照し、単漢字辞書部14bに登録
されている単漢字により単語ラティスを作成し、次の文
字を入力する(ステップS2−2,S2−5,S2−
6)。
する文章に対して文字を順次増やしながら実行する(ス
テップS2−7)。以上の処理により解析する文章の全
文字に対して単語ラティスを作成すると、次に文法的つ
ながりを考慮して単語ラティスを順次選択して、パスを
通し、一連の文章を作成し、予め決めておいた単語間の
結合の強さ等から1つのパスを決定する(ステップS2
−9)。
から引かれた単語があるか否かが判断される(ステップ
S2−10)。
漢字辞書部14bから引かれた単語がない場合には、す
べて単語辞書部14a内に登録された単語が用いられて
いることになり、未登録語なしと認識する(ステップS
2−11)。
上に単漢字辞書部14bから引かれた単語がある場合に
は次に単漢字辞書部14bから引かれた単語が複数個連
続しているか否かが判断される(ステップS2−1
2)。ステップS2−12で単漢字辞書部14bから引
かれた文字が複数個連続している場合にはその連続した
文字列を未登録語部分として認識する(ステップS2−
13)。このとき、未登録語部分として認識するのは未
登録語が1単語のみとは限らず、複数個の単語よりなる
未登録語となるかもしれないためである。
部14bから引かれた文字が単独の場合にはその単独の
文字を未登録語として認識する(ステップS2−1
4)。
語部分は未登録語提示部17に供給される。未登録語提
示部17では供給された未登録語部分を入力装置11に
供給し、表示させると共に読み情報入力部18に供給す
る。
され、入力装置11により、未登録語部分に対してその
読み情報を入力し、未登録語部分とそれに対応する読み
情報とを辞書登録部19に供給する。
供給された未登録語及びその読み情報を単語辞書部14
aに登録する。
示す。まず、入力装置11より音声に合成しようとする
漢字かな混じり文が入力される(ステップS2−1)。
じり文は前処理部12により前処理が行なわれる(ステ
ップS2−2)。
語同定部13により図3に示すような単語同定処理が行
なわれる(ステップS2−3)。
結果により未登録語の有無を判別する(ステップS2−
4)。
された場合には同定処理により得られた読み情報を音声
合成部15に供給し、スピーカ16より合成音声を出力
する(ステップS2−5,S2−6。)また、ステップ
S2−4で未登録語が有ると判断された場合には未登録
語提示部17により入力装置11に未登録語を提示させ
る(ステップS2−5)。
の読み情報を入力する(ステップS2−6)。
登録語と結合され、辞書登録部19により単語辞書部1
4aに登録する(ステップS2−7)。
aに新たに登録された単語を使用して単語同定処理を行
なう(ステップS2−8)。
により得られた読み情報を音声合成部15に供給し、ス
ピーカ16より合成音声を出力する(ステップS2−
5,S2−6)。
図を示す。同図中、図2と同一構成部分には同一符号を
付し、その説明は省略する。
認識された未登録語を記憶する未登録バッファ20を設
けたことを特徴とする。
示す。まず、入力装置11より音声に合成しようとする
漢字かな混じり文が入力される(ステップS3−1)。
じり文は前処理部12により前処理が行なわれる(ステ
ップS3−2)。
語同定部13により図3に示すような単語同定処理が行
なわれ、検出された未登録語はすべて未登録バッファ2
0に記憶される(ステップS3−3)。
された文章は読み情報と共に音声合成部15に供給さ
れ、スピーカ16より合成音声として出力される(ステ
ップS3−4,S3−5。)このとき、未登録語は単漢
字辞書部14bを参照することにより文字毎に読み情報
が付され、音声に合成されるか、読み飛ばされる。
た文章中の未登録語が未登録語バッファ20より未登録
語提示部17に読み出され、入力装置11に提示される
(ステップS3−7)。
の読み情報を入力する(ステップS3−8)。
登録語と結合され、辞書登録部19により単語辞書部1
4aに登録する(ステップS3−9)。
図を示す。同図中、図2と同一構成部分には同一符号を
付し、その説明は省略する。
録されていない単語に対して結合変化情報を辞書部14
に追加する場合の方法に関し、とくに単語として助数詞
を入力する場合の辞書登録部21の動作に特徴がある。
辞書登録部21には入力装置11が接続されると共に
変形パターンテーブル22が接続される。
ブル22a、及びアクセント変形テーブル22bよりな
る。読み情報テーブル22aは読み情報の変化のパター
ン毎に読み情報変形情報が付与されている。
クセント型の変化のパターン毎にアクセント変形情報が
付与されている。
数詞、接尾語、接頭語等のときに、登録しようとする単
語に数詞や、付属語及びその読み、アクセント型などを
付けて入力することによりその読み、アクセント型の変
化のパターンを変形パターンテーブル22より検索して
そのパターンを示す読み情報変形情報やアクセント変形
情報を求め、それらの情報を結合変化情報を付与しよう
とする単語に結合変化情報として付与して単語登録部1
4aに登録する。
示す。単語登録部14aには図9に示すように単語毎に
その表記‘週’、読み‘シュー’、アクセント型
‘0’、文法‘助数詞’、変形情報‘D1’が記憶され
ている。単語登録部14aは単語同定部13からの要求
に応じてこれらの情報を単語同定部13に提供する。
動作フローチャートを示す。
入力装置11より表記、読み、アクセント型、品詞が入
力されると(ステップS4−1〜S4−4)、まず品詞
が判別される(ステップS4−5,S4−6)。ステッ
プS4−5,S4−6で品詞が助数詞のときには入力さ
れた単語の前に数詞を付けた数詞句の読み情報を数詞順
に入力する(ステップS4−7)。次に変形パターンテ
ーブル22の読み情報テーブル22aから助数詞の結合
後の読み情報の変化と一致するパターンを検索し、その
パターンを示す読み情報変形情報を登録する単語に付与
して単語辞書部14aに登録する(ステップS4−8,
S4−9,S4−10)。
が接尾語のときには接尾語に異なるアクセント型の単語
を所定の順で順次付けつつ、そのアクセント型を入力す
る(ステップS4−11)。
変形パターンテーブル22のアクセント変形テーブル2
2bから抽出し、そのパターンを示すアクセント変形情
報を登録する単語に付与して単語辞書部14aに登録す
る(ステップS4−12,S4−13,S4−10)。
動作説明図を示す。図10は助数詞の“本”の読み及び
アクセントの変化の一例を示す。
…,‘10’が結合した場合、読み及びアクセント型が
図のように変化する。
数詞‘1’〜‘10’に対する読みの変化を示す。同図
中、゜,゛は破れつ音、濁音となる場合、空欄は変形が
なく、そのままの読みとなる場合を示している。
‘階’の数詞‘1’〜‘10’に対するアクセント型の
変化を示す。アクセント型は‘本’,‘個’,‘階’で
は図12に示すようにアクセント型が変化する。
する対応を示す。図13に示すように各色のアクセント
型が‘色’が結合することにより、すべて‘0’にな
る。
えば図14に示すように結合させる単語の拍数、アクセ
ント型毎に変形パターンテーブル22に記憶させ、夫々
のパターン変化を‘A’,‘B’,‘C’に示すような
変形情報として取り出し、登録しようとする単語に付与
する。
成図を示す。同図中、図7と同一構成部分には同一符号
を付し、その説明は省略する。
ース23を接続してなり、単語データベース23に多数
の結合語の表記、読み、アクセント型等の読み情報を登
録しておき、入力装置11から単語が入力され、この単
語が上記助数詞、接尾語、接頭語のように結合語になり
得る場合にはこの単語データベース23を検索し、自動
的に結合語の読み情報の変化のパターンを得ようとする
もので、本実施例によれば、結合語の読み情報をユーザ
が入力する必要がないため、助数詞、接尾語、接頭語等
の登録を容易、かつ、確実に行ない得る。
び、前記単語の読み情報を入力し、入力された単語に結
合する他の単語を結合させ、単語の読み情報の変化のパ
ターンを検出し、検出した読み情報の変化のパターンに
基づいて結合変化情報を取得し、取得された結合変化情
報を単語及び単語の読み情報に付与して、単語辞書に登
録することにより、他の単語との結合時に読みが変わる
ときに読み情報を入力する必要がないので、登録作業を
容易に行えるなどの特長を有する。
チャートである。
図である。
チャートである。
る。
Claims (2)
- 【請求項1】 単語、及び、該単語を読むのに必要な読
み情報、並びに、該単語に他の単語が結合したときの該
読み情報の変化のパターンを示す結合変化情報が登録さ
れる単語辞書部と、 前記読み情報の変化のパターン毎に前記結合変化情報が
予め記憶される結合パターン記憶手段と、 前記単語に結合される前記他の単語、及び、その結合後
の読み情報が記憶される記憶手段と、 前記単語、及び、前記単語の前記読み情報が入力され、
入力された前記単語に結合する他の単語を結合し、前記
記憶手段に記憶された読み情報に基づいて前記読み情報
の変化のパターンを検出し、検出した前記読み情報の変
化のパターンに応じて前記結合パターン記憶手段より前
記結合変化情報を求め、前記結合パターン記憶手段から
求めた結合変化情報を前記単語、及び、前記単語の読み
情報に付与して、前記単語辞書部に登録する辞書登録部
と、 入力された文書を、前記単語辞書部を参照しつつ、解析
し、前記読み情報、及び、前記結合変化情報、並びに、
前記結合変化情報に基づいて音声に合成する音声合成手
段とを有することを特徴とする音声合成装置。 - 【請求項2】 音声合成方法であって、単語、及び、該単語を読むのに必要な読み情報、並び
に、該単語に他の単語が結合したときの該読み情報の変
化のパターンを示す結合変化情報が登録される単語辞書
部と、 前記読み情報の変化のパターン毎に前記結合変化情報が
予め記憶される結合パターン記憶手段と、 前記単語に結合される前記他の単語、及び、その結合後
の読み情報が記憶される記憶手段とを用い、 前記単語、及び、前記単語の前記読み情報を取得する手
順と、 前記取得された前記単語に結合する他の単語を検出する
手順と、 前記単語の、前記検出された他の単語との結合後の読み
情報の変化のパターンを検出する手順と、 前記検出された前記読み情報の変化パターンに基づいて
前記単語に他の単語が結合したときの読み情報の変化の
パターンを示す結合変化情報を取得する手順と、 前記取得された結合変化情報を前記単語、及び、前記単
語の読み情報に付与して、前記単語辞書部に登録する手
順と、 入力された文書を、前記単語辞書部を参照しつつ、解析
し、前記読み情報及び前記結合変化情報に基づいて音声
に合成する手順とを有することを特徴とする音声合成方
法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP04752594A JP3450409B2 (ja) | 1994-03-17 | 1994-03-17 | 音声合成装置、及び、音声合成方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP04752594A JP3450409B2 (ja) | 1994-03-17 | 1994-03-17 | 音声合成装置、及び、音声合成方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH07261794A JPH07261794A (ja) | 1995-10-13 |
JP3450409B2 true JP3450409B2 (ja) | 2003-09-22 |
Family
ID=12777545
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP04752594A Expired - Fee Related JP3450409B2 (ja) | 1994-03-17 | 1994-03-17 | 音声合成装置、及び、音声合成方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3450409B2 (ja) |
-
1994
- 1994-03-17 JP JP04752594A patent/JP3450409B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JPH07261794A (ja) | 1995-10-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8825486B2 (en) | Method and apparatus for generating synthetic speech with contrastive stress | |
US8914291B2 (en) | Method and apparatus for generating synthetic speech with contrastive stress | |
JPH09293083A (ja) | 楽曲検索装置および検索方法 | |
JPH10124293A (ja) | 音声指令可能なコンピュータとそれ用の媒体 | |
JP3450409B2 (ja) | 音声合成装置、及び、音声合成方法 | |
JP2000003189A (ja) | 音声データ編集装置及び音声データベース | |
JPH07181992A (ja) | 文書読上げ装置及び方法 | |
US7353175B2 (en) | Apparatus, method, and program for speech synthesis with capability of providing word meaning immediately upon request by a user | |
JP3371761B2 (ja) | 氏名読み音声合成装置 | |
JPH07334075A (ja) | プレゼンテーション支援装置 | |
JPH08272388A (ja) | 音声合成装置及びその方法 | |
JP2612030B2 (ja) | 文章読み上げ装置 | |
JPH10228471A (ja) | 音声合成システム,音声用テキスト生成システム及び記録媒体 | |
JP2002268667A (ja) | プレゼンテーションシステムおよびその制御方法 | |
JPH09237096A (ja) | 漢字説明方法及び装置 | |
JP2000330588A (ja) | 音声対話処理方法、音声対話処理システムおよびプログラムを記憶した記憶媒体 | |
JP3029403B2 (ja) | 文章データ音声変換システム | |
JP3414326B2 (ja) | 音声合成用辞書登録装置及び方法 | |
JP3093498B2 (ja) | 文書読み上げ装置 | |
JP5482503B2 (ja) | ユーザ辞書登録装置、ユーザ辞書登録方法、及びユーザ辞書登録プログラム | |
JPS6160167A (ja) | 日本語ワ−ドプロセツサ | |
JP2008158630A (ja) | 画像出力装置及び画像出力方法 | |
JP2549103B2 (ja) | 音声合成装置 | |
JPH11175308A (ja) | 文書読み上げ音声の声色指定方法 | |
JP3573889B2 (ja) | 音声出力装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20030701 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080711 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090711 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100711 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100711 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110711 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110711 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120711 Year of fee payment: 9 |
|
LAPS | Cancellation because of no payment of annual fees |