JPH04350699A

JPH04350699A - テキスト音声合成装置

Info

Publication number: JPH04350699A
Application number: JP3123917A
Authority: JP
Inventors: Naoki Mizutani; 直樹水谷
Original assignee: Sharp Corp
Current assignee: Sharp Corp
Priority date: 1991-05-28
Filing date: 1991-05-28
Publication date: 1992-12-04

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は、任意の文字記号列から
形成された入力文章を音声に変換するテキスト音声合成
装置に関する。

【０００２】

【従来の技術】従来のテキスト音声合成装置は、文字記
号列からなる文章を合成音声に変換するときに、入力さ
れた任意の文字記号列に正しい読み、アクセント及びイ
ントネーションの情報を付加して音声合成用パラメータ
を生成し、生成された音声合成用パラメータに基づいて
音声を合成して出力するように構成されている。

【０００３】図５に上述した従来のテキスト音声合成装
置の構成を示す。

【０００４】図５において、文字記号列入力部３１は、
文字記号列（例えば日本語漢字かな混じり文）を入力し
て文字記号列解析部３２に出力する。

【０００５】文字記号列解析部３２は、辞書（単語辞書
、漢字辞書、記号辞書等）３３を用いて形態素解析を行
い入力された文字記号列の単語を同定すると共に、辞書
３３から同定した単語の読み等の音韻情報、アクセント
位置、品詞等の文法情報を同時に得る。

【０００６】合成音声パラメータ生成部３４は、韻律を
制御するために、文字記号列解析部３２において同定さ
れた各単語のアクセント位置及び構文構造から、単語が
連鎖したときの文節、呼気段階のアクセントまたはポー
ズの設定を行う。更に、合成音声パラメータ生成部３４
は、発生音声に対応した合成単位に対する継続時間、ピ
ッチパターン、パワーパターン及び音韻特徴パラメータ
（偏自己相関係数、線スペクトル対、ホルマント等）の
パラメータ時系列を得る。

【０００７】音声合成部３５は、上記音声合成用のパラ
メータ時系列に基づいて実際の合成音声波形を生成し、
合成音声出力部３６は、音声合成部３５で生成された合
成音声波形を出力するように構成されている。

【０００８】

【発明が解決しようとする課題】しかしながら、上記従
来のテキスト音声合成装置では、単にアクセント位置ま
たは文法情報に基づいて、入力された任意の文字記号列
を合成音声に変換するので、感情表現などに特有の「抑
揚」を表現できないという問題点がある。

【０００９】本発明は、上記従来のテキスト音声合成装
置における問題点に鑑み、感情表現などに特有な抑揚を
表現可能な音声合成装置を提供する。

【００１０】

【課題を解決するための手段】本発明は、入力された文
字列を言語解析して所定の情報を生成する解析手段と、
文字記号列中の特定の単語及び単語列を検出する語句検
出手段と、所定の情報に基づいて音声合成パラメータを
生成する音声パラメ−タ生成手段と、特定語句に対応す
る所定の情報を格納する語句情報辞書と、語句情報辞書
に格納された所定の情報に基づいて特定語句の音声を合
成する音声合成手段とを備えているテキスト音声合成装
置によって達成される。

【００１１】

【作用】解析手段は入力された文字列を言語解析して所
定の情報を生成し、語句検出手段は文字記号列中の特定
の単語及び単語列を検出し、音声パラメ−タ生成手段は
所定の情報に基づいて音声合成パラメータを生成し、語
句情報辞書は特定語句に対応する所定の情報を格納し、
音声合成手段は、語句情報辞書に格納された所定の情報
に基づいて特定語句の音声を合成する。

【００１２】

【実施例】以下、図面を参照して本発明のテキスト音声
合成装置における実施例を詳述する。

【００１３】図１は、本発明のテキスト音声合成装置に
おける一実施例の構成を示す。

【００１４】図１のテキスト音声合成装置は、文字記号
列入力部１１、解析手段である文字記号列解析部１２、
辞書１３、語句検出手段である特定語句検出部１４、語
句情報辞書である特定語句音韻・韻律辞書１５、音声パ
ラメ−タ生成手段である音声パラメ−タ生成部１６、音
声合成手段である音声合成部１７及び合成音声出力部１
８によって構成されている。

【００１５】次に、上述の各構成部分の動作を説明する
。

【００１６】文字記号列入力部１１は、文字記号列（例
えば日本語漢字かな交じり文）を入力して文字記号列解
析部１２に送り出す。

【００１７】文字記号列解析部１２は、辞書１３を用い
て入力された文字記号列の形態素、構文及び意味の解析
等を行う。

【００１８】特定語句検出部１４は、後述する特定語句
音韻・韻律辞書１５を参照して、文字記号列解析部１２
による解析結果の中で、条件に適合する特定の単語また
は単語列が含まれているかどうか検出し、含まれている
場合にはその特定語句の部分を語句コードに置き換える
。

【００１９】音声パラメータ生成部１６は、韻律を制御
するために、上記文字記号列解析部１２で同定された各
単語のアクセントまたは構文構造により、単語が連鎖し
た際の文節、呼気段落のアクセントまたはポーズの設定
を行う。

【００２０】ここで、上記特定語句検出部１４で、置き
換えられた特定語句の存在を示す語句コードがあれば、
特定語句音韻・韻律辞書１５でその語句に対する所定の
情報である音韻・韻律情報を検索する。そして、検索さ
れた音韻・韻律情報を用いる。

【００２１】更に、発声音声に対応した合成単位に対す
る継続時間、ピッチパターン、パワーパターン及び音韻
特徴パラメータ（偏自己相関係数、線スペクトル対、ホ
ルマント等）のパラメータ時系列を得る。

【００２２】音声合成部１７は、上記音声合成用のパラ
メータ時系列に基づいて実際の合成音声波形を生成し、
合成音声出力部１８は、音声合成部１７で生成された合
成音声波形を出力する。

【００２３】図２に、上述した特定語句音韻・韻律辞書
１５の構成を示す。

【００２４】以下、図２を参照して特定語句音韻・韻律
辞書１５を説明する。

【００２５】特定語句音韻・韻律辞書１５の中の見出し
番号は、文字記号列解析部１２で解析された結果として
得られる単語番号であり、単語の品詞・意味等が一意に
認識されていることを意味する。

【００２６】所定の情報である音韻・韻律情報は、見出
しを発声する時の音韻・韻律に関する情報であり、アク
セントの位置の他に、フレーズ（抑揚）の大きさ、アク
セントの大きさなどが相対的な値として記入されている
。

【００２７】条件の欄は、マッチングのときに見出し以
外に付帯的に要求される条件が記されており、必要に応
じて利用できるように構成されている。

【００２８】次に、図３のフロ−チャ−トを参照して図
１のテキスト音声合成装置の動作、特に、文字記号列入
力部１１〜音声パラメ−タ生成部１６による動作を説明
する。

【００２９】まず、日本語文字列が入力され（ステップ
Ｓ１）、入力された日本語文字列の各単語を辞書を用い
て形態素解析して同定する（ステップＳ２）。

【００３０】ここでは、日本語文字列がどのような単語
で構成されているかを辞書と照合することにより候補を
抽出し、その抽出された候補の中で、頻度情報や活用語
尾、付属語の接続可能性などを考慮して文字列の構成単
語を一意に決定する（これは従来の形態素解析と同様の
方法である）。また、一意に決定した単語の辞書番号、
品詞等の文法情報やアクセントを得る。

【００３１】上記同定された単語列が特定の語句を形成
しているかどうか、即ち、同定された単語列が特定語句
音韻・韻律辞書に存在するか否か、を辞書番号に基づい
て判別し（ステップＳ３）、同定された単語列が特定語
句音韻・韻律辞書に存在する場合（ＹＥＳの場合）には
、その部分の単語列を特定語句であることを示す語句コ
−ドに置き換える（ステップＳ４）。

【００３２】他方、上記ステップＳ３でＮＯの場合には
、韻律を制御するために辞書から検索された各単語のア
クセントや構文構造から、単語が連鎖したときの文節、
呼気段落のアクセントまたはポ−ズの設定を、アクセン
ト付与規則、ポ−ズ付与規則を用いて行って（ステップ
Ｓ５）、後述するステップＳ７に進む。

【００３３】上記ステップＳ４で語句コ−ドに置き換っ
ている場合には、アクセントやポ−ズの情報が格納され
ている特定語句音韻・韻律辞書を検索してアクセントや
ポ−ズを設定し（ステップＳ６）、更に、発声音声に対
応した合成単位に対する継続時間、ピッチパタ−ン、パ
ワ−パタ−ン及び音韻特徴パラメ−タ（偏自己相関係数
、線スペクトル対、ホルマント等）の時系列を得る（ス
テップＳ７）。

【００３４】従って、本発明のテキスト音声合成装置に
よると、入力日本語文字列の中に特定の語句が入ってい
る場合、その語句に対応するあらかじめ用意された音韻
・韻律情報を用いて音声合成ができ、感情表現等の特殊
な韻律操作が可能となる。

【００３５】図４に、本実施例のテキスト音声合成装置
による出力例を示す。

【００３６】図に示すように、「こら、何をしている」
を入力した場合、「ｋｏｒａ（こら）　　１．１２．９
，ｎａｎｉｏｓｉｔｅｉｒｕ（何をしている）１．１０
．６」が出力される。

【００３７】ここで、ｋｏｒａ及びｎａｎｉｏｓｉｔｅ
ｉｒｕの後にそれぞれ示されている数字について説明す
る。

【００３８】ｋｏｒａの後に示されている数字１．１２
．９のうち、最初の数字１　はアクセント位置、２番目
の数字１２はフレ−ズの大きさ、３番目の数字９　はア
クセントの大きさをそれぞれ表している。また、ｎａｎ
ｉｏｓｉｔｅｉｒｕの後に示されている数字も同様であ
る。その結果、出力例に示すように各数字を大きくする
ことが可能なので、従来のテキスト音声合成装置と比較
して感情的な表現をより明確に表すことができる。

【００３９】

【発明の効果】本発明のテキスト音声合成装置によれば
、入力された文字列を言語解析して所定の情報を生成す
る解析手段と、文字記号列中の特定の単語及び単語列を
検出する語句検出手段と、所定の情報に基づいて音声合
成パラメータを生成する音声パラメ−タ生成手段と、特
定語句に対応する所定の情報を格納する語句情報辞書と
、語句情報辞書に格納された所定の情報に基づいて特定
語句の音声を合成する音声合成手段とを備えているので
感情表現などの特殊な抑揚を表わすことができる。

【図面の簡単な説明】

【図１】本発明のテキスト音声合成装置における一実施
例の構成を示すブロック図である。

【図２】図１の特定語句音韻・韻律辞書の構成を示す図
である。

【図３】図１のテキスト音声合成装置の動作を説明する
ためのフロ−チャ−トである。

【図４】図１のテキスト音声合成装置による出力例を説
明するための図である。

【図５】従来のテキスト音声合成装置の一構成を示すブ
ロック図である。

【符号の説明】

１１　　文字記号列入力部１２　　文字記号列解析部１３　　辞書１４　　特定語句検出部１５　　特定語句音韻・韻律辞書１６　　合成音声パラメータ生成部１７　　音声合成部１８　　合成音声出力部

Claims

【特許請求の範囲】

【請求項１】　　入力された文字列を言語解析して所定
の情報を生成する解析手段と、前記文字記号列中の特定
の単語及び単語列を検出する語句検出手段と、前記所定
の情報に基づいて音声合成パラメータを生成する音声パ
ラメ−タ生成手段と、前記特定語句に対応する前記所定
の情報を格納する語句情報辞書と、前記語句情報辞書に
格納された前記所定の情報に基づいて前記特定語句の音
声を合成する音声合成手段とを備えていることを特徴と
するテキスト音声合成装置。