JP3404055B2 - 音声合成装置 - Google Patents

音声合成装置

Info

Publication number
JP3404055B2
JP3404055B2 JP23787792A JP23787792A JP3404055B2 JP 3404055 B2 JP3404055 B2 JP 3404055B2 JP 23787792 A JP23787792 A JP 23787792A JP 23787792 A JP23787792 A JP 23787792A JP 3404055 B2 JP3404055 B2 JP 3404055B2
Authority
JP
Japan
Prior art keywords
sentence
category
semantic information
speech
kanji
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP23787792A
Other languages
English (en)
Other versions
JPH0683381A (ja
Inventor
孝浩 釜井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Panasonic Holdings Corp
Original Assignee
Panasonic Corp
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp, Matsushita Electric Industrial Co Ltd filed Critical Panasonic Corp
Priority to JP23787792A priority Critical patent/JP3404055B2/ja
Publication of JPH0683381A publication Critical patent/JPH0683381A/ja
Application granted granted Critical
Publication of JP3404055B2 publication Critical patent/JP3404055B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Description

【発明の詳細な説明】 【0001】 【産業上の利用分野】本発明は、日本語漢字仮名混じり
文のテキストを音声に変換する音声合成装置に関する。 【0002】 【従来の技術】情報機器、通信機器などから与えられる
メッセージを音声に変換する音声合成装置は、従来から
数多く用いられている。たとえば、与えられるメッセー
ジの種類が限られている場合にはそれぞれのメッセージ
に対応した音声をPCMデータや、ADPCMデータな
どの圧縮された形で記憶しておき、必要に応じて再生す
ればよい。しかし、メッセージの種類が多くなると、こ
の方法では記憶しなければならないデータ量が膨大にな
り、装置の規模や複雑さが増大してしまう。これに対し
本発明が対象とする方式は、言語情報を用いて任意のテ
キストから自然なイントネーションを持った音声を合成
する方式であり、規則合成方式と呼ぶ。また、規則合成
方式を用いた音声合成装置を音声規則合成装置と呼ぶ。
音声規則合成装置は自然言語を文法規則や辞書を用いて
解析し、自然な読みやアクセントを付与して音声を合成
する。したがって、任意の文章を音声に変換することが
でき、メッセージの種類が限定できないシステムや、通
信システムなどに広く応用することができる。 【0003】図4は従来の音声規則合成装置の構成の一
例を示すものである。その合成装置には入力されたテキ
ストを一時記憶する入力テキスト記憶部1が設けられ、
その入力テキスト記憶部1の出力には言語処理部2が接
続されている。言語処理部2は辞書部3に記憶された辞
書を参照する。言語処理部2の出力は、パラメータ生成
部4に接続されている。パラメータ生成部4は個人情報
保持部5を参照する。パラメータ生成部4の出力は、合
成部9に接続されている。 【0004】以上のように構成された音声合成装置につ
いて、以下にその動作を説明する。まず、入力されたテ
キストは入力テキスト記憶部1に一時記憶される。これ
はテキスト入力のスピードが音声出力のスピードよりも
早い場合に、同期を取るために必要である。入力テキス
ト記憶部1に記憶されたテキストは、一行ずつ未処理テ
キストとして言語処理部2に出力される。言語処理部2
は未処理テキストが入力されると辞書部3を参照する。
辞書部3にはさまざまな単語に対し、読み、アクセン
ト、品詞などが登録されている。こうして言語処理部2
は未処理テキストを、音素記号とアクセント記号を含む
処理済みテキストに変換し、パラメータ生成部4に出力
する。パラメータ生成部4は処理済みテキストが入力さ
れると個人情報保持部5を参照する。個人情報保持部5
には各音素記号に対するホルマント周波数や音韻継続時
間などが格納されている。ここからパラメータ生成部4
は、各音素に対応するパラメータの値を取り出し、それ
らを時間軸上で接続、補間し、たとえば10[ミリ秒]
間隔でパラメータの時系列を生成する。こうしてパラメ
ータ生成部4は処理済みテキストから音声パラメータを
生成し、合成部9に出力する。合成部9では音声パラメ
ータから音声を合成する。 【0005】 【発明が解決しようとする課題】さて、このようにして
合成された音声を長時間聞いていると、話調に変化がな
いため受聴者は聞き疲れをし、聞きのがしを起こしやす
い。また、文章の内容が話調に反映されないので、受聴
者は合成音声の意味内容を理解することに多大の負担を
強いられる。人間が文章を読み上げる場合や他人に意志
を伝えようとするときは、文章の内容によって話し方を
変えるのが普通である。それは、話者が話の中で重要な
点を意識的に強調することで、正確に意味を伝えようと
するからである。また、受聴者は話者が強めた部分を選
択的に聞くことにより、効率良く意味を理解することが
できる。このような文章内容の違いに対する規則合成方
式の問題点を解消するには、文単位で意味内容を把握
し、それに対応して話調を変えることが不可欠である。 【0006】ところが規則合成方式の場合、文単位はも
とより単語単位でも意味内容を把握することは行われて
いないのが現状である。そのため、どのような内容の文
章であっても合成された音声は同様の話調を持ち、受聴
者がメッセージを選択的に聞くことはできない。たとえ
ば音声規則合成装置を館内放送システムに用いる場合、
そのメッセージには毎日行われる通常連絡と避難命令な
どの緊急連絡が含まれる。このような場合、緊急連絡が
通常連絡と同じ話調で合成された場合、受聴者がメッセ
ージの緊急性に気付きにくい。 【0007】緊急連絡を通常連絡と同じように、聞きや
すい落ちついた話し方の合成音で放送した場合、受聴者
は緊急連絡を普段の通常連絡と勘違いして、注意を払わ
ず聞きのがしてしまう恐れがある。逆に、通常連絡を緊
急連絡と同じようにけたたましい音声で放送した場合、
受聴者を疲労させることが考えられる。また、本能的に
館内放送から耳をそむけてしまい肝心の緊急放送を聞き
のがしてしまう危険も考えられる。このように、音声規
則合成装置を館内放送に応用する場合は、メッセージの
緊急性とは無関係に、一定の話調で合成されるという問
題点がある。このことは館内放送の他にもあらゆる用途
において問題となる。 【0008】そこで本発明は上記従来の問題点を解消
し、メッセージのカテゴリに応じて話調を変え、受聴者
が自然にメッセージの選択的聴取ができる音声合成装置
を提供することを目的とする。 【0009】 【課題を解決するための手段】この目的を達成するため
に本発明の音声合成装置は、入力テキストから熟語また
は漢字を抽出する文字列抽出手段と、抽出された文字列
に対応する意味情報を登録した意味情報記憶手段と、意
味情報記憶手段から得られた意味情報をもとに文単位で
カテゴリとレベルを出力する意味情報計算手段と、意味
情報計算手段の出力に応じて音声の発声速度、平均ピッ
チ、音質、音量などを制御する合成制御手段とを有する
構成である。 【0010】 【作用】本発明は上記した構成において、入力テキスト
から文字列抽出手段によって熟語または漢字を抽出し、
辞書を用いてそれぞれの熟語または漢字の意味情報を調
べ、これを1文にわたり総合することで文のカテゴリを
判断し、合成制御手段が判断された文のカテゴリとレベ
ルに従って音声の発声速度、平均ピッチ、音質、音量な
どを制御する。この結果、合成部において合成される音
声の話調を文の意味情報によって変化させることとな
る。 【0011】 【実施例】以下、本発明の一実施例の音声合成装置につ
いて図面を用いて説明する。図1は、本発明の第1の実
施例の音声合成装置の構成図である。すなわち、入力さ
れたテキストを一時記憶する入力テキスト記憶部1が設
けられ、その入力テキスト記憶部1の出力には言語処理
部2および熟語抽出部6が並列に接続されている。言語
処理部2は辞書部3に接続され、その辞書部3に格納さ
れた辞書を参照する。言語処理部2の出力はパラメータ
生成部4に入力される。一方、熟語抽出部6の出力はカ
テゴリ計算部7に接続されている。そのカテゴリ計算部
7はカテゴリ辞書8を参照する。カテゴリ計算部7の出
力はパラメータ生成部4に入力される。パラメータ生成
部4は言語処理部2からの入力とカテゴリ計算部7から
の入力をもとに個人情報保持部5を参照し、その出力は
合成部9に入力される。 【0012】本実施例の入力テキスト記憶部1は請求項
1の入力テキスト記憶手段、熟語抽出部6は文字列抽出
手段、カテゴリ辞書8は意味情報記憶手段、カテゴリ計
算部7は意味情報計算手段、パラメータ生成部4は合成
制御手段、合成部9は音声合成手段にそれぞれ対応す
る。 【0013】つぎに、以上のように構成された音声合成
装置について、以下にその動作を説明する。まず、入力
された日本語漢字仮名混じり文は、いったん入力テキス
ト記憶部1に記憶される。入力テキスト記憶部1からは
1文づつ未処理テキストが出力され、その未処理テキス
トは従来と同じように言語処理部2に入力されると同時
に、本発明で新たに設けられた熟語抽出部6にも入力さ
れる。言語処理部2は従来通り辞書部3に格納された辞
書を参照することによって、入力された未処理テキスト
を読みやアクセントを付加された処理済みテキストに変
換し、後段に接続されたパラメータ生成部4に出力す
る。 【0014】一方、熟語抽出部6では未処理テキストか
ら熟語のみを抽出し、やはり本発明で新たに設けられた
カテゴリ計算部7に出力する。熟語の抽出はテキスト中
で文字の種類が仮名から漢字へ、また漢字から仮名へ変
化する点をもとに行う方法などがある。本発明は従来の
音声規則合成装置が備えていた辞書部3の他に、以下の
考えに基づき熟語のカテゴリを登録したカテゴリ辞書8
を設ける。 【0015】日本語漢字仮名混じり文に含まれる個々の
漢字にはそれぞれ意味がある。そして、個々の漢字が組
み合わされ、熟語が作られる。また、熟語がいくつか用
いられて一つの文を形成する。したがって、文全体のお
およその意味は、用いられている熟語または漢字の意味
から推測することができる。これは、熟語または漢字を
カテゴリに分けてカテゴリ辞書8に登録しておくことで
可能である。 【0016】以上の考えに基づき設けられたカテゴリ辞
書8はカテゴリ計算部7から与えられた熟語に対し、カ
テゴリの評価値を出力する。カテゴリ計算部7では各熟
語に対して与えられたカテゴリの評価値を総合して、文
のカテゴリと、そのカテゴリにおけるレベルを判断す
る。これが意味情報としてパラメータ生成部4に出力さ
れる。 【0017】パラメータ生成部4は従来例同様、言語処
理部2から与えられた処理済みテキストを個人情報保持
部5を参照することにより音声パラメータに変換する
が、このときにカテゴリ計算部7により与えられる意味
情報に対応して、音声パラメータを変化させる。たとえ
ば、メッセージの緊急性の度合いに応じて発声速度、平
均ピッチ、音質、音量などを変化させる。 【0018】このようにして生成された音声パラメータ
はカテゴリ計算部7によって判断されたメッセージの意
味情報に対応して変化しているので、合成部によって異
なる話調の音声が合成される。 【0019】つぎに、本実施例におけるカテゴリ辞書8
および、カテゴリ計算部7の動作について説明する。
(表1)にカテゴリ辞書8の1例を示す。 【0020】 【表1】 【0021】(表1)は上段が登録されている熟語を表
し、下段がそれぞれの熟語の緊急度を表している。緊急
度の値が大きいほど、その熟語は緊急性が高いことを表
す。このカテゴリ辞書8に登録されていない熟語は緊急
度が0であるとし、緊急度は4段階の数値で表されるも
のとする。 【0022】図2はカテゴリ計算部7周辺の説明図であ
る。以降の説明では例として例文1「火災が発生しまし
た。」、例文2「危険ですから落ち着いて避難して下さ
い。」、例文3「ラジオ体操を始めましょう。」、例文
4「これで午後の休憩時間を終わります。」の4つを用
いる。図2では熟語抽出部6に例文1「火災が発生しま
した。」が入力されている。熟語抽出部6からは「火
災」と「発生」の二つの熟語が出力され、これに対しカ
テゴリ計算部7がカテゴリ辞書8を参照している。カテ
ゴリ辞書8には「火災」に対し3、「発生」に対し1の
緊急度が登録されているので、3と1をカテゴリ計算部
7に出力する。カテゴリ計算部7はこの二つの値3と1
を加算し、意味情報すなわち緊急度は4であると判断
し、出力する。 【0023】同様に、例文2「危険ですから落ち着いて
避難して下さい。」、例文3「ラジオ体操を始めましょ
う。」、例文4「これで午後の休憩時間を終わりま
す。」という3つの文についてカテゴリ計算の過程をそ
れぞれ(表2)、(表3)、(表4)に示す。 【0024】 【表2】 【0025】 【表3】 【0026】 【表4】 【0027】以上のように各例文に対するカテゴリ計算
部7の出力は、例文1が4、例文2が5、例文3と例文
4が0である。この値に従ってパラメータ生成部4が合
成部9に対し出力する音声パラメータを変化させれば、
緊急度に対応した異なる話調の音声を合成することがで
きる。このとき、変化させる音声パラメータとしては発
声速度、平均ピッチ、音質、音量などが考えられる。た
とえば緊急度、すなわちカテゴリ計算部7の出力が大き
い場合は発声速度を速く、平均ピッチを高く、固く明瞭
度の高い音質の、大音量の音声を合成し、逆に緊急度が
低い場合は発声速度を遅く、平均ピッチを低く、柔らか
く聞きやすい音質の、小音量の音声を合成すればよい。
また、文の意味情報によって音声の男女差や個人差など
を変化させてもよい。 【0028】以上、第1の実施例としてカテゴリ辞書8
に熟語を登録しておく方法について述べた。ところで前
述した通り、個々の漢字はそれぞれ意味を持つので、個
々の漢字を用いて文の意味情報を判断してもよい。そこ
で、つぎに本発明の第2の実施例として、文の意味情報
を判断するために個々の漢字を用いる方法について説明
する。 【0029】図3は、本発明の第2の実施例の音声合成
装置の構成図である。本実施例では第1の実施例におけ
る熟語抽出部6の代わりに漢字抽出部10を用いる。し
たがって、本実施例では漢字抽出部10が請求項1の文
字列抽出手段に対応する。漢字抽出部10は入力テキス
トから漢字のみを抽出して出力する働きを持つ。また、
カテゴリ辞書8には熟語ではなく個々の漢字と、それぞ
れに対応するカテゴリの評価値が登録されている。カテ
ゴリ辞書の一例を(表5)に示す。 【0030】 【表5】 【0031】(表5)のカテゴリ辞書には各漢字に対す
る緊急度が4段階で登録されている。このカテゴリ辞書
を用いてカテゴリ計算を行う過程を第1の実施例になら
って例文1から例文4についてそれぞれ(表6)から
(表9)に示す。 【0032】 【表6】 【0033】 【表7】 【0034】 【表8】 【0035】 【表9】【0036】以上のように各例文に対するカテゴリ計算
部7の出力は、例文1が8、例文2が10、例文3が
1、例文4が1である。このように、本実施例において
も第1の実施例と同様に文の緊急度が計算できる。こう
して計算されたカテゴリ計算部7の出力に従って、パラ
メータ生成部4は音声パラメータを変化させればよい。 【0037】また、第1の実施例では熟語抽出部6が正
確に熟語を抽出できなかった場合、カテゴリ辞書8に該
当しなくなり、文の意味情報は正確に計算できなくなる
が、第2の実施例では単純に漢字を抽出すればよいので
前記の問題は起こらない。また、一般に熟語は複数の漢
字で構成されるため、1文中に含まれる熟語の数よりも
漢字の数の方が多い。このため、カテゴリ計算部7の出
力値は第2の実施例を用いた場合の方が多様になる。し
たがって、合成される音声の話調も複雑に変化し、効果
が大きいと考えられる。 【0038】なお、実施例ではカテゴリ計算部7で単純
な加算を用いてカテゴリ計算を行っているが、これ以外
のたとえば平均値を求めるなどの方法を用いても勿論構
わない。また、実施例では文のカテゴリとして緊急性の
みを扱ったが、それ以外のたとえば娯楽性なども勿論用
いることができる。また、本実施例ではカテゴリ辞書8
に登録するカテゴリの評価値として4段階の値を用いた
が、これ以外の数を用いても、また符号を用いても勿論
構わない。また、カテゴリ辞書8に登録するカテゴリは
一つに限らなくてもよく、各熟語または漢字に対してた
とえば緊急性と娯楽性について評価値を登録しておき、
それぞれのカテゴリについて評価値が出力されるように
しておけば、カテゴリ計算部7で文の意味情報としてそ
れぞれのカテゴリのレベルが計算できる。こうすれば、
ある文が緊急性は6、娯楽性は13などと多方面からの
意味情報が得られるので、合成音もより多様な制御が可
能になる。このときカテゴリ辞書から出力される評価値
と複数のカテゴリとの対応付けは、カテゴリ辞書からの
出力順序による方法や、評価値の範囲にる方法などが考
えられる。 【0039】 【発明の効果】以上説明したように、本発明の音声合成
装置は入力テキスト中の熟語または漢字を抽出し、カテ
ゴリ辞書を参照して文の意味情報を判断し、自動的に合
成音の話調を変化させることにより、単調な合成音を聞
き続けることによる聞き疲れや聞きのがしを防ぐととも
に、メッセージの意味情報が話調に反映されるため、メ
ッセージの意味を理解することが容易になるという有用
なものである。
【図面の簡単な説明】 【図1】本発明の第1の実施例の音声合成装置のブロッ
ク図 【図2】同じくそのカテゴリ計算部周辺の要部ブロック
図 【図3】同じく第2の実施例の音声合成装置のブロック
図 【図4】従来例の音声合成装置のブロック図 【符号の説明】 1 入力テキスト記憶部 2 言語処理部 3 辞書部 4 パラメータ生成部 5 個人情報保持部 6 熟語抽出部 7 カテゴリ計算部 8 カテゴリ辞書 9 合成部 10 漢字抽出部

Claims (1)

  1. (57)【特許請求の範囲】 【請求項1】 所定の目的に応じた内容の日本語漢字仮
    名混じりテキストを記憶し、1文ずつ出力する入力テキ
    スト記憶手段と、前記1文中から熟語または漢字を抽出
    する文字列抽出手段と、前記文字列抽出手段により抽出
    された熟語または漢字に対応する意味情報を登録した意
    味情報記憶手段と、前記意味情報記憶手段から得られた
    意味情報をもとに文単位でカテゴリーとレベルを出力す
    る意味情報計算手段と、前記1文を合成し音声に変換す
    る音声合成手段と、前記意味情報計算手段のカテゴリー
    とレベルとに応じ、前記音声合成手段を制御する合成制
    御手段とを備えた音声合成装置であって、前記合成制御
    手段は、前記意味情報計算手段の出力に応じて前記音声
    合成手段の発声速度、平均ピッチ、音質、音量のうち少
    なくとも一つを制御することを特徴とする音声合成装
    置。
JP23787792A 1992-09-07 1992-09-07 音声合成装置 Expired - Fee Related JP3404055B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP23787792A JP3404055B2 (ja) 1992-09-07 1992-09-07 音声合成装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP23787792A JP3404055B2 (ja) 1992-09-07 1992-09-07 音声合成装置

Publications (2)

Publication Number Publication Date
JPH0683381A JPH0683381A (ja) 1994-03-25
JP3404055B2 true JP3404055B2 (ja) 2003-05-06

Family

ID=17021748

Family Applications (1)

Application Number Title Priority Date Filing Date
JP23787792A Expired - Fee Related JP3404055B2 (ja) 1992-09-07 1992-09-07 音声合成装置

Country Status (1)

Country Link
JP (1) JP3404055B2 (ja)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
GB2427109B (en) 2005-05-30 2007-08-01 Kyocera Corp Audio output apparatus, document reading method, and mobile terminal
JP5031269B2 (ja) * 2005-05-30 2012-09-19 京セラ株式会社 文書表示装置及び文書読み上げ方法
JP2007206522A (ja) * 2006-02-03 2007-08-16 Toyota Motor Corp 音声出力装置
JP4961807B2 (ja) * 2006-04-05 2012-06-27 株式会社Jvcケンウッド 車載装置、音声情報提供システムおよび発話速度調整方法
JP5179066B2 (ja) * 2007-02-07 2013-04-10 パナソニック株式会社 地震報知システム

Also Published As

Publication number Publication date
JPH0683381A (ja) 1994-03-25

Similar Documents

Publication Publication Date Title
EP1668628A1 (en) Method for synthesizing speech
O'Malley Text-to-speech conversion technology
Hallahan DECtalk software: Text-to-speech technology and implementation
Levinson et al. Speech synthesis in telecommunications
JP3404055B2 (ja) 音声合成装置
AU769036B2 (en) Device and method for digital voice processing
KR20050080671A (ko) 티티에스 시스템의 이모티콘 처리 방법
JPH06337876A (ja) 文章読み上げ装置
JP6289950B2 (ja) 読み上げ装置、読み上げ方法及びプログラム
JPS6223888B2 (ja)
JPH07200554A (ja) 文章読み上げ装置
JPH05224688A (ja) テキスト音声合成装置
JP4056647B2 (ja) 波形接続型音声合成装置および方法
JP2578876B2 (ja) 文章読み上げ装置
JPH01321496A (ja) 音声合成装置
JP2001117575A (ja) 音声合成装置および音声合成プログラムを格納したコンピュータ読み取り可能な記録媒体
JP2888847B2 (ja) 文章読み上げ装置とその方法及び言語処理装置とその方法
JPH08328578A (ja) テキスト音声合成装置
JPH10274998A (ja) 文書読み上げ方法および文書読み上げ装置
JPH07160685A (ja) 文章読み上げ装置
JP2000039897A (ja) テキスト音声合成装置
JPH01147774A (ja) 翻訳通信システム
JPH03269599A (ja) 音声合成装置
JPH02205896A (ja) 音声合成装置
JPH04270394A (ja) ポーズ長決定方式

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080229

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090228

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100228

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100228

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110228

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120229

Year of fee payment: 9

LAPS Cancellation because of no payment of annual fees