JPH0916372A - 音声合成装置 - Google Patents

音声合成装置

Info

Publication number
JPH0916372A
JPH0916372A JP7144965A JP14496595A JPH0916372A JP H0916372 A JPH0916372 A JP H0916372A JP 7144965 A JP7144965 A JP 7144965A JP 14496595 A JP14496595 A JP 14496595A JP H0916372 A JPH0916372 A JP H0916372A
Authority
JP
Japan
Prior art keywords
reading
symbol
string
character string
morpheme
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP7144965A
Other languages
English (en)
Inventor
Yuichi Kojima
裕一 小島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP7144965A priority Critical patent/JPH0916372A/ja
Publication of JPH0916372A publication Critical patent/JPH0916372A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 【目的】 文字列中の数字・記号列をまとめて1つの単
位として扱うことにより、数字・記号列に自由に、か
つ、正しく読みを与える音声合成装置を提供する。 【構成】 音声合成装置に入力された文字列は、判定手
段1によって入力順に判定条件と照合され、判定条件と
合致する場合は読み付与手段3に、そうでない場合は通
常音声合成手段2に送られる。読み付与手段3に送られ
た数字・記号列は該数字・記号列にあった音声波形を生
成し、その結果がスピーカ4に送られる。一方、通常音
声合成手段2に送られた文字列は、形態素解析され、形
態素ごとの読みを連結し、隣合う形態素の品詞情報から
各形態素間のポーズを設定し、これらの読み記号列を用
いて音声波形を生成し、その結果がスピーカ4に送られ
る。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、音声合成装置に関し、
より詳細には、与えられた任意の文章を読み上げること
を目的とした音声合成装置に関し、例えば、電話を介し
た新聞速報の読み上げ、個人宛電子メールの読み上げな
ど、視覚が制限された分野においての文章単位の情報の
出力全般に使用して好適なものである。
【0002】
【従来の技術】例えば、「5cm/秒」という文字列が
あるとき、「ごせんちめーとるまいびょう」と発音され
るとわかりやすい。文字列を入力し、発音する音声合成
装置の場合、記号は様々な読みが考えられるので、記号
の処理が問題となる。
【0003】そこで、記号の処理の仕方として、 :記号に対する音声情報を単語辞書に加え、記号に対
する音声情報を決定するための記号用音声情報規則手段
を設け、記号の周囲の単語の情報を参照し、記号に読み
を与えるようにし、上記例では、「/」に「まい」とい
う読みを与えるものや(特開平6−186993号公報
参照)、 :入力された文字列の文字や記号が所定の条件を満た
すかを判定する判定手段を設け、前記判定手段の判定結
果に基づいて当該文字や記号に所定の変換処理を施す手
段を設け、記号の周囲の単語の並びを参照し、並び全体
に変換処理を施し、上記例では、「cm/秒」を「cm
毎秒」に変換するもの(特開平4−98318号公報参
照)、などがある。
【0004】
【発明が解決しようとする課題】前記従来技術におい
ては、周囲の単語の情報を参照し、記号に読みを与えて
いる。しかしながら、読みは記号単位で与えられるた
め、例えば「12:10」という文字列は「:」に
「時」という読みは与えることはできても、「分」に相
当する記号が存在しないため、「12時10分」と読ま
せることは困難であった。
【0005】また、前記従来技術においては、「1
2:10」を「12時10分」という文字列に変換する
ことができるが、この場合、例えば、文字列、「12:
10数人の・・・」は「12時10分数人の・・・」と
変換され、「・・・10分・・・」と「・・・分数・・
・」という2通りの解釈が可能になり、変換後の解析が
誤った場合には記号の読みが誤る可能性がある。
【0006】本発明は、上述のごとき実情に鑑みてなさ
れたもので、文字列中の数字・記号列をまとめて1つの
単位として扱うことにより、数字・記号列に自由に、か
つ正しく読みを与える音声合成装置を提供することを目
的とする。
【0007】
【課題を解決するための手段】本発明は、上記課題を解
決するために、(1)文字列を入力する入力手段と、前
記文字列に、読みを付与する音声合成手段と、音声を出
力する出力手段とより成る音声合成装置において、前記
文字列中の数字・記号列を判定し、該数字・記号列が特
定の順番で並んでいるかどうかを判定する判定手段と、
該判定手段での判定結果に基づいて、数字・記号列に読
みを付与する読み付与手段とを備えていること、更に
は、前記(1)において、(2)前記読み付与手段が、
読みを付与する数字・記号列の前後の文字列を参照する
参照手段を備えていること、或いは、(3)前記読み付
与手段が、読みを付与する数字・記号列の前後の読みを
参照する参照手段を備えていること、或いは、(4)前
記読み付与手段が、読みを付与する数字・記号列の前後
の読みを変更する変更手段を備えていること、或いは、
(5)文字列を入力する入力手段と、少くとも表記およ
び読み情報をもつ形態素辞書と、形態素辞書引き手段
と、辞書引き結果格納手段と、辞書引き結果に基づいて
最適な形態素列を選択決定する形態素列決定手段とを備
え、前記文字列に読みを生成する音声合成装置におい
て、文字列中の数字・記号列を判定する判定手段と、そ
の判定結果が、数字・記号列であれば、形態素辞書引き
結果に加えて、該数字・記号列を1つの形態素として前
記辞書引き結果格納手段に格納する数字・記号列格納手
段と、前記数字・記号列に読みを付与する読み付与手段
とを備えていることを特徴とするものである。
【0008】
【作用】請求項1の発明では、文字列を入力する入力手
段と、前記文字列に読みを付与する音声合成手段と、音
声を出力する出力手段とより成る音声合成装置におい
て、前記文字列中の数字・記号列を判定し、該数字・記
号列が特定の順番で並んでいるかどうかを判定し、その
判定結果に基づいて、数字・記号列に読みを付与する。
請求項2乃至4の発明では、請求項1の作用に加え、読
み付与手段が読みを与える数字・記号列の前後の文字列
への参照手段、または、読みへの参照手段、または、前
後の文字列の読みへの変更手段によって、前後の文字列
によって読みが変化する数字・記号列に正しい読みを与
える。請求項5の発明では、文字列中の数字・記号列を
判定する判定手段と、前記判定手段の結果に基づいて前
記数字・記号列を1つの形態素として形態素辞書引き結
果格納手段に格納することによって数字・記号列を1つ
の形態素として扱う。
【0009】
【実施例】図1は、請求項1の発明による音声合成装置
の概要を説明するための図で、図中、1は判定手段、2
は通常音声合成手段、3は読み付与手段、4はスピーカ
で、音声合成装置に入力された文字列は、判定手段1に
よって、図2に示すように、入力順に判定条件と照合さ
れ、判定条件と合致する場合は読み付与手段3に、そう
でない場合は通常音声合成手段2に送られる。
【0010】図2は、文中に日付を表す場合の記号
「/」がある文字列、例えば、「今日は12/10曜日
は・・・」という文が本装置に与えられた場合の判定の
フローチャートで、以下、各ステップについて説明す
る。
【0011】STEP 1: 与えられた文中の「/」
を中心とする表記「は,1,2,/,1,0,曜」に解
析用のアルファベット「A,B,C,D,E,F,G」
を対応させる。 STEP 2: A≠数字、かつ、B=数字、かつ、C
=数字、かつ、D=”/”、かつ、E=数字、かつ、F
=数字、かつ、G≠数字、ならば、STEP3へ、違う
のなら、通常音声合成手段2へ送る。 STEP 3: BCが12以下ならSTEP4へ、違
うのなら、通常音声合成手段2へ送る。 STEP 4: EFが31以下なら、数字・記号文字
列「12/10」を読み付与手段3へ、違うのなら、通
常音声合成手段2へ送る。
【0012】なお、上記においては、一実施例として日
付を示す数字・記号列の判定を示したが、本発明は、日
付に限らず、時刻、電話番号、通常の数字など、表記文
字列とは異なった読みをさせたい全ての文字列に適用可
能である。通常音声合成手段2に送られた文字列は、例
えば、形態素解析され、形態素ごとの読みを連結し、隣
合う形態素の品詞情報から各形態素間のポーズを設定
し、これらの読み記号列を用いて音声波形を生成し、そ
の音声波形がスピーカ4に送られて発声されるが、この
過程については既知であるので、その詳細は省略する。
【0013】図3は、読み付与手段3に送られてきた
「12/10」の読み上げを説明するためのフローチャ
ート、図4(A)は、「月」を表す数字の読みテーブ
ル、図4(B)は、「日付」を表す数字の読みテーブル
である。以下、図3の各ステップについて説明する。 STEP 1: 数字BC(月)の読みが、図4(A)
テーブル1を参照して音声波形に変換され、STEP2
へ送る。 STEP 2: 数字BC(月)の読みを、スピーカ4
へ送るとともに、STEP3へ送る。 STEP 3: ポーズ(無音区間)が、スピーカ4に
送られ、同時にSTEP4へ送られる。 STEP 4: 数字EF(日付)の読みが、図4
(B)テーブル2を参照して音声波形に変換され、ST
EP5へ送られる。 STEP 5: 数字EF(日付)の読みがスピーカ4
に送られ、その読みが出力される。 なお、上記の説明から明らかなように、図4(A),
(B)において、テーブル1,2には、それぞれ説明の
便宜上読みが記されているが、実際の構成では音声波形
が記録されている。
【0014】以上が、請求項1の発明による音声合成装
置の一実施例であり、該実施例においては、最も簡単な
形として、録音再生型の音声合成装置との併用という形
式をとったが、本発明の構成は、これにとらわれるもの
ではなく、例えば、通常音声合成手段3、読み付与手段
2からスピーカ4へ直結せず、一旦、共通の読み記号列
バッファに書き込み、その結果を読み記号列発音手段を
用いてスピーカ4に出力するなどの構成も可能である。
【0015】図5は、請求項2乃至4に記載の音声合成
装置の概要を説明するための図で、図中、10は入力手
段、11は文字列バッファ、12は判定手段、13は通
常読み生成手段、14は読み付与手段、15は読み記号
列バッファ、16は読み記号列発音手段、17はスピー
カで、音声合成装置に入力された文字列は、一旦、文字
列バッファ11に格納され、判定手段12によって通常
読み生成手段13または読み付与手段14に振り分けら
れる。通常読み生成手段13の出力は、一旦、読み記号
列バッファ15に格納される。この読み記号列バッファ
15は文末の読み記号列(句点に相当する読み記号)が
送られてきた時点で、読み付与手段14を起動する。読
み付与手段14によって残りの読みが生成されると、読
み記号列の全体が読み記号列発音手段16に送られる。
読み記号列発音手段16では、読み記号列を音声波形に
変換し、スピーカ17に送る。
【0016】読み付与手段14には、文字列バッファ1
1へのポインタ14aおよび読み記号列バッファ15へ
のポインタ14bが与えられ、これらポインタ14a,
14bを介して、読みを付与する数字・記号列の前後の
文字列バッファ、読み記号列バッファを参照および/ま
たは更新するとができる。
【0017】例えば、文字列「4次」が与えられると、
判定手段12は「4」を読み付与手段14に、「次」を
通常読み生成手段13に送る。読み付与手段14は与え
られた数字「4」以外に、文字列バッファ11へのポイ
ンタ14aを用いて後続文字「次」を参照し、その結
果、「4」の読みとして「よん」でなく「よ」を生成す
る。
【0018】また、文字列「10分」が与えられると、
判定手段12は「10」を読み付与手段14に、「分」
を通常読み生成手段13に送る。読み付与手段14は与
えられた数字「10」以外に、読み記号列バッファ15
へのポインタ14bを用いて後続の読み「ふん」を参照
し、その結果、「10」の読みとして「じゅう」でなく
「じゅっ」を生成し、後続読み「ふん」を「ぷん」に変
更する。
【0019】前記「読み」を参照する実施例は、前述の
「文字列」を参照する個々の実施例「泊」、「発」、
「分」などの単位で対応することも可能であるが、「ハ
行の音」として扱った方が簡単であり、周囲の誤解析の
影響を受ける恐れもあるが、数字の読みの変化は広く存
在する現象であり、むしろ、正しく読みを与えられる効
果の方が大きい。更に、「ふん」を「ぷん」と変更して
いるため、数字・記号列の周囲に誤った読みを与える可
能性もあるが、これも、前記同様、むしろ、正しく読み
を与えられる効果の方が大きい。これらの数字と助数詞
の読みの変更ルールについては、文献「日本文音声変換
のための数詞読み規則」(情報処理学会論文誌,Vo
l.25,No.6,Nov.1984)に詳しく述べ
られている。
【0020】図6は、請求項5に記載の音声合成装置の
概要を説明するための図で、図中、21は文字列バッフ
ァ、22は判定手段、23は数字・記号列格納手段、2
4は形態素辞書引き手段、25は形態素辞書、26は形
態素候補バッファ、27は形態素列決定手段、28は形
態素列バッファ、29は読み記号列生成手段、30は読
み付与手段、31は読み記号列発音手段、32はスピー
カである。
【0021】図6において、入力された文字列は、文字
列バッファ21に格納され、次いで、判定手段22によ
って判定され、数字および特定の記号よりなる文字列な
らば、形態素辞書引き手段24による辞書引きの前に、
数字・記号列格納手段23によって該数字・記号列を1
つの形態素として形態素候補バッファ26に格納し、数
字・記号列でなければ、そのまま、前記形態素辞書引き
手段24によって辞書引きする。後は、一般の形態素解
析と同様に形態素辞書25の検索の結果を形態素候補バ
ッファ26に格納し、品詞間の接続判定を行ない、最長
一致法などによって形態素列を形態素列決定手段27に
よって決定した後、形態素情報である、(1)表記文字
列、(2)読み記号列、(3)形態素列バッファ中の位
置(番号)、等を形態素列バッファ28に格納し、読み
記号列生成手段29によって形態素列の読み記号列を連
結し、入力文字列全体の読み記号列を生成する。
【0022】前記入力文字列全体の読み記号列を生成す
る際、前記数字・記号列格納手段23によって格納され
た形態素は辞書引き操作がされていないため、読み記号
列が付与されておらず、前接形態素へのポインタ30
a,後接形態素へのポインタ30bを、数字・記号列に
読みを与える読み付与手段30によって、該数字・記号
列の前接形態素、後接形態素を参照/更新しながら数字
・記号列に読み記号列を生成する。
【0023】前記入力文字列全体の読み記号列は、読み
記号列発音手段31に送られ、音声波形に変換後、スピ
ーカ32に送られる。
【0024】なお、上記の説明から明らかなように、例
えば、文字列「1月1日」をどうしても「がんたん」と
読ませたい時など、前記請求項1乃至4までの実施例で
は対応できないが、本実施例では形態素辞書25にあら
かじめ、「1月1日」を「がんたん」と登録しておけ
ば、最長一致法では「1月1日」の読み「がんたん」が
採用される。
【0025】
【発明の効果】
請求項1に対応する効果:数字・記号列が、特定の順番
で並んでいるかどうかを判定する判定手段と、該判定手
段での判定結果に基づいて、特定の順番で並んでいる数
字・記号列全体に読みを付与する読み付与手段とを備え
ることにより、数字・記号列の読みを、他の文字列に読
みを与える音声合成処理手段と独立して与えることにな
り、数字や記号に自由に読みを与えることができる。 請求項2乃至4に対応する効果:請求項1の作用に加
え、読み付与手段が読みを与える数字・記号列の前後の
文字列への参照手段、または、読みへの参照手段、また
は、前後の文字列の読みへの変更手段を備えることによ
り、前後の文字列によって読みが変化する数字・記号列
に正しい読みを与えたり、前後の文字列の読みに変化を
与えることができ、使用者に、違和感を与えない音声出
力が提供できる。 請求項5に対応する効果:判定手段での判定結果に基づ
いて、数字・記号列全体を1つの形態素として格納する
数字・記号列格納手段を設けることにより、形態素解析
を行って読みを生成する従来の音声合成装置の仕組を大
きく変化させることなく、数字・記号列に正しい読みを
与えることができるので、従来装置が流用でき経済的で
ある。
【図面の簡単な説明】
【図1】 請求項1の発明による音声合成装置の概要を
説明するための図である。
【図2】 日付判定の一例を説明するためのフローチャ
ートである。
【図3】 文字列の読み上げを説明するためのフローチ
ャートである。
【図4】 「月」、「日付」を表す数字の読みテーブル
である。
【図5】 請求項2乃至4の発明による音声合成装置の
概要を説明するための図である。
【図6】 請求項5の発明による音声合成装置の概要を
説明するための図である。
【符号の説明】
1…判定手段、2…通常音声合成手段、3…読み付与手
段、4…スピーカ、11…文字列バッファ、12…判定
手段、13…通常読み生成手段、14…読み付与手段、
15…読み記号列バッファ、16…読み記号列発音手
段、17…スピーカ、21…文字列バッファ、22…判
定手段、23…数字・記号列格納手段、24…形態素辞
書引き手段、25…形態素辞書、26…形態素候補バッ
ファ、27…形態素列決定手段、28…形態素列バッフ
ァ、29…読み記号列生成手段、30…読み付与手段、
31…読み記号列発音手段、32…スピーカ。

Claims (5)

    【特許請求の範囲】
  1. 【請求項1】 文字列を入力する入力手段と、前記文字
    列に、読みを付与する音声合成手段と、音声を出力する
    出力手段とより成る音声合成装置において、前記文字列
    中の数字および特定の記号からなる文字列(以下、数字
    ・記号列という)を判定し、該数字・記号列が特定の順
    番で並んでいるかどうかを判定する判定手段と、該判定
    手段での判定結果に基づいて、数字・記号列に読みを付
    与する読み付与手段とを備えていることを特徴とする音
    声合成装置。
  2. 【請求項2】 前記読み付与手段が、読みを付与する数
    字・記号列の前後の文字列を参照する参照手段を備えて
    いることを特徴とする請求項1に記載の音声合成装置。
  3. 【請求項3】 前記読み付与手段が、読みを付与する数
    字・記号列の前後の読みを参照する参照手段を備えてい
    ることを特徴とする請求項1に記載の音声合成装置。
  4. 【請求項4】 前記読み付与手段が、読みを付与する数
    字・記号列の前後の読みを変更する変更手段を備えてい
    ることを特徴とする請求項1に記載の音声合成装置。
  5. 【請求項5】 文字列を入力する入力手段と、少くとも
    表記および読み情報をもつ形態素辞書と、形態素辞書引
    き手段と、辞書引き結果格納手段と、辞書引き結果に基
    づいて最適な形態素列を選択決定する形態素列決定手段
    とを備え、前記文字列に読みを生成する音声合成装置に
    おいて、前記文字列中の数字および特定の記号からなる
    文字列(以下、数字・記号列という)を判定する判定手
    段と、その判定結果が、数字・記号列であれば、形態素
    辞書引き結果に加えて、該数字・記号列を1つの形態素
    として前記辞書引き結果格納手段に格納する数字・記号
    列格納手段と、前記数字・記号列に読みを付与する読み
    付与手段とを備えていることを特徴とする音声合成装
    置。
JP7144965A 1995-04-28 1995-06-12 音声合成装置 Pending JPH0916372A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7144965A JPH0916372A (ja) 1995-04-28 1995-06-12 音声合成装置

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP7-106554 1995-04-28
JP10655495 1995-04-28
JP7144965A JPH0916372A (ja) 1995-04-28 1995-06-12 音声合成装置

Publications (1)

Publication Number Publication Date
JPH0916372A true JPH0916372A (ja) 1997-01-17

Family

ID=26446665

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7144965A Pending JPH0916372A (ja) 1995-04-28 1995-06-12 音声合成装置

Country Status (1)

Country Link
JP (1) JPH0916372A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2000019408A1 (en) * 1998-09-30 2000-04-06 Lernout & Hauspie Speech Products N.V. Voice command navigation of electronic mail reader

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2000019408A1 (en) * 1998-09-30 2000-04-06 Lernout & Hauspie Speech Products N.V. Voice command navigation of electronic mail reader

Similar Documents

Publication Publication Date Title
US6990450B2 (en) System and method for converting text-to-voice
US7292980B1 (en) Graphical user interface and method for modifying pronunciations in text-to-speech and speech recognition systems
US20020077822A1 (en) System and method for converting text-to-voice
JP5198046B2 (ja) 音声処理装置及びそのプログラム
JPH1083277A (ja) 連結型読み上げシステム及びテキストを音声に変換する方法
WO2004066271A1 (ja) 音声合成装置,音声合成方法および音声合成システム
US20020103648A1 (en) System and method for converting text-to-voice
US20020072907A1 (en) System and method for converting text-to-voice
JPH0916372A (ja) 音声合成装置
JP3589972B2 (ja) 音声合成装置
Gakuru et al. Development of a Kiswahili text to speech system.
JP4026512B2 (ja) 歌唱合成用データ入力プログラムおよび歌唱合成用データ入力装置
JP3201329B2 (ja) 音声合成装置
JPH0962286A (ja) 音声合成装置および音声合成方法
JPH09244677A (ja) 音声合成システム
JPH03245192A (ja) 外国語単語の発音決定方法
JP3279261B2 (ja) 定型文コーパス作成装置、方法及び記録媒体
RU2113726C1 (ru) Компьютерное устройство для чтения плоскопечатного текста
JPH07152392A (ja) 音声合成装置
JP3414326B2 (ja) 音声合成用辞書登録装置及び方法
JP2003005776A (ja) 音声合成装置
JP2000187494A (ja) 音声合成方法および音声合成装置
JP3553981B2 (ja) 辞書登録方法及び装置
JPH08160983A (ja) 音声合成装置
JPS63165925A (ja) 文章読み上げ装置

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040727

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20041207