JP3286491B2 - 音声出力装置 - Google Patents

音声出力装置

Info

Publication number
JP3286491B2
JP3286491B2 JP07397995A JP7397995A JP3286491B2 JP 3286491 B2 JP3286491 B2 JP 3286491B2 JP 07397995 A JP07397995 A JP 07397995A JP 7397995 A JP7397995 A JP 7397995A JP 3286491 B2 JP3286491 B2 JP 3286491B2
Authority
JP
Japan
Prior art keywords
character string
replacement
reading
unit
string
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP07397995A
Other languages
English (en)
Other versions
JPH08272392A (ja
Inventor
正典 宮武
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sanyo Electric Co Ltd
Original Assignee
Sanyo Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sanyo Electric Co Ltd filed Critical Sanyo Electric Co Ltd
Priority to JP07397995A priority Critical patent/JP3286491B2/ja
Publication of JPH08272392A publication Critical patent/JPH08272392A/ja
Application granted granted Critical
Publication of JP3286491B2 publication Critical patent/JP3286491B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】入力文字列の一部を一定の規則に
従って置換し、斯かる置換後の文字列に読みを付与した
後、その付与された読みに基づいてその文字列を音声合
成する音声出力装置に関する。
【0002】
【従来の技術】従来、入力された文字列を音声に変換す
る方法として、形態素とその読みが登録されている読み
辞書を用いて、それらの文字列に読みを付与した後、付
与された読みに基づいてその文字列を音声に変換し出力
する方法があった。
【0003】一方、人が文字列を読み上げる場合には、
その文字列をそのままの形式で読み上げるのではなく、
その文字列の意味を理解し乍ら、その文字列を読み上げ
に適した文字列に修正して読み上げていた。
【0004】具体的に説明すると、入力文字列として
「・・・・・山田太郎(5)・・・・・」を考えた場合、「5」は
「山田太郎」の歳を意味しているため、人はその文字列
を「やまだたろう ごさい」に修正して読み上げてい
る。然し乍ら、従来の方法では、文字列に単に読みを付
与しているだけであるため、その音声出力は「やまだた
ろう かっこ ご かっこ」となり、人が読み上げるのと
比較すると、非常に不自然であり理解しずらいものとな
る。
【0005】更に、入力文字列として「・・・・・御徒町
(おかちまち)・・・・・」を考えた場合、「おかちまち」
は「御徒町」の読みを意味しているため、人はその文字
列を「おかちまち」と修正して読み上げる。
【0006】しかし、従来の方法では、その音声出力は
「おかちまち かっこ おかちまちかっこ」となり、「御
徒町」が2度重複して音声出力されてしまい、これもま
た人が読み上げるのと比較すると、非常に不自然であり
理解しずらいものとなる。
【0007】
【発明が解決しようとする課題】このように、入力文字
列に直接読みを付与しその読みに基づいて、文字列を音
声に変換し出力する音声出力装置においては、人が入力
文字列の意味を理解し乍ら、その文字列を読み上げに適
した文字列に修正して読み上げる場合と比較すると、出
力される音声は非常に不自然となり理解しずらいものと
なるという問題点があった。
【0008】
【課題を解決するための手段】本発明の音声出力装置
は、上述の問題点に鑑み為されたものであり、入力文字
列の一部を置換することを規定した置換規則を保持する
置換規則保持部と、上記置換規則を参照して上記入力文
字列の一部を置換する文字列置換部と、上記入力文字
列、及び該入力文字列の置換後の文字列に読みを付与す
る読み付与部と、付与された読みに基づいて上記入力文
字列の未置換文字列、及び該入力文字列の置換後の文字
列を音声に変換して出力する音声生成部とを有し、上記
置換規則は、漢字列、囲み開始記号、ひらがな列、及び
囲み終了記号の順序で構成される文字列を、漢字列の読
みとひらがな列の読みが同一の時、該漢字列に置換する
ことを特徴とするものである。また、本発明の音声出力
装置は、入力文字列の一部を置換することを規定した置
換規則を保持する置換規則保持部と、上記置換規則を参
照して上記入力文字列の一部を置換する文字列置換部
と、上記入力文字列、及び該入力文字列の置換後の文字
列に読みを付与する読み付与部と、付与された読みに基
づいて上記入力文字列の未置換文字列、及び該入力文字
列の置換後の文字列を音声に変換して出力する音声生成
部とを有し、上記置換規則は、人名詞、囲み開始記号、
数詞、及び囲み終了記号の順序で構成される文字列を人
名詞、数詞、及び”歳”の順序で構成される文字列に置
換することを特徴とする音声出力装置。
【0009】
【作用】本発明では、入力文字列を置換規則に基づいて
読み上げに適した文字列に修正した後、その文字列に読
みを付与し、付与された読みに基づいてその文字列を音
声に変換しているため、自然で聞き取りやすい音声を出
力することができる。
【0010】
【実施例】本発明の一実施例を図1乃至図5に基づいて
説明する。
【0011】図1は本発明の音声出力装置の概略構成図
である。
【0012】図1中の1は自然言語文章の入力文字列を
読み込む入力処理部、2は形態素毎に見出し、品詞、及
び変化形等の情報を格納した形態素辞書部、3は形態素
辞書部2を用いて入力文字列を解析し、形態素を判定す
る形態素解析部、4は入力文字列の一部を置換すること
を規定した置換規則を保持する置換規則保持部、5は形
態素解析部3の出力を参照し乍ら、置換規則保持部4の
置換規則に従って入力文字列の一部を置換する文字列置
換部、6は形態素辞書部2に格納された形態素に対応し
てその読みが格納された読み辞書部、7は形態素解析部
3で判定された形態素に対応した読みを読み辞書から選
択し、入力文字列、或るいは置換規則保持部4の置換規
則に従って置換された文字列に読みを付与する読み付与
部、8は形態素辞書部2の形態素に対応してそのアクセ
ントを保持するアクセント辞書部、9は形態素が接続さ
れることにより生じるアクセントの変化規則を保持する
アクセント変化規則保持部、10はアクセント辞書部
8、及びアクセント変化規則保持部9を用い、入力文字
列、或るいは入力文字列が一部置換された文字列に対し
アクセントを付与する韻律付与部、11は合成音声を構
成するために音素、音節、単語、又は文章等の音声デー
タを蓄積した音声データベース部、12は入力文字列、
或るいは一部置換された文字列、これらの文字列に付与
された読み、及びアクセント情報を基にして、必要な音
声データを音声データベース部11から読み出して、そ
れらを加工し合成音声として出力する音声生成部であ
る。
【0013】一方、図2は置換規則保持部4で保持され
ている置換規則を示す図である。図2(a)は置換規則
のシンタックスを表す図であり、図2(b)及び図2
(c)は置換規則の例を表す図である。
【0014】置換規則は、図2(a)に示すように、コ
ロン「:」により区切られて、置換前部、条件部、及び
置換後部の3要素から構成されている。斯かる置換規則
は、条件部で規定されている条件を満足する、置換前部
の文字列が、入力文字列中に存在する場合、その置換前
部の文字列を置換後部の文字列に置換することを規定し
ている。
【0015】また、置換前部、及び置換後部は、或る文
字種から構成される文字列を表す「文字種変数」、或る
品詞に属する文字列を表す「品詞変数」、又は或る文字
列を表す「定数」により規定される。但し、「定数」は
「文字種変数」、及び「品詞変数」と区別するために、
その前後に「”」を付与するものとする(図2(c)の
歳を参照。)。
【0016】条件部は「文字種変数」、「品詞変数」、
及び「定数」を引き数とする述語により規定され、それ
ぞれの述語は引き数となる「文字種変数」、「品詞変
数」、及び「定数」間の関係を表す。
【0017】以下、図2(b)、及び図2(c)に示さ
れている置換規則について詳細に説明する。
【0018】図2(b)の置換規則に規定されている
「Kanji」は漢字文字種のみから構成される文字列(以
下「漢字列」という。)を表す文字種変数であり、「Hi
ragana」はひらがな文字種のみから構成される文字列
(以下「ひらがな列」という。)を表す文字種変数であ
る。
【0019】また、Start-Symbolは「(」等の囲み開始
記号を表す品詞変数であり、End-Symbolは「)」等の囲
み終了記号を表す「品詞変数」である。更に、Same(Kan
ji,Hiragana)は、Kanji文字種変数とHiragana文字種変
数間の関係を表す「述語」であり、この述語はKanji文
字種変数が表す漢字列の読みとHiragana文字種変数が表
すひらがな列の読みとが同一となることを意味する。
【0020】この置換規則は、漢字列、囲み開始記号、
ひらがな列、及び囲み終了記号の順序で構成される文字
列が入力文字列中に存在し、更に漢字列の読みとひらが
な列の読みが同一の時、その漢字列、囲み開始記号、ひ
らがな列、及び囲み終了記号の順序で構成される文字列
を漢字列に置換することを規定している。
【0021】また、図2(c)の置換規則に規定されて
いるNameは、人名詞に属する文字列を表す「品詞変数」
であり、Numberは数詞に属する文字列を表す「品詞変
数」である。また、”歳”は「定数」である。
【0022】この置換規則は、人名詞、囲み開始記号、
数詞、及び囲み終了記号の順序で構成される文字列が入
力文字列中に存在するとき、その人名詞、囲み開始記
号、数詞、及び囲み終了記号の順序で構成される文字列
を、人名詞、数詞、及び”歳”の順序で構成される文字
列に置換することを規定している。
【0023】次に、図1、及び図2に基づいてその動作
原理について説明する。
【0024】まず、入力処理部1に自然言語文章の入力
文字列が読み込まれると、形態素解析部3は形態素辞書
2の内容に従って形態素解析する。
【0025】この後、文字列置換部5は、置換規則保持
部4で保持されている置換規則を参照し乍ら、或る置換
規則の条件部で規定されている条件を満足し、且つその
置換規則の置換前部の文字列が入力文字列中に存在する
場合、その文字列をその置換規則の置換後部の文字列に
置換する。
【0026】更に、読み付与部7は、形態素とその読み
が登録された読み辞書部6を参照して、文字列置換部5
で置換された入力文字列に読みを付与する。韻律付与部
10はアクセント辞書部8、及びアクセント変化規則保
持部9を参照し乍ら、入力文字列、及び置換された文字
列に韻律を付与する。
【0027】音声生成部12は、音声データベース部1
1を参照し乍ら、付与された読み、韻律に従ってそれら
の文字列を音声に変換し出力する。
【0028】更に図3、及び図4を用いて文字列置換部
5の動作を詳細に説明する。
【0029】図3は、文字列置換部5の概略構成図であ
る。
【0030】図3の3aは置換前部の文字列を入力文字
列の中から特定する特定部、3bは「文字種変数」、及
び「品詞変数」に文字列を代入する代入部、3cは条件
部で規定されている条件を満足しているかどうかを判別
する判別部、3dは置換前部の文字列を置換後部の文字
列に置換する置換部である。
【0031】また図4は、文字列置換部5の詳細フロー
チャートである。
【0032】特定部3aでは、ステップS1とステップ
S2の処理が行われる。ステップS1では、文字列置換
部5は置換規則保持部4が保持する置換規則のうち、該
当する置換規則を選択する。ステップS2では、入力文
字列とその置換規則の置換前部に規定されている「文字
種変数」、「品詞変数」、及び「定数」を比較して、そ
の「文字種変数」が表す文字列、その「品詞変数」が表
す文字列、及びその「定数」が表す文字列が、その置換
前部で規定された順番に隣接して並んでいる部分を入力
文字列から特定し、ステップS3に進む。一方、その部
分が入力文字列中に存在しない場合、ステップS6に進
む。
【0033】代入部3bでは、ステップS3の処理が行
われる。ステップS3では、置換前部の文字種変数に、
ステップS2においてその部分を特定したときに対応付
けられた文字列を代入する。同様に、置換前部の品詞変
数に、ステップS2において上記部分を特定したときに
対応付けられた文字列を代入する。
【0034】判別部3cでは、ステップS4の処理が行
われる。ステップS4では、条件部に規定されているす
べての述語の表す関係を、置換前部に規定されている
「文字種変数」に代入された文字列、「品詞変数」に代
入された文字列、及び「定数」が表す文字列が満足する
とき、ステップS5に進む。一方、いずれかの述語の表
す関係が満足されないとき、ステップS6に進む。
【0035】置換部3dでは、ステップS5とステップ
S6の処理が行われる。ステップS5では、置換後部の
「文字種変数」に代入された文字列、「品詞変数」に代
入された文字列、及び「定数」の表す文字列を、置換後
部で規定されている順番に連結した後、それを上記部分
に置換する処理を行う。最後に、ステップS6では、置
換規則保持部4で保持されている置換規則がステップS
1において全て選択された場合、処理を終了する。一
方、すべて選択されていない場合は、ステップS1に再
度戻る。
【0036】ここで、「神輿で有名な御徒町(おかちま
ち)」が入力処理部1に入力されたときの文字列置換部
5の動作例について説明する。
【0037】まず、ステップS1で、図2(b)で示さ
れる置換規則が選択される。次にステップS2では、Ka
nji文字種変数が表す漢字列、Start-Symbol品詞変数が
表す囲み開始記号、Hiragana文字種変数が表すひらがな
列、及びEnd-Symbol品詞変数が表す囲み終端記号が、置
換前部で規定されている順序で隣接して並んでいる部分
を、「御徒町(おかちまち)」であると判断し、ステッ
プS3に進む。
【0038】ステップS3では、Kanji文字種変数、Sta
rt-Symbol品詞変数、Hiragana文字種変数、及びEnd-Sym
bol品詞変数のそれぞれに、「御徒町」、「(」、「お
かちまち」及び「)」を代入する。ステップS4では、
Kanji文字種変数に代入された「御徒町」とHiragana文
字種変数に代入された「おかちまち」の読みは同一であ
るため、条件部に規定されている述語であるSame(Kanj
i,Hiragana)の関係を満足すると判断して、ステップS
5に進む。
【0039】ステップS5では、ステップS2で特定さ
れた文字列である「御徒町(おかちまち)」を、置換前
部のKanji文字種変数に代入された「御徒町」に置き換
え、置換規則が全て選択された場合、処理を終了する。
一方、すべて選択されていない場合は、ステップS1に
再度戻る。
【0040】これにより、「神輿で有名な御徒町(おか
ちまち)」の音声出力は、「みこしでゆうめいなおかち
まち」となり、「御徒町」を2度重複して音声出力する
ことがなくなり、人が文字列を読み上げるときと同様
に、自然で理解しやすい音声を出力することができる。
【0041】ところで、上述の実施例では、入力文字
列、或るいは入力文字列の一部を置換規則保持部4の置
換規則に従って置換することについて述べたが、入力文
字列が「略語」を含む場合に対応するべく、「略語辞書
部」を設けてもよい。
【0042】例えば、入力文字列が「・・・・・××文相と
○○経企庁長官が会談し・・・・・」であるとすると、その
ままで読みを付与すると「ぶんしょう」、「けいきちょ
うちょうかん」となってしまい、聞く側は非常に分かり
にくくなる。
【0043】従って、図5に示すように「略語辞書部1
3」を形態素解析部3に接続して設けると共に、形態素
辞書部2の形態素に「略語」がある場合、その形態素に
対応してフラグを立てておく。
【0044】而して、聞く側で略語選択モード(図示せ
ず。)を選択すると、フラグを有する、形態素辞書部2
の形態素に対応して、入力文字列の略語部分は略語辞書
部13に基づいて「その略語の基となる文字列」に置換
される。
【0045】この結果、上述の「ぶんしょう」、「けい
きちょうちょうかん」は夫々「もんぶだいじん」、「け
いざいきかくちょうちょうかん」と音声合成され、聞く
側は非常に理解し易くなる。
【0046】
【発明の効果】以上の説明から明らかなように、本発明
では、入力文字列を音声に変換する前に、置換規則に基
づいて入力文字列を読み上げに適した文字列に置換する
ため、人が入力文字列を、読み上げに適した文字列に修
正して読み上げる場合と同様の自然な音声出力を行うこ
とができる。
【図面の簡単な説明】
【図1】本発明の音声出力装置の概略構成図である。
【図2】図1における置換規則保持部4の保持する置換
規則を示す図である。
【図3】図1における文字列置換部5の概略構成図であ
る。
【図4】図1における文字列置換部5の詳細フロチャー
トである。
【図5】本発明の音声出力装置の他の概略構成図であ
る。
【符号の説明】
1・・・入力処理部 2・・・形態素辞書部 3・・・形態素解析部 4・・・置換規則保持部 5・・・文字列置換部 6・・・読み辞書部 7・・・読み付与部 8・・・アクセント辞書部 9・・・アクセント変化規則保持部 10・・・韻律付与部 11・・・音声データベース部 12・・・音声生成部 13・・・略語辞書部
───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 平6−186993(JP,A) 特開 平1−300334(JP,A) 特開 平4−98318(JP,A) 特開 平5−333893(JP,A) 特開 平3−35296(JP,A) 特開 平4−20998(JP,A) 特開 平8−36395(JP,A) 特開 平8−221095(JP,A) (58)調査した分野(Int.Cl.7,DB名) G10L 13/06,13/08

Claims (2)

    (57)【特許請求の範囲】
  1. 【請求項1】 入力文字列の一部を置換することを規定
    した置換規則を保持する置換規則保持部と、上記置換規
    則を参照して上記入力文字列の一部を置換する文字列置
    換部と、上記入力文字列、及び該入力文字列の置換後の
    文字列に読みを付与する読み付与部と、付与された読み
    に基づいて上記入力文字列の未置換文字列、及び該入力
    文字列の置換後の文字列を音声に変換して出力する音声
    生成部とを有し、上記置換規則は、漢字列、囲み開始記
    号、ひらがな列、及び囲み終了記号の順序で構成される
    文字列を、漢字列の読みとひらがな列の読みが同一の
    時、該漢字列に置換することを特徴とする音声出力装
    置。
  2. 【請求項2】 入力文字列の一部を置換することを規定
    した置換規則を保持する置換規則保持部と、上記置換規
    則を参照して上記入力文字列の一部を置換する文字列置
    換部と、上記入力文字列、及び該入力文字列の置換後の
    文字列に読みを付与する読み付与部と、付与された読み
    に基づいて上記入力文字列の未置換文字列、及び該入力
    文字列の置換後の文字列を音声に変換して出力する音声
    生成部とを有し、上記置換規則は、人名詞、囲み開始記
    号、数詞、及び囲み終了記号の順序で構成される文字列
    を人名詞、数詞、及び”歳”の順序で構成される文字列
    に置換することを特徴とする音声出力装置。
JP07397995A 1995-03-30 1995-03-30 音声出力装置 Expired - Fee Related JP3286491B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP07397995A JP3286491B2 (ja) 1995-03-30 1995-03-30 音声出力装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP07397995A JP3286491B2 (ja) 1995-03-30 1995-03-30 音声出力装置

Publications (2)

Publication Number Publication Date
JPH08272392A JPH08272392A (ja) 1996-10-18
JP3286491B2 true JP3286491B2 (ja) 2002-05-27

Family

ID=13533735

Family Applications (1)

Application Number Title Priority Date Filing Date
JP07397995A Expired - Fee Related JP3286491B2 (ja) 1995-03-30 1995-03-30 音声出力装置

Country Status (1)

Country Link
JP (1) JP3286491B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007264466A (ja) * 2006-03-29 2007-10-11 Canon Inc 音声合成装置

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2612030B2 (ja) * 1988-05-30 1997-05-21 富士通株式会社 文章読み上げ装置
JPH0335296A (ja) * 1989-06-30 1991-02-15 Sharp Corp テキスト音声合成装置
JPH045695A (ja) * 1990-04-23 1992-01-09 Oki Electric Ind Co Ltd 規則合成装置
JP3071804B2 (ja) * 1990-05-16 2000-07-31 株式会社リコー 音声合成装置
JP3087761B2 (ja) * 1990-08-10 2000-09-11 キヤノン株式会社 音声処理方法及び音声処理装置
JPH05333893A (ja) * 1992-05-28 1993-12-17 Toshiba Corp 文書読み上げ装置
JPH06186993A (ja) * 1992-12-17 1994-07-08 Matsushita Electric Ind Co Ltd 音声合成装置
JPH0836395A (ja) * 1994-05-20 1996-02-06 Toshiba Corp 音声データの生成方法及び文書読上装置
JPH08221095A (ja) * 1995-02-10 1996-08-30 Hitachi Ltd 文章読み上げ方法

Also Published As

Publication number Publication date
JPH08272392A (ja) 1996-10-18

Similar Documents

Publication Publication Date Title
JPH09503316A (ja) 言語合成
WO2006008871A1 (ja) 音声合成装置
JP3286491B2 (ja) 音声出力装置
JP3589972B2 (ja) 音声合成装置
JP2758851B2 (ja) 自動翻訳装置及び自動通訳装置
JP3518340B2 (ja) 読み韻律情報設定方法及び装置及び読み韻律情報設定プログラムを格納した記憶媒体
JP3230868B2 (ja) 音声合成装置
JPH10171485A (ja) 音声合成装置
JP3006240B2 (ja) 音声合成方法および装置
JP3029403B2 (ja) 文章データ音声変換システム
JPH0916190A (ja) 文章読上装置
JP3364820B2 (ja) 合成音声出力方法及び装置
JP3467764B2 (ja) 音声合成装置
RU2113726C1 (ru) Компьютерное устройство для чтения плоскопечатного текста
JP2000187494A (ja) 音声合成方法および音声合成装置
JP2002358091A (ja) 音声合成方法および音声合成装置
JPH03214197A (ja) 音声合成装置
JPH037999A (ja) 音声出力装置
JPH06289889A (ja) 音声合成装置
JPH10124501A (ja) 日本語読み付与方法及び装置及び日本語読み付与プログラム媒体
JP2003208191A (ja) 音声合成システム
JP2839492B2 (ja) 音声合成装置および方法
JP2622834B2 (ja) 文音声変換装置
JPS6160167A (ja) 日本語ワ−ドプロセツサ
JPH06243137A (ja) 音声合成装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090308

Year of fee payment: 7

LAPS Cancellation because of no payment of annual fees