JP2001005479A - 音声出力装置 - Google Patents

音声出力装置

Info

Publication number
JP2001005479A
JP2001005479A JP11177419A JP17741999A JP2001005479A JP 2001005479 A JP2001005479 A JP 2001005479A JP 11177419 A JP11177419 A JP 11177419A JP 17741999 A JP17741999 A JP 17741999A JP 2001005479 A JP2001005479 A JP 2001005479A
Authority
JP
Japan
Prior art keywords
dictionary
kana
text
phonetic symbol
input
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP11177419A
Other languages
English (en)
Inventor
Naoko Sato
奈穂子 佐藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP11177419A priority Critical patent/JP2001005479A/ja
Publication of JP2001005479A publication Critical patent/JP2001005479A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 【課題】 漢字が混ざらないテキストに対応する英数仮
名に特化した辞書を備え、、仮名表記による未登録語発
生を抑制し、正確な読み上げを得る。 【解決手段】 入力部1に漢字が混ざらないテキストが
入力されると、テキスト文字判定手段21が入力テキス
トを判断し、辞書検索手段22において、英数仮名辞書
26を参照し、発音記号生成手段23において、発音記
号付き単語候補列を生成する。発音記号は、辞書に記載
の仮名表記情報と、単語特有のアクセント情報によって
得ることが出来る。特定の発音記号列が得られた場合、
変換規則に従って対応する発音記号列に変換し、単語内
のその文字の位置を検査し、その位置によっては変換規
則に従って対応する発音記号に変換する。次に、候補の
中から尤もらしいものを選択決定し、単語が同定できた
ら、アクセント句生成,ポーズ位置の設定などを行な
い、データを音声合成部へ送る。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、音声出力装置、よ
り詳細には、電子化された入力文書を音声に変換する際
の出力技術に関する。
【0002】
【従来の技術】音声出力装置の一例としてテキスト音声
合成システムが挙げられる。この音声合成システムは入
力された漢字仮名混じりのテキストに対し、単語辞書な
どを参照する言語解析を経て、一定のアルゴリズムによ
り候補中から選択した最適解に対して読みを含む音韻を
設定する。さらに一定のルールに従ってアクセント位
置,ポーズ位置を設定し、音声に変換するための制御記
号列に変換する。この制御記号列を音声合成器に入力
し、この入力に応じた音声を出力する。
【0003】
【発明が解決しようとする課題】しかしながら、従来の
音声合成システムは、入力テキストに漢字仮名混じり文
字列を想定している(例えば、特開平9−258763
号公報など)。従って、入力されたテキストが漢字の混
ざらない文字列であった場合は、辞書引き時の一致度が
低下し、未登録語を含む単語候補の増加により正確な読
み上げができなくなる場合が多くなるという問題があっ
た。そこで、入力が漢字の混ざらない文字列であっても
正確な読み上げを実現する方法が求められている。
【0004】本発明は、上述のごとき実情に鑑みてなさ
れたもので、漢字が混ざらないテキストに対応する英数
仮名に特化した辞書を備えることにより、仮名表記によ
る未登録語発生を抑制し、正確な読み上げを得ようとす
るものである。また、言語処理の前処理として、テキス
ト文字判定手段を備え、従来通りの漢字仮名混じり対応
の辞書を併用し、辞書を切り替えて入力テキストに対応
することで、どんな入力テキストでも読み上げ精度を維
持しようとするものである。
【0005】
【課題を解決するための手段】請求項1の発明は、テキ
スト入力手段を有し、入力されたテキストや記号列を音
声に変換し、読み上げを行なう音声出力装置において、
英数仮名辞書を具備し、入力テキストが英数仮名文字列
の場合、該英数仮名辞書を用いて入力文字列を音声に変
換し、正確な読み上げを行なうことを特徴とし、もっ
て、漢字の混ざらないテキスト入力時に専用の英数仮名
辞書を用いた言語処理を行ない、言語解析の精度を向上
させると共に、辞書の容量を漢字仮名混じり辞書よりも
少なくて済むようにし、さらに、辞書作成作業を軽減す
るようにしたものである。
【0006】請求項2の発明は、請求項1の発明におい
て、英数仮名辞書は、少なくとも単語の英数仮名表記,
アクセント情報を保持しており、発音記号は仮名表記と
アクセント情報から得ることを特徴とし、もって、単語
の仮名表記とアクセント情報のみでほとんどの発音記号
列を作成することで、発音記号列作成処理工数を軽減し
て、処理速度を高め、さらに、辞書記載内容として、少
なくとも単語の英数仮名表記とアクセント情報があれば
よいため、辞書容量が小さくて済み、辞書作成作業を軽
減できるようにしたものである。
【0007】請求項3の発明は、請求項1の発明におい
て、英数仮名辞書は、特定の発音記号列を対応する別の
発音記号列に変換する規則を保持し、特定の発音記号列
が入力されると、規則を適用した発音記号列に変換する
ことを特徴とし、もって、請求項2で作成された発音記
号列では、一部、適当な発音記号が付与されない場合が
あるのに対して、特定発音記号列に対して発音記号変換
を行なうことにより、発音記号付与間違いを修正できる
ようにしたものである。
【0008】請求項4の発明は、請求項1の発明におい
て、英数仮名辞書は、特定の発音記号に対し、その発音
記号の単語内の位置を検査し、対応する別の発音記号に
変換する規則を保持し、特定の発音記号が入力される
と、規則を適用した発音記号に変換することを特徴と
し、もって、請求項2で作成された発音記号列では、一
部、適当な発音記号が付与されない場合があるのに対し
て、特定発音記号が特定位置にある場合に発音記号変換
を行なうことにより、発音記号付与間違いを修正できる
ようにしたものである。
【0009】請求項5の発明は、テキスト入力手段を有
し、入力されたテキストを音声に変換し、読み上げを行
なう音声出力装置において、入力テキストが漢字仮名混
じり文字列か、漢字の混ざらない文字列かを検出するテ
キスト文字判定手段と、漢字仮名混じり表記と対応する
仮名表記を記載した単語辞書を有し、前記テキスト文字
判定手段の判定結果に応じて辞書検索対象表記を使い分
けることを特徴とし、もって、漢字仮名混じり辞書と英
数仮名辞書を併せ持つことにより、入力テキストの字種
によって辞書を使い分けでき、言語解析の精度を大幅に
向上させることができ、さらに、処理の効率を向上させ
ることができるようにしたものである。
【0010】
【発明の実施の形態】図1は、本発明における音声出力
装置の一構成例を示す要部概略図で、本発明による音声
出力装置は、テキスト入力部1,言語処理部2,韻律処
理部3,音響処理部4,音声出力部5,言語データ類
6,音素片データ7からなる。
【0011】図2は、図1に示した言語処理部2の詳細
な構成の一例を示す図で、テキスト文字判定手段21,
辞書検索手段22,発音記号生成手段23,特定発音記
号・位置検出手段24,発音記号変換手段25,英数仮
名辞書26,漢字仮名混じり辞書27,発音記号変換規
則28からなる。
【0012】図3は、漢字仮名混じり辞書の記載例、図
4は、英数仮名辞書の記載例、図5は特定発音記号変換
規則の一例を示す。
【0013】図6は、本発明における言語処理の動作手
順を説明するためのフロー図で、例えば、入力部1に漢
字が混ざらないテキストが入力されると、テキスト文字
判定手段21が入力テキストを判断し、英数仮名辞書2
6の適用を選択する。次に、英数仮名辞書26を参照
し、発音記号付き単語候補列を生成する。もし、入力テ
キストが漢字仮名混じり文字列だったら、そのテキスト
が入力された際に、文字種を判断し、辞書検索は漢字仮
名混じり辞書27の漢字仮名混じり表記で行なう。それ
ぞれ、表記と一致したら発音記号付き単語候補列を生成
する。発音記号は、辞書に記載の仮名表記情報と、単語
特有のアクセント情報によって得ることができる。数字
や記号・英文字は使い方によって読みが異なるため、別
処理(例えば、宮崎「日本文音声変換のための数詞読み
規則」情報処理学会論文誌Vol.25No.6198
4記載の規則や特開平7−56588号公報「音声合成
における記号処理装置」、さらに「英語の発音と文字」
旺文社コンパクト英和辞典付録(1)1994年重版記
載の方法を適用するなど)で発音記号を得る。また、特
定の発音記号列が得られた場合、変換規則に従って対応
する発音記号列に変換する。さらに、特定の発音記号列
が得られた場合、単語内のその文字の位置を検査し、そ
の位置によっては変換規則に従って対応する発音記号に
変換する。次に、候補の中から最長一致法やコスト最小
法など既存のアルゴリズムで尤もらしいものを選択決定
する。そして単語が同定できたら、アクセント句生成,
ポーズ位置の設定などを行ない、データを音声合成部へ
送る。
【0014】(実施例)以下、実施例に基づいて具体的
に説明する。「ごぜん9じに、しんじゅくみなみぐちで
ごうりゅう。byサトウ」という漢字の混ざらないテキ
ストが入力されると、先頭の文字列から英数仮名辞書の
表記情報を検索し、単語候補を生成する。単語候補は、
それぞれ発音記号を付帯している。発音記号は、辞書記
載の表記とアクセント情報により生成される。本実施例
において、「9」は「ク’」と「キ’ュー」の読みが存
在するが、直後に助数詞の「じ(時)」があるため、前
述の論文によると「ク’」が選択される。また、「b
y」は、前述の辞典の付録によると、子音bと、名称音
I[ai]にあたる複合文字yの組み合わせであり、
[bai]という発音になると推定される。従って、発
音記号「バイ」が得られる。
【0015】 例)表記→発音記号 「ごぜん」→「ゴ’ゼン」 「9」→「ク’」 「じ」→「ジ」 「に」→「ニ」 「しんじゅく」→「シンジュク」 「みなみぐち」→「ミナミグチ」 「で」→「デ」 「ごうりゅう」→「ゴウリュウ」 「。」→「.(ポーズ)」 「by」→「バイ」 「サトウ」→「サ’トウ」
【0016】ここで、発音記号に特定なものがあるかど
うか検査する。すると、上記例においては、「ゴ’ゼ
ン」の「ゴ」、「ミナミグチ」の「グ」、「ゴウリュ
ウ」の「ゴ」、「ゴウ」および「リュウ」、「サトウ」
の「トウ」が変換対象である事が判明する。変換規則に
よると、「ゴウ」は「ゴー」、「リュウ」は「リュ
ー」、「トウ」は「トー」への変換をすることになる。
「ゴ」「グ」は更に単語内の文字位置を検出する必要が
ある。「ゴ’ゼン」の「ゴ」、「ゴウリュウ」の「ゴ」
は、その位置が先頭であるので、変換は不要であること
が分かる。一方、「グ」は、その位置が先頭より4文字
目であることから、「グ」を鼻濁音の記号である「ク
゜」に変換することになる。
【0017】最終的には、以下の発音記号が得られる。 「ゴ’ゼン ク’ジニ シンジュク ミナミク゜チデゴ
ーリュー.バイ サ’トー」
【0018】上記例のように発音記号列が同定される
と、それぞれの候補列からアクセント句を生成し、ポー
ズ位置を設定して、発音記号列を音声合成部へ送り、合
成器から合成音声が発声される。
【0019】
【発明の効果】請求項1の発明は、テキスト入力手段を
有し、入力されたテキストや記号列を音声に変換し、読
み上げを行なう音声出力装置において、英数仮名辞書を
具備し入力テキストが英数仮名文字列の場合、該英数仮
名辞書を用いて入力文字列を音声に変換し、正確な読み
上げを行なうようにしたので、漢字の混ざらないテキス
ト入力時に専用の英数仮名辞書を用いた言語処理を行な
うため、言語解析精度が向上すると共に、辞書の容量が
漢字仮名混じり辞書よりも少なくて済むという利点があ
る。さらに、辞書作成作業が軽減される利点もある。
【0020】請求項2の発明は、請求項1の発明におい
て、英数仮名辞書は、少なくとも単語の英数仮名表記,
アクセント情報を保持しており、発音記号は仮名表記と
アクセント情報から得るようにしたので、単語の仮名表
記とアクセント情報のみでほとんどの発音記号列を作成
することで、発音記号列作成処理工数が軽減され、処理
速度を高められる効果がある。さらに、辞書記載内容と
して、少なくとも単語の英数仮名表記とアクセント情報
があればよいため、辞書容量が小さくて済み、辞書作成
作業が軽減されるという利点がある。
【0021】請求項3の発明は、請求項1の発明におい
て、英数仮名辞書は、特定の発音記号列を対応する別の
発音記号列に変換する規則を保持し、特定の発音記号列
が入力されると、規則を適用した発音記号列に変換する
ようにしたので、請求項2で作成された発音記号列で
は、一部、適当な発音記号が付与されない場合がある
が、この請求項3記載の方法によると、特定発音記号列
に対して発音記号変換を行なうので、発音記号付与間違
いを修正できる効果がある。
【0022】請求項4の発明は、請求項1の発明におい
て、英数仮名辞書は、特定の発音記号に対し、その発音
記号の単語内の位置を検査し、対応する別の発音記号に
変換する規則を保持し、特定の発音記号が入力される
と、規則を適用した発音記号に変換するようにしたの
で、請求項2で作成された発音記号列では、一部、適当
な発音記号が付与されない場合があるが、この請求項4
記載の方法によると、特定発音記号が特定位置にある場
合に発音記号変換を行なうので、発音記号付与間違いを
修正できる効果がある。
【0023】請求項5の発明は、テキスト入力手段を有
し、入力されたテキストを音声に変換し、読み上げを行
なう音声出力装置において、入力テキストが漢字仮名混
じり文字列か、漢字の混ざらない文字列かを検出するテ
キスト文字判定手段と、漢字仮名混じり表記と対応する
仮名表記を記載した単語辞書を有し、前記テキスト文字
判定手段の判定結果に応じて辞書検索対象表記を使い分
けるようにしたので、漢字仮名混じり辞書と英数仮名辞
書を併せ持つことにより、入力テキストの字種によって
辞書を使い分けできるため、言語解析の精度が大幅に向
上すること、さらには、処理の効率を向上することが期
待できる。
【図面の簡単な説明】
【図1】 本発明における音声出力装置の一構成例を示
す要部概略図である。
【図2】 図1に示した言語処理部2の詳細な構成の一
例を示す図である。
【図3】 漢字仮名混じり辞書の記載例を示す図であ
る。
【図4】 英数仮名辞書の記載例を示す図である。
【図5】 特定発音記号変換規則の一例を示す図であ
る。
【図6】 本発明における言語処理の動作手順を説明す
るためのフロー図である。
【符号の説明】
1…テキスト入力部、2…言語処理部、3…韻律処理
部、4…音響処理部、5…音声出力部、6…言語データ
類、7…音素片データ、21…テキスト文字判定手段、
22…辞書検索手段、23…発音記号生成手段、24…
特定発音記号・位置検出手段、25…発音記号変換手
段、26…英数仮名辞書、27…漢字仮名混じり辞書、
28…発音記号変換規則。

Claims (5)

    【特許請求の範囲】
  1. 【請求項1】 テキスト入力手段を有し、入力されたテ
    キストや記号列を音声に変換し、読み上げを行なう音声
    出力装置において、英数仮名辞書を具備し、入力テキス
    トが英数仮名文字列の場合、該英数仮名辞書を用いて入
    力文字列を音声に変換し、正確な読み上げを行なうこと
    を特徴とする音声出力装置。
  2. 【請求項2】 請求項1において、前記英数仮名辞書
    は、少なくとも単語の英数仮名表記,アクセント情報を
    保持しており、発音記号は仮名表記とアクセント情報か
    ら得ることを特徴とする音声出力装置。
  3. 【請求項3】 請求項1において、前記英数仮名辞書
    は、特定の発音記号列を対応する別の発音記号列に変換
    する規則を保持し、特定の発音記号列が入力されると、
    前記規則を適用した発音記号列に変換することを特徴と
    する音声出力装置。
  4. 【請求項4】 請求項1において、前記英数仮名辞書
    は、特定の発音記号に対し、その発音記号の単語内の位
    置を検査し、対応する別の発音記号に変換する規則を保
    持し、特定の発音記号が入力されると、前記規則を適用
    した発音記号に変換することを特徴とする音声出力装
    置。
  5. 【請求項5】 テキスト入力手段を有し、入力されたテ
    キストを音声に変換し、読み上げを行なう音声出力装置
    において、入力テキストが漢字仮名混じり文字列か、漢
    字の混ざらない文字列かを検出するテキスト文字判定手
    段と、漢字仮名混じり表記と対応する仮名表記を記載し
    た単語辞書を有し、前記テキスト文字判定手段の判定結
    果に応じて辞書検索対象表記を使い分けることを特徴と
    する音声出力装置。
JP11177419A 1999-06-23 1999-06-23 音声出力装置 Pending JP2001005479A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP11177419A JP2001005479A (ja) 1999-06-23 1999-06-23 音声出力装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP11177419A JP2001005479A (ja) 1999-06-23 1999-06-23 音声出力装置

Publications (1)

Publication Number Publication Date
JP2001005479A true JP2001005479A (ja) 2001-01-12

Family

ID=16030608

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11177419A Pending JP2001005479A (ja) 1999-06-23 1999-06-23 音声出力装置

Country Status (1)

Country Link
JP (1) JP2001005479A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008038994A1 (en) * 2006-09-29 2008-04-03 Electronics And Telecommunications Research Institute Method for converting pronunciation using boundary pause intensity and text-to-speech synthesis system based on the same

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2008038994A1 (en) * 2006-09-29 2008-04-03 Electronics And Telecommunications Research Institute Method for converting pronunciation using boundary pause intensity and text-to-speech synthesis system based on the same

Similar Documents

Publication Publication Date Title
US8015011B2 (en) Generating objectively evaluated sufficiently natural synthetic speech from text by using selective paraphrases
US20020120451A1 (en) Apparatus and method for providing information by speech
US6477495B1 (en) Speech synthesis system and prosodic control method in the speech synthesis system
JP2002149643A (ja) 日本語の表意文字の読み方を予測する方法
JP2004326367A (ja) テキスト解析装置及びテキスト解析方法、ならびにテキスト音声合成装置
JP2001005479A (ja) 音声出力装置
Xydas et al. Text normalization for the pronunciation of non-standard words in an inflected language
JPH11338498A (ja) 音声合成装置
JP2938466B2 (ja) テキスト音声合成システム
JP2002123281A (ja) 音声合成装置
JP2001117583A (ja) 音声認識装置および音声認識方法、並びに記録媒体
JP2001343987A (ja) 音声合成方法、および音声合成装置
Thangthai et al. A learning method for Thai phonetization of English words
JPS62119591A (ja) 文章読上げ装置
JP3414326B2 (ja) 音声合成用辞書登録装置及び方法
JP2004053979A (ja) 音声認識辞書の作成方法及び音声認識辞書作成システム
JPH0229797A (ja) テキスト音声変換装置
JP2009098292A (ja) 音声記号列生成方法、音声合成方法及び音声合成装置
JP2003005776A (ja) 音声合成装置
JPH096378A (ja) テキスト音声変換装置
JPH06176023A (ja) 音声合成システム
JP2006098552A (ja) 音声情報生成装置、音声情報生成プログラム及び音声情報生成方法
KR0136423B1 (ko) 발음 제어 기호의 유효성 판정을 이용한 음운 변동 처리 방법
JP2004301968A (ja) 発話処理装置、発話処理方法及び発話処理用プログラム
JPH09281993A (ja) 発音記号生成装置