JPH06348703A - 発音辞書開発装置 - Google Patents

発音辞書開発装置

Info

Publication number
JPH06348703A
JPH06348703A JP5138160A JP13816093A JPH06348703A JP H06348703 A JPH06348703 A JP H06348703A JP 5138160 A JP5138160 A JP 5138160A JP 13816093 A JP13816093 A JP 13816093A JP H06348703 A JPH06348703 A JP H06348703A
Authority
JP
Japan
Prior art keywords
information
word
dictionary
registered
pronunciation dictionary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP5138160A
Other languages
English (en)
Inventor
Hiroki Kamanaka
博樹 釜中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP5138160A priority Critical patent/JPH06348703A/ja
Publication of JPH06348703A publication Critical patent/JPH06348703A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 【目的】 かな漢字変換辞書と発音辞書の登録単語の違
いに起因する未知語を無くすことができる発音辞書開発
装置を提供する。 【構成】 まず、制御部11により、かな漢字変換辞書
14から各単語の読みと表記の情報が取り出される。次
に、制御部11により、この単語が発音辞書15に登録
されているか否かが判定される。登録されていれば、制
御部11により、上記情報とアクセントの入力メッセー
ジがCRT12に表示される。これにより、ユーザによ
り、キーボード13を介してアクセント情報が入力され
る。このアクセント情報は、上記読みと表記の情報とと
もに、制御部11により、発音辞書15に登録される。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、例えば、テキスト音声
変換システムに用いられる発音辞書を開発する発音辞書
開発装置に関する。
【0002】
【従来の技術】日本語テキスト音声変換システムは、我
々が日常読み書きしている漢字かな混じり文を入力とし
て、それを音声に変換し合成出力するものである。この
システムの構成を図2に示す。その動作の概要は以下の
通りである。
【0003】テキスト解析部21では、入力された漢字
かな混じり文から音韻・韻律記号列が生成される。音韻
・韻律記号列とは、入力文の読み、アクセント、イント
ネーション等を文字列として記述したもの(中間言語)
である。各単語の読みとアクセントを示す情報は発音辞
書22に登録されており、この辞書22を参照しながら
音韻・韻律記号列が生成される。
【0004】合成パラメータ生成部23では、音韻・韻
律記号列に基づき、音声素片(音の種類)、音韻継続時
間(音の長さ)、基本周波数パターン(声の高さ)とい
った合成パラメータが生成される。音声素片24は、接
続して合成波形をつくるための音声の基本単位であり、
音の種類等に応じて様々なものが読出し専用メモリ(R
OM)等に蓄積されている。
【0005】音声合成部25では、合成パラメータに基
づき合成波形が生成され、スピーカ26を通して合成音
が出力される。
【0006】なお、発音辞書22には、普通、数万語の
単語が登録されているが、固有名詞や専門用語など全て
が収録されているわけではない。テキスト解析部21
は、辞書未登録の単語(以下、未知語という)に対し
て、その発音(読み・アクセント)を、予め定めた規則
を用いて自動的に決定する(この処理を未知語処理とい
う)。
【0007】
【発明が解決しようとする課題】テキスト解析部21
は、まず、発音辞書22を用いて、入力されたテキスト
の単語分割を行うが、テキストに未知語、すなわち、辞
書未登録語が含まれていると、単語分割が正しく行われ
ない場合がある。この誤分割が原因で、間違った音韻・
韻律記号列が生成されることがある。また、未知語も含
めて正しく単語分割された場合であっても、未知語処理
によって未知語に与えられる発音が必ずしも正しいとは
限らない。以上のようなことが起こるため、テキストに
未知語が含まれる場合、間違った発音の合成音が生成さ
れることが多い。
【0008】ところで、図2のシステムに入力される漢
字かな混じり文は、ほとんどの場合、かな漢字変換によ
って作成される。かな漢字変換では、かなで表される読
みを漢字かな表記に変換するのに辞書を参照する(以
下、これをかな漢字変換辞書という)。すなわち、かな
漢字変換によって作成されたテキストは、かな漢字変換
辞書に登録された単語から成る。
【0009】したがって、かな漢字変換によって作成し
たテキストをシステムに入力する場合、かな漢字変換辞
書には登録されているが発音辞書22には登録されてい
ない単語が問題となる。すなわち、こうした単語がテキ
ストに含まれていると、その単語が必ず未知語となるた
め、誤った合成音の原因となる。さらに、こうした未知
語が専門用語や固有名詞であるとは限らないので、発音
辞書22に、まだ、不備な点(すなわち、よく用いられ
るにもかかわらず登録されていない単語)が残されてい
る可能性があると言える。
【0010】本発明の目的は、かな漢字変換辞書と発音
辞書の登録単語の違いに起因する未知語を無くすことが
できる発音辞書開発装置を提供するところにある。
【0011】
【課題を解決するための手段】上記目的を達成するため
に、本発明は、発音辞書に、単語の読みとアクセントを
示す情報を、その表記を示す情報と対応させて登録する
発音辞書開発装置において、発音辞書に登録する単語の
読みと表記を示す情報を、かな漢字変換辞書から取り出
すようにしたものである。
【0012】
【作用】上記構成においては、発音辞書に単語を登録す
る際、まず、かな漢字変換辞書からこの辞書に登録され
ている単語の読みと表記を示す情報が取り出される。次
に、この単語のアクセントを示す情報が別途用意され、
このアクセント情報と上記取出し情報が発音辞書に登録
される。
【0013】これにより、かな漢字変換辞書に登録され
ている単語をすべて発音辞書に登録することができるの
で、両者の登録単語の違いに起因する未知語を無くすこ
とができ、間違った合成音の発生を軽減することができ
る。
【0014】
【実施例】以下、本発明の実施例を図面を参照しながら
説明する。
【0015】図1は、本発明の一実施例の発音辞書開発
装置の構成を示すブロック図である。
【0016】図示の装置は、制御部11と、CRT12
と、キーボード13とから構成され、かな漢字変換辞書
14を利用して発音辞書15を開発するようになってい
る。
【0017】ここで、かな漢字変換辞書14は、上記の
如く、かなで表される読みを漢字かな表記に変換するた
めに用いられる辞書である。このかな漢字変換辞書14
には、単語の表記を示す情報が、その読みを示す情報と
対応させて登録されるようになっている。
【0018】すなわち、このかな漢字変換辞書14は、
例えば、単語の表記を示す情報が登録される辞書本体
と、この辞書本体の登録情報を検索するための検索テー
ブルとから構成されている。
【0019】辞書本体には、複数の情報登録位置が設定
され、各情報登録位置には、各単語の表記を示す情報が
登録されている。検索テーブルにも、同様に、複数の情
報登録位置が設定され、各情報登録位置には、各単語の
読みを示す情報と、辞書本体において、この単語の表記
を示す情報が登録された情報登録位置を示す情報が登録
されている。
【0020】このような構成により、かな漢字変換辞書
14は、単語の読みをキーとして、辞書本体の登録情報
を検索可能となっている。すなわち、いま、単語の読み
が「オト」であるとすると、まず、この読み「オト」に
基づいて、検索テーブルから、読みが「オト」である単
語の位置情報が読み出される。次に、この位置情報に基
づいて、辞書本体から読みが「オト」である単語の表記
情報が読み出される。
【0021】発音辞書15は、上記の如く、単語の表記
からその読みとアクセントを得るために用いられる辞書
である。この発音辞書15には、単語の読みとアクセン
トを示す情報が、その表記を示す情報と対応させて登録
されるようになっている。
【0022】すなわち、この発音辞書15は、かな漢字
変換辞書14と同様に、例えば、単語の読みとアクセン
トを示す情報が登録される辞書本体と、この辞書本体の
登録情報を検索するための検索テーブルとから構成され
ている。
【0023】辞書本体には、複数の情報登録位置が設定
され、各情報登録位置には、各単語の読みとアクセント
を示す情報が登録されている。検索テーブルにも、同様
に、複数の情報登録位置が設定され、各情報登録位置に
は、各単語の表記を示す情報と、辞書本体において、こ
の単語の読みとアクセントを示す情報が登録された情報
登録位置を示す情報が登録されている。
【0024】このような構成により、発音辞書15は、
単語の表記をキーとして、辞書本体の登録情報を検索可
能となっている。すなわち、いま、単語の表記が「音」
であるとすると、まず、この表記「音」に基づいて、検
索テーブルから、表記が「音」の単語の位置情報が読み
出される。次に、この位置情報に基づいて、辞書本体か
ら表記が「音」の単語の読みとアクセントを示す情報が
読み出される。
【0025】制御部11は、発音辞書15に、単語の表
記、読み、アクセントを示す情報を登録する機能を有す
る。この場合、表記と読みを示す情報は、かな漢字変換
辞書14から取り出される。これに対し、アクセントを
示す情報は、ユーザから与えられる。この場合、制御部
11は、CRTを使って、ユーザにアクセント情報の入
力を催促し、キーボード13を介して、このアクセント
情報をユーザから受け取るようになっている。
【0026】なお、制御部11は、かな漢字変換辞書1
4からある単語を取り出すと、この単語がすでに発音辞
書15に登録されているか否かを判定し、登録されてい
ない場合だけ、この単語を発音辞書15に登録するよう
になっている。
【0027】上記構成において、図3を参照しながら動
作を説明する。なお、図3は、制御部11の処理を示す
フローチャートである。
【0028】制御部11は、まず、かな漢字変換辞書1
4から1つの単語の表記と読みを示す情報を取り出す
(ステップ31)。
【0029】この取出し処理は、例えば、次のようにし
て行なわれる。まず、検索テーブルの先頭の情報登録位
置から、ここに登録されている読み情報と位置情報が読
み出される。次に、読み出された位置情報に基づいて、
辞書本体から表記情報が読み出される。これにより、検
索テーブルの先頭の情報登録位置における単語の表記と
読みの情報が取り出されたことになる。
【0030】次に、制御部11は、その表記と読みを持
つ単語が発音辞書15に登録済みか否かを判定する(ス
テップ32)。
【0031】この判定処理は、例えば、次のようにして
行なわれる。まず、発音辞書15の検索テーブルの先頭
の情報登録位置から、ここに登録されている表記情報と
位置情報が読み出される。次に、読み出された表記情報
とかな漢字変換辞書14から取り出された表記情報とが
一致するか否かが判定される。
【0032】一致すれば、上記位置情報に基づいて、辞
書本体から読みとアクセントの情報が読み出される。次
に、この読み情報とかな漢字変換辞書14から取り出さ
れた読み情報が一致するか否かが判定される。
【0033】一致すれば、登録済みと判定される。これ
に対し、一致しなければ、次の情報登録位置において、
再び、上述したような処理が実行される。これは、表記
情報が一致するか否かを判定する際に、一致しないと判
定された場合も同様である。
【0034】以下、表記情報と読み情報の両方が一致す
るまで、上述したような処理が繰り返され、両方が一致
した段階で、登録済みと判定される。これに対し、最後
の情報登録位置まで行っても一致しない場合は、未登録
と判定される。
【0035】なお、表記情報の一致だけでなく、読み情
報の一致も判定するのは、表記が同じでも、読みが異な
る単語が存在するからである。
【0036】この判定により、登録済みと判定すると、
制御部11は、ステップ36の処理を実行する。そうで
なければ、その表記と読みの情報をCRT12に表示
し、さらに、その単語のアクセントの入力を要求するメ
ッセージをCRT12に表示する(ステップ33)。こ
れにより、ユーザからキーボード13を介してアクセン
トの情報が入力される。
【0037】このアクセント情報がキーボード13から
入力されると、制御部11は、そのアクセント情報を受
け取り(ステップ34)、表記と読みの情報とともに、
発音辞書15に登録する(ステップ35)。
【0038】この登録処理は、例えば、次のようにして
なされる。まず、発音辞書15の検索テーブルに表記情
報が登録される。この場合の情報登録位置は、例えば、
JISコード順といった所定の規則に従って定められ
る。したがって、この登録に際しては、必要に応じて、
検索テーブルにすでに登録されている情報の登録位置の
並べ替え(ソート)が実行される。
【0039】次に、読みとアクセントの情報が辞書本体
に登録される。この場合の情報登録位置は、例えば、す
でに情報が登録されている領域の最後部に設定される。
したがって、この場合は、すでに、辞書本体に登録され
ている情報の登録位置の並べ替えは行なわれない。次
に、読みとアクセントの情報が登録された情報登録位置
を示す情報が、検索テーブルにおいて、表記情報が登録
された情報登録位置に登録される。
【0040】以上により、1つの単語の登録処理が終了
する。この処理が終了すると、制御部11は、ステップ
36の処理を実行する。
【0041】このステップ36では、制御部11は、か
な漢字変換辞書14に、まだ、取り出していない単語が
残っているか否かを判定する。残っていれば、次の単語
を取り出すために、ステップ31に戻り、残っていなけ
れば処理を終了する。
【0042】以上の処理を行うことにより、かな漢字変
換辞書14の登録単語が全て発音辞書15に登録される
ことになる。
【0043】以上詳述したこの実施例によれば、次のよ
うな効果が得られる。
【0044】(1)まず、かな漢字変換辞書14から単
語を取り出し、この単語を使って発音辞書15を開発す
るようにしたので、かな漢字変換辞書14と発音辞書1
5の登録単語の違いに起因する未知語を無くすことがで
きる。
【0045】(2)同様に、単語の表記と読みの情報を
ユーザが入力する必要がないので、単語の登録速度を高
めることができる。
【0046】(3)また、かな漢字変換辞書14から単
語を取り出して発音辞書15に登録する際、この単語が
すでに登録されている否かを判定し、登録されていない
場合だけ登録するようになっているので、同じ単語を重
複登録してしまうことを防止することができる。
【0047】(4)また、上記判定に際し、表記と読み
の両方をチェックするようになっているので、表記が同
じで読みが異なる単語も確実に登録することができる。
【0048】(5)また、発音辞書15に単語を登録す
る場合、かな漢字変換辞書14から取り出された情報を
CRT12を使って表示するようにしたので、ユーザが
アクセント情報を入力する際の操作性を高めることがで
きる。
【0049】(6)さらに、複数のかな漢字変換辞書1
4から1つの発音辞書15を作ることできるため、かな
漢字変換辞書14の種類を増やすことにより、簡単に、
発音辞書15を充実させることができる。
【0050】なお、ここでいうかな漢字変換辞書には、
様々なオペレーティングシステムの下で、デバイスド
ライバとして動作するかな漢字変換フロントエンドプロ
セッサで用いられる辞書や、ワードプロセッサで用い
られる辞書などが考えられる。
【0051】以上、本発明の一実施例を詳細に説明した
が、この発明は、上述したような実施例に限定されるも
のではない。
【0052】(1)例えば、先の実施例では、CRT1
2を使って、ユーザにアクセント情報の入力を催促する
場合を説明したが、この発明は、そのほかの出力手段、
例えば、プリンタを使って催促するようにしてもよい。
【0053】(2)また、先の実施例では、かな漢字変
換辞書14から単語を取り出して発音辞書15に登録す
る際、この単語がすでに登録されているか否かを判定
し、登録されていない場合だけ、登録する場合を説明し
た。しかし、この発明は、このような判定を行わず、か
な漢字変換辞書14から取り出された単語をすべて登録
するようにしてもよい。
【0054】このような構成によれば、重複登録の可能
性が生じるものの、発音辞書15を最初に生成する場合
に、この発音辞書15を先の実施例より早く生成するこ
とができる。
【0055】(3)また、先の実施例では、アクセント
情報をユーザに入力させる場合を説明したが、この発明
は、制御部11が予め定めた規則を用いて、自動的にア
クセントを決定するようにしてもよい。
【0056】(4)さらに、先の実施例では、この発明
を、テキスト音声変換システムで用いられる発音辞書1
5の開発に適用する場合を説明したが、この発明は、こ
れ以外のシステムで用いられる発音辞書15の開発にも
適用することができる。
【0057】(5)このほかにも、この発明は、その要
旨を逸脱しない範囲で種々様々変形実施可能なことは勿
論である。
【0058】
【発明の効果】以上詳述したように本発明によれば、か
な漢字変換辞書の単語全てを発音辞書に登録することが
可能となる。したがって、かな漢字変換によって作成し
たテキストに未知語が含まれなくなり、テキスト音声変
換システムの読み誤りを防ぐことができる。すなわち、
そのかな漢字変換辞書を用いて作成したものであれば、
どんなテキストであっても正しく読み上げられるように
なる。
【図面の簡単な説明】
【図1】本発明の一実施例の構成を示すブロック図であ
る。
【図2】テキスト音声変換システムの構成を示すブロッ
ク図である。
【図3】本発明の一実施例の動作を示すフローチャート
である。
【符号の説明】
11…制御部、12…CRT、13…キーボード、14
…かな漢字変換辞書、15…発音辞書。

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 発音辞書に、単語の読みとアクセントを
    示す情報を、その表記を示す情報と対応させて登録する
    発音辞書開発装置において、 単語の表記を示す情報がその読みを示す情報と対応する
    ように登録されたかな漢字変換辞書から、各単語の表記
    と読みを示す情報を取り出す情報取出し手段と、 この情報取出し手段により取り出された単語の情報と、
    この単語のアクセントを示す情報を前記発音辞書に登録
    する情報登録手段とを具備したことを特徴とする発音辞
    書開発装置。
  2. 【請求項2】 前記情報登録手段は、前記情報取出し手
    段により取り出された単語の情報が、前記発音辞書に登
    録されているか否かを判定する判定手段と、 この判定手段により登録されていないと判定されると、
    前記情報取出し手段により取り出された単語の情報と、
    この単語のアクセントを示す情報を前記発音辞書に登録
    する登録手段とを具備するように構成されていることを
    特徴とする請求項1記載の発音辞書開発装置。
  3. 【請求項3】 前記情報登録手段は、 前記情報取出し手段により取り出された単語の情報を出
    力する出力手段と、 この出力手段によって情報が出力された単語のアクセン
    トを示す情報を入力する入力手段と、 この入力手段の入力情報と、前記情報取り出し手段の取
    出し情報を前記発音辞書に登録する登録手段とを具備す
    るように構成されていることを特徴とする請求項1記載
    の発音辞書開発装置。
JP5138160A 1993-06-10 1993-06-10 発音辞書開発装置 Pending JPH06348703A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5138160A JPH06348703A (ja) 1993-06-10 1993-06-10 発音辞書開発装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5138160A JPH06348703A (ja) 1993-06-10 1993-06-10 発音辞書開発装置

Publications (1)

Publication Number Publication Date
JPH06348703A true JPH06348703A (ja) 1994-12-22

Family

ID=15215427

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5138160A Pending JPH06348703A (ja) 1993-06-10 1993-06-10 発音辞書開発装置

Country Status (1)

Country Link
JP (1) JPH06348703A (ja)

Similar Documents

Publication Publication Date Title
US6490563B2 (en) Proofreading with text to speech feedback
US6076060A (en) Computer method and apparatus for translating text to sound
US6910012B2 (en) Method and system for speech recognition using phonetically similar word alternatives
JP5025759B2 (ja) 発音矯正装置、発音矯正方法および記録媒体
JPH06282290A (ja) 自然言語処理装置およびその方法
JP3589972B2 (ja) 音声合成装置
JP2003162524A (ja) 言語処理装置
JPH07262191A (ja) 単語分割方法、および音声合成装置
JPH06348703A (ja) 発音辞書開発装置
CN114519998A (zh) 差分抽取装置、方法以及程序
JPH11338498A (ja) 音声合成装置
JPH1115497A (ja) 氏名読み音声合成装置
JP2007193350A (ja) 発音矯正装置、発音矯正方法および記録媒体
JP2938466B2 (ja) テキスト音声合成システム
JP3029403B2 (ja) 文章データ音声変換システム
JP2007086404A (ja) 音声合成装置
JP3414326B2 (ja) 音声合成用辞書登録装置及び方法
JPH03217900A (ja) テキスト音声合成装置
JPH0634175B2 (ja) 文章読上げ装置
JP2003005776A (ja) 音声合成装置
JPH07160685A (ja) 文章読み上げ装置
KR100212448B1 (ko) 무제한 음성 명령어 인식기의 인식 성능 및 처리 속도 개선 방법
KR0136423B1 (ko) 발음 제어 기호의 유효성 판정을 이용한 음운 변동 처리 방법
JP3269083B2 (ja) 自然語処理装置
JPH07152392A (ja) 音声合成装置