JPH04127199A

JPH04127199A - 外国語単語の日本語発音決定方法

Info

Publication number: JPH04127199A
Application number: JP2247411A
Authority: JP
Inventors: Hiroki Kamanaka; 博樹釜中
Original assignee: Oki Electric Industry Co Ltd
Current assignee: Oki Electric Industry Co Ltd
Priority date: 1990-09-19
Filing date: 1990-09-19
Publication date: 1992-04-28

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】［産業上の利用分野］本発明は、外国語単語の日本語としての発音（読み及び
アクセント等〉を決定する外国語単語の日本語発音決定
方法に関し、例えば、日本語テキストを音声に変換する
日本語テキスト音声変換システムに適用し得るものであ
る。

［従来の技術］日本語テキスト音声変換システムは、我々が日常読み書
きしている漢字かな混じり文を入力として、それを音声
に変換して合成出力するものである。この日本語テキス
ト音声変換システム１０の構成を第２図に示し、以下、
このシステムの概要を順を追って説明する。

第２図において、テキスト解析部１１では、発音辞書１
２を利用して、入力された漢字かな混じり文から音韻、
韻律記号列を生成する。ここで、音韻、韻律記号列とは
、入力文の読み、アクセント、イントネーション等を文
字列として記述したもの（中間言語）である。各単語の
読みとアクセントは発音辞書１２に登録されており、こ
の辞書１２を参照しながらテキスト解析部１１は音韻、
韻律記号列を生成される。

合成パラメータ生成部１３は、音韻、韻律記号列に基づ
き、音声素片（音の種類）、音韻継続時間（音の長さ）
、基本周波数パターン〈声の高さ）といった音声合成用
のパラメータ（以下、合成パラメータと呼ぶ）を生成す
る。このうち、音声素片は、接続して合成波形を作るた
めの音声基本単位であり、音の種類等に応じて様々なも
のが予め用意されていてＲＯＭ等でなる音声素片記憶部
１４に蓄積されている。

音声合成部１５では、合成パラメータに基づき合成波形
が生成され、かくして、スピーカ１６を通して入力され
た漢字かな混じり文に対応した合成音声が発音される。

［発明が解決しようとする課題］上述したように、従来の日本語テキスト音声変換システ
ムにおいては、テキスト解析部１１が第３図に示すよう
な予め作成されている発音辞書１２を参照することによ
り、入力文に含まれている各単語の読みとアクセントを
決定する。

しかし、従来の発音辞書１２は日本語単語についての辞
書であって、一般に外国語単語は登録されておらす、入
力文中に現れた外国語単語の読みやアクセントを決定す
ることはできない。なお、ここでいう外国語単語とはア
ルファベット等によって外国語表記されたものを指し、
既にカタカナ等によって表記されている外来語とは異な
るものである。実際上、最近の日本文には、多くの外国
語単語が含まれており、このような外国語単語に対応で
きないことは問題が多い。

そこで、発音辞書１２に、第４図に示すような表記が外
国語であって読み及びアクセントが日本語である外国語
用の辞書を用意して、上記不都合を解決することも既に
提案されている。

ところで、発音辞書１２を格納するディスク装置の容量
が格納単語数を制約する場合かある。このような場合、
入力文に含まれている単語が単語辞書１２に未登録のこ
とも生じる。日本文を対象とする日本語テキスト音声変
換システムにあっては、日本語単語に対する登録内容を
充実させる必要があることから、日本語単語より出現頻
度がおおむね少ない外国語単語に対して未登録のことが
多い。このような未登録の外国語単語が含まれていた場
合には、テキスト解析部１１が処理を行なうことができ
す、音声の発音を途中で終了させたり、または、未知語
部分を発音させないようにしていた。

従って、従来のシステムは、日本語テキスト音声変換シ
ステムとして未完成なシステムということができる。

なお、文章全体の音声を完全に発音させようとすると、
未知語について単語辞書２２に登録する動作を行なうこ
とを要し、繁雑な操作が必要となる。

本発明は、以上の点を考慮してなされたものであり、外
国語表記単語に対する日本語としての発音（読みやアク
セント等）を、発音辞書を用いずに決定することのでき
る外国語単語の日本語発音決定方法を提供しようとする
ものである。

「課題を解決するための手段］かかる課題を解決するため、本発明においては、外国語
表記の全部又は一部をローマ字に変換する表記・ローマ
字変換ルールと、ローマ字をかな文字に変換するローマ
字・かな変換ルールとを予め用意しておき、外国語表記
の外国語単語が与えられたときに表記・ローマ字変換ル
ールを適用してローマ字に変換した後、ローマ字・がな
変換ルールを適用してローソンをかな文字に変換して、
外国語表記の外国語単語の日本語としての読みを決定す
ることとしたく請求項１〜４に対応）。

なお、このようにして得られなかな文字列の音節数が２
以下のときに第１音節をアクセント音節とし、かな文字
列の音節数が３以上のときに最終音節の２個前の音節を
アクセント音節としてアクセント情報を得るようにする
ことが好ましいく請求項５対応）。

［作用］本発明は、外国語表記単語について、少なくとも日本語
としての読み（かな文字）を発音辞書を用いずに得るよ
うにしたものである。外国語表記の外国語単語に対して
、まず予め用意されている表記・ローマ字変換ルールに
従って外国語単語の表記（スペル）をローマ字（中間言
語）に変換する。次に、予め用意されているローマ字・
がな変換ルールに従ってローマ字をかな文字に変換する
。

これにより、外国語単語の日本語としての読み（かな文
字）を決定することができる。

アクセント情報も必要な場合には、外来語について周知
になっている方式に従いアクセントを付加する。すなわ
ち、かな文字列の音節数が２以下のときに第１音節をア
クセント音節とし、かな文字列の音節数が３以上のとき
に最終音節の２個前の音節をアクセント音節とする。

［実施例］以下、本発明を日本語テキスト音声変換システムに適用
した一実施例を図面を参照しながら詳述する。なお、こ
のシステムは、外国語単語として、英語単語に対応でき
るものとなっている。

第５図は、この実施例のシステム構成を示すブロック図
である。

第５図において、当該日本語テキスト音声変換システム
２０に入力された任意の日本語文章（漢字かな混じり文
）は、テキスト解析部２１に与えられる。なお、漢字か
な混じり文は、例えばワードプロセッサで作成したもの
、又は光学的文字読取装置（ＯＣＲ）から出力されたも
のであり、例えばＪＩＳコード等でコード化されている
。

テキスト解析部２１では、入力された漢字かな混じり文
を解析して、入力文の読み、アクセント、イントネーシ
ョンを決定し、これらを文字列として記述した中間言語
たる音韻・韻律記号列として合成パラメータ生成部２３
に与える。

テキスト解析部２１は、かかる解析処理の際に、発音辞
書２２を参照する。英文等と違って分がち書きされてい
ない漢字かな混じり文は、発音辞書２２内の表記とマツ
チングをとることにより単語に分割されて処理される。

この実施例の場合、発音辞書２２には、上述した第３図
及び第４図に示すように、表記、読み、アクセント等の
情報が各単語毎に格納されている。

単語辞書２２中のどの単語ともマツチしながった場合に
は、テキスト解析部２１は未知語処理を行なう。日本語
単語についての未知語処理については、周知の方法が既
に存在するので、この実施例の説明では言及しない。英
文字で構成される未知語について未知語処理（第１図参
照）を行なうため、テキスト解析部２１は未知語処理部
２１ａを有する。この未知語処理部２１ａは、テキスト
解析部２１に関連して設けられている表記・ローマ字変
換ルール２４、ローマ字・がな変換ルール２５、促音付
与ルール２６及びアクセント付加ルール２７を用いて未
知語についての読み、アクセントを決定する。このよう
にして決定された未知語の情報をも単語辞書２２内の情
報と同様に用いて、テキスト変換部２１は音韻、韻律記
号列を生成する。

なお、未知語処理の詳細は後述する。

合成パラメータ生成部２３は、音韻、韻律記号列に基づ
き、音声素片（音の種類）、音韻継続時間（音の長さ）
、基本周波数パターン（声の高さ）といっな音声合成用
のパラメータ（以下、合成パラメータと呼ぶ）を生成す
る。このうち、音声９片は、接続して合成波形を作るた
めの音声基本１位であり、音の種類等に応じて様々なも
のが予と用意されていてＲＯＭ等でなる音声素片記憶部
＝８に蓄積されている。

音声合成部２つでは、合成パラメータに基づば合成波形
が生成され、かくして、スピーカ３０壱通して入力され
た漢字かな混じり文に対応したく成音声が発音される。

入力された漢字かな混じｒ文が英文字でなる未知語を含
んでいる場合であ−ても、これに対応した合成音声が発
音される。

次に、第１図のフローチャートを用いて、未矢語処理部
２Ｌａが実行する未知語処理についてお明する。

ステップ３１表記・ローマ字変換ルールのうちの特殊ルール２４ａ１
を用いて、スペル（表記）を中間言語であるローマ字に
変換する。この特殊ルール２４ａ１は、第６図に一例を
示すように、英文字単語を精成する一部スペル（全部の
ことしある）と発着の関係の中でも特殊な場合を記述し
たものである。

この特殊ルール２４ａ１は、単語の先頭から順に適用さ
れるが、表記にマツチした最長のものが採択される。従
って、第６図に示すように、表記のアルファベット数の
多い順に当該ルールを整理しておくことは好ましい。

ステップ３２ステップ３１で変換されなかったものは、表記・ローマ
字変換ルールのうちの一般ルール２４ａ２を用いてロー
マ字に変換する。この一般ルール２４ａ２には、第７図
に一例を示すように、スペルと発音の関係の中でも一般
的なものが記述しである。なお、第７図には省略してい
るが、子音スペルをそのままローマ字を表す綴りにする
というルールも存在する。この一般ルール２４ａ２も単
語の先頭から順に適用される。

なお、特殊ルール２４ａ１の適用の有無を一般ルール２
４ａ２の適用の有無より先に判断するようにしたのは、
一般ルールが適用可能であるが、一般ルールによる変換
ではおかしくなるものが特殊ルールに規定されているた
めである。

ステップ３３スペルが全てローマ字に変換されるまで、上述のステッ
プ３１．３２を繰り返す。

すなわち、以上のステップ３１〜３３でなる処理ループ
を繰返すことにより、スペルがすべてローマ字に変換さ
れる。例えば、スペルｒ　ｇｅｎｅｒａｔｅは、ルール
番号ＲＬＩの特殊ルール２４ａ１が適用された後、一般
ルール２４ａ２が繰返し適用されてローマ字ｒ　ＪＥＮ
ＥＲＥ　ＩＴ　Ｊに変換される。

ステップ３４０一マ字への変換が終了すると、第８図に詳細を示すロ
ーマ字・かな変換ルール２５を用いて、ローマ字をかな
文字に変換する。このルール２５は単語の先頭から順に
適用されるが、ローマ字のマツチした最長のものが採択
される。なお、第８図において、「−」は長音を、「・
」はヌル（長さ０の文字列）を表す。

ステップ３５０一マ字が全てかを文字に変換されるまで、ステップ３
４を繰り返す。このような繰返し処理によって、ローマ
字ｒ　ＪＥＮＥＲＥＩＴＪはがな文字「チ゛エネレイト
］に変換される。

ステップ３にのステップ３６は、促音付与処理とアクセント付加処理
とからなる。これら処理は並行して実行されるのである
が、ここでは丈ず促音付与処理について説明する。

促音付与には、促音付与ルール２６が適用される。この
ルール２６は基本ルールと例外ルールとからなる。基本
ルールは、英単語について得られなかな文字列が２音節
以上（ｎ≧２）のものであって、後ろから２番目の音節
すなわち第（ｎ−１＞番目の音節が短母音であり、最終
音節すなわち第ｎ音節が破裂子音（パ・り・力行等）で
始まる場合には、これら２つの音節間に促音（ツ）を挿
入するというルールである。例外ルールは、このような
基本ルールを満足する場合であっても、該当する第（ｎ
−１）番目の音節の短母音が無声化する場合、具体的に
は無声子音に挟まれた高舌母音（イ又はつ）である場合
には、促音の挿入は行なわれないというルールである。

例えば、ローマ字が変換されたがな文字が「アルファへ
゛　ト」の場合には、促音付加処理が実行されてかな文
字「アルファへパット」に変換される。かな文字「ソフ
ト」については基本ルールは満足するが、上述の例外ル
ールをも満足するため促音の挿入はなされない。

促音付与処理が終了したがな文字列に対して、アクセン
ト付加ルール２７が適用されてそのがな文字列のアクセ
ント型が決定される。すなわち、促音付与ルール２６に
従って促音が付与されたがな文字列、又は、促音付与が
必要ないとされなかな文字列に対してアクセント型が決
定される。

アクセント型付加ルール２７は、がな文字に変換された
単語の音節数ｎに基づいてアクセント型を決定するもの
である。具体的には、音節数ｎが３より少ないのものは
第１音節にアクセントを有する１型にすると共に、音節
数ｎが３以上のものは第（ｎ−２）音節にアクセントを
有する（ｎ２）型にするルールである。因に、このアク
セント付加ルールは、カタカナの外来語に対する規則と
して一般によく知られているものである。

例えば、「チ゛エネレイト」は５音節でなるので、アク
セント型は３型（「し」にアクセントがくる）となる。

ローマ字がかな文字に変換されて得られた「アルファへ
ト」の場合、促音付加処理が実行されてかな文字「アル
ファへパット」に変換され、これに対してアクセント型
決定のルール２７が適用されるので、アクセント型は促
音音節の前の音節「べ」にアクセントがくる４型となる
。かな文字「ソフト」については促音の挿入がなされず
にアクセント型決定のルール２７が適用され、アクセン
ト型は「ン」にアクセントがくる１型となる。

以上のようなステップ３１〜３６でなる処理を実行する
ことにより、単語辞書２２に登録されていない未知の英
単語に対しても、日本語としての発音（読み・アクセン
ト）が得られ、単語辞書２２に登録されている単語と同
様に用いられる。

第９図は、いくつかの未知語英単語（表記）について日
本語としての発音（読み・アクセント）を得る変換の経
過を示したものである。

従って、上述の実施例によれば、単語辞書２２に登録さ
れていない未知の英単語について日本語としての発音を
自動的に決定することができる。

その結果、単語辞書２２内の情報と同様に扱うことがで
き、文章の発音が途中で中断されたり、発音されない部
分が生じたりすることを防止することができる。

なお、上述の実施例は、日本語テキスト音声変換システ
ムに本発明を適用したものであるが、本発明を他のシス
テムに適用することができる。例えば、漢字かな混じり
文に含まれている英単語をかを文字に変換して表示した
り再記録したりするようなシステムに適用することがで
きる。ワードプロセッサの一機能として英単語をかな文
字に変換する機能を持たせることは有効である。この場
合には、アクセント型の決定は不要となる。

また、本発明を適用できる外国語は英語に限定されるも
のではなく種々のものを適用し得る。

［発明の効果］以上のように、本発明によれば、各種のルールを設け、
このルールを適用して外国語表記単語に対する日本語と
しての発音（読みやアクセント等）を、発音辞書を用い
ずに自動的に決定することのできる。

【図面の簡単な説明】

第１図は本発明の一実施例による外国語単語の日本語発
音決定方法を示すフローチャート、第２図は従来の日本
語テキスト音声変換システムの構成を示すブロック図、
第３図及び第４図はそれぞれ発音辞書の格納内容を示す
図表、第５図は上記実施例に係る日本語テキスト音声変
換システムの構成を示すブロック図、第６図及び第７図
はそれぞれ上記実施例の表記・ローマ字変換ルールの説
明用図表、第８図は上記実施例のローマ字・かな変換ル
ールの説明用図表、第９図は上記実施例による変換経過
例を示す図表である。２１ａ・・・未知語処理部、２４・・・表記・ローマ字
変換ルール、２５・・・ローマ字・かな変換ルール、２
６・・・促音付与ルール、２７・・・アクセント付加ル
ール。外国語単語の日本語としての発音を決定する方法の７Ｏ
−ｆｒ）第１図

Claims

【特許請求の範囲】

（１）外国語表記の全部又は一部をローマ字に変換する
表記・ローマ字変換ルールと、ローマ字をかな文字に変
換するローマ字・かな変換ルールとを予め用意しておき
、外国語表記の外国語単語が与えられたときに上記表記
・ローマ字変換ルールを適用してローマ字に変換した後
、上記ローマ字・かな変換ルールを適用して上記ローマ
字をかな文字に変換して、上記外国語表記の外国語単語
の日本語としてのかな文字列を決定することを特徴とす
る外国語単語の日本語発音決定方法。
（２）上記表記・ローマ字変換ルールが、特殊な表記列
に対して個別かつ優先的に適用される特殊ルールと、複
数の所定の表記列に対して同様に適用される一般ルール
とから構成されていることを特徴とする請求項１に記載
の外国語単語の日本語発音決定方法。
（３）上記ローマ字・かな変換ルールが適用されて得ら
れたかな文字列の最終音節が破裂性子音で始まり、かつ
、その前の音節が短母音であるという条件を満たしたと
きに、これらの音節間に促音を挿入することを特徴とす
る請求項１に記載の外国語単語の日本語発音決定方法。
（４）上記かな文字列の最終音節の直前の音節の短母音
が無声子音に挟まれた高舌母音である場合には、請求項
３に記載の促音挿入処理を実行しないことを特徴とする
請求項１に記載の外国語単語の日本語発音決定方法。
（５）上記外国語表記の外国語単語について得られたか
な文字列の音節数が２以下のときに第１音節をアクセン
ト音節とし、上記かな文字列の音節数が３以上のときに
最終音節の２個前の音節をアクセント音節とする請求項
１ないし４のいずれかに記載の外国語単語の日本語発音
決定方法。