JPH04127199A - 外国語単語の日本語発音決定方法 - Google Patents

外国語単語の日本語発音決定方法

Info

Publication number
JPH04127199A
JPH04127199A JP2247411A JP24741190A JPH04127199A JP H04127199 A JPH04127199 A JP H04127199A JP 2247411 A JP2247411 A JP 2247411A JP 24741190 A JP24741190 A JP 24741190A JP H04127199 A JPH04127199 A JP H04127199A
Authority
JP
Japan
Prior art keywords
foreign language
kana
syllable
word
japanese
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2247411A
Other languages
English (en)
Inventor
Hiroki Kamanaka
博樹 釜中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Oki Electric Industry Co Ltd
Original Assignee
Oki Electric Industry Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Oki Electric Industry Co Ltd filed Critical Oki Electric Industry Co Ltd
Priority to JP2247411A priority Critical patent/JPH04127199A/ja
Publication of JPH04127199A publication Critical patent/JPH04127199A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 [産業上の利用分野] 本発明は、外国語単語の日本語としての発音(読み及び
アクセント等〉を決定する外国語単語の日本語発音決定
方法に関し、例えば、日本語テキストを音声に変換する
日本語テキスト音声変換システムに適用し得るものであ
る。
[従来の技術] 日本語テキスト音声変換システムは、我々が日常読み書
きしている漢字かな混じり文を入力として、それを音声
に変換して合成出力するものである。この日本語テキス
ト音声変換システム10の構成を第2図に示し、以下、
このシステムの概要を順を追って説明する。
第2図において、テキスト解析部11では、発音辞書1
2を利用して、入力された漢字かな混じり文から音韻、
韻律記号列を生成する。ここで、音韻、韻律記号列とは
、入力文の読み、アクセント、イントネーション等を文
字列として記述したもの(中間言語)である。各単語の
読みとアクセントは発音辞書12に登録されており、こ
の辞書12を参照しながらテキスト解析部11は音韻、
韻律記号列を生成される。
合成パラメータ生成部13は、音韻、韻律記号列に基づ
き、音声素片(音の種類)、音韻継続時間(音の長さ)
、基本周波数パターン〈声の高さ)といった音声合成用
のパラメータ(以下、合成パラメータと呼ぶ)を生成す
る。このうち、音声素片は、接続して合成波形を作るた
めの音声基本単位であり、音の種類等に応じて様々なも
のが予め用意されていてROM等でなる音声素片記憶部
14に蓄積されている。
音声合成部15では、合成パラメータに基づき合成波形
が生成され、かくして、スピーカ16を通して入力され
た漢字かな混じり文に対応した合成音声が発音される。
[発明が解決しようとする課題] 上述したように、従来の日本語テキスト音声変換システ
ムにおいては、テキスト解析部11が第3図に示すよう
な予め作成されている発音辞書12を参照することによ
り、入力文に含まれている各単語の読みとアクセントを
決定する。
しかし、従来の発音辞書12は日本語単語についての辞
書であって、一般に外国語単語は登録されておらす、入
力文中に現れた外国語単語の読みやアクセントを決定す
ることはできない。なお、ここでいう外国語単語とはア
ルファベット等によって外国語表記されたものを指し、
既にカタカナ等によって表記されている外来語とは異な
るものである。実際上、最近の日本文には、多くの外国
語単語が含まれており、このような外国語単語に対応で
きないことは問題が多い。
そこで、発音辞書12に、第4図に示すような表記が外
国語であって読み及びアクセントが日本語である外国語
用の辞書を用意して、上記不都合を解決することも既に
提案されている。
ところで、発音辞書12を格納するディスク装置の容量
が格納単語数を制約する場合かある。このような場合、
入力文に含まれている単語が単語辞書12に未登録のこ
とも生じる。日本文を対象とする日本語テキスト音声変
換システムにあっては、日本語単語に対する登録内容を
充実させる必要があることから、日本語単語より出現頻
度がおおむね少ない外国語単語に対して未登録のことが
多い。このような未登録の外国語単語が含まれていた場
合には、テキスト解析部11が処理を行なうことができ
す、音声の発音を途中で終了させたり、または、未知語
部分を発音させないようにしていた。
従って、従来のシステムは、日本語テキスト音声変換シ
ステムとして未完成なシステムということができる。
なお、文章全体の音声を完全に発音させようとすると、
未知語について単語辞書22に登録する動作を行なうこ
とを要し、繁雑な操作が必要となる。
本発明は、以上の点を考慮してなされたものであり、外
国語表記単語に対する日本語としての発音(読みやアク
セント等)を、発音辞書を用いずに決定することのでき
る外国語単語の日本語発音決定方法を提供しようとする
ものである。
「課題を解決するための手段] かかる課題を解決するため、本発明においては、外国語
表記の全部又は一部をローマ字に変換する表記・ローマ
字変換ルールと、ローマ字をかな文字に変換するローマ
字・かな変換ルールとを予め用意しておき、外国語表記
の外国語単語が与えられたときに表記・ローマ字変換ル
ールを適用してローマ字に変換した後、ローマ字・がな
変換ルールを適用してローソンをかな文字に変換して、
外国語表記の外国語単語の日本語としての読みを決定す
ることとしたく請求項1〜4に対応)。
なお、このようにして得られなかな文字列の音節数が2
以下のときに第1音節をアクセント音節とし、かな文字
列の音節数が3以上のときに最終音節の2個前の音節を
アクセント音節としてアクセント情報を得るようにする
ことが好ましいく請求項5対応)。
[作用] 本発明は、外国語表記単語について、少なくとも日本語
としての読み(かな文字)を発音辞書を用いずに得るよ
うにしたものである。外国語表記の外国語単語に対して
、まず予め用意されている表記・ローマ字変換ルールに
従って外国語単語の表記(スペル)をローマ字(中間言
語)に変換する。次に、予め用意されているローマ字・
がな変換ルールに従ってローマ字をかな文字に変換する
これにより、外国語単語の日本語としての読み(かな文
字)を決定することができる。
アクセント情報も必要な場合には、外来語について周知
になっている方式に従いアクセントを付加する。すなわ
ち、かな文字列の音節数が2以下のときに第1音節をア
クセント音節とし、かな文字列の音節数が3以上のとき
に最終音節の2個前の音節をアクセント音節とする。
[実施例] 以下、本発明を日本語テキスト音声変換システムに適用
した一実施例を図面を参照しながら詳述する。なお、こ
のシステムは、外国語単語として、英語単語に対応でき
るものとなっている。
第5図は、この実施例のシステム構成を示すブロック図
である。
第5図において、当該日本語テキスト音声変換システム
20に入力された任意の日本語文章(漢字かな混じり文
)は、テキスト解析部21に与えられる。なお、漢字か
な混じり文は、例えばワードプロセッサで作成したもの
、又は光学的文字読取装置(OCR)から出力されたも
のであり、例えばJISコード等でコード化されている
テキスト解析部21では、入力された漢字かな混じり文
を解析して、入力文の読み、アクセント、イントネーシ
ョンを決定し、これらを文字列として記述した中間言語
たる音韻・韻律記号列として合成パラメータ生成部23
に与える。
テキスト解析部21は、かかる解析処理の際に、発音辞
書22を参照する。英文等と違って分がち書きされてい
ない漢字かな混じり文は、発音辞書22内の表記とマツ
チングをとることにより単語に分割されて処理される。
この実施例の場合、発音辞書22には、上述した第3図
及び第4図に示すように、表記、読み、アクセント等の
情報が各単語毎に格納されている。
単語辞書22中のどの単語ともマツチしながった場合に
は、テキスト解析部21は未知語処理を行なう。日本語
単語についての未知語処理については、周知の方法が既
に存在するので、この実施例の説明では言及しない。英
文字で構成される未知語について未知語処理(第1図参
照)を行なうため、テキスト解析部21は未知語処理部
21aを有する。この未知語処理部21aは、テキスト
解析部21に関連して設けられている表記・ローマ字変
換ルール24、ローマ字・がな変換ルール25、促音付
与ルール26及びアクセント付加ルール27を用いて未
知語についての読み、アクセントを決定する。このよう
にして決定された未知語の情報をも単語辞書22内の情
報と同様に用いて、テキスト変換部21は音韻、韻律記
号列を生成する。
なお、未知語処理の詳細は後述する。
合成パラメータ生成部23は、音韻、韻律記号列に基づ
き、音声素片(音の種類)、音韻継続時間(音の長さ)
、基本周波数パターン(声の高さ)といっな音声合成用
のパラメータ(以下、合成パラメータと呼ぶ)を生成す
る。このうち、音声9片は、接続して合成波形を作るた
めの音声基本1位であり、音の種類等に応じて様々なも
のが予と用意されていてROM等でなる音声素片記憶部
=8に蓄積されている。
音声合成部2つでは、合成パラメータに基づば合成波形
が生成され、かくして、スピーカ30壱通して入力され
た漢字かな混じり文に対応したく成音声が発音される。
入力された漢字かな混じr文が英文字でなる未知語を含
んでいる場合であ−ても、これに対応した合成音声が発
音される。
次に、第1図のフローチャートを用いて、未矢語処理部
2Laが実行する未知語処理についてお明する。
ステップ31 表記・ローマ字変換ルールのうちの特殊ルール24a1
を用いて、スペル(表記)を中間言語であるローマ字に
変換する。この特殊ルール24a1は、第6図に一例を
示すように、英文字単語を精成する一部スペル(全部の
ことしある)と発着の関係の中でも特殊な場合を記述し
たものである。
この特殊ルール24a1は、単語の先頭から順に適用さ
れるが、表記にマツチした最長のものが採択される。従
って、第6図に示すように、表記のアルファベット数の
多い順に当該ルールを整理しておくことは好ましい。
ステップ32 ステップ31で変換されなかったものは、表記・ローマ
字変換ルールのうちの一般ルール24a2を用いてロー
マ字に変換する。この一般ルール24a2には、第7図
に一例を示すように、スペルと発音の関係の中でも一般
的なものが記述しである。なお、第7図には省略してい
るが、子音スペルをそのままローマ字を表す綴りにする
というルールも存在する。この一般ルール24a2も単
語の先頭から順に適用される。
なお、特殊ルール24a1の適用の有無を一般ルール2
4a2の適用の有無より先に判断するようにしたのは、
一般ルールが適用可能であるが、一般ルールによる変換
ではおかしくなるものが特殊ルールに規定されているた
めである。
ステップ33 スペルが全てローマ字に変換されるまで、上述のステッ
プ31.32を繰り返す。
すなわち、以上のステップ31〜33でなる処理ループ
を繰返すことにより、スペルがすべてローマ字に変換さ
れる。例えば、スペルr generateは、ルール
番号RLIの特殊ルール24a1が適用された後、一般
ルール24a2が繰返し適用されてローマ字r JEN
ERE IT Jに変換される。
ステップ34 0一マ字への変換が終了すると、第8図に詳細を示すロ
ーマ字・かな変換ルール25を用いて、ローマ字をかな
文字に変換する。このルール25は単語の先頭から順に
適用されるが、ローマ字のマツチした最長のものが採択
される。なお、第8図において、「−」は長音を、「・
」はヌル(長さ0の文字列)を表す。
ステップ35 0一マ字が全てかを文字に変換されるまで、ステップ3
4を繰り返す。このような繰返し処理によって、ローマ
字r JENEREITJはがな文字「チ゛エネレイト
]に変換される。
ステップ3に のステップ36は、促音付与処理とアクセント付加処理
とからなる。これら処理は並行して実行されるのである
が、ここでは丈ず促音付与処理について説明する。
促音付与には、促音付与ルール26が適用される。この
ルール26は基本ルールと例外ルールとからなる。基本
ルールは、英単語について得られなかな文字列が2音節
以上(n≧2)のものであって、後ろから2番目の音節
すなわち第(n−1>番目の音節が短母音であり、最終
音節すなわち第n音節が破裂子音(パ・り・力行等)で
始まる場合には、これら2つの音節間に促音(ツ)を挿
入するというルールである。例外ルールは、このような
基本ルールを満足する場合であっても、該当する第(n
−1)番目の音節の短母音が無声化する場合、具体的に
は無声子音に挟まれた高舌母音(イ又はつ)である場合
には、促音の挿入は行なわれないというルールである。
例えば、ローマ字が変換されたがな文字が「アルファへ
゛ ト」の場合には、促音付加処理が実行されてかな文
字「アルファへパット」に変換される。かな文字「ソフ
ト」については基本ルールは満足するが、上述の例外ル
ールをも満足するため促音の挿入はなされない。
促音付与処理が終了したがな文字列に対して、アクセン
ト付加ルール27が適用されてそのがな文字列のアクセ
ント型が決定される。すなわち、促音付与ルール26に
従って促音が付与されたがな文字列、又は、促音付与が
必要ないとされなかな文字列に対してアクセント型が決
定される。
アクセント型付加ルール27は、がな文字に変換された
単語の音節数nに基づいてアクセント型を決定するもの
である。具体的には、音節数nが3より少ないのものは
第1音節にアクセントを有する1型にすると共に、音節
数nが3以上のものは第(n−2)音節にアクセントを
有する(n2)型にするルールである。因に、このアク
セント付加ルールは、カタカナの外来語に対する規則と
して一般によく知られているものである。
例えば、「チ゛エネレイト」は5音節でなるので、アク
セント型は3型(「し」にアクセントがくる)となる。
ローマ字がかな文字に変換されて得られた「アルファへ
ト」の場合、促音付加処理が実行されてかな文字「アル
ファへパット」に変換され、これに対してアクセント型
決定のルール27が適用されるので、アクセント型は促
音音節の前の音節「べ」にアクセントがくる4型となる
。かな文字「ソフト」については促音の挿入がなされず
にアクセント型決定のルール27が適用され、アクセン
ト型は「ン」にアクセントがくる1型となる。
以上のようなステップ31〜36でなる処理を実行する
ことにより、単語辞書22に登録されていない未知の英
単語に対しても、日本語としての発音(読み・アクセン
ト)が得られ、単語辞書22に登録されている単語と同
様に用いられる。
第9図は、いくつかの未知語英単語(表記)について日
本語としての発音(読み・アクセント)を得る変換の経
過を示したものである。
従って、上述の実施例によれば、単語辞書22に登録さ
れていない未知の英単語について日本語としての発音を
自動的に決定することができる。
その結果、単語辞書22内の情報と同様に扱うことがで
き、文章の発音が途中で中断されたり、発音されない部
分が生じたりすることを防止することができる。
なお、上述の実施例は、日本語テキスト音声変換システ
ムに本発明を適用したものであるが、本発明を他のシス
テムに適用することができる。例えば、漢字かな混じり
文に含まれている英単語をかを文字に変換して表示した
り再記録したりするようなシステムに適用することがで
きる。ワードプロセッサの一機能として英単語をかな文
字に変換する機能を持たせることは有効である。この場
合には、アクセント型の決定は不要となる。
また、本発明を適用できる外国語は英語に限定されるも
のではなく種々のものを適用し得る。
[発明の効果] 以上のように、本発明によれば、各種のルールを設け、
このルールを適用して外国語表記単語に対する日本語と
しての発音(読みやアクセント等)を、発音辞書を用い
ずに自動的に決定することのできる。
【図面の簡単な説明】
第1図は本発明の一実施例による外国語単語の日本語発
音決定方法を示すフローチャート、第2図は従来の日本
語テキスト音声変換システムの構成を示すブロック図、
第3図及び第4図はそれぞれ発音辞書の格納内容を示す
図表、第5図は上記実施例に係る日本語テキスト音声変
換システムの構成を示すブロック図、第6図及び第7図
はそれぞれ上記実施例の表記・ローマ字変換ルールの説
明用図表、第8図は上記実施例のローマ字・かな変換ル
ールの説明用図表、第9図は上記実施例による変換経過
例を示す図表である。 21a・・・未知語処理部、24・・・表記・ローマ字
変換ルール、25・・・ローマ字・かな変換ルール、2
6・・・促音付与ルール、27・・・アクセント付加ル
ール。 外国語単語の日本語としての発音を決定する方法の7O
−fr)第1図

Claims (5)

    【特許請求の範囲】
  1. (1)外国語表記の全部又は一部をローマ字に変換する
    表記・ローマ字変換ルールと、ローマ字をかな文字に変
    換するローマ字・かな変換ルールとを予め用意しておき
    、外国語表記の外国語単語が与えられたときに上記表記
    ・ローマ字変換ルールを適用してローマ字に変換した後
    、上記ローマ字・かな変換ルールを適用して上記ローマ
    字をかな文字に変換して、上記外国語表記の外国語単語
    の日本語としてのかな文字列を決定することを特徴とす
    る外国語単語の日本語発音決定方法。
  2. (2)上記表記・ローマ字変換ルールが、特殊な表記列
    に対して個別かつ優先的に適用される特殊ルールと、複
    数の所定の表記列に対して同様に適用される一般ルール
    とから構成されていることを特徴とする請求項1に記載
    の外国語単語の日本語発音決定方法。
  3. (3)上記ローマ字・かな変換ルールが適用されて得ら
    れたかな文字列の最終音節が破裂性子音で始まり、かつ
    、その前の音節が短母音であるという条件を満たしたと
    きに、これらの音節間に促音を挿入することを特徴とす
    る請求項1に記載の外国語単語の日本語発音決定方法。
  4. (4)上記かな文字列の最終音節の直前の音節の短母音
    が無声子音に挟まれた高舌母音である場合には、請求項
    3に記載の促音挿入処理を実行しないことを特徴とする
    請求項1に記載の外国語単語の日本語発音決定方法。
  5. (5)上記外国語表記の外国語単語について得られたか
    な文字列の音節数が2以下のときに第1音節をアクセン
    ト音節とし、上記かな文字列の音節数が3以上のときに
    最終音節の2個前の音節をアクセント音節とする請求項
    1ないし4のいずれかに記載の外国語単語の日本語発音
    決定方法。
JP2247411A 1990-09-19 1990-09-19 外国語単語の日本語発音決定方法 Pending JPH04127199A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2247411A JPH04127199A (ja) 1990-09-19 1990-09-19 外国語単語の日本語発音決定方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2247411A JPH04127199A (ja) 1990-09-19 1990-09-19 外国語単語の日本語発音決定方法

Publications (1)

Publication Number Publication Date
JPH04127199A true JPH04127199A (ja) 1992-04-28

Family

ID=17163039

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2247411A Pending JPH04127199A (ja) 1990-09-19 1990-09-19 外国語単語の日本語発音決定方法

Country Status (1)

Country Link
JP (1) JPH04127199A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000010579A (ja) * 1998-06-19 2000-01-14 Nec Corp 音声合成装置及びコンピュータ可読記録媒体
JP2005070611A (ja) * 2003-08-27 2005-03-17 Oki Electric Ind Co Ltd 音声合成方法

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0229797A (ja) * 1988-07-20 1990-01-31 Fujitsu Ltd テキスト音声変換装置

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0229797A (ja) * 1988-07-20 1990-01-31 Fujitsu Ltd テキスト音声変換装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000010579A (ja) * 1998-06-19 2000-01-14 Nec Corp 音声合成装置及びコンピュータ可読記録媒体
JP2005070611A (ja) * 2003-08-27 2005-03-17 Oki Electric Ind Co Ltd 音声合成方法

Similar Documents

Publication Publication Date Title
US6029132A (en) Method for letter-to-sound in text-to-speech synthesis
US6778962B1 (en) Speech synthesis with prosodic model data and accent type
US6016471A (en) Method and apparatus using decision trees to generate and score multiple pronunciations for a spelled word
KR900009170B1 (ko) 규칙합성형 음성합성시스템
WO2005034082A1 (en) Method for synthesizing speech
JP5198046B2 (ja) 音声処理装置及びそのプログラム
JPH11344990A (ja) 綴り言葉に対する複数発音を生成し評価する判断ツリ―を利用する方法及び装置
Demuynck et al. Automatic generation of phonetic transcriptions for large speech corpora.
KR20180025559A (ko) 발음 사전 학습 방법 및 장치
Ngugi et al. Swahili text-to-speech system
JPH04127199A (ja) 外国語単語の日本語発音決定方法
Iyanda et al. Development of a Yorúbà Textto-Speech System Using Festival
Downey et al. A decision tree approach to task-independent speech recognition
Khamdamov et al. Syllable-Based Reading Model for Uzbek Language Speech Synthesizers
Hendessi et al. A speech synthesizer for Persian text using a neural network with a smooth ergodic HMM
Repe et al. Prosody model for marathi language TTS synthesis with unit search and selection speech database
JPH03245192A (ja) 外国語単語の発音決定方法
KR0173340B1 (ko) 텍스트/음성변환기에서 억양패턴 정규화와 신경망 학습을 이용한 억양 생성 방법
JPS6229796B2 (ja)
Kaur et al. BUILDING AText-TO-SPEECH SYSTEM FOR PUNJABI LANGUAGE
Bellegdi et al. Automatic rule based phonetic transcription and syllabification for quranic text
JPH096378A (ja) テキスト音声変換装置
KR100611894B1 (ko) 음성 인식기의 단어 모델 생성 방법
IMRAN ADMAS UNIVERSITY SCHOOL OF POST GRADUATE STUDIES DEPARTMENT OF COMPUTER SCIENCE
JPH05298364A (ja) 発音記号生成方式