JP2001142877A

JP2001142877A - アルファベット文字・日本語読み対応付け装置と方法およびアルファベット単語音訳装置と方法ならびにその処理プログラムを記録した記録媒体

Info

Publication number: JP2001142877A
Application number: JP32489299A
Authority: JP
Inventors: Kuniko Moriwaki; 邦子森脇
Original assignee: Nippon Telegraph and Telephone Corp
Current assignee: Nippon Telegraph and Telephone Corp
Priority date: 1999-11-16
Filing date: 1999-11-16
Publication date: 2001-05-25
Anticipated expiration: 2019-11-16
Also published as: JP4084515B2

Abstract

(57)【要約】【課題】従来は、英語等のアルファベット単語の日本
語読みへの高精度な変換を任意の単語に対して簡易かつ
低コストで行うことができない。【解決手段】本発明のアルファベット・日本語読み対
応付け装置１は、例えば英単語とカタカナの任意の部分
文字列間について要素間距離を計算する手段１ａと最小
距離対応付けを探索する手段１ｂとを備え、英文字とカ
タカナの対応付けを自動的に処理できる。また、本発明
の英単語カタカナ音訳装置２は、アルファベット・日本
語読み対応付け装置１で生成された英文字とカタカナ対
応データから音訳モデルを作成する手段２ａと、その音
訳モデルに基づいて英単語とカタカナの同時出現確率を
計算する手段２ｂと、同時出現確率が最大となる経路を
探索する手段２ｃを備え、任意の英単語について最適な
カタカナ音訳を行うことができる。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、テキスト自動読み
上げやディクテーション（口述筆記）など、コンピュー
タを用いた音声合成や音声認識等の言語処理技術に係
り、特に、英単語等のアルファベットからなる外来語に
対する日本語読み（カタカナ）への変換（音訳）を効率
的に行うに好適なアルファベット文字・日本語読み対応
付け装置と方法およびアルファベット単語音訳装置と方
法ならびにその処理プログラムを記録した記録媒体に関
するものである。

【０００２】

【従来の技術】コンピュータを用いたテキスト自動読み
上げやディクテーションなどの音声合成・音声認識シス
テムにおいて、英単語に日本語読み（カタカナ音訳）を
振る技術の一般的なものに、英単語とそれに対応する日
本語読みを予め単語辞書に登録する従来技術（ａ）があ
る。しかし、多くの場合、英単語には複数の読みが存在
する。例えば、「ｂｏｄｙ」は「バディー」や「ボディ
ー」あるいは「ボディ」など色々な読みがある。

【０００３】また、人名、地名などの固有名詞は単語辞
書に登録されていないことが多いが、単語単位で読みが
登録されていないものは１文字ずつに分解してアルファ
べット読みを繋げてしまうため、従来技術（ａ）では全
く意味をなさない読みが振られてしまう。

【０００４】このような問題に対処するためには、複数
のカタカナ読みや新しい固有名詞の読みなどを全て辞書
に登録する必要があり、その辞書の作成・維持に膨大な
コストがかかる。

【０００５】この従来技術（ａ）のように予め読みを辞
書に登録するのではなく、英単語から自動的に読みを生
成する試みもある。例えば、英単語を一度英語の発音記
号に変換し、更にこれを日本語の読みへ変換する従来技
術（ｂ）が、例えば、K. Knight and J. Graehl:“Mach
ine Transliteration”,Computational Linguistics,vo
l.24,No.4,pp.599-612(1998)に開示されている。しか
し、この従来技術（ｂ）には、英語の発音と日本語の読
みが必ずしも一致しないという困難点がある。

【０００６】また、英単語表記から直接日本語の読みに
変換する従来技術（ｃ）が、例えば、塚田，増田：“英
単語に対する日本語読み付与方法の検討”,情報処理学
会第５３回全国大会,２−３５９（平成８年後期）にお
いて提案されている。

【０００７】これは、アルファべット部分列と日本語音
節の対応規則およびそれを補強する幾つかの規則（末尾
−ｅ規則、接尾辞規則、促音挿入規則）を用いて英語表
記を直接日本語の読みに変換する技術である。

【０００８】しかし、この従来技術（ｃ）は、対応規則
や補強規則を全て人手で作成しなければならないので、
規則の設定に経験が必要とされ、理論的根拠に乏しく、
コストもかかるという問題点がある。

【０００９】

【発明が解決しようとする課題】解決しようとする問題
点は、従来技術（ａ）の単語単位で読みを辞書に登録す
る技術では、辞書作成・維持にコストがかかり、また未
知語には読みが振れないといった点であり、従来技術
（ｂ）の単語表記から発音記号を経由して読みを生成す
る技術では、英語と日本語の発音に違いがあるため困難
が多いといった点であり、さらに、従来技術（ｃ）の単
語表記から直接読みを生成する技術では、人手による規
則の設定を必要とするため、設定基準に理論的根拠がな
く、コストがかかるといった点である。

【００１０】本発明の目的は、これら従来技術の課題を
解決し、英語等のアルファベット単語の日本語読み（カ
タカナ音訳等）への高精度な変換を、簡易かつ低コスト
で、さらに未知語等の任意の単語に対しても行うことを
可能とするアルファベット文字・日本語読み対応付け装
置と方法およびアルファベット単語音訳装置と方法なら
びにその処理プログラムを記録した記録媒体を提供する
ことである。

【００１１】

【課題を解決するための手段】上記目的を達成するた
め、本発明のアルファベット・日本語読み対応付け装置
と方法は、対で入力されたアルファベット単語と、この
アルファベット単語の日本語読みとから、アルファベッ
ト単語を構成する文字列と、この文字列に対する日本語
読みとを対応付けたデータを生成するものであり、ま
ず、予め対で入力されたアルファベット文字列とこのア
ルファベット文字列の１以上の日本語読みとを対応付け
て記憶装置に記憶しておく。そして、アルファベット単
語と、このアルファベット単語の日本語読みとの対が入
力されると、要素間距離計算手段により、このアルファ
ベット単語を構成する文字列と日本語読みを構成する文
字列の全ての組合せの部分文字列間について要素間距離
の計算を行う。この際、記憶装置で記憶した対応付けを
例えば接続コスト０それ以外を接続コスト１として要素
間距離の計算を行う。そして、対応付け探索手段によ
り、計算した部分文字列間の要素間距離の語頭から語尾
までの総和が最少になる対応付けを求める。このように
して、対で入力されたアルファベット単語と、このアル
ファベット単語の日本語読みとから、アルファベット単
語を構成する文字列と、この文字列に対する日本語読み
とを対応付けた大量のデータを容易に生成することがで
きる。

【００１２】また、本発明のアルファベット単語音訳装
置と方法は、上述のアルファベット・日本語読み対応付
け装置で生成されたアルファベット文字列とその日本語
読みとを対応付けた大量のデータを用いて、入力された
アルファベット単語を構成する文字列とその日本語読み
との文字列ngram（複数要素の連鎖）頻度を計算し、こ
の統計情報を用いた音訳モデル（日本語のカナ文字およ
びその連鎖の出現頻度の集合からなるモデル）に基づい
て、入力されたアルファベット単語の日本語読みを特定
する。

【００１３】

【発明の実施の形態】以下、本発明の実施の形態を、図
面により詳細に説明する。図１は、本発明のアルファベ
ット・日本語読み対応付け装置とアルファベット単語音
訳装置の本発明に係る構成の一例を示すブロック図であ
り、図２は、本発明のアルファベット・日本語読み対応
付け方法とアルファベット単語音訳方法の本発明に係る
処理動作の一例を示すフローチャート、図９は、図１お
よび図２における本発明のアルファベット・日本語読み
対応付け装置と方法およびアルファベット単語音訳装置
と方法を実現するためのコンピュータシステムのハード
ウェア構成の一例を示すブロック図である。

【００１４】図９において、９１はＣＲＴ（Cathode Ra
y Tube）やＬＣＤ（Liquid CrystalDisplay）等からな
る表示装置、９２はキーボードやマウス等からなる入力
装置、９３はハードディスクドライブ等からなる外部記
憶装置、９４はＣＰＵ（Central Processing Unit）や
主メモリ等を有し蓄積プログラム方式によるコンピュー
タ処理を行なう情報処理装置、９５は本発明に係る処理
プログラムやデータ等を記録した光ディスク、９６は光
ディスク９５の読み取り動作を行なう駆動装置である。

【００１５】光ディスク９５に記録された処理プログラ
ムやデータをインストールして主メモリに読み込むこと
により、情報処理装置９４内に、図１に示すアルファベ
ット・日本語読み対応付け装置やアルファベット単語音
訳装置の本発明に係る機能が実装される。

【００１６】以下、図１を用いて本発明に係るアルファ
ベット・日本語読み対応付け装置とアルファベット単語
音訳装置の構成を説明する。図１において、１はアルフ
ァベット・日本語読み対応付け装置(図中、「英文字・カ
タカナ対応付け装置」と記載)、２はアルファベット単
語音訳装置(図中、「英単語カタカナ音訳装置」と記載)
である。

【００１７】本例のアルファベット音訳装置２は、英単
語からカタカナ読みを作成し、また、本例のアルファベ
ット・日本語読み対応付け装置１は、このアルファベッ
ト音訳装置２で用いる音訳モデルを作成するために必要
となる英文字・カタカナ対応データを作成する。

【００１８】すなわち、アルファベット・日本語読み対
応付け装置１は、入力された英単語とその日本語読みで
あるカタカナとを文字列単位で自動的に対応付ける装置
であり、要素間距離計算手段１ａと、最小距離対応付け
探索手段１ｂ、英文字カタカナ読みテーブル１ｃ、およ
び、フィードバック手段１ｄとを有する。

【００１９】英文字カタカナ読みテーブル１ｃには、予
め対で入力された英文字列とそのカタカナ読みの候補
（複数可）が格納されており、要素間距離計算手段１ａ
は、入力された英単語・カタカナ対応データの、任意の
部分文字列間について、その英文字カタカナ読みテーブ
ル１ｃを参照し、予め設定された関数を用いて要素間距
離を計算する。

【００２０】そして、最小距離対応付け探索手段１ｂ
は、動的計画法を用いて、要素間距離計算手段１ａで計
算した文字列の要素間距離の総和が最小となる経路を探
索し、その時の英文字とカタカナの対応付け（英文字・
カタカナ対応データ）を１組出力する。

【００２１】さらに、フィードバック手段１ｄは、最小
距離対応付け探索手段１ｂで求めた英文字・カタカナ対
応データを英文字カタカナ読みテーブル１ｃに記憶させ
る。

【００２２】また、アルファベット音訳装置２は、英単
語に対してカタカナ音訳をする装置であって、音訳モデ
ル作成手段２ａと、英単語・カタカナ同時出現確率計算
手段２ｂ、最大確率経路探索手段２ｃ、および、音訳モ
デルとしての文字列ngram頻度テーブル２ｄを有する。

【００２３】音訳モデル作成手段２ａは、アルファベッ
ト・日本語読み対応付け装置１によって生成されたアル
ファベット・カタカナ対応データから、英単語とそのカ
タカナの同時出現確率を求めて音訳するための確率モデ
ル（音訳モデル）である文字列ngram頻度テーブル２ｄ
を生成する。

【００２４】この文字列ngram頻度テーブル２ｄ（音訳
モデル）には、図６，７で具体例を示す文字列bigram頻
度テーブル２ｅと文字列unigram頻度テーブル２ｆが格
納されており、同時出現確率計算手段２ｂは、文字列un
igram頻度テーブル２ｆから、入力された英単語内の英
文字列に対するカタカナ文字列候補を複数列挙し、文字
列bigram頻度テーブル２ｅに基づいて、入力された英単
語に対するカタカナの同時出現確率を計算する。

【００２５】最大確率経路探索手段２ｃは、複数の候補
の中から、英単語・カタカナ同時出現確率計算手段２ｂ
で計算した同時出現確率を最大にする経路を探索し、そ
の結果をカタカナ音訳結果として出力する。

【００２６】以下、このような構成のアルファベット・
日本語読み対応付け装置１とアルファベット音訳装置２
の動作を、図２に基づき説明する。

【００２７】図２において、ステップ２０１，２０２が
図１のアルファベット・日本語読み対応付け装置１の処
理、ステップ２０３〜２０４が図１のアルファベット単
語音訳装置２の処理である。

【００２８】まず、アルファベット・日本語読み対応付
け装置１では、英単語とそのカタカナ読みとが対で入力
されると、要素間距離計算手段１ａにより、その英単語
・カタカナ対応データを入力として、英文字カタカナ読
みテーブル１ｃを参照し、英文字とカタカナの任意の部
分文字列間の要素間距離を計算する（ステップ２０
１）。

【００２９】そして、最小距離対応付け探索手段１ｂに
より、その要素間距離の総和が最小となる対応付け経路
を探索してアルファベット・カタカナ対応データを作成
する（ステップ２０２）。

【００３０】続いて、アルファベット音訳装置２では、
アルファベット・日本語読み対応付け装置１で作成され
たアルファベット・カタカナ対応データを用いて、音訳
モデル作成手段２ａにより、音訳モデル（文字列ngram
頻度テーブル２ｄ）を作成する（ステップ２０３）。

【００３１】その後、任意の英単語が入力されると、そ
の英単語の入力に対して、英単語・カタカナ同時出現確
率計算手段２ｂにより、音訳モデル（文字列ngram頻度
テーブル２ｄ）に基づいて英単語とカタカナの同時出現
確率を計算する（ステップ２０４）。そして、最大確率
経路探索手段２ｃにより、最も確率の高い経路を探索し
てカタカナ音訳結果を出力する（ステップ２０５）。

【００３２】このようにして、アルファベット・日本語
読み対応付け装置１において、対で入力された英単語・
カタカナ対応データから自動的に文字列単位で対応付け
たカタカナ読みデータを作成し、そして、この文字列単
位で対応付けたデータから作成した音訳モデルに基づい
て、アルファベット音訳装置２において、任意に入力さ
れた英単語に対してカタカナ音訳を行う。

【００３３】次に、図３〜図８に基づき、具体的な例を
用いて、アルファベット・日本語読み対応付け装置１と
アルファベット音訳装置２の動作等に関して、要素間距
離計算と最小距離対応付け探索、および、音訳モデルの
順に説明する。

【００３４】尚、以下に説明する技術は、例えば、北研
二・中村哲・永田昌明著：“音声言語処理”（森北出
版株式会社発行、１９９６年）の第２７頁〜第３０頁、
第６３頁〜第６９頁、第８２頁〜第８７頁等に記載の形
態素解析技術に基づくものである。

【００３５】図３は、図１における要素間距離計算手段
で参照する英文字カタカナ読みテーブルの構成例を示す
説明図、図４は、図１における最少距離対応付け探索手
段による英文字・カタカナの対応付け結果表の構成例を
示す説明図、図５は、図１における要素間距離計算手段
による要素間距離の計算結果例を示す説明図、図６は、
図１における文字列bigram頻度テーブルの構成例を示す
説明図、図７は、図１における文字列unigram頻度テー
ブルの構成例を示す説明図、そして、図８は、図１にお
ける最大確率経路探索手段により出力される英単語カタ
カナ音訳の結果表例を示す説明図である。

【００３６】まず、要素間距離計算と最小距離対応付け
探索について説明する。英単語とカタカナを対応付ける
というのは、例えば「station／ステーション」という
単語単位の対応データを「s／ス」、「ta／テー」、「t
io/ショ」、「n／ン」というように、文字列単位で対応
付けを行うことである。尚、文字列単位は原則として日
本語発音の単位にする。

【００３７】英単語を構成する文字列Ｘ＝x₁x₂…x_nと、
その読みであるカタカナを構成する文字列Ｙ＝y₁y₂…y_m
を対応付ける時は、各要素間の距離を定義し、距離の和
が最小となるような対応付けを求めれば良い。文字列の
対応は「ｓ／ス」の「１：１」から、「tio／ショ」の
「３：２」等の「ｓ／ｔ（ｓ，ｔ＞１）」まで多数あ
る。本例では「１：１」〜「４：４」までの対応とす
る。

【００３８】英単語の要素x₁からx_iまでと、カタカナの
要素y₁からy_jまでの距離をｄ(i,j)とする。英文字列と
カタカナ列が「ｓ：ｔ」に対応している時、すなわち英
文字x_i-s+1…x_iと、カタカナy_j-t+1…y_jが対応している
時、その要素間距離をcost(x_i-s+1…x_i，y_j-t+1…y_j)と
すると次の式（数１）で表される。

【００３９】

【数１】

【００４０】各地点(i,j)で「１：１」〜「４：４」の
対応について要素間距離cost(x_i-s+1…x_i，y_j-t+1…y_j)
の計算を行い、語頭からの距離ｄ(i,j)を求める。

【００４１】求めた距離ｄ(i,j)の最小値と、そのとき
の対応「ｓ：ｔ」の値から，直前の地点（ｉ−ｓ，ｊ−
ｔ）を記憶しておく。語尾まで至ったら、記憶された直
前の地点を順に巡り、最小距離となる対応付けを求め
る。要素間距離の値は、英文字カタカナ読みテーブルを
用いて以下の式（数２）から求められる。

【００４２】

【数２】

【００４３】この他の対応として、以下のように１文字
挿入と１文字削除も考える。１文字挿入は、英文字列と
カタカナが「０：１」に対応し、１文字削除は「１：
０」に対応する。このときの要素間距離は常に「１」で
ある。

【００４４】図３に示す英文字カタカナ読みテーブル１
ｃは、予め作成した対応付け規則であり、本例では約１
３０項目の英文字列について設定した。これは、アルフ
ァべットの子音と母音の組み合わせ（ka,ki,ku,ke,ko，
…）に対する読みと、全てのアルファべット１文字（a,
b,c,…）に対する読みの候補を機械的に幾つか列挙した
ものである。

【００４５】図４に示す英文字・カタカナの対応付け結
果表４１において、１行目が、入力された英単語・カタ
カナ対応データであり、「英単語／カタカナ」で表され
る。また、２行目以降が対応付けの結果であり、「英文
字／カタカナ」で表される。

【００４６】図５に示す要素間距離を説明する図では、
矢印が「ｓ：ｔ」の対応を示し、そして矢印に添えてあ
る数字が、その対応の要素間距離である。いくつかの対
応例を示しており、この例では図３の英文字カタカナ読
みテーブル１ｃの項目にある「lo／ロ」と「so／ソ」の
対応のみが要素間距離「０」となるが、それ以外の対
応、例えば、「ｉ／フィ」と「op／ィ」等では全て
「１」になる。

【００４７】従って、語頭から語尾までの要素間距離の
和が最小となるには、「phy／フィ」と「phy／フィー」
の対応を経由する場合で、その距離は、「１＋０＋０＋
１＝２」となる。語頭から語尾までの全ての対応付けに
ついて総当りで検討し、最小距離となる対応付けの経路
（矢印の組み合わせ）を求める。

【００４８】以上の例からも分かるように、本例の図１
に示す英文字・カタカナ対応付け装置１では、図３の英
文字カタカナ読みテーブル１ｃに項目が存在しないもの
が含まれる場合でも、前後に正確な対応付けができる要
素があるために、全体として正しく対応付けができる。

【００４９】このように、元となる英文字カタカナ読み
テーブル１ｃが、全ての対応を網羅していなくても、新
しい対応付けを行える点がこの英文字・カタカナ対応付
け装置１の優れた点である。

【００５０】次に、図１におけるアルファベット音訳装
置２の音訳モデル作成手段２ａで生成し、英単語・カタ
カナ同時出現確率計算手段２ｂで参照する音訳モデル
（文字列bigram頻度テーブル２ｅ、文字列unigram頻度
テーブル２ｆ）について説明する。

【００５１】図１の音訳モデル作成手段２ａでは、英文
字・カタカナ対応付け装置１の最少距離対応付け探索手
段１ｂの処理結果で出力される各英文字・カタカナ対応
データの発生頻度を、１組単位(unigram)および連続し
た組単位(bigram)で、図６および図７の文字列bigram頻
度テーブル２ｅ、文字列unigram頻度テーブル２ｆで示
すようにして記録する。尚、本例では、６万単語につい
ての結果を記録した。

【００５２】英単語・カタカナ同時出現確率計算手段２
ｂでは、これらの文字列bigram頻度テーブル２ｅ、文字
列unigram頻度テーブル２ｆを参照して、入力された任
意の英単語に最適なカタカナ読みを振る。以下、その詳
細を説明する。

【００５３】英単語に最適なカタカナ読みを振るという
ことは、英単語の文字列Ｃ＝ｃ₁…ｃ_nに対応するカタカ
ナの文字列Ｑ＝ｑ₁…ｑ_nとの同時出現確率Ｐ（Ｃ，Ｑ）
を最大にするようなカタカナを求めるということであ
る。尚、ここでのｃ_k，ｑ_kは、１文字を表すのではな
く、１文字以上の文字列を表す。

【００５４】本例では、同時出現確率をマルコフモデル
で近似する。即ち、同時出現確率Ｐ（Ｃ，Ｑ）を、文字
列bigramと確率Ｐ（ｃ_i，ｑ_i｜ｃ_i-1，ｑ_i-1）の積とし
て次式（数３）で表す。

【００５５】

【数３】

【００５６】Ｐ（ｃ_i，ｑ_i｜ｃ_i-1，ｑ_i-1）の値は、文
字列bigram頻度を、先行する文字列のunigram頻度で割
ることによって与えられる。すなわち頻度をＣ（＊）で
表すと、次の式（数４）となる。

【００５７】

【数４】

【００５８】例えば、図６の文字列bigram頻度テーブル
２ｅに示すように、「tio，ショ」および「n，ン」の文
字列bigram頻度が「１５７２」で、図７の文字列unigra
m頻度テーブル２ｆに示すように、「tio，ショ」の文字
列unigram頻度が「２５３７」ならば、Ｐ（n，ン｜ti
o，ショ）＝１５７２／２５３７＝０．６１９６２…で
ある。

【００５９】実際のカタカナ音訳処理では、各英文字列
に対するカタカナ候補を文字列unigram頻度テーブル２
ｆから列挙し、各候補について文字列bigram確率を計算
する。この結果に基づき、単語全体の確率が最大となる
文字列の組み合わせを選択し、最適なカタカナ音訳を求
める。

【００６０】このように、本例の技術では、文字列単位
で音訳をしているので、単語単位ではカタカナ音訳がわ
からない英単語であっても、連続する２つの文字列につ
いて文字列bigram確率が与えられれば、単語全体にカタ
カナ音訳が行える。

【００６１】ところで、連続する２つの文字列につい
て、一度でも文字列bigram確率Ｐ（ｃ _i，ｑ_i｜ｃ_i-1，
ｑ_i-1）＝０になると、単語全体の確率Ｐ（Ｃ，Ｑ）＝
０となる。実際にも、文字列bigram頻度データが不足す
るために、このような現象はよくある。

【００６２】このような文字列bigram頻度データの不足
を補うために、線形補間を用いた平滑化を行う。これ
は、文字列bigram確率Ｐ（ｃ_i，ｑ_i｜ｃ_i-1，ｑ_i-1）を
次式（数５）のように線形補間する手続きである。

【００６３】

【数５】

【００６４】ここで、Ｐ（ｃ_i，ｑ_i）は文字列unigram
確率であり、文字列bigram確率を、より低次のngram確
率で補間するための項である。また、「λ」は重み係数
であり、線形補間法により自動的に設定できる。

【００６５】以上のようにして、英単語の語頭から語尾
まで、全ての連続する文字列bigram確率を計算し、英単
語とカタカナの同時出現確率が最大となるカタカナを求
める。その結果、図８の英単語カタカナ音訳の結果表８
１に示すように、英単語に対するカタカナ音訳と、その
対数確率値が得られる。

【００６６】この図８においては、「station」につい
ての読みが、「英文字列／カタカナ」の形で、対数確率
値と共に３つ表されている。すなわち、音訳結果は対数
確率値の高い順に「ステーション」、「ステイショ
ン」、「スタション」となり、尤らしい音訳が行えてい
ることがわかる。

【００６７】尚、この対数確率値は、上述の「数３」式
の対数をとったものであり、積を和に表わすことによ
り、演算（プログラム作成）が容易になる。また、確率
値は極めて小さい（１０^-6オーダー）が、対数をとるこ
とにより、その比較を容易とすることができる。

【００６８】また、本例では、文字列の対応は「１：
１」〜「４：４」までの対応としている。これにより、
例えば、「１：１」〜「５：５」とした場合に「phylo
／フィロソ」、「sopy／フィー」との結果が出力される
といった不適切なデータの生成を防ぐことができる。

【００６９】また、本例では、フィードバック手段１ｄ
により、最小距離対応付け探索手段１ｂで求めた英文字
・カタカナ対応データを英文字カタカナ読みテーブル１
ｃに記憶させている。これにより、英文字カタカナ読み
テーブル１ｃにおけるデータを容易に増やすことができ
る。

【００７０】以上、図１〜図９を用いて説明したよう
に、本例のアルファベット・日本語読み対応付け装置と
方法およびアルファベット音訳装置と方法では、まず、
アルファベット・日本語読み対応付け装置および方法に
おいて、英単語・カタカナ対応データの対を入力とし、
要素間距離計算手段１ａにより、英文字とカタカナの任
意の部分文字列間の要素間距離を計算し、最小距離対応
付け探索手段１ｂにより、要素間距離の総和が最小とな
る対応付け経路を探索してアルファベット・カタカナ対
応データを作成することにより、英文字とカタカナの対
応付けを自動的に処理できる。

【００７１】そして、英単語カタカナ音訳装置および方
法において、このアルファベット・カタカナ対応データ
を用いて、音訳モデル作成手段２ａにより、音訳モデル
(文字列unigram頻度テーブル２ｆ、文字列bigram頻度２
ｅ)を作成し、英単語の入力に対して、英単語・カタカ
ナ同時出現確率計算手段２ｂにより、音訳モデルに基づ
いて英単語とカタカナの同時出現確率を計算し、最大確
率経路探索手段２ｃにより、最も確率の高い経路を探索
してカタカナ音訳結果を出力することにより、任意の英
単語について最適なカタカナ音訳を行うことができる。

【００７２】このようにして、英単語（アルファベット
単語）のカタカナ読み（日本語読み）への高精度な変換
を、簡易かつ低コストで行うことができる。

【００７３】尚、本発明は、図１〜図９を用いて説明し
た例に限定されるものではなく、その要旨を逸脱しない
範囲において種々変更可能である。例えば、本例では、
英語を音訳対象の言語として用いて説明しているが、ド
イツ語やフランス語等の他のアルファベットを用いた言
語に対しても適用することができる。

【００７４】また、本例では、本発明に係わる処理プロ
グラムを記録する記録媒体として光ディスクを用いてい
るが、ＦＤ（Flexible Disk）等の磁気ディスクを用い
て良い。また、その処理プログラムのインストールに関
しても、ネットワークを介してダウンロードすることで
も良い。

【００７５】

【発明の効果】本発明によれば、従来の単語単位で読み
を辞書に登録する技術のように、辞書作成・維持にコス
トがかかると共に未知語には読みが振れないといった問
題点や、従来の単語表記から発音記号を経由して読みを
生成する技術のように、英語と日本語の発音に違いがあ
るため困難が多いといった問題点、さらには、従来の単
語表記から直接読みを生成する技術にように、人手によ
る規則の設定を必要とするため設定基準に理論的根拠が
なくコストがかかるといった問題点を解決でき、英語等
のアルファベット単語の日本語読み（カタカナ音訳等）
への高精度な変換を、簡易かつ低コストで行うことがで
き、さらに未知語等の任意の単語に対しても行うことが
可能となり、アルファベット単語の日本語読みへの変換
を行うシステムの性能の向上を図ることができる。

【図面の簡単な説明】

【図１】本発明のアルファベット・日本語読み対応付け
装置とアルファベット単語音訳装置の本発明に係る構成
の一例を示すブロック図である。

【図２】本発明のアルファベット・日本語読み対応付け
方法とアルファベット単語音訳方法の本発明に係る処理
動作の一例を示すフローチャートである。

【図３】図１における要素間距離計算手段で参照する英
文字カタカナ読みテーブルの構成例を示す説明図であ
る。

【図４】図１における最少距離対応付け探索手段による
英文字・カタカナの対応付け結果表の構成例を示す説明
図である。

【図５】図１における要素間距離計算手段による要素間
距離の計算結果例を示す説明図である。

【図６】図１における文字列bigram頻度テーブルの構成
例を示す説明図である。

【図７】図１における文字列unigram頻度テーブルの構
成例を示す説明図である。

【図８】図１における最大確率経路探索手段により出力
される英単語カタカナ音訳の結果表例を示す説明図であ
る。

【図９】図１および図２における本発明のアルファベッ
ト・日本語読み対応付け装置と方法およびアルファベッ
ト単語音訳装置と方法を実現するためのコンピュータシ
ステムのハードウェア構成の一例を示すブロック図であ
る。

【符号の説明】

１：アルファベット・日本語読み対応付け装置(「英文
字・カタカナ対応付け装置」)、１ａ：要素間距離計算手
段、１ｂ：最小距離対応付け探索手段、１ｃ：英文字カ
タカナ読みテーブル、１ｄ：フィードバック手段、２：
アルファベット単語音訳装置(「英単語カタカナ音訳装
置」)、２ａ：音訳モデル作成手段、２ｂ：英単語・カ
タカナ同時出現確率計算手段、２ｃ：最大確率経路探索
手段、２ｄ：文字列ngram頻度テーブル、２ｅ：文字列b
igram頻度テーブル、２ｆ：文字列unigram頻度テーブ
ル、４１：英文字・カタカナの対応付け結果表、８１：
英単語カタカナ音訳の結果表、９１：表示装置、９２：
入力装置、９３：外部記憶装置、９４：情報処理装置、
９５：光ディスク、９６：駆動装置。

Claims

【特許請求の範囲】

【請求項１】対で入力されたアルファベット単語と該
アルファベット単語の日本語読みとに基づき、上記アル
ファベット単語を構成する文字列と該文字列に対する日
本語読みとを対応付けたデータを生成するアルファベッ
ト文字・日本語読み対応付け装置であって、予め対で入
力されたアルファベット文字列と該アルファベット文字
列の１以上の日本語読みとを対応付けて記憶する記憶手
段と、上記アルファベット単語と該アルファベット単語
の日本語読みとの対が入力されると、該アルファベット
単語を構成する文字列と上記日本語読みを構成する文字
列の全ての組合せの部分文字列間について、上記記憶手
段で記憶した対応付けを接続コストＭ（Ｍ≧０）、上記
記憶手段で記憶していない対応付けを接続コストＮ（Ｎ
＞Ｍ）とした要素間距離の計算を行う要素間距離計算手
段と、該要素間距離計算手段で計算した部分文字列間の
要素間距離の語頭から語尾までの総和が最少になる対応
付けを求める対応付け探索手段とを有することを特徴と
するアルファベット文字・日本語読み対応付け装置。
【請求項２】請求項１に記載のアルファベット文字・
日本語読み対応付け装置であって、上記記憶手段で予め
記憶するアルファベット文字列の長さ、および、上記要
素間距離計算手段で要素間距離を計算するアルファベッ
トの部分文字列の長さを４文字以内とすることを特徴と
するアルファベット文字・日本語読み対応付け装置。
【請求項３】入力されたアルファベット単語の日本語
読みを出力するアルファベット単語音訳装置であって、
対で入力されたアルファベット単語と該アルファベット
単語の日本語読みとに基づき、上記アルファベット単語
を構成する文字列と該文字列に対する日本語読みとを対
応付けたデータ（アルファベット文字・日本語読み対応
データ）を生成するアルファベット文字・日本語読み対
応付け手段と、該アルファベット文字・日本語読み対応
付け手段で生成した各アルファベット文字・日本語読み
対応データの生成頻度（文字列unigram頻度）を記憶す
る文字列unigram頻度記憶手段と、上記アルファベット
文字・日本語読み対応付け手段により隣り合って生成さ
れる二つのアルファベット文字・日本語読み対応データ
の組の生成頻度（文字列bigram頻度）を記憶する文字列
bigram頻度記憶手段と、上記文字列unigram頻度と上記
文字列bigram頻度に基づき、入力されたアルファベット
単語を構成する全ての文字列と該文字列に対応する日本
語読みの文字列との同時出現確率を計算する同時出現確
率計算手段と、該同時出現確率計算手段で計算した同時
出現確率を最大にする上記日本語読みの文字列の組合せ
を求める最大確率経路探索手段とを有し、該最大確率経
路探索手段で求めた組合せの日本語読みを上記入力され
たアルファベット単語の日本語読みとして出力すること
を特徴とする英単語カタカナ音訳装置。
【請求項４】請求項３に記載のアルファベット単語音
訳装置であって、上記アルファベット文字・日本語読み
対応付け手段は、予め対で入力されたアルファベット文
字列と該アルファベット文字列の１以上の日本語読みと
を対応付けて記憶する記憶手段と、上記アルファベット
単語と該アルファベット単語の日本語読みとの対が入力
されると、該アルファベット単語を構成する文字列と上
記日本語読みを構成する文字列の全ての組合せの部分文
字列間について、上記記憶手段で記憶した対応付けを接
続コストＭ（Ｍ≧０）、上記記憶手段で記憶していない
対応付けを接続コストＮ（Ｎ＞Ｍ）とした要素間距離の
計算を行う要素間距離計算手段と、該要素間距離計算手
段で計算した部分文字列間の要素間距離の語頭から語尾
までの総和が最少になる対応付けを求める対応付け探索
手段とを有することを特徴とするアルファベット単語音
訳装置。
【請求項５】対で入力されたアルファベット単語と該
アルファベット単語の日本語読みとに基づき、上記アル
ファベット単語を構成する文字列と該文字列に対する日
本語読みとを対応付けたデータを生成するコンピュータ
システムによるアルファベット文字・日本語読み対応付
け方法であって、予め対で入力されたアルファベット文
字列と該アルファベット文字列の１以上の日本語読みと
を対応付けて記憶装置に記憶する第1のステップと、上
記アルファベット単語と該アルファベット単語の日本語
読みとの対が入力されると、該アルファベット単語を構
成する文字列と上記日本語読みを構成する文字列の全て
の組合せの部分文字列間について、上記記憶装置に記憶
した対応付けを接続コストＭ（Ｍ≧０）、上記記憶装置
に記憶していない対応付けを接続コストＮ（Ｎ＞Ｍ）と
した要素間距離の計算を行う第２のステップと、該第２
のステップで計算した部分文字列間の要素間距離の語頭
から語尾までの総和が最少になる対応付けを求める第３
のステップとを有することを特徴とするアルファベット
文字・日本語読み対応付け方法。
【請求項６】請求項５に記載のアルファベット文字・
日本語読み対応付け方法であって、上記第３のステップ
で求めた文字列の対応付け結果を、上記記憶装置に記憶
することを特徴とするアルファベット文字・日本語読み
対応付け方法。
【請求項７】入力されたアルファベット単語の日本語
読みを出力するコンピュータシステムによるアルファベ
ット単語音訳方法であって、対で入力されたアルファベ
ット単語と該アルファベット単語の日本語読みとに基づ
き、上記アルファベット単語を構成する文字列と該文字
列に対する日本語読みとを対応付けたデータ（アルファ
ベット文字・日本語読み対応データ）を生成する第１の
ステップと、該第１のステップで生成した各アルファベ
ット文字・日本語読み対応データの生成頻度（文字列un
igram頻度）を第１の記憶装置に記憶する第２のステッ
プと、上記第１のステップで隣り合って生成される二つ
のアルファベット文字・日本語読み対応データの組の生
成頻度（文字列bigram頻度）を第２の記憶装置に記憶す
る第３のステップと、上記文字列unigram頻度と上記文
字列bigram頻度に基づき、入力されたアルファベット単
語を構成する全ての文字列と該文字列に対応する日本語
読みの文字列との同時出現確率を計算する第４のステッ
プと、該第４のステップで計算した同時出現確率を最大
にする上記日本語読みの文字列の組合せを求める第５の
ステップとを有し、上記第５のステップで求めた組合せ
の日本語読みを上記入力されたアルファベット単語の日
本語読みとして出力することを特徴とするアルファベッ
ト単語音訳方法。
【請求項８】請求項７に記載のアルファベット単語音
訳方法であって、上記第１のステップは、予め対で入力
されたアルファベット文字列と該アルファベット文字列
の１以上の日本語読みとを対応付けて第３の記憶装置に
記憶するステップＡと、上記アルファベット単語と該ア
ルファベット単語の日本語読みとの対が入力されると、
該アルファベット単語を構成する文字列と上記日本語読
みを構成する文字列の全ての組合せの部分文字列間につ
いて、上記第３の記憶装置に記憶した対応付けを接続コ
ストＭ（Ｍ≧０）、上記第３の記憶装置に記憶していな
い対応付けを接続コストＮ（Ｎ＞Ｍ）とした要素間距離
の計算を行うステップＢと、該ステップＢで計算した部
分文字列間の要素間距離の語頭から語尾までの総和が最
少になる対応付けを求めるステップＣとを有することを
特徴とするアルファベット単語音訳方法。
【請求項９】請求項８に記載のアルファベット単語音
訳方法であって、上記第３の記憶装置で予め記憶するア
ルファベット文字列の長さ、および、上記ステップＢで
要素間距離を計算するアルファベットの部分文字列の長
さを４文字以内とすることを特徴とするアルファベット
単語音訳方法。
【請求項１０】請求項７から請求項９のいずれかに記
載のアルファベット単語音訳方法であって、上記第４の
ステップは、上記入力されたアルファベット単語を構成
する全ての文字列に対して、上記文字列bigram頻度を、
該文字列bigram頻度が付与された上記アルファベット文
字・日本語読み対応データ組の内の先行する文字列の上
記文字列unigram頻度で割って文字列bigram確率を求
め、求めた各文字列bigram確率の積を求めて上記同時出
現確率を計算するステップを有することを特徴とするア
ルファベット単語音訳方法。
【請求項１１】請求項７から請求項１０のいずれかに
記載のアルファベット単語音訳方法であって、上記記憶
装置に上記文字列bigram頻度が記憶されておらず上記第
４のステップで求める上記文字列bigram確率が０となる
場合には、平滑化を行い当該文字列bigram確率を求める
ステップを有することを特徴とするアルファベット単語
音訳方法。
【請求項１２】入力されたアルファベット単語の日本
語読みを出力するコンピュータシステムによるアルファ
ベット単語音訳方法の処理手順プログラムを記録する記
録媒体であって、請求項７から請求項１１のいずれかに
記載のアルファベット単語音訳方法での各ステップを、
上記コンピュータシステムに実行させるためのプログラ
ムを記録したことを特徴とする記録媒体。