JP2001142877A - アルファベット文字・日本語読み対応付け装置と方法およびアルファベット単語音訳装置と方法ならびにその処理プログラムを記録した記録媒体 - Google Patents

アルファベット文字・日本語読み対応付け装置と方法およびアルファベット単語音訳装置と方法ならびにその処理プログラムを記録した記録媒体

Info

Publication number
JP2001142877A
JP2001142877A JP32489299A JP32489299A JP2001142877A JP 2001142877 A JP2001142877 A JP 2001142877A JP 32489299 A JP32489299 A JP 32489299A JP 32489299 A JP32489299 A JP 32489299A JP 2001142877 A JP2001142877 A JP 2001142877A
Authority
JP
Japan
Prior art keywords
character string
alphabet
word
japanese
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP32489299A
Other languages
English (en)
Other versions
JP4084515B2 (ja
Inventor
Kuniko Moriwaki
邦子 森脇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP32489299A priority Critical patent/JP4084515B2/ja
Publication of JP2001142877A publication Critical patent/JP2001142877A/ja
Application granted granted Critical
Publication of JP4084515B2 publication Critical patent/JP4084515B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 従来は、英語等のアルファベット単語の日本
語読みへの高精度な変換を任意の単語に対して簡易かつ
低コストで行うことができない。 【解決手段】 本発明のアルファベット・日本語読み対
応付け装置1は、例えば英単語とカタカナの任意の部分
文字列間について要素間距離を計算する手段1aと最小
距離対応付けを探索する手段1bとを備え、英文字とカ
タカナの対応付けを自動的に処理できる。また、本発明
の英単語カタカナ音訳装置2は、アルファベット・日本
語読み対応付け装置1で生成された英文字とカタカナ対
応データから音訳モデルを作成する手段2aと、その音
訳モデルに基づいて英単語とカタカナの同時出現確率を
計算する手段2bと、同時出現確率が最大となる経路を
探索する手段2cを備え、任意の英単語について最適な
カタカナ音訳を行うことができる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、テキスト自動読み
上げやディクテーション(口述筆記)など、コンピュー
タを用いた音声合成や音声認識等の言語処理技術に係
り、特に、英単語等のアルファベットからなる外来語に
対する日本語読み(カタカナ)への変換(音訳)を効率
的に行うに好適なアルファベット文字・日本語読み対応
付け装置と方法およびアルファベット単語音訳装置と方
法ならびにその処理プログラムを記録した記録媒体に関
するものである。
【0002】
【従来の技術】コンピュータを用いたテキスト自動読み
上げやディクテーションなどの音声合成・音声認識シス
テムにおいて、英単語に日本語読み(カタカナ音訳)を
振る技術の一般的なものに、英単語とそれに対応する日
本語読みを予め単語辞書に登録する従来技術(a)があ
る。しかし、多くの場合、英単語には複数の読みが存在
する。例えば、「body」は「バディー」や「ボディ
ー」あるいは「ボディ」など色々な読みがある。
【0003】また、人名、地名などの固有名詞は単語辞
書に登録されていないことが多いが、単語単位で読みが
登録されていないものは1文字ずつに分解してアルファ
べット読みを繋げてしまうため、従来技術(a)では全
く意味をなさない読みが振られてしまう。
【0004】このような問題に対処するためには、複数
のカタカナ読みや新しい固有名詞の読みなどを全て辞書
に登録する必要があり、その辞書の作成・維持に膨大な
コストがかかる。
【0005】この従来技術(a)のように予め読みを辞
書に登録するのではなく、英単語から自動的に読みを生
成する試みもある。例えば、英単語を一度英語の発音記
号に変換し、更にこれを日本語の読みへ変換する従来技
術(b)が、例えば、K. Knight and J. Graehl:“Mach
ine Transliteration”,Computational Linguistics,vo
l.24,No.4,pp.599-612(1998)に開示されている。しか
し、この従来技術(b)には、英語の発音と日本語の読
みが必ずしも一致しないという困難点がある。
【0006】また、英単語表記から直接日本語の読みに
変換する従来技術(c)が、例えば、塚田,増田:“英
単語に対する日本語読み付与方法の検討”,情報処理学
会第53回全国大会,2−359(平成8年後期)にお
いて提案されている。
【0007】これは、アルファべット部分列と日本語音
節の対応規則およびそれを補強する幾つかの規則(末尾
−e規則、接尾辞規則、促音挿入規則)を用いて英語表
記を直接日本語の読みに変換する技術である。
【0008】しかし、この従来技術(c)は、対応規則
や補強規則を全て人手で作成しなければならないので、
規則の設定に経験が必要とされ、理論的根拠に乏しく、
コストもかかるという問題点がある。
【0009】
【発明が解決しようとする課題】解決しようとする問題
点は、従来技術(a)の単語単位で読みを辞書に登録す
る技術では、辞書作成・維持にコストがかかり、また未
知語には読みが振れないといった点であり、従来技術
(b)の単語表記から発音記号を経由して読みを生成す
る技術では、英語と日本語の発音に違いがあるため困難
が多いといった点であり、さらに、従来技術(c)の単
語表記から直接読みを生成する技術では、人手による規
則の設定を必要とするため、設定基準に理論的根拠がな
く、コストがかかるといった点である。
【0010】本発明の目的は、これら従来技術の課題を
解決し、英語等のアルファベット単語の日本語読み(カ
タカナ音訳等)への高精度な変換を、簡易かつ低コスト
で、さらに未知語等の任意の単語に対しても行うことを
可能とするアルファベット文字・日本語読み対応付け装
置と方法およびアルファベット単語音訳装置と方法なら
びにその処理プログラムを記録した記録媒体を提供する
ことである。
【0011】
【課題を解決するための手段】上記目的を達成するた
め、本発明のアルファベット・日本語読み対応付け装置
と方法は、対で入力されたアルファベット単語と、この
アルファベット単語の日本語読みとから、アルファベッ
ト単語を構成する文字列と、この文字列に対する日本語
読みとを対応付けたデータを生成するものであり、ま
ず、予め対で入力されたアルファベット文字列とこのア
ルファベット文字列の1以上の日本語読みとを対応付け
て記憶装置に記憶しておく。そして、アルファベット単
語と、このアルファベット単語の日本語読みとの対が入
力されると、要素間距離計算手段により、このアルファ
ベット単語を構成する文字列と日本語読みを構成する文
字列の全ての組合せの部分文字列間について要素間距離
の計算を行う。この際、記憶装置で記憶した対応付けを
例えば接続コスト0それ以外を接続コスト1として要素
間距離の計算を行う。そして、対応付け探索手段によ
り、計算した部分文字列間の要素間距離の語頭から語尾
までの総和が最少になる対応付けを求める。このように
して、対で入力されたアルファベット単語と、このアル
ファベット単語の日本語読みとから、アルファベット単
語を構成する文字列と、この文字列に対する日本語読み
とを対応付けた大量のデータを容易に生成することがで
きる。
【0012】また、本発明のアルファベット単語音訳装
置と方法は、上述のアルファベット・日本語読み対応付
け装置で生成されたアルファベット文字列とその日本語
読みとを対応付けた大量のデータを用いて、入力された
アルファベット単語を構成する文字列とその日本語読み
との文字列ngram(複数要素の連鎖)頻度を計算し、こ
の統計情報を用いた音訳モデル(日本語のカナ文字およ
びその連鎖の出現頻度の集合からなるモデル)に基づい
て、入力されたアルファベット単語の日本語読みを特定
する。
【0013】
【発明の実施の形態】以下、本発明の実施の形態を、図
面により詳細に説明する。図1は、本発明のアルファベ
ット・日本語読み対応付け装置とアルファベット単語音
訳装置の本発明に係る構成の一例を示すブロック図であ
り、図2は、本発明のアルファベット・日本語読み対応
付け方法とアルファベット単語音訳方法の本発明に係る
処理動作の一例を示すフローチャート、図9は、図1お
よび図2における本発明のアルファベット・日本語読み
対応付け装置と方法およびアルファベット単語音訳装置
と方法を実現するためのコンピュータシステムのハード
ウェア構成の一例を示すブロック図である。
【0014】図9において、91はCRT(Cathode Ra
y Tube)やLCD(Liquid CrystalDisplay)等からな
る表示装置、92はキーボードやマウス等からなる入力
装置、93はハードディスクドライブ等からなる外部記
憶装置、94はCPU(Central Processing Unit)や
主メモリ等を有し蓄積プログラム方式によるコンピュー
タ処理を行なう情報処理装置、95は本発明に係る処理
プログラムやデータ等を記録した光ディスク、96は光
ディスク95の読み取り動作を行なう駆動装置である。
【0015】光ディスク95に記録された処理プログラ
ムやデータをインストールして主メモリに読み込むこと
により、情報処理装置94内に、図1に示すアルファベ
ット・日本語読み対応付け装置やアルファベット単語音
訳装置の本発明に係る機能が実装される。
【0016】以下、図1を用いて本発明に係るアルファ
ベット・日本語読み対応付け装置とアルファベット単語
音訳装置の構成を説明する。図1において、1はアルフ
ァベット・日本語読み対応付け装置(図中、「英文字・カ
タカナ対応付け装置」と記載)、2はアルファベット単
語音訳装置(図中、「英単語カタカナ音訳装置」と記載)
である。
【0017】本例のアルファベット音訳装置2は、英単
語からカタカナ読みを作成し、また、本例のアルファベ
ット・日本語読み対応付け装置1は、このアルファベッ
ト音訳装置2で用いる音訳モデルを作成するために必要
となる英文字・カタカナ対応データを作成する。
【0018】すなわち、アルファベット・日本語読み対
応付け装置1は、入力された英単語とその日本語読みで
あるカタカナとを文字列単位で自動的に対応付ける装置
であり、要素間距離計算手段1aと、最小距離対応付け
探索手段1b、英文字カタカナ読みテーブル1c、およ
び、フィードバック手段1dとを有する。
【0019】英文字カタカナ読みテーブル1cには、予
め対で入力された英文字列とそのカタカナ読みの候補
(複数可)が格納されており、要素間距離計算手段1a
は、入力された英単語・カタカナ対応データの、任意の
部分文字列間について、その英文字カタカナ読みテーブ
ル1cを参照し、予め設定された関数を用いて要素間距
離を計算する。
【0020】そして、最小距離対応付け探索手段1b
は、動的計画法を用いて、要素間距離計算手段1aで計
算した文字列の要素間距離の総和が最小となる経路を探
索し、その時の英文字とカタカナの対応付け(英文字・
カタカナ対応データ)を1組出力する。
【0021】さらに、フィードバック手段1dは、最小
距離対応付け探索手段1bで求めた英文字・カタカナ対
応データを英文字カタカナ読みテーブル1cに記憶させ
る。
【0022】また、アルファベット音訳装置2は、英単
語に対してカタカナ音訳をする装置であって、音訳モデ
ル作成手段2aと、英単語・カタカナ同時出現確率計算
手段2b、最大確率経路探索手段2c、および、音訳モ
デルとしての文字列ngram頻度テーブル2dを有する。
【0023】音訳モデル作成手段2aは、アルファベッ
ト・日本語読み対応付け装置1によって生成されたアル
ファベット・カタカナ対応データから、英単語とそのカ
タカナの同時出現確率を求めて音訳するための確率モデ
ル(音訳モデル)である文字列ngram頻度テーブル2d
を生成する。
【0024】この文字列ngram頻度テーブル2d(音訳
モデル)には、図6,7で具体例を示す文字列bigram頻
度テーブル2eと文字列unigram頻度テーブル2fが格
納されており、同時出現確率計算手段2bは、文字列un
igram頻度テーブル2fから、入力された英単語内の英
文字列に対するカタカナ文字列候補を複数列挙し、文字
列bigram頻度テーブル2eに基づいて、入力された英単
語に対するカタカナの同時出現確率を計算する。
【0025】最大確率経路探索手段2cは、複数の候補
の中から、英単語・カタカナ同時出現確率計算手段2b
で計算した同時出現確率を最大にする経路を探索し、そ
の結果をカタカナ音訳結果として出力する。
【0026】以下、このような構成のアルファベット・
日本語読み対応付け装置1とアルファベット音訳装置2
の動作を、図2に基づき説明する。
【0027】図2において、ステップ201,202が
図1のアルファベット・日本語読み対応付け装置1の処
理、ステップ203〜204が図1のアルファベット単
語音訳装置2の処理である。
【0028】まず、アルファベット・日本語読み対応付
け装置1では、英単語とそのカタカナ読みとが対で入力
されると、要素間距離計算手段1aにより、その英単語
・カタカナ対応データを入力として、英文字カタカナ読
みテーブル1cを参照し、英文字とカタカナの任意の部
分文字列間の要素間距離を計算する(ステップ20
1)。
【0029】そして、最小距離対応付け探索手段1bに
より、その要素間距離の総和が最小となる対応付け経路
を探索してアルファベット・カタカナ対応データを作成
する(ステップ202)。
【0030】続いて、アルファベット音訳装置2では、
アルファベット・日本語読み対応付け装置1で作成され
たアルファベット・カタカナ対応データを用いて、音訳
モデル作成手段2aにより、音訳モデル(文字列ngram
頻度テーブル2d)を作成する(ステップ203)。
【0031】その後、任意の英単語が入力されると、そ
の英単語の入力に対して、英単語・カタカナ同時出現確
率計算手段2bにより、音訳モデル(文字列ngram頻度
テーブル2d)に基づいて英単語とカタカナの同時出現
確率を計算する(ステップ204)。そして、最大確率
経路探索手段2cにより、最も確率の高い経路を探索し
てカタカナ音訳結果を出力する(ステップ205)。
【0032】このようにして、アルファベット・日本語
読み対応付け装置1において、対で入力された英単語・
カタカナ対応データから自動的に文字列単位で対応付け
たカタカナ読みデータを作成し、そして、この文字列単
位で対応付けたデータから作成した音訳モデルに基づい
て、アルファベット音訳装置2において、任意に入力さ
れた英単語に対してカタカナ音訳を行う。
【0033】次に、図3〜図8に基づき、具体的な例を
用いて、アルファベット・日本語読み対応付け装置1と
アルファベット音訳装置2の動作等に関して、要素間距
離計算と最小距離対応付け探索、および、音訳モデルの
順に説明する。
【0034】尚、以下に説明する技術は、例えば、北研
二・中村哲・永田昌明 著:“音声言語処理”(森北出
版株式会社発行、1996年)の第27頁〜第30頁、
第63頁〜第69頁、第82頁〜第87頁等に記載の形
態素解析技術に基づくものである。
【0035】図3は、図1における要素間距離計算手段
で参照する英文字カタカナ読みテーブルの構成例を示す
説明図、図4は、図1における最少距離対応付け探索手
段による英文字・カタカナの対応付け結果表の構成例を
示す説明図、図5は、図1における要素間距離計算手段
による要素間距離の計算結果例を示す説明図、図6は、
図1における文字列bigram頻度テーブルの構成例を示す
説明図、図7は、図1における文字列unigram頻度テー
ブルの構成例を示す説明図、そして、図8は、図1にお
ける最大確率経路探索手段により出力される英単語カタ
カナ音訳の結果表例を示す説明図である。
【0036】まず、要素間距離計算と最小距離対応付け
探索について説明する。英単語とカタカナを対応付ける
というのは、例えば「station/ステーション」という
単語単位の対応データを「s/ス」、「ta/テー」、「t
io/ショ」、「n/ン」というように、文字列単位で対応
付けを行うことである。尚、文字列単位は原則として日
本語発音の単位にする。
【0037】英単語を構成する文字列X=x1x2…xnと、
その読みであるカタカナを構成する文字列Y=y1y2…ym
を対応付ける時は、各要素間の距離を定義し、距離の和
が最小となるような対応付けを求めれば良い。文字列の
対応は「s/ス」の「1:1」から、「tio/ショ」の
「3:2」等の「s/t(s,t>1)」まで多数あ
る。本例では「1:1」〜「4:4」までの対応とす
る。
【0038】英単語の要素x1からxiまでと、カタカナの
要素y1からyjまでの距離をd(i,j)とする。英文字列と
カタカナ列が「s:t」に対応している時、すなわち英
文字xi-s+1…xiと、カタカナyj-t+1…yjが対応している
時、その要素間距離をcost(xi-s+1…xi,yj-t+1…yj)と
すると次の式(数1)で表される。
【0039】
【数1】
【0040】各地点(i,j)で「1:1」〜「4:4」の
対応について要素間距離cost(xi-s+1…xi,yj-t+1…yj)
の計算を行い、語頭からの距離d(i,j)を求める。
【0041】求めた距離d(i,j)の最小値と、そのとき
の対応「s:t」の値から,直前の地点(i−s,j−
t)を記憶しておく。語尾まで至ったら、記憶された直
前の地点を順に巡り、最小距離となる対応付けを求め
る。要素間距離の値は、英文字カタカナ読みテーブルを
用いて以下の式(数2)から求められる。
【0042】
【数2】
【0043】この他の対応として、以下のように1文字
挿入と1文字削除も考える。1文字挿入は、英文字列と
カタカナが「0:1」に対応し、1文字削除は「1:
0」に対応する。このときの要素間距離は常に「1」で
ある。
【0044】図3に示す英文字カタカナ読みテーブル1
cは、予め作成した対応付け規則であり、本例では約1
30項目の英文字列について設定した。これは、アルフ
ァべットの子音と母音の組み合わせ(ka,ki,ku,ke,ko,
…)に対する読みと、全てのアルファべット1文字(a,
b,c,…)に対する読みの候補を機械的に幾つか列挙した
ものである。
【0045】図4に示す英文字・カタカナの対応付け結
果表41において、1行目が、入力された英単語・カタ
カナ対応データであり、「英単語/カタカナ」で表され
る。また、2行目以降が対応付けの結果であり、「英文
字/カタカナ」で表される。
【0046】図5に示す要素間距離を説明する図では、
矢印が「s:t」の対応を示し、そして矢印に添えてあ
る数字が、その対応の要素間距離である。いくつかの対
応例を示しており、この例では図3の英文字カタカナ読
みテーブル1cの項目にある「lo/ロ」と「so/ソ」の
対応のみが要素間距離「0」となるが、それ以外の対
応、例えば、「i/フィ」と「op/ィ」等では全て
「1」になる。
【0047】従って、語頭から語尾までの要素間距離の
和が最小となるには、「phy/フィ」と「phy/フィー」
の対応を経由する場合で、その距離は、「1+0+0+
1=2」となる。語頭から語尾までの全ての対応付けに
ついて総当りで検討し、最小距離となる対応付けの経路
(矢印の組み合わせ)を求める。
【0048】以上の例からも分かるように、本例の図1
に示す英文字・カタカナ対応付け装置1では、図3の英
文字カタカナ読みテーブル1cに項目が存在しないもの
が含まれる場合でも、前後に正確な対応付けができる要
素があるために、全体として正しく対応付けができる。
【0049】このように、元となる英文字カタカナ読み
テーブル1cが、全ての対応を網羅していなくても、新
しい対応付けを行える点がこの英文字・カタカナ対応付
け装置1の優れた点である。
【0050】次に、図1におけるアルファベット音訳装
置2の音訳モデル作成手段2aで生成し、英単語・カタ
カナ同時出現確率計算手段2bで参照する音訳モデル
(文字列bigram頻度テーブル2e、文字列unigram頻度
テーブル2f)について説明する。
【0051】図1の音訳モデル作成手段2aでは、英文
字・カタカナ対応付け装置1の最少距離対応付け探索手
段1bの処理結果で出力される各英文字・カタカナ対応
データの発生頻度を、1組単位(unigram)および連続し
た組単位(bigram)で、図6および図7の文字列bigram頻
度テーブル2e、文字列unigram頻度テーブル2fで示
すようにして記録する。尚、本例では、6万単語につい
ての結果を記録した。
【0052】英単語・カタカナ同時出現確率計算手段2
bでは、これらの文字列bigram頻度テーブル2e、文字
列unigram頻度テーブル2fを参照して、入力された任
意の英単語に最適なカタカナ読みを振る。以下、その詳
細を説明する。
【0053】英単語に最適なカタカナ読みを振るという
ことは、英単語の文字列C=c1…cnに対応するカタカ
ナの文字列Q=q1…qnとの同時出現確率P(C,Q)
を最大にするようなカタカナを求めるということであ
る。尚、ここでのck,qkは、1文字を表すのではな
く、1文字以上の文字列を表す。
【0054】本例では、同時出現確率をマルコフモデル
で近似する。即ち、同時出現確率P(C,Q)を、文字
列bigramと確率P(ci,qi|ci-1,qi-1)の積とし
て次式(数3)で表す。
【0055】
【数3】
【0056】P(ci,qi|ci-1,qi-1)の値は、文
字列bigram頻度を、先行する文字列のunigram頻度で割
ることによって与えられる。すなわち頻度をC(*)で
表すと、次の式(数4)となる。
【0057】
【数4】
【0058】例えば、図6の文字列bigram頻度テーブル
2eに示すように、「tio,ショ」および「n,ン」の文
字列bigram頻度が「1572」で、図7の文字列unigra
m頻度テーブル2fに示すように、「tio,ショ」の文字
列unigram頻度が「2537」ならば、P(n,ン|ti
o,ショ)=1572/2537=0.61962…で
ある。
【0059】実際のカタカナ音訳処理では、各英文字列
に対するカタカナ候補を文字列unigram頻度テーブル2
fから列挙し、各候補について文字列bigram確率を計算
する。この結果に基づき、単語全体の確率が最大となる
文字列の組み合わせを選択し、最適なカタカナ音訳を求
める。
【0060】このように、本例の技術では、文字列単位
で音訳をしているので、単語単位ではカタカナ音訳がわ
からない英単語であっても、連続する2つの文字列につ
いて文字列bigram確率が与えられれば、単語全体にカタ
カナ音訳が行える。
【0061】ところで、連続する2つの文字列につい
て、一度でも文字列bigram確率P(c i,qi|ci-1
i-1)=0になると、単語全体の確率P(C,Q)=
0となる。実際にも、文字列bigram頻度データが不足す
るために、このような現象はよくある。
【0062】このような文字列bigram頻度データの不足
を補うために、線形補間を用いた平滑化を行う。これ
は、文字列bigram確率P(ci,qi|ci-1,qi-1)を
次式(数5)のように線形補間する手続きである。
【0063】
【数5】
【0064】ここで、P(ci,qi)は文字列unigram
確率であり、文字列bigram確率を、より低次のngram確
率で補間するための項である。また、「λ」は重み係数
であり、線形補間法により自動的に設定できる。
【0065】以上のようにして、英単語の語頭から語尾
まで、全ての連続する文字列bigram確率を計算し、英単
語とカタカナの同時出現確率が最大となるカタカナを求
める。その結果、図8の英単語カタカナ音訳の結果表8
1に示すように、英単語に対するカタカナ音訳と、その
対数確率値が得られる。
【0066】この図8においては、「station」につい
ての読みが、「英文字列/カタカナ」の形で、対数確率
値と共に3つ表されている。すなわち、音訳結果は対数
確率値の高い順に「ステーション」、「ステイショ
ン」、「スタション」となり、尤らしい音訳が行えてい
ることがわかる。
【0067】尚、この対数確率値は、上述の「数3」式
の対数をとったものであり、積を和に表わすことによ
り、演算(プログラム作成)が容易になる。また、確率
値は極めて小さい(10-6オーダー)が、対数をとるこ
とにより、その比較を容易とすることができる。
【0068】また、本例では、文字列の対応は「1:
1」〜「4:4」までの対応としている。これにより、
例えば、「1:1」〜「5:5」とした場合に「phylo
/フィロソ」、「sopy/フィー」との結果が出力される
といった不適切なデータの生成を防ぐことができる。
【0069】また、本例では、フィードバック手段1d
により、最小距離対応付け探索手段1bで求めた英文字
・カタカナ対応データを英文字カタカナ読みテーブル1
cに記憶させている。これにより、英文字カタカナ読み
テーブル1cにおけるデータを容易に増やすことができ
る。
【0070】以上、図1〜図9を用いて説明したよう
に、本例のアルファベット・日本語読み対応付け装置と
方法およびアルファベット音訳装置と方法では、まず、
アルファベット・日本語読み対応付け装置および方法に
おいて、英単語・カタカナ対応データの対を入力とし、
要素間距離計算手段1aにより、英文字とカタカナの任
意の部分文字列間の要素間距離を計算し、最小距離対応
付け探索手段1bにより、要素間距離の総和が最小とな
る対応付け経路を探索してアルファベット・カタカナ対
応データを作成することにより、英文字とカタカナの対
応付けを自動的に処理できる。
【0071】そして、英単語カタカナ音訳装置および方
法において、このアルファベット・カタカナ対応データ
を用いて、音訳モデル作成手段2aにより、音訳モデル
(文字列unigram頻度テーブル2f、文字列bigram頻度2
e)を作成し、英単語の入力に対して、英単語・カタカ
ナ同時出現確率計算手段2bにより、音訳モデルに基づ
いて英単語とカタカナの同時出現確率を計算し、最大確
率経路探索手段2cにより、最も確率の高い経路を探索
してカタカナ音訳結果を出力することにより、任意の英
単語について最適なカタカナ音訳を行うことができる。
【0072】このようにして、英単語(アルファベット
単語)のカタカナ読み(日本語読み)への高精度な変換
を、簡易かつ低コストで行うことができる。
【0073】尚、本発明は、図1〜図9を用いて説明し
た例に限定されるものではなく、その要旨を逸脱しない
範囲において種々変更可能である。例えば、本例では、
英語を音訳対象の言語として用いて説明しているが、ド
イツ語やフランス語等の他のアルファベットを用いた言
語に対しても適用することができる。
【0074】また、本例では、本発明に係わる処理プロ
グラムを記録する記録媒体として光ディスクを用いてい
るが、FD(Flexible Disk)等の磁気ディスクを用い
て良い。また、その処理プログラムのインストールに関
しても、ネットワークを介してダウンロードすることで
も良い。
【0075】
【発明の効果】本発明によれば、従来の単語単位で読み
を辞書に登録する技術のように、辞書作成・維持にコス
トがかかると共に未知語には読みが振れないといった問
題点や、従来の単語表記から発音記号を経由して読みを
生成する技術のように、英語と日本語の発音に違いがあ
るため困難が多いといった問題点、さらには、従来の単
語表記から直接読みを生成する技術にように、人手によ
る規則の設定を必要とするため設定基準に理論的根拠が
なくコストがかかるといった問題点を解決でき、英語等
のアルファベット単語の日本語読み(カタカナ音訳等)
への高精度な変換を、簡易かつ低コストで行うことがで
き、さらに未知語等の任意の単語に対しても行うことが
可能となり、アルファベット単語の日本語読みへの変換
を行うシステムの性能の向上を図ることができる。
【図面の簡単な説明】
【図1】本発明のアルファベット・日本語読み対応付け
装置とアルファベット単語音訳装置の本発明に係る構成
の一例を示すブロック図である。
【図2】本発明のアルファベット・日本語読み対応付け
方法とアルファベット単語音訳方法の本発明に係る処理
動作の一例を示すフローチャートである。
【図3】図1における要素間距離計算手段で参照する英
文字カタカナ読みテーブルの構成例を示す説明図であ
る。
【図4】図1における最少距離対応付け探索手段による
英文字・カタカナの対応付け結果表の構成例を示す説明
図である。
【図5】図1における要素間距離計算手段による要素間
距離の計算結果例を示す説明図である。
【図6】図1における文字列bigram頻度テーブルの構成
例を示す説明図である。
【図7】図1における文字列unigram頻度テーブルの構
成例を示す説明図である。
【図8】図1における最大確率経路探索手段により出力
される英単語カタカナ音訳の結果表例を示す説明図であ
る。
【図9】図1および図2における本発明のアルファベッ
ト・日本語読み対応付け装置と方法およびアルファベッ
ト単語音訳装置と方法を実現するためのコンピュータシ
ステムのハードウェア構成の一例を示すブロック図であ
る。
【符号の説明】
1:アルファベット・日本語読み対応付け装置(「英文
字・カタカナ対応付け装置」)、1a:要素間距離計算手
段、1b:最小距離対応付け探索手段、1c:英文字カ
タカナ読みテーブル、1d:フィードバック手段、2:
アルファベット単語音訳装置(「英単語カタカナ音訳装
置」)、2a:音訳モデル作成手段、2b:英単語・カ
タカナ同時出現確率計算手段、2c:最大確率経路探索
手段、2d:文字列ngram頻度テーブル、2e:文字列b
igram頻度テーブル、2f:文字列unigram頻度テーブ
ル、41:英文字・カタカナの対応付け結果表、81:
英単語カタカナ音訳の結果表、91:表示装置、92:
入力装置、93:外部記憶装置、94:情報処理装置、
95:光ディスク、96:駆動装置。

Claims (12)

    【特許請求の範囲】
  1. 【請求項1】 対で入力されたアルファベット単語と該
    アルファベット単語の日本語読みとに基づき、上記アル
    ファベット単語を構成する文字列と該文字列に対する日
    本語読みとを対応付けたデータを生成するアルファベッ
    ト文字・日本語読み対応付け装置であって、予め対で入
    力されたアルファベット文字列と該アルファベット文字
    列の1以上の日本語読みとを対応付けて記憶する記憶手
    段と、上記アルファベット単語と該アルファベット単語
    の日本語読みとの対が入力されると、該アルファベット
    単語を構成する文字列と上記日本語読みを構成する文字
    列の全ての組合せの部分文字列間について、上記記憶手
    段で記憶した対応付けを接続コストM(M≧0)、上記
    記憶手段で記憶していない対応付けを接続コストN(N
    >M)とした要素間距離の計算を行う要素間距離計算手
    段と、該要素間距離計算手段で計算した部分文字列間の
    要素間距離の語頭から語尾までの総和が最少になる対応
    付けを求める対応付け探索手段とを有することを特徴と
    するアルファベット文字・日本語読み対応付け装置。
  2. 【請求項2】 請求項1に記載のアルファベット文字・
    日本語読み対応付け装置であって、上記記憶手段で予め
    記憶するアルファベット文字列の長さ、および、上記要
    素間距離計算手段で要素間距離を計算するアルファベッ
    トの部分文字列の長さを4文字以内とすることを特徴と
    するアルファベット文字・日本語読み対応付け装置。
  3. 【請求項3】 入力されたアルファベット単語の日本語
    読みを出力するアルファベット単語音訳装置であって、
    対で入力されたアルファベット単語と該アルファベット
    単語の日本語読みとに基づき、上記アルファベット単語
    を構成する文字列と該文字列に対する日本語読みとを対
    応付けたデータ(アルファベット文字・日本語読み対応
    データ)を生成するアルファベット文字・日本語読み対
    応付け手段と、該アルファベット文字・日本語読み対応
    付け手段で生成した各アルファベット文字・日本語読み
    対応データの生成頻度(文字列unigram頻度)を記憶す
    る文字列unigram頻度記憶手段と、上記アルファベット
    文字・日本語読み対応付け手段により隣り合って生成さ
    れる二つのアルファベット文字・日本語読み対応データ
    の組の生成頻度(文字列bigram頻度)を記憶する文字列
    bigram頻度記憶手段と、上記文字列unigram頻度と上記
    文字列bigram頻度に基づき、入力されたアルファベット
    単語を構成する全ての文字列と該文字列に対応する日本
    語読みの文字列との同時出現確率を計算する同時出現確
    率計算手段と、該同時出現確率計算手段で計算した同時
    出現確率を最大にする上記日本語読みの文字列の組合せ
    を求める最大確率経路探索手段とを有し、該最大確率経
    路探索手段で求めた組合せの日本語読みを上記入力され
    たアルファベット単語の日本語読みとして出力すること
    を特徴とする英単語カタカナ音訳装置。
  4. 【請求項4】 請求項3に記載のアルファベット単語音
    訳装置であって、上記アルファベット文字・日本語読み
    対応付け手段は、予め対で入力されたアルファベット文
    字列と該アルファベット文字列の1以上の日本語読みと
    を対応付けて記憶する記憶手段と、上記アルファベット
    単語と該アルファベット単語の日本語読みとの対が入力
    されると、該アルファベット単語を構成する文字列と上
    記日本語読みを構成する文字列の全ての組合せの部分文
    字列間について、上記記憶手段で記憶した対応付けを接
    続コストM(M≧0)、上記記憶手段で記憶していない
    対応付けを接続コストN(N>M)とした要素間距離の
    計算を行う要素間距離計算手段と、該要素間距離計算手
    段で計算した部分文字列間の要素間距離の語頭から語尾
    までの総和が最少になる対応付けを求める対応付け探索
    手段とを有することを特徴とするアルファベット単語音
    訳装置。
  5. 【請求項5】 対で入力されたアルファベット単語と該
    アルファベット単語の日本語読みとに基づき、上記アル
    ファベット単語を構成する文字列と該文字列に対する日
    本語読みとを対応付けたデータを生成するコンピュータ
    システムによるアルファベット文字・日本語読み対応付
    け方法であって、予め対で入力されたアルファベット文
    字列と該アルファベット文字列の1以上の日本語読みと
    を対応付けて記憶装置に記憶する第1のステップと、上
    記アルファベット単語と該アルファベット単語の日本語
    読みとの対が入力されると、該アルファベット単語を構
    成する文字列と上記日本語読みを構成する文字列の全て
    の組合せの部分文字列間について、上記記憶装置に記憶
    した対応付けを接続コストM(M≧0)、上記記憶装置
    に記憶していない対応付けを接続コストN(N>M)と
    した要素間距離の計算を行う第2のステップと、該第2
    のステップで計算した部分文字列間の要素間距離の語頭
    から語尾までの総和が最少になる対応付けを求める第3
    のステップとを有することを特徴とするアルファベット
    文字・日本語読み対応付け方法。
  6. 【請求項6】 請求項5に記載のアルファベット文字・
    日本語読み対応付け方法であって、上記第3のステップ
    で求めた文字列の対応付け結果を、上記記憶装置に記憶
    することを特徴とするアルファベット文字・日本語読み
    対応付け方法。
  7. 【請求項7】 入力されたアルファベット単語の日本語
    読みを出力するコンピュータシステムによるアルファベ
    ット単語音訳方法であって、対で入力されたアルファベ
    ット単語と該アルファベット単語の日本語読みとに基づ
    き、上記アルファベット単語を構成する文字列と該文字
    列に対する日本語読みとを対応付けたデータ(アルファ
    ベット文字・日本語読み対応データ)を生成する第1の
    ステップと、該第1のステップで生成した各アルファベ
    ット文字・日本語読み対応データの生成頻度(文字列un
    igram頻度)を第1の記憶装置に記憶する第2のステッ
    プと、上記第1のステップで隣り合って生成される二つ
    のアルファベット文字・日本語読み対応データの組の生
    成頻度(文字列bigram頻度)を第2の記憶装置に記憶す
    る第3のステップと、上記文字列unigram頻度と上記文
    字列bigram頻度に基づき、入力されたアルファベット単
    語を構成する全ての文字列と該文字列に対応する日本語
    読みの文字列との同時出現確率を計算する第4のステッ
    プと、該第4のステップで計算した同時出現確率を最大
    にする上記日本語読みの文字列の組合せを求める第5の
    ステップとを有し、上記第5のステップで求めた組合せ
    の日本語読みを上記入力されたアルファベット単語の日
    本語読みとして出力することを特徴とするアルファベッ
    ト単語音訳方法。
  8. 【請求項8】 請求項7に記載のアルファベット単語音
    訳方法であって、上記第1のステップは、予め対で入力
    されたアルファベット文字列と該アルファベット文字列
    の1以上の日本語読みとを対応付けて第3の記憶装置に
    記憶するステップAと、上記アルファベット単語と該ア
    ルファベット単語の日本語読みとの対が入力されると、
    該アルファベット単語を構成する文字列と上記日本語読
    みを構成する文字列の全ての組合せの部分文字列間につ
    いて、上記第3の記憶装置に記憶した対応付けを接続コ
    ストM(M≧0)、上記第3の記憶装置に記憶していな
    い対応付けを接続コストN(N>M)とした要素間距離
    の計算を行うステップBと、該ステップBで計算した部
    分文字列間の要素間距離の語頭から語尾までの総和が最
    少になる対応付けを求めるステップCとを有することを
    特徴とするアルファベット単語音訳方法。
  9. 【請求項9】 請求項8に記載のアルファベット単語音
    訳方法であって、上記第3の記憶装置で予め記憶するア
    ルファベット文字列の長さ、および、上記ステップBで
    要素間距離を計算するアルファベットの部分文字列の長
    さを4文字以内とすることを特徴とするアルファベット
    単語音訳方法。
  10. 【請求項10】 請求項7から請求項9のいずれかに記
    載のアルファベット単語音訳方法であって、上記第4の
    ステップは、上記入力されたアルファベット単語を構成
    する全ての文字列に対して、上記文字列bigram頻度を、
    該文字列bigram頻度が付与された上記アルファベット文
    字・日本語読み対応データ組の内の先行する文字列の上
    記文字列unigram頻度で割って文字列bigram確率を求
    め、求めた各文字列bigram確率の積を求めて上記同時出
    現確率を計算するステップを有することを特徴とするア
    ルファベット単語音訳方法。
  11. 【請求項11】 請求項7から請求項10のいずれかに
    記載のアルファベット単語音訳方法であって、上記記憶
    装置に上記文字列bigram頻度が記憶されておらず上記第
    4のステップで求める上記文字列bigram確率が0となる
    場合には、平滑化を行い当該文字列bigram確率を求める
    ステップを有することを特徴とするアルファベット単語
    音訳方法。
  12. 【請求項12】 入力されたアルファベット単語の日本
    語読みを出力するコンピュータシステムによるアルファ
    ベット単語音訳方法の処理手順プログラムを記録する記
    録媒体であって、請求項7から請求項11のいずれかに
    記載のアルファベット単語音訳方法での各ステップを、
    上記コンピュータシステムに実行させるためのプログラ
    ムを記録したことを特徴とする記録媒体。
JP32489299A 1999-11-16 1999-11-16 アルファベット文字・日本語読み対応付け装置と方法およびアルファベット単語音訳装置と方法ならびにその処理プログラムを記録した記録媒体 Expired - Lifetime JP4084515B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP32489299A JP4084515B2 (ja) 1999-11-16 1999-11-16 アルファベット文字・日本語読み対応付け装置と方法およびアルファベット単語音訳装置と方法ならびにその処理プログラムを記録した記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP32489299A JP4084515B2 (ja) 1999-11-16 1999-11-16 アルファベット文字・日本語読み対応付け装置と方法およびアルファベット単語音訳装置と方法ならびにその処理プログラムを記録した記録媒体

Publications (2)

Publication Number Publication Date
JP2001142877A true JP2001142877A (ja) 2001-05-25
JP4084515B2 JP4084515B2 (ja) 2008-04-30

Family

ID=18170801

Family Applications (1)

Application Number Title Priority Date Filing Date
JP32489299A Expired - Lifetime JP4084515B2 (ja) 1999-11-16 1999-11-16 アルファベット文字・日本語読み対応付け装置と方法およびアルファベット単語音訳装置と方法ならびにその処理プログラムを記録した記録媒体

Country Status (1)

Country Link
JP (1) JP4084515B2 (ja)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003132052A (ja) * 2001-10-19 2003-05-09 Nippon Hoso Kyokai <Nhk> 読みがな付与装置およびプログラム
JP2007109233A (ja) * 2005-10-09 2007-04-26 Toshiba Corp 音訳モデル及び構文解析統計モデルを訓練するための方法及び装置、及び音訳のための方法及び装置
JP2012042999A (ja) * 2010-08-12 2012-03-01 Casio Comput Co Ltd データ入力装置及びプログラム
JP2013218628A (ja) * 2012-04-12 2013-10-24 Nippon Telegr & Teleph Corp <Ntt> 文字列類似度計算装置、方法、及びプログラム
JP2014106857A (ja) * 2012-11-29 2014-06-09 Mitsubishi Electric Corp アルファベット読み推定装置
JP2014164403A (ja) * 2013-02-22 2014-09-08 Nippon Hoso Kyokai <Nhk> 読みがな割当装置およびプログラム
JP2015022508A (ja) * 2013-07-18 2015-02-02 日本電信電話株式会社 文字列対応付け装置、方法、及びプログラム

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003132052A (ja) * 2001-10-19 2003-05-09 Nippon Hoso Kyokai <Nhk> 読みがな付与装置およびプログラム
JP2007109233A (ja) * 2005-10-09 2007-04-26 Toshiba Corp 音訳モデル及び構文解析統計モデルを訓練するための方法及び装置、及び音訳のための方法及び装置
JP2012042999A (ja) * 2010-08-12 2012-03-01 Casio Comput Co Ltd データ入力装置及びプログラム
JP2013218628A (ja) * 2012-04-12 2013-10-24 Nippon Telegr & Teleph Corp <Ntt> 文字列類似度計算装置、方法、及びプログラム
JP2014106857A (ja) * 2012-11-29 2014-06-09 Mitsubishi Electric Corp アルファベット読み推定装置
JP2014164403A (ja) * 2013-02-22 2014-09-08 Nippon Hoso Kyokai <Nhk> 読みがな割当装置およびプログラム
JP2015022508A (ja) * 2013-07-18 2015-02-02 日本電信電話株式会社 文字列対応付け装置、方法、及びプログラム

Also Published As

Publication number Publication date
JP4084515B2 (ja) 2008-04-30

Similar Documents

Publication Publication Date Title
US7113903B1 (en) Method and apparatus for providing stochastic finite-state machine translation
US6490563B2 (en) Proofreading with text to speech feedback
US7174288B2 (en) Multi-modal entry of ideogrammatic languages
US6928448B1 (en) System and method to match linguistic structures using thesaurus information
JP4215418B2 (ja) 単語予測方法、音声認識方法、その方法を用いた音声認識装置及びプログラム
JPH03224055A (ja) 同時通訳向き音声認識システムおよびその音声認識方法
EP1623412B1 (en) Method for statistical language modeling in speech recognition
US8356065B2 (en) Similar text search method, similar text search system, and similar text search program
US20100125459A1 (en) Stochastic phoneme and accent generation using accent class
JP2007156545A (ja) 記号列変換方法、単語翻訳方法、その装置およびそのプログラム並びに記録媒体
CN112346696A (zh) 虚拟助理的语音比较
JP4084515B2 (ja) アルファベット文字・日本語読み対応付け装置と方法およびアルファベット単語音訳装置と方法ならびにその処理プログラムを記録した記録媒体
Manasa et al. Comparison of acoustical models of GMM-HMM based for speech recognition in Hindi using PocketSphinx
JPH0778183A (ja) デ−タベ−ス検索システム
KR101982490B1 (ko) 문자 데이터 변환에 기초한 키워드 검색 방법 및 그 장치
Pilar Knowledge-driven subword grammar modeling for automatic speech recognition in tamil and kannada
JP2006107353A (ja) 情報処理装置および方法、記録媒体、並びにプログラム
JP4674609B2 (ja) 情報処理装置および方法、プログラム、並びに記録媒体
KR100910275B1 (ko) 이중언어 문서에서의 음차표기 대역쌍 자동 추출 방법 및장치
JP5120749B2 (ja) 木構造辞書を記録した記憶媒体、木構造辞書作成装置、及び木構造辞書作成プログラム
JP2005025555A (ja) シソーラス構築システム、シソーラス構築方法、この方法を実行するプログラム、およびこのプログラムを記憶した記憶媒体
JP2001312294A (ja) 入力記号列を出力記号列に変換するトランスデューサの学習方法およびトランスデューサの学習プログラムを記憶したコンピュータ読み取り可能な記録媒体
JPH11338498A (ja) 音声合成装置
KR20090042201A (ko) 이중언어 문서에서의 음차표기 대역쌍 자동 추출 방법 및 장치
JP2006024114A (ja) 機械翻訳装置および機械翻訳コンピュータプログラム

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040611

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040810

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20040903

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20060731

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20070119

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20071226

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080215

R151 Written notification of patent or utility model registration

Ref document number: 4084515

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110222

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110222

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120222

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130222

Year of fee payment: 5

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

EXPY Cancellation because of completion of term