JP4084515B2 - アルファベット文字・日本語読み対応付け装置と方法およびアルファベット単語音訳装置と方法ならびにその処理プログラムを記録した記録媒体 - Google Patents

アルファベット文字・日本語読み対応付け装置と方法およびアルファベット単語音訳装置と方法ならびにその処理プログラムを記録した記録媒体 Download PDF

Info

Publication number
JP4084515B2
JP4084515B2 JP32489299A JP32489299A JP4084515B2 JP 4084515 B2 JP4084515 B2 JP 4084515B2 JP 32489299 A JP32489299 A JP 32489299A JP 32489299 A JP32489299 A JP 32489299A JP 4084515 B2 JP4084515 B2 JP 4084515B2
Authority
JP
Japan
Prior art keywords
character string
alphabet
japanese
reading
partial character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP32489299A
Other languages
English (en)
Other versions
JP2001142877A (ja
Inventor
邦子 森脇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP32489299A priority Critical patent/JP4084515B2/ja
Publication of JP2001142877A publication Critical patent/JP2001142877A/ja
Application granted granted Critical
Publication of JP4084515B2 publication Critical patent/JP4084515B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Description

【0001】
【発明の属する技術分野】
本発明は、テキスト自動読み上げやディクテーション(口述筆記)など、コンピュータを用いた音声合成や音声認識等の言語処理技術に係り、特に、英単語等のアルファベットからなる外来語に対する日本語読み(カタカナ)への変換(音訳)を効率的に行うに好適なアルファベット文字・日本語読み対応付け装置と方法およびアルファベット単語音訳装置と方法ならびにその処理プログラムを記録した記録媒体に関するものである。
【0002】
【従来の技術】
コンピュータを用いたテキスト自動読み上げやディクテーションなどの音声合成・音声認識システムにおいて、英単語に日本語読み(カタカナ音訳)を振る技術の一般的なものに、英単語とそれに対応する日本語読みを予め単語辞書に登録する従来技術(a)がある。しかし、多くの場合、英単語には複数の読みが存在する。例えば、「body」は「バディー」や「ボディー」あるいは「ボディ」など色々な読みがある。
【0003】
また、人名、地名などの固有名詞は単語辞書に登録されていないことが多いが、単語単位で読みが登録されていないものは1文字ずつに分解してアルファべット読みを繋げてしまうため、従来技術(a)では全く意味をなさない読みが振られてしまう。
【0004】
このような問題に対処するためには、複数のカタカナ読みや新しい固有名詞の読みなどを全て辞書に登録する必要があり、その辞書の作成・維持に膨大なコストがかかる。
【0005】
この従来技術(a)のように予め読みを辞書に登録するのではなく、英単語から自動的に読みを生成する試みもある。例えば、英単語を一度英語の発音記号に変換し、更にこれを日本語の読みへ変換する従来技術(b)が、例えば、K. Knight and J. Graehl:“Machine Transliteration”,Computational Linguistics,vol.24,No.4,pp.599-612(1998)に開示されている。しかし、この従来技術(b)には、英語の発音と日本語の読みが必ずしも一致しないという困難点がある。
【0006】
また、英単語表記から直接日本語の読みに変換する従来技術(c)が、例えば、塚田,増田:“英単語に対する日本語読み付与方法の検討”,情報処理学会第53回全国大会,2−359(平成8年後期)において提案されている。
【0007】
これは、アルファべット部分列と日本語音節の対応規則およびそれを補強する幾つかの規則(末尾−e規則、接尾辞規則、促音挿入規則)を用いて英語表記を直接日本語の読みに変換する技術である。
【0008】
しかし、この従来技術(c)は、対応規則や補強規則を全て人手で作成しなければならないので、規則の設定に経験が必要とされ、理論的根拠に乏しく、コストもかかるという問題点がある。
【0009】
【発明が解決しようとする課題】
解決しようとする問題点は、従来技術(a)の単語単位で読みを辞書に登録する技術では、辞書作成・維持にコストがかかり、また未知語には読みが振れないといった点であり、従来技術(b)の単語表記から発音記号を経由して読みを生成する技術では、英語と日本語の発音に違いがあるため困難が多いといった点であり、さらに、従来技術(c)の単語表記から直接読みを生成する技術では、人手による規則の設定を必要とするため、設定基準に理論的根拠がなく、コストがかかるといった点である。
【0010】
本発明の目的は、これら従来技術の課題を解決し、英語等のアルファベット単語の日本語読み(カタカナ音訳等)への高精度な変換を、簡易かつ低コストで、さらに未知語等の任意の単語に対しても行うことを可能とするアルファベット文字・日本語読み対応付け装置と方法およびアルファベット単語音訳装置と方法ならびにその処理プログラムを記録した記録媒体を提供することである。
【0011】
【課題を解決するための手段】
上記目的を達成するため、本発明のアルファベット・日本語読み対応付け装置と方法は、対で入力されたアルファベット単語と、このアルファベット単語の日本語読みとから、アルファベット単語を構成する文字列と、この文字列に対する日本語読みとを対応付けたデータを生成するものであり、まず、予め対で入力されたアルファベット文字列とこのアルファベット文字列の1以上の日本語読みとを対応付けて記憶装置に記憶しておく。そして、アルファベット単語と、このアルファベット単語の日本語読みとの対が入力されると、要素間距離計算手段により、このアルファベット単語を構成する文字列と日本語読みを構成する文字列の全ての組合せの部分文字列間について要素間距離の計算を行う。この際、記憶装置で記憶した対応付けを例えば接続コスト0それ以外を接続コスト1として要素間距離の計算を行う。そして、対応付け探索手段により、計算した部分文字列間の要素間距離の語頭から語尾までの総和が最小になる対応付けを求める。このようにして、対で入力されたアルファベット単語と、このアルファベット単語の日本語読みとから、アルファベット単語を構成する文字列と、この文字列に対する日本語読みとを対応付けた大量のデータを容易に生成することができる。
【0012】
また、本発明のアルファベット単語音訳装置と方法は、上述のアルファベット・日本語読み対応付け装置で生成されたアルファベット文字列とその日本語読みとを対応付けた大量のデータを用いて、入力されたアルファベット単語を構成する文字列とその日本語読みとの文字列ngram(複数要素の連鎖)頻度を計算し、この統計情報を用いた音訳モデル(日本語のカナ文字およびその連鎖の出現頻度の集合からなるモデル)に基づいて、入力されたアルファベット単語の日本語読みを特定する。
【0013】
【発明の実施の形態】
以下、本発明の実施の形態を、図面により詳細に説明する。
図1は、本発明のアルファベット・日本語読み対応付け装置とアルファベット単語音訳装置の本発明に係る構成の一例を示すブロック図であり、図2は、本発明のアルファベット・日本語読み対応付け方法とアルファベット単語音訳方法の本発明に係る処理動作の一例を示すフローチャート、図9は、図1および図2における本発明のアルファベット・日本語読み対応付け装置と方法およびアルファベット単語音訳装置と方法を実現するためのコンピュータシステムのハードウェア構成の一例を示すブロック図である。
【0014】
図9において、91はCRT(Cathode Ray Tube)やLCD(Liquid Crystal Display)等からなる表示装置、92はキーボードやマウス等からなる入力装置、93はハードディスクドライブ等からなる外部記憶装置、94はCPU(Central Processing Unit)や主メモリ等を有し蓄積プログラム方式によるコンピュータ処理を行なう情報処理装置、95は本発明に係る処理プログラムやデータ等を記録した光ディスク、96は光ディスク95の読み取り動作を行なう駆動装置である。
【0015】
光ディスク95に記録された処理プログラムやデータをインストールして主メモリに読み込むことにより、情報処理装置94内に、図1に示すアルファベット・日本語読み対応付け装置やアルファベット単語音訳装置の本発明に係る機能が実装される。
【0016】
以下、図1を用いて本発明に係るアルファベット・日本語読み対応付け装置とアルファベット単語音訳装置の構成を説明する。
図1において、1はアルファベット・日本語読み対応付け装置(図中、「英文字・カタカナ対応付け装置」と記載)、2はアルファベット単語音訳装置(図中、「英単語カタカナ音訳装置」と記載)である。
【0017】
本例のアルファベット音訳装置2は、英単語からカタカナ読みを作成し、また、本例のアルファベット・日本語読み対応付け装置1は、このアルファベット音訳装置2で用いる音訳モデルを作成するために必要となる英文字・カタカナ対応データを作成する。
【0018】
すなわち、アルファベット・日本語読み対応付け装置1は、入力された英単語とその日本語読みであるカタカナとを文字列単位で自動的に対応付ける装置であり、要素間距離計算手段1aと、最小距離対応付け探索手段1b、英文字カタカナ読みテーブル1c、および、フィードバック手段1dとを有する。
【0019】
英文字カタカナ読みテーブル1cには、予め対で入力された英文字列とそのカタカナ読みの候補(複数可)が格納されており、要素間距離計算手段1aは、入力された英単語・カタカナ対応データの、任意の部分文字列間について、その英文字カタカナ読みテーブル1cを参照し、予め設定された関数を用いて要素間距離を計算する。
【0020】
そして、最小距離対応付け探索手段1bは、動的計画法を用いて、要素間距離計算手段1aで計算した文字列の要素間距離の総和が最小となる経路を探索し、その時の英文字とカタカナの対応付け(英文字・カタカナ対応データ)を1組出力する。
【0021】
さらに、フィードバック手段1dは、最小距離対応付け探索手段1bで求めた英文字・カタカナ対応データを英文字カタカナ読みテーブル1cに記憶させる。
【0022】
また、アルファベット音訳装置2は、英単語に対してカタカナ音訳をする装置であって、音訳モデル作成手段2aと、英単語・カタカナ同時出現確率計算手段2b、最大確率経路探索手段2c、および、音訳モデルとしての文字列ngram頻度テーブル2dを有する。
【0023】
音訳モデル作成手段2aは、アルファベット・日本語読み対応付け装置1によって生成されたアルファベット・カタカナ対応データから、英単語とそのカタカナの同時出現確率を求めて音訳するための確率モデル(音訳モデル)である文字列ngram頻度テーブル2dを生成する。
【0024】
この文字列ngram頻度テーブル2d(音訳モデル)には、図6,7で具体例を示す文字列bigram頻度テーブル2eと文字列unigram頻度テーブル2fが格納されており、同時出現確率計算手段2bは、文字列unigram頻度テーブル2fから、入力された英単語内の英文字列に対するカタカナ文字列候補を複数列挙し、文字列bigram頻度テーブル2eに基づいて、入力された英単語に対するカタカナの同時出現確率を計算する。
【0025】
最大確率経路探索手段2cは、複数の候補の中から、英単語・カタカナ同時出現確率計算手段2bで計算した同時出現確率を最大にする経路を探索し、その結果をカタカナ音訳結果として出力する。
【0026】
以下、このような構成のアルファベット・日本語読み対応付け装置1とアルファベット音訳装置2の動作を、図2に基づき説明する。
【0027】
図2において、ステップ201,202が図1のアルファベット・日本語読み対応付け装置1の処理、ステップ203〜204が図1のアルファベット単語音訳装置2の処理である。
【0028】
まず、アルファベット・日本語読み対応付け装置1では、英単語とそのカタカナ読みとが対で入力されると、要素間距離計算手段1aにより、その英単語・カタカナ対応データを入力として、英文字カタカナ読みテーブル1cを参照し、英文字とカタカナの任意の部分文字列間の要素間距離を計算する(ステップ201)。
【0029】
そして、最小距離対応付け探索手段1bにより、その要素間距離の総和が最小となる対応付け経路を探索してアルファベット・カタカナ対応データを作成する(ステップ202)。
【0030】
続いて、アルファベット音訳装置2では、アルファベット・日本語読み対応付け装置1で作成されたアルファベット・カタカナ対応データを用いて、音訳モデル作成手段2aにより、音訳モデル(文字列ngram頻度テーブル2d)を作成する(ステップ203)。
【0031】
その後、任意の英単語が入力されると、その英単語の入力に対して、英単語・カタカナ同時出現確率計算手段2bにより、音訳モデル(文字列ngram頻度テーブル2d)に基づいて英単語とカタカナの同時出現確率を計算する(ステップ204)。そして、最大確率経路探索手段2cにより、最も確率の高い経路を探索してカタカナ音訳結果を出力する(ステップ205)。
【0032】
このようにして、アルファベット・日本語読み対応付け装置1において、対で入力された英単語・カタカナ対応データから自動的に文字列単位で対応付けたカタカナ読みデータを作成し、そして、この文字列単位で対応付けたデータから作成した音訳モデルに基づいて、アルファベット音訳装置2において、任意に入力された英単語に対してカタカナ音訳を行う。
【0033】
次に、図3〜図8に基づき、具体的な例を用いて、アルファベット・日本語読み対応付け装置1とアルファベット音訳装置2の動作等に関して、要素間距離計算と最小距離対応付け探索、および、音訳モデルの順に説明する。
【0034】
尚、以下に説明する技術は、例えば、北研二・中村哲・永田昌明 著:“音声言語処理”(森北出版株式会社発行、1996年)の第27頁〜第30頁、第63頁〜第69頁、第82頁〜第87頁等に記載の形態素解析技術に基づくものである。
【0035】
図3は、図1における要素間距離計算手段で参照する英文字カタカナ読みテーブルの構成例を示す説明図、図4は、図1における最小距離対応付け探索手段による英文字・カタカナの対応付け結果表の構成例を示す説明図、図5は、図1における要素間距離計算手段による要素間距離の計算結果例を示す説明図、図6は、図1における文字列bigram頻度テーブルの構成例を示す説明図、図7は、図1における文字列unigram頻度テーブルの構成例を示す説明図、そして、図8は、図1における最大確率経路探索手段により出力される英単語カタカナ音訳の結果表例を示す説明図である。
【0036】
まず、要素間距離計算と最小距離対応付け探索について説明する。
英単語とカタカナを対応付けるというのは、例えば「station/ステーション」という単語単位の対応データを「s/ス」、「ta/テー」、「tio/ショ」、「n/ン」というように、文字列単位で対応付けを行うことである。
尚、文字列単位は原則として日本語発音の単位にする。
【0037】
英単語を構成する文字列X=x1x2…xnと、その読みであるカタカナを構成する文字列Y=y1y2…ymを対応付ける時は、各要素間の距離を定義し、距離の和が最小となるような対応付けを求めれば良い。
文字列の対応は「s/ス」の「1:1」から、「tio/ショ」の「3:2」等の「s/t(s,t>1)」まで多数ある。
本例では「1:1」〜「4:4」までの対応とする。
【0038】
英単語の要素x1からxiまでと、カタカナの要素y1からyjまでの距離をd(i,j)とする。
英文字列とカタカナ列が「s:t」に対応している時、すなわち英文字xi-s+1…xiと、カタカナyj-t+1…yjが対応している時、その要素間距離をcost(xi-s+1…xi,yj-t+1…yj)とすると次の式(数1)で表される。
【0039】
【数1】
Figure 0004084515
【0040】
各地点(i,j)で「1:1」〜「4:4」の対応について要素間距離cost(xi-s+1…xi,yj-t+1…yj)の計算を行い、語頭からの距離d(i,j)を求める。
【0041】
求めた距離d(i,j)の最小値と、そのときの対応「s:t」の値から,直前の地点(i−s,j−t)を記憶しておく。
語尾まで至ったら、記憶された直前の地点を順に巡り、最小距離となる対応付けを求める。
要素間距離の値は、英文字カタカナ読みテーブルを用いて以下の式(数2)から求められる。
【0042】
【数2】
Figure 0004084515
【0043】
この他の対応として、以下のように1文字挿入と1文字削除も考える。
1文字挿入は、英文字列とカタカナが「0:1」に対応し、1文字削除は「1:0」に対応する。このときの要素間距離は常に「1」である。
【0044】
図3に示す英文字カタカナ読みテーブル1cは、予め作成した対応付け規則であり、本例では約130項目の英文字列について設定した。これは、アルファべットの子音と母音の組み合わせ(ka,ki,ku,ke,ko,…)に対する読みと、全てのアルファべット1文字(a,b,c,…)に対する読みの候補を機械的に幾つか列挙したものである。
【0045】
図4に示す英文字・カタカナの対応付け結果表41において、1行目が、入力された英単語・カタカナ対応データであり、「英単語/カタカナ」で表される。
また、2行目以降が対応付けの結果であり、「英文字/カタカナ」で表される。
【0046】
図5に示す要素間距離を説明する図では、矢印が「s:t」の対応を示し、そして矢印に添えてある数字が、その対応の要素間距離である。いくつかの対応例を示しており、この例では図3の英文字カタカナ読みテーブル1cの項目にある「lo/ロ」と「so/ソ」の対応のみが要素間距離「0」となるが、それ以外の対応、例えば、「i/フィ」と「op/ィ」等では全て「1」になる。
【0047】
従って、語頭から語尾までの要素間距離の和が最小となるには、「phy/フィ」と「phy/フィー」の対応を経由する場合で、その距離は、「1+0+0+1=2」となる。
語頭から語尾までの全ての対応付けについて総当りで検討し、最小距離となる対応付けの経路(矢印の組み合わせ)を求める。
【0048】
以上の例からも分かるように、本例の図1に示す英文字・カタカナ対応付け装置1では、図3の英文字カタカナ読みテーブル1cに項目が存在しないものが含まれる場合でも、前後に正確な対応付けができる要素があるために、全体として正しく対応付けができる。
【0049】
このように、元となる英文字カタカナ読みテーブル1cが、全ての対応を網羅していなくても、新しい対応付けを行える点がこの英文字・カタカナ対応付け装置1の優れた点である。
【0050】
次に、図1におけるアルファベット音訳装置2の音訳モデル作成手段2aで生成し、英単語・カタカナ同時出現確率計算手段2bで参照する音訳モデル(文字列bigram頻度テーブル2e、文字列unigram頻度テーブル2f)について説明する。
【0051】
図1の音訳モデル作成手段2aでは、英文字・カタカナ対応付け装置1の最小距離対応付け探索手段1bの処理結果で出力される各英文字・カタカナ対応データの発生頻度を、1組単位(unigram)および連続した組単位(bigram)で、図6および図7の文字列bigram頻度テーブル2e、文字列unigram頻度テーブル2fで示すようにして記録する。尚、本例では、6万単語についての結果を記録した。
【0052】
英単語・カタカナ同時出現確率計算手段2bでは、これらの文字列bigram頻度テーブル2e、文字列unigram頻度テーブル2fを参照して、入力された任意の英単語に最適なカタカナ読みを振る。以下、その詳細を説明する。
【0053】
英単語に最適なカタカナ読みを振るということは、英単語の文字列C=c1…cnに対応するカタカナの文字列Q=q1…qnとの同時出現確率P(C,Q)を最大にするようなカタカナを求めるということである。尚、ここでのck,qkは、1文字を表すのではなく、1文字以上の文字列を表す。
【0054】
本例では、同時出現確率をマルコフモデルで近似する。即ち、同時出現確率P(C,Q)を、文字列bigramと確率P(ci,qi|ci-1,qi-1)の積として次式(数3)で表す。
【0055】
【数3】
Figure 0004084515
【0056】
P(ci,qi|ci-1,qi-1)の値は、文字列bigram頻度を、先行する文字列のunigram頻度で割ることによって与えられる。すなわち頻度をC(*)で表すと、次の式(数4)となる。
【0057】
【数4】
Figure 0004084515
【0058】
例えば、図6の文字列bigram頻度テーブル2eに示すように、「tio,ショ」および「n,ン」の文字列bigram頻度が「1572」で、図7の文字列unigram頻度テーブル2fに示すように、「tio,ショ」の文字列unigram頻度が「2537」ならば、P(n,ン|tio,ショ)=1572/2537=0.61962…である。
【0059】
実際のカタカナ音訳処理では、各英文字列に対するカタカナ候補を文字列unigram頻度テーブル2fから列挙し、各候補について文字列bigram確率を計算する。
この結果に基づき、単語全体の確率が最大となる文字列の組み合わせを選択し、最適なカタカナ音訳を求める。
【0060】
このように、本例の技術では、文字列単位で音訳をしているので、単語単位ではカタカナ音訳がわからない英単語であっても、連続する2つの文字列について文字列bigram確率が与えられれば、単語全体にカタカナ音訳が行える。
【0065】
以上のようにして、英単語の語頭から語尾まで、全ての連続する文字列bigram確率を計算し、英単語とカタカナの同時出現確率が最大となるカタカナを求める。
その結果、図8の英単語カタカナ音訳の結果表81に示すように、英単語に対するカタカナ音訳と、その対数確率値が得られる。
【0066】
この図8においては、「station」についての読みが、「英文字列/カタカナ」の形で、対数確率値と共に3つ表されている。すなわち、音訳結果は対数確率値の高い順に「ステーション」、「ステイション」、「スタション」となり、尤らしい音訳が行えていることがわかる。
【0067】
尚、この対数確率値は、上述の「数3」式の対数をとったものであり、積を和に表わすことにより、演算(プログラム作成)が容易になる。また、確率値は極めて小さい(10-6オーダー)が、対数をとることにより、その比較を容易とすることができる。
【0068】
また、本例では、文字列の対応は「1:1」〜「4:4」までの対応としている。これにより、例えば、「1:1」〜「5:5」とした場合に「phylo/フィロソ」、「sopy/フィー」との結果が出力されるといった不適切なデータの生成を防ぐことができる。
【0069】
また、本例では、フィードバック手段1dにより、最小距離対応付け探索手段1bで求めた英文字・カタカナ対応データを英文字カタカナ読みテーブル1cに記憶させている。これにより、英文字カタカナ読みテーブル1cにおけるデータを容易に増やすことができる。
【0070】
以上、図1〜図9を用いて説明したように、本例のアルファベット・日本語読み対応付け装置と方法およびアルファベット音訳装置と方法では、まず、アルファベット・日本語読み対応付け装置および方法において、英単語・カタカナ対応データの対を入力とし、要素間距離計算手段1aにより、英文字とカタカナの任意の部分文字列間の要素間距離を計算し、最小距離対応付け探索手段1bにより、要素間距離の総和が最小となる対応付け経路を探索してアルファベット・カタカナ対応データを作成することにより、英文字とカタカナの対応付けを自動的に処理できる。
【0071】
そして、英単語カタカナ音訳装置および方法において、このアルファベット・カタカナ対応データを用いて、音訳モデル作成手段2aにより、音訳モデル(文字列unigram頻度テーブル2f、文字列bigram頻度2e)を作成し、英単語の入力に対して、英単語・カタカナ同時出現確率計算手段2bにより、音訳モデルに基づいて英単語とカタカナの同時出現確率を計算し、最大確率経路探索手段2cにより、最も確率の高い経路を探索してカタカナ音訳結果を出力することにより、任意の英単語について最適なカタカナ音訳を行うことができる。
【0072】
このようにして、英単語(アルファベット単語)のカタカナ読み(日本語読み)への高精度な変換を、簡易かつ低コストで行うことができる。
【0073】
尚、本発明は、図1〜図9を用いて説明した例に限定されるものではなく、その要旨を逸脱しない範囲において種々変更可能である。例えば、本例では、英語を音訳対象の言語として用いて説明しているが、ドイツ語やフランス語等の他のアルファベットを用いた言語に対しても適用することができる。
【0074】
また、本例では、本発明に係わる処理プログラムを記録する記録媒体として光ディスクを用いているが、FD(Flexible Disk)等の磁気ディスクを用いて良い。また、その処理プログラムのインストールに関しても、ネットワークを介してダウンロードすることでも良い。
【0075】
【発明の効果】
本発明によれば、従来の単語単位で読みを辞書に登録する技術のように、辞書作成・維持にコストがかかると共に未知語には読みが振れないといった問題点や、従来の単語表記から発音記号を経由して読みを生成する技術のように、英語と日本語の発音に違いがあるため困難が多いといった問題点、さらには、従来の単語表記から直接読みを生成する技術にように、人手による規則の設定を必要とするため設定基準に理論的根拠がなくコストがかかるといった問題点を解決でき、英語等のアルファベット単語の日本語読み(カタカナ音訳等)への高精度な変換を、簡易かつ低コストで行うことができ、さらに未知語等の任意の単語に対しても行うことが可能となり、アルファベット単語の日本語読みへの変換を行うシステムの性能の向上を図ることができる。
【図面の簡単な説明】
【図1】本発明のアルファベット・日本語読み対応付け装置とアルファベット単語音訳装置の本発明に係る構成の一例を示すブロック図である。
【図2】本発明のアルファベット・日本語読み対応付け方法とアルファベット単語音訳方法の本発明に係る処理動作の一例を示すフローチャートである。
【図3】図1における要素間距離計算手段で参照する英文字カタカナ読みテーブルの構成例を示す説明図である。
【図4】 図1における最小距離対応付け探索手段による英文字・カタカナの対応付け結果表の構成例を示す説明図である。
【図5】図1における要素間距離計算手段による要素間距離の計算結果例を示す説明図である。
【図6】図1における文字列bigram頻度テーブルの構成例を示す説明図である。
【図7】図1における文字列unigram頻度テーブルの構成例を示す説明図である。
【図8】図1における最大確率経路探索手段により出力される英単語カタカナ音訳の結果表例を示す説明図である。
【図9】図1および図2における本発明のアルファベット・日本語読み対応付け装置と方法およびアルファベット単語音訳装置と方法を実現するためのコンピュータシステムのハードウェア構成の一例を示すブロック図である。
【符号の説明】
1:アルファベット・日本語読み対応付け装置(「英文字・カタカナ対応付け装置」)、1a:要素間距離計算手段、1b:最小距離対応付け探索手段、1c:英文字カタカナ読みテーブル、1d:フィードバック手段、2:アルファベット単語音訳装置(「英単語カタカナ音訳装置」)、2a:音訳モデル作成手段、2b:英単語・カタカナ同時出現確率計算手段、2c:最大確率経路探索手段、2d:文字列ngram頻度テーブル、2e:文字列bigram頻度テーブル、2f:文字列unigram頻度テーブル、41:英文字・カタカナの対応付け結果表、81:英単語カタカナ音訳の結果表、91:表示装置、92:入力装置、93:外部記憶装置、94:情報処理装置、95:光ディスク、96:駆動装置。

Claims (7)

  1. 対で入力されたアルファベット単語と該アルファベット単語の日本語読みとに基づき、上記アルファベット単語を構成する部分文字列と該部分文字列に対する日本語読みとを対応付けたデータを生成するアルファベット文字・日本語読み対応付け装置であって、
    予めアルファベット部分文字列と該アルファベット部分文字列の1以上の日本語読みとを対応付けてテーブルに記憶する記憶手段と、
    上記アルファベット単語と該アルファベット単語の日本語読みとの対が入力されると、該アルファベット単語を構成する部分文字列と上記日本語読みを構成する部分文字列の全ての組合せの部分文字列間について、上記記憶手段で上記テーブルに記憶した対応付けを接続コストM(M≧0)、上記記憶手段で上記テーブルに記憶していない対応付けを接続コストN(N>M)として要素間距離の計算を行う要素間距離計算手段と、
    該要素間距離計算手段で計算した部分文字列間の要素間距離の語頭から語尾までの総和が最小になるアルファベット単語を構成する部分文字列と日本語読みを構成する部分文字列の組を求める対応付け探索手段とを有し
    上記要素間距離計算手段は要素間距離を計算するとき、アルファベットの部分文字列の長さと日本語読みを構成する部分文字列の長さとを0:1にした1文字挿入と、アルファベットの部分文字列の長さと日本語読みを構成する部分文字列の長さとを1:0にした1文字削除を取り入れ、1文字挿入と1文字削除はともに接続コストをNとして要素間距離の計算を行う
    ことを特徴とするアルファベット文字・日本語読み対応付け装置。
  2. 請求項1に記載のアルファベット文字・日本語読み対応付け装置であって、
    上記対応付け探索手段で求められたアルファベット単語を構成する部分文字列と日本語読みを構成する部分文字列の組を上記テーブルに新たに記憶させるフィードバック手段とをさらに有する
    ことを特徴とするアルファベット文字・日本語読み対応付け装置
  3. 請求項1あるいは請求項2に記載のアルファベット文字・日本語読み対応付け装置であって、
    上記対応付け探索手段で求められたアルファベット単語を構成する部分文字列と日本語読みを構成する部分文字列の組の生成頻度(文字列unigram頻度)を記憶する文字列unigram頻度記憶手段と、
    上記対応付け探索手段で求められたアルファベット単語を構成する部分文字列と日本語読みを構成する部分文字列の組の隣り合う二つのアルファベット文字・日本語読み対応データの組の生成頻度(文字列bigram頻度)を記憶する文字列bigram頻度記憶手段と、
    上記文字列unigram頻度と上記文字列bigram頻度に基づき、入力されたアルファベット単語を構成する全ての文字列と該文字列に対応する日本語読みの文字列との同時出現確率を計算する同時出現確率計算手段と、
    該同時出現確率計算手段で計算した同時出現確率を最大にする上記日本語読みの文字列の組合せを求める最大確率経路探索手段
    該最大確率経路探索手段で求めた組合せの日本語読みを上記入力されたアルファベット単語の日本語読みとして出力する手段とをさらに有する
    ことを特徴とするアルファベット文字・日本語読み対応付け装置
  4. 対で入力されたアルファベット単語と該アルファベット単語の日本語読みとに基づき、上記アルファベット単語を構成する部分文字列と該部分文字列に対する日本語読みとを対応付けたデータを生成するコンピュータシステムによるアルファベット文字・日本語読み対応付け方法であって、
    予めアルファベット部分文字列と該アルファベット部分文字列の1以上の日本語読みとを対応付けたテーブルを記憶装置に記憶する第1のステップと、
    上記アルファベット単語と該アルファベット単語の日本語読みとの対が入力されると、該アルファベット単語を構成する部分文字列と上記日本語読みを構成する部分文字列の全ての組合せの部分文字列間について、上記記憶装置で上記テーブルに記憶した対応付けを接続コストM(M≧0)、上記記憶装置で上記テーブルに記憶していない対応付けを接続コストN(N>M)として要素間距離の計算を行う第2のステップと、
    該第2のステップで計算した部分文字列間の要素間距離の語頭から語尾までの総和が最小になるアルファベット単語を構成する部分文字列と日本語読みを構成する部分文字列の組を求める第3のステップとを有し
    上記第2のステップでは要素間距離を計算するとき、アルファベットの部分文字列の長さと日本語読みを構成する部分文字列の長さとを0:1にした1文字挿入と、アルファベットの部分文字列の長さと日本語読みを構成する部分文字列の長さとを1:0にした1文字削除を取り入れ、1文字挿入と1文字削除はともに接続コストをNとして要素間距離の計算を行う
    ことを特徴とするアルファベット文字・日本語読み対応付け方法。
  5. 請求項4に記載のアルファベット文字・日本語読み対応付け方法であって、
    上記第3のステップで求められたアルファベット単語を構成する部分文字列と日本語読みを構成する部分文字列の組を上記テーブルに新たに記憶させる第4のステップをさらに有する
    ことを特徴とするアルファベット文字・日本語読み対応付け方法
  6. 請求項4あるいは請求項5に記載のアルファベット文字・日本語読み対応付け方法であって、
    上記第3のステップで求められたアルファベット単語を構成する部分文字列と日本語読みを構成する部分文字列の組の生成頻度(文字列unigram頻度)を記憶する第5のステップと、
    上記第3のステップで求められたアルファベット単語を構成する部分文字列と日本語読みを構成する部分文字列の組の隣り合う二つのアルファベット文字・日本語読み対応データの組の生成頻度(文字列bigram頻度)を記憶する第6のステップと、
    上記文字列unigram頻度と上記文字列bigram頻度に基づき、入力されたアルファベット単語を構成する全ての文字列と該文字列に対応する日本語読みの文字列との同時出現確率を計算する第7のステップと、
    第7のステップで計算した同時出現確率を最大にする上記日本語読みの文字列の組合せを求める第8のステップと、
    該第8のステップで求めた組合せの日本語読みを上記入力されたアルファベット単語の日本語読みとして出力する第9のステップとをさらに有する
    ことを特徴とするアルファベット文字・日本語読み対応付け方法
  7. 請求項1ないし3のいずれか1項に記載のアルファベット文字・日本語読み対応付け装置を構成する各手段としてコンピュータを機能させるプログラムを記録したことを特徴とするコンピュータ読み取り可能な記録媒体。
JP32489299A 1999-11-16 1999-11-16 アルファベット文字・日本語読み対応付け装置と方法およびアルファベット単語音訳装置と方法ならびにその処理プログラムを記録した記録媒体 Expired - Lifetime JP4084515B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP32489299A JP4084515B2 (ja) 1999-11-16 1999-11-16 アルファベット文字・日本語読み対応付け装置と方法およびアルファベット単語音訳装置と方法ならびにその処理プログラムを記録した記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP32489299A JP4084515B2 (ja) 1999-11-16 1999-11-16 アルファベット文字・日本語読み対応付け装置と方法およびアルファベット単語音訳装置と方法ならびにその処理プログラムを記録した記録媒体

Publications (2)

Publication Number Publication Date
JP2001142877A JP2001142877A (ja) 2001-05-25
JP4084515B2 true JP4084515B2 (ja) 2008-04-30

Family

ID=18170801

Family Applications (1)

Application Number Title Priority Date Filing Date
JP32489299A Expired - Lifetime JP4084515B2 (ja) 1999-11-16 1999-11-16 アルファベット文字・日本語読み対応付け装置と方法およびアルファベット単語音訳装置と方法ならびにその処理プログラムを記録した記録媒体

Country Status (1)

Country Link
JP (1) JP4084515B2 (ja)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3953772B2 (ja) * 2001-10-19 2007-08-08 日本放送協会 読みがな付与装置およびプログラム
CN100483399C (zh) * 2005-10-09 2009-04-29 株式会社东芝 训练音译模型、切分统计模型的方法和装置
JP2012042999A (ja) * 2010-08-12 2012-03-01 Casio Comput Co Ltd データ入力装置及びプログラム
JP5676517B2 (ja) * 2012-04-12 2015-02-25 日本電信電話株式会社 文字列類似度計算装置、方法、及びプログラム
JP6020093B2 (ja) * 2012-11-29 2016-11-02 三菱電機株式会社 アルファベット読み推定装置
JP6043651B2 (ja) * 2013-02-22 2016-12-14 日本放送協会 読みがな割当装置およびプログラム
JP6044996B2 (ja) * 2013-07-18 2016-12-14 日本電信電話株式会社 文字列対応付け装置、方法、及びプログラム

Also Published As

Publication number Publication date
JP2001142877A (ja) 2001-05-25

Similar Documents

Publication Publication Date Title
JP5997217B2 (ja) 言語変換において複数の読み方の曖昧性を除去する方法
US6490563B2 (en) Proofreading with text to speech feedback
JP2836159B2 (ja) 同時通訳向き音声認識システムおよびその音声認識方法
JP2003514304A5 (ja)
JP4570509B2 (ja) 読み生成装置、読み生成方法及びコンピュータプログラム
US20100125459A1 (en) Stochastic phoneme and accent generation using accent class
JP4266222B2 (ja) 単語翻訳装置およびそのプログラム並びにコンピュータ読み取り可能な記録媒体
JP2017097062A (ja) 読み付与装置、音声認識装置、読み付与方法、音声認識方法、およびプログラム
JPH10326275A (ja) 形態素解析方法および装置、並びに日本語形態素解析方法および装置
JP4084515B2 (ja) アルファベット文字・日本語読み対応付け装置と方法およびアルファベット単語音訳装置と方法ならびにその処理プログラムを記録した記録媒体
CN110555091A (zh) 一种基于词向量的联想词生成方法及装置
JP6811087B2 (ja) 検索装置、検索方法、及びプログラム
Liang et al. An efficient error correction interface for speech recognition on mobile touchscreen devices
Qafmolla Automatic language identification
JP3952964B2 (ja) 読み情報決定方法及び装置及びプログラム
JP4511274B2 (ja) 音声データ検索装置
KR100910275B1 (ko) 이중언어 문서에서의 음차표기 대역쌍 자동 추출 방법 및장치
JP2004309928A (ja) 音声認識装置、電子辞書装置、音声認識方法、検索方法、及びプログラム
JP4622861B2 (ja) 音声入力システム、音声入力方法、および、音声入力用プログラム
JPH11338498A (ja) 音声合成装置
Habeeb et al. Three N-grams Based Language Model for Auto-correction of Speech Recognition Errors
KR20090042201A (ko) 이중언어 문서에서의 음차표기 대역쌍 자동 추출 방법 및 장치
JP2004280467A (ja) 翻訳装置、翻訳方法、及びそのプログラム
Bhuyan et al. Generation of Missing Words in Assamese text using N-gram based Model
JP2024001922A (ja) 情報処理システム、情報処理方法およびプログラム

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040611

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040810

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20040903

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20060731

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20070119

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20071226

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080215

R151 Written notification of patent or utility model registration

Ref document number: 4084515

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110222

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110222

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120222

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130222

Year of fee payment: 5

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

EXPY Cancellation because of completion of term