JP3048793B2 - 文字変換装置 - Google Patents

文字変換装置

Info

Publication number
JP3048793B2
JP3048793B2 JP5173002A JP17300293A JP3048793B2 JP 3048793 B2 JP3048793 B2 JP 3048793B2 JP 5173002 A JP5173002 A JP 5173002A JP 17300293 A JP17300293 A JP 17300293A JP 3048793 B2 JP3048793 B2 JP 3048793B2
Authority
JP
Japan
Prior art keywords
katakana
notation
unit
word
conversion
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP5173002A
Other languages
English (en)
Other versions
JPH0728807A (ja
Inventor
至幸 小山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP5173002A priority Critical patent/JP3048793B2/ja
Publication of JPH0728807A publication Critical patent/JPH0728807A/ja
Application granted granted Critical
Publication of JP3048793B2 publication Critical patent/JP3048793B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)
  • Machine Translation (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】この発明は、ワードプロセッサ等
の日本語入力装置や英日機械翻訳装置に使用される文字
変換装置に関する。
【0002】
【従来の技術】従来、ワードプロセッサ等の日本語入力
装置によって作成された日本文において、外来語等の単
語が例えば英語の綴りのままで書き込まれている場合が
ある。このような日本文を編集するに際して編集対象の
日本文中の英語表記による単語(以下、英単語と言う)を
片仮名表記に変更する際には、上記英単語を一旦消して
から再度片仮名を入力する必要がある。
【0003】一方、上記日本語入力装置に英単語を片仮
名表記で入力する場合に、ローマ字形式で入力するより
も英語形式で入力したいという要望がある。すなわち、
例えば「ヘッド」という片仮名の文字列を入力する際に、
「heddo」と入力するよりも「head」と入力し、この入力文
字列「head」を片仮名文字列「ヘッド」に変換する方法であ
る。このような要望に応えて、英語綴りで入力した場合
に片仮名文字列に変換する日本語ワードプロセッサが提
案されている(特開昭63−255767公報)。
【0004】この日本語ワードプロセッサは、次のよう
にして外来語の原語による綴りでの入力を片仮名文字列
に変換する。先ず、入力発音解析部によって、入力され
た外来語の原語による綴りを発音の単位(音節)に分解し
て入力単語全体の原語による発音を推定する。次に、原
語日本語発音変換部によって、上記推定された入力外来
語の原語による発音を日本語の発音に変換する。そし
て、日本語発音表示部によって、得られた入力外来語の
日本語読みを片仮名表記として出力するのである。
【0005】
【発明が解決しようとする課題】しかしながら、上記外
来語の原語による綴での入力を片仮名文字列に変換する
日本語ワードプロセッサには次のような問題がある。
【0006】(1) 一つの音節が二つ以上の発音を有し
ている場合には適切な片仮名に変換できない。例えば、
英単語「country」および英単語「counter」を音節に区
切ると、「coun/try」および「coun/ter」となって同じ音
節「coun」を有する。ところが、英単語「country」にお
ける音節「coun」の発音は以下に示すような発音1である
のに対し、英単語「counter」における音節「coun」の発音
は以下に示すような発音2であり、片仮名に変換した場
合には夫々「カン」および「カウン」となるべきである。
【表1】 ところが、一つの音節に対しては一つの発音を対応付け
る必要があるために音節「coun」の発音として発音2を登
録すると、入力英単語「counter」は「カウンター」と変換
できても入力英単語「country」は「カントリー」ではなく
「カウントリー」と変換されてしまうのである。
【0007】(2) 英語の音節は5000音節以上と沢
山存在する。そのために、上記原語日本語発音変換部に
よって原語による発音(英語の音節)を日本語の発音に変
換する際に用いる変換テーブルが非常に膨大なものとな
ってしまう。
【0008】そこで、この発明の目的は、二つ以上の発
音を有する音節を含む原語表記による単語であっても適
切な片仮名表記に変換可能な文字変換装置、あるいは、
大きな音節変換テーブルを用いることなく適切な片仮名
表記に変換可能な文字変換装置を提供することにある。
【0009】
【課題を解決するための手段】上記目的を達成するた
め、請求項1に係る発明は、原語表記による単語を片仮
名表記に変換する文字変換装置であって、変換対象とな
る単語を原語表記で入力する入力部と、原語表記による
発音単位とその発音単位の片仮名表記とを対応付けて成
る原語/片仮名変換テーブルを格納した変換テーブル格
納部と、原語による単語の適切な片仮名表記を登録して
成る片仮名辞書を格納した辞書格納部と、上記原語/片
仮名変換テーブルを用いて,上記入力部から入力された
原語表記による単語を上記発音単位で片仮名表記に変換
する変換部と、上記変換部によって得られた発音単位で
の片仮名表記に基づいて当該原語表記による単語の片仮
名表記の候補を生成する片仮名候補生成部と、上記片仮
名辞書を用いて,上記片仮名候補生成部によって生成さ
れた片仮名候補が適切な片仮名表記であるか否かをチェ
ックするチェック部と、上記チェック部によって適切な
片仮名表記であると判定された片仮名候補を出力する出
力部を備えたことを特徴としている。
【0010】また、請求項2に係る発明は、原語表記に
よる単語を片仮名表記に変換する文字変換装置であっ
て、変換対象となる単語を原語表記で入力する入力部
と、原語表記による発音単位をその発音単位を構成する
要素に区切る際の区切りルールを格納するルール格納部
と、上記原語表記による発音単位の構成要素とその発音
単位の構成要素のローマ字表記とを対応付けて成る原語
/ローマ字変換テーブルを格納した第1変換テーブル格
納部と、日本語の音節のローマ字表記とそのローマ字表
記に対応する片仮名表記とを対応付けて成るローマ字/
片仮名変換テーブルを格納した第2変換テーブル格納部
と、原語による単語の適切な片仮名表記を登録して成る
片仮名辞書を格納した辞書格納部と、上記区切りルール
を適用して,上記入力部から入力された原語表記による
単語を上記発音単位の構成要素に区切る表記区切り部
と、上記原語/ローマ字変換テーブルを用いて,上記表記
区切り部によって区切られた上記原語表記による発音単
位の構成要素をローマ字表記に変換するローマ字表記変
換部と、上記ローマ字/片仮名変換テーブルを用いて,上
記ローマ字表記変換部からのローマ字表記に基づく日本
語の音節を表すローマ字表記を片仮名表記に変換する片
仮名表記変換部と、上記片仮名表記変換部によって得ら
れた日本語の音節単位での片仮名表記に基づいて当該原
語表記による単語の片仮名表記の候補を生成する片仮名
候補生成部と、上記片仮名辞書を用いて,上記片仮名候
補生成部によって生成された片仮名候補が適切な片仮名
表記であるか否かをチェックするチェック部と、上記チ
ェック部によって適切な片仮名表記であると判定された
片仮名候補を出力する出力部を備えたことを特徴として
いる。
【0011】
【作用】請求項1に係る発明では、入力部から原語表記
による単語が入力されると、変換部によって、変換テー
ブル格納部に格納された原語/片仮名変換テーブルを用
いて、当該原語表記による単語が発音単位で片仮名表記
に変換される。そして、この発音単位での片仮名表記に
基づいて、当該原語表記による単語の片仮名表記の候補
が片仮名候補生成部によって生成される。そうすると、
チェック部によって、辞書格納部に格納された片仮名辞
書を用いて、上記片仮名候補生成部で生成された片仮名
候補が適切な片仮名表記であるか否かがチェックされ
る。そして、適切な片仮名表記であると判定された片仮
名候補が出力部から出力される。
【0012】こうして、複数の発音を有する発音単位を
含む原語表記による単語が入力されても、上記片仮名候
補生成部によって上記複数の発音に起因する片仮名候補
が生成され、チェック部によって適切な片仮名表記のみ
が選別されて、適切な片仮名表記が出力される。
【0013】また、請求項2に係る発明では、入力部か
ら原語表記による単語が入力されると、表記区切り部に
よって、原語表記による発音単位を構成要素に区切る際
の区切りルールが適用されて、当該原語表記による単語
が上記発音単位の構成要素に区切られる。そして、ロー
マ字表記変換部によって、第1変換テーブル格納部に格
納されている原語/ローマ字変換テーブルを用いて、上
記表記区切り部で区切られた上記原語表記による発音単
位の構成要素がローマ字表記に変換される。さらに、片
仮名表記変換部によって、第2変換テーブル格納部に格
納されているローマ字/片仮名変換テーブルを用いて、
上記ローマ字表記変換部からのローマ字表記に基づく日
本語の音節を表すローマ字表記が片仮名表記に変換され
る。
【0014】そうすると、上記片仮名表記変換部によっ
て得られた日本語の音節単位での片仮名表記に基づい
て、当該原語表記による単語の片仮名表記の候補が片仮
名候補生成部によって生成される。そして、チェック部
によって、辞書格納部に格納された片仮名辞書を用い
て、上記片仮名候補生成部で生成された片仮名候補が適
切な片仮名表記であるか否かがチェックされ、適切な片
仮名表記であると判定された片仮名候補が出力部から出
力される。
【0015】こうして、上記原語表記による発音単位の
構成要素を表現することが可能なローマ字を媒体とし
て、当該原語表記による単語に係る発音単位の構成要素
から当該原語表記による単語を表す日本語の音節を単位
とする片仮名表記が得られ、この音節単位での片仮名表
記に基づいて当該原語表記による単語が片仮名表記に変
換されるのである。
【0016】
【実施例】以下、この発明を図示の実施例により詳細に
説明する。 <第1実施例>図1は本実施例の文字変換装置における
ブロック図である。入力部1はキーボード等から成り、
原語表記による単語(以下の説明では英単語であるとす
る)が取り込まれる。尚、入力部1による英単語の取り
込みとしては、キー入力等によって英字文字列を直接入
力することや編集時等においては文書格納部(図示せず)
に格納された文書中から英単語を指定して取り込むこと
が可能である。
【0017】こうして、上記入力部1から取り込まれた
英単語が変換部2に送出され、データ部3に格納された
音節/片仮名変換テーブルを参照して片仮名表記に変換
される。そして更に、得られた片仮名表記を用いて入力
英単語の片仮名候補を生成する。チェック部4は、チエ
ック辞書5を引いて、変換部2によって得られた片仮名
候補の中から適切な片仮名表記を選出する。そして、選
出された片仮名表記はディスプレイ等から成る出力部6
より出力されて表示される。
【0018】図2は、上記入力部1,変換部2,チエック
部4および出力部6によって実施される英字/片仮名変
換処理動作のフローチャートである。以下、図2に従っ
て、英単語「country」を入力して片仮名表記「カントリ
ー」に変換する場合を例に、英字/片仮名変換処理動作に
ついて詳細に説明する。
【0019】ステップS1で、上述のようにして、英単
語「country」が入力部1から入力されて変換部2に送出
される。ステップS2で、上記変換部2において、入力
された英単語「country」が「coun/try」の2音節に分割さ
れる。ここで、英単語を音節に分解する方法としては多
くの既知の方法があり、何れの方法を用いても構わな
い。
【0020】ステップS3で、上記音節「coun」,「try」の
うち、最初の音節「coun」が取り出される。ステップS4
で、上記データ部3に格納されている音節/片仮名変換
テーブルを参照して英語表記の音節が片仮名表記に置き
換えられる。ここで、上記音節/片仮名変換テーブル
は、図3に示すように“英語表記の音節(音節)"とこの
音節の発音を表す“片仮名表記(片仮名)"とを対応付け
た構造を有している。尚、上述のように、複数の発音を
有する音節の場合には、夫々の発音を表す複数の片仮名
表記を対応付けている。したがって、本例の場合には音
節「coun」が片仮名表記「カウン」および「カン」に置き換え
られるのである。
【0021】ステップS5で、当該音節が入力英単語に
おける最終音節であるか否かが判別される。その結果最
終音節であればステップS6に進み、そうでなければス
テップS3に戻って未処理の音節中の最初の音節に対す
る処理に入る。本例の場合には、音節「coun」は最終音節
ではないので、再度ステップS3およびステップS4によ
って次の音節「try」が片仮名表記「トリー」および「トラ
イ」に置き換えられる。そうした後、ステップS5におい
て最終音節であると判定されてステップS6に至る。
【0022】ステップS6で、上記ステップS4において
得られた片仮名表記に基づいて、以下のようにして片仮
名候補が生成される。すなわち、上記得られた音節「cou
n」に係る片仮名表記「カウン」,「カン」と、音節「try」に係
る片仮名表記「トリー」,「トライ」を所定の手順で組み合
わせて、片仮名候補「カウントリー」,「カウントライ」,
「カントリー」および「カントライ」を得るのである。つま
り、本ステップで、上記片仮名候補生成部を構成するの
である。
【0023】ステップS7で、得られた片仮名候補のう
ち最初の片仮名候補が読み出されてチェック部4に送出
される。そして、チェック辞書5が検索されて、チェッ
ク辞書5にマッチする片仮名表記が登録されているか否
かが判別される。その結果登録されていればステップS
8に進み、登録されていなければステップS8をスキップ
する。ここで、上記チェック辞書5は、図4に示すよう
に、英単語の発音を表す片仮名表記が五十音順に配列さ
れた構造を有している。ステップS8で、マッチした片
仮名表記をチェック部4の内部バッファ(図示せず)に格
納する。ステップS9で、当該片仮名候補が上記ステッ
プS6において生成された片仮名候補の最終候補である
か否かが判別される。その結果最終候補であればステッ
プS10に進み、そうでなければステップS7に戻って未
処理の片仮名候補中の最初の片仮名候補に対する処理に
入る。
【0024】ここで、本例の場合には片仮名候補が4つ
存在するためにステップS7〜ステップS9を4周する。
その結果、4つの片仮名候補「カウントリー」,「カウント
ライ」,「カントリー」及び「カントライ」のうち片仮名候補
「カントリー」のみがチェック辞書5の登録内容とマッチ
するので、上記内部バッファには片仮名候補「カントリ
ー」が格納されてステップS10に至る。ステップS10
で、上記内部バッファに格納された片仮名表記「カント
リー」が出力部6から出力されて英字/片仮名変換処理動
作を終了する。
【0025】尚、上記片仮名候補とマッチする片仮名表
記が得られない場合には、例えば文字列「候補なし」を出
力するか或は何も出力せずに元の英単語の表記のままに
しておく。また、片仮名候補とマッチする片仮名表記が
複数得られた場合には、マッチした順に片仮名表記を表
示する。
【0026】このように得られた複数の片仮名表記を総
て表示するのは、英単語「lead」のように“リード線のリ
ード"を表す場合の「リード」と“鉛"を表す場合の「レッ
ド」との2通りの片仮名表記があるような場合にも対処
できるようにするためである。尚、その際における複数
片仮名表記の出力順をより適切にしたい場合には、例え
ばチェック辞書5の片仮名表記に出現頻度を与えておけ
ば、出現頻度順に出力することができる。
【0027】次に、上記英単語「country」と同じ文節「c
oun」を有して発音が異なる英単語「counter」を片仮名
表記に変換する場合の英字/片仮名変換処理動作につい
て、図2〜図4に基づいて説明する。
【0028】入力された英単語「counter」が2音節「coun
/ter」に分割される。そして、音節「coun」が片仮名表記
「カウン」および「カン」に置き換えられる一方、音節「te
r」が片仮名表記「ター」に置き換えられる。…ステップS
1〜ステップS5 得られた片仮名表記「カウン」,「カン」と「ター」とを組み
合わせて2つの片仮名候補「カウンター」および「カンタ
ー」が生成される。ところが、チェック辞書5には片仮
名表記「カンター」が登録されていないので、チェック辞
書5とのマッチングの結果片仮名表記「カウンター」のみ
が出力される。…ステップS6〜ステップS10
【0029】このように、本実施例においては、英単語
の片仮名表記として適切な片仮名表記を登録したチェッ
ク辞書5を備える。そして、変換部2によって音節/片
仮名変換テーブルを用いて音節単位で得た片仮名表記に
基づいて入力英単語の片仮名候補を得、この片仮名候補
のうちチェック辞書5に登録されている片仮名候補を入
力英単語の適切な片仮名表記として出力するようにして
いる。したがって、発音の異なる同一音節「coun」を有す
るような英単語「country」と「counter」との場合であっ
ても、適切な片仮名表記「カントリー」と「カウンター」
とに区別して変換できるのである。
【0030】<第2実施例>図5は本実施例の文字変換
装置におけるブロック図である。入力部11はキーボー
ド等から成っており、第1実施例と同様にして英単語が
取り込まれる。こうして、取り込まれた英単語の表記
が、表記区切り部12によって、第1データ部13に格
納された区切りルールを用いて区切られる。
【0031】変換部14は、上記表記区切り部12によ
って区切られた各英文字列に基づいて第2データ部15
に格納された英字/ローマ字変換テーブルおよびローマ
字/片仮名変換テーブルを参照して日本語の音節の片仮
名表記を得る。そして更に、得られた片仮名表記を用い
て当該英単語の片仮名候補を生成する。こうして、入力
英単語を片仮名表記に変換するのである。チェック部1
6は、チエック辞書17を引いて、変換部14によって
得られた片仮名候補の中から適切な片仮名表記を選出す
る。そして、選出された片仮名表記はディスプレイ等か
ら成る出力部18より出力されて表示される。
【0032】図6および図7は、上記入力部11,表記
区切り部12,変換部14,チエック部16および出力部
18によって実施される英字/片仮名変換処理動作のフ
ローチャートである。以下、図6および図7に従って、
英単語「counter」を入力して片仮名表記「カウンター」に
変換する場合を例に、英字/片仮名変換処理動作につい
て詳細に説明する。
【0033】ステップS11で、上述のようにして、英単
語「counter」が入力部11から入力されて表記区切り部
12に送出される。ステップS12で、上記表記区切り部
12において、第1データ部13に格納されている図8
に示すような区切りルールを参照して、入力英単語「cou
nter」の表記が以下のようにして区切られる。
【0034】すなわち、先ず英単語「counter」に対して
上記区切りルールにおける第1ルールが適用される。そ
の結果、「coun/ter」の如く、連続する子音文字間で区切
られる。次に第2ルールが適用される。その結果、「cou
/n/te/r」の如く、母音文字と子音文字との連鎖における
母音文字と子音文字との間で区切られる。次に、当該英
単語「counter」には英文字“y"が存在しないので第3ル
ールは適用されない。次に第4ルールが適用される。そ
の結果、「cou/n/ter」の如く、最後の文字“r"の前の区
切りが削除される。こうして、当該英単語「counter」が
「cou/n/ter」の如く区切られるのである。
【0035】ステップS13で、上述のように区切られた
英文字列のうち、最初の英文字列が取り出される。ステ
ップS14で、上記取り出された英文字列が1文字である
か否かが変別される。その結果1文字であればステップ
S15に進み、そうでなければステップS20に進む。ステ
ップS15で、上記取り出された1英文字に、この1英文
字に続く英文字列のうち最初に出現する母音文字の直前
の英文字まで(つまり、当該1英文字に連鎖する子音文
字列が)付加される。
【0036】ステップS16で、上記第2データ部15に
格納された英字/ローマ字変換テーブルが検索されて、
当該英文字列にマッチするローマ字表記が登録されてい
るか否かが判別される。その結果登録されていればステ
ップS17に進み、登録されていなければステップS18に
進む。ここで、上記英字/ローマ字変換テーブルは、図
9に示すように、“英文字列(英字)"とこの英文字列の
発音を表す“ローマ字列(ローマ字)"とを対応付けた構
造を有している。ステップS17で、当該英文字列を構成
する上記1英文字とこの1英文字に続く子音文字との間
の区切りを削除して得られた英文字列のローマ字表記
が、英字/ローマ字変換テーブルを参照して得られる。
そうした後、得られたローマ字表記が英語表記と見なさ
れて、上記ステップS12において区切られて且つ現在上
記ステップS13において取り出されている英文字列が当
該英語表記による文字列に置き換えられる。すなわち、
本ステップでは、後に実例を上げて説明するように“黙
字"を削除したり、英文字列「ph」をローマ字表記「f」に
変換したりするのである。
【0037】ステップS18で、当該英文字列にマッチす
るローマ字表記が英字/ローマ字変換テーブル中に登録
されていないので、元の英文字列(1英文字)に置き換え
られる。こうして置き換えられた1英文字が、以後の処
理ではローマ字表記であると見なされる。ステップS19
で、上記第2データ部15に格納されているローマ字/
片仮名変換テーブルを参照して当該ローマ字表記が片仮
名表記に変換された後、ステップS23に進む。ここで、
上記ローマ字/片仮名変換テーブルは、図10に示すよ
うに日本語の音節の“ローマ字表記(ローマ字)"とこの
ローマ字表記に対応する“片仮名表記(片仮名)"とを対
応付けた構造を有している。
【0038】ステップS20で、上記ステップS13におい
て取り出された英文字列は複数文字からなるので、この
複数文字が母音文字と子音文字とに分割される。ステッ
プS21で、上記第2データ部15に格納された英字/ロ
ーマ字変換テーブルが参照されて、上記ステップS20に
おいて得られた当該子音文字がローマ字表記に置き換え
られる。ステップS22で、同様にして上記ステップS20
において得られた当該母音文字がローマ字表記に置き換
えられた後、上記ステップS19に進む。ステップS23
で、当該英文字列が入力英単語を構成する最終英文字列
であるか否かが判別される。その結果最終英文字列であ
ればステップS24に進み、そうでなければステップS13
に戻って未処理の英文字列中の最初の英文字列に対する
処理に入る。
【0039】ここで、上記ステップS12において上述の
ようにして入力英単語「counter」が区切られて得られた
3つの英文字列「cou」,「n」,「ter」が、上記ステップS13
〜ステップS23において如何様に処理されるのかを具体
的に説明する。
【0040】先ず、最初の英文字列「cou」は1文字では
ないので子音文字「c」と母音文字「ou」とに分割される。
そして、子音文字「c」がローマ字表記「k」に置き換えら
れる一方、母音文字「ou」がローマ字表記「au」及び「a」
に置き換えられる。その結果、当該英文字列「cou」がロ
ーマ字表記「kau」及び「ka」に置き換わる。そして、
このローマ字表記「ka/u」および「ka」が片仮名表記
「カ/ウ」および「カ」に変換されるのである。…ステップ
S13,ステップS14,ステップS20〜ステップS22,ステ
ップS19
【0041】当該英文字列「cou」は最終文字列ではない
ので、次の英文字列「n」が取り出される。
…ステップS23,ステップ
S13 当該英文字列「n」は1文字であるので、当該英文字列「n」
に連鎖する子音文字列「t」が付加されて英文字列「nt」が
得られる。ところが、得られた英文字列「nt」にマッチす
るローマ字表記が英字/ローマ字変換テーブルには登録
されていないので、元の1英文字「n」に戻される。そし
て、当該英文字列「n」をローマ字表記「n」と見なしてロ
ーマ字/片仮名変換テーブルが参照されて、ローマ字表
記「n」が片仮名表記「ン」に変換されるのである。…ステ
ップS14〜ステップS16,ステップS18,ステップS19
【0042】当該英文字列「n」は最終文字列ではないの
で、次の英文字列「ter」が取り出される。
…ステップS23,ステップ
S13 当該英文字列「ter」は1文字ではないので子音文字「t」と
母音文字「er」とに分割される。その際に、上記区切りル
ールの第4ルールが適用されているので、英文字列「er」
は英文字「e」と「r」とに分割されない。こうして得られた
子音文字「t」がローマ字表記「t」に置き換えられる一
方、母音文字「er」がローマ字表記「a:」に置き換えられ
る。その結果、当該英文字列「ter」がローマ字表記「t
a:」に置き換わる。そして、このローマ字表記「t
a:」が片仮名表記「ター」に変換されるのである。尚、
表記「:」は、通常のローマ字表記にはないが長音「ー」を
表すために設けた表記である。…ステップS14,ステッ
プS20〜ステップS22,ステップS19 当該英文字列「ter」は最終文字列であるからステップS2
4に至る。…ステップS23
【0043】このようにして、上記3つの英文字列「co
u」,「n」,「ter」は、上記ステップS13〜ステップS23によ
って夫々「カウ」および「カ」,「ン」,「ター」の片仮名表記に
変換されるのである。
【0044】ステップS24で、上記ステップS19におい
て得られた片仮名表記「カウ」および「カ」,「ン」,「ター」に
基づいて、以下のようにして片仮名候補が生成される。
すなわち、上記得られた英文字列「cou」に係る片仮名表
記「カウ」,「カ」と、英文字列「n」に係る片仮名表記「ン」
と、英文字列「ter」に係る片仮名表記「ター」を所定の手
順で組み合わせて、片仮名候補「カウンター」および「カ
ンター」を得るのである。つまり、本ステップで、上記
片仮名候補生成部を構成するのである。
【0045】以下、第1実施例の場合と全く同様にし
て、ステップS25における片仮名候補とチェック辞書1
7とのマッチング、ステップS26におけるマッチした片
仮名表記の内部バッファへの格納、ステップS27におけ
る最終候補のチェック、ステップS28における上記内部
バッファ内の片仮名表記の出力が実行される。その結
果、入力英文字列「counter」の片仮名表記「カウンター」
が出力部18から出力されて英字/片仮名変換処理動作
を終了する。
【0046】次に、黙字「w」を有する英単語「writer」を
片仮名表記に変換する場合の英字/片仮名変換処理動作
について、図5〜図10に基づいて説明する。
【0047】入力された英単語「writer」に上記区切り
ルールの第1ルールが適用されて、「w/riter」の如く分
割される。さらに、第2ルールが適用されて「w/ri/te/
r」の如く分割され、第4ルールが適用されて「w/ri/ter」
の如く分割される。…ステップS11,ステップS12 最初の英文字列「w」は1文字であるので、連鎖する子音
文字列を付加して英文字列「wr」が得られる。そして、得
られた英文字列「wr」にマッチするローマ字表記が英字/
ローマ字変換テーブルに登録されているので、「w/ri/te
r」の如く分割された当該英文字列「w」に係る区切りが削
除され、英字/ローマ字変換テーブルより英文字列「wr」
のローマ字表記「r」が得られる。そして、このローマ字
表記「r」が英文字表記「r」と見なされて、入力英単語「w/
ri/ter」が英単語「ri/ter」に変換されるのである。…ス
テップS13〜ステップS17
【0048】再度、最初の英文字列「ri」が取り出され
る。この英文字列「ri」は1文字ではないので子音文字と
母音文字とに分割されて、子音文字および母音文字の夫
々がローマ字表記に置き換えられる。その結果、当該英
文字列「ri」がローマ字表記「ri」,「r:」および「ra
i」に置き換わる。そして、このローマ字表記「ri」,
「r:」および「rai」が片仮名表記「リ」,「リー」および
「ライ」に変換されるのである。…ステップS13,ステッ
プS14,ステップS20〜ステップS22,ステップS19
【0049】当該英文字列「ri」は最終文字列ではないの
で、次の英文字列「ter」が取り出される。
…ステップS23,ステップS
13 上述した英単語「counter」の場合と同様にして、当該英
文字列「ter」を子音文字と母音文字とに分割してローマ
字表記「ta:」に置き換えられる。そして、このローマ
字表記「ta:」が片仮名表記「ター」に変換される。…ス
テップS14,ステップS20〜ステップS22,ステップS19
【0050】当該英文字列「ter」は最終文字列であるか
ら、英文字列「ri」の片仮名表記「リ」,「リー」,「ライ」と
英文字列「ter」の片仮名表記「ター」とが組み合わされ
て、片仮名候補「リター」,「リーター」および「ライター」
が生成される。そして、上記チェック辞書17が検索さ
れて適切な片仮名候補「ライター」が得られ、入力英単語
「writer」の片仮名表記として出力される。…ステップS
23〜ステップS28
【0051】このように、特定の英文字と文字連鎖を呈
する際に発音されないような黙字を有する英単語の場合
には、上記黙字を削除した英文字列に変換した後に英字
/片仮名変換処理動作を実行することによって、容易に
片仮名表記に変換できるのである。
【0052】上述したように、本実施例においては、入
力英単語の音節をその構成要素となる英文字列に分割す
るための4つのルールから成る区切りルールを第1デー
タ部13に格納する。また、第2データ部15には、英
語の音節の構成要素である英文字列とこの英文字列の発
音を表すローマ字表記とを対応付けた英字/ローマ字変
換テーブル、および、日本語の音節のローマ字表記とこ
のローマ字表記の発音を表す片仮名表記とを対応付けた
ローマ字/片仮名変換テーブルを格納する。さらに、第
1実施例の場合と同様に、英単語の片仮名表記として適
切な片仮名表記を登録したチェック辞書17を備える。
【0053】そして、上記表記区切り部12によって上
記区切りルールを用いて入力英単語を音節の構成要素で
ある英文字列に分割した後、変換部14によって、上記
英字/ローマ字変換テーブルおよびローマ字/片仮名変換
テーブルを用いて得た日本語の音節単位での片仮名表記
に基づいて入力英単語の片仮名候補を得る。そして、こ
の片仮名候補のうちチェック辞書17に登録されている
片仮名候補を入力英単語の適切な片仮名表記として出力
するようにしている。
【0054】このように、本実施例においては、ローマ
字表記を媒体として入力英単語を片仮名表記に変換する
ので、音節の構成要素を処理単位として入力英単語を片
仮名表記に変換できる。ここで、音節は上記要素の組み
合わせで構成されているのであるから、上記要素の数は
音節の数に比べて桁違いに少ない。その結果、5000
以上も存在する音節は、入力英単語の表記を上記要素に
分割する幾つかの(本実施例においては“4つ")簡単な
ルールと100項目程度の英字/ローマ字変換テーブル
と100項目程度のローマ字/片仮名変換テーブルによ
って片仮名表記に変換できるのである。
【0055】したがって、本実施例によれば、5000
項目以上の音節/片仮名変換テーブルを必要とはせず、
且つ、上記チェック辞書17を用いて二つ以上の発音を
有する音節を含む英単語であっても適切な片仮名表記に
変換できるのである。
【0056】この発明における英字/片仮名変換処理の
アルゴリズムは図2および図6,図7に示すフローチャ
ートに限定されるもではない。また、上記音節/片仮名
変換テーブル,チェック辞書,区切りルール,英字/ローマ
字変換テーブルおよびローマ字/片仮名変換テーブルの
内容は、図3,図4,図8,図9および図10に限定され
ないことは言うまでもない。また、上記各実施例におい
ては英単語を片仮名表記に変換する場合を例に説明して
いるが、他の外国語の原語表記による単語の場合であっ
ても同様にして片仮名表記に変換できる。
【0057】
【発明の効果】以上より明らかなように、請求項1に係
る発明の文字変換装置は、原語/片仮名変換テーブルお
よび片仮名辞書を有して、変換部によって、入力部から
入力された原語表記による単語を上記原語/片仮名変換
テーブルを用いて発音単位で片仮名表記に変換した後、
片仮名候補生成部によって当該原語表記による単語の片
仮名候補を生成し、チェック部によって、上記片仮名辞
書を用いて、上記生成された片仮名候補が適切な片仮名
表記であるか否かをチェックして適切な片仮名表記を出
力部から出力するので、当該原語表記による単語が複数
の発音を有する発音単位を含んでいる場合には、この複
数の発音に起因した複数の片仮名候補を生成して上記片
仮名辞書を用いてチェックすることによって適切な片仮
名表記のみを出力できる。
【0058】したがって、この発明によれば、二つ以上
の発音を有する音節を含む原語表記による単語であって
も適切な片仮名表記に変換できる。
【0059】また、請求項2に係る発明の文字変換装置
は、原語表記による発音単位を構成要素に区切る際の区
切りルール,原語/ローマ字変換テーブルおよびローマ字
/片仮名変換テーブルを有して、表記区切り部,ローマ字
表記変換部,片仮名表記変換部および片仮名候補生成部
によって、ローマ字を媒体として原語表記による単語に
係る発音単位の構成要素から当該原語表記による単語を
表す日本語の音節を単位とする片仮名表記を得て当該原
語表記による単語の片仮名候補を得るので、原語表記に
よる発音単位よりも種類が少ない上記発音単位の構成要
素を最小処理単位として原語表記による単語を片仮名表
記に変換できる。したがって、この発明によれば、より
少ない変換情報に基づいて原語表記による単語を片仮名
表記に変換できる。
【0060】さらに、片仮名辞書を有して、チェック部
によって上記片仮名候補生成部からの片仮名候補のうち
適切な片仮名表記であると判定された片仮名候補を出力
部から出力するので、二つ以上の発音を有する音節を含
む原語表記による単語であっても適切な片仮名表記に変
換できる。
【図面の簡単な説明】
【図1】この発明の第1実施例における文字変換装置の
ブロック図である。
【図2】図1に示す文字変換装置による英字/片仮名変
換処理動作のフローチャートである。
【図3】図1におけるデータ部に格納された音節/片仮
名変換テーブルの構造を示す図である。
【図4】図1におけるチェック辞書の構造を示す図であ
る。
【図5】この発明の第2実施例における文字変換装置の
ブロック図である。
【図6】図2に示す文字変換装置による英字/片仮名変
換処理動作のフローチャートである。
【図7】図6に続く英字/片仮名変換処理動作のフロー
チャートである。
【図8】図5における第1データ部に格納された区切り
ルールの内容を示す図である。
【図9】図5における第2データ部に格納された英字/
ローマ字変換テーブルの構造を示す図である。
【図10】図5における第2データ部に格納されたロー
マ字/片仮名変換テーブルの構造を示す図である。
【符号の説明】
1,11…入力部、 2,14…変換
部、3…データ部、 4,16…
チェック部、5,17…チェック辞書、
6,18…出力部、12…表記区切り部、
13…第1データ部、15…第2データ部。

Claims (2)

    (57)【特許請求の範囲】
  1. 【請求項1】 原語表記による単語を片仮名表記に変換
    する文字変換装置であって、 変換対象となる単語を原語表記で入力する入力部と、 原語表記による発音単位とその発音単位の片仮名表記と
    を対応付けて成る原語/片仮名変換テーブルを格納した
    変換テーブル格納部と、 原語による単語の適切な片仮名表記を登録して成る片仮
    名辞書を格納した辞書格納部と、 上記原語/片仮名変換テーブルを用いて、上記入力部か
    ら入力された原語表記による単語を上記発音単位で片仮
    名表記に変換する変換部と、 上記変換部によって得られた発音単位での片仮名表記に
    基づいて、当該原語表記による単語の片仮名表記の候補
    を生成する片仮名候補生成部と、 上記片仮名辞書を用いて、上記片仮名候補生成部によっ
    て生成された片仮名候補が適切な片仮名表記であるか否
    かをチェックするチェック部と、 上記チェック部によって適切な片仮名表記であると判定
    された片仮名候補を出力する出力部を備えたことを特徴
    とする文字変換装置。
  2. 【請求項2】 原語表記による単語を片仮名表記に変換
    する文字変換装置であって、 変換対象となる単語を原語表記で入力する入力部と、 原語表記による発音単位をその発音単位を構成する要素
    に区切る際の区切りルールを格納するルール格納部と、 上記原語表記による発音単位の構成要素とその発音単位
    の構成要素のローマ字表記とを対応付けて成る原語/ロ
    ーマ字変換テーブルを格納した第1変換テーブル格納部
    と、 日本語の音節のローマ字表記とそのローマ字表記に対応
    する片仮名表記とを対応付けて成るローマ字/片仮名変
    換テーブルを格納した第2変換テーブル格納部と、 原語による単語の適切な片仮名表記を登録して成る片仮
    名辞書を格納した辞書格納部と、 上記区切りルールを適用して、上記入力部から入力され
    た原語表記による単語の表記を上記発音単位の構成要素
    に区切る表記区切り部と、 上記原語/ローマ字変換テーブルを用いて、上記表記区
    切り部によって区切られた上記原語表記による発音単位
    の構成要素をローマ字表記に変換するローマ字表記変換
    部と、 上記ローマ字/片仮名変換テーブルを用いて、上記ロー
    マ字表記変換部からのローマ字表記に基づく日本語の音
    節を表すローマ字表記を片仮名表記に変換する片仮名表
    記変換部と、 上記片仮名表記変換部によって得られた日本語の音節単
    位での片仮名表記に基づいて、当該原語表記による単語
    の片仮名表記の候補を生成する片仮名候補生成部と、 上記片仮名辞書を用いて、上記片仮名候補生成部によっ
    て生成された片仮名候補が適切な片仮名表記であるか否
    かをチェックするチェック部と、 上記チェック部によって適切な片仮名表記であると判定
    された片仮名候補を出力する出力部を備えたことを特徴
    とする文字変換装置。
JP5173002A 1993-07-13 1993-07-13 文字変換装置 Expired - Lifetime JP3048793B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP5173002A JP3048793B2 (ja) 1993-07-13 1993-07-13 文字変換装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP5173002A JP3048793B2 (ja) 1993-07-13 1993-07-13 文字変換装置

Publications (2)

Publication Number Publication Date
JPH0728807A JPH0728807A (ja) 1995-01-31
JP3048793B2 true JP3048793B2 (ja) 2000-06-05

Family

ID=15952373

Family Applications (1)

Application Number Title Priority Date Filing Date
JP5173002A Expired - Lifetime JP3048793B2 (ja) 1993-07-13 1993-07-13 文字変換装置

Country Status (1)

Country Link
JP (1) JP3048793B2 (ja)

Also Published As

Publication number Publication date
JPH0728807A (ja) 1995-01-31

Similar Documents

Publication Publication Date Title
JP2836159B2 (ja) 同時通訳向き音声認識システムおよびその音声認識方法
US5214583A (en) Machine language translation system which produces consistent translated words
JPH09259127A (ja) 翻訳装置
JP2002149643A (ja) 日本語の表意文字の読み方を予測する方法
JP4018668B2 (ja) 日中機械翻訳装置、日中機械翻訳方法および日中機械翻訳プログラム
JP3048793B2 (ja) 文字変換装置
JP2003178087A (ja) 外国語電子辞書検索装置および方法
JPS58123129A (ja) 仮名漢字変換装置
KR20040018008A (ko) 품사 태깅 장치 및 태깅 방법
JP3285149B2 (ja) 外国語電子辞書検索方法及び装置
JP2715419B2 (ja) 翻訳装置
JPS58123126A (ja) 辞書検索装置
JPS6389976A (ja) 言語解析装置
JP2001051992A (ja) 日本語統計データ作成装置および方法、並びにディクテーションシステム
JPH0414168A (ja) 文書作成装置
JPH0916575A (ja) 発音辞書装置
JPS61223971A (ja) 文章作成装置
JPH1063651A (ja) 中国語入力装置
JPS62224859A (ja) 日本語処理方式
JPH10161847A (ja) 文章データ音声変換システム
JPS61177573A (ja) 日本語文章作成装置
JPH08339365A (ja) 文書作成装置及び文書作成方法
JPH11161296A (ja) 文書読み上げ装置および方法
JPH03225462A (ja) ローマ字漢字変換装置
JPH0877160A (ja) かな漢字変換方法及び装置