JP3194529B2 - 機械翻訳装置 - Google Patents
機械翻訳装置Info
- Publication number
- JP3194529B2 JP3194529B2 JP07109091A JP7109091A JP3194529B2 JP 3194529 B2 JP3194529 B2 JP 3194529B2 JP 07109091 A JP07109091 A JP 07109091A JP 7109091 A JP7109091 A JP 7109091A JP 3194529 B2 JP3194529 B2 JP 3194529B2
- Authority
- JP
- Japan
- Prior art keywords
- translation
- word
- unit
- character string
- character
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Landscapes
- Machine Translation (AREA)
Description
【0001】
【産業上の利用分野】本発明は、英語等の外国語と日本
語との間の機械翻訳装置に関する。
語との間の機械翻訳装置に関する。
【0002】
【従来の技術】従来、既存の機械翻訳装置は、単語辞書
に未登録であった単語はその単語の意味情報が分からな
いため、基本的にはそのままの文字列を出力するという
形でしか処理されていない。
に未登録であった単語はその単語の意味情報が分からな
いため、基本的にはそのままの文字列を出力するという
形でしか処理されていない。
【0003】図4は一例として従来の英日機械翻訳装置
の機能ブロック図である。図において、1は入力手段、
2は入力記憶部、3は単語辞書部、4は翻訳実行制御
部、5は未知語記憶部、9は訳文記憶部、10は訳文表示
部である。
の機能ブロック図である。図において、1は入力手段、
2は入力記憶部、3は単語辞書部、4は翻訳実行制御
部、5は未知語記憶部、9は訳文記憶部、10は訳文表示
部である。
【0004】英文の文字列を入力手段1より入力し該文
字列を入力記憶部2に記憶する。翻訳実行制御部4は英
文に対応した日本語訳を記憶している単語辞書部3を用
いて英文を翻訳し、英文に対応した日本語訳がない場合
は、未知語記憶部5に原語のまま記憶し、両者を合わせ
た翻訳文を訳文記憶部9に記憶し翻訳結果を訳文表示部
10に表示する。
字列を入力記憶部2に記憶する。翻訳実行制御部4は英
文に対応した日本語訳を記憶している単語辞書部3を用
いて英文を翻訳し、英文に対応した日本語訳がない場合
は、未知語記憶部5に原語のまま記憶し、両者を合わせ
た翻訳文を訳文記憶部9に記憶し翻訳結果を訳文表示部
10に表示する。
【0005】この装置を使い、例えば、次の英文に対
し、 「I know a man whose name is Yamamoto. 」 を日本語訳に翻訳する場合、「Yamamoto」という単語は
人名であり、単語辞書には登録されていない。そうする
と既存の機械翻訳装置では、 「私は、Yamamotoという名前の男を知っている。」 と言う具合に翻訳結果を出力する。
し、 「I know a man whose name is Yamamoto. 」 を日本語訳に翻訳する場合、「Yamamoto」という単語は
人名であり、単語辞書には登録されていない。そうする
と既存の機械翻訳装置では、 「私は、Yamamotoという名前の男を知っている。」 と言う具合に翻訳結果を出力する。
【0006】
【発明が解決しようとする課題】単語辞書部に登録され
ていない単語の翻訳処理を行えば、出力された訳文は原
語のまま表示され翻訳文の質の低下につながる。例え
ば、固有名詞のような人名や日本特有のものを表す語
「yamada」、「sushi」、「kimono」、「shinkansen」
などの文字列をそのまま翻訳文中(ここでは日本語文)に
残すことは、日本語の文としては不自然であり、文の読
み難くさという結果を招く。
ていない単語の翻訳処理を行えば、出力された訳文は原
語のまま表示され翻訳文の質の低下につながる。例え
ば、固有名詞のような人名や日本特有のものを表す語
「yamada」、「sushi」、「kimono」、「shinkansen」
などの文字列をそのまま翻訳文中(ここでは日本語文)に
残すことは、日本語の文としては不自然であり、文の読
み難くさという結果を招く。
【0007】そこで、このような辞書未登録語を辞書へ
登録しようとしても、有限である記憶領域にすべてを記
憶させることは不可能である。つまり、辞書未登録語は
後修正で人手により処理するということになり、翻訳に
計算機を用いて如何に人手を介さずに翻訳処理を行うか
ということの意に反する。
登録しようとしても、有限である記憶領域にすべてを記
憶させることは不可能である。つまり、辞書未登録語は
後修正で人手により処理するということになり、翻訳に
計算機を用いて如何に人手を介さずに翻訳処理を行うか
ということの意に反する。
【0008】本発明は、このような外国語から日本語に
翻訳する際、日本語の文としての不自然さを除き、後修
正をなくすことを目的とする。
翻訳する際、日本語の文としての不自然さを除き、後修
正をなくすことを目的とする。
【0009】
【課題を解決するための手段】本発明は、英文等の文字
列を入力する入力手段と、前記入力手段により入力され
た文字列を記憶する入力記憶部と、入力文字列の単語に
対応した日本語訳を記憶した単語辞書部と、前記単語辞
書部を用いて入力文字列を翻訳する翻訳手段と、前記翻
訳手段による翻訳の際、前記単語辞書部に未登録であっ
た語を記憶する未知語記憶部と、前記単語辞書部から得
られた訳語と前記未知語記憶部に記憶された未知語とを
合わせた翻訳文を記憶する訳文記憶部と、前記訳文記憶
部に記憶された翻訳文を表示する訳文表示部とを備えた
機械翻訳装置において、ローマ字とかなが1対1に対応
したローマ字かなテーブルと、前記未知語記憶部中の未
知語をローマ字の文字列として認識し、前記文字列を分
割し、上記ローマ字かなテーブルのローマ字パターンと
マッチングを行い、前記文字列がかなに置き換えられる
かどうかの判定を行うローマ字認識制御部と、前記ロー
マ字認識制御部が置き換えられると判断した場合に、ロ
ーマ字をかなに置き換えるローマ字かな変換部とを有す
ることを特徴とする。
列を入力する入力手段と、前記入力手段により入力され
た文字列を記憶する入力記憶部と、入力文字列の単語に
対応した日本語訳を記憶した単語辞書部と、前記単語辞
書部を用いて入力文字列を翻訳する翻訳手段と、前記翻
訳手段による翻訳の際、前記単語辞書部に未登録であっ
た語を記憶する未知語記憶部と、前記単語辞書部から得
られた訳語と前記未知語記憶部に記憶された未知語とを
合わせた翻訳文を記憶する訳文記憶部と、前記訳文記憶
部に記憶された翻訳文を表示する訳文表示部とを備えた
機械翻訳装置において、ローマ字とかなが1対1に対応
したローマ字かなテーブルと、前記未知語記憶部中の未
知語をローマ字の文字列として認識し、前記文字列を分
割し、上記ローマ字かなテーブルのローマ字パターンと
マッチングを行い、前記文字列がかなに置き換えられる
かどうかの判定を行うローマ字認識制御部と、前記ロー
マ字認識制御部が置き換えられると判断した場合に、ロ
ーマ字をかなに置き換えるローマ字かな変換部とを有す
ることを特徴とする。
【0010】
【作用】辞書未登録語である日本特有の語をローマ字と
見なしてかなで置き換えることにより翻訳文中に辞書未
登録語として英文字列等が現われる数は減少する。ま
た、翻訳結果に現われる辞書未登録語をエディタを用い
て修正する必要はなくなり、辞書に登録されていない日
本特有の語を辞書に登録しなくてもよい。
見なしてかなで置き換えることにより翻訳文中に辞書未
登録語として英文字列等が現われる数は減少する。ま
た、翻訳結果に現われる辞書未登録語をエディタを用い
て修正する必要はなくなり、辞書に登録されていない日
本特有の語を辞書に登録しなくてもよい。
【0011】
【実施例】以下、本発明の一実施例として英日機械翻訳
装置の機能ブロック図である図1を参照しながら説明を
行う。図において、6はローマ字かなテーブル、7はロ
ーマ字かな変換部、8はローマ字認識制御部であり、他
の各部は図4と同じで同じ符号で示す。英文の文字列を
入力手段1より入力し該文字列を入力記憶部2に記憶
し、翻訳実行制御部4を動作させ、翻訳の実行を行う。
装置の機能ブロック図である図1を参照しながら説明を
行う。図において、6はローマ字かなテーブル、7はロ
ーマ字かな変換部、8はローマ字認識制御部であり、他
の各部は図4と同じで同じ符号で示す。英文の文字列を
入力手段1より入力し該文字列を入力記憶部2に記憶
し、翻訳実行制御部4を動作させ、翻訳の実行を行う。
【0012】この翻訳の処理過程においては、入力の該
英文列を構成するそれぞれの単語について、英文に対応
した日本語訳を記憶している単語辞書部3を検索する。
この際、単語辞書部3に登録されている単語については
従来の翻訳処理を継続して行い、単語辞書部3に登録さ
れていなかった単語については、未知語記憶部5に記憶
して、辞書未登録語処理へ移す。
英文列を構成するそれぞれの単語について、英文に対応
した日本語訳を記憶している単語辞書部3を検索する。
この際、単語辞書部3に登録されている単語については
従来の翻訳処理を継続して行い、単語辞書部3に登録さ
れていなかった単語については、未知語記憶部5に記憶
して、辞書未登録語処理へ移す。
【0013】入力した英文が未知語記憶部5に記憶され
た未知語の場合には、ローマ字認識制御部8はローマ字
とかなが1対1に対応したローマ字かなテーブル6の助
けを借り、ローマ字かな変換部7によりローマ字からか
なに変換の制御を行い、翻訳文を訳文記憶部9に記憶し
翻訳結果を訳文表示部10に表示する。
た未知語の場合には、ローマ字認識制御部8はローマ字
とかなが1対1に対応したローマ字かなテーブル6の助
けを借り、ローマ字かな変換部7によりローマ字からか
なに変換の制御を行い、翻訳文を訳文記憶部9に記憶し
翻訳結果を訳文表示部10に表示する。
【0014】図2は辞書未登録語のローマ字かな変換処
理の動作のフローチャートである。A,B,・・・は各
ステップを表す。図3は実施例のローマ字かなテーブル
図である。
理の動作のフローチャートである。A,B,・・・は各
ステップを表す。図3は実施例のローマ字かなテーブル
図である。
【0015】先ず、ステップAで翻訳実行制御部4によ
る翻訳処理が実行され、その際、ステップBで単語辞書
部3の検索を行う。次に、ステップCで単語が辞書に登
録されているかどうか判定する。単語辞書部3に検索さ
れる単語が登録されていればステップDへ、そうでなけ
ればステップEへ進む。ステップDでは単語辞書部3か
らその単語に関する情報を取り出し単語に付与した後、
ステップHへ進む。
る翻訳処理が実行され、その際、ステップBで単語辞書
部3の検索を行う。次に、ステップCで単語が辞書に登
録されているかどうか判定する。単語辞書部3に検索さ
れる単語が登録されていればステップDへ、そうでなけ
ればステップEへ進む。ステップDでは単語辞書部3か
らその単語に関する情報を取り出し単語に付与した後、
ステップHへ進む。
【0016】ステップEでは単語辞書に登録されていな
い単語について、英単語つまりアルファベットの文字列
がローマ字のパターンにマッチするかどうかをローマ字
認識制御部8で判定する。つまり、該ローマ字認識制御
部8は文字列をローマ字かなテーブル6を用いて母音1
文字または子音で始まる2文字か3文字の文字列に分割
し、うまく分割できればローマの文字列であると判断
し、ステップFへ進む。ステップFではローマ字かな変
換部7は、ステップEの結果、英単語の文字列がローマ
字のパターンにマッチすると判断された文字列をローマ
字かなテーブル6のローマ字に対応するかなに置き換
え、ステップHへ進む。
い単語について、英単語つまりアルファベットの文字列
がローマ字のパターンにマッチするかどうかをローマ字
認識制御部8で判定する。つまり、該ローマ字認識制御
部8は文字列をローマ字かなテーブル6を用いて母音1
文字または子音で始まる2文字か3文字の文字列に分割
し、うまく分割できればローマの文字列であると判断
し、ステップFへ進む。ステップFではローマ字かな変
換部7は、ステップEの結果、英単語の文字列がローマ
字のパターンにマッチすると判断された文字列をローマ
字かなテーブル6のローマ字に対応するかなに置き換
え、ステップHへ進む。
【0017】ステップEで英単語の文字列がローマ字の
パターンにマッチしないと判断されたならば、ステップ
Gに進み、その単語はそのまま辞書未登録語とし、翻訳
処理の文字列を英文字列のまま翻訳文中に残し、従来の
未登録語の処理を行う。
パターンにマッチしないと判断されたならば、ステップ
Gに進み、その単語はそのまま辞書未登録語とし、翻訳
処理の文字列を英文字列のまま翻訳文中に残し、従来の
未登録語の処理を行う。
【0018】ステップHでは単語辞書部3を更に検索す
るかどうかの判定を行う。単語辞書部3を検索する必要
がなければ辞書未登録語処理が終了し、そうでなければ
ステップAに戻り単語辞書部3を検索する。
るかどうかの判定を行う。単語辞書部3を検索する必要
がなければ辞書未登録語処理が終了し、そうでなければ
ステップAに戻り単語辞書部3を検索する。
【0019】更に、従来の技術の所で述べた具体例を挙
げて実際の処理を詳しく説明する。
げて実際の処理を詳しく説明する。
【0020】次の英文に対し、翻訳要求があったとす
る。
る。
【0021】「I know a man whose name is Yamamoto.
」 「Yamamoto」という単語は人名であり、単語辞書には登
録されていない。そうすると既存の機械翻訳装置では、 「私は、Yamamotoという名前の男を知っている。」 と言う具合に翻訳結果を出力する。ここで、この「Yama
moto」という文字列がローマ字として認識できるかどう
か判定してみる。つまり、この文字列は「Ya」、「m
a」、「mo」、「to」に分割でき、ローマ字かなテーブ
ル6のローマ字のパターンにマッチする。この分割され
たそれぞれの文字列をローマ字かなテーブル6により、
かなへ変換し合成すれば「やまもと」というかな文字列
として表すことができ、結果としての翻訳文は、 「私は、やまもとという名前の男を知っている。」 が出力される。
」 「Yamamoto」という単語は人名であり、単語辞書には登
録されていない。そうすると既存の機械翻訳装置では、 「私は、Yamamotoという名前の男を知っている。」 と言う具合に翻訳結果を出力する。ここで、この「Yama
moto」という文字列がローマ字として認識できるかどう
か判定してみる。つまり、この文字列は「Ya」、「m
a」、「mo」、「to」に分割でき、ローマ字かなテーブ
ル6のローマ字のパターンにマッチする。この分割され
たそれぞれの文字列をローマ字かなテーブル6により、
かなへ変換し合成すれば「やまもと」というかな文字列
として表すことができ、結果としての翻訳文は、 「私は、やまもとという名前の男を知っている。」 が出力される。
【0022】また、別の例として、以下の英文を考え
る。
る。
【0023】「I watch the TV program of NHK. 」 この文の翻訳結果として、 「私は、NHKのテレビ番組を見ている。」 を出力する。ここで、「NHK」は辞書未登録語であり、
翻訳結果には「NHK」というそのままの英文字列を出力
する。「NHK」という文字列はローマ字のパターンにマ
ッチしない。つまり文字列を母音1文字、または子音
2、あるいは3文字へ分割することはできず、既存の機
械翻訳装置の辞書未登録語処理を行うことが可能であ
る。そして、このような「NHK」という語は、日本語の
文の表現上でも「NHK」という文字列がそのまま文中に
現れることが期待される。
翻訳結果には「NHK」というそのままの英文字列を出力
する。「NHK」という文字列はローマ字のパターンにマ
ッチしない。つまり文字列を母音1文字、または子音
2、あるいは3文字へ分割することはできず、既存の機
械翻訳装置の辞書未登録語処理を行うことが可能であ
る。そして、このような「NHK」という語は、日本語の
文の表現上でも「NHK」という文字列がそのまま文中に
現れることが期待される。
【0024】
【発明の効果】以上説明したように本発明の機械翻訳装
置は、上記のように、機械翻訳装置において辞書未登録
語と判断された英単語のアルファベット文字列をローマ
字と見なしてローマ字かな変換することにより、未登録
語として翻訳文中に現われる原文のままのアルファベッ
トの文字列が減少し、翻訳文の質の向上へとつながる。
さらに、ローマ字として置き換え可能な未知語がかな変
換されることにより、未知語出力の際に、原語出力とか
な出力とのバランスがとれ、日本語としてわかりやすい
訳文を出力することができる。
置は、上記のように、機械翻訳装置において辞書未登録
語と判断された英単語のアルファベット文字列をローマ
字と見なしてローマ字かな変換することにより、未登録
語として翻訳文中に現われる原文のままのアルファベッ
トの文字列が減少し、翻訳文の質の向上へとつながる。
さらに、ローマ字として置き換え可能な未知語がかな変
換されることにより、未知語出力の際に、原語出力とか
な出力とのバランスがとれ、日本語としてわかりやすい
訳文を出力することができる。
【0025】以上は英日翻訳の場合について説明した
が、これに限定されるものではなく、他の外国語につい
ても本発明を実施できることは容易である。
が、これに限定されるものではなく、他の外国語につい
ても本発明を実施できることは容易である。
【図1】本発明の一実施例における英日機械翻訳装置の
機能ブロック図である。
機能ブロック図である。
【図2】図1の実施例におけ未登録語のローマ字かな変
換処理の動作を表すフローチャートである。
換処理の動作を表すフローチャートである。
【図3】図1の実施例におけるローマ字かなテーブルで
ある。
ある。
【図4】従来の英日機械翻訳装置の機能ブロック図であ
る。
る。
1…入力手段、 2…入力記憶部、 3…単語辞書部、
4…翻訳実行制御部、5…未知語記憶部、 6…ロー
マ字かなテーブル、 7…ローマ字かな変換部、 8…
ローマ字認識制御部、 9…訳文記憶部、 10…訳文表
示部。
4…翻訳実行制御部、5…未知語記憶部、 6…ロー
マ字かなテーブル、 7…ローマ字かな変換部、 8…
ローマ字認識制御部、 9…訳文記憶部、 10…訳文表
示部。
Claims (1)
- 【請求項1】 英文等の文字列を入力する入力手段と、
前記入力手段により入力された文字列を記憶する入力記
憶部と、入力文字列の単語に対応した日本語訳を記憶し
た単語辞書部と、前記単語辞書部を用いて入力文字列を
翻訳する翻訳手段と、前記翻訳手段による翻訳の際、前
記単語辞書部に未登録であった語を記憶する未知語記憶
部と、前記単語辞書部から得られた訳語と前記未知語記
憶部に記憶された未知語とを合わせた翻訳文を記憶する
訳文記憶部と、前記訳文記憶部に記憶された翻訳文を表
示する訳文表示部と、を備えた機械翻訳装置において、 ローマ字とかなが1対1に対応したローマ字かなテーブ
ルと、 前記未知語記憶部中の未知語をローマ字の文字列として
認識し、前記文字列を分割し、上記ローマ字かなテーブ
ルのローマ字パターンとマッチングを行い、前記文字列
がかなに置き換えられるかどうかの判定を行うローマ字
認識制御部と、 前記ローマ字認識制御部が置き換えられると判断した場
合に、ローマ字をかなに置き換えるローマ字かな変換部
と、 を有することを特徴とする機械翻訳装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP07109091A JP3194529B2 (ja) | 1991-04-03 | 1991-04-03 | 機械翻訳装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP07109091A JP3194529B2 (ja) | 1991-04-03 | 1991-04-03 | 機械翻訳装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH04306766A JPH04306766A (ja) | 1992-10-29 |
JP3194529B2 true JP3194529B2 (ja) | 2001-07-30 |
Family
ID=13450491
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP07109091A Expired - Fee Related JP3194529B2 (ja) | 1991-04-03 | 1991-04-03 | 機械翻訳装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3194529B2 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3284976B2 (ja) * | 1998-06-19 | 2002-05-27 | 日本電気株式会社 | 音声合成装置及びコンピュータ可読記録媒体 |
-
1991
- 1991-04-03 JP JP07109091A patent/JP3194529B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JPH04306766A (ja) | 1992-10-29 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US5214583A (en) | Machine language translation system which produces consistent translated words | |
JP3194529B2 (ja) | 機械翻訳装置 | |
JPS5821287B2 (ja) | カナ漢字変換装置 | |
KR900008402B1 (ko) | 기계번역장치 | |
JP4843596B2 (ja) | 機械翻訳装置及び機械翻訳プログラム | |
JPS58182741A (ja) | カナ漢字変換処理装置 | |
JPH0528179A (ja) | 機械翻訳装置 | |
JPH0350668A (ja) | 文字処理装置 | |
JP2894064B2 (ja) | 機械翻訳装置 | |
JP2864691B2 (ja) | 学習支援装置 | |
JPH05266073A (ja) | 機械翻訳機 | |
JP3048793B2 (ja) | 文字変換装置 | |
JPH08272780A (ja) | 中国語入力処理装置及び中国語入力処理方法及び言語処理装置及び言語処理方法 | |
JPH0475162A (ja) | 仮名漢字変換装置 | |
JP2995783B2 (ja) | カタカナ語の訳語推定装置 | |
JPS58155440A (ja) | 日本語処理装置 | |
JPS5932032A (ja) | 日本語情報処理装置 | |
JPH06119379A (ja) | ふりがな機能つき機械翻訳装置および方法 | |
JPH07152763A (ja) | 機械翻訳装置と該装置における翻訳方法 | |
JPS5998236A (ja) | 日本文入力装置 | |
JPH0589163A (ja) | 機械翻訳装置 | |
JPH01197876A (ja) | 電子辞書 | |
JPS63273165A (ja) | 翻訳支援装置 | |
JPH07129571A (ja) | 文書作成装置及び文書作成方法 | |
JPS60204063A (ja) | 漢字訂正方式 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
LAPS | Cancellation because of no payment of annual fees |