JPH05266073A - 機械翻訳機 - Google Patents

機械翻訳機

Info

Publication number
JPH05266073A
JPH05266073A JP4064508A JP6450892A JPH05266073A JP H05266073 A JPH05266073 A JP H05266073A JP 4064508 A JP4064508 A JP 4064508A JP 6450892 A JP6450892 A JP 6450892A JP H05266073 A JPH05266073 A JP H05266073A
Authority
JP
Japan
Prior art keywords
translation
character recognition
word
character
processing unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP4064508A
Other languages
English (en)
Inventor
Masahito Takahashi
雅仁 高橋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP4064508A priority Critical patent/JPH05266073A/ja
Publication of JPH05266073A publication Critical patent/JPH05266073A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)
  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 【目的】 機械翻訳機で用いる文字認識装置の文字認識
精度を向上させる。 【構成】 翻訳実行制御部2は、入力手段1から翻訳の
指示を与えられると、文字認識処理部3に原文の読み込
みと文字認識の実行を指示する。文字認識処理部3はイ
メージスキャナ装置4からイメージデータとして原文を
読み込み、さらに、翻訳用辞書9を参照しながら文字認
識処理を行い、文字コードからなる原文を原文記憶部7
に出力する。続いて、翻訳実行制御部2は、翻訳処理部
8に翻訳処理の実行を指示する。翻訳処理部8は、原文
記憶部7に格納された原文の翻訳処理を実行し、翻訳結
果が表示手段11に表示される。 【効果】 文字認識処理時に翻訳用辞書が参照されるた
め、文字認識精度が向上し、訳文の後編集が容易にな
る。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、ある言語で書かれた文
章を他の言語に翻訳する機械翻訳機に関するものであ
る。
【0002】
【従来の技術】近年の国際化の進展とともに翻訳需要が
増大し、翻訳作業の効率化を図るため、機器の操作マニ
ュアルや技術文書、ビジネスレター等の翻訳に機械翻訳
機が利用されるようになった。機械翻訳機を利用して電
子化されていない文書の翻訳を行う場合は、まず、イメ
ージスキャナ装置からイメージデータとして原文を読み
込み、読み込んだイメージデータに対して文字認識処理
を行い、これをテキストデータへ変換した後、翻訳処理
を行うのが一般的である。
【0003】このような従来の機械翻訳機は、図8に示
したブロック構造となっている。図8において、12は
翻訳作業における原文の入力と翻訳操作の指示を行うた
めの入力手段、13は翻訳作業を行うために必要な処理
の実行を制御する翻訳実行制御部、14はイメージデー
タとして光学的に読み込んだ原文に対して、後述する文
字認識用単語辞書18を参照しながら、文字認識処理を
行い、文字コードからなる原文を出力する文字認識処理
部、15は原文を光学的に読み込むイメージスキャナ装
置、16はイメージスキャナ装置15からイメージデー
タとして読み込んだ原文を格納するイメージデータ記憶
部、17はイメージデータ記憶部16に格納されたイメ
ージデータに対して、文字認識処理部14が文字認識処
理を行って生成したイメージデータ中の各文字につい
て、少なくとも1個以上の文字コードの候補を単語単位
にまとめて格納する単語候補記憶部、18は一般的な単
語について少なくとも単語表記を含む単語データを格納
し、文字認識処理部14によって参照される文字認識用
単語辞書、19は単語候補記憶部17に格納された単語
候補を基に、文字認識処理部14が生成した文字コード
からなる原文を格納する原文記憶部、20は原文記憶部
19に格納された原文に対して、後述する翻訳用辞書2
1を参照しながら、翻訳処理を行い訳文を生成する翻訳
処理部、21は翻訳対象となる原文中の単語について、
少なくとも原言語の単語表記と、その品詞情報および原
言語の単語表記に対する訳語表記と、その品詞情報を含
む単語データを格納し、翻訳処理部20によって参照さ
れる翻訳用辞書、22は翻訳処理部20が出力した訳文
を格納する訳文記憶部、23は原文および訳文を表示す
る表示手段である。
【0004】上記のように構成さた従来の機械翻訳機に
ついて、以下、その動作を図9のフローチャートに沿っ
て説明する。ここでは、英日翻訳翻訳機を例にとる。翻
訳する英文は、"You select the icon."とする。
【0005】まず、ステップ(a)で、ユーザが入力手
段12より翻訳実行制御部13に対して、イメージスキ
ャナ装置15にセットした原文に対して、翻訳を行うよ
う指示する。すると、翻訳実行制御部13は、文字認識
処理部14に文字認識処理の実行を指示する。次に、文
字認識処理部14は、イメージスキャナ装置15にイメ
ージデータ読み込みの指示を与える。すると、イメージ
スキャナ装置15は、原文を光学的にスキャンし、イメ
ージデータとして原文を読み込む。このように、読み込
まれたイメージデータは、文字認識処理部14を経由し
て、イメージデータ記憶部16に格納される。
【0006】次にステップ(b)で、文字認識処理部1
4は、イメージデータ記憶部16に格納されたイメージ
データに対して文字認識処理を行って、イメージデータ
中の各文字について少なくとも1個以上の文字コードの
候補を生成し、これらの文字コードを単語単位にまとめ
て単語候補記憶部17に格納する。
【0007】ここで、図3に単語候補記憶部17に格納
された内容の一例を示す。原文において"You","selec
t","the","."に関しては第1候補のみが正しく生成され
ているので、問題ない。しかしながら原文中の"icon"と
いう単語に対する文字認識結果として"c" の文字と、
"e","o" の文字は相紛らわしく、しかも"icon"なる語
は、使用頻度が高いとはいえないので、"ieon","icon",
"ioon"の3つの候補が生成されている。
【0008】次にステップ(c)に進むと、文字認識処
理部14は、文字認識用単語辞書18を検索し、単語候
補記憶部17に格納された各単語候補が、辞書中に存在
する否かを調べる。そして、単語候補記憶部17中のあ
る単語について、上記のように第1候補"ieon",第2候
補"icon", 第3候補"ioon"のように、複数個の単語候補
があり、かつそれらの単語候補の中に文字認識用単語辞
書18に存在するものがあれば、これらの候補のうち、
この辞書18内に存在する候補が、正しい認識による語
である盍然性が高いので、その単語候補を文字認識結果
として原文記憶部19に出力するようになっている。そ
して、すべての単語候補について文字認識結果を、原文
記憶部19へ出力し終ると、文字認識処理部14は、文
字認識処理の終了を翻訳実行制御部13に通知する。
【0009】続いて、翻訳実行制御部13は、原文記憶
部19に格納された原文を表示手段23に表示する。
【0010】ここで、図10に文字認識用単語辞書18
に格納された単語データの一例を示す。また、図11に
ステップ(c)の終了直後の原文記憶部19の内容を示
す。図10に示すように"icon"に対する3個の単語候補
"ieon","icon","ioon"に関しては、それらの単語候補
が、いずれも文字認識用単語辞書18に含まれていない
ため、先頭の単語候補"ieon"が、文字認識結果として出
力されると共に、図11に示すように原文記憶部19に
は、"icon"ではなく"ieon"の語が出力されている。また
図12はステップ(c)終了直後の表示手段23の表示
内容を示す。なお図12において、23aは表示手段2
3の表示画面、Oは原文表示欄、Iは訳文表示欄であ
る。
【0011】最後にステップ(d)において、翻訳実行
制御部13は、翻訳処理部20に原文記憶部19に格納
された原文("Yor select the ieon.")に対して翻訳処理
を行うことを指示する。そこで、翻訳処理部20は、翻
訳用辞書21を参照しながら、原文記憶部19に格納さ
れた原文に対して翻訳処理を行い、翻訳結果を訳文記憶
部22に出力する。
【0012】ここで、図13はステップ(d)の翻訳処
理終了直後の表示手段23の表示内容を示す。なお上述
したように、原文中の単語"icon"は、文字認識処理にお
いて"ieon"と誤って文字認識されたため、翻訳用辞書2
1に単語"icon"が存在するにもかかわらず、訳文には、
単語"ieon"が未知語として出力されている。
【0013】
【発明が解決しようとする課題】すなわち、従来の機械
翻訳機では、上述したように、文字認識処理と翻訳処理
とで用いる辞書が、別々に構成され、これらの辞書に格
納されている単語は必ずしも一致しているわけではなか
った。したがって、ある単語が翻訳用辞書に含まれてい
たとしても、文字認識用単語辞書に含まれていないこと
があるために、文字認識の誤りが発生しやすく、正しい
翻訳を行うことができない場合があった。このような場
合、ユーザはマニュアル処理により文字認識結果の誤り
を訂正した後、再度翻訳処理を試みる必要がある。この
ように、従来の機械翻訳機においては、文字認識処理を
行う際の辞書の構成に起因して、翻訳結果の精度が落ち
たり、ユーザの訂正などにより作業の効率が低下すると
いう問題点があった。
【0014】
【課題を解決するための手段】本発明は、上記の問題点
を解決するために、原文を読み込むイメージスキャナ装
置と、このイメージスキャナ装置により読み込まれた原
文のイメージデータに対して文字認識を行ない文字コー
ドからなる原文を生成する文字認識処理部と、この文字
コードからなる原文に対して翻訳を行い、訳文を生成す
る翻訳処理部と、前記文字認識処理部の文字認識処理に
伴ない参照され、かつ前記翻訳処理部の翻訳に伴ない参
照される翻訳用辞書と、表示手段と、操作情報を指示す
るための入力手段と、この入力手段から操作情報を入力
し、前記イメージスキャナ装置、文字認識処理部及び前
記翻訳処理部を制御すると共に、前記文字コードからな
る原文とこの原文の訳文とを前記表示手段に表示させる
翻訳実行制御部とを備えたものである。
【0015】
【作用】上記構成により、翻訳対象とする原文中の単語
が、翻訳用辞書に存在する場合は、この翻訳用辞書が文
字認識処理時においても参照されることから、文字認識
処理において、文字認識誤りが発生する可能性が低くな
る。したがって、従来の機械翻訳機のように、ユーザが
文字認識の誤りを訂正して再度翻訳処理を行うというよ
うなことが少なくなり、それだけ作業が軽減され、翻訳
作業効率が向上する。
【0016】
【実施例】以下、本発明の実施例における機械翻訳機に
ついて図面を参照しながら説明する。
【0017】図1は、本発明の一実施例における機械翻
訳機の機能ブロック図である。図1において、1は翻訳
作業における原文の入力と翻訳操作の指示を行うための
キーボード、マウスなどの入力手段、2は翻訳作業を行
うために必要な処理の実行を制御する翻訳実行制御部で
あり、この翻訳実行制御部2はCPUがROM内のプロ
グラムを実行することにより実現される。
【0018】3は光学的にイメージデータとして読み込
んだ原文に対して、後述する翻訳用辞書9を参照しなが
ら、文字認識処理を行い、文字コードからなる原文を出
力する文字認識処理部、4は原文を光学的に読み込むイ
メージスキャナ装置、5はイメージスキャナ装置4から
イメージデータとして読み込んだ原文を格納するイメー
ジデータ記憶部、6はイメージデータ記憶部5に格納さ
れたイメージデータに対して文字認識処理部3が文字認
識処理を行って生成したイメージデータ中の各文字につ
いて少なくとも1個以上の文字コードの候補を、単語単
位にまとめて格納する単語候補記憶部、7は単語候補記
憶部6に格納された単語候補を基に、文字認識処理部3
が生成した文字コードからなる原文を格納する原文記憶
部である。また、8は原文記憶部7に格納された原文に
対して後述する翻訳用辞書9を参照しながら翻訳処理を
行い訳文を生成する翻訳処理部、9は翻訳対象となる原
文中の単語について、少なくとも原言語の単語表記とそ
の品詞情報および原言語の単語表記に対する訳語表記と
その品詞情報を含む単語データを格納し、文字認識処理
部3および翻訳処理部8によって参照される翻訳用辞
書、10は翻訳処理部8が出力した訳文を格納する訳文
記憶部、11は原文および訳文を表示するCRTなどの
表示手段である。
【0019】上記のように構成された機械翻訳機につい
て、以下、その動作を図2のフローチャートに沿って説
明する。ここでは、英日翻訳翻訳機を例に説明する。ま
た、翻訳する英文は、"Yor select the icon."とする。
【0020】まず、ステップ(イ) で、ユーザが入力手
段1より翻訳実行制御部2に対してイメージスキャナ装
置4にセットした原文を翻訳するよう指示する。する
と、翻訳実行制御部2は、文字認識処理部3に文字認識
処理の実行を指示する。
【0021】次に、文字認識処理部3は、イメージスキ
ャナ装置4にイメージデータ読み込みの指示を与える。
すると、イメージスキャナ装置4は、原文を光学的にス
キャンし、イメージデータとして原文を読み込み、読み
込まれたイメージデータは、文字認識処理部3を経由し
て、イメージデータ記憶部5に格納される。
【0022】さらにステップ(ロ)で、文字認識処理部
3は、イメージデータ記憶部5に格納されたイメージデ
ータに対して文字認識処理を行って、イメージデータ中
の各文字について、少なくとも1個以上の文字コードの
候補を生成し、これらの文字コードを単語単位にまとめ
て単語候補記憶部6に格納する。
【0023】ここで、図3に単語候補記憶部6に格納さ
れた内容の一例を示す。すなわち、原文中の"icon"とい
う単語に対する文字認識結果として、"ieon","icon","i
oon"の3つの候補が出力されている。
【0024】次にステップ(ハ)に進むと、文字認識処
理部3は、翻訳用辞書9に格納された英語の単語表記を
検索し、単語候補記憶部6に格納された各単語候補が辞
書中に存在する否かを調べる。
【0025】ここで、単語候補記憶部6中の単語(本来
は"icon") について複数個の単語候補("ieon","icon",
"ioon")があり、かつそれらの単語候補の中に翻訳用辞
書9に存在するものがあれば、その単語候補を文字認識
結果として原文記憶部7に出力する。
【0026】すべての単語候補について、文字認識結果
を原文記憶部7へ出力し終ると、文字認識処理部3は、
文字認識処理の終了を翻訳実行制御部2に通知する。続
いて、翻訳実行制御部2は、原文記憶部7に格納された
原文を、表示手段11に表示する。
【0027】ここで、図4に翻訳用辞書9に格納された
単語データの一例を示す。また、図5にステップ(ハ)
の終了直後の原文記憶部7の内容を示す。
【0028】さて図3に示した"icon"に対して単語候補
記憶部6中の3個の単語候補"ieon","icon","ioon"が生
成されている。
【0029】しかしながら,これらの単語候補のうち"i
con"のみが、翻訳用辞書9に含まれている。したがっ
て、単語候補"icon"が、文字認識結果として原文記憶部
7に正しく出力される。この場合表示手段11には図6
のような表示内容があらわれる。なお図6において、1
1aは表示手段11の表示画面、Oはこの画面11aの
原文表示欄、Iは訳文表示欄である。
【0030】最後にステップ(ニ)において、翻訳実行
制御部2は、翻訳処理部8に原文記憶部7に格納された
原文に対して翻訳処理を行うことを指示する。そこで、
翻訳処理部8は、翻訳用辞書9を参照しながら、原文記
憶部7に格納された原文に対して翻訳処理を行い、翻訳
結果を訳文記憶部10に出力する。ここで、図7にステ
ップ(ニ)の翻訳処理終了直後の表示手段11の表示内
容を示す。原文中の単語"icon"は、文字認識処理におい
て翻訳用辞書9を参照することにより正しく文字認識さ
れたため、訳文には未知語は存在せず、正しい翻訳結果
が出力されている。
【0031】このように、本実施例では、文字認識処理
時に参照される辞書と、翻訳実行時に参照される辞書
を、全く同一の辞書(翻訳用辞書21)とした。したが
って文字認識の際に生成される候補に誤った候補が含ま
れていても、この誤った候補の他に正しい候補が存在
し、しかもこの正しい候補が、翻訳用辞書21に格納さ
れていさえすれば、この正しい候補が、確実に原文記憶
部19に格納され、正しく翻訳されるものである。因み
に、原文中に翻訳用辞書21に入っていない単語が含ま
れ、かつ従来の文字認識用辞書にその単語が含まれ、正
しく文字認識されたとしても、結局その単語は、翻訳処
理時に未知語となってしまうので、上記実施例のように
文字認識時の辞書と翻訳時の辞書とを同一に構成して
も、何ら支障を生ずることはない。
【0032】
【発明の効果】本発明は、原文を読み込むイメージスキ
ャナ装置と、このイメージスキャナ装置により読み込ま
れた原文のイメージデータに対して文字認識を行ない文
字コードからなる原文を生成する文字認識処理部と、こ
の文字コードからなる原文に対して翻訳を行い、訳文を
生成する翻訳処理部と、前記文字認識処理部の文字認識
処理に伴ない参照され、かつ前記翻訳処理部の翻訳に伴
ない参照される翻訳用辞書と、表示手段と、操作情報を
指示するための入力手段と、この入力手段から操作情報
を入力し、前記イメージスキャナ装置、文字認識処理部
及び前記翻訳処理部を制御すると共に、前記文字コード
からなる原文とこの原文の訳文とを前記表示手段に表示
させる翻訳実行制御部とを備えて機械翻訳機を構成して
いる。したがって、文字認識処理において翻訳用辞書を
参照することにより、翻訳対象とする原文中の単語が翻
訳用辞書に存在する場合は、文字認識処理において文字
認識誤りが発生する可能性が極めて低くなる。その結
果、翻訳の精度を向上することができるし、ユーザが文
字認識の誤りを訂正することを少なくでき、翻訳作業効
率が向上することができる。
【図面の簡単な説明】
【図1】本発明の一実施例における機械翻訳機の機能ブ
ロック図
【図2】本発明の一実施例における機械翻訳機のフロー
チャート
【図3】本発明の一実施例における機械翻訳機の単語候
補記憶部に格納されたデータ内容の例示図
【図4】本発明の一実施例における機械翻訳機の翻訳用
辞書に格納されたデータ内容の例示図
【図5】本発明の一実施例における機械翻訳機の原文記
憶部に格納されたデータ内容の例示図
【図6】本発明の一実施例における機械翻訳機の翻訳処
理実行直前の表示手段への表示例示図
【図7】本発明の一実施例における機械翻訳機の翻訳処
理実行直後の表示手段への表示例示図
【図8】従来の機械翻訳機の機能ブロック図
【図9】従来の技術における機械翻訳機のフローチャー
【図10】従来の技術における機械翻訳機の文字認識用
単語辞書に格納されたデータ内容の例示図
【図11】従来の技術における機械翻訳機の原文記憶部
に格納されたデータ内容の例示図
【図12】従来の技術における機械翻訳機の翻訳処理実
行直前の表示手段への表示例示図
【図13】従来の技術における機械翻訳機の翻訳処理実
行直後の表示手段への表示例示図
【符号の説明】
1 入力手段 2 翻訳実行制御部 3 文字認識処理部 4 イメージスキャナ装置 8 翻訳処理部 9 翻訳用辞書 11 表示手段

Claims (1)

    【特許請求の範囲】
  1. 【請求項1】原文を読み込むイメージスキャナ装置と、
    このイメージスキャナ装置により読み込まれた原文のイ
    メージデータに対して文字認識を行ない文字コードから
    なる原文を生成する文字認識処理部と、この文字コード
    からなる原文に対して翻訳を行い、訳文を生成する翻訳
    処理部と、前記文字認識処理部の文字認識処理に伴ない
    参照され、かつ前記翻訳処理部の翻訳に伴ない参照され
    る翻訳用辞書と、表示手段と、操作情報を指示するため
    の入力手段と、この入力手段から操作情報を入力し、前
    記イメージスキャナ装置、文字認識処理部及び前記翻訳
    処理部を制御すると共に、前記文字コードからなる原文
    とこの原文の訳文とを前記表示手段に表示させる翻訳実
    行制御部とを備えたことを特徴とする機械翻訳機。
JP4064508A 1992-03-23 1992-03-23 機械翻訳機 Pending JPH05266073A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4064508A JPH05266073A (ja) 1992-03-23 1992-03-23 機械翻訳機

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4064508A JPH05266073A (ja) 1992-03-23 1992-03-23 機械翻訳機

Publications (1)

Publication Number Publication Date
JPH05266073A true JPH05266073A (ja) 1993-10-15

Family

ID=13260214

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4064508A Pending JPH05266073A (ja) 1992-03-23 1992-03-23 機械翻訳機

Country Status (1)

Country Link
JP (1) JPH05266073A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013014877A1 (ja) * 2011-07-28 2013-01-31 日本電気株式会社 信頼度算出装置、翻訳信頼度算出利用方法および翻訳エンジン用プログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013014877A1 (ja) * 2011-07-28 2013-01-31 日本電気株式会社 信頼度算出装置、翻訳信頼度算出利用方法および翻訳エンジン用プログラム
JPWO2013014877A1 (ja) * 2011-07-28 2015-02-23 日本電気株式会社 信頼度算出装置、翻訳信頼度算出利用方法および翻訳エンジン用プログラム

Similar Documents

Publication Publication Date Title
US5214583A (en) Machine language translation system which produces consistent translated words
US8655641B2 (en) Machine translation apparatus and non-transitory computer readable medium
JPS62203273A (ja) 機械翻訳システム
JPH05266073A (ja) 機械翻訳機
JP4843596B2 (ja) 機械翻訳装置及び機械翻訳プログラム
JP2737160B2 (ja) 文章処理装置
JP3194529B2 (ja) 機械翻訳装置
JP2715419B2 (ja) 翻訳装置
JP3197110B2 (ja) 自然言語解析装置および機械翻訳装置
JP3013402B2 (ja) 機械翻訳装置
JP3147947B2 (ja) 機械翻訳装置
JP3316884B2 (ja) 言語翻訳装置
JPH0350668A (ja) 文字処理装置
JPH10198664A (ja) 日本語入力システム及び日本語入力プログラムを記録した媒体
JPH09269945A (ja) メディア変換方法およびメディア変換装置
JPH04158477A (ja) 機械翻訳装置
JPH07152763A (ja) 機械翻訳装置と該装置における翻訳方法
JPS62271054A (ja) 翻訳装置における形態素解析結果修正方式
JPH09274615A (ja) 文体変換装置
JPH06236399A (ja) 翻訳機能付きワードプロセッサ
JPH1027176A (ja) 機械翻訳装置及び機械翻訳方法
JPH09231226A (ja) 機械翻訳用辞書メンテナンス装置
JPH05197752A (ja) 機械翻訳装置
JPH07160698A (ja) 文字処理方法およびその装置
JPH0528179A (ja) 機械翻訳装置