JPH08339373A - 機械翻訳装置 - Google Patents

機械翻訳装置

Info

Publication number
JPH08339373A
JPH08339373A JP7147222A JP14722295A JPH08339373A JP H08339373 A JPH08339373 A JP H08339373A JP 7147222 A JP7147222 A JP 7147222A JP 14722295 A JP14722295 A JP 14722295A JP H08339373 A JPH08339373 A JP H08339373A
Authority
JP
Japan
Prior art keywords
spelling
word
translation
unregistered
unregistered word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP7147222A
Other languages
English (en)
Inventor
Shigeko Akiyama
薫子 秋山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP7147222A priority Critical patent/JPH08339373A/ja
Publication of JPH08339373A publication Critical patent/JPH08339373A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】 【目的】 未登録語として検出した単語に対する綴りの
補正を、自動的に綴りを推測することにより迅速に行え
る機械翻訳装置を提供することを目的とする。 【構成】 本発明の機械翻訳装置は、原文を翻訳し原文
と訳文とを対応付ける翻訳編集手段13と、各手段の制
御全般を担う制御手段12とを備え、文字認識を行い原
文を作成する文字認識手段13aと、原文中から未登録
語を検出する未登録語検出手段13bと、単語の綴りの
補正に際して綴り情報15を参照し正しい綴りを推測し
て表示する綴り推測手段13cと、未登録語に訳語を対
応させ翻訳用辞書8aに登録する未登録語登録手段13
dと、原文に対し構文を解析して翻訳する翻訳手段13
eとで構成された翻訳編集手段13により、未登録語と
して検出した単語に対して綴りを推測し、正しい単語の
候補を表示する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は外国語を翻訳する機械翻
訳装置に関するものである。
【0002】
【従来の技術】近年、原文を自動的に翻訳するために機
械翻訳装置が普及してきている。この機械翻訳装置は、
キーボード等の入力手段から入力したり、スキャナ等を
用いて原稿を光学的な2次元走査によって読み取ったり
することにより翻訳しようとする原文を作成し、作成し
た原文に翻訳処理を施して原文と訳文とを対応付けて編
集し、光磁気ディスク装置やハードディスク装置等の記
録手段に順次格納しておく機能を備えている。そして、
記録手段に格納されている各種の文書データの内から必
要に応じて所望の文書データを検索して読み出し、読み
出した文書データをCRT(陰極線管ディスプレイ)や
LCD(液晶ディスプレイ)等の表示手段に表示した
り、あるいはレーザープリンタ等の出力手段で出力する
ことができる。
【0003】しかしながら、このような機械翻訳装置の
実態は、翻訳処理の全てを自動翻訳すると誤訳とは言え
ないまでも適訳でないことが多いため、原文の概要を捉
える程度の翻訳しかできない。そのため、自動翻訳の前
には利用者自身の手により、翻訳用辞書に登録されてい
ない未登録語に対して訳語を対応させたり綴りを補正し
たりする必要がある。さらに、自動翻訳の後には誤訳を
訂正したり意訳するための再翻訳処理を行う必要もあ
り、機械翻訳装置は未だ翻訳処理を軽減するための支援
装置としての位置付けにあるに過ぎない。そして、この
ような翻訳処理作業を軽減するために、検出した未登録
語に対し訳語を対応させたり綴りを補正したりする未登
録語処理を迅速に行うことが要望されている。このよう
な機械翻訳装置で翻訳する原文と訳文との組合せはどの
ようなものでも構わないが、一例として英文を和訳する
場合について説明する。
【0004】以下、従来の機械翻訳装置について説明す
る。図7は従来の機械翻訳装置の構成を示すブロック図
である。
【0005】図7において、機械翻訳装置は翻訳処理部
1と周辺機器2とで構成されており、機械翻訳装置の中
枢をなす翻訳処理部1はその主要部が制御手段3と翻訳
編集手段4とで構成されている。文字認識手段4aと未
登録語検出手段4bと綴り補正手段4cと未登録語登録
手段4dと翻訳手段4eとで構成された翻訳編集手段4
は、後述する方法により文字認識した原文を翻訳し原文
と訳文とを対応付けて編集する。機械翻訳装置の制御全
般を担う制御手段3は、CPU(中央処理装置)、RO
M(リードオンリメモリ)、RAM(ランダムアクセス
メモリ)、入出力制御装置等で構成されており、CRT
やLCD等で構成された表示手段5を制御して原文や訳
文等の文書データを表示する。キーボード等の入力手段
6から入力したり、スキャナ等の読み取り手段7で原稿
を読み取り、翻訳編集手段4で文字認識することにより
作成した原文は、翻訳処理を施して原文と訳文とを対応
付けて編集した後、光磁気ディスク装置やハードディス
ク装置で構成された記録手段8に文書データとして順次
格納される。記録手段8に格納された文書データの検索
は、検索手段9を通じて所望のものを検索することによ
り行われ、読み出した文書データはレーザープリンタ等
で構成された出力手段10で出力することができる。
【0006】以下、文字認識・翻訳処理を行う翻訳編集
手段について、図7に加え図8〜図12の従来の機械翻
訳装置の表示画面を示す図を参照して説明する。
【0007】前述のように、機械翻訳装置の中枢をなす
翻訳処理部1はその主要部が制御手段3と翻訳編集手段
4とで構成されており、文字認識・翻訳処理を行う翻訳
編集手段4は、文字認識を行い原文を作成する文字認識
手段4aと、原文中から翻訳用辞書8aに登録されてい
ない未登録語を検出する未登録語検出手段4bと、単語
の綴りの誤りを補正する綴り補正手段4cと、未登録語
に訳語を対応させ翻訳用辞書8aに登録する未登録語登
録手段4dと、原文に対し構文を解析して翻訳する翻訳
手段4eとで構成されている。
【0008】文字認識手段4aは、読み取り手段7で原
稿から読み取ったイメージデータに対して文字認識を行
い、文字データに変換して原文を作成する。
【0009】未登録語検出手段4bは、図8に示すよう
な原文に対し、表示手段5の画面の左側に表示された原
文中の全ての単語を対象に、翻訳用辞書8aに登録され
ている登録語と逐一照合することにより未登録語の検出
を行う。未登録語の検出に要する時間は原文を構成する
単語の数に比例するので、原文が長文であればある程未
登録語の検出には時間がかかることになる。未登録語の
出現は、その大部分が入力手段6からの入力間違いや文
字認識手段4aでの認識間違いに起因するものであり、
この文字認識手段4aでの認識間違いは、特に英数文字
の内小文字の「o,c,e」,「i,l」等や1文字を
2文字と見間違え易い「m,rn」の間で発生し易い。
【0010】例えば、1文目の「examinatlo
n」と2文目の「exarninatlon」が翻訳用
辞書8aに登録されていない未登録語であるとすれば、
未登録語検出手段4bは「examinatlon」と
「exarninatlon」とを未登録語として検出
し、図9に示すように「examinatlon」と
「exarninatlon」の部分をブロックで囲っ
て未登録語であることを表示する。
【0011】この原文の1文目の「examinatl
on」は「examination」の間違いであるこ
とが分かるので、綴りを「examination」に
補正しなければならない。同様に、2文目の「exar
ninatlon」も「examination」の間
違いであることが分かるので、綴りを「examina
tion」に補正しなければならない。
【0012】次に、綴り補正手段4cを作動させ、入力
手段6から入力することによりブロックで囲んだ1文目
の「examinatlon」と2文目の「exarn
inatlon」の部分を、図10に示すように正しい
綴りの「examination」に補正する。なお、
「examinatlon」から「examinati
on」への補正は、一括変換方式を利用することにより
原文中の全ての「examinatlon」を「exa
mination」へと容易に変更できる。2文目の
「exarninatlon」も同様である。
【0013】翻訳処理の前段階として、再び未登録語検
出手段4bを作動させ、図10に示す表示手段5の画面
の左側に表示された原文中の全ての単語を対象に、翻訳
用辞書8aに登録されている登録語と逐一照合すること
により未登録語の検出を行う。もし、「examina
tion」が未登録語として表示されなければ何もせず
に未登録語処理を終了する。
【0014】ここで、図11に示すように、例えば単語
「examination」が正確に綴りを補正したに
もかかわらず、またしてもブロックで囲まれ新たな未登
録語として表示されれば、これは本当の未登録語である
ので未登録語登録手段4dを作動して未登録語「exa
mination」に訳語「試験,検査,・・,審査」
を対応させ、検索手段9を通じて記録手段8の翻訳用辞
書8aに登録することにより未登録語処理を終了する。
【0015】最後に、翻訳手段4eは検索手段9を通
じ、記録手段8に格納された翻訳用辞書8aを用いて概
要が捉えられる程度に、原文の全てに対し構文を解析し
て自動的に逐次翻訳し、図12に示すように、左側に原
文を右側に訳文をそれぞれ対応させて表示する。
【0016】以上に述べた一連の流れをまとめて、図1
3の従来の機械翻訳装置の翻訳編集手段の動作を示すフ
ローチャートを参照しながら説明する。
【0017】まず、利用者は原稿から読み取ったイメー
ジデータに対して文字認識を行うために翻訳編集手段4
を作動させ、文字認識手段4aによりイメージデータを
文字データに変換して原文を作成する(ステップ1)。
次に、作成した原文を翻訳するために未登録語検出手段
4bを作動させ(ステップ2)、原文中の全ての単語を
対象に翻訳用辞書8aに登録されている登録語と逐一照
合し、未登録語が存在するか否かを判断する(ステップ
3)。
【0018】未登録語が存在しなければ、翻訳手段4e
により原文の全てに対し構文を解析して自動的に逐次翻
訳する(ステップ4)。未登録語が存在すれば検出した
未登録語を表示する(ステップ5)。そして、次は表示
された未登録語に綴りの間違いがあるか否かにより分岐
する(ステップ6)。
【0019】綴りの間違いがあれば、綴り補正手段4c
により間違った綴りを補正し(ステップ7)、ステップ
2へ進んで再び原文中の全ての単語を対象に未登録語の
検出を行う。綴りの間違いがなければ、未登録語登録手
段4dにより未登録語を訳語と対応させて翻訳用辞書8
aに登録し未登録語処理を終了する(ステップ8)。そ
して、翻訳手段4eにより原文の全てに対し構文を解析
して自動的に逐次翻訳する(ステップ9)。
【0020】
【発明が解決しようとする課題】しかしながら、以上の
ような従来の機械翻訳装置では、未登録語として検出し
た単語に対する綴りの補正には、利用者の推測力に全面
的に依存しなければならず、利用者に対する負担が極め
て大きいという問題点を有していた。
【0021】本発明は、以上の問題点を解決し、未登録
語として検出した単語に対する綴りの補正を、自動的に
綴りを推測することにより迅速に行える機械翻訳装置を
提供することを目的とする。
【0022】
【課題を解決するための手段】以上の問題点を解決する
ために本発明の機械翻訳装置は、各種入力及び指示を行
う入力手段と、入力手段から入力された各種情報を表示
する表示手段と、アルファベットの文書等を読み取る読
み取り手段と、読み取り手段が読み取った文書情報を文
字認識してテキスト情報に変換する文字認識手段と、文
字認識手段により変換されたテキスト情報を格納する格
納手段と、単語の綴りとその意味とが対応して検索可能
に格納されている翻訳用辞書と、単語の綴りに従って翻
訳用辞書内からその単語の綴りに対応する訳語を検索す
る検索手段と、格納手段に格納された単語の綴りに対し
て検索手段により翻訳用辞書内を検索しながら翻訳する
翻訳手段と、テキスト情報に変換された単語の綴りが翻
訳用辞書内にないものを未登録語として検出する未登録
語検出手段と、文字認識手段により誤った認識をされる
文字又は単語の綴りを構成する一部の文字列に対して、
それぞれ正しい文字又は正しい文字単語の綴りを構成す
る一部の文字列を格納する正誤情報テーブルと、未登録
語検出手段により未登録語として検出された単語の綴り
に対して正誤テーブルを参照して文字又は単語の綴りの
一部を入れ替えて自動的に修正し表示手段に表示する綴
り推測手段と、を備える。
【0023】
【作用】この構成により、未登録語として検出した単語
に対し、自動的に綴りを推測して正しい単語の候補を表
示するので、綴りの補正を利用者の推測力に依存する必
要がなくなり、綴りの補正が迅速に行えると共に利用者
の負担を軽減できる。
【0024】
【実施例】以下、図面を参照しながら本発明の実施例を
説明するが、従来例と同一の部分には同一の符号を付し
ている。
【0025】図1は本発明の一実施例における機械翻訳
装置のブロック図である。図1において、機械翻訳装置
は翻訳処理部11と周辺機器2とで構成されており、機
械翻訳装置の中枢をなす翻訳処理部11はその主要部が
制御手段12と翻訳編集手段13とで構成されている。
文字認識手段13aと未登録語検出手段13bと綴り推
測手段13cと未登録語登録手段13dと翻訳手段13
eとで構成された翻訳編集手段13は、後述する方法に
より原文を翻訳し原文と訳文とを対応付けて編集する。
機械翻訳装置の制御全般を担う制御手段12は、CP
U、ROM、RAM、入出力制御装置等で構成されてお
り、CRTやLCD等で構成された表示手段5を制御し
て原文や訳文等の文書データを表示する。音声出力する
音声出力手段14は音声合成LSI、スピーカー、ブザ
ー、アンプ等で構成されており、表示手段5に表示され
た警告の内容を音声出力して告知する。キーボード等の
入力手段6から入力したり、スキャナ等の読み取り手段
7で原稿を読み取り、翻訳編集手段13で文字認識する
ことにより作成した原文は、翻訳処理を施して原文と訳
文とを対応付けて編集した後、光磁気ディスク装置やハ
ードディスク装置で構成された記録手段8に文書データ
として順次格納される。記録手段8に格納された文書デ
ータの検索は、検索手段9を通じて所望のものを検索す
ることにより行われ、読み出した文書データはレーザー
プリンタ等で構成された出力手段10で出力することが
できる。
【0026】以下、原文の文字認識・翻訳処理を行う翻
訳編集手段について、図1に加え図2の本発明の一実施
例における機械翻訳装置の表示画面を示す図と、図3の
本発明の一実施例における機械翻訳装置の綴り情報を示
す図と、図4〜図5の本発明の一実施例における機械翻
訳装置の表示画面を示す図を参照して説明する。
【0027】前述のように、機械翻訳装置の中枢をなす
翻訳処理部11はその主要部が制御手段12と翻訳編集
手段13とで構成されており、翻訳編集手段13は、文
字認識を行い原文を作成する文字認識手段13aと、原
文中から翻訳用辞書8aに登録されていない未登録語を
検出する未登録語検出手段13bと、単語の綴りの補正
に際して綴り情報を参照し正しい綴りを推測して表示す
る綴り推測手段13cと、未登録語に訳語を対応させ翻
訳用辞書8aに登録する未登録語登録手段13dと、原
文に対し構文を解析して翻訳する翻訳手段13eとで構
成されている。
【0028】文字認識手段13aは、読み取り手段7で
原稿から読み取ったイメージデータに対して文字認識を
行い、テキスト情報(文字データ)に変換して原文を作
成する。
【0029】未登録語検出手段13bは、図8の従来例
の表示画面と同様な原文に対し、表示手段5の画面の左
側に表示された原文中の全ての単語を対象に、翻訳用辞
書8aに登録されている登録語と逐一照合することによ
り未登録語の検出を行う。
【0030】検出された未登録語は図示しない未登録語
格納手段に格納される。未登録語の検出に要する時間は
原文を構成する単語の数に比例するので、原文が長文で
あればある程未登録語の検出には時間がかかることにな
る。未登録語の出現は、その大部分が入力手段6からの
入力間違いや文字認識手段13aでの認識間違いに起因
するものであり、この文字認識手段13aでの認識間違
いは、特に英数文字の内小文字の「o,c,e」,
「i,l」等や1文字を2文字と見間違え易い「m,r
n」の間で発生し易い。
【0031】例えば、1文目の「examinatlo
n」と2文目の「exarninatlon」が翻訳用
辞書8aに登録されていない未登録語であるとすれば、
未登録語検出手段13bは「examinatlon」
と「exarninatlon」とを未登録語として検
出し、図2に示す表示画面のように「examinat
lon」と「exarninatlon」の部分をブロ
ックで囲って未登録語であることを表示する。そして従
来例と違い、本実施例では未登録語を識別すると、画面
表示あるいは音声出力の内、少なくとも一つの方法を用
いて警告を行う。
【0032】この時、表示手段5の画面の下側には、
{「examinatlon」,「exarninat
lon」は未登録語です。綴りに間違いはありませんか
?}という旨の表示による警告が行われる。加えて、音
声出力手段14により音声による警告も行われ、ブザー
によるピープ音、あるいは表示された内容が音声合成L
SIにより音声に変換されてスピーカーから出力され
る。
【0033】この原文の1文目の「examinatl
on」は「examination」の間違いであるこ
とが分かるので、綴りを「examination」に
補正しなければならない。同様に、2文目の「exar
ninatlon」も「examination」の間
違いであることが分かるので、綴りを「examina
tion」に補正しなければならない。
【0034】次に、入力手段により手動補正か自動補正
かを選択する。手動補正を選択すると、入力手段6から
入力することによりブロックで囲んだ1文目の「exa
minatlon」と2文目の「exarninatl
on」の部分を、図10の従来例の表示画面と同様に、
正しい綴りである「examination」に手動で
補正することができる。
【0035】また、入力手段により自動補正を選択する
と、まず、原文の1文目の未登録語「examinat
lon」を自動補正するために、綴り推測手段13cは
図3に示すような綴り情報15を参照する。この綴り情
報15は情報テーブルで構成されており、翻訳用辞書8
aに格納されている。1枚目の情報テーブル16aに
は、単語を構成する文字列の内の出現頻度の高い部分を
列挙した{「tion」・・}等の文字列情報が記録さ
れており、2枚目の情報テーブル16bには、誤認識を
起こし易い文字列と正しい文字列との組合せを列挙した
{「m〜rn」,「ti〜tl」・・}等の文字列情報
が記録されている。
【0036】上記綴り情報及び各情報テーブルを正誤情
報テーブルとする。情報テーブル16a,16bの枚数
は1枚目だけでも2枚目だけでも構わないが、枚数には
別段制限がないので、より多く(この場合は両方)揃っ
ていた方がより良い結果が得られる。
【0037】未登録語「examinatlon」に対
して、綴り推測手段13cは1枚目の情報テーブル16
aを参照し、単語「examinatlon」を構成す
る文字列の内の「tlon」の部分を、情報テーブル1
6aに記録されている文字列情報の内の、良く似ている
文字列「tion」と入れ替えて、単語「examin
ation」を推測する。他にも似ている文字列があれ
ば同様に入れ替えて次々と単語を推測し、推測した単語
「examination」,・・等を、図4に示すよ
うに未登録語「examinatlon」の正しい単語
の候補である推測語として表示する。利用者が推測語と
して「examination」を選択すると、図10
に示すように原文中の「examinatlon」が
「examination」に補正される。
【0038】次に、原文の2文目の未登録語「exar
ninatlon」を自動補正するために綴り推測手段
13cは、まず1枚目の情報テーブル16aを参照し、
単語「exarninatlon」を構成する文字列の
内の「tlon」の部分を、情報テーブル16aに記録
されている文字列情報の内の、良く似ている文字列「t
ion」と入れ替えて、単語「exarninatio
n」を推測し、次に2枚目の情報テーブル16bを参照
して、単語「exarnination」の誤認識を起
こし易い文字列「rn」の部分を、情報テーブル16a
に記録されている文字列情報の内の、良く似ている文字
列「m」と入れ替えて、単語「examinatio
n」を推測する。他にも似ている文字列があれば同様に
入れ替えて次々と単語を推測し、推測した単語「exa
mination」,・・等を、図5に示すように未登
録語「exarninatlon」の正しい単語の候補
である推測語として表示する。利用者が推測語として
「examination」を選択すると、図10に示
すように原文中の「examinatlon」が「ex
amination」に補正される。
【0039】ところで、原文の2文目の未登録語「ex
arninatlon」を自動補正するためには、2枚
目の情報テーブル16bだけを参照しても「m〜rn」
と「ti〜tl」の入れ替えにより結果としては同じも
のが得られるが、未登録語が複雑な単語の場合は情報テ
ーブル16aを参照した後に情報テーブル16bを参照
した方が早く処理できる。
【0040】なお、「examinatlon」から
「examination」への補正は、一括変換方式
を利用することにより原文中の全ての「examina
tlon」を「examination」へと容易に変
更できる。2文目の「exarninatlon」も同
様である。
【0041】翻訳処理の前段階として、再び未登録語検
出手段13bを作動させ、図10に示す表示手段5の画
面の左側に表示された原文中の全ての単語を対象に、翻
訳用辞書8aに登録されている登録語と逐一照合するこ
とにより未登録語の検出を行う。もし、「examin
ation」が未登録語として表示されなければ何もせ
ずに未登録語処理を終了する。
【0042】ここで、図11に示すように、例えば単語
「examination」が正確に綴りを補正したに
もかかわらず、またしてもブロックで囲まれ新たな未登
録語として表示されれば、これは本当の未登録語である
ので未登録語登録手段13dを作動して未登録語「ex
amination」に訳語「試験,検査,・・,審
査」を対応させ、検索手段9を通じて記録手段8の翻訳
用辞書8aに登録することにより未登録語処理を終了す
る。
【0043】最後に、翻訳手段13eは検索手段9を通
じ、記録手段8に格納された翻訳用辞書8aを用いて概
要が捉えられる程度に、原文の全てに対し構文を解析し
て自動的に逐次翻訳し、図12の従来例の表示画面と同
様に、左側に原文を右側に訳文をそれぞれ対応させて表
示する。
【0044】以上に述べた一連の流れをまとめて、図6
の本発明の一実施例における機械翻訳装置の翻訳編集手
段の動作を示すフローチャートを参照しながら説明す
る。
【0045】まず、利用者は原稿から読み取ったイメー
ジデータに対して文字認識を行うために翻訳編集手段1
3を作動させ、文字認識手段13aによりイメージデー
タを文字データに変換して原文を作成する(ステップ1
1)。次に、作成した原文を翻訳するために未登録語検
出手段13bを作動させ(ステップ12)、原文中の全
ての単語を対象に翻訳用辞書8aに登録されている登録
語と逐一照合し、未登録語が存在するか否かを判断する
(ステップ13)。
【0046】未登録語が存在しなければ、翻訳手段13
eにより原文の全てに対し構文を解析して自動的に逐次
翻訳する(ステップ14)。未登録語が存在すれば検出
した未登録語を表示して警告を行う(ステップ15)。
そして、次は表示された未登録語に綴りの間違いがある
か否かにより分岐する(ステップ16)。
【0047】綴りの間違いがあれば、綴り推測手段13
cにより正しい綴りを自動的に推測させて推測語を表示
する(ステップ17)。そして、表示された推測語の内
から最適の単語を選択することにより間違った綴りを補
正し(ステップ18)、ステップ12へ戻り再び原文中
の全ての単語を対象に未登録語の検出を行う。
【0048】綴りの間違いがなければ、未登録語登録手
段13dにより未登録語を訳語と対応させて翻訳用辞書
8aに登録し未登録語処理を終了する(ステップ1
9)。そして、翻訳手段13eにより原文の全てに対し
構文を解析して自動的に逐次翻訳する(ステップ2
0)。
【0049】
【発明の効果】本発明の機械翻訳装置は、この構成によ
り、未登録語として検出した単語に対し、自動的に綴り
を推測して正しい単語の候補を表示するので、綴りの補
正を利用者の推測力に依存する必要がなくなり、綴りの
補正が迅速に行えると共に利用者の負担を軽減できる。
【図面の簡単な説明】
【図1】本発明の一実施例における機械翻訳装置のブロ
ック図
【図2】本発明の一実施例における機械翻訳装置の表示
画面を示す図
【図3】本発明の一実施例における機械翻訳装置の綴り
情報を示す図
【図4】本発明の一実施例における機械翻訳装置の表示
画面を示す図
【図5】本発明の一実施例における機械翻訳装置の表示
画面を示す図
【図6】本発明の一実施例における機械翻訳装置の翻訳
編集手段の動作を示すフローチャート
【図7】従来の機械翻訳装置の構成を示すブロック図
【図8】従来の機械翻訳装置の表示画面を示す図
【図9】従来の機械翻訳装置の表示画面を示す図
【図10】従来の機械翻訳装置の表示画面を示す図
【図11】従来の機械翻訳装置の表示画面を示す図
【図12】従来の機械翻訳装置の表示画面を示す図
【図13】従来の機械翻訳装置の翻訳編集手段の動作を
示すフローチャート
【符号の説明】
1 翻訳処理部 2 周辺機器 3 制御手段 4 翻訳編集手段 4a 文字認識手段 4b 未登録語検出手段 4c 綴り補正手段 4d 未登録語登録手段 4e 翻訳手段 5 表示手段 6 入力手段 7 読み取り手段 8 記録手段 8a 翻訳用辞書 9 検索手段 10 出力手段 11 翻訳処理部 12 制御手段 13 翻訳編集手段 13a 文字認識手段 13b 未登録語検出手段 13c 綴り推測手段 13d 未登録語登録手段 13e 翻訳手段 14 音声出力手段 15 綴り情報 16a 情報テーブル 16b 情報テーブル

Claims (4)

    【特許請求の範囲】
  1. 【請求項1】各種入力及び指示を行う入力手段と、 前記入力手段から入力された各種情報を表示する表示手
    段と、 外国語の文書等を読み取る読み取り手段と、 前記読み取り手段が読み取った文書情報を文字認識して
    テキスト情報に変換する文字認識手段と、 前記文字認識手段により変換されたテキスト情報を格納
    する格納手段と、 単語の綴りとその意味とが対応して検索可能に格納され
    ている外国語の翻訳用辞書と、 単語の綴りに従って前記翻訳用辞書内からその単語の綴
    りに対応する訳語を検索する検索手段と、 前記格納手段に格納された単語の綴りに対して前記検索
    手段により前記翻訳用辞書内を検索しながら翻訳する翻
    訳手段と、 前記テキスト情報に変換された単語の綴りが前記翻訳用
    辞書内にないものを未登録語として検出する未登録語検
    出手段と、 前記文字認識手段により誤った認識をされる文字又は単
    語の綴りを構成する一部の文字列に対して、それぞれ正
    しい文字又は正しい文字単語の綴りを構成する一部の文
    字列を格納する正誤情報テーブルと、 前記未登録語検出手段により未登録語として検出された
    単語の綴りに対して前記正誤テーブルを参照して文字又
    は単語の綴りの一部を入れ替えて自動的に修正し前記表
    示手段に表示する綴り推測手段と、を備える機械翻訳装
    置。
  2. 【請求項2】前記綴り推測手段は、未登録語の単語の綴
    りと、その単語の綴りに対応する修正した1つ又は複数
    の単語の綴りとを同時に表示させる請求項1記載の機械
    翻訳装置。
  3. 【請求項3】前記綴り推測手段により修正された複数の
    単語の綴りのうちの1つを前記入力手段により選択指示
    することにより、表示された未登録語の単語の綴りが選
    択された単語の綴りに変換される請求項2記載の機械翻
    訳装置。
  4. 【請求項4】前記入力手段は、前記綴り推測手段を作動
    させて単語の綴りを修正するか又は前記入力手段により
    単語の綴りを修正するかを選択する請求項1記載の機械
    翻訳装置。
JP7147222A 1995-06-14 1995-06-14 機械翻訳装置 Pending JPH08339373A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7147222A JPH08339373A (ja) 1995-06-14 1995-06-14 機械翻訳装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7147222A JPH08339373A (ja) 1995-06-14 1995-06-14 機械翻訳装置

Publications (1)

Publication Number Publication Date
JPH08339373A true JPH08339373A (ja) 1996-12-24

Family

ID=15425339

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7147222A Pending JPH08339373A (ja) 1995-06-14 1995-06-14 機械翻訳装置

Country Status (1)

Country Link
JP (1) JPH08339373A (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007052700A (ja) * 2005-08-19 2007-03-01 Toshiba Corp 機械翻訳装置および機械翻訳プログラム
JP2010164918A (ja) * 2009-01-19 2010-07-29 Toshiba Corp 音声翻訳装置、および方法
KR101064950B1 (ko) * 2008-12-02 2011-09-15 한국전자통신연구원 번역 오류 후처리 보정 장치 및 방법
US8494835B2 (en) 2008-12-02 2013-07-23 Electronics And Telecommunications Research Institute Post-editing apparatus and method for correcting translation errors
US10157176B2 (en) 2016-01-28 2018-12-18 Fujitsu Limited Information processing apparatus and display method
US10521507B2 (en) 2016-01-28 2019-12-31 Fujitsu Limited Information processing apparatus and registration method

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007052700A (ja) * 2005-08-19 2007-03-01 Toshiba Corp 機械翻訳装置および機械翻訳プログラム
KR101064950B1 (ko) * 2008-12-02 2011-09-15 한국전자통신연구원 번역 오류 후처리 보정 장치 및 방법
US8494835B2 (en) 2008-12-02 2013-07-23 Electronics And Telecommunications Research Institute Post-editing apparatus and method for correcting translation errors
JP2010164918A (ja) * 2009-01-19 2010-07-29 Toshiba Corp 音声翻訳装置、および方法
US10157176B2 (en) 2016-01-28 2018-12-18 Fujitsu Limited Information processing apparatus and display method
US10521507B2 (en) 2016-01-28 2019-12-31 Fujitsu Limited Information processing apparatus and registration method

Similar Documents

Publication Publication Date Title
US5214583A (en) Machine language translation system which produces consistent translated words
US8219381B2 (en) Dictionary registration apparatus, dictionary registration method, and computer product
US8655641B2 (en) Machine translation apparatus and non-transitory computer readable medium
JPH08235182A (ja) 文章処理方法とその装置
JPH08339373A (ja) 機械翻訳装置
JP2009157888A (ja) 音訳モデル作成装置、音訳装置、及びそれらのためのコンピュータプログラム
Kabra et al. Auto spell suggestion for high quality speech synthesis in hindi
JP3935374B2 (ja) 辞書構築支援方法、装置及びプログラム
JP2774495B2 (ja) 自然言語処理装置
JP3949874B2 (ja) 翻訳訳語学習方法、翻訳訳語学習装置、記憶媒体及び翻訳システム
JPH09325673A (ja) 翻訳文添削支援装置
JPS59127151A (ja) 文章読上げ装置
JP3278889B2 (ja) 機械翻訳装置
JP3362036B2 (ja) 機械翻訳方法および装置
JPS63118868A (ja) 日本語文章校正装置
JPH0836580A (ja) 翻訳装置
KR100932643B1 (ko) 한국어 tts 시스템을 위한 형태소, 구문 분석 없는음소열-발음열 변환방법 및 장치
JP3118880B2 (ja) 日本語文章処理装置
JPH05342260A (ja) 単語綴りチェック装置
JPH07334624A (ja) 文字認識装置
JPS6190268A (ja) 翻訳方式
JPH10301597A (ja) 音声認識装置
JPH06149878A (ja) 外国語文作成読解支援装置
JP2009098328A (ja) 音声合成装置及び方法
JPH0635955A (ja) 機械翻訳装置