JPH0554073A - デジタル翻訳装置 - Google Patents

デジタル翻訳装置

Info

Publication number
JPH0554073A
JPH0554073A JP3211978A JP21197891A JPH0554073A JP H0554073 A JPH0554073 A JP H0554073A JP 3211978 A JP3211978 A JP 3211978A JP 21197891 A JP21197891 A JP 21197891A JP H0554073 A JPH0554073 A JP H0554073A
Authority
JP
Japan
Prior art keywords
word
character
translated
image
output
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP3211978A
Other languages
English (en)
Inventor
Takashi Sato
藤 隆 佐
Shinji Kato
藤 真 治 加
Kenichi Hasegawa
谷 川 健 一 長
Genichi Yasui
井 元 一 安
Kazuyasu Ohashi
橋 和 泰 大
Takehisa Maeda
田 雄 久 前
Yoshie Yamanaka
中 美 枝 山
Shigeki Sawa
茂 樹 沢
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP3211978A priority Critical patent/JPH0554073A/ja
Publication of JPH0554073A publication Critical patent/JPH0554073A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 【目的】 低コストで操作性の良い翻訳装置を提供し、
また1つの単語に対して複数の訳語を出力する。 【構成】 原稿画像を読み取る原稿読取手段;原稿の画
像情報を格納する記憶手段;格納された画像情報から文
字単位の情報を切り出す文字切り出し手段;切り出した
文字単位の情報の間隔から単語情報を抽出する単語抽出
手段;抽出した単語情報の各文字情報を文字コードに変
換する文字コード変換手段;文字コードのならびにより
単語を認識し、単語コードのならびに変換する単語コー
ド変換手段;1つの単語コードと該コードに対する複数
の訳語とを組にして記憶する訳語記憶手段;訳語記憶手
段に基づいて、認識した単語を複数の訳語に翻訳する翻
訳手段;および、単語および訳語の文字画像を出力画像
メモリに書込み、書込んだ情報を出力する出力画像作成
手段;を備える。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明はデジタル翻訳装置に関
し、特に文章原稿を光学的に読取って文字を認識し、認
識した文字を単語単位で翻訳するデジタル翻訳装置に関
する。
【0002】
【従来の技術】翻訳装置においては、例えば、翻訳した
い文章原稿を光学的に読取り、読み取った画像の文字を
認識し、この認識結果から辞書検索を行ない翻訳処理を
行なう。また文字の認識は、OCR(文字認識装置)等
を用い、入力されたイメージ文字と文字認識用の辞書に
存在する文字とを比較することにより行なっている。翻
訳装置として製品化されているものとして例えば、
(株)ノヴァの「Transer/EJ」がある。
【0003】このような翻訳装置の文字認識装置として
は、例えば特開昭60−239885号公報や特開平1-
137383号公報に開示の装置があり、文字認識率を向上す
るための工夫がなされている。他に、16ビットパーソ
ナルコンピュータとCCDカメラおよびイメージメモリ
ボードから構成された印刷漢字認識システム(第40回
(平成2年前期)情報処理学会全国大会公演論文集
(I)4C−4)等もある。
【0004】
【発明が解決しようとする課題】ところで、従来の翻訳
装置は、ホストコンピュータと画像入力装置で構成さ
れ、かなり高額であり、コンピュータ専門知識がないと
使用できなかった。また翻訳後の文章の校正作業が多い
ので、複雑な操作の流れをある程度理解していないと使
用するのが困難であった。さらに、翻訳作業において出
力される訳語の数が単語と1対1であるために、適切な
訳語が出力されなかった場合には、使用者が再度その単
語についての翻訳作業を行なわなければない等の問題が
あった。
【0005】本発明は上記問題を解決すべく考案された
もので、低コストで操作性の良い翻訳装置を提供し、ま
た1つの単語に対して複数の訳語を出力することを目的
とする。
【0006】
【課題を解決するための手段】本発明のデジタル翻訳装
置は、原稿画像を読み取る原稿読取手段(200);原稿読
取手段(200)が読み取った原稿の画像情報を格納する記
憶手段(209);記憶手段(209)に格納された画像情報から
文字単位の情報を切り出す文字切り出し手段(204,205,2
06);文字切り出し手段(204,205,206)により切り出した
文字単位の情報の間隔から単語情報を抽出する単語抽出
手段(204,205,206);単語抽出手段(204,205,206)により
抽出した単語情報の各文字情報を文字コードに変換する
文字コード変換手段(204,205,206,207,212);文字コー
ドのならびにより単語を認識し、単語コードのならびに
変換する単語コード変換手段(204,205,206,207,212);
1つの単語コードと該コードに対する複数の訳語とを組
にして記憶する訳語記憶手段(207);訳語記憶手段(207)
に基づいて、認識した単語を複数の訳語に翻訳する翻訳
手段(204,205,206,207);および、単語および訳語の文
字画像を出力画像メモリに書込み、書込んだ情報を出力
する出力画像作成手段(204,205,206,209,211);を備え
る。なお、カッコ内の記号は後述する実施例の対応要素
である。
【0007】
【作用】例えば、英文章の原稿を読み取った場合、読取
った原稿に対して、文字の切り出しを行なうことによ
り、アルファベット単位の文字情報を抽出することがで
きる。さらに、アルファベット単位の文字情報を基に単
語抽出を行なうことで英単語単位の文字情報が抽出され
る。この後、英単語単位の各文字(アルファベット)を
文字コード変換し、文字コードのならびにより単語を認
識し、さらに単語コードに変換する。この単語コードに
対する、訳語記憶手段に記憶された情報を参照すること
により認識した単語の訳語を得ることができる。なお、
単語の訳語はあらかじめ複数個が用意されている。さら
に、単語および訳語の文字画像を出力画像メモリに書込
み、書込んだ情報を出力することにより、読取った原稿
の単語および該単語に対する複数の訳語の画像を形成す
ることができる。単語に対する複数の訳語が得られるの
で、オペレータは適切な訳語を選択することにより、再
翻訳等の手間を省くことができ、かつ翻訳の幅が広が
る。
【0008】本発明の好ましい実施例では、出力画像作
成手段(204,205,206,209,211)は、単語の文字画像と訳
語の文字画像をメモリに書込む際に、単語別に単語と複
数の訳語を並べて書込む。従って、例えば、英和辞書の
書式に近似した書式で出力画像を得ることが可能であ
り、翻訳結果を出力した際にその出力画像が煩雑になら
ず、非常に見易い。
【0009】また、本発明の好ましい実施例では、1つ
の単語に対する訳語の出力数を入力設定する出力訳語設
定数入力手段(202);および、出力訳語設定数入力手段
(202)の設定に対応して1つの単語に対する訳語の出力
数を制御する訳語出力数制御手段(204,205,206,207);
を備える。従って、単語に対する訳語の数をオペレータ
が容易に設定できる。
【0010】また、本発明の好ましい実施例では、文字
コード変換手段または単語コード変換手段のコード変換
において変換するコードが存在しない単語の、出力画像
形式を変換する出力画像形式変換手段;を備える。従っ
て、原稿画像の単語で翻訳された単語と翻訳されなかっ
た単語とを異なる形式で出力でき、翻訳されなかった単
語の検索等が非常に容易となる。
【0011】また、本発明の好ましい実施例では、訳語
記憶手段(213)に記憶されていない単語および該単語に
対する訳語の登録,訳語記憶手段(213)に記憶されてい
る単語であって訳語記憶手段(213)に記憶されていない
訳語の追加登録,および記憶手段に記憶されている単語
および該単語に対する訳語の削除を行なう編集手段(20
4,205,206,213);を備え、前記訳語記憶手段(213)は、
情報の読出しおよび書込みが自在の記憶手段である。従
って、翻訳の際の辞書(訳語記憶手段)の編集が容易で
あり、種々のオペレータに対応した翻訳装置となり得
る。
【0012】さらに、本発明の好ましい実施例では、出
力画像の出力書式を設定する書式設定入力手段(202);
および、書式設定入力手段(202)により設定された書式
に対応して、単語および訳語の文字画像を出力画像メモ
リに書込む際の書式を変更する書式変更手段(204,205,2
06);を備える。従って、オペレータの好みに応じて書
式を変更することにより、それぞれのオペレータが見や
すい出力画像を得ることができる。本発明の他の目的お
よび特徴は図面を参照した以下の実施例の説明により明
らかになろう。
【0013】
【実施例】
(実施例1)図1に本発明のデジタル翻訳装置の構成を
示す。200はスキャナであり、これを入力手段(入力
部1)として原稿画像がI/F(インターフェース)2
01を介して入力される。202はフロントパネル等の
キー入力手段(入力部2)であり、ここで種々の設定条
件等がI/F203を介して入力される。204は本発
明のデジタル翻訳装置全体を制御するCPUであり、プ
ログラム用ROM206に格納された各種制御プログラ
ムおよび後述するプログラムに従って装置全体を動作さ
せる。205は入力手段202からI/F203を介し
て入力される各種データを一時記憶するワーク用RAM
である。208はアルファベット,記号,漢字,仮名,
記号,などのビットマップ・パターンが格納されている
CG(Chracter Generator)ROMである。207は、
文字コード変換処理および翻訳処理時に用いる辞書デー
タを格納している翻訳辞書用ROMである。209は入
力手段200からI/F201を介して入力された画像
データあるいは出力画像データを格納するメモリであ
り、ここに記憶された出力画像データはI/F210を
介してプリンタ・エンジン等の出力手段211へ送られ
記録媒体上に出力される。なお、212は文字認識(文
字コード変換や単語コード変換等)を行なう際に比較処
理を行なう画像処理回路である。以下に、英語から日本
語への翻訳処理の例について説明する。
【0014】図2に、入力部(操作部)202の入力に
対応したCPU204の制御動作(英語から日本語への
翻訳処理)の概要を示す。入力部(スキャナ)200の
原稿設置台(図示しない)に英文が書かれた文章原稿が
セットされ、操作部202に「スタート」入力がある
と、CPU204はまず、セットされた原稿を入力部
(スキャナ)200の原稿読取り部により読取って、例
えば、図3に示すような原稿対応の画像を得る(ステッ
プ100:以下カッコ内ではサブルーチンとかステップ
と言う語を省略し、それに付した番号数字のみを記
す)。
【0015】次に読取った原稿に対して文字切り出し処
理(200)を行ない、さらに切り出した文字を単語単
位で抽出する(300)。その後、抽出した単語単位の
画像に対して文字コード変換処理(400)、単語コー
ド変換処理(500)を行ない、さらに抽出した単語に
対する訳語出力数の制御処理を行なう。訳語出力数に応
じて抽出した単語に対する翻訳処理を行ない、翻訳結果
の文字コードを文字画像に変換して出力画像メモリに画
像を形成し(800)、出力画像メモリに書き込まれた
出力画像を紙に転写して排出する(900)。以下に、
各処理の詳細について説明する。
【0016】図4に、文字切り出し処理(200)の内
容を示す。この文字切り出し処理(200)では、ステ
ップ100(図2)で読取った画像に対し、まず、図5
に示すように主走査方向の黒画素のヒストグラムを計算
する(201)。次に黒画素数のヒストグラム値が0の
部分を機械的に行間とみなして、文字画像を行単位で切
り出す(202)。さらに図6に示すように、切り出し
た行単位の文字画像において副走査方向に黒画素の行単
位で切り出した文字画像各々に対して各走査線ごとに黒
画素数のヒストグラムを計算し、黒画素数のヒストグラ
ム値が0の部分を機械的に文字間とみなして1文字単位
の文字画像を切り出す(203,204)。なお、1文
字単位で切り出された文字画像の例を図7に示す。
【0017】図8に、単語抽出処理(300)の内容を
示す。この処理では、切り出した文字単位の画像とその
次の文字単位画像との距離(文字間)が1文字分の距離
以上の場合、そこを単語の切れ目と判断し、1文字単位
の文字画像をグループ化して単語を抽出する。まず、文
字画像の個数をカウントするカウンタの値iを1にセッ
トする(301)。次にi番目の文字画像とi+1番目
の文字画像との間に1文字分の空白があるかをチェック
する(302,303)。もし空白がある場合には、そ
の文字画像が何個目であるかを判断し、1個目である場
合にはその文字画像の左隣に文字画像があることはない
ので、そのi番目(1番目)の文字画像を1文字の単語
であるとみなす(304,305)。
【0018】ステップ303の判断で空白がなかった場
合はその文字が1個目であるかを判断し、そうでなけれ
ばi−1番目の文字画像との間に空白があるかを判断
し、空白がある場合にはそのi番目の文字画像を単語の
先頭の文字であるとみなし、それをWs=iとしてWs
番目の文字画像として記憶する(306〜308)。こ
こで空白がない場合には何もしない。ステップ306の
判断において1個目の文字画像であった場合には、ステ
ップ307の判断をすることなしに上述と同様にWs番
目の文字画像として記憶する(306,308)。
【0019】ステップ304の判断において、注目して
いるi番目の文字画像が1個目でなければ、(i=
1),先に記憶したWs番目の文字画像から現在注目し
ている文字画像までをまとめて1つの単語単位とみなす
(309)。
【0020】以上の処理を、iを1ずつ増やしながら全
ての文字画像についてチェックするまで繰返す(31
0,311)。これらの処理が完了すると図9に示すよ
うに単語単位の画像が抽出される。
【0021】次に文字コード変換処理(400)につい
て説明する。図10に、文字コード変換処理を実施する
構成を示す。この構成において文字パターン比較回路2
12aは画像処理部212(図2に示す)に備わるもの
である。文字コード変換処理では、単語抽出処理で得ら
れた各単語ごとのそれを構成する各文字画像に対して、
前記して翻訳辞書用ROM207内にあらがじめ記憶さ
れている文字画像パターンと文字コードとがペアになっ
た文字コード表内に、各文字パターンとのパターンマッ
チングを文字パターン比較回路212aで行ない、適合
したパターンとペアになっている文字コードを出力する
ことにより、各文字画像を文字コードに変換する。この
変換操作は各単語の1つ1つの文字画像に対して行なわ
れ、その結果1つの単語は図11に示すように文字コー
ドのならびに変換される。
【0022】次に、単語コード変換処理(500)につ
いて説明する。図12に単語コード変換処理を実施する
構成を示す。この構成において比較回路212bは画像
処理部212(図2に示す)に備わるものである。単語
コード変換処理では、文字コード変換処理で得られた各
単語ごとの文字コードのならびに対して、前記した翻訳
辞書用ROM207内にあらがじめ記憶されている文字
コードのならびとそれに対応する単語、そしてその単語
コードとの3つが組になった単語コード表内の、各文字
コードとのならびとの比較を比較回路212bにより行
ない、適合した文字コードのならびと組になっている単
語コードを出力することにより、各単語を単語コードに
変換する。
【0023】図13に、翻訳処理時に使用する訳語辞書
のメモリマップを示す。図13に示すように訳語辞書格
納領域と、訳語の文字画像を格納する文字格納領域とか
らなる。訳語辞書は辞書内に登録されている訳語数N1
といくつかの訳語とをメンバとする構造体が基本構成単
位となっており、それらが各単語コードに対応してい
る。また1つ1つの訳語は固定長L1のデータ形式をも
ち、その訳語の文字画像が格納されているメモリ領域の
アドレスや、訳語の優先順位、および種々の属性(例え
ば品詞や専門用語集)等をメンバとする構造体になって
いる。文字格納領域の訳語文字画像記憶形式は、前記し
た単語コード表のように訳語の文字1つ1つがコード化
されそのコードが文字パターンを指すという形式や、指
定されたアドレスにビットパターン展開された文字画像
が格納されるといった形式が考えられるが、本実施例で
は前者の場合について述ベるものとする。
【0024】次に訳語出力数制御処理(600)に用い
るポインタについて説明する。図14に示すように、上
記訳語辞書では登録された複数の訳語を各々区別、参照
するために、訳語を指すポインタcptrが設けられてい
る。これにより1つの単語に対して複数の訳語がある場
合にもそのポインタを動かすことで容易に各々の訳語に
アクセスすることができる。このポインタcptrの位置
は、訳語辞書に記憶されている各データのデータ長が固
定長であることから、ある単語コードに対応する訳語の
情報が格納されている領域の先頭アドレスA1を用いて
アドレス計算を行なうことにより求められる。例えば、
図14に示すように単語コード、訳語数の各データ長を
n0,n1とすれば、訳語1自体の情報(その文字画像
が格納されている領域のアドレス、優先順位、属性等)
が格納されているアドレスは、A1+n0+n1で計算
される。このアドレスをcptrに代入し、その値に訳語情
報のデータ長L1を加えてゆことにより訳語2以後の情
報が格納されている領域のアドレスが計算できる。
【0025】図15に、上記ポインタを用いた訳語出力
数制御処理(600)のフローチャートを示す。ここ
で、出力する訳語数はN2個であるものとし、その設定
は外部からの入力による。まず、上述したように訳語情
報格納部の先頭アドレスデータから、訳語1自体の情報
が格納されている領域のアドレスを計算する(60
1)。そしてそのアドレス値を、訳語ポインタcptrに代
入する(602)。さらに訳語がいくつ出力されたかを
みる訳語出力数カウンタの値を1にセットする(60
3)。次にcptrが指す訳語構成体のメンバから、訳語の
文字画像が格納されている領域のアドレスを読み取り、
それにしたがって文字画像を出力する(604)。出力
後、前述の訳語出力数カウンタの値を1増やす(60
5)。ここで訳語の出力数は、その単語に対して現在訳
語辞書中に登録されている訳語数N1と、出力訳語設定
数N2との関係から決められる。すなわち、N1≧N2
の場合は訳語をN2個出力し(607)、N1<N2の
場合はN1個出力する(608)。複数個の訳語を出力
する場合は上記の両者について同様であり、訳語を指す
ポインタcptrをひとつ進め(609)、ステップ604
およびステップ605の処理を行ない、各々ステップ6
07あるいはステップ608の条件により決められた訳
語数を全て出力し終えるまで、ステップ604→605
→609の処理を繰返す。以上により訳語の出力数が制
御される。
【0026】次に翻訳処理(700)について説明す
る。この処理では図16に示すように、単語コード変換
処理において得られたある1つの単語に対応する単語コ
ードを、前述の訳語辞書内で検索し、その単語コードに
対応した訳語を出力する。
【0027】図17に出力画像作成処理(800)の内
容を示す。この処理では単語の文字画像を出力画像メモ
リに書込む単語文字画像書込み処理(ステップ801〜
806)と、その単語に対する訳語の文字画像を出力画
像メモリに書込む訳語文字画像書込み処理(ステップ8
07〜812)を行なう。まず、1つの単語を構成する
文字コードの数をみる文字コード数カウンタの値iを1
にセットする(801)。次に単語の文字画像を書き込
む画像メモリ領域のアドレスを指定する(802)。そ
して単語の文字コードのならびのi番目の文字コードに
対応する文字画像を指定された領域に書込む(80
3)。この書き込みの終了後、書き込み領域を指定する
アドレス(x方向,y方向アドレス)を1文字分更新す
る(804)。その後、まだその単語を構成する文字コ
ードがあるかどうかを判断し(805)、もしあれば文
字コード数カウンタの値iを1増やし(806)、ステ
ップ803〜ステップ805の処理を繰返す。
【0028】ステップ805の判断において文字コード
がなくなれば、1つの単語の書き込みは終了し、訳語の
文字画像の書き込み処理に移る。まず、訳語の出力数を
みる訳語出力数カウンタの値jを1にセットする(80
7)。次に訳語の文字画像を書き込む画像メモリ領域の
アドレスを指定する(808)。そして先に書き込んだ
単語に対するj個目の訳語の文字画像を、ステップ80
8で指定されたアドレスを先頭とする領域へ書き込む
(809)。この書き込み終了後、書き込み領域を指定
する指定アドレス(x方向,y方向)を1訳語分更新す
る(810)。この訳語書き込みの際には、訳語の1つ
1つの文字に対応する文字コードがまず与えられ、それ
に対応した文字画像が実際には書き込まれる。その後、
それ以上訳語を出力するかどうかを判断し(811)、
まだ出力する場合には訳語出力数カウンタの値jを1増
やし(812)、ステップ809〜811の処理を繰返
す。そして決められた数の訳語が出力されると1組の単
語・訳語文字画像の書き込みが終了する。本発明では、
単語レベルで翻訳しそれに対して複数の訳語を出力する
ので、入力原稿中の1つ1つの単語に対して上記したス
テップ801〜812までの処理が繰返される。
【0029】図18に、翻訳結果の出力例を示す。図1
8に示すように1つ単語に対して複数の訳語が出力され
る。
【0030】図19および図20に、辞書形式に画像出
力を行なう場合の、出力画像作成処理800a(出力画
像作成処理800に代わる処理)のフローチャートを示
す。また図21にこのときの画像メモリのメモリマップ
を示す。以下図19,図20,および図21を参照して
辞書形式出力画像作成処理について説明する。この処理
では、まず書き込みを行なう場所の座標値データの初期
値を(x0,y0)とする(821)。ここで、xi,
yiは現在の座標値を指すものとすると、xi=x0,
yi=y0である。次にその位置を開始点として、単語
の文字画像1文字をメモリ中へ書き込む(822)。た
だし、1文字の大きさはdx×dyであるものとする。
単語の文字画像1文字を書き終えたら、座標値データの
x座標値をdxだけ増やす。すなわち、xi=xi+d
xとする(823)。上記ステップ822,ステップ8
23の処理は、1つの単語の書き込みが終わるまで繰返
される(824)。
【0031】次に、訳語の文字画像の書き込み処理に入
る。まず、2文字分のスペースを空け、すなわち、xi
=xi+2dxとする(825)。そのx座標値をxs
として記憶する(826)。このxsは訳語の文字画像
を書きはじめた座標として以後の処理において使用され
る。次にまだ文字を書き込けだけの大きさの領域がある
かどうかをxmax−xiを計算しそれをdxと比較する
ことにより判断する(827)。もしその判断において
xmax−xi≧dx(まだ書き込む領域がある)なら
ば、そのときの座標値データの位置(xi,yi)を開
始点として訳語の文字画像1文字を書き込む(82
8)。そしてx座標をdxだけ増やす(829)。もし
ステップ827の判断においてxmax−xi<dx(書
き込む領域がない)ならば、座標値データのx座標をx
sとし(830)、またy座標値をdy+sだけ増やす
(831)。すなわちそのときの座標データはxi=x
s,yi=yi+dy+sとなる。このステップ830
およびステップ831の処理では訳語の文字画像を書き
込む行を改行している。
【0032】この処理が終了すると、ステップ828,
ステップ829の処理を行ない1文字分の画像を書き込
む。これらステップ827〜ステップ831までの処理
は1つの訳語が書き込み終わるまで繰返される(83
2)。その後、まだ書き込むべき単語があるかどうかを
判断し(833)、もしあればx座標値をxi=xi+
dxとし(834)、訳語の文字画像の書き込みを行な
う。訳語がすべて書き終わったら、新たな単語に対する
上述の処理を全ての単語に対して処理し終わるまで繰返
し行なう(835)。ここで新たな単語に対する処理が
開始される度に、座標値データがxi=x0,yi=y
i+dy+sの計算によって更新される(836)。
【0033】図22に、上述の辞書形式出力画像処理
(800a)により出力した出力画像例を示す。単語単
位ごとに複数の訳が出力されることがわかる。
【0034】(実施例2)図2に英語から日本語への翻
訳処理の例において示したが、図23に、図2に示す処
理と別の処理を示す。この処理は、図2に示す処理と比
較して、文字コード変換処理および単語コード変換処理
において変換できなかった文字および単語がある場合に
出力画像形式変換処理を行なう点と、出力画像作成処理
の処理内容が異なる。
【0035】図24に出力画像形式変換処理(750)
の内容を示す。まず認識できなかった単語、あるいは認
識できたが翻訳できなかった単語の入力を行なう(75
1)。ここで、認識できなかった単語とは、切り出した
文字画像を文字コード変換処理により文字コードに変換
できなかったもので、そのデータ形式は読み取ったまま
の文字画像データ(ビットパターン)になっている。一
方、翻訳されなかった単語というのは単語コード変換処
理により単語コードに変換できなかったもので、そのデ
ータ形式は単語を構成する各文字に対応した文字コード
のならびである。
【0036】次に、その入力されたデータに対してデー
タ形式が画像データかあるいは文字コードのならびであ
るかの判別を行なう(752)。もし入力されたデータ
が文字コードのならびである場合、その単語は、認識さ
れたが翻訳できなかったものと判断し(753)、各々
の文字コードを通常の出力に使用するものとは別のフォ
ント辞書を用いて、文字画像に変換する(754)。も
し、入力されたデータが単語の画像データであった場合
には、その単語は認識されなかったものであると判断し
(755)、その入力されたビットパターン形式のデー
タに対して、例えば反転処理,網掛け,変倍,アンダー
ライン付加,等の画像処理を加え、新しいデータを作成
する(756)。
【0037】図25および図26に本実施例2における
出力画像作成処理(800b)の内容を示す。この処理
ではまず、画像メモリに書き込もうとする単語、すなわ
ち現在みている処理対象の単語が、認識OKかつ翻訳O
Kであり、正常に翻訳されたものであるかをチェック
し、その判別を行なう(800b−1,800b−
2)。正常に翻訳された単語である場合は、図17に示
す出力画像作成処理(800)と同様の処理となる。
【0038】一方、正常に翻訳されなかった単語である
場合は、まずその単語の文字画像を書き込む画像メモリ
上の領域のアドレスを指定する(800b−3)。次に
上述した出力画像形式変換処理(750)で得られた単
語の画像を、ステップ800b−3で指定された領域に
書き込む(800b−4)。当然のことながら、この認
識あるいは翻訳できなかった単語に対する処理の場合、
訳語は画像メモリに書き込まれない。
【0039】図27,図28,および図29に本実施例
の出力画像作成処理による翻訳結果の出力例を示す。図
27は、認識されたが翻訳できなかった単語を他の単語
とは別のフォントで出力し、認識も翻訳もされなかった
単語を網掛け処理して出力した例である。また図28
は、認識されたが翻訳できなかった単語を他の単語とは
別のフォントで出力し、認識も翻訳もされなかった単語
に対してアンダーライン付加を行ない出力した例であ
る。図29は、認識されたが翻訳できなかった単語を他
の単語とは別のフォントで出力し、認識も翻訳もされな
かった単語を反転処理して出力した例である。
【0040】(実施例3)図30に、図1に示すデジタ
ル翻訳装置の構成と別の構成を示す。図30に示す構成
では、図1に示す構成と比較して、翻訳辞書用のROM
が外付けの翻訳辞書用メモリ213となっている点が異
なる。翻訳辞書用メモリ213は情報の読出しだけでな
く、書込みを行なうことができる。本実施例では英語か
ら日本語への翻訳処理モードと、外付けの翻訳辞書用メ
モリ213を利用して、内蔵辞書への登録・削除等の行
なう内蔵辞書の編集モードを有している。英語から日本
語への翻訳処理モードに関しては実施例1に示す処理と
同様の処理である。従って以下に内蔵辞書の編集モード
の処理について説明する。
【0041】図31に編集モード時のCPUの制御動作
を示す。この処理では文字を画像として入力するため、
キーボード入力のような仮名漢字変換のプログラムは必
要ない。その代わりにまず、図32に示すような単語と
訳語が1対1のペアになっている形式の入力原稿をオペ
レータが作成する必要がある。この形式は単語と訳語が
交互にならんでいれば良く、図32に示すように単語と
訳語のペアが縦方向に並んでいなければならないと言う
訳ではない。まず、その入力原稿をセットし、原稿読取
り手段により原稿を得る(S1)。次に操作ボード上で
登録,追加,削除のどの指示が与えられているかのチェ
ックを行ない(S2,S4)、その指示に応じて新規登
録処理(S3),訳語の追加登録処理(S5),訳語の
削除処理(S6)を行なう。なお、それぞれの処理にお
いて、文字画像の格納に用いられるメモリは、前記した
外付けの翻訳辞書用メモリ213(図30)である。
【0042】図32に文字入力処理において入力する入
力原稿の一例を示す。単語および翻訳の新規登録の場合
には、図32(a)に示すように、新規に登録したい単
語とその訳語とのペアの集合からなる形式の入力原稿を
用いる。また翻訳の追加登録の場合には図32(b)に
示すように、現在登録されている単語と追加登録したい
訳語とのペアの集合からなる形式の入力原稿を用いる。
さらに翻訳の削除をしたい場合には図32(c)に示す
ように、現在登録されている単語と削除したい訳語との
ペアの集合からなる形式の入力原稿を用いる。なお、新
規登録、追加登録、削除等の処理モードの設定は、入力
部(操作部)2による条件設定入力により行なう。
【0043】図33に単語および訳語の新規登録処理
(S3)の内容を、図34に訳語の追加登録処理(S
5)の内容を、図35に削除処理(S6)の内容を、そ
れぞれ示す。
【0044】図33に示す新規登録処理では、まず、抽
出された英単語の単語画像を文字コード変換して、文字
コードのならびにする(S31)。次にその文字コード
のならびと、今現在の単語コード表中の単語コードの最
大値に1を加えたコードとをペアにして、単語コード表
に登録する(S32)。続いて、次の単語画像(訳語)
を文字コード変換して、その文字コードのならびを、先
に単語コード表へ登録したのと同じコードに対応させ
て、訳語辞書内に登録する(S33,S34)。図34
に示す訳語追加処理では、まず、抽出された英単語の単
語画像を文字コード変換して、文字コードのならびにす
る(S51)。次にその文字コードのならびを、単語コ
ード変換し、単語コードのならびにする(S52)。さ
らに、次の単語画像(訳語)を文字コード変換して文字
コードのならびとし(S53)、ステップS52で得ら
れた単語コードを訳語辞書内で検索し、そに対応する訳
語情報が格納されている部分の最後部に、訳語の文字コ
ードのならびを構造体として格納する(S54)。
【0045】図35に示す削除処理では、まず、抽出さ
れた英単語の単語画像を文字コード変換して、文字コー
ドのならびにする(S61)。次にその文字コードのな
らびを、単語コード変換し、単語コードのならびにする
(S62)。さらに、次の単語画像(訳語)を文字コー
ド変換して文字コードのならびとし(S63)、ステッ
プS62で得られた単語コードを訳語辞書内で検索し、
そに対応する各々の訳語構造体に対して文字コードのな
らびを検索し、合致した訳語構造体をメモリから消去す
る(S64)。
【0046】以上の処理により、編集モード処理が行な
われる。なお、編集モード処理では単語単位で抽出され
ている文字画像各々に対し、それが単語であるのか、あ
るいは訳語であるのがという判定をしなければならない
が、本実施例では、図32に示すような所定の形式の原
稿を用いることにより単語が出現する順番の偶奇をみる
ことでそれを可能としている。すなわち奇数番目の単語
画像は英単語と判断し、偶数番目のものは訳語であると
判断している。
【0047】新規登録の例として、図36に単語コード
表への登録の様子を、図37に訳語辞書への登録の様子
を、それぞれ示す。
【0048】(実施例4)本実施例4では、画像出力す
る際の書式を種々に変更する機能を有している。図38
に、本実施例4の構成を示す。図38に示す構成は、図
1に示す構成と比較して、入力部(操作部)202に書
式設定入力のための設定入力手段を備える点と、ビット
マップパターンの画像データを一時記憶すめためのバッ
ファメモリを有する点が異なる。以下に本実施例におい
て英語から日本語へ翻訳する処理について説明する。
【0049】図39に、書式設定入力に用いられる入力
部(操作部)202での表示画面の一例を示す。本実施
例では、操作部202が透明タッチスイッチ付LCD
(Liquid Crystal Display)表示器により構成されてい
る。書式設定の項目には図示するようなA〜Fがあり、
それぞれ希望の項目を選択または数値入力を行なう。A
およびBは各々1行文字数,1ページ行数の設定であ
り、テンキー(図示しない)より数値データの入力を行
なう。C〜Dは出力画像の表示方法の設定であり、それ
ぞれ希望の番号表示部を指先でタッチすることにより設
定値が入力される。図40および図41に、書式設定入
力処理のフローチャートを示す。まず、初期画面として
操作部202のLCD表示器に図39に示すような項目
が表示される。この時点で装置本体は書式設定値の入力
待ちとなる。次に画面上の「1行文字数」と表示されて
いる部分を指先でタッチすることによりA入力モードと
する(S10)。この状態で装置本体は操作部202に
備わるテンキー(図示しない)からの数値データ入力待
ち状態となり、テンキーから入力された数値データ(1
行文字数)は変数Ncとしてメモリに格納される。その
後、入力された数値データを文字画像に変換してLCD
画面上に表示し、その部分を反転表示する。
【0050】次に、LCD画面上の「1ページ行数」と
表示されている部分を指先でタッチすることによりB入
力モードとし(S20)、上述のA入力モード同様、テ
ンキーから数値データ(1ページ行数)を入力する。こ
のとき入力された数値データは変数Nlとしてメモリ内
に格納される。またその後、その数値データを文字画像
に変換してLCD画面上に表示し、その部分を反転表示
する。
【0051】以後、S30,S40,S50,S60の
各々のステップでは操作部202のタッチスイッチ付L
CD表示器の画面上の所望の書式設定項目表示部分を指
先でタッチすることにより各々の入力モード(C,D,
E,F入力モード)とし、さらに選択項目部分を指先で
タッチして書式を入力する。ここで各選択項目はそれに
対応した数値データを持っており、そのデータが各々の
ステップで変数F1,F2,F3およびF4としてメモ
リ中に格納される。その後、選択された項目の表示部分
を反転表示する。以上のような処理により出力原稿の書
式設定入力が完了する。
【0052】次に、前述のC入力モードで設定される割
付設定に対する処理について説明する。通常、英単語と
その日本語訳を同じフォントの同じポイント数で出力し
ようとする場合、必ずしも互いの文字画像幅(横方向の
ドット数)が一致するとは限らず、どちらかが短くなっ
たり長くなったりするのが普通である。従ってこの割付
設定においては、文字画像幅を訳語に揃えるか、単語に
揃えるか、あるいは文字画像幅は揃えず互いにそのまま
の幅で出力するかの設定を行なっている。
【0053】図42(a)に訳語の文字画像幅を単語に
揃える場合を示し、図42(b)に単語の文字画像幅を
訳語に揃える場合を示し、さらに図42(c)に文字画
像を揃えない場合を示す。ここで文字画像間の主走査方
向距離を行間Liと各々定義する。(a)の場合におい
て、訳語画像の幅が単語画像の幅より小さい場合は訳語
画像を横方向にだけ拡大変倍し、反対に単語画像の幅よ
り大きい場合は訳語画像を横方向にだけ縮小変倍する。
また、(b)の場合において、単語画像の幅が訳語画像
の幅より大きい場合は単語画像を横方向にだけ縮小変倍
し、反対に訳語画像の幅より小さい場合は単語画像を横
方向にだけ拡大変倍する。
【0054】(a),(b)の場合には単語画像と訳語
画像の幅が互いに等しいため、単語画像間の字間および
訳語画像間の字間もまた各々等くなる。なお、ここで変
倍率の計算については後述する。一方、(c)の場合に
おいては単語画像および訳語画像間の字間は一定になら
ない。
【0055】図43に、図42に示す割付設定処理の具
体例を示す。(a)は単語画像,訳語画像ともに本来の
サイズを示し、(b)は訳語を単語に合わせた場合、
(c)は単語を訳語に合わせた場合、の一例を示す。ま
た左側の「print」と「印刷する」の例は、訳語画像の
サイズが単語画像のサイズよりも大きい場合であり、右
側の「function」と「機能」の例は訳語画像のサイズが
単語画像のサイズよりも小さい場合の例を示している。
これらの処理により、(b)では訳語サイズが訳語ごと
に異なり、また(c)では単語のサイズが単語ごとに異
なるが、単語と訳語のサイズが同じになるため出力画像
作成の際に書き込みを行なうアドレスの指定が一意的に
決められるようになる。
【0056】図44および図45に、出力画像の書式を
変更する自動編集処理のフローチャートを示す。まず、
前述した書式設定入力(S100)により与えられた1
行文字数データNcと、あらかじめ装置本体に記憶され
ている用紙横サイズwとから、出力に適切なフォントの
ポイント数および字間Ciを決定し、また出力の際に使
用するフォント辞書を選択する(S101)。同様に、
前述した書式設定入力(S100)により与えられた1
ページ行数データNlと、あらかじめ装置本体に記憶さ
れている用紙サイズhとから、行間Liを決定する(S
102)。
【0057】次に、切り出された文字が文字コード変換
処理(S103)で文字コード変換されたかを判断する
(S104)。もし1つの単語を構成する文字全てが文
字コードに変換されていれば、文字コードを、ステップ
S101で選択されたフォント辞書を用いてドットパタ
ーン画像に変換する(S105)。そして、その画像が
記号かどうかを判断し(S106)、もし記号でなかっ
たならばその画像をバッファメモリ中に一時的に格納す
る(S107)。またこのときの単語画像の横方向のド
ット数を、変数nc1としてメモリ中に記憶しておく
(S108)。
【0058】続いて翻訳処理を行ない(S109)、翻
訳されたかどうかを判断し(S110)、翻訳されたな
らばその訳語を構成する各文字コードを、S101で選
択された訳語用のフォント辞書を用いてドットパターン
画像に変換し、バッファメモリ中に一時的に格納する
(S111)。またこのときの訳語画像の横方向のドッ
ト数を、変数nc2としてメモリ中に記憶しておく(S
112)。
【0059】次に、割付設定の様式を、前記書式設定入
力処理(S100)において変数F1として記憶してお
いた値が何であるかを判断する(S113)。もし、F
1=1(単語を訳語に合わせる場合)であれば、変倍率
Wr=nc2/nc1を計算し(S116)、ステップ
S107でバッファメモリに格納した単語画像を変倍率
wrで横変倍する(S117)。そしてその後、フレー
ムメモリ(画像メモリ)中の指定された位置にその単語
画像を書込み、行間Liだけ下の場所にステップS11
1でバッファメモリ中に格納した訳語画像を書き込む
(S118)。もしF=2(訳語を単語に合わせる場
合)であれば、変倍率Wr=nc1/nc2を計算し
(S114)、ステップS111でバッファメモリに格
納した訳語画像を変倍率wrで横変倍する(S11
5)。そしてその後、フレームメモリ(画像メモリ)中
の指定された位置にステップS107でバッファメモリ
中に格納した単語画像を書き込み、行間Liだけ下の場
所に横変倍された訳語画像を書込む(S118)。もし
F=3(文字幅を揃えない場合)であれば、ステップS
107でバッファメモリ中に格納した単語画像と、ステ
ップS111で格納バッファメモリ中に格納した訳語画
像とをフレームメモリ(画像メモリ)内の指定された位
置に書き込む(S118)。
【0060】フローチャート中のステップS119は認
識されなかった文字を表示するかしないかの判断であ
り、それについての入力設定値はメモリ中の変数F4に
格納されているのでF4の値をチェックすることで判断
できる。もしF4=1であれば、(表示する)ならば読
取ったままのイメージをフレームメモリ中に書込み、F
4=2(表示しない)ならば何もしない。
【0061】同様にステップS120は記号を表示する
かしないかの判断であり、それについての入力設定値は
メモリ中の変数F2に格納されているので、F2の値を
チェックすることで判断できる。もしF2=1(表示す
る)ならば、画像をバッファメモリ中に格納して(S1
21)、その後フレームメモリ内の指定された位置に書
き込み(S118)、F2=2(表示しない)ならば何
もしない。
【0062】さらにステップS123は翻訳されなかっ
た単語を表示するかしないかの判断であり、それについ
ての入力設定値はメモリ中の変数F3に格納されている
のでF3の値を見ることで判断される。もしF3=1
(表示する)ならば、ステップS107でバッファメモ
リ中に格納した単語画像をフレームメモリ内の指定され
た位置に書き込み(S118)、F3=2(表示しな
い)ならば何もしない。
【0063】図46,図47,および図48に各割付設
定に対する出力画像の一例を示す。図46は訳語を単語
に合わせた場合の出力画像、図47は単語を訳語に合わ
せた場合の出力画像、図48は文字幅を揃えずに文字間
隔を可変にした場合の出力画像、をそれぞれ示す。
【0064】
【発明の効果】以上のように本発明によれば、英文章の
原稿を読み取った場合、読取った原稿に対して、文字の
切り出しを行なうことにより、アルファベット単位の文
字情報を抽出することができる。さらに、アルファベッ
ト単位の文字情報を基に単語抽出を行なうことで英単語
単位の文字情報が抽出される。この後、英単語単位の各
文字(アルファベット)を文字コード変換し、文字コー
ドのならびにより単語を認識し、さらに単語コードに変
換する。この単語コードに対する、訳語記憶手段に記憶
された情報を参照することにより認識した単語の訳語を
得ることができる。なお、単語の訳語はあらかじめ複数
個が用意されている。さらに、単語および訳語の文字画
像を出力画像メモリに書込み、書込んだ情報を出力する
ことにより、読取った原稿の単語および該単語に対する
複数の訳語の画像を形成することができる。単語に対す
る複数の訳語が得られるので、オペレータは適切な訳語
を選択することにより、再翻訳等の手間を省くことがで
き、かつ翻訳の幅が広がる。また、出力画像作成手段(2
04,205,206,209,211)は、単語の文字画像と訳語の文字
画像をメモリに書込む際に、単語別に単語と複数の訳語
を並べて書込むので、例えば、英和辞書の書式に近似し
た書式で出力画像を得ることが可能であり、翻訳結果を
出力した際にその出力画像が煩雑にならず、非常に見易
い。
【0065】また、1つの単語に対する訳語の出力数を
入力設定する出力訳語設定数入力手段(202);および、
出力訳語設定数入力手段(202)の設定に対応して1つの
単語に対する訳語の出力数を制御する訳語出力数制御手
段(204,205,206,207);を備えるので、単語に対する訳
語の数をオペレータが容易に設定できる。
【0066】また、文字コード変換手段または単語コー
ド変換手段のコード変換において変換するコードが存在
しない単語の、出力画像形式を変換する出力画像形式変
換手段;を備えるので、原稿画像の単語で翻訳された単
語と翻訳されなかった単語とを異なる形式で出力でき、
翻訳されなかった単語の検索等が非常に容易となる。ま
た、訳語記憶手段(213)に記憶されていない単語および
該単語に対する訳語の登録,訳語記憶手段(213)に記憶
されている単語であって訳語記憶手段(213)に記憶され
ていない訳語の追加登録,および記憶手段に記憶されて
いる単語および該単語に対する訳語の削除を行なう編集
手段(204,205,206,213);を備え、前記訳語記憶手段(21
3)は、情報の読出しおよび書込みが自在の記憶手段であ
るので、翻訳の際の辞書(訳語記憶手段)の編集が容易
であり、種々のオペレータに対応した翻訳装置となり得
る。
【0067】さらに、出力画像の出力書式を設定する書
式設定入力手段(202);および、書式設定入力手段(202)
により設定された書式に対応して、単語および訳語の文
字画像を出力画像メモリに書込む際の書式を変更する書
式変更手段(204,205,206);を備えるので、オペレータ
の好みに応じて書式を変更することにより、それぞれの
オペレータが見やすい出力画像を得ることができる。
【図面の簡単な説明】
【図1】 本発明のデジタル翻訳装置の構成概略のブロ
ック図である。
【図2】 図1に示す入力部(操作部)202に対応し
たCPU204の制御動作の概要を示すフローチャート
である。
【図3】 原稿対応の画像の一例を示す平面図である。
【図4】 図2に示す文字の切り出し処理(200)の
内容を示すフローチャートである。
【図5】 図3に示す原稿画像に対して、主走査方向の
黒画素のヒストグラムを計算し文字画像を行単位で切り
出す際の、原稿対応の画像の一例を示す平面図である。
【図6】 図5に示した行単位で切り出したの文字画像
を、副走査方向に黒画素のヒストグラムを計算し1文字
単位の文字画像を切り出す際の、原稿対応の画像の一例
を示す平面図である。
【図7】 1文字単位で切り出された文字画像の一例を
示す平面図である。
【図8】 図2に示す単語の抽出処理(300)の内容
を示すフローチャートである。
【図9】 1文字単位の文字画像をグループ化して単語
単位で抽出した一例を示す平面図である。
【図10】 文字コード変換処理(400)を実施する
構成を示すブロック図である。
【図11】 文字コード変換例を示す平面図である。
【図12】 単語コード変換処理(500)を実施する
構成を示すブロック図である。
【図13】 翻訳処理時に使用する訳語辞書のメモリマ
ップである。
【図14】 訳語辞書のメモリマップであり、訳語出力
数制御処理(600)に用いるポインタについて説明す
る図である。
【図15】 訳語出力数制御処理(600)のフローチ
ャートである。
【図16】 翻訳処理(700)時に用いる訳語辞書内
のメモリマップである。
【図17】 出力画像作成処理(800)のフローチャ
ートである。
【図18】 翻訳結果の出力例を示す平面図である。
【図19】 辞書形式に画像出力を行なう場合の、出力
画像作成処理800a(出力画像作成処理800に代わ
る処理)のフローチャートである。
【図20】 辞書形式に画像出力を行なう場合の、出力
画像作成処理800a(出力画像作成処理800に代わ
る処理)のフローチャートである。
【図21】 辞書形式出力画像作成処理(800a)時
の画像メモリのメモリマップである。
【図22】 辞書形式出力画像処理(800a)により
出力した出力画像例を示す平面図である。
【図23】 図2に示す処理と別の処理(実施例2)
の、フローチャートである。
【図24】 出力画像形式変換処理(750)のフロー
チャートである。
【図25】 出力画像作成処理(800b)のフローチ
ャートである。
【図26】 出力画像作成処理(800b)のフローチ
ャートである。
【図27】 出力画像作成処理(800b)による翻訳
結果の出力例を示す平面図であり、認識されたが翻訳で
きなかった単語を他の単語とは別のフォントで出力し、
認識も翻訳もされなかった単語を網掛け処理して出力し
た例である。
【図28】 出力画像作成処理(800b)による翻訳
結果の出力例を示す平面図であり、認識されたが翻訳で
きなかった単語を他の単語とは別のフォントで出力し、
認識も翻訳もされなかった単語に対してアンダーライン
付加を行ない出力した例である。
【図29】 出力画像作成処理(800b)による翻訳
結果の出力例を示す平面図であり、認識されたが翻訳で
きなかった単語を他の単語とは別のフォントで出力し、
認識も翻訳もされなかった単語を反転処理して出力した
例である。
【図30】 図1に示すデジタル翻訳装置の構成と別の
構成(実施例3)を示すブロック図である。
【図31】 図30に示す構成(実施例3)での、編
集モード時のCPUの制御動作を示すフローチャートで
ある。
【図32】 編集モード時に使用する入力原稿の例を示
す平面図であり、(a)は単語および翻訳の新規登録時
に用いる原稿例、(b)は翻訳の追加登録時に用いる原
稿例、(c)は訳語の削除時に用いる原稿例、をそれぞ
れ示す。
【図33】 単語および訳語の新規登録処理(S3)の
フローチャートである。
【図34】 訳語の追加登録処理(S5)のフローチャ
ートである。
【図35】 削除処理(S6)のフローチャートであ
る。
【図36】 翻訳辞書用メモリのメモリマップであり、
新規登録時の単語コード表への登録の様子を示す。
【図37】 翻訳辞書用メモリのメモリマップであり、
新規登録時の訳語辞書への登録の様子を示す。
【図38】 図1に示すデジタル翻訳装置の構成と別の
構成(実施例4)を示すブロック図である。
【図39】 書式設定入力に用いられる入力部(操作
部)202での表示画面の一例を示す平面図である。
【図40】 書式設定入力処理(S100)のフローチ
ャートである。
【図41】 書式設定入力処理(S100)のフローチ
ャートである。
【図42】 割付設定(図39のCの選択設定)に対す
る画像出力時の文字の形成領域の領域変更の様子を示す
平面図であり、(a)は訳語の文字画像幅を単語に揃え
る場合、(b)は単語の文字画像幅を訳語に揃える場
合、(c)は文字画像を揃えない場合、をそれぞれ示
す。
【図43】 割付設定(図39のCの選択設定)に対す
る出力画像例を示す平面図であり、(a)は単語画像,
訳語画像ともに本来のサイズを示し、(b)は訳語を単
語に合わせた場合、(c)は単語を訳語に合わせた場
合、の一例を示す。
【図44】 出力画像の書式を変更する自動編集処理の
フローチャートである。
【図45】 出力画像の書式を変更する自動編集処理の
フローチャートである。
【図46】 割付設定(図39のCの選択設定)に対す
る出力画像の一例を示す平面図であり、訳語を単語に合
わせた場合の出力画像を示す。
【図47】 割付設定に対する出力画像の一例を示す平
面図であり、単語を訳語に合わせた場合の出力画像を示
す。
【図48】 割付設定に対する出力画像の一例を示す平
面図であり、文字幅を揃えずに文字間隔を可変にした場
合の出力画像を示す。
【符号の説明】
200:入力部1(原稿読取手段) 202:入力部2(出力訳語設定数入力手段,書式設定
入力手段) 204:CPU 205:RAM 206:プログラム用ROM 207:翻訳辞書用
ROM(訳語記憶手段) 208:CG用ROM 209:画像メモリ
(記憶手段) 211:出力部 212:画像処理部 213:翻訳辞書用メモリ(訳語記憶手段) 214:バッファメモリ (204,205,206:文字切り出し手段,単語抽出手段,書
式変更手段) (204,205,206,207:翻訳手段,訳語出力制御手段) (204,205,206,207,212:文字コード変換手段,単語コ
ード変換手段) (204,205,206,209,211:出力画像作成手段) (204,205,206,213:編集手段)
───────────────────────────────────────────────────── フロントページの続き (72)発明者 安 井 元 一 東京都大田区中馬込1丁目3番6号 株式 会社リコ−内 (72)発明者 大 橋 和 泰 東京都大田区中馬込1丁目3番6号 株式 会社リコ−内 (72)発明者 前 田 雄 久 東京都大田区中馬込1丁目3番6号 株式 会社リコ−内 (72)発明者 山 中 美 枝 東京都大田区中馬込1丁目3番6号 株式 会社リコ−内 (72)発明者 沢 茂 樹 東京都大田区中馬込1丁目3番6号 株式 会社リコ−内

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】原稿画像を読み取る原稿読取手段;原稿読
    取手段が読み取った原稿の画像情報を格納する記憶手
    段;記憶手段に格納された画像情報から文字単位の情報
    を切り出す文字切り出し手段;文字切り出し手段により
    切り出した文字単位の情報の間隔から単語情報を抽出す
    る単語抽出手段;単語抽出手段により抽出した単語情報
    の各文字情報を文字コードに変換する文字コード変換手
    段;文字コードのならびにより単語を認識し、単語コー
    ドのならびに変換する単語コード変換手段;1つの単語
    コードと該コードに対する複数の訳語とを組にして記憶
    する訳語記憶手段;訳語記憶手段に基づいて、認識した
    単語を複数の訳語に翻訳する翻訳手段;および、 単語および訳語の文字画像を出力画像メモリに書込み、
    書込んだ情報を出力する出力画像作成手段;を備える、
    デジタル翻訳装置。
  2. 【請求項2】出力画像作成手段は、単語の文字画像と訳
    語の文字画像をメモリに書込む際に、単語別に単語と複
    数の訳語を並べて書込むことを特徴とする、前記請求項
    1記載のデジタル翻訳装置。
  3. 【請求項3】1つの単語に対する訳語の出力数を入力設
    定する出力訳語設定数入力手段;および、出力訳語設定
    数入力手段の設定に対応して1つの単語に対する訳語の
    出力数を制御する訳語出力数制御手段;を備える、前記
    請求項1記載のデジタル翻訳装置。
  4. 【請求項4】文字コード変換手段または単語コード変換
    手段のコード変換において変換するコードが存在しない
    単語の、出力画像形式を変換する出力画像形式変換手
    段;を備える、前記請求項1記載のデジタル翻訳装置。
  5. 【請求項5】訳語記憶手段に記憶されていない単語およ
    び該単語に対する訳語の登録,訳語記憶手段に記憶され
    ている単語であって訳語記憶手段に記憶されていない訳
    語の追加登録,および記憶手段に記憶されている単語お
    よび該単語に対する訳語の削除を行なう編集手段;を備
    え、前記訳語記憶手段は、情報の読出しおよび書込みが
    自在の記憶手段であることを特徴とする、前記請求項1
    記載のデジタル翻訳装置。
  6. 【請求項6】出力画像の出力書式を設定する書式設定入
    力手段;および、書式設定入力手段により設定された書
    式に対応して、単語および訳語の文字画像を出力画像メ
    モリに書込む際の書式を変更する書式変更手段;を備え
    る、前記請求項1記載のデジタル翻訳装置。
JP3211978A 1991-08-23 1991-08-23 デジタル翻訳装置 Pending JPH0554073A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3211978A JPH0554073A (ja) 1991-08-23 1991-08-23 デジタル翻訳装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3211978A JPH0554073A (ja) 1991-08-23 1991-08-23 デジタル翻訳装置

Publications (1)

Publication Number Publication Date
JPH0554073A true JPH0554073A (ja) 1993-03-05

Family

ID=16614863

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3211978A Pending JPH0554073A (ja) 1991-08-23 1991-08-23 デジタル翻訳装置

Country Status (1)

Country Link
JP (1) JPH0554073A (ja)

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06295309A (ja) * 1993-04-06 1994-10-21 Ricoh Co Ltd 機械翻訳装置及び言語解析装置並びにディジタル複写装置
JPH06301713A (ja) * 1993-04-13 1994-10-28 Ricoh Co Ltd 対訳表示方法及び文書表示装置並びにディジタル複写装置
JPH06325081A (ja) * 1993-03-26 1994-11-25 Casio Comput Co Ltd 翻訳支援装置
JPH0721186A (ja) * 1993-07-02 1995-01-24 Casio Comput Co Ltd 翻訳支援装置
JPH0736901A (ja) * 1993-07-22 1995-02-07 Casio Comput Co Ltd 翻訳支援装置
JPH0756924A (ja) * 1993-06-30 1995-03-03 Ricoh Co Ltd 対訳装置
JPH0765012A (ja) * 1993-08-27 1995-03-10 Ricoh Co Ltd 対訳画像形成装置
JPH07121539A (ja) * 1993-10-21 1995-05-12 Matsushita Electric Ind Co Ltd 機械翻訳装置
JPH0830624A (ja) * 1994-07-15 1996-02-02 Matsushita Electric Ind Co Ltd 解読支援装置
JPH0895978A (ja) * 1994-09-21 1996-04-12 Matsushita Electric Ind Co Ltd 解読支援装置
JPH08166954A (ja) * 1994-12-13 1996-06-25 Sharp Corp 翻訳支援装置
JPH08287071A (ja) * 1995-04-12 1996-11-01 Sharp Corp 文書処理装置
JPH1125111A (ja) * 1997-07-04 1999-01-29 Fuji Xerox Co Ltd 電子辞書
JP2001326804A (ja) * 2000-05-16 2001-11-22 Sharp Corp 画像処理装置及び画像処理システム
JP2006244251A (ja) * 2005-03-04 2006-09-14 Fuji Xerox Co Ltd 翻訳文出力装置
US7664631B2 (en) 2005-03-09 2010-02-16 Fuji Xerox Co., Ltd. Language processing device, language processing method and language processing program
US7865353B2 (en) 2005-03-22 2011-01-04 Fuji Xerox Co., Ltd. Translation device, image processing device, translation method, and recording medium

Cited By (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06325081A (ja) * 1993-03-26 1994-11-25 Casio Comput Co Ltd 翻訳支援装置
JPH06295309A (ja) * 1993-04-06 1994-10-21 Ricoh Co Ltd 機械翻訳装置及び言語解析装置並びにディジタル複写装置
JPH06301713A (ja) * 1993-04-13 1994-10-28 Ricoh Co Ltd 対訳表示方法及び文書表示装置並びにディジタル複写装置
JPH0756924A (ja) * 1993-06-30 1995-03-03 Ricoh Co Ltd 対訳装置
JPH0721186A (ja) * 1993-07-02 1995-01-24 Casio Comput Co Ltd 翻訳支援装置
JPH0736901A (ja) * 1993-07-22 1995-02-07 Casio Comput Co Ltd 翻訳支援装置
JPH0765012A (ja) * 1993-08-27 1995-03-10 Ricoh Co Ltd 対訳画像形成装置
JPH07121539A (ja) * 1993-10-21 1995-05-12 Matsushita Electric Ind Co Ltd 機械翻訳装置
JPH0830624A (ja) * 1994-07-15 1996-02-02 Matsushita Electric Ind Co Ltd 解読支援装置
JPH0895978A (ja) * 1994-09-21 1996-04-12 Matsushita Electric Ind Co Ltd 解読支援装置
JPH08166954A (ja) * 1994-12-13 1996-06-25 Sharp Corp 翻訳支援装置
JPH08287071A (ja) * 1995-04-12 1996-11-01 Sharp Corp 文書処理装置
JPH1125111A (ja) * 1997-07-04 1999-01-29 Fuji Xerox Co Ltd 電子辞書
JP2001326804A (ja) * 2000-05-16 2001-11-22 Sharp Corp 画像処理装置及び画像処理システム
JP2006244251A (ja) * 2005-03-04 2006-09-14 Fuji Xerox Co Ltd 翻訳文出力装置
US7664631B2 (en) 2005-03-09 2010-02-16 Fuji Xerox Co., Ltd. Language processing device, language processing method and language processing program
US7865353B2 (en) 2005-03-22 2011-01-04 Fuji Xerox Co., Ltd. Translation device, image processing device, translation method, and recording medium

Similar Documents

Publication Publication Date Title
US5241674A (en) Electronic dictionary system with automatic extraction and recognition of letter pattern series to speed up the dictionary lookup operation
US4907283A (en) Image processing apparatus
US5187480A (en) Symbol definition apparatus
JPH0554073A (ja) デジタル翻訳装置
JPH05233630A (ja) 日本語又は中国語を記載する方法
JPH06274680A (ja) 文書認識方法およびシステム
JPH06176188A (ja) 認識文字の情報作成方法及び装置
JP2000322417A (ja) 画像ファイリング装置及び方法及び記憶媒体
EP0519713B1 (en) Character input method and apparatus
JPH05303619A (ja) 電子スクラップブック
EP0737910A2 (en) Method and apparatus for inputting data
GB2259386A (en) Text processing
JP3424942B2 (ja) 対訳画像形成装置
JPH1063775A (ja) 文書作成装置及び認識候補表示方法
JP2674542B2 (ja) 手書き文字認識装置
JPH037992B2 (ja)
JP2976990B2 (ja) 文字認識装置
JPH09114824A (ja) 文書処理装置
JP2682873B2 (ja) 表形式文書の認識装置
JP3441546B2 (ja) 文字処理装置及び文字処理装置における変換制御方法
JPH0581467A (ja) 画像処理方法及び装置
JPH06119314A (ja) 文書作成装置
JPH06348889A (ja) 文字認識装置
JP2986255B2 (ja) 文字認識装置
JPH0666065B2 (ja) 振仮名付加機能付き文書処理装置