JPH0546659A - デジタル翻訳複写装置 - Google Patents

デジタル翻訳複写装置

Info

Publication number
JPH0546659A
JPH0546659A JP3206688A JP20668891A JPH0546659A JP H0546659 A JPH0546659 A JP H0546659A JP 3206688 A JP3206688 A JP 3206688A JP 20668891 A JP20668891 A JP 20668891A JP H0546659 A JPH0546659 A JP H0546659A
Authority
JP
Japan
Prior art keywords
character
image information
image
word
words
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP3206688A
Other languages
English (en)
Inventor
Akira Ohori
堀 顕 大
Takaya Muraishi
石 貴 也 村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP3206688A priority Critical patent/JPH0546659A/ja
Publication of JPH0546659A publication Critical patent/JPH0546659A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Machine Translation (AREA)
  • Document Processing Apparatus (AREA)

Abstract

(57)【要約】 【目的】 単語抽出の間違いを軽減して翻訳性能の向上
を図る。 【構成】 原稿の画像情報から文字画像情報を抽出し、
抽出した文字画像情報を1文字毎に認識した後、認識し
た文字画像情報に予め登録した所定の記号が存在するか
否か検索し所定の記号が存在するとその記号部分で文字
画像情報を区切る。次に、区切られた文字画像情報に予
め登録した単語が存在するか否か検索し所定の単語が存
在するとその単語で文字画像情報を区切り、区切られた
単語に対応する翻訳を施して翻訳結果の文字画像情報を
出力画像メモリ405に書き込む。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、デジタル翻訳複写装置
に関し、特に、活字や手書き等の文章原稿を光学的に読
み取って文字を認識し、認識した文字を単語単位で翻訳
して出力するデジタル翻訳複写装置に関する。
【0002】
【従来の技術】文章原稿の画像において、文字と文字の
間の距離(スペース)を検出することにより文字列を認
識し抽出する装置が開示されている(特開昭63−21
7490号公報)。
【0003】
【発明が解決しようとする課題】しかし、特開昭63−
217490号公報によれば文字間のスペースが狭い場
合や原稿が手書きの場合等は、うまく単語を抽出するこ
とができない。かかる場合には単語に対応した翻訳を正
しく行うことはできない。
【0004】そこで本発明は、上記問題点を解決するた
めに単語抽出の間違いを軽減して翻訳性能を向上させる
ことを目的とする。
【0005】
【課題を解決するための手段】本願の発明は、原稿の画
像情報を読み取る画像読取手段(100),読み取った
画像情報を記憶する画像記憶手段(404),読み取っ
た画像情報に画像処理を施す画像処理手段(401),
および、画像処理手段(401)が出力する画像信号が
表す画像を記録媒体上に記録する画像記録手段(20
0),を備えるデジタル翻訳複写装置において、原稿の
画像情報から文字画像情報を抽出する原稿文字抽出手段
(401);抽出した文字画像情報を1文字毎に認識す
る認識手段(401);予め所定の記号および単語を記
憶する記憶手段(406);認識手段(401)により
認識した文字画像情報に予め記憶した前記所定の記号が
存在するとその記号部分で文字画像情報を区切り、区切
られた文字画像情報に予め記憶した単語が存在するとそ
の単語単位で文字画像情報を区切る単語抽出手段(40
1);単語抽出手段(401)により区切られた単語に
対応する翻訳を施す翻訳手段(401);および、翻訳
結果の文字画像情報を出力画像メモリ(405)に書き
込む手段(401);を備える。なお、カッコ内の記号
は、図面に示し後述する実施例の対応要素又は対応事項
を示す。
【0006】
【作用】これによれば単語抽出手段(401)は、抽出
された文字画像情報を1文字毎に認識手段(401)が
認識した文字画像情報に、予め記憶手段(406)で記
憶した前記所定の記号が存在するとその記号部分で文字
画像情報を区切り、その後区切られた文字画像情報に予
め記憶した単語が存在するとその単語で文字画像情報を
区切る。そして、翻訳手段(401)は区切られた単語
に翻訳を施し、書き込み手段(401)は翻訳結果の文
字画像情報を出力画像メモリ(406)に書き込む。
【0007】したがって、たとえ単語と単語の区切り目
がわかりにくい原稿の画像情報であっても意味の通るよ
うに自動的に判断して単語を抽出し翻訳を行うため、翻
訳の誤りが軽減し翻訳機能は向上する。本発明の他の目
的および特徴は、図面を参照した以下の実施例の説明よ
り明らかになろう。
【0008】
【実施例】図1に、本発明の一実施例であるデジタル複
写機の構成概要を示す。この複写機は、原稿画像を読み
取るスキャナ部100,全体の制御を行うCPU40
1,制御プログラムが格納されているROM402,制
御プログラムが一時的に使用するRAM403,読み取
った画像を一旦格納するページメモリ404,出力画像
を格納する出力画像メモリ405,翻訳に必要な辞書等
が格納されている辞書メモリ406,各装置間のデータ
のやりとりを行う内部システム・バス407,インター
フェースI/F408、409,出力画像メモリ405
内に格納された画像を出力するプリンタ部200,操作
ボード300等で構成されている。
【0009】図2に、スキャナ部100およびプリンタ
部200の内部機構の概要を示す。スキャナ部100
の、原稿(図示せず)を載置するためのコンタクトガラ
ス1は、光源2a,2bによって照明され、読取原稿か
らの反射光(原稿像)はミラー3,4,5,6,7,お
よびレンズ8を介してCCDイメージセンサ9の受光面
に結像される。光源2(2a,2b)およびミラー3
は、コンタクトガラス1の下面をコンタクトガラス1と
平行に副走査方向(図1において左右方向)に移動する
走行体10に搭載され、ミラー4,5はその走行体10
に連動して1/2の速度で副走査方向に移動する走行体
11に搭載されている。主走査方向は、CCDイメージ
センサ9の固体走査によって行われ、原稿画像はCCD
イメージセンサ9によって読み取られ、前述のような光
学系が移動することで原稿全面が走査されるようになっ
ている。なお、図中39は、原稿を押圧するための圧板
である。
【0010】プリンタ部200は、レーザ書込み系、画
像再生系ならびに給紙系により構成される。レーザ書込
み系は、レーザ出力ユニット21、結像レンズ22なら
びにミラー23を備えている。レーザ出力ユニット21
の内部には、レーザ光源であるレーザダイオード及び電
気モータによって高速で定速回転する多角形ミラー(ポ
リゴンミラー)が設けられている。レーザ書込み系から
出力されるレーザ光が、画像再生系の感光体ドラム24
に照射される。感光体ドラム24の周囲には、帯電チャ
ーシャ25、イレーサ26、現像ユニット27、転写チ
ャージャ28、分離チャージャ29、分離爪30、クリ
ーニングユニット31などが備わっている。なお、感光
体ドラム24の一端近傍でレーザビームが照射される位
置に主走査同期信号(MSYNC)を発生するビームセ
ンサ(図示せず)が配置されている。
【0011】このプリンタ部200における画像再生プ
ロセスを簡単に説明する。感光体ドラム24の周面は、
帯電チャージャ25によって一様に高電位に帯電され
る。その周面にレーザ光が照射されると、照射された部
分は電位が下がる。レーザ光は記録再生の黒/白に応じ
てオン/オフ制御されるので、レーザ光の照射によっ
て、感光体ドラム24の周面に記録画像に対応する電位
分布、すなわち静電潜像が形成される。静電潜像が形成
された部分が現像ユニット27を通ると、その電位の高
低に応じてトナーが付着し、静電潜像が可視化したトナ
ー像となる。トナー像が形成された部分に、所定のタイ
ミングで記録シート32がカセットから送り込まれ、ト
ナー像に重なる。このトナー像は転写チャージャ28に
よって記録シート32に転写し、その後分離チャージャ
29ならびに分離爪30によって、感光体ドラム24か
ら分離される。分離された記録シート32は、搬送ベル
ト34によって搬送され、ヒータを内蔵した定着ローラ
35によって加熱着された後、排紙トレイ36に排紙さ
れる。
【0012】本実施例では、レ−ザプリンタ200は給
紙系を2系統有している。一方の給紙系は、上段給紙カ
セット33aおよび手差し給紙台33cが備わってお
り、上段給紙カセット33aまたは手差し給紙台33c
にセットされた記録シート32aは、給紙ローラ37a
によって給紙される。もう一方の給紙系には下段給紙カ
セット33bが備わり、下段給紙カセット33b内の記
録シート32bは、給紙ローラ37bによって給紙され
る。そしていずれかの給紙ローラから給紙された記録シ
ート32は、レジストローラ38に当接した状態で一旦
停止し、記録プロセスの進行に同期したタイミングで感
光体ドラム24に送り込まれる。
【0013】図3に、CPU401の翻訳を行う場合の
処理動作を示し、図4にそのサブルーチンを示す。
【0014】原稿がコンタクトガラス1にセットされオ
ペレータにより翻訳指示があると、スキャナ部100で
原稿を光学的に読み取り(ステップ1:以下カッコ内で
はステップ又はサブルーチンという語を省略する)、読
み取った原稿画像をページメモリ404に格納する
(1)。そして、図5に示すように主走査方向の黒画素
数のヒストグラムを計算して文字画像を行単位で切り出
し、次に図6に示すように行単位の文字画像を今度は副
走査方向にヒストグラムを計算して文字単位の画像を切
り出す(2)。その後、1文字単位で全ての文字画像を
認識し(3)、単語抽出処理を行う(4)。
【0015】図4を参照する。単語抽出処理(4)は、
ステップ3で認識した後の文字列をまず予め登録してあ
る区切り記号(ピリオド,カンマ,コロン,セミコロン
等)が現れたところで区切り(41)、さらにそれぞれ
の文字列(文章)について意味の通るように辞書の検索
を行いながら単語に区切っていく(42,43)処理で
ある。
【0016】具体的には、図7に示すように、予め登録
してある区切り記号(実施例ではピリオド)を認識する
と、そこで文章として区切る。次に、単語に区切るわけ
であるが、この手順を図8により最初の部分(Invite
your partner to・・・)を例にとって説明する。
【0017】先頭の文字「I」は「私」の意味であり辞
書に存在するので、まず「I」を1単語として区切る。
次の「n」は1文字では辞書に存在しないので「nv」と
して辞書を検索するが、「nv」で始まる単語は存在しな
いので、ここで先頭の文字「I」に戻る。次に「In」で
区切ると上記と同様に、「v」,「vi」,「vit」,「vi
te」というように存在する単語がないので、また、先頭
の文字「I」に戻って、その次は「Invite」で区切る。
すると、その後の単語はまず「you」で区切ることがで
きるが、さらにその後が「rp〜」となりこれは存在しな
い単語であるので次は「your」で区切る。以下の区切り
(文章)についても同様の処理を繰り返せば文章全体の
意味が通じるように単語を抽出することができる。
【0018】このような処理を続けることによって最初
の一区切り(文章)を単語に区切ることができる。ただ
し、例えば、「understand」,「today」,「tonight」
等の単語がある場合、上記の手法ではそれぞれ、「unde
r/stand」,「to/day」,「to/night」のように区切
ってしまうため後述するようにオペレータが再変換を指
示する必要がある。
【0019】再度、図3のメインフローに戻る。単語抽
出処理(4)が終了すると、単語の区切り方に変更の指
示がオペレータからあるかをチェックする(5)。変更
のある場合は、ステップ4に戻って次の候補で再変換を
行う。なお、変更の際のオペレータによる指示は操作ボ
ード300上のスイッチ(図示しない)操作による。変
更がなければ、それぞれの単語に相当する日本語を翻訳
辞書から検索し(6)、翻訳結果の文字画像を出力画像
メモリ405に書き込む(7)。そして最終に出力画像
メモリ405に書き込まれた画像をプリンタ部200で
記録紙に転写して排出する(8)。これにより図9に示
すような画像が出力される。
【0020】
【発明の効果】以上説明したように本願の発明によれ
ば、たとえ単語と単語の区切り目がわかりにくい原稿の
画像情報であっても意味の通るように自動的に判断して
単語を抽出し翻訳を行うため、翻訳の誤りが軽減し翻訳
機能は向上する。
【図面の簡単な説明】
【図1】 本発明の一実施例のデジタル複写機の電装部
の概要を示すブロック図である。
【図2】 図1に示すデジタル複写機の機構部の概要を
示すブロック図である。
【図3】 図1に示すCPU401の処理動作の内容の
一部を示すフローチャートである。
【図4】 図3に示す単語抽出処理(4)の内容を示す
フローチャートである。
【図5】 主走査方向のヒストグラム計算による文字画
像の、行単位の切り出しを示す平面図である。
【図6】 副走査方向のヒストグラム計算による文字画
像の、文字単位の切り出しを示す平面図である。
【図7】 文章全体をピリオドの存在により区切った様
子を示す平面図である。
【図8】 単語抽出の手順を示す平面図である。
【図9】 プリンタ部200により出力される画像の一
例を示す平面図である。
【符号の説明】
100:スキャナ部(画像読取手段)200:プリンタ
部(画像記録手段) 300:操作ボード 401:CPU(画像処理手段,原稿文字抽出手段,認
識手段,単語抽出手段,翻訳手段,書き込み手段) 402:ROM 403:RAM 404:ページメモリ(画像記憶手段) 405:出力画像メモリ(出力画像メモリ) 406:辞書メモリ(記憶手段) 407:システム・バス 408,409:
I/F

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】原稿の画像情報を読み取る画像読取手段,
    読み取った画像情報を記憶する画像記憶手段,読み取っ
    た画像情報に画像処理を施す画像処理手段,および、画
    像処理手段が出力する画像信号が表す画像を記録媒体上
    に記録する画像記録手段,を備えるデジタル翻訳複写装
    置において、 原稿の画像情報から文字画像情報を抽出する原稿文字抽
    出手段;抽出した文字画像情報を1文字毎に認識する認
    識手段;予め所定の記号および単語を記憶する記憶手
    段;前記認識手段により認識した文字画像情報に予め記
    憶した前記所定の記号が存在するとその記号部分で文字
    画像情報を区切り、区切られた文字画像情報に予め記憶
    した単語が存在するとその単語で文字画像情報を区切る
    単語抽出手段;単語抽出手段により区切られた単語に対
    応する翻訳を施す翻訳手段;および、翻訳結果の文字画
    像情報を出力画像メモリに書き込む手段;を備えること
    を特徴とするデジタル翻訳複写装置。
  2. 【請求項2】原稿の画像情報を読み取る画像読取手段,
    読み取った画像情報を記憶する画像記憶手段,読み取っ
    た画像情報に画像処理を施す画像処理手段,および、画
    像処理手段が出力する画像信号が表す画像を記録媒体上
    に記録する画像記録手段,を備えるデジタル翻訳複写装
    置において、 原稿の画像情報から文字画像情報を抽出し、抽出した文
    字画像情報を1文字毎に認識した後、認識した文字画像
    情報に予め登録した所定の記号が存在するか否か検索し
    所定の記号が存在するとその記号部分で文字画像情報を
    区切り、区切られた文字画像情報に予め登録した単語が
    存在するか否か検索し所定の単語が存在するとその単語
    で文字画像情報を区切り、区切られた単語に対応する翻
    訳を施して翻訳結果の文字画像情報を出力画像メモリに
    書き込む、デジタル翻訳複写装置の翻訳文字形成方法。
JP3206688A 1991-08-19 1991-08-19 デジタル翻訳複写装置 Pending JPH0546659A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3206688A JPH0546659A (ja) 1991-08-19 1991-08-19 デジタル翻訳複写装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3206688A JPH0546659A (ja) 1991-08-19 1991-08-19 デジタル翻訳複写装置

Publications (1)

Publication Number Publication Date
JPH0546659A true JPH0546659A (ja) 1993-02-26

Family

ID=16527469

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3206688A Pending JPH0546659A (ja) 1991-08-19 1991-08-19 デジタル翻訳複写装置

Country Status (1)

Country Link
JP (1) JPH0546659A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0927939A1 (en) * 1997-12-29 1999-07-07 Xerox Corporation Method and system to obtain data for information retrieval
KR100351584B1 (ko) * 2000-07-05 2002-09-05 주식회사 팔만시스템 한자의 일자대조에 의한 교정 시스템

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP0927939A1 (en) * 1997-12-29 1999-07-07 Xerox Corporation Method and system to obtain data for information retrieval
KR100351584B1 (ko) * 2000-07-05 2002-09-05 주식회사 팔만시스템 한자의 일자대조에 의한 교정 시스템

Similar Documents

Publication Publication Date Title
US5729618A (en) Image forming apparatus for outputting equivalents of words spelled in a foreign language
US5517409A (en) Image forming apparatus and method having efficient translation function
JP3050007B2 (ja) 画像読取装置およびこれを備えた画像形成装置
JP2001274969A (ja) 画像処理装置
KR100306063B1 (ko) 화상처리방법및장치
JPH05324720A (ja) 対訳画像形成装置
JP3897392B2 (ja) 画像処理装置
JPH0546659A (ja) デジタル翻訳複写装置
JP3269842B2 (ja) 対訳画像形成装置
JPH05324709A (ja) 対訳画像形成装置
JPH0477965A (ja) デジタル複写装置
JPH11213089A (ja) 画像処理装置及びその方法
JPH0554069A (ja) デジタル翻訳装置
JP2594415B2 (ja) 翻訳機能を設けた画像形成装置
JP3489788B2 (ja) 原稿画像処理装置
JPH0554188A (ja) 画像処理装置
JPH11220557A (ja) 画像処理装置及び方法
JPH0554075A (ja) 翻訳装置
JP3044560B2 (ja) 画像形成装置
JP2000022899A (ja) 画像認識装置
JP2023133082A (ja) 読取装置、画像形成装置、読取方法、および情報処理装置
JP2001312697A (ja) 画像方向判別方法及び装置
JPH0562014A (ja) 文字認識装置
JPS63146568A (ja) デジタル複写機
JPS6336668A (ja) マ−ク情報読取り制御装置