JPH0554069A - デジタル翻訳装置 - Google Patents

デジタル翻訳装置

Info

Publication number
JPH0554069A
JPH0554069A JP3210747A JP21074791A JPH0554069A JP H0554069 A JPH0554069 A JP H0554069A JP 3210747 A JP3210747 A JP 3210747A JP 21074791 A JP21074791 A JP 21074791A JP H0554069 A JPH0554069 A JP H0554069A
Authority
JP
Japan
Prior art keywords
image
row
width
line
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP3210747A
Other languages
English (en)
Inventor
Hitomi Kumazaki
崎 ひとみ 熊
Noriyasu Takeuchi
内 則 康 竹
Akira Asami
見 彰 浅
Masahito Yokoyama
山 雅 人 横
Tomonori Tanaka
中 智 憲 田
Takaaki Tawada
和 田 高 明 多
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP3210747A priority Critical patent/JPH0554069A/ja
Publication of JPH0554069A publication Critical patent/JPH0554069A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】 アルファベットからなる文章原稿において行
毎の切り出しを必要最小限の行幅で、かつ正確に行い翻
訳性能の向上を図る。 【構成】 原稿画像の行方向の黒画素数のヒストグラム
を検出して2値化し、2値化された高密度領域の列方向
のデータ幅に比例する行幅を決定する。そして決定され
た行幅が当該行の中央位置と隣接する行の中央位置の間
隔以上の場合は当該行と隣接する行の中間位置で行を区
切り原稿画像の行毎の切り出しを行い、決定された行部
分の幅が間隔より小さい場合は決定された行幅で原稿画
像の行毎の切り出しを行う。その後、切り出した行の文
字の間隔から単語を抽出して翻訳を施し、翻訳結果をプ
リンタ200が出力する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、デジタル翻訳装置に関
し、特に、アルファベットからなる文章原稿を光学的に
読み取って文字を認識し、認識した文字を単語単位で翻
訳して出力するデジタル翻訳装置に関する。
【0002】
【従来の技術】従来のデジタル翻訳装置において、原稿
を光学的に読み取りメモリに格納し、格納された文字画
像から1行単位の画像を切り出す場合は、まず、主走査
方向の黒画素数のヒストグラムを計算し、あるしきい値
を決めそれによって行間を判別していた。よって、ある
程度の余裕を持たせて文字画像を1行単位で切り出すこ
とができた。
【0003】しかし、英文字列など1行の中でも高さに
よって黒画素密度が変わる原稿については検出される文
字列が実際の幅よりも狭い幅となり、そこに誤差を含ま
せるための余裕幅を加えても行毎の切り出しがうまくい
かないことがある。すなわち、主にアルファベットa,
s,z,wなどからなる文字画像中にg,j,p,qな
ど通常の行幅よりも下にはみ出す部分を持つ文字を少し
含む文字列については、検出される行幅はそれら文字の
上半分部分だけで、それに多少の余裕幅を加えても行切
り出しで文字の一部が切り分けられてしまうことが起り
得る。
【0004】これに対して、しきい値を下げる方法,文
字列のボトムを検出して文字の最大の高さまたは最大行
間幅を推定することで、広い行幅によって行切り出しを
より安定に行う方法(特開昭63−101983号公
報),または隣接した行部分と判断されるそれぞれの部
分の中央位置を推定しそれらの中間の位置に行の区切り
位置がくるとして、連続的に行を区切る方法が知られて
いる。
【0005】
【発明が解決しようとする課題】しかし、しきい値を下
げる方法では地汚れ誤差や原稿の地の色による2値化エ
ラーが生ずる可能性があるので好ましくない。
【0006】また、特開昭63−101983号公報に
よる方法では、英文字列など1行の中でも高さによって
黒画素密度が変わるものについては、その文字列のボト
ムの検出がうまくいかず、その結果行毎の切り出しがう
まくいかないことがある。すなわち、主にa,s,z,
wなどからなる英文字列にg,j,p,qなどが少しま
じっている英文字列の場合に、文字列ボトムがgなどの
中間の位置で検出されることがあり、行幅を広くとった
にもかかわらず、文字の中間で行が区切られてしまうこ
とがあるのでアルファベットからなる外国語を読み取り
処理する場合には適切でない。
【0007】更に、隣接した行部分の中央位置を推定し
連続的に行を区切る方法では、行間が大きかった場合に
行として切り取った画像部分に空白部分が多くなり、文
字認識のために切り取った意味がなくなる。
【0008】そこで本発明は、上記問題点を解決するた
めにアルファベットからなる文章原稿において行毎の切
り出しを必要最小限の行幅で、かつ正確に行い翻訳性能
を向上させることを目的とする。
【0009】
【課題を解決するための手段】本願の発明は、原稿画像
を読み取る画像読取手段(100);画像読取手段(1
00)が読み取った画像情報を記憶する画像記憶手段
(401);画像記憶手段(401)に記憶した画像情
報の行方向の黒画素数のヒストグラムを検出する画像密
度検出手段(1541a);検出したヒストグラムの所
定レベルより高密度領域の列方向幅を検出する幅検出手
段(1541b,1541c);幅検出手段(1541
b,1541c)が検出した列方向幅に比例する行幅を
算出する行幅算出手段(1541d);前記ヒストグラ
ムの所定レベルより高密度領域の列方向中央位置の、隣
り合う高密度領域間位置差を検出するピッチ検出手段
(301);行幅算出手段(1541d)が算出した行
幅が、ピッチ検出手段(301)が検出した位置差以下
のときには該行幅を、位置差を越えるときには該位置差
を、摘出行幅に設定する行幅設定手段(1541e,1
541f,301);前記列方向中央位置を中心として
行幅設定手段(1541e,1541f,301)が設
定した摘出行幅の画像情報を摘出する行切り出し手段
(1541g);行切り出し手段(1541g)が切り
出した画像情報から文字単位の画像情報を摘出する文字
切り出し手段(1542);文字切出し手段(154
2)が切り出した画像情報の行方向間隔から単語単位で
画像情報を摘出する単語領域検出手段(1543);文
字切出し手段(1542)が切り出した画像情報の文字
を認識する文字認識手段(1544);単語領域検出手
段(1543)が検出した単語単位の、文字認識手段
(1544)が認識した文字の並びでなる単語を翻訳す
る翻訳手段(1545);翻訳手段(1545)の翻訳
語の文字画像情報を出力画像メモリ(402)に書き込
む出力画像作成手段(1546);および、出力画像メ
モリ(402)に記憶した画像情報を出力する出力手段
(200);を備える。なお、カッコ内の記号は、図面
に示し後述する実施例の対応要素又は対応事項を示す。
【0010】
【作用】これによれば、画像密度検出手段(1541
a)が画像記憶手段(401)に記憶した画像情報の行
方向の黒画素数のヒストグラムを検出し、幅検出手段
(1541b,1541c)は検出されたヒストグラム
の所定レベルより高密度領域の列方向幅を検出する。次
に、行幅算出手段(1541d)は、幅検出手段(15
41b,1541c)が検出した列方向幅に比例する行
幅を算出し、ピッチ検出手段(301)は、前記ヒスト
グラムの所定レベルより高密度領域の列方向中央位置
の、隣り合う高密度領域間位置差を検出する。そして、
行幅設定手段(1541e,1541f,301)は、
行幅算出手段(1541d)が算出した行幅が、ピッチ
検出手段(301)が検出した位置差以下のときには該
行幅を、位置差を越えるときには該位置差を、摘出行幅
に設定し、行切り出し手段(1541g)は、前記列方
向中央位置を中心として行幅設定手段(1541e,1
541f,301)が設定した摘出行幅の画像情報を摘
出する。
【0011】従って、原稿画像から行毎の切り出しを隣
接する行と重ねて行うことなく、行毎の文字画像に対応
した必要最小限の行幅で、かつ正確に行える。特に、英
文字の特徴から文字の縦方向の幅が一定でないアルファ
ベットを含む画像の切り出しを安定に実施しうる。
【0012】そして、文字切り出し手段(1542)
は、行切り出し手段(1541g)が切り出した画像情
報から文字単位の画像情報を摘出し、単語領域検出手段
(1543)は、文字切出し手段(1542)が切り出
した画像情報の行方向間隔から単語単位で画像情報を摘
出する。そして、文字認識手段(1544)は、文字切
出し手段(1542)が切り出した画像情報の文字を認
識し、翻訳手段(1545)は、単語領域検出手段(1
543)が検出した単語単位の、文字認識手段(154
4)が認識した文字の並びでなる単語を翻訳する。そし
て出力画像作成手段(1546)は、翻訳手段(154
5)の翻訳語の文字画像情報を出力画像メモリ(40
2)に書き込み、出力手段(200)は、出力画像メモ
リ(402)に記憶した画像情報を出力する。
【0013】従って、安定した文字認識,翻訳,結果出
力が得られる。本発明の他の目的および特徴は、図面を
参照した以下の実施例の説明より明らかになろう。
【0014】
【実施例】図1に、本発明の一実施例であるデジタル複
写機の機構部の概要を示す。機構部は、主に画像読取部
(スキャナ)100および画像記録部(レーザプリン
タ)200で構成されている。
【0015】スキャナ100の、原稿(図示せず)を載
置するためのコンタクトガラス1は、光源2a,2bに
よって照明され、読取原稿からの反射光(原稿像)はミ
ラー3,4,5,6,7,およびレンズ8を介してCC
Dイメージセンサ9の受光面に結像される。光源2(2
a,2b)およびミラー3は、コンタクトガラス1の下
面をコンタクトガラス1と平行に副走査方向(図1にお
いて左右方向)に移動する走行体10に搭載され、ミラ
ー4,5はその走行体10に連動して1/2の速度で副
走査方向に移動する走行体11に搭載されている。主走
査方向は、CCDイメージセンサ9の固体走査によって
行われ、原稿画像はCCDイメージセンサ9によって読
み取られ、前述のような光学系が移動することで原稿全
面が走査されるようになっている。なお、図中39は、
原稿を押圧するための圧板である。
【0016】レーザプリンタ200は、レーザ書込み
系、画像再生系ならびに給紙系により構成される。レー
ザ書込み系は、レーザ出力ユニット21、結像レンズ2
2ならびにミラー23を備えている。レーザ出力ユニッ
ト21の内部には、レーザ光源であるレーザダイオード
及び電気モータによって高速で定速回転する多角形ミラ
ー(ポリゴンミラー)が設けられている。レーザ書込み
系から出力されるレーザ光が、画像再生系の感光体ドラ
ム24に照射される。感光体ドラム24の周囲には、帯
電チャーシャ25、イレーサ26、現像ユニット27、
転写チャージャ28、分離チャージャ29、分離爪3
0、クリーニングユニット31などが備わっている。な
お、感光体ドラム24の一端近傍でレーザビームが照射
される位置に主走査同期信号(MSYNC)を発生する
ビームセンサ(図示せず)が配置されている。
【0017】このレーザプリンタ200における画像再
生プロセスを簡単に説明する。感光体ドラム24の周面
は、帯電チャージャ25によって一様に高電位に帯電さ
れる。その周面にレーザ光が照射されると、照射された
部分は電位が下がる。レーザ光は記録再生の黒/白に応
じてオン/オフ制御されるので、レーザ光の照射によっ
て、感光体ドラム24の周面に記録画像に対応する電位
分布、すなわち静電潜像が形成される。静電潜像が形成
された部分が現像ユニット27を通ると、その電位の高
低に応じてトナーが付着し、静電潜像が可視化したトナ
ー像となる。トナー像が形成された部分に、所定のタイ
ミングで記録シート32がカセットから送り込まれ、ト
ナー像に重なる。このトナー像は転写チャージャ28に
よって記録シート32に転写し、その後分離チャージャ
29ならびに分離爪30によって、感光体ドラム24か
ら分離される。分離された記録シート32は、搬送ベル
ト34によって搬送され、ヒータを内蔵した定着ローラ
35によって加熱着された後、排紙トレイ36に排紙さ
れる。
【0018】本実施例では、レーザプリンタ200は給
紙系を2系統有している。一方の給紙系は、上段給紙カ
セット33aおよび手差し給紙台33cが備わってお
り、上段給紙カセット33aまたは手差し給紙台33c
にセットされた記録シート32aは、給紙ローラ37a
によって給紙される。もう一方の給紙系には下段給紙カ
セット33bが備わり、下段給紙カセット33b内の記
録シート32bは、給紙ローラ37bによって給紙され
る。そしていずれかの給紙ローラから給紙された記録シ
ート32は、レジストローラ38に当接した状態で一旦
停止し、記録プロセスの進行に同期したタイミングで感
光体ドラム24に送り込まれる。
【0019】図2に、図1に示す複写機の電装部の概要
を示す。電装部は、主に原稿を読み取って画像データ信
号を出力する画像読取部100,画像データ信号を加工
する画像処理部150,画像データ信号に基づいて記録
を行う画像記録部200,メモリ回路400,操作ボー
ド500およびこれらのユニット等を制御する制御部3
00により構成されている。
【0020】画像読取部100において、CCDイメー
ジセンサ9により読み取られた画像信号は、増幅器10
1である決められた電圧振幅に増幅され、A/D変換回
路102によりデジタルデータに変換され、シェーディ
ング補正回路103に入力される。シェーディング補正
回路103は、光源2a,2bの照度むら、CCDイメ
ージセンサ9内部の受光素子の感度むらおよび暗電流に
対する補正等を施す回路である。また、画像読取部10
0は、キャリッジ駆動モータMおよびモータMの回転制
御を行うモータ制御回路104を有する。
【0021】シェーディング補正回路103から出力さ
れた画像データ信号は、画像処理部150の空間フィル
タ回路151に入力される。空間フィルタ回路151で
は、文字や線字の解像力をあげるMTF補正,写真等の
ノイズを除去する平滑化処理等を行う。
【0022】空間フィルタ回路151から出力された画
像データ信号は、出力変調回路152に入力され、ここ
でプリンタの特性を考慮した補正を考慮した中間調表現
処理および画像記録部40で作る書き込み信号に対応す
るコードデータに変換し、これを出力回路153から画
像記録部200へ出力する。なお、編集回路154はコ
ードデータに種々の加工処理や編集処理を施して出力さ
せる回路である。
【0023】画像記録部200において、LDドライブ
回路201は、温度等によるレーザ光の出力変動を補正
しながら、画像処理部150から出力された画像データ
信号に応じてLD202を付勢し、変調されたレーザ光
をLD202に出射させる。制御部300は、プログラ
ムに従って様々な制御を行うCPU301,制御プログ
ラムが格納されているROM302,制御プログラムが
一時的に使用するRAM303およびI/Oポート30
4等を備えるマイクロコンピュータであって、この複写
機全体の制御を行う。
【0024】メモリ回路400は、読み取った画像を一
旦格納するページメモリ401,出力画像を格納する出
力画像メモリ402,翻訳に必要な辞書等が格納されて
いる辞書メモリ403から構成される。
【0025】図3に、図2の編集回路154の構成を示
す。符号1541は、行毎の文字画像切り出しを行う行
毎切出し回路であり、この行毎切出し回路1541は画
像のかかっている画素をカウントしヒストグラムをとる
行毎の画素密度カウント回路1541a,得られたヒス
トグラムを2値化する2値化回路1541b,2値化デ
ータより行部分を判断しその幅を測定する仮行幅測定回
路1541c,得られた仮行幅より行幅を決定する行幅
決定回路1541d,決定された行幅で隣接行が重なら
ないか判断する行幅確認回路1541e,隣接行が重な
ると判断された場合に行幅を決定し直す行幅再決定回路
1541f,および行幅決定回路1541dまたは行幅
再決定回路1541fで得られた行幅に従って文字画像
を行毎に切り出す切出し回路1541gを有する。ま
た、符号1542は行毎に切り出した文字画像から1文
字づつの切り出しを行う1文字毎の切出し回路,符号1
543は切り出された文字画像から単語を抽出する単語
抽出回路,符号1544は単語単位で文字を認識する文
字認識回路,符号1545は認識した文字を翻訳する翻
訳回路,符号1546は翻訳した単語の文字画像などを
出力画像メモリ402に書き込む出力画像作成回路であ
る。
【0026】図4に、CPU301の翻訳を行う場合の
処理動作を示し、図5にそのサブルーチンを示す。
【0027】原稿がコンタクトガラス1にセットされオ
ペレータにより翻訳指示があると、スキャナ部100で
原稿を光学的に読み取り(ステップ1:以下カッコ内で
はステップ又はサブルーチンという語を省略する)、読
み取った原稿画像をページメモリ401に格納する
(1)。そして格納した原稿画像に対して原稿文字の切
り出し処理を行う(2)。
【0028】図5を参照する。原稿文字の切り出し処理
(2)は、まず、画素密度カウント回路1541aで行
方向に画像のかかっている画素のカウントをとり、図6
に示すようなヒストグラムを作成する(21)。次に、
そのヒストグラムをあるしきい値によって2値化する
(22)。このしきい値としては、あまり小さな値をと
らず、図7の(a)に示す、すなわち英文字列の縦方向
の黒画素密度分布を3段に分けた場合の位置2の部分が
行部分として認識されればよい。
【0029】次に、2値化データより行部分を判断し、
その幅を測定する(23)。すなわち、2値化されたデ
ータは図6に示すように、0と1の並びからなっている
が、そのうち2値化のときに黒画素がしきい値よりも多
い部分に対応するものの部分を行部分であると判断し、
その幅を0又は1の連続して並んでいる数をカウントす
ることにより測定する。図6の例では、幅は3と測定さ
れる。
【0030】次に、仮の行幅より実際に切出しに用いる
行幅を決定する(24)。ここではステップ23で得ら
れた仮の行幅は図7の(a)に示す位置2の幅に相当す
るとして位置2の幅を3倍した値を最大行幅として決定
する。位置2の幅の3倍とした理由は、英文字の大文字
は、図7の(a)の位置1と位置2を用いて記述され、
小文字のa,w,s,z,e,r,c,v,u,i,
o,n,m,xは、図7の(b)に示すように位置2の
みを用いて記述され、小文字のl,k,h,t,f,
b,dは、図7の(c)に示すように位置1と位置2を
用いて記述され、小文字のq,g,y,j,pは、図7
の(d)に示すように位置2と位置3を用いて記述され
るので、簡単のためにそれらの文字の出現確率が同じで
あるとしても位置2の黒画素分布が他(位置1,位置
3)よりも多くなるからである。なお、位置2の次は位
置1,位置3の順になるが、実際の文章では大文字は主
に文章の頭に出現するだけであることなどを考慮すると
位置1と位置3の分布はそれほど差はない。
【0031】次に、上記方法で決定された行幅で切り出
しを行うと、図8に示すように前後の行と重なりが生じ
てしまう場合があるので、この重なりを判断するために
2値化されたデータの隣接行の中央位置間の長さ(ピッ
チ)とステップ24で決定された行幅を比較する(2
5)。なお、中央位置間の長さ(ピッチ)はヒストグラ
ムの所定レベルより検出される。決定した行幅の方が行
間の長さよりも長ければ、重なりが生じていると判断
し、図9に示すように2値化されたデータで判定される
行間部分の中央位置で2つの行を区切ることとして行幅
を再決定する(26)。そして、図10に示すように決
定した行幅で行毎の切り出しを行う(27)。この場合
は、行間が狭く、このように切り取っても切り取った行
部分に空白はあまりない。決定した行幅の方が行間の長
さよりも短かれば、重なりは生じてなくステップ24で
決定された行幅で行毎の切り出しを行う。
【0032】再度、図4のメインフローに戻る。原稿文
字の切り出し処理(2)が終了すると、切り出された行
に対して単語毎の切り出しを行う単語抽出処理を行う
(3)。単語毎の切り出しは、文字毎の切り出しにより
得られる文字の間隔に基づいて実施する。次に、抽出し
た単語を単語単位で認識する(4)。そして、それぞれ
の単語に相当する日本語を翻訳辞書から検索し翻訳を行
い(5)、翻訳結果をもとの文字画像とともに編集,出
力し(6)、プリンタ200で記録紙に転写して排出す
る(7)。
【0033】
【発明の効果】以上説明したように本願の発明によれ
ば、原稿画像から行毎の切り出しを隣接する行と重ねて
行うことなく、行毎の文字画像に対応した必要最小限の
行幅で、かつ正確に行える。特に、英文字の特徴から文
字の縦方向の幅が一定でないアルファベットを含む画像
の切り出しを安定に実施しうる。
【0034】よって、安定した文字認識,翻訳,結果出
力が得られる。
【図面の簡単な説明】
【図1】 本発明の一実施例のデジタル複写機の機構部
の概要を示すブロック図である。
【図2】 図1に示すデジタル複写機の電装部の概要を
示すブロック図である。
【図3】 図2に示す編集回路154の構成概要を示す
ブロック図である。
【図4】 図2に示すCPU301の処理動作の内容の
一部を示すフローチャートである。
【図5】 図4に示す原稿文字の切り出し処理(2)の
内容を示すフローチャートである。
【図6】 読み取った英文字画像から仮の行幅を測定す
る様子を示すブロック図である。
【図7】 (a)は、英文字列の縦方向の黒画素密度分
布を3段に分けた場合の位置を示す平面図,(b)は、
(a)の位置2を用いる場合の一例を示す平面図,
(c)は、(a)の位置1と位置2を用いる場合の一例
を示す平面図,および、(d)は、(a)の位置2と位
置3を用いる場合の一例を示す平面図である。
【図8】 決定された行幅と隣接する行の中央位置の間
隔を比較する様子を示すブロック図である。
【図9】 行幅を再度決定する様子を示すブロック図で
ある。
【図10】 最終的に決定した行幅で切り出した結果を
示すブロック図である。
【符号の説明】
100:画像読取部(画像読取手段) 150:画像処理部(画像処理手段) 154:編集回路 1541:行毎切出
し回路 1541a:画像密度カウント回路(画像密度検出手
段) 1541b:2値化回路(幅検出手段) 1541c:仮行幅測定回路(幅検出手段) 1541d:行幅決定回路(行幅算出手段) 1541e:行幅確認回路(行幅設定手段) 1541f:行幅再決定回路(行幅設定手段) 1541g:切出し回路(行切り出し手段) 1542:各行中の一文字毎の切り出し回路(文字切り
出し手段) 1543:単語抽出回路(単語領域検出手段) 1544:文字認識回路(文字認識手段) 1545:翻訳回路(翻訳手段) 1546:出力画像作成回路(出力画像作成手段) 200:画像記録部(出力手段,画像記録手段) 300:制御部 301:CPU(ピッチ検出手段,行幅設定手段) 302:ROM 303:RAM 304:I/Oポート 400:メモリ回路 401:ページメモリ(画像記憶手段) 402:出力画像メモリ(出力画像メモリ) 403:辞書メモリ 500:操作ボード
───────────────────────────────────────────────────── フロントページの続き (72)発明者 横 山 雅 人 東京都大田区中馬込1丁目3番6号 株式 会社リコー内 (72)発明者 田 中 智 憲 東京都大田区中馬込1丁目3番6号 株式 会社リコー内 (72)発明者 多 和 田 高 明 東京都大田区中馬込1丁目3番6号 株式 会社リコー内

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】原稿画像を読み取る画像読取手段;画像読
    取手段が読み取った画像情報を記憶する画像記憶手段;
    画像記憶手段に記憶した画像情報の行方向の黒画素数の
    ヒストグラムを検出する画像密度検出手段;検出したヒ
    ストグラムの所定レベルより高密度領域の列方向幅を検
    出する幅検出手段;幅検出手段が検出した列方向幅に比
    例する行幅を算出する行幅算出手段;前記ヒストグラム
    の所定レベルより高密度領域の列方向中央位置の、隣り
    合う高密度領域間位置差を検出するピッチ検出手段;前
    記行幅算出手段が算出した行幅が、前記ピッチ検出手段
    が検出した位置差以下のときには該行幅を、位置差を越
    えるときには該位置差を、摘出行幅に設定する行幅設定
    手段;前記列方向中央位置を中心として前記行幅設定手
    段が設定した摘出行幅の画像情報を摘出する行切り出し
    手段;行切り出し手段が切り出した画像情報から文字単
    位の画像情報を摘出する文字切り出し手段;文字切出し
    手段が切り出した画像情報の行方向間隔から単語単位で
    画像情報を摘出する単語領域検出手段;文字切出し手段
    が切り出した画像情報の文字を認識する文字認識手段;
    前記単語領域検出手段が検出した単語単位の、前記文字
    認識手段が認識した文字の並びでなる単語を翻訳する翻
    訳手段;翻訳手段の翻訳語の文字画像情報を出力画像メ
    モリに書き込む出力画像作成手段;および、 出力画像メモリに記憶した画像情報を出力する出力手
    段;を備えるデジタル翻訳装置。
  2. 【請求項2】原稿画像を読み取る画像読取手段,読み取
    った原稿画像を記憶する画像記憶手段,読み取った原稿
    画像に画像処理を施す画像処理手段,および、画像処理
    手段が出力する画像信号が表す画像を記録媒体上に記録
    する画像記録手段,を備えるデジタル翻訳装置におい
    て、 画像読取手段が読取った原稿画像情報に基づいて、行方
    向に原稿画像のヒストグラムを検出し、ヒストグラムを
    2値化して得られる高密度画像領域幅からそれに比例す
    る行幅を決定し、決定された行幅が当該行の中央位置と
    隣接行の中央位置の間隔以上の場合は当該行と隣接する
    行の中間位置で行を区切り原稿画像の行切り出しを行
    い、決定された行幅が前記間隔より小さい場合は決定さ
    れた行幅で原稿画像の行切り出しを行い、切り出した行
    から文字画像を切り出しその文字間隔から単語単位を認
    識し該単語単位で、切り出した文字を単語としてこれを
    翻訳し、翻訳語の文字画像を出力画像メモリに書き込
    む、デジタル翻訳装置の翻訳文字形成方法。
JP3210747A 1991-08-22 1991-08-22 デジタル翻訳装置 Pending JPH0554069A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3210747A JPH0554069A (ja) 1991-08-22 1991-08-22 デジタル翻訳装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3210747A JPH0554069A (ja) 1991-08-22 1991-08-22 デジタル翻訳装置

Publications (1)

Publication Number Publication Date
JPH0554069A true JPH0554069A (ja) 1993-03-05

Family

ID=16594457

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3210747A Pending JPH0554069A (ja) 1991-08-22 1991-08-22 デジタル翻訳装置

Country Status (1)

Country Link
JP (1) JPH0554069A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7352897B2 (en) 2001-09-27 2008-04-01 Canon Kabushiki Kaisha Method and means for dividing an image into character image lines, and method and apparatus for character image recognition
WO2013146845A1 (ja) * 2012-03-28 2013-10-03 Necインフロンティア株式会社 イメージデータ生成方法、イメージデータ生成装置及びイメージデータ生成プログラム
US8958080B2 (en) 2010-01-07 2015-02-17 Sharp Kabushiki Kaisha Document image generating apparatus, document image generating method and computer program, with adjustment of ruby-added image

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7352897B2 (en) 2001-09-27 2008-04-01 Canon Kabushiki Kaisha Method and means for dividing an image into character image lines, and method and apparatus for character image recognition
US8958080B2 (en) 2010-01-07 2015-02-17 Sharp Kabushiki Kaisha Document image generating apparatus, document image generating method and computer program, with adjustment of ruby-added image
WO2013146845A1 (ja) * 2012-03-28 2013-10-03 Necインフロンティア株式会社 イメージデータ生成方法、イメージデータ生成装置及びイメージデータ生成プログラム
JP2013206125A (ja) * 2012-03-28 2013-10-07 Nec Infrontia Corp イメージデータ生成方法、イメージデータ生成装置及びイメージデータ生成プログラム
US9235915B2 (en) 2012-03-28 2016-01-12 Nec Platforms, Ltd Image data generation method, image data generation device, and image data generation program

Similar Documents

Publication Publication Date Title
JP7131415B2 (ja) 傾き検出装置、読取装置、画像処理装置および傾き検出方法
US6266156B1 (en) Area judging apparatus
JP3695163B2 (ja) 画像形成装置
JPH0844827A (ja) デジタル複写機
US5960229A (en) Image processing method and apparatus
JP2002288636A (ja) 画像検査装置および画像形成装置
JPH0554069A (ja) デジタル翻訳装置
EP0505729A2 (en) Image binarization system
JP3671682B2 (ja) 画像認識装置
JPH0554188A (ja) 画像処理装置
JPH10145556A (ja) 画像読取装置
JP3629959B2 (ja) 画像認識装置
US8422785B2 (en) Image processing apparatus, image processing method, and program
JP3629962B2 (ja) 画像認識装置
JPH0554075A (ja) 翻訳装置
JP3361673B2 (ja) 情報再生装置および情報再生方法
JPH05336341A (ja) 画像処理装置
JPH0477965A (ja) デジタル複写装置
JPH11213089A (ja) 画像処理装置及びその方法
JPH0546659A (ja) デジタル翻訳複写装置
JPH01144181A (ja) 光学的文字読取装置
JPH0296885A (ja) 画像処理装置
JP3675709B2 (ja) 画像形成装置
JP3361905B2 (ja) 光学的文字読取装置
JPH0562014A (ja) 文字認識装置