JPS62119690A - 文書画像領域分割装置 - Google Patents

文書画像領域分割装置

Info

Publication number
JPS62119690A
JPS62119690A JP60260340A JP26034085A JPS62119690A JP S62119690 A JPS62119690 A JP S62119690A JP 60260340 A JP60260340 A JP 60260340A JP 26034085 A JP26034085 A JP 26034085A JP S62119690 A JPS62119690 A JP S62119690A
Authority
JP
Japan
Prior art keywords
area
document
characteristic
circuit
feature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP60260340A
Other languages
English (en)
Inventor
Teruo Akiyama
秋山 照雄
Isao Masuda
功 増田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP60260340A priority Critical patent/JPS62119690A/ja
Publication of JPS62119690A publication Critical patent/JPS62119690A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Image Analysis (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔発明の属する技術分野〕 本発明は文書中の文字や図表を自動的に読み取る文書自
動読取装置において書式を前もって知ることの出来ない
文書の書式を自動的に理解し、文書に含まれる見出し2
本文1図表、写真等の領域全自動的に抽出する文書画像
領域分割装置に関するものである。
〔従来の技術〕
これまで、文書中の文字音読み取るものとして光学的文
字読取装置t (OOR)が実用化されているが、これ
らのものはOORシートと呼ばれる書式の固定した特殊
な用紙に誉かれたシ印刷されたシしているものしか扱え
ないものが殆どであシ、また特殊な用紙を用いるもので
なくても書式の制限が厳しく汎用性がなかった。これま
で書式を予め知ることの出来ない文書の領域全分割する
ものとして、ランレングスを用い、黒画素の連続が短い
ものが多く存在する部分を文字領域として抽出したシ、
白画素の連続が長いものに囲まれる領域を抽出し、その
形状、大きさによって文字領域9図表領域を分離するも
のがあるが、処理に使用するパラメータが文書の種類に
依存してしまうという欠点があった。また、文書中の図
形の輪郭を追跡することによって図形の外接枠を求め、
その位置。
大きさを用いて領域を抽出していくものが提案されてい
るが、局所的な特徴を用いるため、処理効率が悪いとい
う欠点があった。領域内の画素濃度を用い統計的な手法
によって領域を分割する手法も提案されているが、これ
は大局的な特徴を用いるため、精度が低下するといった
欠点があった。
また、フーリエ変換を用いるもの、文書に関する細かい
ルールを記述した上で知識処理を用いるものが提案され
ているが処理に時間がかがシ、効率が悪いといった欠点
があった。
〔発明の目的〕
本発明はこれらの欠点を解決し曹弐を予め知ることの出
来ない文f’k、その種類に依存せずに効率良く、しか
も高精度に領域分割することを目的とする。
〔発明の特徴〕
本発明は、周辺分布特徴、線密度特徴、外接矩形特徴と
いう極めて簡単な特徴を併用し、文書の大局的な性質と
局所的な性質を効率的に組み合わせることによって書式
にとられれることなく文書の領域を分割することも最も
主要な特徴としており、以下、図面に従って説明する。
〔実施例〕
本発明の一実施例を第1図に示す。
光電変換部/ではファクシミリ、ドラムスキャナ等、既
存の入力装置を用いて文書を光電変換した上でアナログ
/ディジタル変換によって量子化し、信号線コによって
文書の蒼子化データ金画像データ記憶部3に格納すると
同時にデータの入力終了後、信号線クラ用いて文書方向
判別回路jに画像入力終了信号を送る。
特徴抽出部乙は周辺分布特徴計算回路7と線密度特徴計
算回路rと外接矩形特徴計算回路りとから構成される。
周辺分布特徴計算回路7は画像データ記憶部3に格納さ
れた文書画像中の指定された領域内の周辺分布特徴を計
算する。周辺分布特徴は領域内に含まれる図形の概略的
な位置、大きさ全示すもので、水平方向周辺分布pph
と垂直方向周辺分布ppvがある。水平方向周辺分布は
指定された領域内を水平方向に、また垂直方向周辺分布
は指定された領域内を垂直方向に走査し各画素の濃度値
を加えることによって求めることが出来る。第2図は周
辺分布特徴計算回路7について説明したもので、指定領
域内に数字”、5″が白画素O1黒画素lの濃度値を持
つ10xりの画素に分割されて画像データ記憶部3に格
納されている状態を示している。周辺分布特徴計算回路
7は信号線IOを用いて指定領域内の画素の濃度値を読
みだし周辺分布特徴を計算する。指定領域内の画素の座
標t=Lj、その画素の濃度値をF(i、j)とした時
、周辺分布pph、 ppv  は式 %式%) を用いて求めることが出来る。ここで、iは画素の垂直
方向の座標、」は画素の水平方向の座標である。第2図
は領域//ヲ水平方向/、2、垂直方向13に走査し、
各走査毎に濃度値を累計した値がレジスターク、及びレ
ジスターjに格納されている状態を示している。この場
合には濃度値の累計は黒画素の数と等しくなる。レジス
ター≠及び−6= レジスタ7.1の内容は信号線/i<とパス/AAを通
じて第1図に示した前処理部17又は論理処理部lざに
送られる。
線密度特徴計算回路rは画像データ記憶部3に格納され
た文書画像中の指定された領域内の線密度特徴を計算す
る。線密度は領域内の図形の複雑さを示すもので、水平
方向線密度8D11と垂直方向線密度8Dvがある。水
平方向線密度は指定された領域内を水平方向に、また垂
直方向線密度は指定された領域内を垂直方向に走査し各
画素の濃度値が一定値0.2満から07以上に変化する
場所を計数することによって求めることが出来る。第3
図は線密度特徴計算回路rについて説明したもので、第
2図と同様、指定領域内に数字I J、 Iが白画素O
1黒画素lの濃度値金持っ10×りの画素に分割されて
画像データ記憶部3に格納されている状態を示している
。細密度特徴計重回路rけ信号線19を用いて指定領域
内の画素の濃度値を読みだし線密度特徴を計算する。指
定領域内の画素の座標をIIJ%その画素の濃度値をF
Ct、j)とし、さらに濃度値F(i、j)は白または
黒の値、すなわちOまたはlの値しか取らないものとし
た時、線密度8Dh 、 SDvは式 %式%)) を用いて計算することが出来る。ここで、lは画素の垂
直方向の座標、jは画素の水平方向の座標である。第3
図中の領域2Of水平方向21・垂直方向コλに走査し
、各走査毎に線密度を計算した値がレジスタ23、及び
レジスタコ≠に格納されている。レジスタ23及びレジ
スタ、2≠の内容は信号線23とバス/AA’に通じて
第1図に示した前処理部17又は論理処理部/とに送ら
れる。
外接矩形特徴計算回路7は画像データ記憶部3に格納さ
れた文書画像中の指定された領域内の図形の外接矩形特
徴を計算する。外接矩形特徴は図形の位置、大きさを正
確に求めるために用いる。
文書画像上の図形は一般に互いに入り組んでいることが
多いため、外接矩形特徴は画像メモリ内の図形を投影し
て求めるのではなく、輪郭線を追跡することによって値
を求める必要がある。画素の濃度が多値の場合には画素
濃度が一定値0.2を越える画素の輪郭を追跡すれば良
い。第4図は外接矩形特徴計算回路りについて説明した
もので、第2図、第3図と同様、指定領域内に数字11
が白画素O1黒画素lの濃度値を持つlo×りの画素に
分割されて画像データ記憶部3に格納されている状態を
示している。外接矩形特徴計算回路りは信号線26を用
いて指定領域内の画素の濃度値全貌みだし外接矩形特徴
全計算する。領域27にある図形、21r’i時計方向
λり又は反時計方向3゜に輪郭追跡することによって求
めた図形の垂直方向の存在範囲がレジスタ3/、水平方
向の存在範囲がレジスタ3コに格納されている。レジス
タ31及びレジスタ32の内容は1F!号IVi133
とバス16人を通じて第1図に示し九前処理部/7又は
論理処理部l♂に送られる。
前処理部17は文書方向判別回路jと文書傾き補正回路
3≠から構成される。文書方向判別回路は入力された文
書が縦書きの文書か、横書きの文書か全判別する回路で
光電変換部lからの入力終了信号を信号線4tを経由し
て受は取った後、動作する。文書方向回路jについては
例えば信号線3jから読み込まれる周辺分布特徴計算回
路7の結果と特願昭1.0−/Iタタに示した文字列方
向判別装置を用いることによって実現可能である。
文書傾き補正回路3≠は文書方向判別回路jからの結果
全信号線36を用いて読み込み、文書の傾きを補正する
回路である。文書傾き補正回路について例えば信号線3
7から読み込まれる周辺分布特徴計算回路7の結果と特
願昭33−/413コ3♂、特願昭、3−1.−171
011コに示した文書傾き補正装置を用いることによっ
て実現可能である。文書傾き補正回路で傾きを検出して
補正を行った後、信号線37,3Kを用いて傾きを補正
した文書画像データを画像データ記憶部3に格納する。
論理処理部l♂はフィールドセパレータ領域抽出回路3
り、本文領域抽出回路≠0、見出し領域抽出回路lA/
、付属領域抽出回路≠2と、これらの各回路全制御する
だめの領域分割制御装置≠3とからなる。
フィールドセパレータ抽出回路3りは文書の領域を分割
するために用いられでいるフィールドセパレータを抽出
するもので文語傾き補正回路からの終了信号f、信号線
4t≠から受は取った後作動する。フィールドセパレー
タは通常直線状の細長い形をしておp、実直線がその典
型的なものである。
実直線の抽出は例えば信号線<z、tから読み込まれる
外接矩形%微計算回路りの結果を用い、縦と横の比が一
定値03以上の図形を抽出することによって実現可能で
ある。ここで抽出されたフィールドセパレータの位置、
大きさを示す領域情報は信号線≠6を用いて領域分割制
御装置413に送られる。領域分割制御装置μ3はフィ
ールドセパレータ領域抽出回路3り、本文領域抽出回路
≠O1見出し領域抽出回路≠l、付属領域抽出回路≠2
から得られる各領域の位蓋、大きさ全蓄積すると同時に
、その情報をもとに文書画像の領域分割の制御を行う装
置である。領域分割制御装置≠3はフィールドセパレー
タ領域抽出回路3りから得られるフィールドセパレータ
の領域情報音もとに領域分割を行う。第j崗は複数個の
文字列から構成される3個の文字ブロック4L7.≠♂
、≠りとフィールドセパレータjOから構成される横書
きの文書の例を示したものである。領域分割制御装置≠
3はフィールドセパレータの情報をもとに第5図に示し
た文書の領域全体(第を図−j/ )”f:フィールド
セパレータを挾む二つの領域(第6図−!λ、j3)に
分割する。2個以上のフィールドセパレータが抽出され
ている場合には領域を分割する操作全反復して行う。
本文領域抽出回路≠Oは周辺分布特徴計算回路7から得
られる周辺分布特徴と、線密度特徴計算回路ざから得ら
れる線密度特徴を信号線j4tを用いて入力し、周期的
に並んだ複数個の文字列から構成される本文ブロックを
概略的に抽出する。さらに外接矩形特徴計算回路りで計
算された外接矩形特徴を用いて個々の文字列全正確に抽
出する。
外接矩形特徴は他の二特徴と同様、信号線よμを用いて
入力する0本文文字列の抽出結果は信号線よ!ヲ用いて
領域分割制御装置f1t11.3に出力される。
第7図は本文ブロック概略抽出の原理について説明した
ものである。第7図kl横方向のj個の文字列によって
構成される本文ブロックが2個存在する状態を示してい
る。まず、水平方向の周辺分布(pph )と垂直方向
の周辺分布(pp、)、ji 、t7を求める。次に最
大の幅を持つ谷を周辺分布の中から抽出する。第7図に
おいては谷、a/+ s2+aJ+b/の中でb/の幅
が最大である。そこで、ここの位置を領域分割の丸めの
候補位置とする。
なお、本文領域抽出回路≠Oにおける領域分割はフィー
ルドセパレータによって分割された個々の領域に対して
行う。この領域分割処理によって本文ブロックを抽出す
る場合には第7図に示される状況と、第r図に示される
状況を区別する必要がある。第g図は見出し等の大きな
文字が領域に含まれている場合全示している。第7図に
示される状況のときには左右を分割して2個の本文プロ
ツりとすべきであシ、第r図に示される状況のときには
領域を分割すべきでない。第g図における水平方向の周
辺分布(pph )と垂直方向の周辺分布(ppv )
・3F、jりの中で最大の幅を持つ谷はbJであり、こ
の場所が領域分割の候補位置となる。第r図に示される
状況の時の分割を防ぐため、線密度特徴計算回路どによ
って計算される線密度特徴を用いる。すなわち、領域内
に多くの文字が含まれる場合には第7図60に示される
ように線密度の値は犬きくなシ、領域内に少しの文字し
か含まれない場合には第r図61に示されるように線密
度の値が小さくなる性質を利用する。従って、領域内の
線密度の値が大きい場合のみ領域を分割することによっ
て、本文ブロックを概略的に抽出することが出来る。周
辺分布特徴と線密度特徴を利用した領域分割によって既
にフィールドセパレータによって分割されていた第6図
!コの領域は2個の領域1,2.63に分割される。本
文領域抽出回路はさらに概略的に抽出された本文ブロッ
クケ用いて個々の文字列を正確に抽出する。文字列の抽
出には外接矩形%徴計′脚回路りによって計算される外
接矩形特徴を用いる。第り図は文字ブロック内の図形が
外接矩形%徴を用いて文字列に統合されていく様子を示
している。第7図(a)は本文ブロックに含まれる図形
の例を示しており、各図形の外接矩形特徴全第り図(b
)に示した。本文領域抽出回路は各外接矩形特徴全文字
列方向に統合し、個々の文字列第7図(e) ’(I:
得る。さらに、文字列が周期性金持って並んでいる部分
を抽出し本文ブロックとする。このように、本文領域抽
出回路では周辺分布特徴、線密度%徴、外接矩形特徴を
併用することにより効果的、かつ効率的に本文文字列の
抽出を行う。
見出し領域抽出回路弘/では文書中の見出し領域全抽出
する。見出し領域全構成する文字列は、信号線A4tを
通じて読み込む線密度特徴と外接矩形特徴を利用して抽
出出来る。通常、本文は文書中で大半の領域を占めてお
り、見出し文字はこれらの本文領域を構成する文字より
も大きい、そこでまず、外接矩形物gII11′算回路
りを用いて文書中の図形の外接矩形特徴を求め本文領域
の文字図形よシも大きい図形要素を見出し文字の候補矩
形とする。本文文字の大きさは本文領域の文字が文書中
の図形要素の大半を占めていることを利用し、文書中の
全図形の大きさを平均して近似的に求める。候補図形の
中には図9表、写真など付属領域に含まれるものも本文
領域の文字よりも大きな図形を持つものとして抽出され
ている。そこでこれらの付属領域に含まれる図9表、写
真等は線密度特徴によって分離する。すなわち、抽出さ
れた図形要素が単一の文字であれば、その線密度は一定
値0≠を越えないことを利用し、本文領域の文字を構成
する図形要素よりも大きい図形要素の中で線密度が一定
値CIA以下のものを見出し文字に含まれる図形として
抽出する。さらに見出し文字に含まれる図形として抽出
したこれらの図形の領域を統合して見出し領域とする。
抽出された見出し領域は信号線を夕を用いて領域分割制
御装置≠3に送られる。また、線密度特徴が一定値0弘
を越えるものについては、付属領域の候補図形とじて信
号線66を経由して付属領域抽出回路μλに出力する。
付属領域抽出回路412は図1表、写真等を含む付属領
域を抽出するものである。付属領域抽出回路では信号線
66を経て入力される付属領域の候補図形と、図9表、
写真のタイトル文字等、フィールドセパレータ領域にも
、本文領域にも、見出し領域にも含まれない図形要素を
統会し、付属領域として抽出する。抽出した結果は信号
線67を経由して領域分割制御装置≠3に出力する。フ
ィールドセパレータ、見出し9本文のいずれに4含まな
い図形要素は信号線31.41rを経由して得られる画
像データからフィールドセパレータ領域抽出回路3り、
本文領域抽出回路4tO1見出し領域抽出回路lAlか
ら得られる領域を取シ除くことによって抽出される。
領域分割制御装置≠3は論理処理部it内の各回路で抽
出された各領域の位置、大きさを蓄積すると同時に各回
路の動作の制御を行う。各領域の抽出結果は信号線6り
を経由して外部に出力され=   17   = る。
〔発明の効果〕 以上説明したように、本発明では周辺分布%徴、線密度
特徴、外接矩形特徴という極めて簡単な特徴を併用し、
文書の大局的な性質と局所的な性質全効果的に組み合わ
せることにより、あらかじめ書式を知ることの出来ない
文11’t−フィールドセパレータ領域、見出し領域、
本文領域、付属領域など互いに性質の異なる領域に効率
的に分割し、文書全構成する文字列等の構成要素を抽出
することが出来る。本発明によシ、書式が固定したもの
、あるいは書式が制限されたものしか扱うことが出来な
かったこれまでのOORと異なり、書式をあらかじめ知
ることの出来ない任意の文41読み取る00Rが実現出
来る。
【図面の簡単な説明】
第1図は本発明の一実施例。第2図は周辺分布特徴計算
回路の動作原理を示す図。第3図は線密度特徴計算回路
の動作原理を示す図。第μ図は外接矩形特徴計算回路の
動作原理を示す図。第5図は文書の一例を示す図、第を
図は領域分割の過程を示す図。第7図、第r図は本文領
域抽出の原理を示す図。第9図は文字列抽出の原理を示
す図。 l・・・光電変換部、コ・・・−駄子化画像データを転
送するだめの信号線、3・・・量子化画像データ記憶部
、≠・・・データ入力終了信号を転送するための信号線
、!・・・文書方向判別回路、6・・・特徴抽出部、7
・・・周辺分布特徴計算回路、r・・・線密度特徴計算
回路、り・・・外接矩形特徴計算回路、io・・・周辺
分布特徴計算回路に画像データを読み込むための信号線
、ii・・・周辺分布特徴を求める領域、12・・・水
平方向周辺分布を求める方向、13・・・垂直方向周辺
分布を求める方向、1lI−・・・水平方向周辺分布の
値を格納するレジスタ、lj・・・垂直方向周辺分布の
値を格納スるレジスタ、/z・・・レジスタの値を出力
する信号線、16人・・・特徴抽出部、画像データ記憶
部と前処理部、論理処理部間のデータの入出力を行うた
めのバス、/7・・・前処理部、llr・・・論理処理
部、lり・・・線密度特徴計算回路に画像データを読み
込むための信号線1.20・・・線密度特徴を求める領
域、21・・・水平方向線密度を求める方向2.2.2
・・・垂直方向線密度を求める方向、23・・・水平方
向線密度の値全格納するレジスタ、2≠・・・垂直方向
線密度の値を格納するレジスタ、2よ・・・レジスタの
値全出力する信号線、2乙・・・外接矩形特徴計算回路
に画像データを読み込むための信号線、27・・・外接
矩形特徴を求める領域1.2f・・・外接矩形特徴を求
める図形、27・・・輪郭線を追跡する方向(時計方向
)、30・・・輪郭線を追跡する方向(反時計方向)、
31・・・水平方向の図形存在範囲を示す値を格納する
レジスタ、32・・・垂直方向の図形存在範囲を示す値
を格納するレジスタ、33・・・レジスタの値を出力す
る信号線、34t・・・文書傾き補正回路、3j・・・
文書方向判別回路にデータを読み込むだめの信号線、3
z・・・文書方向の判別結果全出力する信号線、37・
・・文書傾き補正回路にデータを読み込むだめの信号線
、3g・・・画像データ記憶部の内容を前処理部、論理
処理部に出力するための信号線、3り・・・フィールド
セパレータ領域抽出回路、lAO・・・本文領域抽出回
路、≠l・・・見出し領域抽出回路、4t、2・・・付
属領域抽出回路、≠3・・・領域分割制御装置、Vμ・
・・文書傾き補正の終了M号を出力する信号線、tよ・
・・フィールドセパレータ領域抽出回路にデータ’(r
 Weみ込むための信号線、it・・・抽出したフィー
ルドセパレータを出力するための信号線、IA7.μg
、l11.り・・・本文ブロックの例、3o・・・フィ
ールドセパレータの例、!l・・・分割される領域の例
、j、!、!3・・・分割された領域の例、!i≠・・
・本文領域抽出回路にデータを読み込むだめの信号線、
jJ′・・・分割する領域を読み込み、分割した結果を
出力するだめの信号線、!t・・・水平方向周辺分布、
!7・・・垂直方向周辺分布、!ざ・・・水平方向周辺
分布、jり・・・垂直方向周辺分布、to、ti・・・
垂直方向線密度、6コ、63・・・分割された領域の例
、ti・・・見出し領域抽出回路にデータを読み込むた
めの信号線、it・・・抽出した見出し領域を出力する
ための信号線、66・・・付属領域の候補を出力する信
号線、67・・・抽出した付属領域を出力するための信
号線、6r・・・付属−!l   − 領域抽出回路にデータを読み込むだめの信号線、tり・
・・領域分割結果を出力するだめの信号線、a/+ a
、2+ a3+ a4’+ b/l b、2−・−領域
分割候補位置。

Claims (1)

  1. 【特許請求の範囲】 光電変換装置によって蓄積された文字,図,表,写真等
    、が混在する文書画像データの領域分割を行う文書画像
    領域分割装置において、 (a)前述の文書画像を光電変換した上でアナログ/デ
    ィジタル変換を行い量子化信号を出力する光電変換部と
    、 (b)該光電変換部から出力された量子化画像データを
    蓄積する画像データ記憶部と、 (c)該画像データ記憶部に格納された文書画像が縦書
    きか、横書きかを判別する文書方向判別回路、文書の傾
    きを補正する文書傾き補正回路から構成される前処理部
    と、 (d)傾きが補正され画像データ記憶部に格納された文
    書画像の周辺分布特徴を計算する周辺分布特徴計算回路
    、線密度特徴を計算する線密度特徴計算回路、外接矩形
    特徴を計算する外接矩形特徴計算回路から構成される特
    徴抽出部と、(e)該特徴抽出部から得られる各特徴を
    併用して文書画像の領域を分割し、フィールドセパレー
    タ領域,本文領域,図表,写真等が含まれる付属領域の
    各領域を抽出するフィールドセパレータ領域抽出回路,
    本文領域抽出回路,見出し領域抽出回路,付属領域抽出
    回路から構成される論理処理部、 とを備えたことを特徴とする文書画像領域分割装置。
JP60260340A 1985-11-20 1985-11-20 文書画像領域分割装置 Pending JPS62119690A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP60260340A JPS62119690A (ja) 1985-11-20 1985-11-20 文書画像領域分割装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP60260340A JPS62119690A (ja) 1985-11-20 1985-11-20 文書画像領域分割装置

Publications (1)

Publication Number Publication Date
JPS62119690A true JPS62119690A (ja) 1987-05-30

Family

ID=17346623

Family Applications (1)

Application Number Title Priority Date Filing Date
JP60260340A Pending JPS62119690A (ja) 1985-11-20 1985-11-20 文書画像領域分割装置

Country Status (1)

Country Link
JP (1) JPS62119690A (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1990001198A1 (en) * 1988-07-20 1990-02-08 Fujitsu Limited Character recognition apparatus
JPH0293988A (ja) * 1988-09-30 1990-04-04 Omron Tateisi Electron Co 画像記録装置、画像出力装置、画像の種別識別装置、画像記録装置の記録方法、画像出力装置の出力方法および画像の種別識別方法
JPH02311975A (ja) * 1989-05-29 1990-12-27 Nec Corp 光学文字読取装置
US5625710A (en) * 1988-07-20 1997-04-29 Fujitsu Limited Character recognition apparatus using modification of a characteristic quantity
US7309599B2 (en) 2000-10-19 2007-12-18 Dsm Ip Assets B.V. Aerobic fermentation method

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60189084A (ja) * 1984-03-07 1985-09-26 Fujitsu Ltd 文字区域抽出回路

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60189084A (ja) * 1984-03-07 1985-09-26 Fujitsu Ltd 文字区域抽出回路

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5197107A (en) * 1988-04-26 1993-03-23 Fujitsu Limited Character recognition apparatus
WO1990001198A1 (en) * 1988-07-20 1990-02-08 Fujitsu Limited Character recognition apparatus
US5625710A (en) * 1988-07-20 1997-04-29 Fujitsu Limited Character recognition apparatus using modification of a characteristic quantity
JPH0293988A (ja) * 1988-09-30 1990-04-04 Omron Tateisi Electron Co 画像記録装置、画像出力装置、画像の種別識別装置、画像記録装置の記録方法、画像出力装置の出力方法および画像の種別識別方法
JPH02311975A (ja) * 1989-05-29 1990-12-27 Nec Corp 光学文字読取装置
US7309599B2 (en) 2000-10-19 2007-12-18 Dsm Ip Assets B.V. Aerobic fermentation method

Similar Documents

Publication Publication Date Title
JP3086702B2 (ja) テキスト又は線図形を識別する方法及びデジタル処理システム
US20040213458A1 (en) Image processing method and system
JP2890482B2 (ja) 文書画像再配置ファイリング装置
JP2001060247A (ja) 画像処理装置および画像処理方法
CN114121179B (zh) 化学结构式的提取方法及提取装置
JPS62119690A (ja) 文書画像領域分割装置
US4817169A (en) Page segmentor
Saitoh et al. Document image segmentation and text area ordering
Amamoto et al. Block segmentation and text area extraction of vertically/horizontally written document
JPS6325391B2 (ja)
Aparna et al. A complete OCR system development of Tamil magazine documents
JPS61193277A (ja) 文書読取装置
JPS61160180A (ja) 文字列方向判別装置
JPH03268181A (ja) 文書読み取り装置
JP3142950B2 (ja) 線分認識方式
JPH0528310A (ja) フオーム型文書識別装置
JPH08249419A (ja) 表領域判定装置
JPH0214392A (ja) 文書領域解析装置
JPH0550785B2 (ja)
JP2984291B2 (ja) 画像処理装置及び画像処理方法
JP3074210B2 (ja) 紙文書画像処理装置
RU2287183C2 (ru) Способ и средство для мобильного захвата, обработки, хранения и передачи текста и смешанной информации, содержащей знаки и изображения
JP2708604B2 (ja) 文字認識方法
JPS63184181A (ja) 光学文字認識装置
JPH0514952B2 (ja)