JPS6214263A - 文書画像処理方式 - Google Patents

文書画像処理方式

Info

Publication number
JPS6214263A
JPS6214263A JP60152211A JP15221185A JPS6214263A JP S6214263 A JPS6214263 A JP S6214263A JP 60152211 A JP60152211 A JP 60152211A JP 15221185 A JP15221185 A JP 15221185A JP S6214263 A JPS6214263 A JP S6214263A
Authority
JP
Japan
Prior art keywords
document
picture
image
memory
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP60152211A
Other languages
English (en)
Inventor
Yasuaki Nakano
中野 康明
Hiromichi Fujisawa
浩道 藤澤
Toshihiro Hananoi
花野井 歳弘
Kiyomichi Kurino
栗野 清道
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP60152211A priority Critical patent/JPS6214263A/ja
Publication of JPS6214263A publication Critical patent/JPS6214263A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔発明の利用分野〕 本発明は文書画像の処理方式に係り、特に画像ファイル
に文書画像を自動的に格納する目的に好適な文書画像処
理方式に関する。
〔発明の背景〕
従来の文書画像ファイル装置では文書画像を格納すると
き、入力された文書画像の職別情報(文書番号など)を
キーボードなどから与える必要があった。その作業が煩
雑であるばかりでなく、自動給紙機構を用いた大量の文
書の連続入力に際し、各文書の職別情報の付与が困難で
あった。先頭頁のみ職別情報をキー人力し、以後は自動
的に内部でカウンタを歩進して職別情報を生成する方法
も考えられるが、文書中のある頁が脱落した場合にずれ
が生ずるなどの問題があった。
従って、文書中の特定領域に職別情報を記入し、それを
読み取って入力文書の職別情報をディレクトリに登録す
ることが有効である。文書中の特定領域としては、たと
えば長方形の枠などの形状が便利である。
従来技術では、公開特許公報昭和60−17566号(
昭和60年1月29日公開)において、文書上の指定さ
れた領域の文字を認識し、検索キーワードを得る方法が
提案されている。また、公開特許公報昭和60−175
71号(昭和60年1月29日公開)において、入力画
像から特定の閉曲線を抽出し、その閉曲線の内部を文字
認識する方法が提案されている。しかし、文書画像から
効率よく長方形の枠などの特定領域を探索する方法は知
られていない。また、文書に上記長方形の枠が最初から
印刷されているとは限らないから、文書上に長方形の枠
を追記して職別情報を書き込む必要もあるが、この場合
原文書を汚損した形でファイル中に格納することになり
、文書を表示・印刷あるいは編集するとき問題である。
〔発明の目的〕
本発明の目的は、入力文書上の特定形状の記入領域中の
職別情報を利用することにより、文書の入力時における
キー人力作業を軽減することにあり、さらに職別情報に
より生じた文書の汚損の影響を被ることなく文書をファ
イル中に格納する手段を提供することにある。
〔発明の概要〕
かかる目的を達成するために、本発明においては入力文
書の画像から枠部分を抽出し、さらに枠の内部に存在す
る文字を職別することにより、自動的に文書の職別情報
の決定を行うものである。
また、入力文書画像から枠部分の画像を消去することに
より、職別情報記入領域によって生ずる原文書の汚損を
消去するものである。
〔発明の実施例〕
以下、本発明を図面を用いて詳細に説明する。
第1図は本発明の文書画像処理方式を実施する装置の構
成を示すブロック図である。装置の各部はバス1に接続
され、全体の動作は制御部2により制御される。
文書の処理には登録モードと検索モードとがあるが、本
発明は主に登録モードに関係するので登録モードの処理
のみを説明する。登録モードの処理の流れ図を第2図に
示す。この処理は制御部2のソフトウェアにより実行さ
れる。
第2図で、201は文書画像の入力であり、入力された
文書上の画像をメモリ51の中に格納する。文書3上の
情報(文書画像)は光電変換装置4により走査され、さ
らにディジタル化され、バス1を介してメモリ51に格
納される。メモリ51は後述する52〜56とともにメ
モリ5の一部をなす、ディジタル化の際、公知の高効率
符号化処理を行ってもよく、これにより文書画像を記憶
するメモリの記憶容量を節約できる。また、以下の説明
では1画素1ビツトに二値化するものとするが、1画素
を多値で表現してもよく、カラースキャナにより光電変
換して色情報を付与してもよい、202では文書画像に
対し位置補正処理、傾き補正処理などの正規化を行い、
その結果得られる画像がメモリ52に格納される。この
正規化画像に対し、203で特定パターン抽出処理が行
われ、抽出された特定パターンの位置情報はメモリ53
に格納される。
第3図は特定パターン抽出処理の処理内容を説明する図
である。入力画像(A)に対し、(B)のような4個の
基準パターンT1.、T2.T3゜T4を移動しながら
マツチングさせる。T1−T4は特定パターンの4隅に
対応する部分パターンで、あらかじめメモリ54の中に
格納しておく。
マツチングは、基準パターンと同じ大きさの領域を入力
画像(正規化画像)から切り出して行う。
基準パターンT1に対し類似度かある閾値以上の部分領
域が検出されると、その代表点(たとえば左下隅)の位
置座標をT1候補点として登録し、次に基準パターンT
2の候補点をマツチングにより探索する。T2のマツチ
ングでは、T1候補点から一定の相対位置にある点の付
近の部分領域に対して行う。T2のマツチングが成功し
ない場合は、このT1候補点を削除し他のT1候補点を
探索する。以下同様にT3.T4候補点を探索する。
このようにして、T4候補点までが求まったとき、これ
らの間の相対位置は特定パターンのものに一致するので
、T1〜T4候補点が特定パターンの位置を示すものと
認められる。
第2図204は、T4 (あるいはT1〜T3)が検出
されなかったとき特定パターンは検出失敗とする判定部
で、失敗のときは205でこの文書に対するリジェクト
処理を行う。206〜220は文書から特定パターンの
領域を抽出し職別情報を表す文字パターンを認識する処
理であり、第4図はこれらの処理の説明図である。20
6ではT1〜T4から定まる特定パターンを含むやや大
きな部分領域を入力画像(正規化画像)から切り出す(
第4図(A))、207では上記の部分領域について輪
郭抽出処理を行い、輪郭上の座標点列を抽出する(第4
図(B))。この座標点列は輪郭の個数だけ得られる。
ここで、輪郭には外輪郭と内輪郭との区別がなされてい
るものとする。
内輪郭(外輪郭)とは白地を取り囲む黒地(黒地を取り
囲む白地)の境界であり、白地を右側に黒地を左側に見
るようにして輪郭を一周したとき時計回り(反時計回り
)に−周するような輪郭を言う、208は輪郭について
209〜211の処理を繰り返すループ制御である。2
09は長方形をなす内輪郭のときのみ210〜211の
処理を行う判定である。長方形判定の詳細については後
述する。210では長方形の中で大きさがある範囲に入
るものを抽出し、211で枠内側として背縁する。21
2は枠抽出が成功したかどうかを判定し、失敗なら21
3でエラー終了とする。214〜219は枠の中の画像
を生成する処理である。
あらかじめメモリ55の中に部分領域と同じ大きさの白
地の作業エリアを作っであるとする。214は輪郭につ
いて215〜219の処理を繰り返すループ制御である
。215で輪郭を構成する点列の座標位置の画素を黒と
した後、216で内部を塗り潰す。そのとき217で輪
郭の種類を判定し、外輪郭なら黒で内輪郭なら白で内部
を白で塗り潰す。この処理を輪郭の左上の点の順序に従
って行うことにより画像を再生することができる。ただ
し、点の順序は上にあるほど、同じ上下位置なら左にあ
るほど高いとする。第4図(C)、(D)は上記の塗り
潰し処理の途中経過を示す、220では上記の再生した
画像を文字認識部8に送って枠内の文字を認識する。上
記の説明から分かるように枠内部に含まれる画像(文字
パターン)のみが文字認識部に送られるので、特定パタ
ーン外部の文書画像の影響を受けず文字の切り出し・認
識が容易である。
221〜222は原画像から特定パターンの画像を消去
する部分で、第5図はその処理の説明図である。221
では輪郭の中から長方形をなす外輪郭で大きさがある範
囲以上で、かつ枠内側を包含するものを抽出し、枠外側
とする。221は215〜219の処理と同様にしてで
きる。222では抽出した枠外側の輪郭情報を用いて、
原画像から特定パターンの画像を消去する。具体的には
、メモリ55の中に原画像と同じ大きさの白地の作業エ
リアを作り、枠外側として抽出した外輪郭を構成する点
列の座標位置の画素を黒とした後(第5図(A))、内
部を黒で塗り潰す、その後、作業エリア全体を白黒反転
する(第5図(B))。
このメモリ55の中の画像とメモリ52の中の原画像(
第3図(A))とに対し1画素ごとの論理積を作った画
像メモリ56に作成することにより(第51!l (C
) ’) 、原画像から特定パターンの画像を消去する
第2図223は1文字認識部8の出力した職別情報から
画像の格納アドレスなどディレクトリ情報を生成する処
理である。224ではコンソール7を用いて、枠の抽出
結果の表示・修正2文字認識結果の表示・修正、格納ア
ドレスの確認・変更などの対話処理を行う。225では
メモリ56の画像をファイル6に出力する。
次に長方形抽出処理の詳細を説明する。第6図は、 長方形を抽出する処理の内容を示す図である。内輪郭の
座標は一次元データX (i) 、 Y (i)として
表現される。輪郭点の中で(X(i)+Y(i))の最
大値と最小値、(X(i)+Y(i))の最大値と最小
値、を与える点を求めればこれらは第5図のP4.P2
.P3.Piに相当する。PI〜P4は枠が長方形の場
合には4隅の点になる。
P1〜P2の間でXの最大値と最小値を与える点を求め
これを012.Qllとする。P2〜P3の間でYの最
大値と最小値を与える点を求めこれを022.Q21と
する。他の辺についても同様にする。Pi、Qll、Q
12.P2の4点のX座標値の差が小さいときP1〜P
2の直線であると判定し、他の3辺についても同様に直
線判定を行い、4辺が直線であるときこの枠は長方形で
あると判定をする。
以上本発明の一実施例について説明した。以上の説明で
は枠は一個しかないとしたが、複数個の枠がある場合に
処理内容を修正することは容易である。また、枠認識に
際して長方形決定の閾値を複数個設け、自動判定の結果
が困難なときはマンマシン的に最適値を選択したり、二
値化レベルを変えて再試行したり、オペレータが位置を
指示したりするなどの変更を加えてもよい。
また、本実施例では特定パターンを消去後ファイル6に
出力するようにしたが、消去前の画像を特定パターンの
位置情報とともにファイル6に格納するようにして、格
納した画像を読みだした時に自動的に或いはオペレータ
の指示により消去するようにしてもよい。
また1本実施例では特定パターンとして枠形式のものに
限定したが、実線あるいは破線などの罫線や、円などを
用いるように拡張することも可能である。たとえば実線
からなる罫線は、細長い外輪郭を抽出することで検出で
き、罫線の−L方の領域を切り出すことによって下線を
引いた職別情報文字の認識が可能である。円の検出は輪
郭座標系列を極座標表示し、この空間で直線検出すれば
よい。
また、色情報を利用し枠抽出や職別情抽出を行うことも
有効である。
さらに、文書から直接光電変換する場合に限定せず、画
像ファイルにあらかじめ文書を格納しておき、後刻画像
ファイルから読みだした文書画像に対して職別情報を抽
出するようにしてもよい。
〔発明の効果〕
以上説明したごとく、本発明によれば入力文書から自動
的に文書の職別情報を抽出することが可能で、従来のよ
うな人間によるキーボード作業が不要となるか、あるい
は大幅に軽減される。
また本発明によれば、職別情報の記入により生じた入力
文書の汚損を自動的に消反できるので、格納した文書を
利用する際に見よい画像が得られる。
【図面の簡単な説明】
第1図は本発明の文書処理方式を実施する装置の構成を
示すブロック図、第2図は第1図の制御部における処理
を説明するための流れ図、第3゜4.5.6図は第2図
における処理内容を説明する図である。 1・・・バス、2・・・制御部、3・・・文書、5・・
・メモリ、6・・・ファイル、7・・・コンソール、8
・・・文字認識部。

Claims (1)

  1. 【特許請求の範囲】 1、ディジタル画像を入力する手段と、 上記ディジタル画像から枠部分を抽出する手段と、 上記枠部分の内部に存在する文字を職別する手段と、 上記職別された文字から上記ディジタル画像の職別情報
    を生成する手段と を有してなる文書画像処理方式。 2、特許請求の範囲第1項記載の文書画像処理方式にお
    いて、 上記入力されたディジタル画像から枠部分を消去したの
    ち上記ディジタル画像を出力することを特徴とする文書
    画像処理方式。
JP60152211A 1985-07-12 1985-07-12 文書画像処理方式 Pending JPS6214263A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP60152211A JPS6214263A (ja) 1985-07-12 1985-07-12 文書画像処理方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP60152211A JPS6214263A (ja) 1985-07-12 1985-07-12 文書画像処理方式

Publications (1)

Publication Number Publication Date
JPS6214263A true JPS6214263A (ja) 1987-01-22

Family

ID=15535496

Family Applications (1)

Application Number Title Priority Date Filing Date
JP60152211A Pending JPS6214263A (ja) 1985-07-12 1985-07-12 文書画像処理方式

Country Status (1)

Country Link
JP (1) JPS6214263A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018025386A (ja) * 2015-03-10 2018-02-15 パナソニックIpマネジメント株式会社 加熱調理器

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2018025386A (ja) * 2015-03-10 2018-02-15 パナソニックIpマネジメント株式会社 加熱調理器
US10616962B2 (en) 2015-03-10 2020-04-07 Panasonic Intellectual Property Management Co., Ltd. Heating device for cooking

Similar Documents

Publication Publication Date Title
JP2930612B2 (ja) 画像形成装置
US20060045386A1 (en) Image processing method, system, program, program storage medium and information processing apparatus
US5892854A (en) Automatic image registration using binary moments
US20020015525A1 (en) Image processor for character recognition
JP2001297303A (ja) 文書画像認識方法、装置及びコンピュータ読み取り可能な記録媒体
JPS6159568A (ja) 文書処理装置
JP2958584B2 (ja) ノイズ除去方法
JP4281236B2 (ja) 画像認識装置、画像認識方法、および、画像認識プログラムを記憶したコンピュータ読取り可能な記録媒体
JPS6214263A (ja) 文書画像処理方式
JP7301529B2 (ja) 画像処理装置、画像処理方法、及びプログラム
JP2003046746A (ja) 画像処理方法及び画像処理装置
JP2000187705A (ja) 文書読取装置および方法および記憶媒体
JP2002027228A (ja) 画像処理のための装置、方法及び記録媒体
JPS5949671A (ja) 光学的文字読取装置
JP2800205B2 (ja) 画像処理装置
JP2954218B2 (ja) 画像処理方法及び装置
JP2002185763A (ja) デジタル複写機
JP3276554B2 (ja) フォーマット認識装置及び文字読取り装置
JP3046656B2 (ja) 文字原稿の傾き補正方法
JP3160458B2 (ja) 文字読取装置及び文字読取方法
JP2931041B2 (ja) 表内文字認識方法
JP2802132B2 (ja) 画像形成装置
JPH0728934A (ja) 文書画像処理装置
JPS61198376A (ja) 光学的文字読取装置
JP3046654B2 (ja) 文字原稿の傾き検出方法