JPS6175477A - フアイリング方式 - Google Patents

フアイリング方式

Info

Publication number
JPS6175477A
JPS6175477A JP59196616A JP19661684A JPS6175477A JP S6175477 A JPS6175477 A JP S6175477A JP 59196616 A JP59196616 A JP 59196616A JP 19661684 A JP19661684 A JP 19661684A JP S6175477 A JPS6175477 A JP S6175477A
Authority
JP
Japan
Prior art keywords
document
memory
sample
stored
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP59196616A
Other languages
English (en)
Inventor
Yasuaki Nakano
中野 康明
Hiromichi Fujisawa
藤沢 浩道
Masaaki Fujinawa
藤縄 雅章
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP59196616A priority Critical patent/JPS6175477A/ja
Publication of JPS6175477A publication Critical patent/JPS6175477A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Processing Or Creating Images (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔発明の利用分野〕 本発明は画像のファイリング方式に係り、特に定形的な
文書を経時的に格納する目的に好適なファイリング方式
に関する。
〔発明の背景〕
従来の画像ファイリング方式では、格納した画像を検索
するための所謂検索キー情報は人間が制御コンソールな
どからキーインしていた。そのため操作者の恣意によっ
て検索キー情報が選ばれ。
同一種類の文書に対して検索キーの継続性が保証されな
い危険があった。この危険を避けようとすると1文書の
種類の一覧表を別に用意したり、ファイル内の文書をそ
の都度参照したりする必要があり、煩雑であるだけでな
く誤操作を生ずる危険も高かった。
画像ファイルに対して、自動的にキー情報を抽出する方
式として1次の2通りが考えられる。
(1)文書の内容を理解し、その理解結果に基づいてキ
ー情報を生成する方式が考えられる。そのための基本技
術は、文書理解技術と文字認識技術とからなる0文字認
識技術は公知であり、文書理解の基本技術は、たとえば
野ロ要治、豊田順−両氏による「所間記事の切り抜きを
行うシステムに関する基礎的研究」 (情報処理学会筒
23口金国大会講演論文集6C−1、昭和56年)に記
載しである。しかし、この文書理解技術はまだ完成した
ものではなく、理解した結果からどのようにして検索キ
ー情報を抽出するかは今後のi題である。
(2)また、文書上のキーワードなどに螢光インクなど
でマークを付け、このマークされた文字を読み取って検
索キーとして使用することも考えられる。そのための基
本技術は、たとえば長谷雅彦、鈴木 元、伊藤久泰三氏
による「マークを用いた印刷文書の領域抽出法」 (電
子通信学会技報第PRL83−78、昭和59年3月)
に記載しである。しかし1本方式でも前述した問題点す
なわち操作者の恣意による検索キーの選択の問題は未解
決である。
〔発明の目的〕
本発明の目的は、定形的な入力文書に対して文書の種類
を自動的に識別して、すでに格納された文書と同一の分
類コードを与えることにより格納を自動的に行う手段を
提供することにある。
〔発明の概要〕 かかる目的を達成するために、本発明においては格納す
べき対象文書の見本文書の(複数個の)画像あるいはそ
の特徴パターンをあらかじめ記憶しておき、格納すべき
対象文書の画像から特徴パターンを抽出して、上記見本
文書の特徴パターンと比較し同一であると判定した見本
文書の分類コードを入力文書に付与することによって、
自動的に分類コードの決定を行うものである。
〔発明の実施例〕
以下1本発明を図面を用いて詳細に説明する。
第1図は本発明のファイリング方式を実施する装置の構
成を示すブロック図である。装置の各部はバス1に接続
され、全体の動作は制御部2により制御される1文書3
上の情報(文書画像)は光電変換装置4により走査され
、さらにディジタル化され、バス1を介してメモリ51
に格納される。
メモリ51は後述する52,53.54とともにメモリ
5の一部をなす、ディジタル化の際、公知の高効率符号
化処理を行ってもよく、これにより文書画像を記憶する
メモリの記憶容量を節約できる。また、以下の説明では
1画素1ビツトに二値化するものとするが、1画素を多
値で表現してもよく、カラースキャナにより光電変換し
て色情報を付与してもよい。
文書の処理には登録モードと識別モードとがある。まず
、登録モードの場合は各文書類型ごとに見本文書を用い
、この見本文書上の画像をメモリ51の中に格納する。
この見本文書画像に対し制御部2により公知の位置補正
処理、傾き補正処理などを行って得られる正規化画像が
メモリ52に格納される。この正規化画像に対し、制御
部2のプログラム制御により後述する線抽出処理が行わ
れ、抽出された線パターンがメモリ53に格納される。
上記の見本文書の正規化画像及び線パターンがファイル
装置1!9に格納される。その際、キーボード7より見
本文書の種類を示す情報を入力しその情報からファイル
装[9のアドレスを制御部2において決定する。以上の
登録モード処理はあらかじめ行っておくものとするが、
次に述べる識別モード処理と混在して行うことも可能で
ある。
次に識別モードにおける入力対象文書の処理について説
明する。入力文書の画像は見本文書と同様にメモリ51
の中に取り込まれ、その正規化画像がメモリ52に格納
される。入力文書の正規化画像から抽出された線パター
ンがメモリ54に格納される。制御部2により、見本文
書の線パターンが順次メモリ53に読みだされ、メモリ
54の入力文書の腺パターンと比較される。比較処理の
詳細については後述する。比較の結果入力文書と同一と
看做される見本文書の種類を示す番号が決定されるので
、この番号によって入力文書の格納アドレスを決定でき
る。たとえば、ディレクトリの中に文書の種類に対応す
る項目を設けておき、その項目の中の一つとして種内通
番を記録して。
この通番を1ずつ上げて行きアドレスと対応を取るなど
の方法がある。すなわち、種内通番は文書の管理情報と
して用いられる。
次に比較処理の詳細を全体の処理の流れの中で説明する
。第2図は、全体の処理の流れをPAD形式で示す流れ
図である。
201は各種の初期化であり、装置内部の初期化や、見
本文書の線パターンやディレクトリなどの各種情報をフ
ァイル装919から読みこむ処理もコニで行う、202
は登録モードか識別モードかの選択を行う、登録モード
の場合は203から207の処理を行う、203ではキ
ーボード7から登録しようとする文書の種類の識別番号
nをキーインする。204では、使用する見本文書を光
電変換装置4によりディジタルパターンに変換し見本文
書画像P(n)をメモリ5に格納する。この見本文書画
像P(n)は、必要に応じて正規化される。205では
、この見本文書から線パターンを特徴パターンE(n)
として抽出する。206では、キーボード7から付随情
報を入力しディレクトリを作成する。付随情報には年月
日、コメントなどがある。この見本文書に対する管理項
目を作り、ディレクトリ中のしかるべき箇所に登録する
207ではディレクトリの作成を行い、その結果定まる
アドレスにP(n)、E(n)、付随情報をファイル装
置9に書き出す。
202において読み取りモードが選択された場合、20
8から217の処理を行う。208では、入力すべき対
象文書の画像Pxをメモリ内にとりこむ。209ではP
xから線パターンExを抽出する。210は照合であり
、Exに対応する見本文書番号mを得る処理であり、2
11から215で構成される。211は既に登録されて
いる見本文書に関するループであってnはその文書め識
別番号、Nは既登録見本文書の個数である。212では
ExとE(n)の距離Dnを計算する。距離の代わりに
通常のパターン認識に用いられる類似度、尤度、相関係
数などを使用してよい。213では距離Dnの最小値を
与える識別番号mを求めている。211のループの終了
後214でDmが閾値θthより小さいか否かを判定し
ている。小さくない場合は、入力文書に対応する見本文
書が見付からなかった場合であり、215のリジェクト
処理を行う、リジェクト処理では、ディスプレイ8に既
登録見本文書の一覧表を表示し、その中から選択させた
り、あるいは既登録見本文書の中に該当するものがない
場合には登録モードを実行して見本文書を追加したりす
るなどの処理を行う。
216はアドレス計算とディレクトリの更新処理であり
、見本文書に対応する種内通番の作成、ファイル中のア
ドレスの計算と登録などを行う。
217は入力文書のファイル9への格納である。
218は終了処理であり、メモリ中のディレクトリをフ
ァイルに格納するなどの処理を含む。以上の説明では文
書とディレクトリとは同一のメモリに格納するとしたが
、たとえばディレクトリは磁気ディスク装置に文書は光
デイスク装置に格納するなど、別のメモリを使用しても
よい。
次に線パターン抽出処理の詳細を説明する。第3図は、
線パターンを抽出する処理をPAD形式で示す流れ図で
ある。線パターン抽出には水平線抽出と垂直線抽出とが
あるが、ここでは水平線抽出について述べ、垂直線抽出
については同様であるので省略する。第3図で301は
線抽出への入り口であり、メモリ52に格納されている
正規化画像Qが与えられる。302では303〜309
の処理を走査線番号jについて繰り返すことにより、黒
長連積分値A(j)を得る。303は初期化である。3
04は走査線の中の画素Q(i、j)が1かOかを判定
し、1の場合には306で黒の遮炎Bをカウントする。
Q(i、j)がOの場合には、307の判定によりその
前の画素までの遮炎Bが閾値ξより大きいとき、308
で積分処理を行い、309で遮炎Bをリセットする。ル
ープ終了後310で積分値A(j )にBを加えている
のは304以下のループでは最終点(i=I−1)にお
ける積分がなされていないからである。307の判定を
加えたことにより、−分長い黒の水平線分があるときの
みA(j )に積分が行われるので雑音の影響を受けに
くく、また文書上に記入されている文字・記号は短い線
分からなっているのでほとんど積分に寄与しない、31
1はこの処理の出口であり、長連積分値A(ベクトルパ
ターン)を出力に与え、メモリ53に格納する0以上の
説明から分かるように、パターンAは線分の存在を反映
したパターンになっており、これを線パターンと呼ぶ。
本実施例では、特徴パターンとして線パターンを用いる
ので、文書上の記入あるいは印刷された文字・記号など
がほとんど無視でき、文書の同一性の判定がより正確に
行える利点がある。
なお、特徴パターンとして線パターンを用いた場合、異
なる文書が同一の直線部を有しているときは区別ができ
ないが、このようなときは文書上の部分領域を指定して
その領域内での各種の特徴をとるとよい。
また上記の説明では見本文書の特徴パターンはあらかじ
めファイル9内に格納するとしたが、照合の都度計算す
るようにしてファイルに登録しない構成とすることも可
能である。
〔発明の効果〕
以上説明したごとく1本発明によれば格納すべき対象文
書の分類コードの決定を自動的に行うことが可能であり
、従来のように人間による検索キー情報の指定が不要と
なるので、文書の種類の一覧表を別に用意したり、ファ
イル内の文書をその都度参照したりする必要がなく、シ
かも誤りのない文書の登録が可能となる。
【図面の簡単な説明】 第1図は本発明のファイリング方式を実施する装置の構
成を示すブロック図、第2図は第1図の制御部における
処理を説明するための流れ図である・第3j」1ま疎ノ
ζター/偕ム鄭贈 乃着J1引V杉。 1・・・バス、2・・・制御部、3・・・文書、5・・
・メモリ。 茅2図 茅30

Claims (1)

  1. 【特許請求の範囲】 画像を光電変換する変換手段と、 該変換された複数の画像を格納する手段と、上記手段に
    該格納された画像からその画像に固有な部分を抽出し、
    あらかじめ格納された画像のいずれと同一種類であるか
    を識別する手段と、上記識別結果に基づいて、 上記入力画像を格納する手段とを有することを特徴とす
    るファイリング方式。
JP59196616A 1984-09-21 1984-09-21 フアイリング方式 Pending JPS6175477A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP59196616A JPS6175477A (ja) 1984-09-21 1984-09-21 フアイリング方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP59196616A JPS6175477A (ja) 1984-09-21 1984-09-21 フアイリング方式

Publications (1)

Publication Number Publication Date
JPS6175477A true JPS6175477A (ja) 1986-04-17

Family

ID=16360715

Family Applications (1)

Application Number Title Priority Date Filing Date
JP59196616A Pending JPS6175477A (ja) 1984-09-21 1984-09-21 フアイリング方式

Country Status (1)

Country Link
JP (1) JPS6175477A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07114616A (ja) * 1993-10-20 1995-05-02 Hitachi Ltd 伝票文書情報システム
JPH0991450A (ja) * 1995-07-17 1997-04-04 Toshiba Corp 文書処理装置および文書処理方法
US5799115A (en) * 1995-03-16 1998-08-25 Kabushiki Kaisha Toshiba Image filing apparatus and method
JP2009271831A (ja) * 2008-05-09 2009-11-19 Sharp Corp 画像データ処理装置

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5914070A (ja) * 1982-07-15 1984-01-24 Ricoh Co Ltd 画像フアイル方式

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5914070A (ja) * 1982-07-15 1984-01-24 Ricoh Co Ltd 画像フアイル方式

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07114616A (ja) * 1993-10-20 1995-05-02 Hitachi Ltd 伝票文書情報システム
US5799115A (en) * 1995-03-16 1998-08-25 Kabushiki Kaisha Toshiba Image filing apparatus and method
JPH0991450A (ja) * 1995-07-17 1997-04-04 Toshiba Corp 文書処理装置および文書処理方法
JP2009271831A (ja) * 2008-05-09 2009-11-19 Sharp Corp 画像データ処理装置

Similar Documents

Publication Publication Date Title
US7277584B2 (en) Form recognition system, form recognition method, program and storage medium
JP3602596B2 (ja) ドキュメントファイリング装置および方法
CN108304815A (zh) 一种数据获取方法、装置、服务器及存储介质
JPS6140684A (ja) 輪郭追跡装置
JP6574920B1 (ja) 画像処理システム、画像処理方法、及びプログラム
JP6574921B1 (ja) 画像処理システム、画像処理方法、及びプログラム
JPS6175477A (ja) フアイリング方式
CN106055693A (zh) 一种信息处理方法及终端
CN110135412B (zh) 名片识别方法和装置
US11657632B2 (en) Image processing device, image reading device, image processing method, and non-transitory computer readable medium, using two pieces of image data
JP3090070B2 (ja) 帳票識別方法及び装置
JPH11296676A (ja) 画像データ分類方法および画像データ登録方法
JP2003316802A (ja) イメージ管理システム、イメージ管理方法及びイメージ管理プログラム
JPH03269780A (ja) 指紋データの2値化方法
JP2788529B2 (ja) 指紋照合装置の辞書登録方法
JP2899119B2 (ja) 指紋照合装置
Jamal et al. Fingerprint and Qr Code Based Authentication System at Pusat Servis Komputer JB
JPS60221882A (ja) 本人照合方式
JPS6222186A (ja) 図面読取り装置
JP2818317B2 (ja) 指紋登録照合方法
Poindxter Using the Longest Common Subsequence Algorithm to Identify Steganography Signatures
JP2828820B2 (ja) 指紋照合装置
JP3503562B2 (ja) ファクシミリ装置
JP3272381B2 (ja) 領域境界点抽出方法
CN116310948A (zh) 宕机录像的处理方法、装置、电子设备及存储介质