JPH05143707A - 符号化画像データの処理方法および装置 - Google Patents

符号化画像データの処理方法および装置

Info

Publication number
JPH05143707A
JPH05143707A JP3307375A JP30737591A JPH05143707A JP H05143707 A JPH05143707 A JP H05143707A JP 3307375 A JP3307375 A JP 3307375A JP 30737591 A JP30737591 A JP 30737591A JP H05143707 A JPH05143707 A JP H05143707A
Authority
JP
Japan
Prior art keywords
image data
coded image
coded
document
processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP3307375A
Other languages
English (en)
Other versions
JP3191057B2 (ja
Inventor
Hirotoshi Ise
広敏 伊勢
Yoshihito Ohara
義仁 大原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP30737591A priority Critical patent/JP3191057B2/ja
Publication of JPH05143707A publication Critical patent/JPH05143707A/ja
Priority to US08/502,270 priority patent/US5563966A/en
Application granted granted Critical
Publication of JP3191057B2 publication Critical patent/JP3191057B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/21Intermediate information storage
    • H04N1/2166Intermediate information storage for mass storage, e.g. in document filing systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Processing Or Creating Images (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)
  • Image Processing (AREA)

Abstract

(57)【要約】 【目的】 複数の文書を含む符号化文書画像データを分
類して登録する処理を高速化する。 【構成】 符号化画像データをページ単位で順に入力
し、入力された符号化画像データの一つのページに所定
の符号化セパレータパターンが含まれているかを符号化
画像データのままで調査し、含まれていればそのページ
をセパレータシートの符号化画像データであると識別
し、含まれていなければそのページを文書の符号化画像
データであると識別し、セパレータシートの前の文書と
後の文書とを別の分類として登録する。 【効果】 符号化された文書の画像データを復号化する
ことなく分類できるため、異なる分類にするべき複数の
文書をファクシミリ等からでも高速で電子画像ファイル
システムに登録できる。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、符号化画像データの処
理方法および装置に関し、さらに詳しくは、異なる分類
にするべき複数の文書を含む符号化画像データの処理方
法および装置に関する。
【0002】
【従来の技術】近年、大容量の電子画像ファイルシステ
ムを利用した文書管理が広く行われつつある。このよう
な電子画像ファイルシステムに文書を登録する場合、ス
キャナなどの画像読取入力手段を用いて文書画像データ
を読取入力する。分類して管理したい複数の文書を一括
して登録する場合は、異なる分類となる文書間に所定の
画像パターン(以下、セパレータパターンという)を持
った原稿(以下、セパレータシートという)を挿入して
おき、例えば特開昭61−248169号公報に開示さ
れているような画像情報処理装置を用いて複数の文書を
連続して読取入力する。このとき画像情報処理装置は、
前記セパレータパターンを検出し、その前後の文書画像
データに異なる管理情報を割り当てるので、各文書画像
データを分類して電子画像ファイルシステムに登録でき
るようになる。
【0003】
【発明が解決しようとする課題】電子画像ファイルシス
テムに文書を登録するのに文書画像データをファクシミ
リから入力することが考えられるが、この場合、文書画
像データは、MH,MR,MMRなどの方式で符号(圧
縮)化されている。また、読み取った画像を圧縮して出
力する圧縮型スキャナを用いる場合も、文書画像データ
は符号化されている。さらに、ネットワークを経由して
通信により遠隔から文書画像データを入力したい場合が
あるが、この場合も文書画像データは符号化されてい
る。
【0004】しかし、上記特開昭61−248169号
公報に開示されている画像情報処理装置では、符号化さ
れている文書画像データからセパレータパターンを直に
検出することは考慮されていないため、その符号化され
ている文書画像データを復号化してからセパレータパタ
ーンを検出する必要があり、処理時間がかかる問題点が
ある。
【0005】そこで、本発明の目的は、符号化されてい
る文書画像データでも短時間に分類することが出来るよ
うにした符号化画像データの処理方法および装置を提供
することにある。
【0006】
【課題を解決するための手段】本発明は、符号化画像デ
ータを所定の単位で順に入力し、入力された符号化画像
データの一つの単位に所定の符号化セパレータパターン
が含まれているかを符号化画像データのままで調査し、
含まれていればその符号化画像データの単位をセパレー
タシートの符号化画像データであると識別し、含まれて
いなければその符号化画像データの単位を文書の符号化
画像データであると識別し、セパレータシートの前の文
書と後の文書とを別の分類とすることを特徴とする符号
化画像データの処理方法を提供する。
【0007】また、本発明は、符号化画像データを所定
の単位で順に入力する符号化画像データ入力手段と、入
力された符号化画像データの一つの単位に所定の符号化
セパレータパターンが含まれているかを符号化画像デー
タのままで調査する符号化セパレータパターン調査手段
と、含まれていればその符号化画像データの単位をセパ
レータシートの符号化画像データであると識別し含まれ
ていなければその符号化画像データの単位を文書の符号
化画像データであると識別しセパレータシートの前の文
書と後の文書とを別の分類とする識別分類手段と、文書
の符号化画像データを分類に応じて格納する大容量記憶
手段とを具備したことを特徴とする符号化画像データの
処理装置を提供する。
【0008】
【作用】本発明の符号化画像データの処理方法では、入
力された符号化画像データの一つの単位に所定の符号化
セパレータパターンが含まれているかを符号化画像デー
タのままで調査して、その符号化画像データの単位がセ
パレータシートか文書かを識別する。そこで、符号化さ
れた文書の画像データを復号化することなく分類できる
ため、異なる分類にするべき複数の文書をファクシミリ
等からでも高速で電子画像ファイルシステムに登録でき
るようになる。
【0009】本発明の符号化画像データの処理装置で
は、上記符号化画像データの処理方法を利用して、異な
る分類にするべき複数の文書を高速で大容量記憶手段に
格納するから、ファクシミリ等を文書の入力装置として
好適に利用できるようになる。
【0010】
【実施例】以下、本発明の実施例を、図面を参照して、
詳細に説明する。なお、これにより本発明が限定される
ものではない。
【0011】(実施例1)実施例1は、複数の文書が間
にセパレータシートを挿入されて一括入力され、これを
電子画像ファイルシステムが分離し、別の文書ファイル
として登録/管理する例である。
【0012】図1は、本発明の符号化画像データの処理
方法を利用して、異なる分類にすべき複数文書を電子画
像ファイルシステムに一括登録する手順を示している。
【0013】文書D11とD12、文書D21、文書D
31とD32は、それぞれ異なる分類にすべき文書であ
る。そこで、文書D12と文書D21の間および文書D
21と文書D31の間に、それぞれセパレータシートS
01およびセパレータシートS02を挿入し、例えばフ
ァクシミリに連続して読み取らせる。セパレータシート
S01およびセパレータシートS02には、所定のセパ
レータパターンSMが印刷されている。
【0014】すると、ファクシミリ中の画像データ符号
化処理ICにより、連続したページの符号化画像データ
C1〜C7が得られる。セパレータシートS01および
セパレータシートS02に対応する符号化画像データC
3および符号化画像データC5は、セパレータパターン
SMに対応する符号化セパレータパターンCMが含まれ
ている。この符号化セパレータパターンCMは、文書1
1,D12,D21,D31,D32に対応する符号化
画像データC1,C2,C4,C6,C7には現れない
ようなパターンである。換言すれば、その条件を満たす
ようにセパレータシートS01,セパレータシートS0
2におけるセパレータパターンSMを決定しておく。
【0015】符号化画像データC1〜C7を入力する
と、符号化画像データ分類処理CCは、符号化セパレー
タパターンCMを含まない符号化画像データC1,C2
が連続するから、これらを同一分類の文書のデータと識
別する。また、符号化セパレータパターンCMを含む符
号化画像データC3が現れるから、この前後を異なる分
類の文書のデータと識別し、符号化セパレータパターン
CMを含まない符号化画像データC4を第2の分類の文
書のデータと識別する。さらに、符号化セパレータパタ
ーンCMを含む符号化画像データC5が現れるから、こ
の前後を異なる分類の文書のデータと識別し、符号化セ
パレータパターンCMを含まない符号化画像データC6
を第3の分類の文書のデータと識別する。また、符号化
セパレータパターンCMを含まない符号化画像データC
7が続くから、それは第3の分類の文書のデータと識別
する。かくして、符号化画像データC1〜C7は、符号
化されたままで分類される。
【0016】そこで、電子画像ファイルシステムは、符
号化画像データC1,C2と、符号化画像データC4
と、符号化画像データC6,C7とから、それぞれ異な
る分類の文書ファイルを作成し、登録し、管理すること
が出来る。
【0017】上記手順で符号化画像データを分類/登録
/管理する電子画像ファイルシステムの一構成例を図2
に示す。この電子画像ファイルシステム1において、1
1は、キーボードであり、コマンドの入力等に使用す
る。12は、CPUであり、システム全体を制御する。
13は、ディスプレイであり、文書やセパレータシート
の画像の目視確認等に利用する。14は、ディスプレイ
コントローラであり、ディスプレイ13を制御する。
【0018】15は、復号(伸長)プロセッサであり、
符号化画像データを復号し、画像データ(ドットデー
タ)を復元する。
【0019】16は、制御用メモリであり、全体制御部
16−1と,符号化画像データ入力部16−2と,文書
管理部16−3と,セパレータシート識別部16−4と
から構成される。全体制御部16−1は、本発明にかか
る符号化画像データの処理方法を実行するためのメイン
プログラムを格納する。符号化画像データ入力部16−
2は、符号化画像データの入力を実行するプログラムを
格納する。文書管理部16−3は、文書ファイル生成,
文書ファイル登録,文書ファイルクローズ等の文書ファ
イルの管理を実行するプログラムを格納する。セパレー
タシート識別部16−4は、入力された符号化画像デー
タに含まれるセパレータシート対応ページを検出するプ
ログラムを格納する。
【0020】17は、データ用メモリであり、符号化画
像データが一時的に格納される符号化画像データバッフ
ァ17−1と,復元した画像データを一時的に格納する
画像データ格納領域17−2とから構成される。
【0021】18は、光ディスク装置であり、分類され
た符号化画像データをそれぞれ文書ファイルとして格納
する。19は、光ディスク装置コントローラであり、光
ディスク装置18を制御する。
【0022】20は、符号化画像データ取込インタフェ
ースであり、ファクシミリや圧縮型スキャナや通信回線
から符号化画像データを取り込む。
【0023】図3は、上記電子画像ファイルシステム1
による符号化画像データ分類および登録処理のフロー図
である。これら処理は、全体制御部16−1,符号化画
像データ入力部16−2,文書管理部16−3,セパレ
ータシート識別部16−4により実行される。ステップ
100では、符号化画像データ取込インタフェース20
を介して符号化画像データバッファ17−1に符号化画
像データをページ単位で入力する。なお、ここで入力す
る符号化画像データは、図1のC1〜C7の各ページに
相当するものである。
【0024】ステップ102では、入力された符号化画
像データが先頭ページであるかどうか判別し、先頭ペー
ジであればステップ104に進み、先頭ページでなけれ
ばステップ106に進む。なお、実施例1では、セパレ
ータシートは必ず文書と文書の間に挿入するので、先頭
ページはセパレータシートに対応する符号化画像データ
ではない。ステップ104では、新規の分類で文書ファ
イルを作成する。ステップ106では、入力された符号
化画像データがセパレータシートであるか文書であるか
を識別する。このセパレータシート識別処理の詳細な流
れを図4に示す。
【0025】図4において、ステップ120では、符号
化セパレータパターン(図1のCM)が存在する判別領
域内の符号化画像データを調査する。この符号化画像デ
ータ調査処理の詳細な流れを図5に示す。
【0026】図5は、符号化画像データ調査処理とし
て、当該ページにおけるMR符号の各モードの出現頻度
を調査する例を示す。ステップ140では、画像ポイン
タPを初期化する。また、MR符号の各モード(VOモ
ード〜VL3モード)に対応する出現頻度カウンタN
(i)(i=1〜9)を<0>に初期化する。
【0027】ステップ142では、画像ポインタPの内
容がV0モードであるかチェックし、V0モードである
場合には、ステップ160で、V0モードに対応する出
現頻度カウンタN(1)を<1>だけ増加する。同様
に、ステップ144,146では、VR1モード,VL
1モードのチェックを行い、各モードである場合には、
ステップ162,164で、出現頻度カウンタN
(2),N(3)を<1>だけ増加する。
【0028】ステップ148では、H(水平)モードの
チェックを行い、Hモードの場合には、ステップ166
で、Hモード処理を行う。このHモード処理の詳細な流
れを図6に示す。
【0029】図6において、ステップ200では、出現
頻度カウンタN(4)を<1>だけ増加する。ステップ
202では、ランカウンタポインタjを<1>に初期化
する。ステップ204では、画像ポインタPの内容が表
すランが黒ランであるか否か判別し、黒ランである場合
はステップ206に進み、黒ランでない場合はステップ
208に進む。ステップ206では、ランカウンタRU
N(j)に黒ラン長を代入する。ステップ208では、
ランカウンタRUN(j)に白ラン長を代入する。ステ
ップ210では、ランカウンタRUN(j)をランの色
と長さごとに頻度分布を算出し、リターンする。
【0030】図5に戻り、ステップ150では、画像ポ
インタPの内容がP(パス)モードであるかチェック
し、Pモードである場合には、ステップ168で、Pモ
ードに対応する出現頻度カウンタN(5)を<1>だけ
増加する。同様に、ステップ152,154,156,
158では、VR2モード,VL2モード,VR3モー
ド,VL3モードのチェックを行い、各モードである場
合には、ステップ170,172,174,176で、
それぞれ出現頻度カウンタN(6)〜N(9)を<1>
だけ増加する。
【0031】画像ポインタPの内容が、どのモードにも
対応しない場合には、エラーリターンする。ステップ1
78では、判別領域に関して調査が終了したかチェック
し、終了していない場合にはステップ180に進み、終
了した場合にはリターンする。ステップ180では、画
像ポインタPを更新し、前記ステップ142に戻る。
【0032】ここで、MR符号を利用して文書と識別可
能にしたセパレータシートの例を図7,図8に示す。図
7は、汎用のセパレータシートの例であり、20−1
は、セパレータパターン22−1が印刷された領域であ
る。22−2は、セパレータパターン22−1の拡大で
あり、斜線部分は、黒画素を表す。このセパレータパタ
ーン22−1が、傾き,ノイズなどがなく、図7に示し
た状態で入力された場合には、最初にHモードが出現
し、領域20−1ではV0モードは出現しない特性をも
つ。従って、MR符号の各モードの出現頻度を調査する
ことによりセパレータシートを識別することが出来る。
また、傾き,ノイズなどがある場合にも、領域20−1
全体にわたってMR符号の各モードの出現頻度を調査す
ることによりセパレータシートを識別することが出来
る。図8は、入力する文書における余白領域が確定して
いる場合のセパレータシートの例であり、その余白領域
31−1にセパレータパターンを記入したものがセパレ
ータシートとなる。31−2は、余白領域31−1の拡
大であり、セパレータパターンとして文字列「セパレー
タ」が記入されている。
【0033】図4に戻り、ステップ124では、符号化
画像データ調査の結果によりセパレータシートを識別可
能かチェックする。識別可能ならステップ126に進
み、識別可能でなければステップ132に進む。
【0034】ステップ126では、符号化画像データ調
査の結果がセパレータシートか文書かをチェックし、セ
パレータシートならステップ128に進み、文書ならス
テップ130に進む。
【0035】ステップ128では、識別結果をセパレー
タシートとしてリターンする。ステップ130では、識
別結果を文書としてリターンする。
【0036】ステップ132では、復号プロセッサ15
により符号化画像データから画像データを復元し、画像
データ格納領域17−2に格納する。ステップ134で
は、復元した画像データにより当該ページの画像をディ
スプレイ13に表示する。ステップ136では、ディス
プレイ13に表示された画像をユーザが目視によりチェ
ックし、セパレータシートか文書かをキーボード11か
ら指示する。そして、セパレータシートなら前記ステッ
プ128に進み、文書なら前記ステップ130に進む。
【0037】図3に戻り、ステップ108では、セパレ
ータシート識別処理の結果の結果がセパレータシートか
否かチェックし、セパレータシートでない場合にはステ
ップ110に進み、セパレータシートである場合にはス
テップ116に進む。
【0038】ステップ110では、当該ページの符号化
画像データを、開いている文書ファイルに登録する。ス
テップ112では、符号化画像データの末尾ページの登
録が終了したかチェックし、終了していない場合には前
記ステップ100に戻り、終了した場合にはステップ1
14に進む。ステップ114では、開いている文書ファ
イルを閉じ、終了する。
【0039】ステップ116では、開いている文書ファ
イルを閉じる。ステップ118では、新たな分類の文書
ファイルを作成し、前記ステップ100に戻る。
【0040】以上の処理により、一括入力された符号化
画像データを、符号化されたまま分離し、各文書ファイ
ルに登録し、管理することが出来る。
【0041】(実施例2)実施例2は、インデクスを付
加して文書ファイルを登録/管理する例である。インデ
クス情報は、文書の先頭のタイトルページに記述される
か又はセパレータシートに記述される。図9に、インデ
クス情報を記述したセパレータシートを例示する。これ
は、図7のセパレータシートに、手書き文字枠フィール
ド21を付加したもので、この手書き文字枠フィールド
21に、インデクスのコードを記入する。
【0042】実施例2における電子画像ファイルシステ
ムの一構成例を図10に示す。この電子画像ファイルシ
ステム1Aは、図2の電子画像ファイルシステム1と同
様の構成であるが、次の構成が異なっている。キーボー
ド11は、インデクスの修正のためのコードの入力にも
使用する。ディスプレイ13は、インデクスのコードの
確認,修正にも利用する。データ用メモリ17は、イン
デクスのコードを格納するコードデータ格納領域17−
3をも有している。光ディスク装置18は、インデクス
を付加して文書ファイルを格納する。
【0043】図11に、インデクスを付加した文書ファ
イルの構成を示す。40は、インデクスフィールドであ
り、インデクスのコードを格納する。41は、ページ数
フィールドであり、この文書ファイルを構成する符号化
画像データのページ数Nを格納する。42−i(i=1
〜N)は、先頭アドレスフィールドであり、iページ目
の符号化画像データを記憶したメモリ領域の先頭アドレ
スを格納する。42−i(i=1〜N)は、領域サイズ
フィールドであり、iページ目の符号化画像データを記
憶したメモリ領域の大きさを格納する。
【0044】図12は、上記電子画像ファイルシステム
1Aによる符号化画像データ分類および登録処理のフロ
ー図である。ステップ300では、符号化画像データ取
込インタフェース20を介して符号化画像データバッフ
ァ17−1に符号化画像データをページ単位で入力す
る。なお、実施例2では、セパレータシートは、文書と
文書の間に挿入するだけでなく、先頭ページに置いても
よい(置かなくてもよい)。また、各文書の最初のペー
ジまたはその前に置くセパレータシートにインデクス情
報を記述しておく必要がある。
【0045】ステップ302では、セパレータシート識
別処理を行う。これは図4〜図6で示した処理である。
ステップ304では、セパレータシート識別処理の結果
の結果がセパレータシートか否かチェックし、セパレー
タシートでない場合にはステップ314に進み、セパレ
ータシートである場合にはステップ306に進む。
【0046】ステップ306では、入力された符号化画
像データが先頭ページであるかどうか判別し、先頭ペー
ジでなければステップ308に進み、先頭ページであれ
ばステップ310に進む。ステップ308では、開いて
いる文書ファイルを閉じる。ステップ310では、イン
デクス作成処理を行う。このインデクス作成処理の詳細
を図13に示す。
【0047】図13において、ステップ340では、符
号化画像データのままでインデクスのコードを認識可能
かチェックする。認識可能な場合にはステップ342に
進み、認識不可能な場合にはステップ346に進む。
【0048】ステップ342では、符号化画像データか
らコードを認識する。この方法としては、例えば、符号
化画像データを符号単位に分解し、各符号単位の出現頻
度から認識する方法がある。ステップ344では、文字
パターン,単語辞書などのインデクス作成辞書を利用し
て、コードをインデクスに変換し、リターンする。ステ
ップ346では、復号プロセッサ15により符号化画像
データからインデクス情報記述部分の画像データを復元
し、画像データ格納領域17−2に格納する。ステップ
350では、復元した画像データからコードを認識す
る。この方法としては、例えば、辞書に登録された文字
パターンと,認識対象の文字パターンをパターンマッチ
ングし、類似度を算出する方法がある。この場合、イン
デクスとして利用する可能性が高い単語を登録した単語
辞書を利用することにより、認識精度を向上できる。ス
テップ352では、コードをインデクスに変換し、リタ
ーンする。
【0049】図12に戻り、ステップ312では、イン
デクスを利用して、新たな分類の文書ファイルを作成す
る。そして、前記ステップ300に戻る。
【0050】一方、ステップ316では、当該ページ
が、タイトルページかチェックする。いずれの文書ファ
イルも開かれていなければ、タイトルページである。い
ずれかの文書ファイルが開かれていれば、タイトルペー
ジではない。タイトルページならステップ318に進
み、タイトルページでなければステップ322に進む。
【0051】ステップ318では、インデクス作成処理
を行う。このインデクス作成処理の詳細を図14に示
す。
【0052】図14において、ステップ330では、復
号プロセッサ15により符号化画像データからインデク
ス情報記述部分の画像データを復元し、画像データ格納
領域17−2に格納する。ステップ334では、前記ス
テップ350と同様にして、復元した画像データに含ま
れるコードを認識する。ステップ336では、コードを
インデクスに変換し、リターンする。
【0053】図12に戻り、ステップ320では、イン
デクスを利用して、新たな分類の文書ファイルを作成す
る。ステップ322では、当該ページの符号化画像デー
タを、開いている文書ファイルに登録する。ステップ3
24では、符号化画像データの末尾ページの登録が終了
したかチェックし、終了していない場合には前記ステッ
プ300に戻り、終了した場合にはステップ326に進
む。ステップ326では、開いている文書ファイルを閉
じ、終了する。
【0054】以上の処理により、一括入力された符号化
画像データを、符号化されたまま分離し、インデクスを
付加して各文書ファイルに登録し、管理することが出来
る。
【0055】(他の実施例)上記実施例1,実施例2で
は、文書の符号化画像データだけを登録/管理したが、
セパレータシートの符号化画像データをも独立に又は文
書と共に登録/管理してもよい。
【0056】また、上記実施例2では、コードからイン
デクスを作成したが、図形からインデクスを作成するよ
うにしてもよい。
【0057】また、上記実施例2では、インデクス情報
の画像データからインデクスを作成したが、ISDNの
Bチャネルで符号化画像データを受信し,Dチャネルで
インデクス情報を受信し、その受信したインデクス情報
からインデクスを作成してもよい。
【0058】
【発明の効果】本発明の符号化画像データの処理方法に
よれば、ファクシミリで伝送された符号化画像データな
どを復号せずに分類できるため、処理を高速化できる。
従って、電子画像ファイルシステムにおける画像データ
の登録作業全体の高速化が可能となる。
【0059】本発明の符号化画像データの処理装置によ
れば、符号化画像データを高速に分類し登録できるた
め、ファクシミリや,圧縮型スキャナや,通信回線など
を画像の入力装置として好適に利用できるようになる。
【図面の簡単な説明】
【図1】本発明の符号化画像データの処理方法の概要を
表す説明図である。
【図2】本発明の符号化画像データの処理方法を利用し
た電子画像ファイルシステムの一例のブロック図であ
る。
【図3】図2の電子画像ファイルシステムの処理のフロ
ー図である。
【図4】セパレータシート識別処理のフロー図である。
【図5】符号化画像データ調査処理のフロー図である。
【図6】Hモード処理の流れ図である。
【図7】セパレータシートの例示図である。
【図8】セパレータシートの別の例示図である。
【図9】インデクス情報を含むセパレータシートの例示
図である。
【図10】本発明の符号化画像データの処理方法を利用
した電子画像ファイルシステムの他の一例のブロック図
である。
【図11】インデクスを付加した符号化画像データの形
式図である。
【図12】図10の電子画像ファイルシステムの処理の
フロー図である。
【図13】インデクス作成処理のフロー図である。
【図14】インデクス作成処理の別のフロー図である。
【符号の説明】
D11〜D32 文書 S01,S02 セパレータシート SM セパレータパターン C1〜C7 符号化画像データ CM 符号化セパレータパターン CC 符号化画像データ分類処理 1 電子画像ファイルシステム 1A 電子画像ファイルシステム

Claims (13)

    【特許請求の範囲】
  1. 【請求項1】 符号化画像データを所定の単位で順に入
    力し、入力された符号化画像データの単位に所定の符号
    化セパレータパターンが含まれているかを符号化画像デ
    ータのままで調査し、含まれていればその符号化画像デ
    ータの単位をセパレータシートの符号化画像データであ
    ると識別することを特徴とする符号化画像データの処理
    方法。
  2. 【請求項2】 符号化画像データを所定の単位で順に入
    力し、入力された符号化画像データの単位に所定の符号
    化セパレータパターンが含まれているかを符号化画像デ
    ータのままで調査し、含まれていればその符号化画像デ
    ータの単位の前の符号化画像データの単位と後の符号化
    画像データの単位とを別の分類とすることを特徴とする
    符号化画像データの処理方法。
  3. 【請求項3】 符号化画像データを所定の単位で順に入
    力し、入力された符号化画像データの一つの単位に所定
    の符号化セパレータパターンが含まれているかを符号化
    画像データのままで調査し、含まれていればその符号化
    画像データの単位をセパレータシートの符号化画像デー
    タであると識別し、含まれていなければその符号化画像
    データの単位を文書の符号化画像データであると識別
    し、セパレータシートの前の文書と後の文書とを別の分
    類とすることを特徴とする符号化画像データの処理方
    法。
  4. 【請求項4】 請求項1から請求項3のいずれかに記載
    の符号化画像データの処理方法において、符号化画像デ
    ータが、MH符号,MR符号,MMR符号のいずれかの
    符号を用いて符号化されたものであることを特徴とする
    符号化画像データの処理方法。
  5. 【請求項5】 請求項1から請求項4のいずれかに記載
    の符号化画像データの処理方法において、文書に出現す
    る確率が小さいマークまたは複数の前記マークの組合せ
    を利用して符号化セパレータパターンを構成することを
    特徴とする符号化画像データの処理方法。
  6. 【請求項6】 請求項1から請求項4のいずれかに記載
    の符号化画像データの処理方法において、文書の余白を
    符号化したときに出現する符号と異なる符号を利用して
    符号化セパレータパターンを構成することを特徴とする
    符号化画像データの処理方法。
  7. 【請求項7】 請求項1から請求項4のいずれかに記載
    の符号化画像データの処理方法において、文書の符号化
    画像データに出現する符号の各モードの頻度分布と異な
    る頻度分布を与えるように符号化セパレータパターンを
    構成することを特徴とする符号化画像データの処理方
    法。
  8. 【請求項8】 請求項1から請求項7のいずれかに記載
    の符号化画像データの処理方法において、符号化画像デ
    ータが、ファクシミリから出力された符号化画像データ
    であることを特徴とする符号化画像データの処理方法。
  9. 【請求項9】 請求項3から請求項8のいずれかに記載
    の符号化画像データの処理方法において、文書の符号化
    画像データを、分類に応じて、大容量記憶装置に格納す
    ることを特徴とする符号化画像データの処理方法。
  10. 【請求項10】 請求項9に記載の符号化画像データの
    処理方法において、符号化画像データがISDNのBチ
    ャネルから出力された符号化画像データであり、文書の
    符号化画像データを分類に応じて大容量記憶装置に格納
    する際に、ISDNのDチャネルから出力されたインデ
    クス情報からインデクスを作成し、そのインデクスを各
    分類に付加することを特徴とする符号化画像データの処
    理方法。
  11. 【請求項11】 MH符号,MR符号,MMR符号など
    画像のラン状態を符号化する符号化画像データを符号単
    位に分解し、所定の符号単位の出現頻度を調査し、その
    調査結果から符号化画像データに含まれる文字,図形,
    記号を認識することを特徴とする符号化画像データの処
    理方法。
  12. 【請求項12】 符号化画像データを所定の単位で順に
    入力する符号化画像データ入力手段と、入力された符号
    化画像データの一つの単位に所定の符号化セパレータパ
    ターンが含まれているかを符号化画像データのままで調
    査する符号化セパレータパターン調査手段と、含まれて
    いればその符号化画像データの単位をセパレータシート
    の符号化画像データであると識別し含まれていなければ
    その符号化画像データの単位を文書の符号化画像データ
    であると識別しセパレータシートの前の文書と後の文書
    とを別の分類とする識別分類手段と、文書の符号化画像
    データを分類に応じて格納する大容量記憶手段とを具備
    したことを特徴とする符号化画像データの処理装置。
  13. 【請求項13】 請求項12に記載の符号化画像データ
    の処理装置において、符号化画像データに含まれている
    文字,図形,記号を符号化画像データのままで認識する
    文字等認識手段と、その文字等認識手段により認識した
    結果からインデクスを作成するインデクス作成手段と、
    そのインデクスを各分類に付加するインデクス付加手段
    を具備したことを特徴とする符号化画像データの処理装
    置。
JP30737591A 1991-11-22 1991-11-22 符号化画像データの処理方法および装置 Expired - Fee Related JP3191057B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP30737591A JP3191057B2 (ja) 1991-11-22 1991-11-22 符号化画像データの処理方法および装置
US08/502,270 US5563966A (en) 1991-11-22 1995-07-13 Method and apparatus for processing coded image data

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP30737591A JP3191057B2 (ja) 1991-11-22 1991-11-22 符号化画像データの処理方法および装置

Publications (2)

Publication Number Publication Date
JPH05143707A true JPH05143707A (ja) 1993-06-11
JP3191057B2 JP3191057B2 (ja) 2001-07-23

Family

ID=17968306

Family Applications (1)

Application Number Title Priority Date Filing Date
JP30737591A Expired - Fee Related JP3191057B2 (ja) 1991-11-22 1991-11-22 符号化画像データの処理方法および装置

Country Status (2)

Country Link
US (1) US5563966A (ja)
JP (1) JP3191057B2 (ja)

Families Citing this family (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3093493B2 (ja) * 1992-11-16 2000-10-03 キヤノン株式会社 画像記憶検索装置
US6137905A (en) * 1995-08-31 2000-10-24 Canon Kabushiki Kaisha System for discriminating document orientation
US7312903B2 (en) * 2003-03-31 2007-12-25 Toshiba Corporation Scan job size
US20090080030A1 (en) * 2003-07-25 2009-03-26 Hubin Jiang Imaging system and business methodology
US8693043B2 (en) * 2003-12-19 2014-04-08 Kofax, Inc. Automatic document separation
KR100634008B1 (ko) * 2004-11-12 2006-10-16 엘지전자 주식회사 이미지 데이터의 디코딩장치 및 방법
US9137417B2 (en) 2005-03-24 2015-09-15 Kofax, Inc. Systems and methods for processing video data
US9769354B2 (en) 2005-03-24 2017-09-19 Kofax, Inc. Systems and methods of processing scanned data
JP4793429B2 (ja) * 2008-12-03 2011-10-12 富士ゼロックス株式会社 画像処理装置及び画像処理プログラム
US8774516B2 (en) 2009-02-10 2014-07-08 Kofax, Inc. Systems, methods and computer program products for determining document validity
US8958605B2 (en) 2009-02-10 2015-02-17 Kofax, Inc. Systems, methods and computer program products for determining document validity
US9576272B2 (en) 2009-02-10 2017-02-21 Kofax, Inc. Systems, methods and computer program products for determining document validity
US9767354B2 (en) 2009-02-10 2017-09-19 Kofax, Inc. Global geographic information retrieval, validation, and normalization
US9349046B2 (en) 2009-02-10 2016-05-24 Kofax, Inc. Smart optical input/output (I/O) extension for context-dependent workflows
US7885011B1 (en) 2009-08-19 2011-02-08 General Electric Company Objective for optical imaging systems
US8169696B2 (en) * 2009-06-04 2012-05-01 General Electric Company Systems for intraoperative nerve imaging
US9483794B2 (en) 2012-01-12 2016-11-01 Kofax, Inc. Systems and methods for identification document processing and business workflow integration
US9058580B1 (en) 2012-01-12 2015-06-16 Kofax, Inc. Systems and methods for identification document processing and business workflow integration
US8855375B2 (en) 2012-01-12 2014-10-07 Kofax, Inc. Systems and methods for mobile image capture and processing
US10146795B2 (en) 2012-01-12 2018-12-04 Kofax, Inc. Systems and methods for mobile image capture and processing
US9058515B1 (en) 2012-01-12 2015-06-16 Kofax, Inc. Systems and methods for identification document processing and business workflow integration
US9208536B2 (en) 2013-09-27 2015-12-08 Kofax, Inc. Systems and methods for three dimensional geometric reconstruction of captured image data
US9311531B2 (en) 2013-03-13 2016-04-12 Kofax, Inc. Systems and methods for classifying objects in digital images captured using mobile devices
US9355312B2 (en) 2013-03-13 2016-05-31 Kofax, Inc. Systems and methods for classifying objects in digital images captured using mobile devices
US20140316841A1 (en) 2013-04-23 2014-10-23 Kofax, Inc. Location-based workflows and services
JP2016518790A (ja) 2013-05-03 2016-06-23 コファックス, インコーポレイテッド モバイル装置を用いて取込まれたビデオにおけるオブジェクトを検出および分類するためのシステムおよび方法
WO2015073920A1 (en) 2013-11-15 2015-05-21 Kofax, Inc. Systems and methods for generating composite images of long documents using mobile video data
TWI536798B (zh) * 2014-08-11 2016-06-01 虹光精密工業股份有限公司 影像分檔方法
US9760788B2 (en) 2014-10-30 2017-09-12 Kofax, Inc. Mobile document detection and orientation based on reference object characteristics
US10242285B2 (en) 2015-07-20 2019-03-26 Kofax, Inc. Iterative recognition-guided thresholding and data extraction
US9779296B1 (en) 2016-04-01 2017-10-03 Kofax, Inc. Content-based detection and three dimensional geometric reconstruction of objects in image and video data
US11062176B2 (en) 2017-11-30 2021-07-13 Kofax, Inc. Object detection and image cropping using a multi-detector approach

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4408181A (en) * 1979-04-10 1983-10-04 Tokyo Shibaura Denki Kabushiki Kaisha Document data filing/retrieval system
US4352012A (en) * 1980-02-22 1982-09-28 Verderber Joseph A Header sheet for image communications system
US4553261A (en) * 1983-05-31 1985-11-12 Horst Froessl Document and data handling and retrieval system
JPS61248169A (ja) * 1985-04-26 1986-11-05 Canon Inc 画像情報処理装置
US4757348A (en) * 1986-11-17 1988-07-12 Xerox Corporation High speed electronic reprographic/printing machine
US4941170A (en) * 1989-03-20 1990-07-10 Tandem Computers Incorporated Facsimile transmissions system
US5161037A (en) * 1990-10-10 1992-11-03 Fuji Xerox Corporation, Ltd. Image processing system and method for processing documents in accordance with a job control sheet
US5247591A (en) * 1990-10-10 1993-09-21 Interfax, Inc. Method and apparatus for the primary and secondary routing of fax mesages using hand printed characters
US5227893A (en) * 1990-10-31 1993-07-13 International Business Machines Corporation Pseudo-bar code control of image transmission

Also Published As

Publication number Publication date
US5563966A (en) 1996-10-08
JP3191057B2 (ja) 2001-07-23

Similar Documents

Publication Publication Date Title
JP3191057B2 (ja) 符号化画像データの処理方法および装置
KR101446376B1 (ko) 고유 이미지 프로세스에 따른 미지 문서의 식별 및 검증
KR101515256B1 (ko) 동적 문서 식별 프레임워크를 사용한 문서 검증
US7593961B2 (en) Information processing apparatus for retrieving image data similar to an entered image
JP4504702B2 (ja) 文書処理装置、文書処理方法、および文書処理プログラム
JP3842006B2 (ja) 帳票類判別装置、帳票類判別方法、およびこれらの方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2575539B2 (ja) 書類上の金額フィールドの位置特定方法および識別方法
US8300942B2 (en) Area extraction program, character recognition program, and character recognition device
KR100412317B1 (ko) 문자인식/수정방법및장치
JP4557765B2 (ja) 画像処理装置およびその方法
CN111401099B (zh) 文本识别方法、装置以及存储介质
JPH08235341A (ja) ドキュメントファイリング装置および方法
US20050226516A1 (en) Image dictionary creating apparatus and method
Jarusek et al. Photomontage detection using steganography technique based on a neural network
US5854860A (en) Image filing apparatus having a character recognition function
CN115376139A (zh) 基于ocr高速图像识别的标签采集分析系统
KR100957508B1 (ko) 광학 문자 인식 시스템 및 방법
JP3090070B2 (ja) 帳票識別方法及び装置
JPH07168913A (ja) 文字認識システム
JP3930466B2 (ja) 文字認識装置、文字認識プログラム
JP4221960B2 (ja) 帳票識別装置及びその識別方法
WO2023062799A1 (ja) 情報処理システム、原稿種識別方法、モデル生成方法及びプログラム
JPH07160824A (ja) 文字認識装置
JP2643092B2 (ja) 文書書式上の事前定義されたフィールドの外側に位置する標準外データを処理する方法およびシステム
JP3243389B2 (ja) 文書識別方法

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees