JPS61227483A - 文書の読み取り,処理及び圧縮装置 - Google Patents

文書の読み取り,処理及び圧縮装置

Info

Publication number
JPS61227483A
JPS61227483A JP61068846A JP6884686A JPS61227483A JP S61227483 A JPS61227483 A JP S61227483A JP 61068846 A JP61068846 A JP 61068846A JP 6884686 A JP6884686 A JP 6884686A JP S61227483 A JPS61227483 A JP S61227483A
Authority
JP
Japan
Prior art keywords
encoding
extraction
document
image
reading
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP61068846A
Other languages
English (en)
Inventor
フランソワーズ ロメオ
パスカル ジヨリー
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Publication of JPS61227483A publication Critical patent/JPS61227483A/ja
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/41Bandwidth or redundancy reduction
    • H04N1/411Bandwidth or redundancy reduction for the transmission or storage or reproduction of two-tone pictures, e.g. black and white pictures
    • H04N1/413Systems or arrangements allowing the picture to be reproduced without loss or modification of picture-information

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 本発明は、黒白の文書の読み取り、処理、圧縮用の機械
に関するものである。この機械は電子保存文書の制作の
全ての過程で使用される可能性がある。保存される文書
の中に含まれる情報の、この機械による圧縮は、この文
書を直接保存するのに比べて収納の(データーメモリー
用)媒体の体積を著しく圧縮できる。本発明による機械
は特に以下のような用途に向いているニ ー技術文書(通信、航空機産業、自動車産業、・・・)
の保存、 一図書館蔵書(科学その他)の保存、 −官庁文書、および 一企業通信(保険会社、銀行、・・・)。
多くの種類の、文書の読み取り、処理、圧縮用の機械が
知られている。そのような機械は、一般的には用途が特
定のものに限られており、文書の形状にしろ、媒体の物
理的な特性にしろ、あらかじめ決められた範躊のものし
か扱えない、さらに、これら既知の機械では、処理され
る文書の中に含まれる情報の圧縮は、その機械と扱われ
る文書の種類に特有の決まった符号化方法によって達成
される。そのような既知の機械としては、特に、テレコ
ピー機、報道用ファクシミリ、光学読み取り機等をあげ
ることができる。
テレコピー機は、A4判の紙の媒体上で、文書の読み取
り、処理、圧縮を行う機械である。この文書の分析はl
ll11当り8ドツトの解像力のフォトダイオードバー
により線走査によって行なわれる。
この分析の結果である数値化された文書のイメージは引
き続き送信に先立って符号化される。符号化には多くの
方法がある。最初の方法は線上の黒と白の領域の長さを
符号化するものである(改訂Hufmann符号)、別
の符号化の方法として、ある線上の遷移の相対位置を前
の線と比較して示すものがある(Readの符号)、テ
レコピーで用いられる符号化の方法は厳密なもの、即ち
、得られた符号が原文書の情報の全てを保存するもので
ある。
圧縮比、つまり符号のビット数に対する数値化されたイ
メージのビット数の比は10から20の程度である。
報道用ファクシミリは、新聞の地方での印刷のために用
いられる新聞ページの送信サービスを行なうものである
。この場合、扱われる文書はA2判よりやや小さいフォ
トコピー用媒体紙のページである。文書はIm当り40
ドツト程度の極めC高い解像度で走査される。得られた
数値化されたイメージは多数の線をまとめたグループ上
での黒又は白の領域の長さを調べる、厳密ではない方法
で符号化される。この厳密でない方法は、文書の分析が
非常に高い解像度で処理される程度に応じて。
情報の切り捨てをひきおこすのである。
最後に光学読み取り機は、専らタイプライタで打たれた
文を載せた紙を媒体とする文書の、読取り、処理、圧縮
を行なう機械である。正常に処理されるためには、文書
はいくつかの基準、特にインク付けとコントラストを満
足していなければならない0文書の数値化は印字の分離
と認識処理につづいて実行されるが、それは例えばAS
CII符号のような文書の最適符号化へ導くものである
文字認識は、良く定義された活字目録の文字を用いたタ
イプ打ちされた文書に適用される特殊化された技術であ
る。この方法は文書内容を認識し。
かつ、あるレベルの構造を保存する点では唯一のもので
ある。得られた圧縮は最適のものである。
これまでに述べた既知の機械は、一般にA4判からA2
判の用紙上の文書だけしか扱えないという不便さを両者
とも持っている。さらに個々には独得の不便さも持って
いる:テレコピー機械の圧縮比の不十分さ、ファクシミ
リ機械に必要とされる極めて高い解像力、光学読み取り
機のためのタイプ打ちされた文書に関する制約、などで
ある。
テレコピー機械に用いられる符号化方法と形状認識方法
を組み併せた文書符号化方法も又提案されている。混合
符号化によって得られる圧縮比は、テレコピーによる符
号化のそれに比べてはるかに大きくなり、光学読み取り
機と異なって紙上の文書ならどんなものでも扱える。こ
のような符号化方法は、特にジョンセンによるベルシス
テムテクニカルジャーナル(0、J ohnsen等の
Be1l System T echnical J 
ournal  62巻、8号、 1983年10月号
)の“2つのレベル図面のパターンマツチングと代置に
よる符号化”と、IEEI!68巻、7号。
1980年7月号のW、に、Prattの“複合記号マ
ツチングファクシミリデータ圧縮システム”と題した論
文に述べられている。
読み取られた文書に対応する二元系画像から出発して、
これらの符号化の方法は、記号(文字。
数字の特性、又は他の大きさが限定された形状)を分類
するための文書解析から成ってしする。最初の記号はラ
イブラリーに収納される:つづいて来る記号は検知され
1次にライブラリー中の記号各々と比較される。検知さ
れた記号が既にライブラリー中に存在するものであれば
、それは単純にライブラリーのその記号に対応する認識
番号によって符号化される0反対にライブラリーの中に
ない場合には、その記号がライブラリーに納められる。
ついでライブラリーの各記号はその記号のビットの集合
に等しい符号で表現される。PRATT等の方法では、
記号以外のイメージの要素は、テレコピーに用いられる
のと同じ方法で符号化される( Hufmann又はR
eadの符号)。
混合符号化方法を用いた既知の機械は、専ら処理と圧縮
の手段を含むものであるが、読み取りの機構を持っては
いない。さらに、これら既知の機械はテレコピー機に向
けたものである。それ等は文書を線で走査しなから解析
する、つまり処理は逐次的であり、本来A4判の文書を
処理するように作られている。また、ある種の既知の機
械、特にジョンセン(J ohnsen)の方式を具体
化したものについては、文書再生の質の低下が起った。
それは、処理される画像の連結した大きな形体が記号と
して分割されることに起因している。
本発明は、特に既知の機械の不便さと限界を改善するこ
とを目的とする0本発明の第一の目的は。
様々な種類、例えば紙、マイクロフィッシュその他の文
書の読み取りを可能にすることである1本発明による機
械は、この目的のために各々特定の型の文書に適合した
一部の読み取り機構を備えている。
本発明は同時に読み取られた文書の処理について、より
大きな速度、より大きな柔軟性をもつことを目的とする
。この目的は二つのバスを有するアーキテクチャ(計算
機機構を用いて達成される。
一つはイメージのバス(母線)、他は通信のバスでる。
イメージのバスは読み取られた文書に対応する数値化さ
れたイメージの連結成分を抽出する装置に用いられる:
通信のバスはこの抽出装置を。
イメージの中に検出された連結成分の符号化を行なう符
号化装置へつなぐ、この二つのバスによる構成は処理機
能の二つのレベルの巧みな分離を可能にする:つまり画
像メモリーへの迅速かつ優先的な接近を前提とした画像
の分割と、画像から抽出された種々の要素に対する特有
の処理、である。
本発明による機械は、専用型であるか、もしくは再構成
可能な型であることも可能である。一つの応用に専門化
している場合には、抽出の装置と符号化装置の実行する
処理は固定されたもので、その用途に特有のものになる
。タイプ打ち文書のために設計された機械は、例えば見
取り図、又は設計図の処理には用いられない。
内容として文と同様図面も含まれている文書の処理を機
械がしなければならない時には、装置の再構成ができれ
ば有利である。そのような時には読み取られた文書に合
わせて、特に読み取られた文書の内容(タイプ打ち文書
、図面、写真、・・・)に合わせて、抽出装置又は符号
化装置よって行われる処理を修正するために複数の手段
が備えられている。これらの手段は、特に抽出と符号化
の装置へ抽出と符号化のプログラムを遠隔ロードするこ
とができるようになっている。もつと正確に言えば1本
発明による1文書の読取り、処理、圧縮機械は次のもの
を含んでいるニ 一部なくとも二元系画像の一部を送信する画像バス、 一制御信号の送信と前記の二元系画像の連結成分を表わ
す符号化信号の送信に用いられる通信バス、 一複数の読み取り機構、一つのインターフェース及び場
合によっては二元化の手段を含んだ文書の読み取り手段
:その読み取り機構は各々、一種の文書媒体の専用にな
っていて読み取られた文書の二元系画像を出力し、その
インターフェースは二元化の回路に向けて数値化された
画像信号を出力し、そのインターフェースは通信バスに
つながれ、その二元化の手段は画像バスと通信バスにつ
ながれている、 一画像バスにつながれ、読み取りの手段から送られる二
元系画像を受ける画像メモリー、−二元系画像の連結成
分を決定するための、そして各々の連結成分をあらかじ
め定められた一部のクラスの中の一つのクラスの中で分
類するための抽出装置;上記抽出装置は少なくとも一つ
の抽出手段を含み、各抽出手段は一つの抽出プロセッサ
と一つの附属メモリから成り、各抽出手段は画像バスと
通信バスにつながれている。
一連結成分を符号化するための符号化装置、上記装置は
各クラスにつき少なくとも一つの符号化の手段を持ち、
そのクラスに振り分けられた画像の連結部分にその特有
の符号化を実行し、各々の符号化手段は一つの符号化の
プロセッサと一つの附属メモリから成り、通信バスに接
続される、 一通信バスに接続され、符号化の装置から出力される符
号を組み直して最終的な符号にする併合手段、 一通信バスに接続され、一つの計算機と一つの制御コン
ソールを持ち、通信バスに接続された諸要素を制御する
ための制御の手段。
二元化の手段は、読み取り機構の一つが、非二元系の数
値信号を出力する時以外は必要がない。
出来るなら抽出の装置は多数の同型の抽出手段を並列に
置いたものを含むことができ、制御手段はこの同型の抽
出手段の間のタスクの再配分を制御することが可能であ
る。
同じく、処理の部分の一つ又は複数の符号化の手段は並
列に置かれた同型の多数の符号化手段を含み、制御手段
はこの同型の符号化手段の間のタスクの再配分を制御す
る。
この抽出及び符号化のレベルで実施される並列化によっ
て読み取られた文書の処理速度を早めることができる。
第1図は、本発明による、読み取り、処理、圧縮用の機
械の構造を図式的に示している。この機械は原理的には
文書の読み取りを行い、又、二元系画像を作るための読
み取り手段2、その二元系画像を記憶するためのイメー
ジメモリ4、画像メモリ4に含まれる画像を解析し連結
成分を抽出する抽出装置6、抽出装置6によって検出さ
れた連結成分を符号化する符号化装置8、符号化装置8
によって作り上げられた様々な符号を基に最終的な符号
を作る併合の手段10、及び制御手段12を含んでいる
本発明による機械は、二つのバス、つまり画像バス14
と通信バス16の周囲に配置され作動する。
これらのバスは、各々1機械が行う処理の機能レベルの
一つと連結されている0回線18,20,22は。
各々、読み取り手段22画像メモリ4.抽出装置6を画
像バス14と結ぶ、この画像バスは画像の分割と接続成
分の検出のために抽出装置6が迅速かつ優先的に画像メ
モリ4にアクセスすることを可能にする。
通信バス16は機械の異なる要素間の対話のために働き
、メモリ4に含まれる画像から抽出された情報の交換を
可能にする0回線24と26は読み取り手段2を通信の
バス16と結ぶ、同じく、複数の回線28□、・・・、
28□は符号化装置8を通信バス16と結ぶ。最後に、
回線30.32.34は、各々、抽出装置6、併合装置
10.制御手段12を通信バス16と結ぶ。
次に、第1図の機械の各々の構成要素を詳しく記述する
。読み取り手段2は複数の読取り機構36it36tt
・・・、36.、各々の読取りの機構及び回線24によ
って通信バス16に結ばれているインターフェース38
、回線18と26によって、各々、画像バス14と通信
バス16に結ばれている二元化手段40、から成ってい
る。
読取り機構の数は決まっていない、それはこの機械によ
ってどれだけの異なった型の文書が処理される可能性が
あるかに依存している。この読み取りの機構は、特に文
書を読む機構、マイクロフィッシュを読む機構、アパー
チャーカードを読む機構などを持つことが可能である1
分析の解像力は読み取り機構毎に異なっている。数値化
される画像の大きさにはおそらく制限があり、例えば1
−当たり8ドツトでAO判に等価となるであろう。
読み取り機構の行う分析は文書の濃度のレベルを保存す
るものである。ついで画像の二元化が二元化の手段40
によって実行され、それはインターフェース38を介し
て読取り機構の一つから送られる数値化された文書を受
取る。できれば、この二元化は局部的にコントラストが
弱くなっているのを検知し、読み取られる文書の質を改
善するように文書の局部的な特性を考慮に入れて実行さ
れるのが望ましい。二元化された画像は画像メモリ4に
貯えられる。
抽出装置6は、抽出のプロセッサ42と回線46で抽出
のプロセッサと結ばれたメモリ44を含んでいる。メモ
リ44は、抽出の処理を記述する命令のゾーンと二元系
画像の要素の記憶とその解析のための作業ゾーンとを持
つ、抽出装置は、連結成分の抽出のための画像メモリ4
に含まれる画像の分割の役目を担う。
本発明によれば、抽出装置によって検出された連結成分
は要素の複数のクラスの中の一つに分類されるが、同じ
クラスに属する要素は一つの単位を成しそのクラスに特
有の方法で符号化される。
この方法は、各連結成分をその形に応じて符号化する方
法によって文書読み取りの圧縮比を大きくすることを可
能にしている;この圧縮比は単一の符号化の方法で得ら
れるものよりもずっと大きい。
文書の連結成分は三つのクラスに分類できる:ベクトル
のクラス、記号のクラス、非記号のクラスである。
ベクトルは、垂直、水平、又は斜めの線である。
この種の線は見取図や技術的な設計図中に特に数が多い
。それは二元系画像を行毎あるいは列毎に走査して検出
される。ベクトルが二元系画像の中で検知されてしまえ
ば、残りの連結成分がその大きさが成るあらかじめ決め
られた大きさより小さいか大きいかに従って、記号又は
非記号として分類される。
既知の種々の技術が連結図形の抽出に用いられ得るが、
それはラベル付け、輪郭追跡、区域追跡。
などである。
ラベル付けはイメージの行毎の走査の際に出会う点にラ
ベルを付けていくものである。接続−する諸点は同じラ
ベルを付けられる。この方法は、特に、 R,Lui■
aによる“バーチャルメモリ計算機のための新しい接続
成分アルゴリズム″と題した。
Computer  Graphics  and  
Image  Processingの22巻、198
3年のページ287から300の論文の中で述べられて
いる。
輪郭調査の方法は、各点についてその近隣の配置を調べ
ることにより接続図形の輪郭の点を見出すものである。
この方法の主な難点は、対象の内側の輪郭と埋込みを調
査することにある0輪郭調査の方法の一つが、 R、C
adarbargによる“ラスタースキャンデバイスの
ためのチェインリンク符号化と分割”と題する、Coi
+putar Graphics and I sag
e P rocassing”の10巻、1979年、
ページ224から234の論文の中で述べられている。
最後に領域調査の方法は走査線上に黒い領域を検出し隣
接する線上に連結する黒い領域を探し、これをスタック
中に記憶させ、かつ画像中から消去する。このメカニズ
ムをスタック中の領域について繰り返し、スタックが空
になるまで続ける。
検出された連結成分は各々符号化装置8に送られる。こ
の送信により3種の情報が運ばれる;−処理される画像
中の連結成分の位置、−用いられた抽出方法と関連づけ
られている、連結成分の形状の記述、 一形状と同じ様に抽出され、符号化装置で有用な形状の
大きさく高さ、幅、黒い点の数、線又はそれ以外による
領域の数等の特徴、) 符号化装置8は少なくとも要素のクラス当り一つの符号
化手段を持つ、符号化手段は、各々、回線52□、・・
・、 52flによってメモリー501.・・・、50
1と結ばれた符号化のプロセッサ481.・・・、 4
8.lを含んでいる。各メモリーは1作業ゾーンと接続
成分の符号化を実行するための一連の命令を含んだゾー
ンとを持つ;各要素クラスにはそのための特有の符号化
が伴う。
符号化装置8は、特にベクトルのクラス用の符号化手段
、記号のクラス用の符号化手段、非記号のクラス用の符
号化手段、を含むことが可能である。
本発明の機械の符号化装置8は既知の機械の符号化装置
よりもはるかに大きな柔軟性を発揮する。
実際、符号化手段の数、つまり扱われた文書の接続成分
が分配される先のクラスの数は特定の用途に応じて各々
の機械で適合させられる。
異なる用途に振り向けられた二つの機械は、固定されて
はいるが異なった符号化手段をもつことが可能である。
再構成ができる機械にあっては、符号化装置が実行する
処理は、特定の用途に合わせて一部のプログラムの中か
ら選ばれ、符号化装置の中で遠隔ロードされたプログラ
ムの形をとることが可能である。この選択と遠隔ロード
は制御手段12によって実行することができる。
同様に、抽出装置6によって使われる抽出の方法も処理
される文書に応じて調節することができる。再構成がで
きる装置にあっては、用いられる抽出の方法は、抽出プ
ロセッサ42に附属するメモリ44のゾーンの一つに含
まれている一連の命令によって表わされる。制御手段1
2は記憶手段の中に一部の抽出の方法を備え、扱われる
文書に応じて抽出のメモリ44の中に抽出の方法の一つ
を書き込むよう指示することも充分に可能である。抽出
方法の選択と符号化装置8の構造の選択は、互換性のあ
るものでなければならない。
ベクトル、記号、非記号のクラスに対応する符号化の方
法をつづいて述べる。検知されたベクトルは単純にその
座標(始点、終点)とその幅によってメモリーされる。
記号の符号化は、それが含む情報は保存したままで表現
に必要なビット数を減らすことが鍵になる。このために
符号化は擬認識の方法を用いる。この方法については、
既辷述べたPratt等、J ohnsen等の論文で
特に考察が成されている。一般的には、擬認識の方法は
1文書解析の過程でその文書の記号のライブラリーを作
り出すのである。ある記号のクラスと関連した符号化手
段が一つの記号を受けたとき、三つの場合が生じ得るニ ーライブラリーの中にその受け取られた記号を表わすも
のがない;その時は、記号は存在するライブラリー中に
繰り入れられる。
−ライブラリーの中に受け取られた記号を表わすモデル
が一つだけある、 −ライブラリーの中の複数のモデルが受け取られた記号
を表わすことが可能である;その記号は最も近いモデル
に割り当てられる。
記号は、その場合1文書中の位置とライブラリー中で代
表するものとを参照して符号化される。
最後の場合には、符号化は1例えば記号を含む行列上で
ハフマン(Hufmann)かリード(Read)の符
号によって行うことが可能である。
最後に、非記号のクラスの接続成分は、記号の表現と同
じ方式で符号化される。この符号には、連結成分の位置
と大きさが先行する。
符号化装置8の符号化の異なる手段によって作られた符
号は次に併合手段10へ送られる。それは併合プロセラ
1す54とそれに回線58で結ばれたメモIJ58を持
つ、この併合手段は、符号化手段によって発信された符
号をもとにして最終符号を作り上げる。
得られる圧縮比、即ち、画像メモリ4に含まれる二元系
画像のビット数の符号のビット数に対する比は、はぼ7
0である。この比率は、二元系画像がテレコピー機の場
合のように完全にReadの符号で符号化された時に得
られるであろう平均20という値と比較される。
制御手段12は第1図で示されているが、計算機60と
制御コンソール62を持つ、この制御手段は、機械の異
なる要素の機能を管理し、特にインターフェース38を
介して読み取り機構の一つへ文書の読取りの指令を発し
、読み取られた文書に対応する二元系画像が画像メモリ
4に収納されたことを示す信号を二元化手段40から受
け、抽出装置6に対して、画像メモリ4の接続成分を決
めるため抽出の指令を出し、抽出装置6から符号化装置
8の符号化手段の一つに向けて連結成分の一つを送り出
す要求を受け、符号化の指令を出し、この符号化手段か
ら併合手段10へ向けて符号を送る要求を受け、併合の
指令を出す。
抽出手段は、プロセッサと、用いられる抽出の方法を表
わす命令が納められるメモリとを持つ。
″専用の機械では、この命令の群はROMに入れておく
こともできる。再構成のできる装置では、できればこの
命令群は書き換えられるメモリに入れたい、抽出の方法
も同様に読み取られた文書に応じて修正することができ
る。ある与えられた時点で用いられる抽出の方法は1例
えば、読み取られた文書に応じて、制御手段12によっ
て選ばれ、抽出装置6へと送ることが可能である。
同様に、符号化手段も、メモリ中の一連の命令によって
表わされる符号化の手順を実行する。再構成ができる機
械では、各符号化手段の符号化の手順及び用いられる符
号化手段の数は、制御手段12によって決められるよう
にした方が有利である。
第1図で表わされる本発明による機械は、あらゆる種類
(タイプ打ち文書、図面、図表、・・・)、種々の異な
る物理的媒体上の文書を取り扱うことができる。特定の
いくつかの場合には、この機械の処理速度は制限された
ものになるかもしれない。
それは、特に扱われる文書が多数の大きな連結成分を持
つ場合、例えば、密にタイプされた文書を扱うような場
合にそうである。
処理の速度を増すために、抽出装置6は、そのような時
には並列の抽出の群を備えることができる。同様に、並
列に置かれた同型の符号化手段の群を連結成分の各クラ
スの符号化を行うために設けてもよい。
第2図は、第1図の機械の実施の別法を示すもので、そ
の中では抽出装置と符号化装置が各々並列で動作する複
数のプロセッサを持つ。この図では、第1図のそれと同
等の要素は同じ番号を付けられている。
【図面の簡単な説明】
一第1図は1本発明による、読取り、処理、圧縮用の機
械のアーキテクチュアを図式的に示したものであり、 一第2図は、第1図の機械の実施の別法を示すもので、
抽出と符号化のタスクの並列化を可能とするものである

Claims (8)

    【特許請求の範囲】
  1. (1)、二元系画像の少なくとも一部の送信に用いられ
    る画像バス(14)、 制御信号の通信と、前記二元系画像の連結成分を表わす
    符号化信号の通信に用いられる通信バス(16)、 その各々が1つの文書媒体用に特殊化され、読み取られ
    た文書の数値化された画像信号を発信する複数の読み取
    り機構(36_1、36_2、…、36_p)と、通信
    バスにつながれたインタフェース(38)とを持ち、上
    記読み取り機構は画像バスに二元系画像信号を発信する
    、文書読み取り手段(2)、 画像バスに結ばれ、読み取り手段(2)が発信する二元
    系画像を受け取る画像メモリ(4)、二元系画像の連結
    成分を定めその連結成分をあらかじめ決められている一
    群のクラスのいずれかに分類するためのもので、各々が
    1つの抽出プロセッサ(42)と1つのメモリ(44)
    から成っており、画像バス、通信バスと結ばれている少
    なくとも1つの抽出手段を持つ、抽出装置(6)、 各々が1つの符号化プロセッサ(48_1、48_2、
    …、48_n)と1つの附属メモリ(50_1、50_
    2、…、50_n)から成っており、かつ通信バスに結
    ばれている、各クラスにつき少なくとも1つの符号化手
    段を持ち、そのクラスに振り当てられた画像の連結成分
    に特有の符号化を実施する、連結成分の符号化のための
    符号化手段(8)、 符号化装置(8)が発信する符号をまとめ直し、最終の
    符号を作るための、通信バスに結ばれている併合手段(
    10)、 通信バスに結ばれている諸要素を制御するための、通信
    バスと結ばれ1つの計算機(60)と1つの制御コンソ
    ール(62)を持つ制御手段(12)、を持つことを特
    徴とする文書の読み取り、処理、圧縮装置。
  2. (2)、読み取り手段(2)が、その他に二元化の手段
    (40)を持ち、前記二元化の手段は画像バスと通信バ
    スに結ばれ、かつ読み取り機構(36_1、36_2、
    …、36_p)が発信する数値化画像信号をインターフ
    ェース(38)を介して受信することを特徴とする、特
    許請求の範囲第1項に記載の装置。
  3. (3)、少なくとも1つのマイクロフィッシュ読み取り
    器、1つのアパーチャーカード読み取り器、1つの文書
    読み取り器を、読取り手段(2)が有していることを特
    徴とする、特許請求の範囲第1項に記載の装置。
  4. (4)、抽出装置(6)が複数の並列に置かれた同型の
    抽出手段を持ち、制御手段(12)が同型の抽出手段の
    間のタスクの再配分を制御することを特徴とする、特許
    請求の範囲第1項に記載の装置。
  5. (5)、連結成分が少なくとも3つのクラス、ベクトル
    のクラス、記号のクラス、非記号のクラスに分割され、
    符号化装置(8)が各クラスにつき少なくとも1つの符
    号化手段を持つことを特徴とする、特許請求の範囲第1
    項に記載の装置。
  6. (6)、少なくとも1つの符号化装置が複数の並列に置
    かれた同型の符号化手段を有し、制御手段(12)が同
    型の符号化手段の間のタスクの再配分を制御することを
    特徴とする、特許請求の範囲第1項に記載の装置。
  7. (7)、制御手段(12)が各抽出手段に対しその抽出
    手段の抽出方法を定める一連の命令を伝える能力を持ち
    、前記抽出の方法は読み取られた文書に応じて複数の方
    法の中から選ばれることを特徴とする、特許請求の範囲
    第1項に記載の装置。
  8. (8)、制御手段(12)が各符号化手段に対しその符
    号化手段に特有の符号化の方法を定める一連の命令を伝
    える能力を持ち、前記符号化の方法は複数の方法の中か
    ら読み取られた文書に応じて選ばれることを特徴とする
    、特許請求の範囲第1項に記載の装置。
JP61068846A 1985-03-29 1986-03-28 文書の読み取り,処理及び圧縮装置 Pending JPS61227483A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
FR8504828 1985-03-29
FR8504828A FR2579795B1 (fr) 1985-03-29 1985-03-29 Machine de saisie, de traitement et de compression de documents

Publications (1)

Publication Number Publication Date
JPS61227483A true JPS61227483A (ja) 1986-10-09

Family

ID=9317764

Family Applications (1)

Application Number Title Priority Date Filing Date
JP61068846A Pending JPS61227483A (ja) 1985-03-29 1986-03-28 文書の読み取り,処理及び圧縮装置

Country Status (5)

Country Link
US (1) US4684997A (ja)
EP (1) EP0200593B1 (ja)
JP (1) JPS61227483A (ja)
DE (1) DE3671590D1 (ja)
FR (1) FR2579795B1 (ja)

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH065888B2 (ja) * 1986-02-14 1994-01-19 富士写真フイルム株式会社 画像デ−タ量子化方法および装置
JPH0785248B2 (ja) * 1986-03-14 1995-09-13 株式会社東芝 デ−タフアイルシステム
JPS63109653A (ja) * 1986-10-27 1988-05-14 Sharp Corp 情報登録検索装置
US5113494A (en) * 1987-02-27 1992-05-12 Eastman Kodak Company High speed raster image processor particularly suited for use in an image management system
JPH01309464A (ja) * 1988-06-07 1989-12-13 Canon Inc 画像伝送装置
US5353132A (en) * 1989-02-06 1994-10-04 Canon Kabushiki Kaisha Image processing device
US5231679A (en) * 1989-09-01 1993-07-27 Sanyo Electric Co., Ltd. Image processing apparatus and image reducing circuit therefor
US5287416A (en) * 1989-10-10 1994-02-15 Unisys Corporation Parallel pipelined image processor
US5170466A (en) * 1989-10-10 1992-12-08 Unisys Corporation Storage/retrieval system for document
WO1991006058A1 (en) * 1989-10-10 1991-05-02 Unisys Corporation Storage and retrieval system for document image data
JP2876258B2 (ja) * 1991-01-23 1999-03-31 株式会社リコー デジタル電子スチルカメラ
US5212742A (en) * 1991-05-24 1993-05-18 Apple Computer, Inc. Method and apparatus for encoding/decoding image data
US5390262A (en) * 1991-10-03 1995-02-14 Ncr Corporation Method for splitting and configuring a multi-channel image processing system
CA2063495C (en) 1991-10-03 1999-03-30 John O. G. Vieth Method and system for compressing data in a multi-channel image processing system
CA2063621C (en) 1991-10-03 1999-03-16 Wayne M. Doran Method and modular system for high speed processing of item images
EP0564201B1 (en) * 1992-03-30 2000-05-24 Canon Kabushiki Kaisha Image processing apparatus and method
JPH0628434A (ja) * 1992-07-09 1994-02-04 Canon Inc 情報処理装置
US6219754B1 (en) * 1995-06-07 2001-04-17 Advanced Micro Devices Inc. Processor with decompressed video bus

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE2825912A1 (de) * 1978-06-13 1980-01-03 Siemens Ag Verfahren zur uebertragung von aufzeichnungen mit gemischtem darstellungsinhalt auf einen sichtanzeigeschirm, insbesondere in fernsprechanlagen
US4410916A (en) * 1979-08-24 1983-10-18 Compression Labs, Inc. Dual mode facsimile coding system and method
US4415880A (en) * 1980-01-28 1983-11-15 Texas Instruments Incorporated Character recognition method and apparatus
JPS5776652A (en) * 1980-10-31 1982-05-13 Toshiba Corp Display system for picture information
US4606069A (en) * 1983-06-10 1986-08-12 At&T Bell Laboratories Apparatus and method for compression of facsimile information by pattern matching

Also Published As

Publication number Publication date
EP0200593A1 (fr) 1986-11-05
FR2579795B1 (fr) 1987-05-07
FR2579795A1 (fr) 1986-10-03
DE3671590D1 (de) 1990-06-28
US4684997A (en) 1987-08-04
EP0200593B1 (fr) 1990-05-23

Similar Documents

Publication Publication Date Title
JPS61227483A (ja) 文書の読み取り,処理及び圧縮装置
CA2019134C (en) Method for compressing and decompressing forms by means of very large symbol matching
US5818965A (en) Consolidation of equivalence classes of scanned symbols
CA2192436C (en) System and method for automatic page registration and automatic zone detection during forms processing
US4494150A (en) Word autocorrelation redundancy match facsimile compression for text processing systems
US6351559B1 (en) User-enclosed region extraction from scanned document images
JP3962891B2 (ja) 文書画像処理装置、文書画像処理方法、及び記憶媒体
US5307422A (en) Method and system for identifying lines of text in a document
US5805740A (en) Bar-code field detecting apparatus performing differential process and bar-code reading apparatus
US5974177A (en) Apparatus and method of network distribution of record data using transmittal symbols hand entered on a transmittal sheet
US5778095A (en) Classification of scanned symbols into equivalence classes
Gatos et al. Automatic page analysis for the creation of a digital library from newspaper archives
US5253305A (en) Character boundary identification method and system
US5081688A (en) Apparatus for recording regenerating record information comprising title and image information
US5854860A (en) Image filing apparatus having a character recognition function
JPH06103358A (ja) イメージ入力装置
EP0896295A2 (en) Character recognition method and system
EP0201909A2 (en) Procedure for automatic reading of images and device for carrying out this same procedure
US5655027A (en) Continuous extraction and processing of document fields
JPH05159062A (ja) 文書認識装置
JPS59103177A (ja) 名刺読取装置
JPH0731712B2 (ja) 文字読取装置
JPS63293690A (ja) 文字認識システム
JP2641210B2 (ja) 文字認識装置
JPS62177686A (ja) 光学的文字読取装置