JPH0453476B2 - - Google Patents

Info

Publication number
JPH0453476B2
JPH0453476B2 JP62132010A JP13201087A JPH0453476B2 JP H0453476 B2 JPH0453476 B2 JP H0453476B2 JP 62132010 A JP62132010 A JP 62132010A JP 13201087 A JP13201087 A JP 13201087A JP H0453476 B2 JPH0453476 B2 JP H0453476B2
Authority
JP
Japan
Prior art keywords
symbol
prototype
symbols
sij
facsimile
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP62132010A
Other languages
English (en)
Other versions
JPS63108869A (ja
Inventor
Jooji Keeshii Richaado
Kooneriasu Kingu Jeemuzu
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of JPS63108869A publication Critical patent/JPS63108869A/ja
Publication of JPH0453476B2 publication Critical patent/JPH0453476B2/ja
Granted legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/41Bandwidth or redundancy reduction
    • H04N1/411Bandwidth or redundancy reduction for the transmission or storage or reproduction of two-tone pictures, e.g. black and white pictures
    • H04N1/4115Bandwidth or redundancy reduction for the transmission or storage or reproduction of two-tone pictures, e.g. black and white pictures involving the recognition of specific patterns, e.g. by symbol matching

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Image Processing (AREA)
  • Character Input (AREA)
  • Character Discrimination (AREA)
  • Editing Of Facsimile Originals (AREA)
  • Facsimiles In General (AREA)
  • Facsimile Transmission Control (AREA)

Description

【発明の詳細な説明】 A 産業上の利用分野 本発明はフアクシミリ伝送及び圧縮に関する。
具体的には、本発明は伝送されるフアクシミリの
外観を改良し、フアクシミリの形成のために送信
されたデータの量を減少する方法に関する。
B 従来技術 米国特許第4499499号は文書がOCR(光学文字
認識)走査記号として送信されるパターン突合せ
装置を説明している。この特許の送信装置及び受
信装置はともに原型のプロトタイプの同じライブ
ラリを保持している。各原型には識別コードが与
えられ、最初の認識にもとづいて、一度だけ送信
される。送信量の減少はその識別コードだけを送
信することによつて、その後の繰返し記号が送信
されることによつて達成される。
1980年6月刊IEEE第68巻第7号の組合せシス
テム突合せフアクシミリ・データ圧縮システム中
のプラツト等の論文(Pratt et al,in
Combined System Matching Fascimile Deta
Compression System,“Proceedings of the
IEEE,vol,68,No.7,July 1980)は文書の記
号の繰返しを利用して、フアクシミリの圧縮及び
送信量の減少を達成している。システムは各入力
記号を原型のライブラリの項目と比較する。もし
一致が示されると、対応するライブラリID及び
前の記号に関する水平位置がコード化される。そ
うでない場合は、記号の2進パターンが送信さ
れ、さらに新たな原型要素としてライブラリ中に
置かれる。
米国特許第4499596号は入力PELパターンをラ
イブラリの原型と比較している。一致した場合に
は、インデツクス番号が発生される。一致しない
場合には、パターンはライブラリ中に新らしい原
型として登録される。
従来のパターン突合せフアクシミリ装置では、
各原型は最初の認識に基づいて直ちに送られてい
た。印刷が貧弱な文書によるノイズは貧弱な原型
を生じ、受信される文書のイメージが貧弱であつ
た。さらにこれ等の従来のシステムでは文字間ス
ペースが決定されないので、識別コードは文書中
の記号の相対位置を示すアドレスを伴わないなけ
ればならない。データ送信量の著しい減少は、各
記号に対して1つのアドレスを送信する必要が除
去される時に得られる。
C 発明が解決しようとする問題点 本発明の目的はフアクシミリの送信を容易にす
る方法及び、フアクシミリの外観を改良する方法
を提供することにある。
D 問題点を解決するための手段 送信量の減少は各原型の両側の白いスペースの
量を決定することによつて達成される。白いスペ
ースの量は原型とともに、そのパラメータの1つ
として受信装置に送られる。その後原型の繰返し
記号に遭遇する時は、識別コードだけが送られ
る。原型は白いスペースがその中に埋込まれた擬
似フオント文字として検索される。文字間スペー
スが擬似フオントについて決定されているので、
文書のページ中の最初のアドレスだけを送ればよ
い。その後の記号はさらにアドレスをつけ加える
必要なく互に次の位置に位置付けられる。
送信されるフアクシミリのみかけは送信される
文書中の記号の繰返し中に存在する冗長度を利用
することによつて改良される。送信装置は同じパ
ターンと突合されるすべての入力記号の平均を求
めこれ等の記号の原型としてこの平均を送信す
る。この結果、送信フアクシミリの品質が増強さ
れる。
E 実施例 第2図はデイジタル・フアクシミリ送信のため
光学的に走査される文書のテキストの行を示す。
行のマトリツクス表示が得られ、個々の文字パタ
ーンの位置が決定される記号i(文字“v”)には
記号j(文字“a”)が続き、これに記号k(文字
“r”)が続く。記号のスペース・パラメータは幅
W、その前側白スペースf及びその後側白スペー
スによつて特徴付けられる。記号i及びjは白ス
ペースSijによつて分離される。白Sijはbi+fjド
ツト列に等しい。記号j及びkはSjkによつて分
離されている。Sjkはbj+fkドツト列を有する。
記号jのwj,Sij及びsjkはデイジタル・イメー
ジ上で直接測定出来る。しかしながら、記号前側
白スペースfj及び後方白スペースbjは直接測定出
来ずSij及びSjkからだけ誘導出来る。
パターン突合せの技術用語では、クラスiは第
i番目の原型と一致する記号の集合として定義さ
れる。
パラメータwjはクラスiの平均値として評定
される。
bi及びfjを評定するためには、全文書について
文字間スペースを先ず測定する。Sijはクラスi
及びクラスjのパターン間の平均白スペースとす
る。Sijはクラスi及びクラスjのパターンの平
均白スペースとする。Sijはクラスi及びクラス
jのパターン間の平均白スペースとする。bj及び
fjの評定は次式(1)の差の2乗和を最小にすること
によつて得ることが出来る。
SD=oi oj δij〔Sij−(bi+fj)〕2 (1) ここで δij=1:テキト中にクラスのシーケンス(i,j)
が生じた場合 0:その他の場合 最小化はbi及びfjに関して式(1)をbj及びfjに関
して微分し、結果を0に等しいと置くことによつ
て達成される。これによつて次の2N元を生ずる。
Ri=mibi+oj δij fj i=1乃至N (2) Cj=njfi+oi δij bi j=i乃型N (3) ここで Ri=aibi+oj δij fiiに直ぐ続くすべての原型の
推定前側スペースの和 Ci=nifi+oj δij bijの直ぐ前(先行)の原型の
推定後側スペースの和 mi=oj 原型iに直ぐ続く原型の数 ni=oi δij原型jの直ぐ前の原型の数 各クラスの対が存在するならば、即ちすべての
i,jについてδij=1ならば、解くべき式は式
は次の通りとなる。
Ri=Nbi+oj fii=1乃至N Ci=Nfj+oj bij=1乃至N これを解いて、 Bbi=Ri/N−σb (4) fj=Ci/N−σj (5) ここでσb,σfは次式を満足する任意の定数で
ある。
σb+σf=1/N2 N1 Nj Sij (6) ここでこれ等の定数はすべての間隔パラメータ
が非負の定数になるように選択されなければなら
ない。
もしすべてのクラス対が文書中に生じなけれ
ば、一般の場合は次式 bi=Ri/mi i=1,2,…N fi=Ci/ni i=1,2,……N を使用してbi及びfjの最初の推定値を先ず求めて
一般的な場合について解くことができる。
これ等の値は消去したSijを求めるのに使用さ
れる。
Sij(1)=bi(0) +fi(0) Sij その他の場合 これによつてSijの完全な集合が与えられる。
式4,5及び6はbi,fiの新らしい推定値を得る
のに使用される。この手続を繰返すと、第kルー
プでは次の値が計算される。
bi(k)=Ri(k-1)/N−σb(k-1) fi(k)=Ci(k-1)/N−σb(k-1) この過程を収歛する迄繰返す。
文字幅の変動はSijの観測値に影響を与える。
例えばぼけた文字は余分の白スペースを増す。よ
り正確な推定値は空白スペースSijでなくクラス
i及びj間の平均中心間距離cijを測定すること
によつて得られる。上述の手続を使用して次式を
最小にする。
SD′=Ni Nj Sij〔Cij−(bi+fj+wi/2+wj/2)〕2Sijを (Cij−Wi+Wj/2)によつて置換する。
第1図は送信装置1及び受信装置2を有する構
造体を示す。送信装置1はIBMモデル8815のよ
うな市販のOCRスキヤナ3を含む。スキヤナ3
は送信さるべき文書を走査して、バツフア4中に
保管されるデータ出力を発生する。本実施例では
IBM PCであるバツフア4は中央処理ユニツトへ
の端末としても機能する。送信CPU5はAPLラ
ンゲージ・プロセツサによつて規定されるAPL
インタープリタの下で稼動するIBMシステム/
370でよい(1978年発行IBMマニユアル第G6
26−3847号、第5版リリース第3号:Release
NO.3published in the IBM NO.G6 26−3847,
5th Edition,in 1987参照)システム/370アー
キテクチヤは米国特許第3226689号及び刊行物
「IBMシステム/370の動作原理」フオームA22−
7000−4“IBM System/370 Prin ciples of
Operation,” formA22−7000−4中に説明されている。実
施のためには、IBMシステム/370の下で稼動す
るAPLソース・コードが使用されたが、他のプ
ログラミング言語及び計算装置を使用して、不当
な試験を行うことなく同等な機能を遂行させこと
が出来る。
受信装置2はIBMシステム/370計算機である
受信CPU6より成る。受信CPU6はフオントが
その上位計算機からロードされるIBMページ・
プリンタ・モデル3812のようなプリンタ・フレク
シブル・ページ・プリンタ(しばしばレーザ・プ
リンタ)7に接続される。
光学認識装置を使用する記号の識別方法は一般
に知られているので、本発明の方法は記号が既に
走査されて識別された時点から出発して説明した
方がわかりやすいであろう。
(a) 平均による雑音の減少 送信されるべき文書はOCRスキヤナ3によつ
て走査される。送信CPU5によつて受取られる
各走査記号はp×qビツト配列体として登録され
ている。配列体中の1ビツトは黒ペルを、0は白
ペルを示す。送信CPUは各ビツト配列体ごとに
パターンと突合され、一致したパターンに依存し
て識別コード(ID)を割当てる。
文字の終りに到達した時に、送信CPUは登録
されていたビツト配列体及び夫々のIDを検索す
る。次に第1表の凝似コードによつて説明された
のと同じ方法でビツト配列体を平均する。
第1表 Do for id=1、to M M=原型の総数 Initialize N to 0 Initialize array A(p,q)to 0 Do for K=1 to Z Z=記憶配列体の総
数 Read array (k) If Ib of array(k)=id Increment N Do for i=1 to p,j=1 to q Add bit(i,j)of array(k) to
A(i,j) Enddo Endif Enddo Divide A(i,j)by N Do for i=1 to p,and j=1 to q If A(i,j)is greater than a threshold Then A(j,j),else A(i,j)=0 Endif Enddo 第3a図は同一パターンに一致する記号を示
す。第3b図はこれ等の10個の記号の平均を示
す。第3b図の平均は10個の配列体を加算し、値
=5で閾値操作を行うことによつて誘導される。
パターンに属するすべてのビツトの平均の結果
A(i,j)をそのパターンの原型として使用す
る。この原型は受信システムに送られ、ここでフ
オントが形成される。文書の形成中で、対応する
記号が印刷されるべき時にフオントが使用され
る。
(b) 白スペース・パラメータの決定 クラスi及びクラスjの記号間の中心間の距離
Cijが測定される。次にCijの平均は第1表に示さ
れた手続中で計算される。増強原型iの幅wi及
び増強原型jの幅wjはセクシヨン(a)の平均を求
めた後に決定される。Cijの平均からwiの半分及
びwjの半分をCijの平均から減算した後に、クラ
ス及びjの記号間の平均縁−縁距離が与えられ
る。
第2表はクラスi及びjの記号の平均縁−縁距
離を求めるためのAPLソース・コードのリスト
を示す。本実施例では縁−縁距離が使用される
が、本発明の白スペースの計算する本発明の方法
は不当な試験を行うことなく、記号の予じめ指定
した点間の他の距離を使用して実施できる。
第2表 VZ←CTR-TO-CTR P;I;Q;Q1 〔1〕 AAZ〔I:J〕=クラスI及びJ間のctr−
to−ctr距離 〔2〕 Z←(2,2ρ「/P〔;1〕)ρ0 〔3〕 I←1 〔4〕 BR:50 FLASH ItI+1 〔5〕 Q1←P〔I−1;〕 〔6〕 Q←P〔I;〕 〔7〕 →SKP×1Q1〔6〕=0 〔8〕 AスペースもしくはEOL:次のパターンに
スキツプ 〔9〕 I←I+1 〔10〕 →END 〔11〕 SKP: 〔12〕 X←(Q〔3〕+0.5×Q〔5〕)−(Q1〔3
〕+
0.5×Q1〔5〕) 〔13〕 Z←〔1;Q1〔1〕;Q〔1〕〕−(Q1〔3〕

0.5×Q1〔5〕) 〔13〕 Z←〔1;Q1〔1〕;Q〔1〕)−(Q1〔3〕

0.5×Q1〔5〕) 〔14〕 Z←〔1;Q1〔1〕;Q〔1〕〕−Z〔2;Q1
〔1〕;Q〔1〕;Q〔1〕〕+1 〔15〕 END:→BR×LI<I↑ρP 〔16〕 Z〔1;;〕←Z〔1;;〕÷1「Z(2;;
」 〔17〕 AA対中の各パターンの幅の距離から減算
する 〔18〕 Z(1;;〕←L0.5+Z〔1;;〕−0.5×(

〔2;;〕>0)×Vo,+V←AVG-WDTH P 〔19〕 AAZがここで縁−縁距離を与える。
すべての存在する縁−縁距離Sijが決定された
後に、第4図に示された形式のマトリツクス中へ
置かれる。
第4図のマトリツクスの各行xは直前の記号と
してクラスの記号xを有するすべてのクラスのシ
ーケンス(x,k)の平均距離Sxy,1≦k≦N
を含む。マトリツクスの各列yは直ちに後続する
記号としてクラスyの記号を有するすべてのクラ
スのシーケンス(k,y)の平均距離Sky、1≦
k≦Nを含む。
すべてのクラス・シーケンスは文書中に存在し
ないので、マトリツクス中にはいくつかの欠けた
項目が存在する。式(4)及び(5)はしかしながら、す
べてのクラス・シーケンスが存在するときに使用
することができないので、欠けている項目を決定
しなければならない。
第3表は欠けたSijの推定値を見出すための
APLソース・コードの一部のリストを示す。
第3表 VZ←NS SPACEMIN S;MINF;I;LP;
M;N;R;C;F;B;BB;FF;SS;
OK;L 〔1〕 AAの字間距離を最も良く表わす間隔パラ
メータ 〔2〕 AAの選択。米国特許第4499596号参照 〔3〕 I←0 〔4〕 AA Iはループ・インデツクス 〔5〕 St(OK←NS≠0)×S 〔6〕 AA S=距離の入力マトリツクス、NSが
各距離のサンプル数を示す。
〔7〕 □←‘ループ数?’ 〔8〕 LP←□ 〔9〕 AA LPはアルゴリズムの繰返し数であ
る。
〔10〕 M←+/S≠0 〔11〕 M〔I〕=行i中にあるサンプルについての
項目数 〔12〕 N←+S≠0 〔13〕 AAN〔I〕=列i中あるサンプルについて
の項目数 〔14〕 R←+/S 〔15〕 AA R=Sの行の和 〔16〕 C←+≠S 〔17〕 AA C=Sの列和 〔18〕 註:R,C,M,Nは上記米国特許出願に
記載してあるとおり。
〔19〕 Lt(ρS)〔1〕 〔20〕 AA L=S中の行(列)の数 〔21〕 Q←(+/+/S)÷*2 〔22〕 AA QはFF及びBBを調節するのに必要な
定数である。
〔23〕 FF←F−MINF←L/F←(C÷N) 〔24〕 AA FFは前方の空白スペース 〔25〕 BB←(BtR÷M)−(Q−MINF) 〔26〕 AA BBは後方の空白スペース 〔27〕 SS←S+(〜OK)×(BBo.FF) 〔28〕 AA SSはSに欠けているメンバの推定値
を含む改訂距離マトリツクスである。
〔30〕 BR:ItI+1 〔31〕 Z←SSの解 〔32〕 BB←Z〔;1〕 〔33〕 FF←Z〔;2〕 〔34〕 SS←S+(〜OK)×(BBo.+FF) 〔35〕 →BR×1(I<LP) 第14行で各行のすべての存在する項目が計算さ
れる(APLソース・コード中のRとして)。Riは
後継記号としてクラスiを有する2つの記号間の
平均白スペースである。同じように、各項目のす
べての存在する項目の和が(APLソース・コー
ド中のCとして)計算される。Ciは先行記号とし
てクラスiを有する2つの記号間の平均白スペー
スである。第19−21行で次の定数を計算する(コ
ード中にはQとして表わされている)。
ρ1p+ρf=1/N2 Ni Nj Sij 第23行で、行マトリツクスFを得る。Fの第i
番目の要素は直ぐ続く記号としてクラスiの記号
を有するシーケンス(k,i)の距離Sij、1≦
k≦Nの平均値である。第23行のMINFはマトリ
ツクスFの最小の要素を含む。FFはFの各要素
からMINFを減算することによつて形成される行
マトリツクスである。マトリツクスFFの各第i
番目の要素は対応するfiの推定値である。
第25行において、列マトリツクスBが得られ
る。Bの各i番目の要素は直前の記号としてクラ
スiの記号を有するシーケンス(i,k)の距離
Sik、1≦k≦Nの平均値である。BBはBの各
要素から値(Q−MINF)を減算することによつ
て得られる。マトリツクスBBの各第i番目の要
素は対応するbiの推定値である。
第27行で、N×MマトリツクスはAPLの外積
機能を使用してBBとFFを組合すことによつて形
成される。この新らしいマトリツクスの対応する
項目は原マトリツクス中の欠けた項目にあてはめ
られ、すべてのSijの平均距離の新らしい完全な
マトリツクスが形成される。
第4表は第3表のAPLコードの第32乃至39と
関連して使用されるAPLソース・コードのリス
トである。第4表のコードはマトリツクスSS、
BB及びFFを繰返し修正して、bi及びfiのよりよ
い値を与える。
第4表 VZ←Sの解;MINF;R;C;Q;F;B;
BB;F;L 〔1〕 L←(ρSS)〔1〕 〔2〕 Q←(+/+/SS)÷L*2 〔3〕 R←+/SS 〔4〕 C←+/SS 〔5〕 F←C÷L 〔6〕 FF←F−MINF←L/F 〔7〕 BB←(B←R÷L)−(Q−MINF) 〔8〕 Z←BB,〔1.5〕FF V12:10:43 06/30/86 F 発明の効果 以上説明したように、本発明によれば、フアク
シミリの送信が容易になるとともに、フアクシミ
リの外観が改良される。
【図面の簡単な説明】
第1図は本発明を実施したシステムの構成の論
理ブロツク図である。第2図は送信すべき文書の
行の一部を示した図である。第3A図は同じ原型
に属する走査文書からの10個の文字を示した図で
ある。第3b図は第3a図の10個の文字の平均を
示した図である。第4図は記号の異なるクラス間
の平均縁−縁距離のマトリツクス図である。 1…送信装置、2…受信装置、3…OCRスキ
ヤナ、4…バツフア、5…送信CPU、6…受信
CPU、7…プリンタ。

Claims (1)

  1. 【特許請求の範囲】 1 シンボルのプロトタイプ・フアクシミリのラ
    イブラリを作成し、走査されたときの各シンボル
    の表示を、該ライブラリ中のプロトタイプ・フア
    クシミリの対応するものに突き合わせ、原稿上の
    走査された各シンボルの位置を識別するデータを
    生成する段階を有する、原稿から走査されたシン
    ボルのフアクシミリを送信する方法において、 (a) 上記プロトタイプ・フアクシミリに突き合さ
    れた走査されたシンボルの表示全てを平均する
    ことによつて上記ライブラリ中のプロトタイ
    プ・フアクシミリの各々を拡張し、以て拡張さ
    れたプロトタイプ・フアクシミリのライブラリ
    を作成する段階と、 (b) 走査された各々のシンボルの両側にあらわれ
    る白スペースの量を決定する段階と、 (c) 走査された各々のシンボルの拡張されたプロ
    トタイプ・フアクシミリに、該シンボルの両側
    の平均白スペースの量をあらわす位置パラメー
    タを関連付ける段階を有する、 フアクシミリ伝送システムの送信データの減少
    方法。
JP62132010A 1986-10-17 1987-05-29 ファクシミリ伝送システムの送信デ−タの減少方法 Granted JPS63108869A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US920489 1986-10-17
US06/920,489 US4769716A (en) 1986-10-17 1986-10-17 Facsimile transmission using enhanced symbol prototypes with precalculated front and back white spaces

Publications (2)

Publication Number Publication Date
JPS63108869A JPS63108869A (ja) 1988-05-13
JPH0453476B2 true JPH0453476B2 (ja) 1992-08-26

Family

ID=25443835

Family Applications (1)

Application Number Title Priority Date Filing Date
JP62132010A Granted JPS63108869A (ja) 1986-10-17 1987-05-29 ファクシミリ伝送システムの送信デ−タの減少方法

Country Status (4)

Country Link
US (1) US4769716A (ja)
EP (1) EP0263950B1 (ja)
JP (1) JPS63108869A (ja)
DE (1) DE3787865T2 (ja)

Families Citing this family (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5640607A (en) * 1992-04-21 1997-06-17 Microsoft Corporation Method for sending bit mapped image by appending special code to text string and transmitting the text string separately from compressed residual image
US5706364A (en) * 1995-04-28 1998-01-06 Xerox Corporation Method of producing character templates using unsegmented samples
US5956419A (en) * 1995-04-28 1999-09-21 Xerox Corporation Unsupervised training of character templates using unsegmented samples
US5689620A (en) * 1995-04-28 1997-11-18 Xerox Corporation Automatic training of character templates using a transcription and a two-dimensional image source model
US5883986A (en) * 1995-06-02 1999-03-16 Xerox Corporation Method and system for automatic transcription correction
JP3061765B2 (ja) 1996-05-23 2000-07-10 ゼロックス コーポレイション コンピュータベースの文書処理方法
US5884014A (en) * 1996-05-23 1999-03-16 Xerox Corporation Fontless structured document image representations for efficient rendering
US5835638A (en) * 1996-05-30 1998-11-10 Xerox Corporation Method and apparatus for comparing symbols extracted from binary images of text using topology preserved dilated representations of the symbols
US7519221B1 (en) 2005-02-28 2009-04-14 Adobe Systems Incorporated Reconstructing high-fidelity electronic documents from images via generation of synthetic fonts
US7702182B2 (en) * 2006-02-16 2010-04-20 Adobe Systems, Incorporated Method and apparatus for creating a high-fidelity glyph prototype from low-resolution glyph images
US7697758B2 (en) * 2006-09-11 2010-04-13 Google Inc. Shape clustering and cluster-level manual identification in post optical character recognition processing
US7646921B2 (en) * 2006-09-11 2010-01-12 Google Inc. High resolution replication of document based on shape clustering
US8175394B2 (en) * 2006-09-08 2012-05-08 Google Inc. Shape clustering in post optical character recognition processing
US7650035B2 (en) * 2006-09-11 2010-01-19 Google Inc. Optical character recognition based on shape clustering and multiple optical character recognition processes

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS54116121A (en) * 1978-03-01 1979-09-10 Fujitsu Ltd Production system of character train
JPS56100565A (en) * 1980-01-16 1981-08-12 Toshiba Corp Facsimile device
US4463386A (en) * 1982-05-03 1984-07-31 International Business Machines Corporation Facsimile data reduction
US4499596A (en) * 1982-06-28 1985-02-12 International Business Machines Corporation Adaptive facsimile compression using a dynamic extendable decision network
US4494150A (en) * 1982-07-13 1985-01-15 International Business Machines Corporation Word autocorrelation redundancy match facsimile compression for text processing systems
US4499499A (en) * 1982-12-29 1985-02-12 International Business Machines Corporation Method for identification and compression of facsimile symbols in text processing systems
JPS60254871A (ja) * 1984-05-31 1985-12-16 Kokusai Denshin Denwa Co Ltd <Kdd> フアクシミリ画像の符号化方法

Also Published As

Publication number Publication date
EP0263950A3 (en) 1991-03-20
EP0263950A2 (en) 1988-04-20
JPS63108869A (ja) 1988-05-13
US4769716A (en) 1988-09-06
DE3787865D1 (de) 1993-11-25
EP0263950B1 (en) 1993-10-20
DE3787865T2 (de) 1994-05-05

Similar Documents

Publication Publication Date Title
JPH0453476B2 (ja)
JP2940496B2 (ja) パタンマッチング符号化装置及び方法
US7907783B2 (en) Apparatus and method of matching symbols in a text image coding and decoding system
US6351546B1 (en) Image processing method and image processing device
US8719578B2 (en) Document verifying apparatus, document verifying method, and computer product
EP0592238A2 (en) Certifiable optical character recognition
JPS6118381B2 (ja)
GB1584096A (en) Optical character recognition system
US4105997A (en) Method for achieving accurate optical character reading of printed text
CN111630521A (zh) 图像处理方法和图像处理系统
US20190369929A1 (en) Print control device, page data correction method, and raster data generation method
JP2022090947A (ja) 画像処理装置、画像処理方法およびプログラム
US7936897B2 (en) Image forming apparatus
JP4532331B2 (ja) 情報埋め込み装置、情報抽出装置、情報埋め込み方法、情報抽出方法、情報埋め込みプログラム、及び情報抽出プログラム
US4593278A (en) Real time graphic processor
US7505180B2 (en) Optical character recognition using digital information from encoded text embedded in the document
US8314955B2 (en) Apparatus and method for requesting password re-entry for external-device display and not requesting password re-entry for image display on display unit of the apparatus
JP4807401B2 (ja) 画像処理装置、画像形成装置およびプログラム
JP3842914B2 (ja) データ符号化方法/復号方法、データ符号化装置/復号装置、及び、そのデータ符号化方法/復号方法を用いた画像データ記録システム
JPH0333990A (ja) マスク処理を用いる光学式文字認識装置及び方法
JP3781324B2 (ja) 画像位置合わせ方法、ファックス文字認識方法および記録媒体
EP1544791A2 (en) Method and system for estimating the robustness of algorithms for generating characterizing information descriptive of a selected text block
JPH07184069A (ja) 機密文書管理装置
Capitant et al. The application of optical character recognition techniques to bandwidth compression of facsimile data
US10440236B2 (en) Multi-object color caching mechanism