JPH0453476B2 - - Google Patents
Info
- Publication number
- JPH0453476B2 JPH0453476B2 JP62132010A JP13201087A JPH0453476B2 JP H0453476 B2 JPH0453476 B2 JP H0453476B2 JP 62132010 A JP62132010 A JP 62132010A JP 13201087 A JP13201087 A JP 13201087A JP H0453476 B2 JPH0453476 B2 JP H0453476B2
- Authority
- JP
- Japan
- Prior art keywords
- symbol
- prototype
- symbols
- sij
- facsimile
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N1/00—Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
- H04N1/41—Bandwidth or redundancy reduction
- H04N1/411—Bandwidth or redundancy reduction for the transmission or storage or reproduction of two-tone pictures, e.g. black and white pictures
- H04N1/4115—Bandwidth or redundancy reduction for the transmission or storage or reproduction of two-tone pictures, e.g. black and white pictures involving the recognition of specific patterns, e.g. by symbol matching
Landscapes
- Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Signal Processing (AREA)
- Image Processing (AREA)
- Character Input (AREA)
- Character Discrimination (AREA)
- Editing Of Facsimile Originals (AREA)
- Facsimiles In General (AREA)
- Facsimile Transmission Control (AREA)
Description
【発明の詳細な説明】
A 産業上の利用分野
本発明はフアクシミリ伝送及び圧縮に関する。
具体的には、本発明は伝送されるフアクシミリの
外観を改良し、フアクシミリの形成のために送信
されたデータの量を減少する方法に関する。
具体的には、本発明は伝送されるフアクシミリの
外観を改良し、フアクシミリの形成のために送信
されたデータの量を減少する方法に関する。
B 従来技術
米国特許第4499499号は文書がOCR(光学文字
認識)走査記号として送信されるパターン突合せ
装置を説明している。この特許の送信装置及び受
信装置はともに原型のプロトタイプの同じライブ
ラリを保持している。各原型には識別コードが与
えられ、最初の認識にもとづいて、一度だけ送信
される。送信量の減少はその識別コードだけを送
信することによつて、その後の繰返し記号が送信
されることによつて達成される。
認識)走査記号として送信されるパターン突合せ
装置を説明している。この特許の送信装置及び受
信装置はともに原型のプロトタイプの同じライブ
ラリを保持している。各原型には識別コードが与
えられ、最初の認識にもとづいて、一度だけ送信
される。送信量の減少はその識別コードだけを送
信することによつて、その後の繰返し記号が送信
されることによつて達成される。
1980年6月刊IEEE第68巻第7号の組合せシス
テム突合せフアクシミリ・データ圧縮システム中
のプラツト等の論文(Pratt et al,in
Combined System Matching Fascimile Deta
Compression System,“Proceedings of the
IEEE,vol,68,No.7,July 1980)は文書の記
号の繰返しを利用して、フアクシミリの圧縮及び
送信量の減少を達成している。システムは各入力
記号を原型のライブラリの項目と比較する。もし
一致が示されると、対応するライブラリID及び
前の記号に関する水平位置がコード化される。そ
うでない場合は、記号の2進パターンが送信さ
れ、さらに新たな原型要素としてライブラリ中に
置かれる。
テム突合せフアクシミリ・データ圧縮システム中
のプラツト等の論文(Pratt et al,in
Combined System Matching Fascimile Deta
Compression System,“Proceedings of the
IEEE,vol,68,No.7,July 1980)は文書の記
号の繰返しを利用して、フアクシミリの圧縮及び
送信量の減少を達成している。システムは各入力
記号を原型のライブラリの項目と比較する。もし
一致が示されると、対応するライブラリID及び
前の記号に関する水平位置がコード化される。そ
うでない場合は、記号の2進パターンが送信さ
れ、さらに新たな原型要素としてライブラリ中に
置かれる。
米国特許第4499596号は入力PELパターンをラ
イブラリの原型と比較している。一致した場合に
は、インデツクス番号が発生される。一致しない
場合には、パターンはライブラリ中に新らしい原
型として登録される。
イブラリの原型と比較している。一致した場合に
は、インデツクス番号が発生される。一致しない
場合には、パターンはライブラリ中に新らしい原
型として登録される。
従来のパターン突合せフアクシミリ装置では、
各原型は最初の認識に基づいて直ちに送られてい
た。印刷が貧弱な文書によるノイズは貧弱な原型
を生じ、受信される文書のイメージが貧弱であつ
た。さらにこれ等の従来のシステムでは文字間ス
ペースが決定されないので、識別コードは文書中
の記号の相対位置を示すアドレスを伴わないなけ
ればならない。データ送信量の著しい減少は、各
記号に対して1つのアドレスを送信する必要が除
去される時に得られる。
各原型は最初の認識に基づいて直ちに送られてい
た。印刷が貧弱な文書によるノイズは貧弱な原型
を生じ、受信される文書のイメージが貧弱であつ
た。さらにこれ等の従来のシステムでは文字間ス
ペースが決定されないので、識別コードは文書中
の記号の相対位置を示すアドレスを伴わないなけ
ればならない。データ送信量の著しい減少は、各
記号に対して1つのアドレスを送信する必要が除
去される時に得られる。
C 発明が解決しようとする問題点
本発明の目的はフアクシミリの送信を容易にす
る方法及び、フアクシミリの外観を改良する方法
を提供することにある。
る方法及び、フアクシミリの外観を改良する方法
を提供することにある。
D 問題点を解決するための手段
送信量の減少は各原型の両側の白いスペースの
量を決定することによつて達成される。白いスペ
ースの量は原型とともに、そのパラメータの1つ
として受信装置に送られる。その後原型の繰返し
記号に遭遇する時は、識別コードだけが送られ
る。原型は白いスペースがその中に埋込まれた擬
似フオント文字として検索される。文字間スペー
スが擬似フオントについて決定されているので、
文書のページ中の最初のアドレスだけを送ればよ
い。その後の記号はさらにアドレスをつけ加える
必要なく互に次の位置に位置付けられる。
量を決定することによつて達成される。白いスペ
ースの量は原型とともに、そのパラメータの1つ
として受信装置に送られる。その後原型の繰返し
記号に遭遇する時は、識別コードだけが送られ
る。原型は白いスペースがその中に埋込まれた擬
似フオント文字として検索される。文字間スペー
スが擬似フオントについて決定されているので、
文書のページ中の最初のアドレスだけを送ればよ
い。その後の記号はさらにアドレスをつけ加える
必要なく互に次の位置に位置付けられる。
送信されるフアクシミリのみかけは送信される
文書中の記号の繰返し中に存在する冗長度を利用
することによつて改良される。送信装置は同じパ
ターンと突合されるすべての入力記号の平均を求
めこれ等の記号の原型としてこの平均を送信す
る。この結果、送信フアクシミリの品質が増強さ
れる。
文書中の記号の繰返し中に存在する冗長度を利用
することによつて改良される。送信装置は同じパ
ターンと突合されるすべての入力記号の平均を求
めこれ等の記号の原型としてこの平均を送信す
る。この結果、送信フアクシミリの品質が増強さ
れる。
E 実施例
第2図はデイジタル・フアクシミリ送信のため
光学的に走査される文書のテキストの行を示す。
行のマトリツクス表示が得られ、個々の文字パタ
ーンの位置が決定される記号i(文字“v”)には
記号j(文字“a”)が続き、これに記号k(文字
“r”)が続く。記号のスペース・パラメータは幅
W、その前側白スペースf及びその後側白スペー
スによつて特徴付けられる。記号i及びjは白ス
ペースSijによつて分離される。白Sijはbi+fjド
ツト列に等しい。記号j及びkはSjkによつて分
離されている。Sjkはbj+fkドツト列を有する。
光学的に走査される文書のテキストの行を示す。
行のマトリツクス表示が得られ、個々の文字パタ
ーンの位置が決定される記号i(文字“v”)には
記号j(文字“a”)が続き、これに記号k(文字
“r”)が続く。記号のスペース・パラメータは幅
W、その前側白スペースf及びその後側白スペー
スによつて特徴付けられる。記号i及びjは白ス
ペースSijによつて分離される。白Sijはbi+fjド
ツト列に等しい。記号j及びkはSjkによつて分
離されている。Sjkはbj+fkドツト列を有する。
記号jのwj,Sij及びsjkはデイジタル・イメー
ジ上で直接測定出来る。しかしながら、記号前側
白スペースfj及び後方白スペースbjは直接測定出
来ずSij及びSjkからだけ誘導出来る。
ジ上で直接測定出来る。しかしながら、記号前側
白スペースfj及び後方白スペースbjは直接測定出
来ずSij及びSjkからだけ誘導出来る。
パターン突合せの技術用語では、クラスiは第
i番目の原型と一致する記号の集合として定義さ
れる。
i番目の原型と一致する記号の集合として定義さ
れる。
パラメータwjはクラスiの平均値として評定
される。
される。
bi及びfjを評定するためには、全文書について
文字間スペースを先ず測定する。Sijはクラスi
及びクラスjのパターン間の平均白スペースとす
る。Sijはクラスi及びクラスjのパターンの平
均白スペースとする。Sijはクラスi及びクラス
jのパターン間の平均白スペースとする。bj及び
fjの評定は次式(1)の差の2乗和を最小にすること
によつて得ることが出来る。
文字間スペースを先ず測定する。Sijはクラスi
及びクラスjのパターン間の平均白スペースとす
る。Sijはクラスi及びクラスjのパターンの平
均白スペースとする。Sijはクラスi及びクラス
jのパターン間の平均白スペースとする。bj及び
fjの評定は次式(1)の差の2乗和を最小にすること
によつて得ることが出来る。
SD=o
〓i o
〓j
δij〔Sij−(bi+fj)〕2 (1)
ここで
δij=1:テキト中にクラスのシーケンス(i,j)
が生じた場合 0:その他の場合 最小化はbi及びfjに関して式(1)をbj及びfjに関
して微分し、結果を0に等しいと置くことによつ
て達成される。これによつて次の2N元を生ずる。
が生じた場合 0:その他の場合 最小化はbi及びfjに関して式(1)をbj及びfjに関
して微分し、結果を0に等しいと置くことによつ
て達成される。これによつて次の2N元を生ずる。
Ri=mibi+o
〓j
δij fj i=1乃至N (2)
Cj=njfi+o
〓i
δij bi j=i乃型N (3)
ここで
Ri=aibi+o
〓j
δij fiiに直ぐ続くすべての原型の
推定前側スペースの和 Ci=nifi+o 〓j δij bijの直ぐ前(先行)の原型の
推定後側スペースの和 mi=o 〓j 原型iに直ぐ続く原型の数 ni=o 〓i δij原型jの直ぐ前の原型の数 各クラスの対が存在するならば、即ちすべての
i,jについてδij=1ならば、解くべき式は式
は次の通りとなる。
推定前側スペースの和 Ci=nifi+o 〓j δij bijの直ぐ前(先行)の原型の
推定後側スペースの和 mi=o 〓j 原型iに直ぐ続く原型の数 ni=o 〓i δij原型jの直ぐ前の原型の数 各クラスの対が存在するならば、即ちすべての
i,jについてδij=1ならば、解くべき式は式
は次の通りとなる。
Ri=Nbi+o
〓j
fii=1乃至N
Ci=Nfj+o
〓j
bij=1乃至N
これを解いて、
Bbi=Ri/N−σb (4)
fj=Ci/N−σj (5)
ここでσb,σfは次式を満足する任意の定数で
ある。
ある。
σb+σf=1/N2 N
〓1 N
〓j
Sij (6)
ここでこれ等の定数はすべての間隔パラメータ
が非負の定数になるように選択されなければなら
ない。
が非負の定数になるように選択されなければなら
ない。
もしすべてのクラス対が文書中に生じなけれ
ば、一般の場合は次式 bi=Ri/mi i=1,2,…N fi=Ci/ni i=1,2,……N を使用してbi及びfjの最初の推定値を先ず求めて
一般的な場合について解くことができる。
ば、一般の場合は次式 bi=Ri/mi i=1,2,…N fi=Ci/ni i=1,2,……N を使用してbi及びfjの最初の推定値を先ず求めて
一般的な場合について解くことができる。
これ等の値は消去したSijを求めるのに使用さ
れる。
れる。
Sij(1)=bi(0) +fi(0)
Sij その他の場合
これによつてSijの完全な集合が与えられる。
式4,5及び6はbi,fiの新らしい推定値を得る
のに使用される。この手続を繰返すと、第kルー
プでは次の値が計算される。
式4,5及び6はbi,fiの新らしい推定値を得る
のに使用される。この手続を繰返すと、第kルー
プでは次の値が計算される。
bi(k)=Ri(k-1)/N−σb(k-1)
fi(k)=Ci(k-1)/N−σb(k-1)
この過程を収歛する迄繰返す。
文字幅の変動はSijの観測値に影響を与える。
例えばぼけた文字は余分の白スペースを増す。よ
り正確な推定値は空白スペースSijでなくクラス
i及びj間の平均中心間距離cijを測定すること
によつて得られる。上述の手続を使用して次式を
最小にする。
例えばぼけた文字は余分の白スペースを増す。よ
り正確な推定値は空白スペースSijでなくクラス
i及びj間の平均中心間距離cijを測定すること
によつて得られる。上述の手続を使用して次式を
最小にする。
SD′=N
〓i N
〓j
Sij〔Cij−(bi+fj+wi/2+wj/2)〕2Sijを
(Cij−Wi+Wj/2)によつて置換する。
第1図は送信装置1及び受信装置2を有する構
造体を示す。送信装置1はIBMモデル8815のよ
うな市販のOCRスキヤナ3を含む。スキヤナ3
は送信さるべき文書を走査して、バツフア4中に
保管されるデータ出力を発生する。本実施例では
IBM PCであるバツフア4は中央処理ユニツトへ
の端末としても機能する。送信CPU5はAPLラ
ンゲージ・プロセツサによつて規定されるAPL
インタープリタの下で稼動するIBMシステム/
370でよい(1978年発行IBMマニユアル第G6
26−3847号、第5版リリース第3号:Release
NO.3published in the IBM NO.G6 26−3847,
5th Edition,in 1987参照)システム/370アー
キテクチヤは米国特許第3226689号及び刊行物
「IBMシステム/370の動作原理」フオームA22−
7000−4“IBM System/370 Prin ciples of
Operation,” formA22−7000−4中に説明されている。実
施のためには、IBMシステム/370の下で稼動す
るAPLソース・コードが使用されたが、他のプ
ログラミング言語及び計算装置を使用して、不当
な試験を行うことなく同等な機能を遂行させこと
が出来る。
造体を示す。送信装置1はIBMモデル8815のよ
うな市販のOCRスキヤナ3を含む。スキヤナ3
は送信さるべき文書を走査して、バツフア4中に
保管されるデータ出力を発生する。本実施例では
IBM PCであるバツフア4は中央処理ユニツトへ
の端末としても機能する。送信CPU5はAPLラ
ンゲージ・プロセツサによつて規定されるAPL
インタープリタの下で稼動するIBMシステム/
370でよい(1978年発行IBMマニユアル第G6
26−3847号、第5版リリース第3号:Release
NO.3published in the IBM NO.G6 26−3847,
5th Edition,in 1987参照)システム/370アー
キテクチヤは米国特許第3226689号及び刊行物
「IBMシステム/370の動作原理」フオームA22−
7000−4“IBM System/370 Prin ciples of
Operation,” formA22−7000−4中に説明されている。実
施のためには、IBMシステム/370の下で稼動す
るAPLソース・コードが使用されたが、他のプ
ログラミング言語及び計算装置を使用して、不当
な試験を行うことなく同等な機能を遂行させこと
が出来る。
受信装置2はIBMシステム/370計算機である
受信CPU6より成る。受信CPU6はフオントが
その上位計算機からロードされるIBMページ・
プリンタ・モデル3812のようなプリンタ・フレク
シブル・ページ・プリンタ(しばしばレーザ・プ
リンタ)7に接続される。
受信CPU6より成る。受信CPU6はフオントが
その上位計算機からロードされるIBMページ・
プリンタ・モデル3812のようなプリンタ・フレク
シブル・ページ・プリンタ(しばしばレーザ・プ
リンタ)7に接続される。
光学認識装置を使用する記号の識別方法は一般
に知られているので、本発明の方法は記号が既に
走査されて識別された時点から出発して説明した
方がわかりやすいであろう。
に知られているので、本発明の方法は記号が既に
走査されて識別された時点から出発して説明した
方がわかりやすいであろう。
(a) 平均による雑音の減少
送信されるべき文書はOCRスキヤナ3によつ
て走査される。送信CPU5によつて受取られる
各走査記号はp×qビツト配列体として登録され
ている。配列体中の1ビツトは黒ペルを、0は白
ペルを示す。送信CPUは各ビツト配列体ごとに
パターンと突合され、一致したパターンに依存し
て識別コード(ID)を割当てる。
て走査される。送信CPU5によつて受取られる
各走査記号はp×qビツト配列体として登録され
ている。配列体中の1ビツトは黒ペルを、0は白
ペルを示す。送信CPUは各ビツト配列体ごとに
パターンと突合され、一致したパターンに依存し
て識別コード(ID)を割当てる。
文字の終りに到達した時に、送信CPUは登録
されていたビツト配列体及び夫々のIDを検索す
る。次に第1表の凝似コードによつて説明された
のと同じ方法でビツト配列体を平均する。
されていたビツト配列体及び夫々のIDを検索す
る。次に第1表の凝似コードによつて説明された
のと同じ方法でビツト配列体を平均する。
第1表
Do for id=1、to M M=原型の総数
Initialize N to 0
Initialize array A(p,q)to 0
Do for K=1 to Z Z=記憶配列体の総
数 Read array (k) If Ib of array(k)=id Increment N Do for i=1 to p,j=1 to q Add bit(i,j)of array(k) to
A(i,j) Enddo Endif Enddo Divide A(i,j)by N Do for i=1 to p,and j=1 to q If A(i,j)is greater than a threshold Then A(j,j),else A(i,j)=0 Endif Enddo 第3a図は同一パターンに一致する記号を示
す。第3b図はこれ等の10個の記号の平均を示
す。第3b図の平均は10個の配列体を加算し、値
=5で閾値操作を行うことによつて誘導される。
数 Read array (k) If Ib of array(k)=id Increment N Do for i=1 to p,j=1 to q Add bit(i,j)of array(k) to
A(i,j) Enddo Endif Enddo Divide A(i,j)by N Do for i=1 to p,and j=1 to q If A(i,j)is greater than a threshold Then A(j,j),else A(i,j)=0 Endif Enddo 第3a図は同一パターンに一致する記号を示
す。第3b図はこれ等の10個の記号の平均を示
す。第3b図の平均は10個の配列体を加算し、値
=5で閾値操作を行うことによつて誘導される。
パターンに属するすべてのビツトの平均の結果
A(i,j)をそのパターンの原型として使用す
る。この原型は受信システムに送られ、ここでフ
オントが形成される。文書の形成中で、対応する
記号が印刷されるべき時にフオントが使用され
る。
A(i,j)をそのパターンの原型として使用す
る。この原型は受信システムに送られ、ここでフ
オントが形成される。文書の形成中で、対応する
記号が印刷されるべき時にフオントが使用され
る。
(b) 白スペース・パラメータの決定
クラスi及びクラスjの記号間の中心間の距離
Cijが測定される。次にCijの平均は第1表に示さ
れた手続中で計算される。増強原型iの幅wi及
び増強原型jの幅wjはセクシヨン(a)の平均を求
めた後に決定される。Cijの平均からwiの半分及
びwjの半分をCijの平均から減算した後に、クラ
ス及びjの記号間の平均縁−縁距離が与えられ
る。
Cijが測定される。次にCijの平均は第1表に示さ
れた手続中で計算される。増強原型iの幅wi及
び増強原型jの幅wjはセクシヨン(a)の平均を求
めた後に決定される。Cijの平均からwiの半分及
びwjの半分をCijの平均から減算した後に、クラ
ス及びjの記号間の平均縁−縁距離が与えられ
る。
第2表はクラスi及びjの記号の平均縁−縁距
離を求めるためのAPLソース・コードのリスト
を示す。本実施例では縁−縁距離が使用される
が、本発明の白スペースの計算する本発明の方法
は不当な試験を行うことなく、記号の予じめ指定
した点間の他の距離を使用して実施できる。
離を求めるためのAPLソース・コードのリスト
を示す。本実施例では縁−縁距離が使用される
が、本発明の白スペースの計算する本発明の方法
は不当な試験を行うことなく、記号の予じめ指定
した点間の他の距離を使用して実施できる。
第2表
VZ←CTR-TO-CTR P;I;Q;Q1
〔1〕 AAZ〔I:J〕=クラスI及びJ間のctr−
to−ctr距離 〔2〕 Z←(2,2ρ「/P〔;1〕)ρ0 〔3〕 I←1 〔4〕 BR:50 FLASH ItI+1 〔5〕 Q1←P〔I−1;〕 〔6〕 Q←P〔I;〕 〔7〕 →SKP×1Q1〔6〕=0 〔8〕 AスペースもしくはEOL:次のパターンに
スキツプ 〔9〕 I←I+1 〔10〕 →END 〔11〕 SKP: 〔12〕 X←(Q〔3〕+0.5×Q〔5〕)−(Q1〔3
〕+
0.5×Q1〔5〕) 〔13〕 Z←〔1;Q1〔1〕;Q〔1〕〕−(Q1〔3〕
+
0.5×Q1〔5〕) 〔13〕 Z←〔1;Q1〔1〕;Q〔1〕)−(Q1〔3〕
+
0.5×Q1〔5〕) 〔14〕 Z←〔1;Q1〔1〕;Q〔1〕〕−Z〔2;Q1
〔1〕;Q〔1〕;Q〔1〕〕+1 〔15〕 END:→BR×LI<I↑ρP 〔16〕 Z〔1;;〕←Z〔1;;〕÷1「Z(2;;
」 〔17〕 AA対中の各パターンの幅の距離から減算
する 〔18〕 Z(1;;〕←L0.5+Z〔1;;〕−0.5×(
Z
〔2;;〕>0)×Vo,+V←AVG-WDTH P 〔19〕 AAZがここで縁−縁距離を与える。
to−ctr距離 〔2〕 Z←(2,2ρ「/P〔;1〕)ρ0 〔3〕 I←1 〔4〕 BR:50 FLASH ItI+1 〔5〕 Q1←P〔I−1;〕 〔6〕 Q←P〔I;〕 〔7〕 →SKP×1Q1〔6〕=0 〔8〕 AスペースもしくはEOL:次のパターンに
スキツプ 〔9〕 I←I+1 〔10〕 →END 〔11〕 SKP: 〔12〕 X←(Q〔3〕+0.5×Q〔5〕)−(Q1〔3
〕+
0.5×Q1〔5〕) 〔13〕 Z←〔1;Q1〔1〕;Q〔1〕〕−(Q1〔3〕
+
0.5×Q1〔5〕) 〔13〕 Z←〔1;Q1〔1〕;Q〔1〕)−(Q1〔3〕
+
0.5×Q1〔5〕) 〔14〕 Z←〔1;Q1〔1〕;Q〔1〕〕−Z〔2;Q1
〔1〕;Q〔1〕;Q〔1〕〕+1 〔15〕 END:→BR×LI<I↑ρP 〔16〕 Z〔1;;〕←Z〔1;;〕÷1「Z(2;;
」 〔17〕 AA対中の各パターンの幅の距離から減算
する 〔18〕 Z(1;;〕←L0.5+Z〔1;;〕−0.5×(
Z
〔2;;〕>0)×Vo,+V←AVG-WDTH P 〔19〕 AAZがここで縁−縁距離を与える。
すべての存在する縁−縁距離Sijが決定された
後に、第4図に示された形式のマトリツクス中へ
置かれる。
後に、第4図に示された形式のマトリツクス中へ
置かれる。
第4図のマトリツクスの各行xは直前の記号と
してクラスの記号xを有するすべてのクラスのシ
ーケンス(x,k)の平均距離Sxy,1≦k≦N
を含む。マトリツクスの各列yは直ちに後続する
記号としてクラスyの記号を有するすべてのクラ
スのシーケンス(k,y)の平均距離Sky、1≦
k≦Nを含む。
してクラスの記号xを有するすべてのクラスのシ
ーケンス(x,k)の平均距離Sxy,1≦k≦N
を含む。マトリツクスの各列yは直ちに後続する
記号としてクラスyの記号を有するすべてのクラ
スのシーケンス(k,y)の平均距離Sky、1≦
k≦Nを含む。
すべてのクラス・シーケンスは文書中に存在し
ないので、マトリツクス中にはいくつかの欠けた
項目が存在する。式(4)及び(5)はしかしながら、す
べてのクラス・シーケンスが存在するときに使用
することができないので、欠けている項目を決定
しなければならない。
ないので、マトリツクス中にはいくつかの欠けた
項目が存在する。式(4)及び(5)はしかしながら、す
べてのクラス・シーケンスが存在するときに使用
することができないので、欠けている項目を決定
しなければならない。
第3表は欠けたSijの推定値を見出すための
APLソース・コードの一部のリストを示す。
APLソース・コードの一部のリストを示す。
第3表
VZ←NS SPACEMIN S;MINF;I;LP;
M;N;R;C;F;B;BB;FF;SS;
OK;L 〔1〕 AAの字間距離を最も良く表わす間隔パラ
メータ 〔2〕 AAの選択。米国特許第4499596号参照 〔3〕 I←0 〔4〕 AA Iはループ・インデツクス 〔5〕 St(OK←NS≠0)×S 〔6〕 AA S=距離の入力マトリツクス、NSが
各距離のサンプル数を示す。
M;N;R;C;F;B;BB;FF;SS;
OK;L 〔1〕 AAの字間距離を最も良く表わす間隔パラ
メータ 〔2〕 AAの選択。米国特許第4499596号参照 〔3〕 I←0 〔4〕 AA Iはループ・インデツクス 〔5〕 St(OK←NS≠0)×S 〔6〕 AA S=距離の入力マトリツクス、NSが
各距離のサンプル数を示す。
〔7〕 □←‘ループ数?’
〔8〕 LP←□
〔9〕 AA LPはアルゴリズムの繰返し数であ
る。
る。
〔10〕 M←+/S≠0
〔11〕 M〔I〕=行i中にあるサンプルについての
項目数 〔12〕 N←+S≠0 〔13〕 AAN〔I〕=列i中あるサンプルについて
の項目数 〔14〕 R←+/S 〔15〕 AA R=Sの行の和 〔16〕 C←+≠S 〔17〕 AA C=Sの列和 〔18〕 註:R,C,M,Nは上記米国特許出願に
記載してあるとおり。
項目数 〔12〕 N←+S≠0 〔13〕 AAN〔I〕=列i中あるサンプルについて
の項目数 〔14〕 R←+/S 〔15〕 AA R=Sの行の和 〔16〕 C←+≠S 〔17〕 AA C=Sの列和 〔18〕 註:R,C,M,Nは上記米国特許出願に
記載してあるとおり。
〔19〕 Lt(ρS)〔1〕
〔20〕 AA L=S中の行(列)の数
〔21〕 Q←(+/+/S)÷*2
〔22〕 AA QはFF及びBBを調節するのに必要な
定数である。
定数である。
〔23〕 FF←F−MINF←L/F←(C÷N)
〔24〕 AA FFは前方の空白スペース
〔25〕 BB←(BtR÷M)−(Q−MINF)
〔26〕 AA BBは後方の空白スペース
〔27〕 SS←S+(〜OK)×(BBo.FF)
〔28〕 AA SSはSに欠けているメンバの推定値
を含む改訂距離マトリツクスである。
を含む改訂距離マトリツクスである。
〔30〕 BR:ItI+1
〔31〕 Z←SSの解
〔32〕 BB←Z〔;1〕
〔33〕 FF←Z〔;2〕
〔34〕 SS←S+(〜OK)×(BBo.+FF)
〔35〕 →BR×1(I<LP)
第14行で各行のすべての存在する項目が計算さ
れる(APLソース・コード中のRとして)。Riは
後継記号としてクラスiを有する2つの記号間の
平均白スペースである。同じように、各項目のす
べての存在する項目の和が(APLソース・コー
ド中のCとして)計算される。Ciは先行記号とし
てクラスiを有する2つの記号間の平均白スペー
スである。第19−21行で次の定数を計算する(コ
ード中にはQとして表わされている)。
れる(APLソース・コード中のRとして)。Riは
後継記号としてクラスiを有する2つの記号間の
平均白スペースである。同じように、各項目のす
べての存在する項目の和が(APLソース・コー
ド中のCとして)計算される。Ciは先行記号とし
てクラスiを有する2つの記号間の平均白スペー
スである。第19−21行で次の定数を計算する(コ
ード中にはQとして表わされている)。
ρ1p+ρf=1/N2 N
〓i N
〓j
Sij
第23行で、行マトリツクスFを得る。Fの第i
番目の要素は直ぐ続く記号としてクラスiの記号
を有するシーケンス(k,i)の距離Sij、1≦
k≦Nの平均値である。第23行のMINFはマトリ
ツクスFの最小の要素を含む。FFはFの各要素
からMINFを減算することによつて形成される行
マトリツクスである。マトリツクスFFの各第i
番目の要素は対応するfiの推定値である。
番目の要素は直ぐ続く記号としてクラスiの記号
を有するシーケンス(k,i)の距離Sij、1≦
k≦Nの平均値である。第23行のMINFはマトリ
ツクスFの最小の要素を含む。FFはFの各要素
からMINFを減算することによつて形成される行
マトリツクスである。マトリツクスFFの各第i
番目の要素は対応するfiの推定値である。
第25行において、列マトリツクスBが得られ
る。Bの各i番目の要素は直前の記号としてクラ
スiの記号を有するシーケンス(i,k)の距離
Sik、1≦k≦Nの平均値である。BBはBの各
要素から値(Q−MINF)を減算することによつ
て得られる。マトリツクスBBの各第i番目の要
素は対応するbiの推定値である。
る。Bの各i番目の要素は直前の記号としてクラ
スiの記号を有するシーケンス(i,k)の距離
Sik、1≦k≦Nの平均値である。BBはBの各
要素から値(Q−MINF)を減算することによつ
て得られる。マトリツクスBBの各第i番目の要
素は対応するbiの推定値である。
第27行で、N×MマトリツクスはAPLの外積
機能を使用してBBとFFを組合すことによつて形
成される。この新らしいマトリツクスの対応する
項目は原マトリツクス中の欠けた項目にあてはめ
られ、すべてのSijの平均距離の新らしい完全な
マトリツクスが形成される。
機能を使用してBBとFFを組合すことによつて形
成される。この新らしいマトリツクスの対応する
項目は原マトリツクス中の欠けた項目にあてはめ
られ、すべてのSijの平均距離の新らしい完全な
マトリツクスが形成される。
第4表は第3表のAPLコードの第32乃至39と
関連して使用されるAPLソース・コードのリス
トである。第4表のコードはマトリツクスSS、
BB及びFFを繰返し修正して、bi及びfiのよりよ
い値を与える。
関連して使用されるAPLソース・コードのリス
トである。第4表のコードはマトリツクスSS、
BB及びFFを繰返し修正して、bi及びfiのよりよ
い値を与える。
第4表
VZ←Sの解;MINF;R;C;Q;F;B;
BB;F;L 〔1〕 L←(ρSS)〔1〕 〔2〕 Q←(+/+/SS)÷L*2 〔3〕 R←+/SS 〔4〕 C←+/SS 〔5〕 F←C÷L 〔6〕 FF←F−MINF←L/F 〔7〕 BB←(B←R÷L)−(Q−MINF) 〔8〕 Z←BB,〔1.5〕FF V12:10:43 06/30/86 F 発明の効果 以上説明したように、本発明によれば、フアク
シミリの送信が容易になるとともに、フアクシミ
リの外観が改良される。
BB;F;L 〔1〕 L←(ρSS)〔1〕 〔2〕 Q←(+/+/SS)÷L*2 〔3〕 R←+/SS 〔4〕 C←+/SS 〔5〕 F←C÷L 〔6〕 FF←F−MINF←L/F 〔7〕 BB←(B←R÷L)−(Q−MINF) 〔8〕 Z←BB,〔1.5〕FF V12:10:43 06/30/86 F 発明の効果 以上説明したように、本発明によれば、フアク
シミリの送信が容易になるとともに、フアクシミ
リの外観が改良される。
第1図は本発明を実施したシステムの構成の論
理ブロツク図である。第2図は送信すべき文書の
行の一部を示した図である。第3A図は同じ原型
に属する走査文書からの10個の文字を示した図で
ある。第3b図は第3a図の10個の文字の平均を
示した図である。第4図は記号の異なるクラス間
の平均縁−縁距離のマトリツクス図である。 1…送信装置、2…受信装置、3…OCRスキ
ヤナ、4…バツフア、5…送信CPU、6…受信
CPU、7…プリンタ。
理ブロツク図である。第2図は送信すべき文書の
行の一部を示した図である。第3A図は同じ原型
に属する走査文書からの10個の文字を示した図で
ある。第3b図は第3a図の10個の文字の平均を
示した図である。第4図は記号の異なるクラス間
の平均縁−縁距離のマトリツクス図である。 1…送信装置、2…受信装置、3…OCRスキ
ヤナ、4…バツフア、5…送信CPU、6…受信
CPU、7…プリンタ。
Claims (1)
- 【特許請求の範囲】 1 シンボルのプロトタイプ・フアクシミリのラ
イブラリを作成し、走査されたときの各シンボル
の表示を、該ライブラリ中のプロトタイプ・フア
クシミリの対応するものに突き合わせ、原稿上の
走査された各シンボルの位置を識別するデータを
生成する段階を有する、原稿から走査されたシン
ボルのフアクシミリを送信する方法において、 (a) 上記プロトタイプ・フアクシミリに突き合さ
れた走査されたシンボルの表示全てを平均する
ことによつて上記ライブラリ中のプロトタイ
プ・フアクシミリの各々を拡張し、以て拡張さ
れたプロトタイプ・フアクシミリのライブラリ
を作成する段階と、 (b) 走査された各々のシンボルの両側にあらわれ
る白スペースの量を決定する段階と、 (c) 走査された各々のシンボルの拡張されたプロ
トタイプ・フアクシミリに、該シンボルの両側
の平均白スペースの量をあらわす位置パラメー
タを関連付ける段階を有する、 フアクシミリ伝送システムの送信データの減少
方法。
Applications Claiming Priority (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| US920489 | 1986-10-17 | ||
| US06/920,489 US4769716A (en) | 1986-10-17 | 1986-10-17 | Facsimile transmission using enhanced symbol prototypes with precalculated front and back white spaces |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPS63108869A JPS63108869A (ja) | 1988-05-13 |
| JPH0453476B2 true JPH0453476B2 (ja) | 1992-08-26 |
Family
ID=25443835
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP62132010A Granted JPS63108869A (ja) | 1986-10-17 | 1987-05-29 | ファクシミリ伝送システムの送信デ−タの減少方法 |
Country Status (4)
| Country | Link |
|---|---|
| US (1) | US4769716A (ja) |
| EP (1) | EP0263950B1 (ja) |
| JP (1) | JPS63108869A (ja) |
| DE (1) | DE3787865T2 (ja) |
Families Citing this family (14)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US5640607A (en) * | 1992-04-21 | 1997-06-17 | Microsoft Corporation | Method for sending bit mapped image by appending special code to text string and transmitting the text string separately from compressed residual image |
| US5706364A (en) * | 1995-04-28 | 1998-01-06 | Xerox Corporation | Method of producing character templates using unsegmented samples |
| US5956419A (en) * | 1995-04-28 | 1999-09-21 | Xerox Corporation | Unsupervised training of character templates using unsegmented samples |
| US5689620A (en) * | 1995-04-28 | 1997-11-18 | Xerox Corporation | Automatic training of character templates using a transcription and a two-dimensional image source model |
| US5883986A (en) * | 1995-06-02 | 1999-03-16 | Xerox Corporation | Method and system for automatic transcription correction |
| JP3061765B2 (ja) | 1996-05-23 | 2000-07-10 | ゼロックス コーポレイション | コンピュータベースの文書処理方法 |
| US5884014A (en) * | 1996-05-23 | 1999-03-16 | Xerox Corporation | Fontless structured document image representations for efficient rendering |
| US5835638A (en) * | 1996-05-30 | 1998-11-10 | Xerox Corporation | Method and apparatus for comparing symbols extracted from binary images of text using topology preserved dilated representations of the symbols |
| US7519221B1 (en) | 2005-02-28 | 2009-04-14 | Adobe Systems Incorporated | Reconstructing high-fidelity electronic documents from images via generation of synthetic fonts |
| US7702182B2 (en) * | 2006-02-16 | 2010-04-20 | Adobe Systems, Incorporated | Method and apparatus for creating a high-fidelity glyph prototype from low-resolution glyph images |
| US7697758B2 (en) * | 2006-09-11 | 2010-04-13 | Google Inc. | Shape clustering and cluster-level manual identification in post optical character recognition processing |
| US7646921B2 (en) * | 2006-09-11 | 2010-01-12 | Google Inc. | High resolution replication of document based on shape clustering |
| US8175394B2 (en) * | 2006-09-08 | 2012-05-08 | Google Inc. | Shape clustering in post optical character recognition processing |
| US7650035B2 (en) * | 2006-09-11 | 2010-01-19 | Google Inc. | Optical character recognition based on shape clustering and multiple optical character recognition processes |
Family Cites Families (7)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS54116121A (en) * | 1978-03-01 | 1979-09-10 | Fujitsu Ltd | Production system of character train |
| JPS56100565A (en) * | 1980-01-16 | 1981-08-12 | Toshiba Corp | Facsimile device |
| US4463386A (en) * | 1982-05-03 | 1984-07-31 | International Business Machines Corporation | Facsimile data reduction |
| US4499596A (en) * | 1982-06-28 | 1985-02-12 | International Business Machines Corporation | Adaptive facsimile compression using a dynamic extendable decision network |
| US4494150A (en) * | 1982-07-13 | 1985-01-15 | International Business Machines Corporation | Word autocorrelation redundancy match facsimile compression for text processing systems |
| US4499499A (en) * | 1982-12-29 | 1985-02-12 | International Business Machines Corporation | Method for identification and compression of facsimile symbols in text processing systems |
| JPS60254871A (ja) * | 1984-05-31 | 1985-12-16 | Kokusai Denshin Denwa Co Ltd <Kdd> | フアクシミリ画像の符号化方法 |
-
1986
- 1986-10-17 US US06/920,489 patent/US4769716A/en not_active Expired - Lifetime
-
1987
- 1987-05-29 JP JP62132010A patent/JPS63108869A/ja active Granted
- 1987-08-28 DE DE87112542T patent/DE3787865T2/de not_active Expired - Fee Related
- 1987-08-28 EP EP87112542A patent/EP0263950B1/en not_active Expired - Lifetime
Also Published As
| Publication number | Publication date |
|---|---|
| EP0263950A3 (en) | 1991-03-20 |
| EP0263950A2 (en) | 1988-04-20 |
| JPS63108869A (ja) | 1988-05-13 |
| US4769716A (en) | 1988-09-06 |
| DE3787865D1 (de) | 1993-11-25 |
| EP0263950B1 (en) | 1993-10-20 |
| DE3787865T2 (de) | 1994-05-05 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| JPH0453476B2 (ja) | ||
| JP2940496B2 (ja) | パタンマッチング符号化装置及び方法 | |
| US7907783B2 (en) | Apparatus and method of matching symbols in a text image coding and decoding system | |
| US6351546B1 (en) | Image processing method and image processing device | |
| US8719578B2 (en) | Document verifying apparatus, document verifying method, and computer product | |
| EP0592238A2 (en) | Certifiable optical character recognition | |
| JPS6118381B2 (ja) | ||
| GB1584096A (en) | Optical character recognition system | |
| US4105997A (en) | Method for achieving accurate optical character reading of printed text | |
| CN111630521A (zh) | 图像处理方法和图像处理系统 | |
| US20190369929A1 (en) | Print control device, page data correction method, and raster data generation method | |
| JP2022090947A (ja) | 画像処理装置、画像処理方法およびプログラム | |
| US7936897B2 (en) | Image forming apparatus | |
| JP4532331B2 (ja) | 情報埋め込み装置、情報抽出装置、情報埋め込み方法、情報抽出方法、情報埋め込みプログラム、及び情報抽出プログラム | |
| US4593278A (en) | Real time graphic processor | |
| US7505180B2 (en) | Optical character recognition using digital information from encoded text embedded in the document | |
| US8314955B2 (en) | Apparatus and method for requesting password re-entry for external-device display and not requesting password re-entry for image display on display unit of the apparatus | |
| JP4807401B2 (ja) | 画像処理装置、画像形成装置およびプログラム | |
| JP3842914B2 (ja) | データ符号化方法/復号方法、データ符号化装置/復号装置、及び、そのデータ符号化方法/復号方法を用いた画像データ記録システム | |
| JPH0333990A (ja) | マスク処理を用いる光学式文字認識装置及び方法 | |
| JP3781324B2 (ja) | 画像位置合わせ方法、ファックス文字認識方法および記録媒体 | |
| EP1544791A2 (en) | Method and system for estimating the robustness of algorithms for generating characterizing information descriptive of a selected text block | |
| JPH07184069A (ja) | 機密文書管理装置 | |
| Capitant et al. | The application of optical character recognition techniques to bandwidth compression of facsimile data | |
| US10440236B2 (en) | Multi-object color caching mechanism |