JP2002015279A

JP2002015279A - ハードコピー・ドキュメントのための画像データ復号化方法及び同装置

Info

Publication number: JP2002015279A
Application number: JP2001140812A
Authority: JP
Inventors: Daniel H Greene; エイチ．グリーンダニエル; Ashok C Popat; シー．ポパットアショック
Original assignee: Xerox Corp
Current assignee: Xerox Corp
Priority date: 2000-05-19
Filing date: 2001-05-11
Publication date: 2002-01-18
Anticipated expiration: 2021-05-11
Also published as: US7110621B1; JP4582953B2

Abstract

(57)【要約】【課題】アシスト・チャネルを用いてＯＣＲ精度を向
上させる方法を提供する。【解決手段】ハードコピー・アシスト・チャネル２０
４において、画像抽出モジュール２１０は、ビットマッ
プ画像データ２０６を受信し、アシスト・チャネル１１
８のデータと、ビットマップ一次チャネル２１４のデー
タとを切り離す。デコーダ・モジュール３２０４は、復
号化及び圧縮解除されたアシスト・チャネル２１９から
のサポートなしに、ビットマップ一次データ２１４を復
号化し、一次データの候補３２０２を生成する。リライ
ト・モジュール３２００は、一次データの候補３２０２
と、復号化及び圧縮解除されたアシスト・チャネル２１
９とを入力として受け取り、データ１１２の一次チャネ
ルを生成する。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、概してドキュメン
ト画像符号化及び復号化に関し、より詳細には、光学文
字認識（ＯＣＲ）の精度を向上させるための方法及び装
置に関する。

【０００２】

【従来の技術】入力スキャナは、ハードコピー・ドキュ
メントを電子ドキュメント処理システムにアップロード
するために開発された。これらのスキャナは一般に、ハ
ードコピー・ドキュメントの外観をラスタ・フォーマッ
トのデジタル・データストリームに変換し、それによっ
て、ハードコピー・ドキュメントの外観を表すビットマ
ップ表現をもたらす。ScanSoft社により製作されるText
bridge等のＯＣＲシステムは、ビットマップ・ドキュメ
ントの外観を、対応する記号的な符号に変換する。残念
ながら、特定のビットマップ・パターンと、対応するド
キュメント符号化（例えばASCII）との間の相関関係を
推測する際に、ＯＣＲシステムはエラーを起こすことか
ら免れない。

【０００３】この問題は、混同される可能性（確率）の
高い文字（例えば１、｜及びＩ）に対して明確に異なる
印刷特徴を与えるＯＣＲ−Ｂフォント等の特殊なフォン
トをデザインすることにより対処されている。これは、
ＯＣＲシステムが、ビットマップ・パターンと、それに
対応するドキュメント符号化との間の相関関係をより正
確に推測することを可能にする。更に、Plumb他は、
「ＯＣＲを介してソース・コードをパブリッシュするた
めのツール（Tools for Publishing Source Codevia OC
R）」（1997年）において、スペース及びタブをプリン
ト可能な文字に置換することによる、ハードコピー・ド
キュメントの一次チャネルの印刷を開示している。ま
た、米国特許第4,105,997号は、ＯＣＲの最中に、エラ
ーの位置を確認するためにドキュメント内のテキストの
チェックサムを用いる方法を開示している。

【０００４】この問題はまた、米国特許第5,486,686号
でも言及されている。この特許は、人間が読むことが可
能なドキュメントのハードコピー表現が、このドキュメ
ント及び／又はそのコンテンツの全部又は一部の電子表
現と一体化されるドキュメント処理システムを開示して
いる。この電子表現は、ドキュメントに関する情報又は
ドキュメントから計算される情報を符号化する「アシス
ト・チャネル」を提供する。アシスト・チャネルは、プ
リント可能であり且つ機械で読み取ることができるコー
ドを用いて定義される。例示された一例において、アシ
スト・チャネルは、ドキュメントの下部で小さいグリフ
・コードを用いて定義されることが可能である。

【０００５】より詳細には、ハードコピー・ドキュメン
トの「アシスト・チャネル」は、一次チャネルのコンテ
ンツを復号化する際にＯＣＲアプリケーションを支援す
るサイド情報の機械可読な符号化である。ハードコピー
・ドキュメントの「一次チャネル」は、人間が読むこと
が可能なドキュメントの情報を含む。変更されることが
できず、ＯＣＲ処理でややエラーを起こしやすい一次チ
ャネルは、ドキュメントの大部分の情報コンテンツを保
持する。アシスト・チャネルの１つの用途は、例えば、
米国特許第5,625,721号、第5,748,807号、及び第6,047,
093号に開示されるように、一次チャネルのコンテンツ
を復号化する際に、ＯＣＲアプリケーションの誤りを確
認するのを支援する情報を符号化することである。

【０００６】

【発明が解決しようとする課題】アシスト・チャネルを
用いてＯＣＲ処理を向上させるこれらの進歩を伴ってさ
えも、アシスト・チャネルで符号化される情報量と、こ
の符号化された情報を与えられた場合のＯＣＲシステム
の精度の向上との間のトレードオフのバランスを保ち、
改善するアシスト・チャネルの符号化を提供すること
が、引き続き好ましい。ある極端な例では、アシスト・
チャネルは一次チャネルと同程度多くの情報（即ち、冗
長な情報）を含むことができる。別の極端な例では、ア
シスト・チャネルは、ドキュメントのコンテンツの単一
のチェックサムのみを含むことができる。従って、ＯＣ
Ｒ処理中の一次チャネルの誤りを補正するが、一次チャ
ネルに比べて依然としてコンパクトであるアシスト・チ
ャネルの符号化を提供することが好ましい。

【０００７】

【課題を解決するための手段】本発明では、ハードコピ
ー・ドキュメント上の表現のための画像データを生成す
るための方法及び装置が提供される。ハードコピー・ド
キュメント上に表現されるべき、人間が読むことが可能
な情報を有する第１のチャネルを提供する記号データの
一次セットが識別される。符号化データの二次セット
は、記号データの一次セットを用いて計算される。符号
化データの二次セットは、ハードコピー・ドキュメント
上に表現される、機械により可読である情報を有するア
シスト・チャネルを提供する。

【０００８】本発明の一態様では、ハードコピー・ドキ
ュメントの画像データは、記号データの一次セット及び
符号化データの二次セットを含むハードコピー・ドキュ
メントの走査された表現を記録することにより復号化さ
れる。ハードコピー・ドキュメントの走査された表現
は、任意のＯＣＲエンジンを用いて復号化され、候補と
なる記号データのセットが定義される。候補となる記号
データのセットは、ＯＣＲエンジンとは独立して、イベ
ント・ライブラリ及び符号化データの二次セットを用い
て書き直される。イベント・ライブラリは、ハードコピ
ー・ドキュメントの走査された表現が復号化される際に
遭遇する確率の高い誤りを識別する。

【０００９】

【発明の実施の形態】Ａ．アシスト・チャネル動作環境図１及び２は、ドキュメントが、電子ドメイン（領域）
とハードコピー・ドメインとの間で授受される本発明の
一般的な動作環境を示す。図１は、ディスプレイ１０４
等に表示及び／又は生成される電子ドキュメント１０２
と、プリンタ１０８によって用紙等の物理的な媒体上に
表現されるハードコピー・ドキュメント１０６とを示
す。電子アシスト・チャネル１１０は、電子ドキュメン
ト１０２を生成及び／又は編集するために使用される電
子ドキュメント処理システム（図示せず）から画像デー
タを受信し、出力として増補された画像データ１２２を
生成する。

【００１０】電子アシスト・チャネル１１０への画像デ
ータ入力は、本願明細書において、電子ドキュメント１
０２の画像データ１１４を含む一次チャネル１１２のデ
ータとして定義される。電子アシスト・チャネル１１０
の符号化／圧縮モジュール１１６は、アシスト・チャネ
ル１１８を生成する。電子アシスト・チャネル１１０の
マージ・モジュール１２０は、増補された画像データ１
２２を生成するために一次チャネル１１２とアシスト・
チャネル１１８とを組み合わせる。図１に示されるこの
実施の形態において、増補された画像データ１２２の一
次チャネル１１２及びアシスト・チャネル１１８はそれ
ぞれ、ハードコピー・ドキュメント１０６上で１２４及
び１２６として表現される。一次チャネル・データ１２
４は人間が読むことが可能な情報であるように最適化さ
れ、アシスト・チャネル・データ１２６は機械により可
読である情報であるように最適化される。

【００１１】図２は、一次チャネルのデータ１２４及び
アシスト・チャネルのデータ１２６が表現されたハード
コピー・ドキュメント１０６を、ハードコピー・ドメイ
ンから電子ドメインにアップロードする流れを示す。本
発明の一態様では、ハードコピー・アシスト・チャネル
２０４が、スキャナ２０８からビットマップ画像データ
２０６を受信する。ハードコピー・アシスト・チャネル
２０４の画像抽出モジュール２１０は、アシスト・チャ
ネル１１８のデータとビットマップ一次チャネル２１４
のデータとを分離する。ハードコピー・アシスト・チャ
ネル２０４の復号化／圧縮解除モジュール２１２は、デ
コーダ・モジュール２１６で用いられるアシスト・チャ
ネル１１８のデータを準備する。

【００１２】デコーダ・モジュール２１６は、一次チャ
ネル・データ１１２を生成するために、ビットマップ一
次チャネル２１４上で復号化及び圧縮解除されたアシス
ト・チャネル２１９を用いて、光学文字認識（ＯＣＲ）
を実行する。アシスト・チャネル２１９を用いて、正確
に再構成されると、一次チャネル・データ１１２は、画
像データ１１４としてディスプレイ１０４上に表示され
ることができる。従って、アシスト・チャネル・モジュ
ール１１０及び２０４は、ハードコピー・ドメインと電
子ドメインとの間でデータを変換するハードコピー・ド
キュメント画像データのＯＣＲ処理の実行を援助する。

【００１３】図１及び２に示されるアシスト・チャネル
・モジュール１１０及び２０４を実行するための動作配
置が多数存在することは、当業者により理解されるであ
ろう。ある実施の形態では、アシスト・チャネル・モジ
ュール１１０及び２０４は、ディスプレイ１０４又はプ
リンタ１０８と一体的に動作するか、又はディスプレイ
１０４及びプリンタ１０８とは別々に動作するコンピュ
ータ・システムに埋設されている。他の実施の形態で
は、アシスト・チャネル・モジュール１１０及び２０４
は、１つ又は複数のコンピュータ・システム上で互いに
一体化されるか、又はそれぞれ別々に動作する。

【００１４】Ｂ．アシスト・チャネル・コーディング概要として、アシスト・チャネル・コーディングは、一
次チャネルのＯＣＲ処理の際に欠けている、即ち必要と
されるであろう情報のみを有するように、アシスト・チ
ャネル内の一次チャネルの情報コンテンツを圧縮する。
即ち、重複一次チャネルを圧縮するために使用されるこ
とが可能な技術とは異なり、アシスト・チャネルは、ア
シスト・チャネルのコンテンツを最小限に抑えることに
よって、符号化効率を向上させる。また、一次及び二次
チャネルが、段階的に情報を配信するように設計される
プログレッシブ方式の符号化（又はピラミッド符号化）
とは異なり、アシスト・チャネル・コーディングは、デ
ータの固定チャネルから始まり、ハードコピー・ドメイ
ンから電子ドメインへの変換の際に遭遇するエラー又は
脱落を補正するデータによって、そのデータを増補す
る。

【００１５】以下のセクションＣ、Ｄ及びＥにおいて、
アシスト・チャネル・データを符号化及び復号化する３
つの異なる方法が開示される。概要として、図３乃至１
６は、分離コーディングを使用するアシスト・チャネル
符号化／復号化を示し、図１７乃至２２は、ブロック・
コーディングを使用するアシスト・チャネル符号化／復
号化を示し、そして、図２３乃至２８は、畳み込みコー
ディングを使用するアシスト・チャネル符号化／復号化
を示す。セクションＦは、これらの復号化技術を適用す
ることができる「リライト・モデル」を使用する代替の
動作環境を説明する。

【００１６】Ｃ．アシスト・チャネル分離コーディング本願明細書では「分離コーディング」と呼ばれるアシス
ト・チャネル・コーディングの第１の方法は、ＯＣＲ処
理の最中に、最も混同されそうな一次チャネル内の記号
（即ち、等価クラス）を異なるグループに分類する。好
適には、容易に圧縮されることが可能な等価クラスへの
文字の分類は、アシスト・チャネルにおいて符号化され
るが、同様に圧縮され得ない実際の文字コードは、アシ
スト・チャネルにおいて符号化されない。一次チャネル
の走査された表現を復号化する場合、テンプレート・ラ
イブラリからの許容記号マッチは、ＯＣＲ処理の間は、
アシスト・チャネルにおいて符号化された分類を満たす
ものに制限され、これによりＯＣＲ信頼性が向上する。

【００１７】Ｃ．１アシスト・チャネル分離符号化図３は、分離符号化を実行するための概略ステップのフ
ロー・ダイアグラムである。概して、分離コーディング
は、符号化の定義と、この符号化の適用との２つの別の
動作に分割されることができる。一連のステップ３０４
により示される、符号化を定義するための動作は、ＯＣ
Ｒ処理の最中に最も混同されそうな一次チャネル内の文
字又は記号を区別する等価クラスを有する集合の生成を
含む。ステップ３０４で作成／取得される符号化を適用
するための、一連のステップ３１２により識別される動
作は、一次チャネル内の文字又は記号を、定義された等
価クラスの集合内のある等価クラスに割り当てることを
含む。

【００１８】概要として、符号化を定義するためのステ
ップ３０４での動作は、符号化を適用するためのステッ
プ３１２での動作と共に実行されてもよいし、符号化適
用ステップ３１２の動作とは独立して実行されてもよ
い。実際は、ステップ３１２は、一次チャネルのために
アシスト・チャネルが生成される度に毎回実行される必
要があるのに対し、ステップ３０４は、特定の一次チャ
ネルのためにアシスト・チャネルが何度生成されよう
と、１回だけ実行されればよい。以下で更に詳細に論じ
られるように、符号化は、ステップ３１２で適用される
度に定義される必要はない。

【００１９】より詳細には、ステップ３０６で、１セッ
トの電子ドキュメントの一次チャネルに現れるであろう
（英数字）記号（即ち、記号データ）のアルファベット
が識別される。続いてステップ３０８で、記号内の識別
されたアルファベットは、エントロピーを最小限に抑え
且つ利得を最大にする複数のグループに分割される。即
ち、ステップ３０８で、記号内のアルファベットは、
（ａ）アシスト・チャネルを構成する情報量（即ち、エ
ントロピー）を最小限に抑え、且つ（ｂ）ＯＣＲ処理の
最中に混同される可能性の高い２つの文字が、異なる等
価クラスに配置される確率（即ち、利得）を最大にす
る、ような方法で、複数の等価クラス（即ち、グルー
プ）のうちの１つにマップされる。

【００２０】図４は、英数字記号の識別されたアルファ
ベットを複数のグループに分割するための図３に示され
るステップ３０８を、更に詳細に説明するフロー・ダイ
アグラムである。ステップ４１０では、記号の識別され
たアルファベットの各文字に対応するノードと、各ノー
ドを相互接続するアークとを含むグラフが定義される。
図５は、４つの記号の識別されたアルファベット
「ｅ」、「ｐ」、「ｂ」及び「ｃ」と、その文字が発生
するであろう確率を記録する、それぞれに対応するノー
ド５０２、５０４、５０６及び５０８とを有するグラフ
５００の例を示す。各ノードは、別のノードへのアーク
を有しており、このアークは、ある文字が他の文字と区
別される利得を記録する。例えば、ノード５０２はノー
ド５０４、５０６及び５０８へのそれぞれのアーク５１
０、５１２及び５１４を有しており、これらのアーク
は、個々が他と区別されて異なる等価クラスに分類され
るその利得を記録する。

【００２１】図４のステップ４１２では、ステップ４１
０で定義されたノード及びアークに値が割り当てられ
る。より詳細には、各ノードには、ある文字がドキュメ
ント内で発生するであろう確率により定義される値が割
り当てられる。各アークには、そのアークの両端の文字
がＯＣＲ処理の最中に混同される可能性によって定義さ
れる値が割り当てられる。ステップ４１４では、全ての
ノードが単一のグループに集められ、ノードのカレント
・パーティション（分割）を定義する。カレント・パー
ティションは、エントロピーを最小限に抑え、且つ利得
を最大にするように、ステップ４１６、４１８、４２０
及び４２２で調整される。

【００２２】ステップ４１６では、グラフのカレント・
パーティションにおける全ての可能な変更が識別され
る。実施の一形態において、可能な変更は、（ａ）任意
の既存のグループに属する任意のノードを有する新しい
グループを形成すること、及び（ｂ）あるノードをある
グループから別のグループへ移動すること、により識別
される。ステップ４１８では、ステップ４１６で識別さ
れた可能な候補のそれぞれごとに、利得における変化
（Δ）及びエントロピーにおける変化（Δ）が計算され
る。各候補は、新しいパーティションを定義する１つ又
は複数の可能な変更を含む。ステップ４２０では、カレ
ント・パーティションが、利得における変化及びエント
ロピーにおける変化の比率を最大にするパーティション
であるように選択される。

【００２３】より詳細には、ステップ４２０では、ＯＣ
Ｒエラーの減少率とアシスト・チャネルの情報コンテン
ツのサイズとの比率が最大になるように、カレント・パ
ーティションは、ステップ４１６で識別された変更によ
り定義されるそれらの候補の中から選択される。図５を
再度参照すると、グラフ５００のカレント・パーティシ
ョンは、グループ５１６及び５１８を含む。ステップ４
２２で、所望の利得又はエントロピーが達成されると、
カレント・パーティションが、エントロピーを最小限に
抑え、且つ利得を最大にする記号の識別されたアルファ
ベットを有するパーティションであると判断され、ステ
ップ３０８のルーチンは終了する。

【００２４】図６は、利得を最大にしつつ、エントロピ
ーを最小限に抑えるカレント・パーティションを識別す
るための反復処理を示すグラフである。まず最初に、カ
レント・パーティションは、グラフ上の点６００により
表される（ステップ４１４）。候補の第１のセット６０
２が識別された（ステップ４１８）後、エントロピーと
利得との比率を最大にする候補６０４が選択される（ス
テップ４２０）。このプロセスは、候補６１２が所望の
利得又はエントロピーと共に識別される（ステップ４２
２）まで、候補６０６、６０８及び６１０に対して反復
的に続けられる。このプロセスが、例えば仮想の候補６
１４等の候補が前のカレント・パーティション６１６に
比べて、局所的に負の比率をもたらすような例を、考慮
に入れるであろうことは、当業者により理解されるであ
ろう。従って、図６に示される例において、このような
候補を選択することは、プラスの傾斜を有する候補６０
８のいずれかを選択するよりも好ましい。

【００２５】図３を再度参照すると、英数字記号の識別
されたアルファベットが、利得を最大にしつつ、エント
ロピーを最小限に抑えるグループに、ステップ３０８で
分割されると、ステップ３１０が実行される。ステップ
３１０では、ステップ３０８で作成されるパーティショ
ンの複数のグループのそれぞれに、識別子が割り当てら
れる。図７は、１セットの記号が３つのグループ７０
２、７０４及び７０６に分類される（ステップ３０８）
パーティション７００を示す。グループ７０２、７０４
及び７０６には、それぞれ識別子７０８、７１０及び７
１２が割り当てられる（ステップ３１０）。パーティシ
ョン７００は、参照番号７１４、７１６及び７１８によ
り識別される、ＯＣＲ処理によって混同される可能性が
高い記号「ｅ」、「ｏ」及び「ｃ」を、それぞれグルー
プ７０２、７０４及び７０６に分離することによって、
利得を最大にする。更に、パーティション７００は、ド
キュメント内で発生する可能性が最も高い記号を最大の
グループ７０２に集めるように３つのグループを定義す
ることによって、エントロピーを最小限に抑える。

【００２６】ASCII文字セットのパーティションの例
が、表１に列挙されており、この表１において、ASCII
文字セットは９グループの文字に分類される。上述され
たように、ＯＣＲ処理の最中に混同され易い文字、
「ｅ」、「ｃ」及び「ｏ」は、利得を最大にするため
に、識別子（即ち、ＩＤ）Ｚ１、Ｚ２及びＺ４を有する
グループ、即ちクラスにそれぞれ分類される。更に、Ｚ
１として識別される第１、且つ最大のグループ内の最も
発生する可能性の高い文字は、エントロピーを最小限に
抑え、それによって、アシスト・チャネルの情報コンテ
ンツ量を最小限に抑える。

【表１】

【００２７】ステップ３０４は、ステップ４１６で局所
的変化のみを調べるので、パーティションを定義するた
めのこの技術は、必ずしも利得及びエントロピーの間の
大域的に最適なトレードオフに到達しないであろう。ア
ニーリング法又は分岐限定法等のアルゴリズム技術が、
より適切な解を見いだすために使用され得る一方で、こ
れらのアプローチは、ステップ３０４で説明される技術
よりも幾分か改善された解を提供するものの、解を見い
だすためにかなり多くの時間を必要とする。結果とし
て、ステップ３０４は、グラフ分割を識別するための本
アプリケーションに非常によく適している。

【００２８】定義ステップ３０４が完了すると、適用ス
テップ３１２が実行される。先ずステップ３１４では、
ステップ３０２で受信された一次チャネルの各記号を、
各記号が割り当てられるグループに対応する識別子と関
連付けることにより、アシスト・チャネルが作成され
る。図８は、ステップ３０２で受信された一次チャネル
８００の例を示す。図９は、図７に示されるパーティシ
ョン７００を使用して作成される、図８に示される一次
チャネルのためのアシスト・チャネル９００を示す。具
体的には、一次チャネル８００の参照番号８０２及び８
０４によって識別される最初の２つの記号「Ａ」及び
「ｎ」は、識別子７０８（即ち、「ａ」）及び７１０
（即ち、「ｂ」）を有するグループ７０２及び７０４に
分類され、それらの記号はそれぞれ、図９の参照番号９
０２及び９０４により識別される。

【００２９】ステップ３１６では、ステップ３１４で作
成されたアシスト・チャネルが、例えば、算術に基づく
符号化、ジブ−レンペル（Ziv-Lempel）の符号化又はラ
ン・レングス符号化を用いて圧縮される。これらの及び
他の圧縮技術は、Cover他による「情報理論の構成要素
（"Elements of Information Theory"）」（ジョン・ワ
イリー・アンド・サンズ、1991年8月12日（ISBN：04710
62596））で開示されている。アシスト・チャネルがス
テップ３１６で圧縮されると、アシスト・チャネルはス
テップ３１８で符号化される。実施の一形態において、
アシスト・チャネルは、データ・グリフを用いて符号化
される。図１０は、データ・グリフを用いて符号化され
るアシスト・チャネル１０１０の例を示す。

【００３０】ここで参照されるデータ・グリフは、デジ
タル情報を２値の１と０との形式で符号化し、これらの
値はその後、非常に小さい直線マークの形で表現され
る。一般に、各小型マークは、２値データのディジット
（桁）を表す。特定のディジットが、２値の１であるか
０であるかは、特定のマークの線の向きに依存する。例
えば、実施の一形態において、左上から右下に向けられ
たマークは０を表し、左下から右上に向けられたマーク
は１を表すことが可能である。

【００３１】図１及び２に示されるアシスト・チャネル
１２６を形成するデータ・グリフの個々のマークは、多
数のこのようなマークが共に用紙にプリントされる場合
に、均等なグレー・ハーフトーン領域を何気なく見る人
に、好ましくは全体的な視覚効果をもたらすように、プ
リント装置の最大解像度と相関的なサイズである。米国
特許第5,091,966号、第5,128,525号、第5,168,147号、
第5,221,833号、第5,245,165号、第5,315,098号、第5,4
49,895号及び第5,486,686号は、データ・グリフの使用
法、符号化及び復号化技術に関する更なる情報を提供し
ている。

【００３２】図３を再度参照すると、ステップ３２０で
は、符号化されたデータ・グリフが一次チャネルと連結
され、増補データを生成する。連結されたチャネル（即
ち、増補データ）は、ハードコピー・ドキュメント上に
表現される。図１に示すように、実施の一形態におい
て、増補データ１２２は、一次チャネル１２４及びアシ
スト・チャネル１２６としてハードコピー・ドキュメン
ト１０６上にプリンタ１０８によって表現される。

【００３３】ステップ３０２で受信される一次チャネル
に対して適用ステップ３１２が実行される度に、定義ス
テップ３０４が実行される必要のないことは、当業者に
より理解されるであろう。代わりに、定義ステップ３０
４は、任意の数の一次チャネルに対して一度だけ実行さ
れればよい。或いは、ステップ３０２で受信する英数字
記号のアルファベット又はフォントが変わる度に、定義
ステップ３０４が断続的に実行されてもよい。

【００３４】別の実施の一形態において、定義ステップ
３０４は、異なる種類のドキュメント、フォント又はマ
シンに対して１回実行される。例えば、定義ステップ
は、フォント書体ごとに１回実行され、ステップ３１２
で繰り返し適用されることが可能である。また、例え
ば、ドキュメントの種類には、ドキュメントのジャンル
（例えば、オフィス文書、法律文書、メモ、画像等）に
よる分類を含んでもよい。更なる例として、マシンの種
類には、特定のスキャナ及びプリンタ、又は特定のクラ
スのスキャナ及びプリンタを含む。例えば、実施の一形
態において、定義ステップ３０４は、特定のスキャナ及
び／又はプリンタのために実行されることが可能であ
り、それにより、特定のスキャナ及び／又はプリンタの
特定の誤りに対する符号化方式の感度を高める。

【００３５】Ｃ．２アシスト・チャネル分離復号化図１１は、図２に示されるアシスト・チャネル１２６に
より増補されるハードコピー・ドキュメント１０６の一
次チャネル１２４を復号化するためのハードコピー・ア
シスト・チャネル（２０４）によって実行されるステッ
プのフロー・ダイアグラムを示す。先ずステップ１１０
２で、ハードコピー・ドキュメント１０６のビットマッ
プ画像２０６が、例えばスキャナ２０８を使用して取得
される。ステップ１１０４では、画像抽出モジュール２
１０が、ビットマップ画像２０６からアシスト・チャネ
ルを抽出し、アシスト・チャネル１１８を復号化／圧縮
解除モジュール２１２に供給する。更に、画像抽出モジ
ュール２１０は、一次チャネル１２４のビットマップ表
現であるビットマップ一次チャネル２１４を、ビットマ
ップ画像２０６から抽出する。

【００３６】ステップ１１０６では、アシスト・チャネ
ル（１１８）が、モジュール２１２によって復号化され
る。例えば、アシスト・チャネルがデータ・グリフを用
いて符号化される場合、これらのデータ・グリフは、そ
れらのデジタル表現にステップ１１０６で復号化され
る。アシスト・チャネル（この時点ではデジタル形式で
ある）は、ステップ１１０８でモジュール２１２によっ
て圧縮解除され、復号化及び圧縮解除されたアシスト・
チャネル２１９をデコーダ・モジュール２１６に供給す
る。

【００３７】ステップ１１１０からの一連のステップで
は、デコーダ・モジュール２１６が、ビットマップ一次
チャネル２１４の連続行と、復号化及び圧縮解除された
アシスト・チャネル２１９の対応する連続行とをモジュ
ール２１０及び２１２のそれぞれから、入力として取得
する。ステップ１１１０で受信されたチャネル２１４及
び２１９の連続行のそれぞれに対して、一次チャネル２
１４の全ての行がステップ１１１８で処理されたことが
判断されるまで、ステップ１１１２、１１１４及び１１
１６が実行される。ステップ１１１８で全ての行が処理
されたと判断されると、一次チャネルの復号化はステッ
プ１１２０で完了する。デコーダ・モジュール２１６が
ステップ１１２０で処理を終了すると、復号化された一
次チャネル１１２は、ドキュメント１０２内の１１４と
してディスプレイ１０４上に電子形式で表示されること
が可能である。

【００３８】ビットマップ一次チャネル２１４の行を復
号化するためのステップ１１１２、１１１４及び１１１
６をここで詳細に参照する。ステップ１１１２では、一
次チャネルの行のグラフが、プロダクト・グラフの第１
の次元を定義するように決定される。ステップ１１１４
では、アシスト・チャネルの対応する行のグラフが、プ
ロダクト・グラフの第２の次元を定義するように決定さ
れる。最後にステップ１１１６で、一次チャネルのグラ
フと、アシスト・チャネルのグラフとの積の最短経路
が、観察される一次チャネルを生成するために決定され
る。

【００３９】実施の一形態において、ステップ１１１２
は（ビットマップ一次チャネル２１４の「テキスト」の
各行ごとに）、ドキュメント画像復号化（ＤＩＤ：Docu
mentImage Decoding）として当該技術において公知のド
キュメント復号化技術を使用して、デコーダ・モジュー
ル２１６により実行される。一般にＤＩＤは、ダイナミ
ック・プログラミング又はビタービ（Viterbi）アルゴ
リズムを用いて達成される。ダイナミック・プログラミ
ングは、有限状態のネットワークの全体にわたる、観察
される画像を表す経路（即ち、一次チャネル１１２）、
即ち、観察される画像を生成する可能性が最も高い経路
（即ち、ビットマップ一次チャネル２１４から導き出し
得る観察される可能性の最も高い画像）の検索を含む。

【００４０】ダイナミック・プログラミングの更なる詳
細は、Aho、Hopcroft及びUllmanによる「コンピュータ
・アルゴリズムの設計及び解析（The Design and Analy
sisof Computer Algorithms）」（コンピュータ・サイ
エンス及び情報処理に関するアディソン‐ウェズリー・
シリーズ）（アディソン‐ウェズリー出版、ISBN：0201
000296、1974年6月）に開示されている。更に、ＤＩＤ
の更なる詳細は、米国特許第5,321,773号、第5,526,444
号、第5,689,620号、及び第5,594,809号において開示さ
れている。

【００４１】図１２を、ここで参照する。図１２は、ビ
タービ・アルゴリズムを用いて一次チャネルのグラフの
最短経路を計算するためのステップを説明するフロー・
ダイアグラムである。先ず、グラフがステップ１２００
で定義され、定義されたグラフの最短経路がステップ１
２０１で計算される。図１２は、アシスト・チャネルの
助けなしで動作するＤＩＤデコーダを説明する。アシス
ト・チャネルを含めるには、ステップ１２００で定義さ
れるグラフは、最短経路が計算される前に、プロダクト
・グラフを計算することにより変更される。図１１のス
テップをここで参照すると、ステップ１２００は、一次
チャネルのためのグラフを決定するためのステップ１１
１２で実行される。更に、ステップ１２０１は、一次及
びアシスト・チャネルのグラフの積を定義しているグラ
フの最短経路を決定するためのステップ１１１６で実行
される。

【００４２】グラフの定義は、ビットマップ一次チャネ
ル２１４の行に沿って、ピクセルごとにグラフのノード
を定義することにより、ステップ１２０２で開始され
る。例えば、図１３は、グラフ生成を１３０１に示し、
最短経路計算を１３０３に示す。グラフ生成は、図８に
示される一次チャネル８００の行の文字８０２のビット
マップ表現のためのノード１３０２によりグラフ１３０
０を定義することから始まる。ステップ１２０３では、
各ノードにおける全ての可能なアークが、テンプレート
・ライブラリを用いて列挙される。ステップ１２０４で
は、テンプレート・ライブラリ内の文字を画像内の文字
とマッチング（照合）することによって、アークの得点
が、列挙された各アークで計算される。

【００４３】より詳細には、アークの得点は、マッチン
グ関数を使用して、列挙された各アークごとに計算され
る。この計算は、ライブラリ内の特定のテンプレート
と、ノードにより定義される画像ポイントでの画像領域
とのマッチングの測定である。マッチング関数を選択す
る際には、いくらかのフレキシビリティがあるが、マッ
チング関数は通常、マッチングの負の対数確率に密接に
比例する。これは、よりよいマッチングに対してアーク
の得点がより小さくなること、及び最短経路が行全体の
最適な解釈を識別すること、を可能にする。マッチング
関数の例は、Kopec他による「マルコフ・ソース・モデ
ルを用いたドキュメント画像復号化（Document Image D
ecoding Using Markov Source Models）」（パターン解
析及び機械知能に関するIEEE論文集第１６巻６号、1994
年6月、第602〜617頁）に開示されている。

【００４４】アークの得点及びテンプレートは、別のノ
ードへのアークの形で記録される。例えば図１３に示す
ように、アーク１３１４は、テンプレート１３１０（即
ち、「Ａ」）及びアークの得点１３１２（即ち、「１
０」）によって、ノード１３０６と１３０８との間に定
義される。より詳細には、アークは一致の質によって重
み付けされ（得点が低いほど、より一致する）、その一
致により識別されるテンプレートの幅だけ離された位置
のノード同士を連結する。

【００４５】隣接するテンプレート同士の間の間隔にわ
ずかなシフトをもたらすために、スペーサ・アーク（図
１３では参照番号１３１６で示される）が定義される。
例えば、得点（図示せず）を有することが可能なスペー
サ・アーク１３１８は、テンプレート１３１０の終端ノ
ード１３０８と、ノード１３２０から開始し得る図８に
示される文字８０４のための次のテンプレートとの間の
間隔を満たし得る。

【００４６】ステップ１２０６では、記録１３２２が、
図示されるように（図１３の最短経路計算１３０３に示
すように）各ノード１３０２ごとの累積得点１３２４及
びバックポインタ１３２６により定義される。ステップ
１２０８では、行の最後のノード１３２８を除く全ての
ノード１３０２の記録１３２２は、無限大の得点（即
ち、最悪の得点又は経路）及びNIL（ニル）バックポイ
ンタによって初期化される。行の最後のノード１３２８
に関する記録のための得点は、ステップ１２０８で０
（即ち、最高の得点又は経路）に初期化される。

【００４７】ステップ１２１０及び１２１２では、ビタ
ービ・アルゴリズムの２つのパスが実行される。ステッ
プ１２１０で実行されるビタービ・アルゴリズムの第１
のパス（即ち、フォワードパス）の最中に、各ノード
（即ち、ピクセル位置）に至る確率の最も高い経路（即
ち、最もよい得点）が、先に計算された全ての位置への
確率の最も高い（即ち、最短の）経路を使用することに
より識別される。第１のパスは、各ノードのための最適
な経路の終端点が識別されるまで、実行される。図１４
及び１５に関連する以下の記述において、この例では、
部分的に最短の経路をグラフの後部から構築することが
有用であり、従って、ビタービ・アルゴリズムの第１及
び第２のパスの一般的な方向を逆転させることは、当業
者により理解されるであろう。

【００４８】図１４は、ノード１４０２により定義され
るグラフ１４００のビタービ・アルゴリズムのフォワー
ドパス計算の例を示す。フォワードパスは、矢印１４０
４（即ち、順方向又は第１の方向）により示される方向
で、ノード１４０３からノード１４０１まで実行され
る。簡潔に示すために、ノード１４１０及び１４１２か
らそれぞれ開始し、ノード１４１４で終端するアーク１
４０６及び１４０８のための得点１４１６及び１４１８
と、テンプレート１４２０及び１４２２のみが示され
る。ステップ１２１０でノード１４１４のための最短経
路を計算する際に、ノード１４１０及び１４１２のそれ
ぞれの記録１４２４及び１４２６において、得点及びバ
ックポインタが、より短い経路を定義するようにノード
１４１４への点数に更新されるべきか否かの判断が成さ
れる。もし更新される場合、ノード１４１０の新しい得
点は１９（即ち、１２＋７）であり、ノード１４１２の
新しい得点は１０（即ち、３＋７）である。更新される
と、ノード１４１０の得点は改善される（即ち、１９は
５０よりも適切である）ので、ノード１４１４への新し
い得点及びバックポインタにより記録は更新される（図
１５参照）。対照的に、ノード１４１４からの新しい得
点に更新されても、ノード１４１２の得点は改善されな
い。従って、この記録は更新されない（即ち、１０は８
よりも不適切である）。

【００４９】ステップ１２１２で実行されるビタービ・
アルゴリズムの第２のパス（即ち、バックワードパス）
では、第１のパスの間に構成されたグラフが、グラフ全
体を通して実際に最適な経路（即ち、最短経路）を識別
するために、グラフの第１のノードから逆方向にたどら
れる。図１５は、図１４で作成されるグラフ１４００の
バックトレーシングの例を示す。バックトレーシング
は、矢印１５０３により示される方向に、図１５で実行
される。多くの異なる経路が存在し得るが、最適な経路
は、第１のパスの間に処理される最後のノードのバック
ポインタ（即ち、ノード１４０１のバックポインタ１５
０４）から始まるグラフ全体を通して、経路を逆方向に
たどることにより定義される。ノード１４０１のバック
ポインタ１５０４からのバックポインタ（例えば、１５
０４、１５０６、１５０８、１５１０、１５１２）を有
する経路は、ある文字のテンプレート（例えば、テンプ
レート１４２０）を指定する１セットのアークを識別す
る（例えば、バックポインタ１５０８はアーク１４０６
を識別する）。アークのこのセットは、一次チャネルの
記号に一致するテンプレートを識別する。即ち、プロダ
クト・グラフの第１の次元における最短経路は、アシス
ト・チャネル２１９の助けなしに構成される出力文字列
を定義する。

【００５０】プロダクト・グラフにアシスト・チャネル
を組み入れるためには、プロダクト・グラフが定義され
るまで、最短経路１２０１の計算は保留される。ステッ
プ１１１４で、アシスト・チャネル２１９のグラフが決
定され、プロダクト・グラフの第２の次元を定義する。
より詳細には、ステップ１１１４では、ノードがアシス
ト・チャネルで符号化される各識別子７０８で定義され
る。あるノードから次のノードへのアークは、識別子の
値を与えられる。更に、各ノードは、最短経路の計算中
に、スペーサ・アーク１３１６の存在を許容するため
に、それ自体に戻るアーク（即ち、例えば、アーク１６
３０等の自己回帰アーク）を含む。

【００５１】最後にステップ１１１６では、プロダクト
・グラフの最短経路が、ステップ１１１２及び１１１４
で定義される一次元のグラフを用いて定義される。即
ち、ステップ１１１６は、ビットマップ一次チャネル２
１４及びアシスト・チャネル２１９を用いてプロダクト
・グラフ全体を通して最短の経路を識別し、観察される
画像（即ち、一次チャネル１１２）を定義する。ステッ
プ１１１０、１１１２、１１１４及び１１１６は、ビッ
トマップ一次チャネル２１４の各行に対して、ステップ
１１１８で繰り返される。一次チャネルの全ての行がス
テップ１１２０で処理されると、一次チャネル１１２
は、ディスプレイ１０４上に、例えば、ドキュメント１
０２内の画像データ１１４として表示されることが可能
である。

【００５２】図１６は、図１１のステップ１１１６での
プロダクト・グラフの最短経路計算の例を示す。図１６
に示されるプロダクト・グラフ１６００は、第１の次元
１６０２（図１１のステップ１１１２で生成されるグラ
フにより定義される）及び第２の次元１６０４（図１１
のステップ１１１４で生成されるグラフにより定義され
る）を含む。プロダクト・グラフの第１の次元１６０２
は、図８に示される一次チャネル８００のテキストのビ
ットマップ行を表し、プロダクト・グラフの第２の次元
１６０４は、図９に示されるアシスト・チャネル９００
の対応する行を表す。

【００５３】図１６に示されるプロダクト・グラフ１６
００は、例示のために、一次チャネルの最初の４つの記
号（即ち、８０２、８０４、８０６及び８０８）、アシ
スト・チャネルの最初の４つの識別子（即ち、９０２、
９０４、９０６及び９０８）、及びわずかなテンプレー
トの一致のみを含む。比較目的のために、プロダクト・
グラフ１６００は、結果として生じる出力文字列１６０
８と、１セットのアーク１６１０、１６１２、１６１４
及び１６１８を含む１つの次元１６０２におけるビット
マップ一次チャネルのグラフの最短経路の計算により生
成される出力文字列の両方を示す。単一の次元１６０２
におけるグラフ１６００の最短経路の計算は、アシスト
・チャネルからの入力なしで実行され、文字「Ａｈ
ａ」を含む出力文字列１６０６を生成する。

【００５４】プロダクト・グラフ１６００は、次元１６
０２に沿って画像における位置を、そして次元１６０４
に沿って対応するアシスト・チャネルにおける位置を識
別するノード１６４０を含む。また、プロダクト・グラ
フ１６００は、アシスト・チャネルと合致しているはず
のアークを含む。即ち、テンプレート・ラベルを有する
第１の次元における各アーク、及び分類ラベルを有する
第２の次元における各アークにとって、テンプレートが
正しいクラスである場合には、対応するアークがプロダ
クト・グラフに存在する。第２の次元１６０４に沿った
アーク１６２２、１６２４、１６２６及び１６２８はそ
れぞれ、７０２、７０４、７０２及び７０２の記号グル
ープを識別する識別子９０２、９０４、９０６及び９０
８に対応する。プロダクト・グラフ１６００が定義され
ると、プロダクト・グラフの最短経路の計算は、文字
「Ａｎａ」を含む出力文字列１６０８を生成する。

【００５５】図１６に示されるように、支援されない復
号化された一次チャネル１６０６の出力は、プロダクト
・グラフ１６００においてアシスト・チャネルを使用し
て訂正される。ノード１６４６でプロダクト・グラフ１
６００を定義する際に、計算された得点が１５であるア
ーク１６１２のテンプレート「ｈ」は、アシスト・チャ
ネルにより除外される。ビットマップ一次チャネルのグ
ラフからのアーク１６１２は、アーク１６２４によって
定義されるアシスト・チャネルの第２のエントリを満た
さないので、プロダクト・グラフから除外される。即
ち、アーク１６１２により識別されるテンプレートは、
アーク１６２４の識別子７１０により指定されるグルー
プ７０４ではなく、グループ７０２に分類される。従っ
て、図１６に示されるテンプレートに関しては、より高
い１９という得点を有し、且つアシスト・チャネルの第
２のエントリ（即ち、アーク１６２４）を満たすアーク
１６２０のテンプレート「ｎ」のみが、プロダクト・グ
ラフにおける位置１６４２で有効なアークとして許容さ
れる。

【００５６】より詳細には、図１６は、図１１に示され
るステップを参照しながら、図８に示される一次チャネ
ル８００の走査された表現から、復号化された一次チャ
ネル１６０８を生成するプロダクト・グラフ１６００を
示す。まず最初に、一次チャネルのグラフが、第１の次
元１６０２において決定される（ステップ１１１２）。
続いて、アシスト・チャネルのグラフは、第２の次元
（１６０４）において決定される（ステップ１１１
４）。先ず、プロダクト・グラフは、一次チャネルのグ
ラフ及びアシスト・チャネルのグラフを組み合せること
により定義される（ステップ１１１６）。一次チャネル
のグラフと、アシスト・チャネルのグラフとの積の最短
経路を決定することは、出力文字列１６０８を生成する
（ステップ１１１６）。

【００５７】簡潔さのために、プロダクト・グラフ１６
００を定義しているアーク及びノードのほんの一部が、
図１６に示されていることは、当業者により理解される
であろう。グラフの最短経路を計算するための図１２の
ステップ１２０１に従う実施の一形態において、プロダ
クト・グラフ１６００の最短経路は、下から上へ、且つ
右から左への順序で第１のパスを実行することにより計
算される。本実施の形態では、プロダクト・グラフの第
１のパスは、プロダクト・グラフの最も下に位置するノ
ードが、最も右のノードに優先するとみなす。第２のパ
スは、プロダクト・グラフ１６００の左上のノード１６
４４により定義される経路を選択することにより実行さ
れる。

【００５８】簡潔さのために、プロダクト・グラフ１６
００は、各ノード１６４０から延伸し、且つテンプレー
ト・ライブラリからのテンプレートと、ビットマップ一
次チャネルとの間で、アシスト・チャネルの条件を満た
す全ての可能な一致を識別する、多数のアークを示すわ
けではないことは、当業者により理解されるであろう。
代替の実施の形態において、プロダクト・グラフ１６０
０を定義するアークの数は、プロダクト・グラフの対角
線の周辺に配置されたノードから延伸するアークのみを
含むことによって、減じられる。十分な量の分散を許容
することにより、この代替の実施の形態は、アシスト・
チャネルが画像内の１行にわたって均等な割合で用いら
れると想定される。

【００５９】Ｄ．アシスト・チャネル・ブロック・コー
ディング本願明細書において「ブロック・コーディング」と呼ば
れる、アシスト・チャネル・コーディングの第２の方法
は、ハードコピー・ドキュメントの一次チャネルの文字
を垂直な列にグループ化する。ガード・ディジット（即
ち、エラー訂正符号）は、各垂直ブロックごとに計算さ
れ、ハードコピー・ドキュメントのアシスト・チャネル
において符号化される。好適には、アシスト・チャネル
による一次チャネルの復号化は、垂直ブロックごとに同
期をとられる。即ち、一次チャネルのアシスト・チャネ
ルとの同期は、一次チャネルの各垂直ブロックで発生す
るので、テキスト行のＯＣＲ処理の最中に発生し得る同
期はずれは、最小限に抑えられる。

【００６０】Ｄ．１アシスト・チャネル・ブロック符
号化図１７は、アシスト・チャネルのブロック符号化を実行
するためのステップのフロー・ダイアグラムである。実
施の一形態において、これらのステップは、図１に示さ
れる電子アシスト・チャネル１１０によって実行され
る。ステップ１７０２で、符号化／圧縮モジュール１１
６は、データの一次チャネル１１２を受信する。例え
ば、図１８はデータの一次チャネル１８００の例を示
す。ステップ１７０４で、列グループのサイズが指定さ
れる。列グループのサイズは、固定されていても、列グ
ループごとに異なっていてもよい。より詳細には、列グ
ループのサイズは、何個の記号（例えば、文字）が、一
次チャネルの各行に沿って列グループを定義するかを識
別する。ステップ１７０６では、列グループ当たりのガ
ード・ディジットの数が指定される。より多くのガード
・ディジットがステップ１７０６で指定されると、ガー
ド・ディジットが訂正可能なエラーの数はより多くなる
一方で、アシスト・チャネルがより大きくなるであろう
ことは、当業者により理解されるであろう。

【００６１】ステップ１７０８では、一次チャネルの記
号データ（例えば、文字）の行数が決定される。続いて
ステップ１７１０では、記号データの各行の長さが決定
される。ステップ１７１２では、記号データの一次チャ
ネルが、指定された列グループのサイズに従って、垂直
ブロックに分割される。ステップ１７１４では、ステッ
プ１７０６で指定された数の列グループ当たりのガード
・ディジットが、ステップ１７１２で生成された各垂直
ブロックごとに計算される。実施の一形態において、ガ
ード・ディジットは、エラーを訂正するリード・ソロモ
ン符号を適用することにより計算される。リード・ソロ
モン符号の計算は、Peterson他による「エラー訂正符号
（Error-Correcting Codes）」（ＭＩＴ出版、1972年）
において開示されており、公知である。

【００６２】例えば、２⁸個の記号アルファベットを伴
う５個のエラーを訂正するリード・ソロモン符号が適用
される場合、アシスト・チャネルの最大ブロック・サイ
ズは、１０個のガード・ディジット（即ち、チェック・
ディジット）を含む２５５ディジットである。更に、４
０行のテキスト（即ち、記号データ）が、列グループの
サイズが２である列にグループ化されると仮定する。す
ると、この例は、２⁸個の記号アルファベットにわたる
リード・ソロモン符号のための２５５ディジットである
最大ブロック・サイズよりもかなり小さい９０文字（即
ち、４０×２＋１０＝９０）のブロック・サイズを必要
とする。この符号化方式を用いる場合、ガード・ディジ
ットのサイズは、１文字当たり１ビット（即ち、８文字
に対して１ガード・ディジットである圧縮比）である。
そして、ブロック当たりのＯＣＲエラーが５個以下であ
る限り、このページはエラーなしに復号化されるであろ
う。

【００６３】図１９は、ガード・ディジットが、図１８
に示される一次チャネルの記号データの指定された垂直
ブロックのために計算される例を示す。より詳細には、
図１９において、一次チャネルの記号データは、参照番
号１９０２により示されるように２記号幅のブロック・
サイズを有する垂直ブロックに分割される（ステップ１
７１２）。記号データの各垂直ブロックごとに、対応す
るガード・ディジット１９０４が計算される（ステップ
１７１４）。一次チャネルの行（例えば、行１９０６）
が、別の行（例えば、行１９０８）ほど長くない場合に
は、空記号（例えば、空記号１９１０）が、その列のガ
ード・ディジット（例えば１９１２）を計算するために
その行に加えられる。

【００６４】各垂直ブロックごとのガード・ディジット
がステップ１７１４で計算されると、アシスト・チャネ
ルのためのデータがアセンブルされ圧縮される。図２０
は、図１８に示される一次チャネルの例のためにステッ
プ１７１６でアセンブルされるデータ２００２を示す。
より詳細には、データ２００２は、列グループのサイズ
２００４、列グループ当たりのガード・ディジット数２
００６、ガードされる記号データの行数２００８、行長
さのベクトル２０１０、及びガード・ディジット２０１
２を含む。実施の一形態において、データ２００２の幾
つか（例えば、行長さのベクトル２０１０）は、無損失
の圧縮技術を用いてステップ１７１４で圧縮される。

【００６５】アシスト・チャネルがステップ１７１６で
圧縮されると、アシスト・チャネルはステップ１７１８
で符号化される。実施の一形態において、アシスト・チ
ャネルは、例えば図１０に示されるように、データ・グ
リフを用いて符号化される。ステップ１７２０では、符
号化されたアシスト・チャネルが一次チャネルと連結さ
れて、例えばプリンタ１０８を用いてステップ１７２２
でプリントされる。

【００６６】一次チャネルが符号化される方法が変更さ
れ得ることは、当業者により理解されるであろう。実施
の一形態において、一次チャネルは、一定のサイズ及び
一定のガード・ディジット数をそれぞれ有する列グルー
プに分割される。代替の実施の形態において、一次チャ
ネルは、各列グループごとに異なるサイズ及び／又は異
なるガード・ディジット数を割り当てられる列グループ
に分割される。例えば、ある行は最後の列に至る前に終
了する可能性があるために、最後の列はより少数の文字
を有し得る。従って、ガード・ディジット数は、最後の
列ではおそらく異なるであろう。また、その列の情報
が、より高い復号化精度を必要とすると先験的に判断さ
れる場合（例えば、金額情報を含む銀行小切手の列）、
特定の列のためのガード・ディジット数をより大きくし
てもよい。

【００６７】Ｄ．２アシスト・チャネル・ブロック復
号化図２１は、走査されたハードコピー・ドキュメントを復
号化するために、ブロック符号化されたアシスト・チャ
ネルを用いて、ハードコピー・アシスト・チャネルによ
り実行されるステップを説明するフロー・ダイアグラム
である。図２に示されるように、先ずステップ２１０２
では、ハードコピー・ドキュメント１０６のビットマッ
プ画像２０６が、スキャナを使用して取得される。この
例において、ハードコピー・ドキュメント１０６は、一
次チャネル１２４及びブロック符号化されたアシスト・
チャネル１２６を含む。ステップ２１０４では、画像抽
出モジュール２１０が、アシスト・チャネル１１８及び
ビットマップ一次チャネル２１４をビットマップ画像２
０６から抽出する。アシスト・チャネル１１８は、ステ
ップ２１０６で復号化され、モジュール２１２によりス
テップ２１０８で圧縮解除される。ステップ２１０９で
は、ビットマップ一次チャネルが、行長さのベクトル２
０１０の行長さを用いて位置合わせされ、一次チャネル
の行をアシスト・チャネルのガード・ディジットと同期
させる。続いて、圧縮解除されたアシスト・チャネル２
１９及びビットマップ一次チャネル２１４は、ステップ
２１１０、２１１２、２１１４、２１１６、２１１８、
２１２０、２１２２、２１２４、２１２６及び２１２８
を実行するデコーダ・モジュール２１６に入力される。

【００６８】ステップ２１１０では、ＯＣＲ解釈の候補
が、アシスト・チャネルの支援を借りずに、一次チャネ
ルの各行ごとの最短経路計算を介して算出される。実施
の一形態において、この最短経路計算は、上述のセクシ
ョンＣで詳細に論じられたドキュメント画像デコーダ
（ＤＩＤ）を用いて、各行ごとに実行される。より詳細
には、ＤＩＤは、図１２で説明されるステップを実行
し、図１４及び１５に示されるようなノード及びアーク
を伴うグラフを通して最短の経路を生成する。２つのパ
スのうちの第２のパスにおいて、グラフ全体を逆方向に
たどることにより識別される最短経路は、各行の「アシ
スト無し」のＯＣＲ解釈の候補を提供する。

【００６９】ステップ２１１２では、カレント・メッセ
ージのベクトルが、ＯＣＲ解釈の候補を有する第１の列
グループを用いて特定される。列グループの寸法は、列
グループのサイズ及びガードされたテキストの行数を用
いて、アシスト・チャネルにおいて定義される。ステッ
プ２１１４では、カレント・メッセージのベクトルに対
応するガード・ディジットが、アシスト・チャネルから
取得される。ステップ２１１６では、ステップ２１１４
で取得されたガード・ディジットが用いられ、ステップ
２１１０で計算されたＯＣＲ解釈の候補にエラーが存在
するか否かがチェックされる。エラーが存在する場合
は、カレント・メッセージのベクトルは、ガード・ディ
ジット（例えば、リード・ソロモン符号）を使用してス
テップ２１１８で訂正され、存在しない場合は、ステッ
プ２１２２が実行される。

【００７０】ステップ２１２０では、ステップ２１１８
で訂正を必要とされた一次チャネルの各行の、残りのメ
ッセージのベクトルが識別される。ステップ２１１６で
チェックされない残りのメッセージのベクトルに対し
て、ステップ２１１０で実行された最短経路計算が解釈
し直され、新しい又は変更されたＯＣＲ解釈の候補を生
成する。一次チャネルの各行の残りの再解釈は、図２２
を参照して、以下で十分に説明される。最後に、全ての
ガード・ディジットが処理されている場合は、復号化は
ステップ２１２６で終了し、処理されていない場合は、
復号化処理は、カレント・メッセージをＯＣＲ解釈の候
補を有する次の垂直ブロックに指定することにより、ス
テップ２１２４で続けられる。ステップ２１２４が完了
すると、ステップ２１１４がカレント・メッセージ及び
（変更された）ＯＣＲ解釈の候補に対して繰り返され
る。

【００７１】図２２は、図１８に示される一次チャネル
１８００の一部１８０２のために実行される最短経路計
算の再解釈の詳細な例を示す。より詳細には、図２２
は、ＯＣＲ処理においてエラーが識別された際に、ＯＣ
Ｒ解釈の候補２２０６を解釈し直し、再編成するために
アシスト・チャネルを使用する方法を示す。まず最初
に、ＯＣＲ解釈の候補２２０６は、矢印２２０２によっ
て概略的に示されるように、抽出されたビットマップ一
次チャネル２２０４から、ドキュメント画像デコーダを
用いて計算される（ステップ２１１０）。抽出されたビ
ットマップ一次チャネル１８００の一部１８０２のみ
が、図２２に示されていることに留意すべきである。

【００７２】続いて、図１９に示される第１の列グルー
プ１９２０のためのガード・ディジット１９１８が用い
られ、矢印２２０９によって概略的に示されるように、
この列グループのための復号化されたＯＣＲ解釈の候補
の中にエラーが存在するか否かが決定される（ステップ
２１１６）。図１９に示される列グループ１９２０の一
部１９２２のみが、部分２２０８として図２２で識別さ
れていることに留意すべきである。部分２２１０を含む
列グループを評価するためにガード・ディジットを使用
する場合、この列グループに対応するガード・ディジッ
トは、ビットマップの部分２２０８を復号化する際のエ
ラーを識別し、訂正された復号化部分２２１２をもたら
すために用いられる（ステップ２１１８）。

【００７３】第１の列グループの処理後、訂正された全
ての行が解釈し直され、矢印２２１３によって概略的に
示されるように、新しいＯＣＲ解釈の候補が提供される
（ステップ２１２０）。図２２では、訂正された復号化
部分２２１２を考慮して、ＯＣＲ解釈の候補２２０６を
解釈し直した後に、新しいＯＣＲ解釈の候補２２１４が
提供される。図１５に関連して上述されたＤＩＤを使用
することにより、復号化エラーを考慮したＯＣＲ解釈の
候補２２０６の再解釈は、図１５及び２２で参照番号１
５２０、１５２２及び１５２８によりそれぞれ識別され
るように、文字「ｄ」を訂正し、文字「ｏｌ」に置換す
る。新しい文字１５２２のために、グラフ１４００は、
図１５に示されるように新しいテンプレートがノード１
５２４で終了するように再編成される。ノード１５２４
から逆方向にたどることにより、新しいセットのテンプ
レートを特定する新しいセットのアークを識別するバッ
クポインタ（例えば、１５２６、１５０８、１５１０、
１５１２）を有する新しい経路が解釈し直され、これに
より、図２２に示される新しいＯＣＲ解釈の候補２２１
４が得られる。

【００７４】ＤＩＤグラフの再解釈が成されると、新し
いＯＣＲ解釈の候補２２１４はこの時点で、図１５及び
２２に示される新しいテンプレート１５２８を識別す
る。新しいＯＣＲ解釈の候補２２１４のエラー識別及び
訂正は、部分２２３０を含む次の列グループに対して実
施される。ＯＣＲ解釈２２０６の部分２２１０に対して
実行されたと同様に、ＯＣＲ解釈２２１４の画像部分２
２３０は、先ずエラーを調べられ、矢印２２３２により
示されるように、必要に応じて訂正される。続いて、エ
ラーが識別されて、画像部分２２３４で訂正されたと仮
定すると、ＯＣＲ解釈２２１４は、矢印２２３８により
示されるように、新しいＯＣＲ解釈２２３６として解釈
し直される。ＯＣＲ解釈の各列グループが、図２１に示
されるフロー・ダイアグラムに従って分析され終わるま
で、図２２に示されるプロセスが続けられる。

【００７５】ＯＣＲ出力行を解釈し直すために、様々な
技術を用いることが可能であることは、当業者により理
解されるであろう。特に、任意のＯＣＲシステムの文字
列出力は、訂正された接頭部とオリジナルのＯＣＲ解釈
との間の文字列編集の隔たり（即ち、ある文字列を別の
文字列に等しくするために必要とされる変更の回数）を
最小限に抑えるために、部分的に訂正された行に合せて
再調整されることが可能である。

【００７６】１ページ又は複数ページのハードコピー・
ドキュメントのためのエラー訂正コードを、垂直なパー
ティション（サイズは異なり得る）に沿って計算するこ
とは、テキスト及び／又はページの各行の初め及び終わ
りに、当然ながら同期点を追加する。図２２に示される
ように、エラーの検出及び訂正が、テキストの復号化さ
れた行全体で進められる際に、前のブロック２２１２の
成功した訂正は、次のブロック２２３０の訂正と同期が
とられる。好適には、一次チャネルの垂直列グループご
とにガード・ディジットを計算することにより、デコー
ダ・モジュール２１６は、各列グループで同期がとられ
る。行に沿って複数の同期点を提供する垂直列グループ
を用いない場合、ＯＣＲデコーダは、誤って異なる幅の
文字を照合し、エラー訂正符号との位置がずれるおそれ
がある。更に、適切な同期を伴わないＯＣＲデコーダ
は、アシスト・チャネルのエラー訂正能力を上回るおそ
れのある連続するエラー文字列を生成し得る。

【００７７】更に、より多くのテキスト行が記号ブロッ
クごとにガードされると、より大きい圧縮がアシスト・
チャネルにより達成されることは、当業者によって理解
されるであろう。また、ブロック・コーディングは、十
分な数の同期点を提供するために、多数の記号行を必要
とすることは、当業者により理解されるであろう。即
ち、ほんの数行しか存在しない場合は、これらの行の中
央に位置する１セットの同期点が、アシスト・チャネル
のデータ２００２に加えられることが可能である。ガー
ド・ディジットのための１セットの同期点の中の同期点
は、１ページ又は複数ページ上で、同じ又は異なるテキ
スト行の第１の列グループの位置を識別する。これは、
１列を超える列が、同一セットのガード・ディジットに
よってガードされることを可能にする。例えば、多数の
テキストの列／欄を有するページ（例えば新聞）は、複
数の列／欄におけるメッセージ・ディジットの行の開始
を識別する１セットの同期点を記述することによって、
符号化されることが可能である。或いは、ページ当たり
数行のみを有する複数のページを有するドキュメントに
おける各行の開始は、異なるページ上で行の開始を識別
する１セットの同期点によって記述されることが可能で
ある。

【００７８】Ｄ．３拡張アシスト・チャネル・ブロッ
ク・コーディングブロック・エラー・コーディングは、ＯＣＲ処理でエラ
ーを識別して訂正する間、改善された同期を提供する
が、ブロック・エラー・コーディングは、ＯＣＲ処理の
最中に生じる可能性の高いエラーに関する情報を一切使
用しない。このセクションでは、ＯＣＲ処理の最中に生
じる可能性の高いエラーに関する情報を用いる拡張アシ
スト・チャネル・ブロック・コーディングに関する２つ
の代替の実施の形態が示される。

【００７９】実施の一形態において、復号化は、最も近
いメッセージのベクトルよりも寧ろ、オリジナル・メッ
セージのベクトルである可能性が最も高いメッセージの
ベクトルを、図２１のステップ２１１８で、検出するこ
とにより実行されることが可能である。例えば、カレン
ト・メッセージのベクトルの訂正は、正しくなさそうな
単一の訂正よりも寧ろ、「ｃ」を「ｏ」に変え、「Ｉ」
を「１」に変えるといった、２つの訂正をすることによ
り実行され得る。本実施の形態において、アシスト・チ
ャネルのビット当たりのエラー訂正の有効性が改善され
る。この実施の形態の不利な点は、ブロック・コードの
最大尤度による復号化が計算処理的に難しいということ
である。

【００８０】計算処理的にそこまでの労力を必要としな
い別の実施の形態において、分離符号化エラー訂正が、
文字コードを再符号化することにより実行される。発生
する可能性の最も高いＯＣＲエラーに、発生する可能性
のより低いＯＣＲエラーよりも多くのガード・ディジッ
トが割り当てられるように、文字コードが再符号化され
る。即ち、より多くのエラー訂正が、ＯＣＲ処理の最中
にエラーをより受け易いビットに適用される。例えば、
表２は、上述の技術を用いて作成される、４つの等価ク
ラスを有する分離コードを示す。４つの等価クラス又は
グループ・コード（即ち、ＧＣ）は、プリントされた文
字が高位の２ビットによって、符号化されることを可能
にする。各グループ・コードは、文字コード（即ち、Ｃ
Ｃ）又はグループに特有の文字コードの一意の等価クラ
スを識別する。

【表２】

【００８１】文字を分類する等価クラスを識別する高位
の２ビットは、ＯＣＲ処理の最中に、低位のビットのみ
の場合よりも、変更される可能性が非常に高い。従っ
て、より強力なエラー訂正が、図１９に示される垂直配
置において、高位のビットに適用される。

【００８２】ブロック・コーディングの例として図１７
に示されるようにハードコピー・ドキュメントを符号化
する場合、この実施の形態は、表２に記載の符号化方式
のために、グループ・コード当たりのガード・ディジッ
ト数及び文字コード当たりのガード・ディジット数を特
定するステップを、ステップ１７０６で実行することを
含む。例えば、グループ・コードを用いない５-ディジ
ットのエラー訂正符号で用いられるのとほぼ同じ空間
で、この符号化方式は、８-ディジットのエラー訂正符
号が高位（「グループ・コード」）の２-ビットに適用
されることを可能にし、２-ディジットのエラー訂正符
号が低位（「文字コード」）の６-ビットに適用される
ことを可能にする。

【００８３】更に、図１７に示されるようにハードコピ
ー・ドキュメントを符号化する際に、オリジナルの文字
コードは、それらのグループ・コード及び文字コード表
現（即ち、ｇｃ．ｃｃ）に再符号化される。例えば、文
字「Ａ」は、例えばASCIIコードからコード「＜０１＞
＜００００００＞」に再符号化される。従って、図１９
の垂直配置に関すると、参照番号１９１８によって識別
されるＧ１のためのガード・ディジットは、垂直列グル
ープ１９２０のためのグループ・コードを保護する第１
のセットのガード・ディジットと、垂直列グループ１９
２０のための文字コードを保護する第２セットのガード
・ディジットとを含む。

【００８４】復号化する場合、デコーダ・モジュール
は、先ず、特定の等価クラスに訂正された高位のビット
を有する行上で最適な解を検出することを強いられる。
続いて、デコーダ・モジュールは、訂正された高位ビッ
トの低位のビットを訂正する。低位のビットを用いた訂
正は、識別された等価クラスの範囲内の文字のみの訂正
に制約される。換言すると、先ず、復号化された行は、
チェック・ディジットの高位のビットを用いて修正され
る。続いて、この行は、チェック・ディジットの低位の
ビットを用いて、更に修正される。より詳細には、図２
１は、本実施の形態において、ステップ２１１６、２１
１８及び２１２０を有する、高位のビットのための「外
側ループ」と、低位のビットのための「内側ループ」と
を含むように変更される。

【００８５】代替の実施の形態において、高位及び低位
のガード・ディジットの列グループのサイズ２００４は
変化する。この代替の実施の形態の一態様において、ガ
ード・ディジットの高位のビットは、ガード・ディジッ
トの低位のビット（例えば、より小さい列グループ・サ
イズである２）よりも大きいサイズ（例えば、より大き
い列グループ・サイズである４）を有する列にグループ
化される。この符号化フォーマットは、より大きい記号
アルファベットを用いて符号化するために、異なる列の
高位のビットを一緒にグループ化する。これによりリー
ド・ソロモン・コーディングのエラー訂正を最大に利用
している。

【００８６】Ｅ．アシスト・チャネル畳み込みコーディ
ング本願明細書では「畳み込みコーディング」と呼ばれる、
アシスト・チャネル・コーディングの第３の方法は、一
次チャネルの１行の文字の各文字ｃ_iを連続的にハッシ
ュして、ハッシュ関数の繰返しを計算する。より詳細に
は、テキスト行の各位置で、カレント・ハッシュはカレ
ント文字コードと組み合せられ、再びハッシュされる。
それにより、各文字がテキスト行におけるその文字位置
の右の全てのハッシュ値に影響を及ぼす、ハッシュ値の
連鎖を生成する。この連鎖内の各ハッシュ値は、（例え
ば、各ハッシュ値の１ビットを選択することにより）サ
ンプリングされ、アシスト・チャネルにおいて符号化さ
れる。続いて、一次チャネルの走査された表現を復号化
する際に、テンプレート照合検索は、一致する対応ハッ
シュ値のサンプル値を生成する解釈に制限される。行に
おける如何なるエラーも、その行の残りのためのハッシ
ュ値の連鎖を変えてしまう可能性が高く、その結果、サ
ンプル値が一致する可能性は低いと推測されるので、適
切な一致が識別される迄に調べられる不正確な解釈の数
は制限される。

【００８７】Ｅ．１アシスト・チャネル畳み込み符号
化図２３は、アシスト・チャネルの畳み込み符号化を実行
するためのステップを示すフロー・ダイアグラムであ
る。実施の一形態において、これらのステップは、図１
に示される電子アシスト・チャネル１１０により実行さ
れる。ステップ２３０２では、データの一次チャネル
が、例えば符号化／圧縮モジュール１１６で受信され
る。データの一次チャネルは、プリンタ等によりハード
コピー・ドキュメント上に生成されることが可能な任意
の英数字記号を含み得る。ステップ２３０４では、文字
データの一次チャネルのカレント行が選択される。ステ
ップ２３０６、２３０８、２３１０、２３１２、２３１
４及び２３１６では、一次チャネルの各行が、畳み込み
符号化に従って符号化される。

【００８８】先ずステップ２３０６で、一次チャネルの
選択された行（文字ｃ₁、ｃ₂、ｃ₃、...を有する）の最
初の文字が、カレント文字ｃ_iとして識別される。続い
てステップ２３０８で、状態変更関数h_i=H(h_i-1,c[1,
i])が繰返し計算される。この式で、ｈ₀＝０、ｈ_i-1は
連鎖内の前の値であり、そして、ｃ_iはカレント文字で
ある。たとえ状態変更関数H(h_i-1,c[1,i])が、先行する
文字（即ち、c[1,i]=c₁,c₂,c₃,...c_i）の何れかに依存
し得るとしても、状態変更関数はしばしば、H(h_i- ₁,c_i)
のような単純な形式を有する。実施の一形態において、
状態（state）関数は、Johannesson他による「畳み込み
コーディングの基本（Fundamentals Of Convolutional
Coding）」（IEEE、1999年、ISBN：0-7803-3483-3）に
記載されるように、単純なシフト・レジスタを用いて実
施される。代替の実施の形態において、Bruce Schneier
による「応用暗号手法（Applied Cryptography）」（ジ
ョン・ワイリー・アンド・サンズ、ISBN：0-471-11709-
9）に記載されるように、より多くの複雑なハッシュ関
数が、ＭＤ５のように実施されることができる。ハッシ
ュ関数を選択する際に、異なる入力が同一出力を有する
確率が極めて小さい（例えば、２^-32）ように、ハッシ
ュ関数が十分に大きい範囲（例えば、２³²を超える）を
有することが好ましい。

【００８９】ステップ２３１０で、カレント行の最後の
文字に達していない場合は、ステップ２３１２でガード
抽出関数g_i=G(h_i,c[1,i])が用いられ、カレント文字ｃ_i
の状態変更関数のためのガード値（即ち、ｇ_i）が計算
される。たとえガード抽出関数G(h_i,c[1,i])が、全ての
先行する文字（即ち、ｃ₁、ｃ₂、ｃ₃、...、ｃ_i）に依
存可能であるとしても、ガード抽出関数はしばしば、G
(h_i,q_i)のような単純な形式を有する。この式におい
て、任意の数の先行する文字（即ち、ｃ₁、ｃ₂、
ｃ ₃、...、ｃ_i）に依存し得るｑ_iは、ガード値のビット
数を識別するビット・セレクタである。ガード抽出関数
Ｇの入力は、ｈ_i（例えば、カレント文字のハッシュ）
及びc[1,i]（即ち、カレント文字を含む先行する文字）
を含む。次にステップ２３１４で、カレント文字がカレ
ント行の次の文字になるように割り当てられ、ステップ
２３０８が繰り返される。

【００９０】図２４は、ｑ_i＝１である場合の、一次チ
ャネル２４０６のカレント行（即ち、「Ｔｈｉｓ」）の
ための状態変更関数及びガード抽出関数を計算する簡略
化された実施の形態を示す。一次チャネル２４０６の各
文字は、文字コード２４０８（即ち、ｃ₁、ｃ₂、ｃ₃、
及びｃ₄）により表される。本実施の形態において、ガ
ード抽出関数は、その全体（即ち、全てのビット）を選
択される最後のガード値（即ち、ｇ_n）を除く、連鎖内
の全てのガード値のために、一方向のハッシュ関数２４
０４（即ち、ｈ_i）の出力の低位のビット（即ち、ｑ_i＝
１）を常に選択するようにハードコーディングされる。
この実施の形態は、ガード抽出関数に対する出力として
生成されるガード値２４１０が、特定の符号化方式のた
めに固定されることが可能であることを示す。

【００９１】図２５は、一次チャネルの行における各対
応する文字コード２５０３のためのガード値２５０１を
ステップ２３１６で生成するために、ステップ２３０８
で実行される繰返し計算のより一般化された表現を示
す。本実施の形態において、ガード抽出関数G(h_i,c[1,
i])２５０２は、対応する状態変更関数２５０４（即
ち、h_i=H(h_i-1,c_i)）から入力を受信する。カレント文
字ｈ_iの状態変更関数２５０４の出力から選択されるビ
ット数は、文字c[1,i]の値における累積的な不確実性に
依存する（即ち、より確実なほど、選択されるビット数
は少ない）。この不確実性は、値ｑ_iにより各ガード値
ごとに定量化され、この値ｑ_iは、ガード値（単数又は
複数）ｇ_iを定義するために各状態ｈ_iから可変の数を選
択するために用いられる。

【００９２】図２３を再度参照する。ステップ２３１０
で、カレント行の最後の文字に達した場合は、ガード値
ｇ_nがステップ２３１１で計算される。次にステップ２
３１６で、アシスト・チャネルが、計算されたガード抽
出関数（即ち、ｇ₁、...、ｇ _n）によって、カレント行
から増補される。ステップ２３１８で、選択された行が
一次チャネルの最後の行でない場合は、カレント行はス
テップ２３２０で一次チャネルの次の行になるように割
り当てられ、ステップ２３０６が繰り返される。最後の
行である場合は、アシスト・チャネルは、例えば図１０
に示されるようにデータ・グリフ等を用いて機械で読み
取り可能な情報としてステップ２３２４で符号化され
る。最後にステップ２３２６で、一次チャネル及びアシ
スト・チャネルは連結され、例えば図１に示されるプリ
ンタ１０８を用いてハードコピー・ドキュメント上に表
現される。

【００９３】Ｅ．２アシスト・チャネル畳み込み復号
化図２６は、走査されたハードコピー・ドキュメントを、
畳み込み符号化されたアシスト・チャネルを用いて復号
化するために、図２に示されるハードコピー・アシスト
・チャネルにより実行されるステップを説明するフロー
・ダイアグラムを示す。先ずステップ２６０２で、ビッ
トマップ画像２０６が、ハードコピー・ドキュメント１
０６のスキャナを用いて取得される。この例では、ハー
ドコピー・ドキュメント１０６は、一次チャネル１２４
及び畳み込み符号化されたアシスト・チャネル１２６を
含む。ステップ２６０４では、画像抽出モジュール２１
０が、アシスト・チャネル１１８及びビットマップ一次
チャネル２１４をビットマップ画像２０６から抽出す
る。アシスト・チャネル１１８は、モジュール２１２に
より、ステップ２６０６で復号化される。続いてステッ
プ２６１０で、ビットマップ一次チャネルの各行は、復
号化されたアシスト・チャネルを用いて復号化される。
デコーダ・モジュール２１６がステップ２６１２で完了
すると、復号化された一次チャネル１１２は、ドキュメ
ント１０２の参照符号１１４で示されるディスプレイ１
０４上に電子形式で表示されることが可能である。

【００９４】図２７は、図２６に示されるステップ２６
１０を更に詳細に説明するフロー・ダイアグラムであ
る。ステップ２７０２では、優先順位付き待ち行列が、
一次チャネルのカレント行のために、空の候補Ｃ＝(ｃ'
＝φ、ｈ'＝０、ｓ'＝０、ｋ'＝０）によって初期化さ
れる。この式において、ｃ'＝ｃ₁'ｃ₂'...、ｃ_i-1'は、
テキストのカレント行の接頭部の可能な解釈であり、
ｈ’は、可能な解釈ｃ’を処理した後の状態変更関数の
値であり、得点ｓ’は、一次チャネルの行の可能な解釈
ｃ’の品質を測定し、そしてｋ’は、カレント候補のた
めのカレント・ガード値の位置である。

【００９５】ステップ２７０４では、最も高い得点を有
する候補が、優先順位付き待ち行列から取り出され、カ
レント候補Ｃ_bestとして定義される。行の接頭部のＣ
_bestの解釈は、ｃ'＝ｃ₁'ｃ₂'...、ｃ_i-1'である。ステ
ップ２７０８では、カレント候補Ｃ_bestの行の接頭部
ｃ'＝ｃ₁'ｃ₂'...ｃ_i-1'の全ての拡張文字ｃ_i'（即ち、
復号化文字）が識別される。更に、ステップ２７０４で
は、ｈ_i-1'をこの候補のカレント・ハッシュとし、ｓ
_i-1'を候補のカレント得点とし、そして、ｋ’をアシス
ト・チャネルの最初の一致しないガード値の位置とす
る。更にステップ２７０８では、各可能な拡張文字ｃ_i'
が、一次チャネルのカレント行の残りの部分に対して得
点され、これにより、新しい得点ｓ_i'＝ｓ_i-1'＋Ｓ
(ｃ_i')を取得する。ステップ２７１０では、状態変更関
数h_i'=H(h_i',c_i'[1,i])及びガード抽出関数g_i'=G(h_i',
c'[1,i])のための値が、ステップ２７０８で識別される
各拡張文字c_i'ごとに計算される。

【００９６】ステップ２７１２では、位置ｋ_iから始ま
るアシスト・チャネルのガード値ｇ_iに等しい、ステッ
プ２７１０で計算されたガード抽出関数ｇ_i'を有する、
ステップ２７０８で識別された拡張文字ｃ_i'のそれぞれ
が、候補Ｃ_next(ｃ'＝ｃ₁'ｃ₂'...ｃ_i'、ｈ_i'、ｓ_i'、
ｋ_i'）として、優先順位付き待ち行列に加えられる。ス
テップ２７１４では、計算されたガード値ｇ_i'が、カレ
ント行のためのアシスト・チャネルの最後のガード値ｇ
_nに等しい場合、一次チャネルのカレント行の終わりに
達したことを意味するので、ステップ２７１６が実行さ
れる。ｇ_nに等しくない場合は、ステップ２７０４が次
の最良の候補のために繰り返される。ステップ２７１６
で、ビットマップ一次チャネルの全ての行が処理されて
いるならば、ステップ２６１０はステップ２６１２に進
む。そうでない場合、カレント行はステップ２７１８で
次の行間隔へ進み、ステップ２７０２が繰り返される。

【００９７】図２８は、図２７に示されるステップに従
って、図２４に示される一次チャネルのカレント行２４
０６を復号化する方法のグラフ図２８０２を示す。先
ず、空の候補２８０３によりグラフが定義される。第１
の文字空間のための拡張文字２８０４乃至２８０７が識
別される。拡張文字２８０４乃至２８０７の中で、拡張
文字２８０４及び２８０７のガード値がアシスト・チャ
ネルのガード値と一致した（即ち、ｇ_i'＝ｇ_i）ので、
拡張文字２８０４及び２８０７のみが優先順位付き待ち
行列に加えられる点に留意すべきである。続いて、拡張
文字２８０７が最高の計算された得点を有したので、次
の繰返しでは、拡張２８０７が選択される。一次チャネ
ル２４０６のビットマップは、図２７に示されるステッ
プを４回繰返すことによって復号化される。各繰返しの
開始時に選択される優先順位付き待ち行列の最良の候補
は、参照番号２８０７、２８１０、２８１２及び２８１
４により識別される。Johannesson他による「畳み込み
コーディングの基本」（IEEE、1999年、ISBN：0-7803-3
483-3）に開示されているように、系統的な復号化技術
以外の畳み込み復号化技術が、Viterbi等の発明、即ち
リスト復号化技術を実行するために用いられることが可
能であることは、当業者により理解されるであろう。

【００９８】Ｅ．３変調アシスト・チャネル畳み込み
コーディング図２９は、図２５に示される畳み込みコーダーを、本願
明細書では「変調畳み込みコーディング」と呼ばれる、
一体化された分離コーダー２９０２と分離コード・コン
プレッサ２９０４と共に示す。本実施の形態において、
アシスト・チャネルは、ハードコピー・ドキュメントに
プリントされた記号を、一次チャネルの各文字の文字コ
ードのハッシュから導き出されるガード値を用いて分離
コードの圧縮をスクランブルすることによって保護す
る。復号化する際に、スクランブルを解かれた分離コー
ドは、テンプレート照合検索の実行時のエラーを容易に
回避することを可能にする。

【００９９】図２５に示される実施の形態に類似して、
状態変更関数２５０４及びガード抽出関数２５０２は、
ガード値２５０１（即ち、ｇ₁、...、ｇ_n）を生成す
る。しかしながら、対照的に、図２９に示される実施の
形態は、圧縮された分離コード２９０８（即ち、ｃ
ｄ₁、...、ｃｄ_n）の処理結果を、ガード値２５０１
（即ち、ｇ₁、...、ｇ_n-1）を用いてスクランブルす
る。圧縮された分離コード２９０８は、ガード値ｇ_nと
共にアシスト・チャネルにおいて符号化される。

【０１００】即ち、上述の畳み込みコーディングに類似
して、状態変更関数２５０４は、状態変更関数h_i=H(h
_i-1,c_i)の反復を介して生成される。しかしながら、こ
の状態変更関数をサンプリングし、その結果をアシスト
・チャネルにおいて符号化するよりも寧ろ、状態変更関
数のサンプルは、分離コーディングに基づくアシスト・
チャネルのコーディングを変更するために用いられる。
状態変更関数がアシスト・チャネルを変更するために用
いられる方法は、分離コーディングが圧縮される方法に
依存する。

【０１０１】図２９に示されるように、文字コード２５
０３は分離コーダー２９０２に入力され、この分離コー
ダー２９０２は、出力として分離コード２９０６を生成
する。実施の一形態において、分離コーダー２９０２
は、上述のセクションＣで説明された方法で一次チャネ
ルの文字コードを符号化する。実施の一形態の分離コー
ド・コンプレッサ２９０４は、変更された算術に基づく
符号化技術を用いて分離コード２９０６を圧縮する。こ
の例は、Witten他により、「データ圧縮のための算術コ
ーディング（Arithmetic Coding for Data Compressio
n）」（Comm. ACM第３０巻６刷、第520〜540頁、1987
年）において記述されている。本実施の形態において、
分離コードの等価クラス・ラベルは、等価クラスの公算
に基づく算術符号化技術によって圧縮される。

【０１０２】より詳細には、拡張された畳み込みアシス
ト・チャネルの符号化は、一次チャネルの各行の第１の
符号化及び第２の符号化を必要とする。第１の符号化
は、一次チャネルの所定のテキスト文字列ｃ₁、ｃ₂、ｃ
₃、...、ｃ_nに対して実行され、このテキスト文字列の
文字を等価クラスｚ₁、ｚ₂、ｚ₃、...、ｚ_m（例えば、
図７のグループ・ラベルａ、ｂ、ｃ）に分類し、ｄ₁が
ｚ₁、ｚ₂、ｚ₃、...、ｚ_mの１つであるようなクラス・
ラベルの減少された文字列ｄ₁、ｄ₂、ｄ₃、...、ｄ _nを
取得する。算術コンプレッサは、区間に関する計算とし
て記述されることが可能であり、Ｐ（ｚ_i）が、ｚ_iとラ
ベル付けされた等価クラスの確率である場合、区間
［０，１］は、部分区間（サブインターバル）［ｓ₀，
ｓ₁］、［ｓ₁，ｓ₂］、...に分割される。この場合、ｓ
_iは確率の累積和である。即ち、ｓ_i＝Σ_j≦ _iＰ
（ｚ_i）。これは、ｉ番目の等価クラスに対応するｉ番
目の部分区間の幅Ｐ（ｚ_i）を提供する。一般性を損失
することなく、区間は、最大の（最も可能性の高い）も
のから最小のものに順序づけられると仮定される。クラ
ス・ラベルの文字列ｄ₁、ｄ₂、ｄ₃、...、ｄ_nは、以下
の反復により圧縮される。

【数１】

【０１０３】選択演算子Ｓは、以下の式により示される
ｄ_iの等価クラスのための区間が区間［０，１］に対す
るのと同じ比率で、カレント区間［ｘ，ｙ］内の区間
［ｘ',ｙ'］を選択する。このように、区間ｒ₁は、クラ
ス・ラベルの文字列ｄ₁、ｄ₂、ｄ₃、...、ｄ_nを一意に
決定し、log(P(d₁)P(d₂)P(d₃)...P(d_i))+1ビットの上限
が特定されることを必要とする。

【数２】

【０１０４】第２の符号化は、対応する状態変更関数ｈ
₁、ｈ₂、ｈ₃、...、ｈ_nを計算するために、一次チャネ
ルの所定のテキスト文字列ｃ₁、ｃ₂、ｃ₃、...、ｃ_nに
対して実行される。実施の一形態において、ｈ_iは、Ｇ
(ｈ_i)が０又は１に等しい確率が同じであるような、２
値関数Ｇによりサンプリングされる。続いて、図２９に
示すように、状態変更関数の出力が、選択区間を並べ替
えることによって、算術エンコーダ２９０４を変更する
ために用いられる。区間［０，１］の部分区間［ｓ₀，
ｓ₁］、［ｓ₁，ｓ₂］、...、への分割のために、［μ
(ｓ₀),μ(ｓ₁)］、［μ(ｓ₁),μ(ｓ₂)］、［μ(ｓ₂),μ
(ｓ₃)］、...が［０，１］を包括するパーティションで
あり、区間長さが||μ(ｓ_i+1)−μ(ｓ_i)||＝||ｓ_i+1−
ｓ_i||として保持されるように、順列μが定義される。
順列演算子は、単一のビットに依存するように定義さ
れ、次式のような状態変更関数により提供される。

【数３】

【０１０５】順列μは、可能な限り大きい同期はずれを
もたらすように選択される。第１の区間が１／２より大
きい場合、逆順列μ(ｘ)＝１−ｘは十分である。最大の
区間が１／２未満である場合、順列の画像において区間
自体が重ならないように、順列を選択することが好まし
い。演算子Ｒ(ｇ,[ａ，ｂ])を用いると、算術圧縮反復
は、以下のように書き直されることができる。

【数４】

【０１０６】図３０は、ガード値２５０１を用いて分離
コード２９０６の圧縮２９０４をスクランブルする例を
示す。図３０において、分離コード（又はクラス）ラベ
ル「ａ」「ｂ」及び「ｃ」の文字列が０及び１との間の
実数により符号化される。クラス・ラベル「ａ」「ｂ」
及び「ｃ」のそれぞれに対して割り当てられる確率は、
区間３００２を定義するためには、１／２対１／３対１
／６の割合（即ち、０〜０．５、０．５〜０．８３３、
０．８３３〜１．０）である。図３０に示されるこの例
は、符号化されているクラス・ラベルの文字列は、
「ｂ」から始まり、「ａ」が続くと仮定する。「ｂ」ク
ラス・ラベルから開始すると、選択される区間は、
[０．５，０．８３３]である。次の区間は、区間３００
４及び区間３００６の何れかから選択される。これらの
区間は、計算された単一ビットのガード値ｇ₁が１に等
しいか０に等しいかに従って、切り替えられる。分離コ
ード「ａ」が続くことにより、次の区間は、３０１２で
ガード値ｇ₁が０に等しいか１に等しいかに従って、そ
れぞれ３００８又は３０１０の値の範囲により定義さ
れ、これにより、ガード値に基づいて、分離コードの圧
縮をスクランブルする。

【０１０７】図３１は、スクランブルされた畳み込み符
号化アシスト・チャネルを用いて、一次チャネルの各行
を復号化するための図２６に示されるステップ２６１０
の詳細を説明するフロー・ダイアグラムである。図２７
に示されるステップ２７０２に類似して、ステップ３１
０２は、優先順位付き待ち行列を空の候補Ｃ₀によって
初期化する。続いてステップ３１０４では、Ｃ_bestとし
て定義される候補が、コンプレッサ２９０４のカレント
状態がｒ_i-1'として記録されること以外はステップ２７
０４と同様に、優先順位付き待ち行列から取り出され
る。ステップ３１０６では、分離コード・ラベルｄ_i'
が、アシスト・チャネルからの圧縮された分離コード・
ラベルｃｄ_i、コンプレッサの前の状態ｒ_i-1、及び前の
ガード値ｇ_i- ₁を用いて圧縮解除される。分離コード・
ラベルｄ_i'は、行の接頭部ｃ'の次の拡張文字のために
計算される分離クラスである。

【０１０８】ステップ３１０８では、Ｃ_bestの全ての拡
張文字ｃ_i'が識別される。ｃ_i'は、ｄ_iとラベル付けさ
れた計算された分離クラスに属する。更にステップ３１
０８では、識別される可能な拡張文字ｃ_i'のそれぞれ
が、一次チャネルのカレント行の残りの部分に対して得
点され、これにより、新しい得点ｓ_i'＝ｓ_i-1'＋Ｓ
(ｃ_i')を取得する。最後にステップ３１１２では、全て
の識別された拡張文字ｃ_i'のための候補Ｃ_nextが、優先
順位付き待ち行列に加えられる。ステップ３１１４、３
１１６及び３１１８は、図２７に示され上述されたステ
ップ２７１４、２７１６及び２７１８に対応することに
留意されたい。

【０１０９】このように、計算されたガード値が、アシ
スト・チャネルのガード値と一致しない候補を、優先順
位付き待ち行列から削除する図２７に示される復号化技
術とは異なり、図３１の復号化技術は、正しい分離クラ
スに属さない候補を削除する。しかしながら、図２７及
び３１のアルゴリズムは、特定候補の復号化エラーに
が、その候補の全ての拡張文字に不十分な得点をもたら
すであろうという点で、類似している。図３１におい
て、候補におけるエラーの後、ステップ３１０６で圧縮
解除された分離クラスｄ_iは、正しいというよりも寧
ろ、ほぼランダムであろう。従って、ステップ３１０８
で最適な拡張文字が調査されないかなりの確率が存在
し、結果として、エラーを含んでいる候補の拡張文字の
得点を低下させる。

【０１１０】状態変更関数の計算を種々の圧縮アルゴリ
ズムと連結することが可能であることは、当業者により
理解されるであろう。このアプローチの背後にある一般
的な観念は、状態変更関数の値が、達成される圧縮の質
に影響を及ぼさないがエラー発生後に圧縮解除の結果を
スクランブルするように、圧縮アルゴリズムの機能を変
更するというものである。例えば、ジブ−レンペル−ウ
ェルチ（Ziv-Lempel-Welch）の（ＬＺＷ）コンプレッサ
は、コーディングの前にコンプレッサのディクショナリ
・インデックスを用いて、状態変更関数ｈ_i-1のビット
のサブセットをＸＯＲする（排他的論理和をとる）こと
によって、圧縮をスクランブルするように変更されても
よい。

【０１１１】Ｆ.リライト・モデルを用いた代替動作環
境セクションＡで説明された動作環境では、ＤＩＤ様式の
デコーダの最短経路は、アシスト・チャネルの情報を考
慮するように変更される。このように、デコーダは、ア
シスト・チャネルの情報と整合している一致する解を識
別することによって最短経路を検出するように変更され
る。即ち、図２に示されるデコーダの動作環境で実行さ
れる最短経路計算は、アシスト・チャネルにより訂正さ
れる復号化エラーと整合している最短経路を検出するよ
うに増分的に適用されることが可能である。

【０１１２】図３２は、図２に示されるハードコピー・
アシスト・チャネル２０４の代替の実施の形態を示す。
この代替の実施の形態において、アシスト・チャネル
は、デコーダ・モジュール３２０４とは独立して動作す
る。従って、この代替の実施の形態において、アシスト
・チャネルは、如何なる特定のＯＣＲ復号化プロセスと
も一体化される必要はない。その代わりに、アシスト・
チャネルは、ビットマップ画像の最初の復号化を実行す
る任意のＯＣＲエンジンとは独立してデコーダ・エラー
をモデル化するリライト・モジュールへ入力される。

【０１１３】図２に示される実施の形態に類似して、図
３２の画像抽出モジュール２１０は、ビットマップ画像
データ２０６を受信し、アシスト・チャネル１１８のデ
ータとビットマップ一次チャネル２１４のデータとを切
り離す。しかしながら、本実施の形態では、デコーダ・
モジュール３２０４は、復号化及び圧縮解除されたアシ
スト・チャネル２１９からのサポートなしに、ビットマ
ップ一次データ２１４を復号化し、一次データの候補３
２０２を生成する。また、本実施の形態では、リライト
・モジュール３２００が、一次データの候補３２０２
と、復号化及び圧縮解除されたアシスト・チャネル２１
９とを入力として受け取り、データ１１２の一次チャネ
ルを生成する。

【０１１４】作動時に、リライト・モジュール３２００
は、イベント・ライブラリを用いて一次データの候補３
２０２のグラフを定義する。イベント・ライブラリは、
ＯＣＲ処理の最中に発生し得る様々な失敗イベントの確
率を測定することにより、デコーダ・モジュール３２０
４にＯＣＲエンジンのための失敗モデルを構築するため
に用いられる。これらの失敗イベントは、一般的（即
ち、全てのＯＣＲエンジンで発生する傾向がある）であ
っても、特殊（即ち、所定のＯＣＲエンジンでのみ発生
する傾向がある）であってもよい。例えば、図３３は、
特殊な規則３３０４と、如何なる場合にも対応可能な規
則３３０８を含む、より汎用的な規則３３０６とを明記
するイベント・ライブラリ３３０２を示す。重み３３１
０が各規則に割り当てられる。重みが小さいほど、その
イベントがデコーダ・モジュールで発生する確率が高
い。その結果として、識別変換３３１２（即ち、変換を
行わない）は、最も小さい重みを割り当てられるか、又
はそのような変換の内の１つであり得る。失敗イベント
の１つの例はイベント３３１４（即ち、ｒｎ→ｍ）であ
り、これは原形の損失（即ち、「ｒｎ」）及びその誤り
の訂正（即ち、「ｍ」）を定義する。

【０１１５】実施の一形態において、失敗モデルは、そ
の状態に戻る遷移のみを有する単一の状態を含む単純な
構造を有する重み付けされた有限状態トランスデューサ
である。本実施の形態において、重み付けされた有限状
態トランスデューサの単純さのために、失敗モデルを、
重み付けされた有限状態トランスデューサの十分に一般
化された定式化により処理することは必要でない。代替
の実施の形態において、Jones他により「ベイズ流ＯＣ
Ｒポスト・プロセッサにおける複数の知識ソースの一体
化（Integrating Multiple Knowledge Sources in A Ba
yesian OCR Post-Processor）」、（ＩＣＤＡＲ '９１
サン‐マロ（フランス）の会報第２巻、第925〜933
頁）において説明されているような、言語モデルを組み
入れる重み付けされた有限状態トランスデューサのより
一般化された定式化が用いられる。この重み付けされた
有限状態トランスデューサのより一般化された定式化
は、リライト・モジュールが、デコーダ・モジュールの
ＯＣＲエンジンに組み込まれた任意の言語モデルにアク
セスすることができないことを考慮する。

【０１１６】イベント・ライブラリ３３０２において定
義される失敗モデルを用いて、リライト・モジュール３
２００は、デコーダ・モジュール３２０４により復号化
された一次データの候補３２０２を、アシスト・チャネ
ル２１９の援助を受けてリライトする（書き直す）。実
施の一形態において、リライトは、失敗モデル及びアシ
スト・チャネルを使用して、一次データの候補３２０２
の最短経路を（ビタービ・アルゴリズムを用いたダイナ
ミック・プログラミングを用いて）計算することにより
実行される。このリライト動作は、最も可能性の高い一
次チャネル・データ１１２を検出する。換言すると、こ
の最短経路計算は、上述されたデコーダ・モジュール２
１６で動作するＤＩＤＯＣＲエンジンで行われる最短
経路計算のための代用物をもたらす。そして、これによ
り、アシスト・チャネルが、デコーダ・モジュール３２
０４で動作可能な任意のＯＣＲエンジンに適用されるこ
とを可能にする。

【０１１７】図１２に関連して上述されたように、最短
経路の計算は、グラフを定義するステップ及び最短経路
を計算するステップを含む。ＤＩＤＯＣＲエンジンの
本実施の形態におけるグラフを定義するステップは、図
３４の参照番号３４００で明記される。ステップ３４０
０を用いてグラフが定義されると、グラフの最短経路
が、上記に詳述された図１２に示されるステップ１２０
１を用いて計算される。

【０１１８】グラフを定義するための図３４に示される
ステップ３４００は、一次データの候補３２０２からテ
キスト行の各文字（又は、記号）の位置で、グラフ内の
ノードを定義するステップ３４０２を含む。換言する
と、グラフのノードは、一次データの候補の各テキスト
位置に対応する。ステップ３４０４では、各ノードごと
に、イベント・ライブラリ３３０２がサーチされ、イベ
ントの左側がそのノード（即ち、カレント・ノード）か
ら開始する文字列と一致する場合には、アークが加えら
れる。アークの得点は、そのイベントの重みである。ア
ークの宛先ノードの位置は、カレント・ノードの位置
に、一致したイベントの左側の文字数を加えた位置に等
しい。

【０１１９】図３５は、図３４で説明されるステップに
従って定義されるグラフの例を示す。ＯＣＲ解釈の候補
３５０５は、抽出されたビットマップ一次チャネル３５
０３から、例えばＤＩＤＯＣＲエンジンを用いて計算
される。ＯＣＲ解釈の候補３５０５における各文字位置
３５０６で、グラフ３５０２のノード３５０４が定義さ
れる（ステップ３４０２）。あるノードで開始する文字
の位置により定義される文字列が、イベント・ライブラ
リの文字列と一致する場合、アークがグラフのノード間
に引かれ、リライト及び得点を割り当てられる。例え
ば、アーク３５０８は、ＯＣＲ解釈の候補３５０５の文
字列「ｒｎ」と、イベント・ライブラリ３３０２の文字
列３３１４との間の一致のために、得点及びリライト
（即ち、「ｍ」）を与えられる（ステップ３４０４）。
グラフ３５０２の最短アークは、イベント・ライブラリ
において定義される識別変換３３１２であることに留意
すべきである。

【０１２０】代替の実施の形態において、デコーダ・モ
ジュール３２０４は、リライト・モジュール３２００に
配信される一次データの候補３２０２と共に、確実性予
測等の他のＯＣＲデータを含む。実施の一形態におい
て、これらの確実性予測は、ステップ３４０４でアーク
の得点に組み入れられる。従って、デコーダ・モジュー
ル３２０４及びリライト・モジュール３２００は、互い
に独立して動作するが、リライト・モジュール３２００
は、デコーダ・モジュール３２０４に提供され得る他の
統計情報を利用することができる。

【０１２１】図３６は、図３５で定義されるグラフの、
図１１及び１２で説明されるステップ１２０１による復
号化を示す。図３６に示される例において、プロダクト
・グラフ３６００は、図１６で定義されるプロダクト・
グラフに類似の方法で定義される。分離コードを用いて
符号化されたアシスト・チャネルを用いて、一次チャネ
ルを復号化するための図１１で説明されるステップは、
ＯＣＲ解釈の候補をリライトするために適用されること
ができる。但し、ステップ１１１０で取得される一次チ
ャネルの各行は、ビットマップ一次チャネル２１４では
なく、ＯＣＲ解釈３５０５の行に対応する。

【０１２２】例示のために、図３６に定義されるグラフ
の復号化の例は、図３５の最初の４つの記号のみを説明
する。また、簡潔さのために、プロダクト・グラフ３６
００の形成方法を示す極くわずかのアークが図３６に示
される。上記に詳述された分離復号化に従って、プロダ
クト・グラフ３６００の第１の次元３６０２が定義され
る。リライト・モジュール３２００が、第１の次元３６
０２におけるグラフの最短経路計算でなく、寧ろプロダ
クト・グラフにおける最短経路計算を実行することは、
当業者により理解されるであろう。

【０１２３】図３６に示されるように、アシストされず
に復号化された一次チャネル３６０６の出力（即ち、一
次データの候補３２０２である文字「Ｆｄｂｗ」）は、
プロダクト・グラフ３６００のアシスト・チャネルを用
いて訂正され、訂正された出力３６２０（即ち、一次チ
ャネル・データ１１２である文字「Ｆｏｌｌｏｗ」を生
成する。プロダクト・グラフを定義する際に、リライト
・モジュール３２００は、ＯＣＲ解釈の候補３６０２に
おける文字位置、及び対応するアシスト・チャネル３６
０４における位置の両方を識別する。図３６に示される
アシスト・チャネルの例は、図７に示される３つのグル
ープに分類される分離コードを用いて定義される。プロ
ダクト・グラフ３６００を定義する際に、文字「ｄ」
が、アーク３６１０でアシスト・チャネルの第２の位置
により要求されるように、分離グループ「ｂ」にではな
く、分離グループ「ａ」に分類されるので、アーク３６
０８はプロダクト・グラフから除外される。しかしなが
ら、アーク３６１２はアシスト・チャネルの第４の位置
３６１３に該当するが、次のアーク３６１４がアシスト
・チャネルの第５の位置３６１５に該当しないことに留
意すべきである。プロダクト・グラフ３６００が定義さ
れると、プロダクト・グラフの最短経路の計算は、文字
「Ｆｏｌｌｏｗ」を含む出力文字列３６２０を生成す
る。

【０１２４】リライト・モジュールが、図３６に示され
るような分離コーディングを用いたオペレーションに限
定される必要はないことは、当業者により理解されるで
あろう。代わりに、リライト・モジュールは、図２に示
される動作環境に関連して上述されたように、ブロック
・コーディング及び畳み込みコーディングに従って動作
することが可能である。また、図２に示されるデコーダ
・モジュール２１６により実行される畳み込みコーディ
ングが、グラフ（例えば、図１６に示されるグラフ１６
０２）をツリー（例えば、図２８に示されるツリー２８
０２）に変更するのと同様に、畳み込みリライト・モジ
ュールと共に動作する図３２に示されるリライト・モジ
ュール３２００が、図３６に示されるグラフ３６０２を
ツリーに変更し得ることを、当業者は理解するであろ
う。

【０１２５】デコーダ３２０４によって復号化される一
次チャネルの文字又は記号は、失敗モデルにより識別さ
れる他のいかなるイベントよりも正しい可能性が高いは
ずなので、リライト処理がアシスト・チャネルの援助を
伴って実行されない限り、リライト・モジュールによる
一次データの候補のリライトは、無意味（即ち、識別変
換）になる可能性が高いことは、当業者により更に理解
されるであろう。結果として、アシスト・チャネルが、
一次データの候補に現れる文字を、次の最適な解釈によ
り制限するか、又は訂正した場合、失敗モデルは有用に
なる。一次データの候補のこのような制限又は訂正は、
リライト・モジュールにより識別される誤り（例えば、
ｒｎ→ｍ）によって暗示される、図３６に示されるよう
なデータの再同期化を含むことができる。

【０１２６】要約すると、図３２に示される、デコーダ
・モジュールに依存しないＯＣＲ誤りを訂正するために
アシスト・チャネルを用いるリライト・モジュールを含
む、より一般化されたハードコピー・アシスト・チャネ
ルは、図２に示される一体化されたハードコピー・アシ
スト・チャネルよりも効率が悪い可能性がある。ＯＣＲ
デコーダにより用いられる統計情報の全てが、リライト
・モジュールに把握されるわけではないために、一般化
されたハードコピー・アシスト・チャネルで、非効率性
が生じる。即ち、図２のアシスト・チャネルと一体化さ
れるＤＩＤＯＣＲエンジンは、復号化されているビッ
トマップ一次チャネルに特有の、他の解釈に関するより
多くの統計情報を用いることができる。対照的に、図３
２に示されるリライト・モジュールは、任意の一般のド
キュメントで発生するＯＣＲ誤りの失敗モデル統計情報
内の情報のみ利用可能である。しかしながら、図３２に
示される一般化されたハードコピー・アシスト・チャネ
ルの主たる利点は、デコーダ・モジュールでのオペレー
ションのために選択されるＯＣＲエンジンとは独立して
いるリライト・モジュールにおいて、任意のアシスト・
チャネル復号化技術（即ち、分離コーディング、ブロッ
ク・コーディング、又は畳み込みコーディング）が、動
作可能なことである。上述されたＤＩＤＯＣＲエンジ
ンの他に、デコーダ・モジュールで動作可能な他のＯＣ
Ｒエンジンには、ScanSoft社（www.scansoft.com）によ
り製作されたテキスト・ブリッジ・プロ・ミレニアム
（TextBridge Pro Millennium）のＯＣＲエンジンを含
むことは、当業者により理解されるであろう。

【図面の簡単な説明】

【図１】ディスプレイ上に表示及び／又は生成される電
子ドキュメントの授受を示す（ブロック）図である。

【図２】ハードコピー・ドキュメント上に表現される一
次チャネル及びアシスト・チャネルからのデータと共
に、ハードコピー・ドメイン及び電子ドメインの間での
ハードコピー・ドキュメントの授受を示す（ブロック）
図である。

【図３】本発明の分離符号化を実行するための一般的な
ステップを有するフロー・ダイアグラムである。

【図４】図３に示されるステップ３０８を更に詳細に説
明するフロー・ダイアグラムである。

【図５】４つの記号「ｅ」、「ｐ」、「ｂ」及び「ｃ」
の識別されたアルファベットのグラフの例を、その文字
が発生する可能性を記録する、記号に対応するノードと
共にに示す図である。

【図６】利得を最大にする一方で、エントロピーを最小
にするカレント・パーティションを識別するための反復
プロセスを示すグラフである。

【図７】１セットの記号が３グループに分類されるパー
ティションを示す図である。

【図８】一次チャネルの例を示す図である。

【図９】図７に示されるパーティションを使用して作成
される図８に示される一次チャネルのためのアシスト・
チャネルを示す図である。

【図１０】データ・グリフを使用して符号化されるアシ
スト・チャネルの例を示す図である。

【図１１】アシスト・チャネルによって増補されるハー
ドコピー・ドキュメントの一次チャネルを復号化するた
めに、ハードコピー・アシスト・チャネルにより実行さ
れるステップのフロー・ダイアグラムである。

【図１２】一次チャネルのグラフの最短経路を計算する
ためのステップを説明するフロー・ダイアグラムであ
る。

【図１３】図８に示される一次チャネル８００の行の文
字８０２のビットマップ表現のためのノードを有するグ
ラフを示す図である。

【図１４】ビタービ・アルゴリズムを用いたフォワード
パス計算の例を示す図である。

【図１５】図１４で作成されるグラフと逆方向にトレー
スする（即ち、ビタービ・アルゴリズムのバックワード
パス計算）例を示す図である。

【図１６】プロダクト・グラフの最短経路計算の例を示
す図である。

【図１７】アシスト・チャネルのブロック符号化を実行
するためのステップのフロー・ダイアグラムである。

【図１８】データの一次チャネルの例を示す図である。

【図１９】図１８に示される一次チャネルの記号データ
の特定の垂直ブロックごとに、ガード・ディジットが計
算される例を示す図である。

【図２０】図１８に示されるデータの一次チャネルの例
のために集められたデータを示す図である。

【図２１】ブロック符号化されたアシスト・チャネルを
有する走査されたハードコピー・ドキュメントを復号化
するために、ハードコピー・アシスト・チャネルにより
実行されるステップを説明するフロー・ダイアグラムで
ある。

【図２２】図１８に示される一次チャネルの一部に対し
て実行される最短経路計算の再解釈の詳細な例を示す図
である。

【図２３】アシスト・チャネルの畳み込み符号化を実行
するためのステップを示すフロー・ダイアグラムであ
る。

【図２４】ガード値のビット数ｑ_i＝１である場合の、
一次チャネルのカレント行（即ち、「Ｔｈｉｓ」）のた
めの状態変更関数及びガード抽出関数の計算の簡略化さ
れた実施の形態を示す図である。

【図２５】一次チャネルの行内の対応する文字コードの
それぞれごとにガード値を生成するために実行される反
復計算のより一般化された表現を示す図である。

【図２６】畳み込み符号化されたアシスト・チャネルを
有する走査されたハードコピー・ドキュメントを復号化
するために、図２に示されるハードコピー・アシスト・
チャネルにより実行されるステップを説明するフロー・
ダイアグラムである。

【図２７】図２６に示されるステップ２６１０をより詳
細に説明するフロー・ダイアグラムである。

【図２８】図２７に示されるステップに従って、図２４
に示される一次チャネルのカレント行を復号化する方法
を示すグラフ図である。

【図２９】本願明細書で「変調された畳み込みコーディ
ング」と呼ばれる、一体化された分離コーダー及び分離
コード・コンプレッサを有する図２５に示される畳み込
みコーダーを示す図である。

【図３０】ガード値を用いた算術符号化により圧縮され
る分離コードのスクランブリングの例を示す図である。

【図３１】スクランブルされた畳み込み符号化アシスト
・チャネルを用いて一次チャネルの各行を復号化するた
めの図２６に示されるステップ２６１０の詳細を説明す
るフロー・ダイアグラムである。

【図３２】図２に示されるハードコピー・アシスト・チ
ャネルの代替の実施の形態を示す（ブロック）図であ
る。

【図３３】デコーダ・モジュールのＯＣＲエンジンのた
めの失敗モデルを構築するために用いられるイベント・
ライブラリを示す図である。

【図３４】図３３に示されるイベント・ライブラリを用
いて、図３２に示されるリライト・モジュールにより実
行されるグラフを定義するためのステップを説明するフ
ロー・ダイアグラムである。

【図３５】図３４で説明されるステップに従って定義さ
れるグラフの例である。

【図３６】図１２で説明されるステップ１２０１で定義
されるグラフの復号化の例を示す図である。

【符号の説明】

１１２一次チャネル１１８アシスト・チャネル２０４ハードコピー・アシスト・チャネル２０６ビットマップ画像データ２１０画像抽出モジュール２１２復号化／圧縮解除モジュール２１４ビットマップ一次チャネル２１９復号化及び圧縮解除されたアシスト・チャネ
ル３２００リライト・モジュール３２０２一次データの候補３２０４デコーダ・モジュール

───────────────────────────────────────────────────── フロントページの続き (72)発明者アショックシー．ポパットアメリカ合衆国 94070 カリフォルニア州サンカルロスシーダーストリート 625 アパートメントケーＦターム(参考） 5B064 EA18

Claims

【特許請求の範囲】

【請求項１】ハードコピー・ドキュメント上に表現さ
れる、人間により可読である情報を有する第１のチャネ
ルを提供する記号データの一次セットと、前記ハードコ
ピー・ドキュメント上に表現される、機械により可読で
ある情報を有する第２のチャネルを提供する符号化デー
タの二次セットとを含む前記ハードコピー・ドキュメン
トの走査された表現を記録するステップと、前記ハードコピー・ドキュメントの該走査された表現の
復号化された形式を復号化モジュールから受信して、候
補となる記号データのセットを定義するステップと、前記復号化モジュールとは独立して、前記ハードコピー
・ドキュメントの走査された表現が復号化される際に遭
遇する確率の高い誤りを識別するイベント・ライブラリ
と、前記符号化データの二次セットと、を用いて、前記
候補となる記号データのセットを書き直すステップと、を含む、ハードコピー・ドキュメントのための画像デー
タ復号化方法。
【請求項２】前記書き直すステップが、前記候補とな
る記号データのセットと、前記符号化データの二次セッ
トと、のプロダクト・グラフの最短経路を計算するステ
ップを更に含む、請求項１に記載の方法。
【請求項３】前記プロダクト・グラフが、前記候補となる記号データのセット及び前記符号化デー
タの二次セットの両方の位置に対応するノードを定義す
るステップと、前記候補となる記号データのセットと、前記符号化デー
タの二次セットと、を満たすアークを定義するステップ
と、により定義される、請求項２に記載の方法。
【請求項４】前記プロダクト・グラフが更に、前記候
補となる記号データのセット内の記号をイベント・ライ
ブラリからのイベントとマッチングすることにより定義
される、請求項３に記載の方法。
【請求項５】ハードコピー・ドキュメント上に表現さ
れる、人間により可読である情報を有する第１のチャネ
ルを提供する記号データの一次セットと、前記ハードコ
ピー・ドキュメント上に表現される、機械により可読で
ある情報を有する第２のチャネルを提供する符号化デー
タの二次セットとを含む前記ハードコピー・ドキュメン
トの走査された表現を記録するための手段と、前記ハードコピー・ドキュメントの該走査された表現の
復号化された形式を復号化モジュールから受信して、候
補となる記号データのセットを定義するための手段と、前記復号化モジュールとは独立して、前記ハードコピー
・ドキュメントの走査された表現が復号化される際に遭
遇する確率の高い誤りを識別するイベント・ライブラリ
と、前記符号化データの二次セットと、を用いて、前記
候補となる記号データのセットを書き直すための手段
と、を含む、ハードコピー・ドキュメントのための画像デー
タ復号化装置。