JPH07200729A

JPH07200729A - 光学式文字認識方法

Info

Publication number: JPH07200729A
Application number: JP6319309A
Authority: JP
Inventors: Kevin S Burke; ケビン・エス・バーク
Original assignee: Hewlett Packard Co
Current assignee: HP Inc
Priority date: 1993-11-29
Filing date: 1994-11-29
Publication date: 1995-08-04
Also published as: EP0655703A2

Abstract

(57)【要約】【目的】光学式文字認識システムで極めて小さい字体の
走査精度を向上させる。【構成】文書を走査してバッファに溜める（２０２）。
データを尖鋭化するために３つのポインタをセットする
（２０４、２０６、２０８）。現在のラインを尖鋭化す
る（２１０）。更に次のデータ・ラインを尖鋭化するた
めにポインタ変数をセットしなおす（２１２、２１
４）。現在のポインタが文書の最終ラインを指している
か判断し（２１６）、次のポインタをセットする（２１
８、２２０）。次の尖鋭化動作用に３つのポインタの全
ての準備が終了すると、現在のラインをＹ方向にアップ
サンプルし（２２２）、現在のラインをアップサンプル
する（２２４）。バッファ内にまだ他のラインがあれば
ブロック２１０に戻る。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明はコンピュータ・システム
に関し、特にコンピュータ・システムでの光学式文字認
識（ＯＣＲ）システムに関する。更に詳細には、本発明
は光学式文字認識システムを利用した極めて大きい、
又、極めて小さい字体の認識システムに関する。

【０００２】

【従来の技術】光学式文字認識システムは、１ポイント
を1/72インチとした場合、文字サイズが８から１４ポイ
ントの間にある文字を正確に識別する率は高い。ポイン
トのサイズがこのような“絶好の範囲”から変動する
と、認識精度は、特に８ポイント以下のポイント・サイ
ズの場合は著しく低下する。精度の低下を誘発する要因
の一つは、ほとんどの文書が８から１２ポイントの範囲
のサイズのテキストから成っているため、ほとんどのＯ
ＣＲシステムがそれらの特定のポイント・サイズに同調
されているということにある。このサイズ範囲以外の文
字を認識しようとする場合、８ないし１２ポイントの範
囲内の文字サイズの認識に利用される（文字の）特徴の
多くは、この範囲外の文字サイズではひずみを生ずる
か、無効になってしまう。例えば、このシステムは文字
の境界ボックス幅と比較して比較的狭い文字ストローク
幅を期待するというヒューリスティック（発見的傾向）
を有するが、極めて大きいテキストの場合は、ストロー
ク幅は全て極めて広く、従って無効になってしまうであ
ろう。このような種類の問題点は、ＯＣＲの用例が、特
徴の抽出に先立って文字を標準化した場合でも、依然と
して生ずることがある。

【０００３】極めて小さい文字の認識に影響を及ぼす別
の要因には特徴の喪失がある。特徴の喪失は、小さいテ
キストにおいて、“ａ”、“ｅ”等のような文字で生ず
る閉路の文字の特徴が潰れる場合に生ずる。例えば、
“ｅ”の閉路が潰れると、“ｅ”はＯＣＲシステムによ
って“ｃ”として誤って認識されることがある。

【０００４】そこでこの分野では、光学式文字認識シス
テムにおいて、極めて小さい文字の認識精度を向上させ
たシステムに対する必要性がある。

【０００５】

【発明が解決しようとする課題】本発明の一側面は、光
学式文字認識システムで極めて小さい字体の走査精度を
向上させることにある。

【０００６】本発明の別の側面は、走査のための大きい
字体を用意するために、走査されたデータをアップサン
プル（拡大サンプリング）することによって、上記の精
度を向上させることにある。

【０００７】本発明の更に別の側面は、データをアップ
サンプルする前に走査されたデータを尖鋭化することに
ある。

【０００８】

【課題を解決するための手段】本発明の上記の、及びそ
の他の側面は、最初にデータを尖鋭化し、次にデータを
アップサンプルして、データ内に含まれる文字サイズを
拡大し、それによって光学的文字認識の鮮度を高めるよ
うに、走査されるグレースケール画像を処理するシステ
ムによって達成される。

【０００９】データは先ず、各ピクセルを処理する際
に、各ピクセルの上下のピクセルを点検し、現在のピク
セルの上下のデータに基づいて、現在のピクセルを調整
することによってＹ方向に尖鋭化される。データを尖鋭
化した後、データはピクセルの各々の既存の走査ライン
の間に、ピクセルの新たな走査ラインを作成することに
よってＹ方向にアップサンプルされる。この新たな走査
ラインは、２つの走査ラインのピクセルのグレースケー
ルのレベルを平均化し、この平均値を、２つの走査ライ
ンの間にある新たな走査ラインに置くことによって作成
される。同様にして、走査ライン内の各々の既存のピク
セルの間に新たなピクセルを付加することによって、デ
ータは各走査ライン内で拡大される。各々のピクセル対
の間の新たなピクセルは、一対のピクセル内の２つのピ
クセルの値を平均化することによって形成される。

【００１０】

【実施例】下記の説明は、本発明を実施する現段階で最
良のモードの説明である。この説明は、限定的な意味で
はなく、本発明の基本原理を説明する目的であるにすぎ
ない。本発明の範囲は、添付の特許請求の範囲を参照す
ることによって判断されるべきものである。

【００１１】図１は、本発明を含むコンピュータ・シス
テムの概略図を示している。ここで図１を参照すると、
コンピュータ・システム１００はシステムバス１０４を
経てコンピュータ・システム１００の別の素子と通信す
る処理素子１０２を含んでいる。キーボード１０６とマ
ウス１１０によって、コンピュータ・システム１００に
テキスト及びグラフィックの入力が行われ、グラフィッ
ク・ディスプレー１０８によって、コンピュータ・シス
テム１００内のソフトウェアが、システムのユーザーに
データを出力することが可能になる。ディスク１１２は
ソフトウェアと本発明のデータを含んでおり、通信イン
タフェース１１４によって、本発明は光学式文字認識ス
キャナ１２４と通信することができる。

【００１２】メモリ１１６はオペレーティング・システ
ム１１８を含んでおり、これは、ＭＳ−ＤＯＳオペレー
ティング・システムでもよいし、入手できる多くの他の
オペレーティング・システムの一つでもよい。スキャナ
・ドライバ・ソフトウェア１２０はオペレーティング・
システム１１８を介してＯＣＲスキャナ１２４と通信
し、応用プログラム１２２にサービスをを供給する。本
発明は、本発明からデータを受理し、文字をＡＳＣＩＩ
のような機械読み取り可能な形式に変換する認識手段と
共に、スキャナ・ドライバ・ソフトウェア１２０内に含
まれている。

【００１３】図２は本発明のドライバ・ソフトウェア部
分のフローチャートを示している。図２は、スキャナ・
ドライバ・ソフトウェア１２０が文書から走査されたデ
ータをアップサンプルしたい場合、又は、文書から走査
されたデータの一部をアップサンプルしたい場合に、ス
キャナ・ドライバ・ソフトウェア１２０（図１）によっ
て呼び出される。スキャナ・ドライバ・ソフトウェア１
２０は、より小さいテキストである場合が多い図面のタ
イトルのような文書の部分をアップサンプルすることを
決定するが、文書のどの部分をアップサンプルするかの
決定については本発明の構成要素ではないので、詳細に
は説明しない。

【００１４】さて図２を参照すると、スキャナ・ドライ
バ・ソフトウェア１２０（図１）によって呼び出される
と、制御プロセスはブロック２０２で図２に入る。ブロ
ック２０２は文書、又は文書の一部を走査してバッファ
に溜める。別の実施例では、この動作は図２のフローチ
ャートを呼び出す前に、スキャナ・ドライバ・ソフトウ
ェアによって実行することも可能であろう。ブロック２
０４はバッファの開始アドレスを得て、このアドレスを
ポインタ変数ＰＲＥＶ＿ＰＴＲ内にセットする。ブロッ
ク２０６はこれもバッファの開始アドレスをＣＵＲ＿Ｐ
ＴＲポインタ変数にセットする。ブロック２０８は、バ
ッファの開始アドレスとバッファ内のピクセルの走査さ
れたラインの長さを加算して求められ、ＮＥＸＴ＿ＰＴ
Ｒ変数に第２の走査ラインの開始アドレスをセットす
る。これらの３つのポインタはデータを尖鋭化するため
に利用される。ＰＲＥＶ＿ＰＴＲは走査されたデータの
先行のラインを照準し、ＣＵＲ＿ＰＴＲは現在尖鋭化中
のラインを照準し、ＮＥＸＴ＿ＰＴＲは尖鋭化されたラ
インの次のラインを照準する。しかし、初期状態では、
先行のポインタと現在のポインタの双方が動作の開始時
点で同じラインを照準することが必要であり、このライ
ンは文書の最上部の、第１の走査ラインで始まる。

【００１５】３つのポインタをセットした後、ブロック
２１０は現在のラインを尖鋭化するために図４を呼び出
す。次に、ブロック２１２はＰＲＥＶ＿ＰＴＲにＣＵＲ
＿ＰＴＲをセットし、ブロック２１４はＣＵＲ＿ＰＴＲ
をＮＥＸＴ＿ＰＴＲにセットして、次のデータ・ライン
を尖鋭化する準備を行う。次に、ブロック２１６が、現
在のポインタが文書の最終ラインを指しているか否かを
判定し、否である場合は、ブロック２１６はブロック２
１８に移行し、そこで文書の後続のソース・ラインに等
しい次のポインタをセットする。現在のラインが最終ラ
インを照準している場合は、ブロック２１６はブロック
２２０に移行し、そこでは単に、文書の最終ラインを走
査するために現在のポインタに等しい値が次のポインタ
にセットされる。次の尖鋭化動作用に３つのポインタの
全ての準備が終了すると、ブロック２２２は、現在のラ
インをＹ方向にアップサンプルするために図７を呼び出
す。次にブロック２２４は、現在のラインをアップサン
プルするために図９を呼び出し、ブロック２２６はバッ
ファ内にまだ他のラインがあるか否かを判定する。バッ
ファ内にまだ他のラインがある場合は、ブロック２２６
は次のラインを尖鋭化するためにブロック２１０に戻
る。全てのラインの処理が終了すると、ブロック２２６
はスキャナ・ドライバ・ソフトウェア１２０に戻る。

【００１６】図３は本発明でデータを尖鋭化するために
利用されるピクセルの図面を示している。ここで図３を
参照すると、ピクセル３０２の全ての側の全ピクセルを
示したピクセル３０２が示されている。勿論、例えば最
上のライン又は最下部のラインや、左右の縁部のピクセ
ルのような、文書の縁部のピクセルの場合は、ピクセル
が存在しない側もある。しかし、このようにピクセルが
存在しない場合、代表的には白である文書の背景カラー
のグレースケール値を置き換えることができ、又は、縁
部のピクセルを単に無視することができる。

【００１７】ピクセル３０２の値は、ピクセル３０２と
とともに、隣接する全てのピクセル３０４，３０６，３
０８，３１０，３１２，３１４，３１６及び３１８の値
を統合することによって、下記の方程式を用いて計算す
ることができる。 (ピクセル * N - 合計(隣接のピクセル)) / M ここで、ＮとＭは所望の尖鋭化効果が得られるように選
択される。

【００１８】しかし、本発明の好適実施例では、尖鋭化
は垂直方向だけで行われる場合に最も効果的である。従
って、本発明の好適実施例での尖鋭化では、ピクセル３
０６と３１６だけが関与する。この尖鋭化の計算は、近
隣の値を作成するためにピクセル３０６と３１６の値を
加算し、その値をピクセル３０２の値の４倍から減算
し、その結果を２で割ることによって行われる。従っ
て、好適実施例では、Ｎ＝４であり、Ｍ＝２である。こ
の好適実施例は更に、平均値に到達するために探索テー
ブル方式をも採用しており、従って、文字の縁部にある
ピクセル値を調整することが可能である。

【００１９】図４は、本発明の尖鋭化方法のフローチャ
ートを示している。図４は図２のブロック２１０から呼
び出される。ここで図４を参照すると、このプロセスに
入った後、ブロック４０２は現在のラインから現在のピ
クセルを得る。図４、ブロック４０２の方法の最初の処
理中に、このブロックは現在のラインから最初のピクセ
ルを獲得し、その他の全ての処理回数中に、現在のライ
ンのための次のピクセルを得る。次に、ブロック４０４
が先行のラインから現在のピクセルを獲得し、ブロック
４０６は次のラインから現在の次のピクセルを獲得す
る。次に、ブロック４０８がこれらのピクセルを索引値
へと統合する。

【００２０】本発明の好適実施例では、グレースケール
値は０から１５まで変化することができ、ここに０は白
の値であり、１５は黒の値である。しかし、０が黒の値
であり、１５が白の値であるように逆にすることもで
き、又は、８ビットのグレースケールを用いることもで
きることが当業者には理解されよう。好適実施例では１
６のグレースケール・レベルが用いられているので、ピ
クセル値は４ビット数で表される。ブロック４０８は３
つのピクセル用の３つの４ビット数を互いに連結して統
合することによって、１２ビット数を作成し、その際、
先行ラインのピクセルは高位の４ビットを表し、現在の
ラインのピクセルは中位の４ビットを表し、次のライン
のピクセルは低位の４ビットを表す。しかし、探索テー
ブルが索引値の作成順と一致する限り、探索テーブルは
どの位数でも作成できるので、この位数は重要ではな
い。索引値は１２ビットを含んでいるので、探索テーブ
ルは４，０９６のエントリを含んでいなければならな
い。

【００２１】索引値を作成した後、ブロック４１０はブ
ロック４０８で作成された索引を使って尖鋭化した検索
テーブルから尖鋭化したピクセルの値を読み込む。

【００２２】尖鋭化のための探索テーブルは、より大き
いか等しい値の２つのピクセルの間の“谷間”のピクセ
ルを平均化することによって、又、“谷間”の判断基準
に合致しないピクセルを著しく尖鋭化するために、上記
の方程式を用いることによって作成される。このよう
に、尖鋭化のための探索テーブルを作成する方法は、次
のとおりである。 if (先行ピクセル≧現在のピクセル and 次のピクセル
≧現在のピクセル) then 尖鋭化されたピクセル = (現在のピクセル + 先行ピク
セル + 次のピクセル) / 3 else 尖鋭化されたピクセル = ((現在のピクセル * 4) - (先
行ピクセル + 次のピクセル)) / 2 ここに、“+”は加算を表し、“-”は減算を表し、
“/”は除算を表し、“*”は乗算を表す。

【００２３】尖鋭化されたピクセルは、探索テーブルで
はなく、前述の方法を用いても計算できることが当業者
には理解されよう。

【００２４】尖鋭化されたピクセル値を得た後、ブロッ
ク４１２はこの値を現在のラインに記憶する。次にブロ
ック４１４は、処理されるべきピクセルがこれ以上ある
か否を判定する。処理されるべきピクセルが未だある場
合は、ブロック４１４はブロック４０２に戻り、現在の
ラインから次のピクセルを得る。全てのピクセルが処理
された後、ブロック４１４は図２に戻る。

【００２５】図５は、図４のブロック４１０で用いられ
た尖鋭化のための探索テーブルから２つのエントリを示
している。この探索テーブルは前述の方法で作成され
る。図示した２行は、１６進の位置６３０ないし６３７
番地と、１６進の位置６３８ないし６３Ｆ番地の行であ
る。位置６３０番地は現在のラインの値３と、先行ライ
ンの値６と、次ののラインの値０を示す。これらの値を
有するピクセルを統合するために、尖鋭化されたピクセ
ル値は１６進の３である。

【００２６】図６は、入力データの各々のオリジナルの
走査ラインの間の新たな走査ラインのための本発明の方
法を示している。これは入力データからピクセル数を係
数２だけ有効に増大する。当業者には、データが係数２
以外の係数だけアップサンプルできることが理解されよ
う。

【００２７】ここで図６を参照すると、先行走査ライン
６０２の６つのピクセルは、現在の走査ライン６０６か
らの６つのピクセルを行き先走査ライン６０４へと統合
された状態で示されている。ピクセルは単に平均化され
ることによって統合される。例えば、１０の値を有する
ピクセル６０８は、８の値を有するピクセル６１２と統
合されて、平均値が９である行き先ピクセル６１０へと
統合される。

【００２８】図７はＹ方向にアップサンプルするための
本発明の方法のフローチャートを示している。図７は、
図２のブロック２２２から呼び出され、図６に関して前
述した方法を実行する。ここで図７を参照すると、この
処理プロセスに入った後、ブロック７０２は現在のライ
ンから一対の現在のピクセルを得る。前述のように、好
適実施例では、ピクセルは４ビット値によって表され
る。従って、一対のピクセルはデータの単一バイトであ
る８ビットによって表される。従って、ブロック７０２
は現在のラインからデータの次のバイトを検索する。ブ
ロック７０４は先行ラインから一対の現在のピクセルを
獲得し、ブロック７０６は、これらの４つのピクセルが
同じ値であるか否かを判定する。４つのピクセルが同じ
値である場合は、ブロック７０６はブロック７１４に移
行する。平均化を行う必要がないので、ブロック７１４
は現在のラインのピクセルを単に行き先ラインへと記憶
する。

【００２９】ピクセルが全て同一ではない場合は、ブロ
ック７０６はブロック７０８に移行し、これは一対の現
在のラインの各ピクセルを、一対の先行ラインの対応す
るピクセルへと加算する。次にブロック７１０は、これ
らの結果を２で割って平均値を計算し、次にこれらの２
つの平均化されたピクセル値を行き先ラインに記憶す
る。

【００３０】ピクセルを行き先ラインに記憶した後、制
御プロセスはブロック７１６に移行し、そこで、それ以
上のピクセル対があるか否かが判定され、ある場合は、
ブロック７１６は再びブロック７０２に戻る。全てのピ
クセル対の処理が終了した後、ブロック７１６は図２に
戻る。

【００３１】図８は、走査されたデータの各々の水平ピ
クセル間で新たなピクセルを形成して、データをＸ方向
に拡大する本発明の方法を示している。これによって、
データは係数２だけ有効にアップサンプルされる。別の
拡大率も可能であることが当業者には理解されよう。

【００３２】ここで図８を参照すると、４つのピクセル
に先行ピクセル８０６を加えた現在のライン８０２が、
８つのピクセルを含む行き先ライン８０４に統合される
状態が示されている。現在のライン８０２内の各ピクセ
ル毎に、ピクセルは行き先ピクセル８０４へとコピーさ
れ、現在のピクセルの平均値と、現在のピクセルの前の
ピクセルとから形成される行き先ライン８０４内に新た
なピクセルが形成される。例えば、ピクセル８０８はピ
クセル８１２として行き先ライン８０４へとコピーさ
れ、更に、ピクセル８０８の値と、先行ピクセル８０６
の値とを平均することによって、新たなピクセル８１０
が形成される。

【００３３】図９は、図８に関連して前述したように、
Ｘ方向にアップサンプルする方法のフローチャートを示
している。図９は図２のブロック２２４から呼び出され
る。ここで図９を参照すると、この処理プロセスに入っ
た後、ブロック９０２は変数ＰＲＥＶの値を０にセット
する。ＰＲＥＶは処理中のピクセルに先行するピクセル
であり、白を表す０の初期値から始まる。

【００３４】図９の方法は一時に４つのピクセルを処理
し、このデータは２バイト内に記憶される。ブロック９
０４はバッファから次の４つのピクセル、すなわち次の
２バイトを得る。ブロック９０６は次に、第１と第２の
ピクセルと共に、変数ＰＲＥＶ用の値を連結することに
よって、変数ＩＮＤＥＸ１用の値を形成する。次にブロ
ック９０８は、第２と、第３と第４のピクセルを互いに
連結することによって、変数ＩＮＤＥＸ２用の値を形成
する。次にブロック９１０は、ＩＮＤＥＸ１を用いてア
ップサンプル用の探索テーブルから４つのピクセル値を
獲得し、ブロック９１２は変数ＩＮＤＥＸ２と、索引を
用いてテーブルをアクセスすることによって、追加の４
つのピクセルを獲得する。次にブロック９１４はこれら
の８つのピクセルを行き先ラインに記憶し、ブロック９
１６は変数ＰＲＥＶをブロック９０４内で得られた第４
のピクセルの値にセットする。次に、ブロック９１８
は、ライン内に処理されるべき、それ以上のピクセルが
残っているか否かを判定し、残っている場合は、ブロッ
ク９１８は、次の４つのピクセルを処理するためにブロ
ック９０４に戻る。処理されるべき、それ以上のピクセ
ルがない場合は、制御プロセスは図２に戻る。

【００３５】図１０は変数ＩＮＤＥＸ１と、ＩＮＤＥＸ
２が、変数ＰＲＥＶと、ブロック９０４から得られた４
つのピクセルとから形成される態様を示した図面であ
る。図１０に示すように、ＩＮＤＥＸ１は第１及び第２
のピクセルと共にＰＲＥＶを連結することによって形成
され、ＩＮＤＥＸ２は第２及び第３及び第４のピクセル
を共に連結することによって形成される。

【００３６】図１１及び図１２は、探索テーブルからの
サンプルエントリと共に、アップサンプル用の探索テー
ブルを参照するためにピクセルが統合される態様を示し
ている。ここで図１１及び図１２を参照すると、４つの
ピクセル１１０４，１１０６，１１０８及び１１１０
が、ブロック９０６に関して説明したように、先行ピク
セル１１０２と統合される。ＩＮＤＥＸ１の値から成
り、図１０に関連して上述した３つのピクセル１１０
２，１１０４及び１１０６の値は、アップサンプル用の
探索テーブルをアクセスするために利用される。アップ
サンプルのための探索テーブル用の２行は図１２に示さ
れている。この例では１６進２３８番地である３つのピ
クセル１１０２，１１０４及び１１０６用の値は、図１
２に示した探索テーブルのエントリを参照するために利
用される。１６進２３８番地の探索テーブルエントリは
１６進値２３５８を含み、これは次にピクセル１１１
２，１１０４，１１１４及び１１０６用の行き先値に配
される。好適実施例では、図９の方法はＩｎｔｅｌ３
８６クラスのプロセッサで実装され、アップサンプル用
の探索テーブルのバイトは、テーブル内の１６進２３８
番地のエントリが図１２に示した２３５８ではなく、５
８２３であるように反転される。

【００３７】これまで本発明の現段階での好適実施例を
説明してきたが、本発明の側面が達成されることが明ら
かであり、当業者には、本発明の趣旨と範囲から逸脱す
ることなく、本発明の構造と回路に多くの変更が可能で
あり、大幅に異なる実施例と用途が可能であることが理
解されよう。これまでの開示内容は、例示のためであ
り、本発明を限定するものではなく、本発明の範囲は特
許請求の範囲に規定されているとおりである。

【００３８】以上、本発明の実施例について詳述した
が、以下、本発明を各実施態様毎に列挙する。（１）．光学式文字認識システムの認識手段に入力す
るためにアップサンプル（拡大サンプリング）されたデ
ータを作成するための、前記アップサンプルされたデー
タ内の文字を前記認識手段によってより正確に認識でき
るようにする、コンピュータ処理によるアップサンブリ
ング方法において、（ａ）少なくとも２本のデータ走査
ラインで文書を走査し、前記走査ラインは階調値を備え
るステップと、（ｂ）前記少なくとも２本の走査ライン
は前記階調値からデータの走査ラインを尖鋭化するステ
ップと、（ｃ）Ｙ方向のデータの前記尖鋭化された走査
ラインの前記階調値を統合することで、追加のＹ方向の
アップサンプルされたデータの走査ラインを作成するス
テップと、（ｄ）Ｘ方向のデータの前記尖鋭化された走
査ラインの前記階調値を統合することと、Ｘ方向に前記
追加のＹ方向にアップサンプルされたデータの走査ライ
ンの階調値を統合することによって、データのＸ方向の
アップサンプルされた走査ラインを生成するステップ
と、（ｅ）前記Ｘ方向のアップサンプルされたデータの
走査ラインを前記認識手段に伝送するステップ、とを有
することを特徴とする方法。（２）．前記ステップ（ｂ）が、データの各走査ライ
ン内の各ピクセルの近傍の全ピクセルの階調値を統合す
るステップを有することを特徴とする（１）記載の方
法。（３）．前記ステップ（ｂ）が、尖鋭化されたピクセ
ルを作成するために、各走査ライン内の各ピクセルのＹ
方向の上方のピクセルの階調値と、各ピクセルのＹ方向
の下方のピクセルの階調値とを統合するステップを有す
ることを特徴とする（１）記載の方法。（４）．前記統合ステップが、各ピクセルの上方の前
記ピクセルと、各ピクセルの下方の前記ピクセルが等し
いか、より暗い階調値を持つ場合は、３つのピクセル全
てについて階調値を平均して前記尖鋭化されたピクセル
の階調値を作成し、各ピクセルの上方の前記ピクセル
と、各ピクセルの下方の前記ピクセルが等しくない階調
値を持つか、いずれかがより暗くない階調値を持つ場合
は、各ピクセルの上方の前記ピクセルの階調値と、各ピ
クセルの下方の前記ピクセルの階調値を合計し、前記ピ
クセルの４倍の階調値から加算結果を減算し、且つその
結果を２で割って、前記尖鋭化されたピクセルの階調値
を作成するステップを有することを特徴とする（３）記
載の方法。（５）．前記統合ステップが、各ピクセルの上方の前
記ピクセルの階調値と、各ピクセルの階調値と、各ピク
セルの下方の前記ピクセルの階調値とを索引値へと連結
し、且つ、前記索引値を用いてテーブルから前記尖鋭化
されたピクセルの階調値を検索するステップを有するこ
とを特徴とする（４）記載の方法。（６）．前記ステップ（ｃ）が、データの連続する一
対の尖鋭化された走査ラインの間の第３の走査ラインを
作成するステップを有し、その際、前記第３の走査ライ
ンの各ピクセルの階調値が、尖鋭化された走査ラインの
前記連続する一対の各ライン内の対応するピクセルの階
調値の統合をするステップを有することを特徴とする
（１）記載の方法。（７）．前記ステップ（ｃ）が、前記一対のデータの
ラインの各ライン内の対応するピクセルの階調値を平均
することで、データの前記第３のピクセル走査ライン内
にピクセルの階調値を作成するステップを有することを
特徴とする（６）記載の方法。（８）．前記ステップ（ｄ）が、尖鋭化されたデータ
の各走査ライン内の各オリジナル・ピクセルのための前
記Ｘ方向にアップサンプルされたデータの走査ライン
内、および、追加のＹ方向にアップサンプルされたデー
タの各走査ライン内の、一対の行き先ピクセルを作成す
るステップを有し、その際、前記一対のピクセルの階調
値は、前記オリジナル・ピクセルからの階調値と、前記
オリジナル・ピクセルからの前記階調値と各データの走
査ライン内の前記オリジナル・ピクセルに先行するピク
セルからの階調値との統合値を有する階調値とを有す
る、ことを特徴とする（１）記載の方法。（９）．前記ステップ（ｄ）が、前記オリジナル・ピ
クセルからの前記の階調値と、前記オリジナル・ピクセ
ルに先行する前記ピクセルからの前記階調値とを平均化
することにより前記統合値を形成するステップを有する
ことを特徴とする（８）記載の方法。（１０）．前記ステップ（ｄ）が、走査ラインから４
つのピクセルの階調値を検索するステップと、先行して
作成された最後のピクセルの階調値と、前記４つのピク
セルの階調値とを連結して、連結された索引を作成する
ステップと、前記連結された索引の最初の３つのピクセ
ルを第１の索引へと分離するステップと、前記連結され
た索引の最後の３つのピクセルを第２の索引へと分離す
るステップと、前記最初の索引値を利用してテーブルか
ら最初の４つの尖鋭化されたピクセルの階調値を検索す
るステップと、前記第２の索引値を利用してテーブルか
ら第２の４つの尖鋭化されたピクセルの階調値を検索す
るステップと、前記最初の４つの尖鋭化されたピクセル
の階調値と、前記第２の４つの尖鋭化されたピクセルの
階調値とを前記Ｘ方向にアップサンプルされたデータの
走査ラインに記憶するステップ、とを有することを特徴
とする（１）記載の方法。

【００３９】

【発明の効果】以上のように、本発明を用いると、光学
式文字認識システムで極めて小さい字体の走査精度を向
上させることができ、走査のための大きい字体を用意す
るために、走査されたデータをアップサンプル（拡大サ
ンプリング）することによって、上記の精度を向上させ
ることができる。

【図面の簡単な説明】

【図１】本発明を含むコンピュータ・システムの概略
図である。

【図２】本発明のドライバ・ソフトウェア部分のフロ
ーチャートである。

【図３】本発明でデータを尖鋭化するために利用され
るピクセルの集合の図面である。

【図４】本発明の尖鋭化方法のフローチャートであ
る。

【図５】本発明の性能を高めるために利用される尖鋭
化用の探索テーブルの部分である。

【図６】データの各々のオリジナル走査ラインの間に
新たなピクセル走査ラインを形成する本発明の方法であ
る。

【図７】Ｙ方向にアップサンプルの方法のフローチャ
ートである。

【図８】データの各々の水平ピクセルの間に新たなピ
クセルを形成する本発明の方法である。

【図９】Ｘ方向にアップサンプルするための方法のフ
ローチャートである。

【図１０】図９の方法で索引が形成される態様を示す
図面である。

【図１１】図９の方法で探索テーブルからデータが検
索される態様を示す図面である。

【図１２】図９の方法で用いられるアップサンプル用
探索テーブルの一部である。

【符号の説明】

２０２、２０４、２０６、２０８、２１０、２１２、２
１４、２１６、２１８、２２０、２２２、２２４、２２
６：ブロック

Claims

【特許請求の範囲】

【請求項１】光学式文字認識システムの認識手段に入力
するためにアップサンプル（拡大サンプリング）された
データを作成するための、前記アップサンプルされたデ
ータ内の文字を前記認識手段によってより正確に認識で
きるようにする、コンピュータ処理によるアップサンブ
リング方法において、（ａ）少なくとも２本のデータ走査ラインで文書を走査
し、前記走査ラインは階調値を備えるステップと、（ｂ）前記少なくとも２本の走査ラインは前記階調値か
らデータの走査ラインを尖鋭化するステップと、（ｃ）Ｙ方向のデータの前記尖鋭化された走査ラインの
前記階調値を統合することで、追加のＹ方向のアップサ
ンプルされたデータの走査ラインを作成するステップ
と、（ｄ）Ｘ方向のデータの前記尖鋭化された走査ラインの
前記階調値を統合することと、Ｘ方向に前記追加のＹ方
向にアップサンプルされたデータの走査ラインの階調値
を統合することによって、データのＸ方向のアップサン
プルされた走査ラインを生成するステップと、（ｅ）前記Ｘ方向のアップサンプルされたデータの走査
ラインを前記認識手段に伝送するステップ、とを有することを特徴とする方法。
【請求項２】前記ステップ（ｂ）が、データの各走査ラ
イン内の各ピクセルの近傍の全ピクセルの階調値を統合
するステップを有することを特徴とする請求項１記載の
方法。
【請求項３】前記ステップ（ｂ）が、尖鋭化されたピク
セルを作成するために、各走査ライン内の各ピクセルの
Ｙ方向の上方のピクセルの階調値と、各ピクセルのＹ方
向の下方のピクセルの階調値とを統合するステップを有
することを特徴とする請求項１記載の方法。
【請求項４】前記統合ステップが、各ピクセルの上方の前記ピクセルと、各ピクセルの下方
の前記ピクセルが等しいか、より暗い階調値を持つ場合
は、３つのピクセル全てについて階調値を平均して前記
尖鋭化されたピクセルの階調値を作成し、各ピクセルの上方の前記ピクセルと、各ピクセルの下方
の前記ピクセルが等しくない階調値を持つか、いずれか
がより暗くない階調値を持つ場合は、各ピクセルの上方
の前記ピクセルの階調値と、各ピクセルの下方の前記ピ
クセルの階調値を合計し、前記ピクセルの４倍の階調値
から加算結果を減算し、且つその結果を２で割って、前
記尖鋭化されたピクセルの階調値を作成するステップを
有することを特徴とする請求項３記載の方法。
【請求項５】前記統合ステップが、各ピクセルの上方の前記ピクセルの階調値と、各ピクセ
ルの階調値と、各ピクセルの下方の前記ピクセルの階調
値とを索引値へと連結し、且つ、前記索引値を用いてテーブルから前記尖鋭化されたピク
セルの階調値を検索するステップを有することを特徴と
する請求項４記載の方法。
【請求項６】前記ステップ（ｃ）が、データの連続する
一対の尖鋭化された走査ラインの間の第３の走査ライン
を作成するステップを有し、その際、前記第３の走査ラ
インの各ピクセルの階調値が、尖鋭化された走査ライン
の前記連続する一対の各ライン内の対応するピクセルの
階調値の統合をするステップを有することを特徴とする
請求項１記載の方法。
【請求項７】前記ステップ（ｃ）が、前記一対のデータ
のラインの各ライン内の対応するピクセルの階調値を平
均することで、データの前記第３のピクセル走査ライン
内にピクセルの階調値を作成するステップを有すること
を特徴とする請求項６記載の方法。
【請求項８】前記ステップ（ｄ）が、尖鋭化されたデー
タの各走査ライン内の各オリジナル・ピクセルのための
前記Ｘ方向にアップサンプルされたデータの走査ライン
内、および、追加のＹ方向にアップサンプルされたデー
タの各走査ライン内の、一対の行き先ピクセルを作成す
るステップを有し、その際、前記一対のピクセルの階調
値は、前記オリジナル・ピクセルからの階調値と、前記
オリジナル・ピクセルからの前記階調値と各データの走
査ライン内の前記オリジナル・ピクセルに先行するピク
セルからの階調値との統合値を有する階調値とを有す
る、ことを特徴とする請求項１記載の方法。
【請求項９】前記ステップ（ｄ）が、前記オリジナル・
ピクセルからの前記の階調値と、前記オリジナル・ピク
セルに先行する前記ピクセルからの前記階調値とを平均
化することにより前記統合値を形成するステップを有す
ることを特徴とする請求項８記載の方法。
【請求項１０】前記ステップ（ｄ）が、走査ラインから４つのピクセルの階調値を検索するステ
ップと、先行して作成された最後のピクセルの階調値と、前記４
つのピクセルの階調値とを連結して、連結された索引を
作成するステップと、前記連結された索引の最初の３つのピクセルを第１の索
引へと分離するステップと、前記連結された索引の最後の３つのピクセルを第２の索
引へと分離するステップと、前記最初の索引値を利用してテーブルから最初の４つの
尖鋭化されたピクセルの階調値を検索するステップと、前記第２の索引値を利用してテーブルから第２の４つの
尖鋭化されたピクセルの階調値を検索するステップと、前記最初の４つの尖鋭化されたピクセルの階調値と、前
記第２の４つの尖鋭化されたピクセルの階調値とを前記
Ｘ方向にアップサンプルされたデータの走査ラインに記
憶するステップ、とを有することを特徴とする請求項１
記載の方法。