JPH07200729A - 光学式文字認識方法 - Google Patents

光学式文字認識方法

Info

Publication number
JPH07200729A
JPH07200729A JP6319309A JP31930994A JPH07200729A JP H07200729 A JPH07200729 A JP H07200729A JP 6319309 A JP6319309 A JP 6319309A JP 31930994 A JP31930994 A JP 31930994A JP H07200729 A JPH07200729 A JP H07200729A
Authority
JP
Japan
Prior art keywords
pixel
value
pixels
data
tone
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP6319309A
Other languages
English (en)
Inventor
Kevin S Burke
ケビン・エス・バーク
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
HP Inc
Original Assignee
Hewlett Packard Co
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hewlett Packard Co filed Critical Hewlett Packard Co
Publication of JPH07200729A publication Critical patent/JPH07200729A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/16Image preprocessing
    • G06V30/166Normalisation of pattern dimensions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Image Processing (AREA)
  • Character Input (AREA)

Abstract

(57)【要約】 【目的】光学式文字認識システムで極めて小さい字体の
走査精度を向上させる。 【構成】文書を走査してバッファに溜める(202)。
データを尖鋭化するために3つのポインタをセットする
(204、206、208)。現在のラインを尖鋭化す
る(210)。更に次のデータ・ラインを尖鋭化するた
めにポインタ変数をセットしなおす(212、21
4)。現在のポインタが文書の最終ラインを指している
か判断し(216)、次のポインタをセットする(21
8、220)。次の尖鋭化動作用に3つのポインタの全
ての準備が終了すると、現在のラインをY方向にアップ
サンプルし(222)、現在のラインをアップサンプル
する(224)。バッファ内にまだ他のラインがあれば
ブロック210に戻る。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明はコンピュータ・システム
に関し、特にコンピュータ・システムでの光学式文字認
識(OCR)システムに関する。更に詳細には、本発明
は光学式文字認識システムを利用した極めて大きい、
又、極めて小さい字体の認識システムに関する。
【0002】
【従来の技術】光学式文字認識システムは、1ポイント
を1/72インチとした場合、文字サイズが8から14ポイ
ントの間にある文字を正確に識別する率は高い。ポイン
トのサイズがこのような“絶好の範囲”から変動する
と、認識精度は、特に8ポイント以下のポイント・サイ
ズの場合は著しく低下する。精度の低下を誘発する要因
の一つは、ほとんどの文書が8から12ポイントの範囲
のサイズのテキストから成っているため、ほとんどのO
CRシステムがそれらの特定のポイント・サイズに同調
されているということにある。このサイズ範囲以外の文
字を認識しようとする場合、8ないし12ポイントの範
囲内の文字サイズの認識に利用される(文字の)特徴の
多くは、この範囲外の文字サイズではひずみを生ずる
か、無効になってしまう。例えば、このシステムは文字
の境界ボックス幅と比較して比較的狭い文字ストローク
幅を期待するというヒューリスティック(発見的傾向)
を有するが、極めて大きいテキストの場合は、ストロー
ク幅は全て極めて広く、従って無効になってしまうであ
ろう。このような種類の問題点は、OCRの用例が、特
徴の抽出に先立って文字を標準化した場合でも、依然と
して生ずることがある。
【0003】極めて小さい文字の認識に影響を及ぼす別
の要因には特徴の喪失がある。特徴の喪失は、小さいテ
キストにおいて、“a”、“e”等のような文字で生ず
る閉路の文字の特徴が潰れる場合に生ずる。例えば、
“e”の閉路が潰れると、“e”はOCRシステムによ
って“c”として誤って認識されることがある。
【0004】そこでこの分野では、光学式文字認識シス
テムにおいて、極めて小さい文字の認識精度を向上させ
たシステムに対する必要性がある。
【0005】
【発明が解決しようとする課題】本発明の一側面は、光
学式文字認識システムで極めて小さい字体の走査精度を
向上させることにある。
【0006】本発明の別の側面は、走査のための大きい
字体を用意するために、走査されたデータをアップサン
プル(拡大サンプリング)することによって、上記の精
度を向上させることにある。
【0007】本発明の更に別の側面は、データをアップ
サンプルする前に走査されたデータを尖鋭化することに
ある。
【0008】
【課題を解決するための手段】本発明の上記の、及びそ
の他の側面は、最初にデータを尖鋭化し、次にデータを
アップサンプルして、データ内に含まれる文字サイズを
拡大し、それによって光学的文字認識の鮮度を高めるよ
うに、走査されるグレースケール画像を処理するシステ
ムによって達成される。
【0009】データは先ず、各ピクセルを処理する際
に、各ピクセルの上下のピクセルを点検し、現在のピク
セルの上下のデータに基づいて、現在のピクセルを調整
することによってY方向に尖鋭化される。データを尖鋭
化した後、データはピクセルの各々の既存の走査ライン
の間に、ピクセルの新たな走査ラインを作成することに
よってY方向にアップサンプルされる。この新たな走査
ラインは、2つの走査ラインのピクセルのグレースケー
ルのレベルを平均化し、この平均値を、2つの走査ライ
ンの間にある新たな走査ラインに置くことによって作成
される。同様にして、走査ライン内の各々の既存のピク
セルの間に新たなピクセルを付加することによって、デ
ータは各走査ライン内で拡大される。各々のピクセル対
の間の新たなピクセルは、一対のピクセル内の2つのピ
クセルの値を平均化することによって形成される。
【0010】
【実施例】下記の説明は、本発明を実施する現段階で最
良のモードの説明である。この説明は、限定的な意味で
はなく、本発明の基本原理を説明する目的であるにすぎ
ない。本発明の範囲は、添付の特許請求の範囲を参照す
ることによって判断されるべきものである。
【0011】図1は、本発明を含むコンピュータ・シス
テムの概略図を示している。ここで図1を参照すると、
コンピュータ・システム100はシステムバス104を
経てコンピュータ・システム100の別の素子と通信す
る処理素子102を含んでいる。キーボード106とマ
ウス110によって、コンピュータ・システム100に
テキスト及びグラフィックの入力が行われ、グラフィッ
ク・ディスプレー108によって、コンピュータ・シス
テム100内のソフトウェアが、システムのユーザーに
データを出力することが可能になる。ディスク112は
ソフトウェアと本発明のデータを含んでおり、通信イン
タフェース114によって、本発明は光学式文字認識ス
キャナ124と通信することができる。
【0012】メモリ116はオペレーティング・システ
ム118を含んでおり、これは、MS−DOSオペレー
ティング・システムでもよいし、入手できる多くの他の
オペレーティング・システムの一つでもよい。スキャナ
・ドライバ・ソフトウェア120はオペレーティング・
システム118を介してOCRスキャナ124と通信
し、応用プログラム122にサービスをを供給する。本
発明は、本発明からデータを受理し、文字をASCII
のような機械読み取り可能な形式に変換する認識手段と
共に、スキャナ・ドライバ・ソフトウェア120内に含
まれている。
【0013】図2は本発明のドライバ・ソフトウェア部
分のフローチャートを示している。図2は、スキャナ・
ドライバ・ソフトウェア120が文書から走査されたデ
ータをアップサンプルしたい場合、又は、文書から走査
されたデータの一部をアップサンプルしたい場合に、ス
キャナ・ドライバ・ソフトウェア120(図1)によっ
て呼び出される。スキャナ・ドライバ・ソフトウェア1
20は、より小さいテキストである場合が多い図面のタ
イトルのような文書の部分をアップサンプルすることを
決定するが、文書のどの部分をアップサンプルするかの
決定については本発明の構成要素ではないので、詳細に
は説明しない。
【0014】さて図2を参照すると、スキャナ・ドライ
バ・ソフトウェア120(図1)によって呼び出される
と、制御プロセスはブロック202で図2に入る。ブロ
ック202は文書、又は文書の一部を走査してバッファ
に溜める。別の実施例では、この動作は図2のフローチ
ャートを呼び出す前に、スキャナ・ドライバ・ソフトウ
ェアによって実行することも可能であろう。ブロック2
04はバッファの開始アドレスを得て、このアドレスを
ポインタ変数PREV_PTR内にセットする。ブロッ
ク206はこれもバッファの開始アドレスをCUR_P
TRポインタ変数にセットする。ブロック208は、バ
ッファの開始アドレスとバッファ内のピクセルの走査さ
れたラインの長さを加算して求められ、NEXT_PT
R変数に第2の走査ラインの開始アドレスをセットす
る。これらの3つのポインタはデータを尖鋭化するため
に利用される。PREV_PTRは走査されたデータの
先行のラインを照準し、CUR_PTRは現在尖鋭化中
のラインを照準し、NEXT_PTRは尖鋭化されたラ
インの次のラインを照準する。しかし、初期状態では、
先行のポインタと現在のポインタの双方が動作の開始時
点で同じラインを照準することが必要であり、このライ
ンは文書の最上部の、第1の走査ラインで始まる。
【0015】3つのポインタをセットした後、ブロック
210は現在のラインを尖鋭化するために図4を呼び出
す。次に、ブロック212はPREV_PTRにCUR
_PTRをセットし、ブロック214はCUR_PTR
をNEXT_PTRにセットして、次のデータ・ライン
を尖鋭化する準備を行う。次に、ブロック216が、現
在のポインタが文書の最終ラインを指しているか否かを
判定し、否である場合は、ブロック216はブロック2
18に移行し、そこで文書の後続のソース・ラインに等
しい次のポインタをセットする。現在のラインが最終ラ
インを照準している場合は、ブロック216はブロック
220に移行し、そこでは単に、文書の最終ラインを走
査するために現在のポインタに等しい値が次のポインタ
にセットされる。次の尖鋭化動作用に3つのポインタの
全ての準備が終了すると、ブロック222は、現在のラ
インをY方向にアップサンプルするために図7を呼び出
す。次にブロック224は、現在のラインをアップサン
プルするために図9を呼び出し、ブロック226はバッ
ファ内にまだ他のラインがあるか否かを判定する。バッ
ファ内にまだ他のラインがある場合は、ブロック226
は次のラインを尖鋭化するためにブロック210に戻
る。全てのラインの処理が終了すると、ブロック226
はスキャナ・ドライバ・ソフトウェア120に戻る。
【0016】図3は本発明でデータを尖鋭化するために
利用されるピクセルの図面を示している。ここで図3を
参照すると、ピクセル302の全ての側の全ピクセルを
示したピクセル302が示されている。勿論、例えば最
上のライン又は最下部のラインや、左右の縁部のピクセ
ルのような、文書の縁部のピクセルの場合は、ピクセル
が存在しない側もある。しかし、このようにピクセルが
存在しない場合、代表的には白である文書の背景カラー
のグレースケール値を置き換えることができ、又は、縁
部のピクセルを単に無視することができる。
【0017】ピクセル302の値は、ピクセル302と
とともに、隣接する全てのピクセル304,306,3
08,310,312,314,316及び318の値
を統合することによって、下記の方程式を用いて計算す
ることができる。 (ピクセル * N - 合計(隣接のピクセル)) / M ここで、NとMは所望の尖鋭化効果が得られるように選
択される。
【0018】しかし、本発明の好適実施例では、尖鋭化
は垂直方向だけで行われる場合に最も効果的である。従
って、本発明の好適実施例での尖鋭化では、ピクセル3
06と316だけが関与する。この尖鋭化の計算は、近
隣の値を作成するためにピクセル306と316の値を
加算し、その値をピクセル302の値の4倍から減算
し、その結果を2で割ることによって行われる。従っ
て、好適実施例では、N=4であり、M=2である。こ
の好適実施例は更に、平均値に到達するために探索テー
ブル方式をも採用しており、従って、文字の縁部にある
ピクセル値を調整することが可能である。
【0019】図4は、本発明の尖鋭化方法のフローチャ
ートを示している。図4は図2のブロック210から呼
び出される。ここで図4を参照すると、このプロセスに
入った後、ブロック402は現在のラインから現在のピ
クセルを得る。図4、ブロック402の方法の最初の処
理中に、このブロックは現在のラインから最初のピクセ
ルを獲得し、その他の全ての処理回数中に、現在のライ
ンのための次のピクセルを得る。次に、ブロック404
が先行のラインから現在のピクセルを獲得し、ブロック
406は次のラインから現在の次のピクセルを獲得す
る。次に、ブロック408がこれらのピクセルを索引値
へと統合する。
【0020】本発明の好適実施例では、グレースケール
値は0から15まで変化することができ、ここに0は白
の値であり、15は黒の値である。しかし、0が黒の値
であり、15が白の値であるように逆にすることもで
き、又は、8ビットのグレースケールを用いることもで
きることが当業者には理解されよう。好適実施例では1
6のグレースケール・レベルが用いられているので、ピ
クセル値は4ビット数で表される。ブロック408は3
つのピクセル用の3つの4ビット数を互いに連結して統
合することによって、12ビット数を作成し、その際、
先行ラインのピクセルは高位の4ビットを表し、現在の
ラインのピクセルは中位の4ビットを表し、次のライン
のピクセルは低位の4ビットを表す。しかし、探索テー
ブルが索引値の作成順と一致する限り、探索テーブルは
どの位数でも作成できるので、この位数は重要ではな
い。索引値は12ビットを含んでいるので、探索テーブ
ルは4,096のエントリを含んでいなければならな
い。
【0021】索引値を作成した後、ブロック410はブ
ロック408で作成された索引を使って尖鋭化した検索
テーブルから尖鋭化したピクセルの値を読み込む。
【0022】尖鋭化のための探索テーブルは、より大き
いか等しい値の2つのピクセルの間の“谷間”のピクセ
ルを平均化することによって、又、“谷間”の判断基準
に合致しないピクセルを著しく尖鋭化するために、上記
の方程式を用いることによって作成される。このよう
に、尖鋭化のための探索テーブルを作成する方法は、次
のとおりである。 if (先行ピクセル≧現在のピクセル and 次のピクセル
≧現在のピクセル) then 尖鋭化されたピクセル = (現在のピクセル + 先行ピク
セル + 次のピクセル) / 3 else 尖鋭化されたピクセル = ((現在のピクセル * 4) - (先
行ピクセル + 次のピクセル)) / 2 ここに、“+”は加算を表し、“-”は減算を表し、
“/”は除算を表し、“*”は乗算を表す。
【0023】尖鋭化されたピクセルは、探索テーブルで
はなく、前述の方法を用いても計算できることが当業者
には理解されよう。
【0024】尖鋭化されたピクセル値を得た後、ブロッ
ク412はこの値を現在のラインに記憶する。次にブロ
ック414は、処理されるべきピクセルがこれ以上ある
か否を判定する。処理されるべきピクセルが未だある場
合は、ブロック414はブロック402に戻り、現在の
ラインから次のピクセルを得る。全てのピクセルが処理
された後、ブロック414は図2に戻る。
【0025】図5は、図4のブロック410で用いられ
た尖鋭化のための探索テーブルから2つのエントリを示
している。この探索テーブルは前述の方法で作成され
る。図示した2行は、16進の位置630ないし637
番地と、16進の位置638ないし63F番地の行であ
る。位置630番地は現在のラインの値3と、先行ライ
ンの値6と、次ののラインの値0を示す。これらの値を
有するピクセルを統合するために、尖鋭化されたピクセ
ル値は16進の3である。
【0026】図6は、入力データの各々のオリジナルの
走査ラインの間の新たな走査ラインのための本発明の方
法を示している。これは入力データからピクセル数を係
数2だけ有効に増大する。当業者には、データが係数2
以外の係数だけアップサンプルできることが理解されよ
う。
【0027】ここで図6を参照すると、先行走査ライン
602の6つのピクセルは、現在の走査ライン606か
らの6つのピクセルを行き先走査ライン604へと統合
された状態で示されている。ピクセルは単に平均化され
ることによって統合される。例えば、10の値を有する
ピクセル608は、8の値を有するピクセル612と統
合されて、平均値が9である行き先ピクセル610へと
統合される。
【0028】図7はY方向にアップサンプルするための
本発明の方法のフローチャートを示している。図7は、
図2のブロック222から呼び出され、図6に関して前
述した方法を実行する。ここで図7を参照すると、この
処理プロセスに入った後、ブロック702は現在のライ
ンから一対の現在のピクセルを得る。前述のように、好
適実施例では、ピクセルは4ビット値によって表され
る。従って、一対のピクセルはデータの単一バイトであ
る8ビットによって表される。従って、ブロック702
は現在のラインからデータの次のバイトを検索する。ブ
ロック704は先行ラインから一対の現在のピクセルを
獲得し、ブロック706は、これらの4つのピクセルが
同じ値であるか否かを判定する。4つのピクセルが同じ
値である場合は、ブロック706はブロック714に移
行する。平均化を行う必要がないので、ブロック714
は現在のラインのピクセルを単に行き先ラインへと記憶
する。
【0029】ピクセルが全て同一ではない場合は、ブロ
ック706はブロック708に移行し、これは一対の現
在のラインの各ピクセルを、一対の先行ラインの対応す
るピクセルへと加算する。次にブロック710は、これ
らの結果を2で割って平均値を計算し、次にこれらの2
つの平均化されたピクセル値を行き先ラインに記憶す
る。
【0030】ピクセルを行き先ラインに記憶した後、制
御プロセスはブロック716に移行し、そこで、それ以
上のピクセル対があるか否かが判定され、ある場合は、
ブロック716は再びブロック702に戻る。全てのピ
クセル対の処理が終了した後、ブロック716は図2に
戻る。
【0031】図8は、走査されたデータの各々の水平ピ
クセル間で新たなピクセルを形成して、データをX方向
に拡大する本発明の方法を示している。これによって、
データは係数2だけ有効にアップサンプルされる。別の
拡大率も可能であることが当業者には理解されよう。
【0032】ここで図8を参照すると、4つのピクセル
に先行ピクセル806を加えた現在のライン802が、
8つのピクセルを含む行き先ライン804に統合される
状態が示されている。現在のライン802内の各ピクセ
ル毎に、ピクセルは行き先ピクセル804へとコピーさ
れ、現在のピクセルの平均値と、現在のピクセルの前の
ピクセルとから形成される行き先ライン804内に新た
なピクセルが形成される。例えば、ピクセル808はピ
クセル812として行き先ライン804へとコピーさ
れ、更に、ピクセル808の値と、先行ピクセル806
の値とを平均することによって、新たなピクセル810
が形成される。
【0033】図9は、図8に関連して前述したように、
X方向にアップサンプルする方法のフローチャートを示
している。図9は図2のブロック224から呼び出され
る。ここで図9を参照すると、この処理プロセスに入っ
た後、ブロック902は変数PREVの値を0にセット
する。PREVは処理中のピクセルに先行するピクセル
であり、白を表す0の初期値から始まる。
【0034】図9の方法は一時に4つのピクセルを処理
し、このデータは2バイト内に記憶される。ブロック9
04はバッファから次の4つのピクセル、すなわち次の
2バイトを得る。ブロック906は次に、第1と第2の
ピクセルと共に、変数PREV用の値を連結することに
よって、変数INDEX1用の値を形成する。次にブロ
ック908は、第2と、第3と第4のピクセルを互いに
連結することによって、変数INDEX2用の値を形成
する。次にブロック910は、INDEX1を用いてア
ップサンプル用の探索テーブルから4つのピクセル値を
獲得し、ブロック912は変数INDEX2と、索引を
用いてテーブルをアクセスすることによって、追加の4
つのピクセルを獲得する。次にブロック914はこれら
の8つのピクセルを行き先ラインに記憶し、ブロック9
16は変数PREVをブロック904内で得られた第4
のピクセルの値にセットする。次に、ブロック918
は、ライン内に処理されるべき、それ以上のピクセルが
残っているか否かを判定し、残っている場合は、ブロッ
ク918は、次の4つのピクセルを処理するためにブロ
ック904に戻る。処理されるべき、それ以上のピクセ
ルがない場合は、制御プロセスは図2に戻る。
【0035】図10は変数INDEX1と、INDEX
2が、変数PREVと、ブロック904から得られた4
つのピクセルとから形成される態様を示した図面であ
る。図10に示すように、INDEX1は第1及び第2
のピクセルと共にPREVを連結することによって形成
され、INDEX2は第2及び第3及び第4のピクセル
を共に連結することによって形成される。
【0036】図11及び図12は、探索テーブルからの
サンプルエントリと共に、アップサンプル用の探索テー
ブルを参照するためにピクセルが統合される態様を示し
ている。ここで図11及び図12を参照すると、4つの
ピクセル1104,1106,1108及び1110
が、ブロック906に関して説明したように、先行ピク
セル1102と統合される。INDEX1の値から成
り、図10に関連して上述した3つのピクセル110
2,1104及び1106の値は、アップサンプル用の
探索テーブルをアクセスするために利用される。アップ
サンプルのための探索テーブル用の2行は図12に示さ
れている。この例では16進238番地である3つのピ
クセル1102,1104及び1106用の値は、図1
2に示した探索テーブルのエントリを参照するために利
用される。16進238番地の探索テーブルエントリは
16進値2358を含み、これは次にピクセル111
2,1104,1114及び1106用の行き先値に配
される。好適実施例では、図9の方法はIntel 3
86クラスのプロセッサで実装され、アップサンプル用
の探索テーブルのバイトは、テーブル内の16進238
番地のエントリが図12に示した2358ではなく、5
823であるように反転される。
【0037】これまで本発明の現段階での好適実施例を
説明してきたが、本発明の側面が達成されることが明ら
かであり、当業者には、本発明の趣旨と範囲から逸脱す
ることなく、本発明の構造と回路に多くの変更が可能で
あり、大幅に異なる実施例と用途が可能であることが理
解されよう。これまでの開示内容は、例示のためであ
り、本発明を限定するものではなく、本発明の範囲は特
許請求の範囲に規定されているとおりである。
【0038】以上、本発明の実施例について詳述した
が、以下、本発明を各実施態様毎に列挙する。 (1). 光学式文字認識システムの認識手段に入力す
るためにアップサンプル(拡大サンプリング)されたデ
ータを作成するための、前記アップサンプルされたデー
タ内の文字を前記認識手段によってより正確に認識でき
るようにする、コンピュータ処理によるアップサンブリ
ング方法において、(a)少なくとも2本のデータ走査
ラインで文書を走査し、前記走査ラインは階調値を備え
るステップと、(b)前記少なくとも2本の走査ライン
は前記階調値からデータの走査ラインを尖鋭化するステ
ップと、(c)Y方向のデータの前記尖鋭化された走査
ラインの前記階調値を統合することで、追加のY方向の
アップサンプルされたデータの走査ラインを作成するス
テップと、(d)X方向のデータの前記尖鋭化された走
査ラインの前記階調値を統合することと、X方向に前記
追加のY方向にアップサンプルされたデータの走査ライ
ンの階調値を統合することによって、データのX方向の
アップサンプルされた走査ラインを生成するステップ
と、(e)前記X方向のアップサンプルされたデータの
走査ラインを前記認識手段に伝送するステップ、とを有
することを特徴とする方法。 (2). 前記ステップ(b)が、データの各走査ライ
ン内の各ピクセルの近傍の全ピクセルの階調値を統合す
るステップを有することを特徴とする(1)記載の方
法。 (3). 前記ステップ(b)が、尖鋭化されたピクセ
ルを作成するために、各走査ライン内の各ピクセルのY
方向の上方のピクセルの階調値と、各ピクセルのY方向
の下方のピクセルの階調値とを統合するステップを有す
ることを特徴とする(1)記載の方法。 (4). 前記統合ステップが、各ピクセルの上方の前
記ピクセルと、各ピクセルの下方の前記ピクセルが等し
いか、より暗い階調値を持つ場合は、3つのピクセル全
てについて階調値を平均して前記尖鋭化されたピクセル
の階調値を作成し、各ピクセルの上方の前記ピクセル
と、各ピクセルの下方の前記ピクセルが等しくない階調
値を持つか、いずれかがより暗くない階調値を持つ場合
は、各ピクセルの上方の前記ピクセルの階調値と、各ピ
クセルの下方の前記ピクセルの階調値を合計し、前記ピ
クセルの4倍の階調値から加算結果を減算し、且つその
結果を2で割って、前記尖鋭化されたピクセルの階調値
を作成するステップを有することを特徴とする(3)記
載の方法。 (5). 前記統合ステップが、各ピクセルの上方の前
記ピクセルの階調値と、各ピクセルの階調値と、各ピク
セルの下方の前記ピクセルの階調値とを索引値へと連結
し、且つ、前記索引値を用いてテーブルから前記尖鋭化
されたピクセルの階調値を検索するステップを有するこ
とを特徴とする(4)記載の方法。 (6). 前記ステップ(c)が、データの連続する一
対の尖鋭化された走査ラインの間の第3の走査ラインを
作成するステップを有し、その際、前記第3の走査ライ
ンの各ピクセルの階調値が、尖鋭化された走査ラインの
前記連続する一対の各ライン内の対応するピクセルの階
調値の統合をするステップを有することを特徴とする
(1)記載の方法。 (7). 前記ステップ(c)が、前記一対のデータの
ラインの各ライン内の対応するピクセルの階調値を平均
することで、データの前記第3のピクセル走査ライン内
にピクセルの階調値を作成するステップを有することを
特徴とする(6)記載の方法。 (8). 前記ステップ(d)が、尖鋭化されたデータ
の各走査ライン内の各オリジナル・ピクセルのための前
記X方向にアップサンプルされたデータの走査ライン
内、および、追加のY方向にアップサンプルされたデー
タの各走査ライン内の、一対の行き先ピクセルを作成す
るステップを有し、その際、前記一対のピクセルの階調
値は、前記オリジナル・ピクセルからの階調値と、前記
オリジナル・ピクセルからの前記階調値と各データの走
査ライン内の前記オリジナル・ピクセルに先行するピク
セルからの階調値との統合値を有する階調値とを有す
る、ことを特徴とする(1)記載の方法。 (9). 前記ステップ(d)が、前記オリジナル・ピ
クセルからの前記の階調値と、前記オリジナル・ピクセ
ルに先行する前記ピクセルからの前記階調値とを平均化
することにより前記統合値を形成するステップを有する
ことを特徴とする(8)記載の方法。 (10). 前記ステップ(d)が、走査ラインから4
つのピクセルの階調値を検索するステップと、先行して
作成された最後のピクセルの階調値と、前記4つのピク
セルの階調値とを連結して、連結された索引を作成する
ステップと、前記連結された索引の最初の3つのピクセ
ルを第1の索引へと分離するステップと、前記連結され
た索引の最後の3つのピクセルを第2の索引へと分離す
るステップと、前記最初の索引値を利用してテーブルか
ら最初の4つの尖鋭化されたピクセルの階調値を検索す
るステップと、前記第2の索引値を利用してテーブルか
ら第2の4つの尖鋭化されたピクセルの階調値を検索す
るステップと、前記最初の4つの尖鋭化されたピクセル
の階調値と、前記第2の4つの尖鋭化されたピクセルの
階調値とを前記X方向にアップサンプルされたデータの
走査ラインに記憶するステップ、とを有することを特徴
とする(1)記載の方法。
【0039】
【発明の効果】以上のように、本発明を用いると、光学
式文字認識システムで極めて小さい字体の走査精度を向
上させることができ、走査のための大きい字体を用意す
るために、走査されたデータをアップサンプル(拡大サ
ンプリング)することによって、上記の精度を向上させ
ることができる。
【図面の簡単な説明】
【図1】 本発明を含むコンピュータ・システムの概略
図である。
【図2】 本発明のドライバ・ソフトウェア部分のフロ
ーチャートである。
【図3】 本発明でデータを尖鋭化するために利用され
るピクセルの集合の図面である。
【図4】 本発明の尖鋭化方法のフローチャートであ
る。
【図5】 本発明の性能を高めるために利用される尖鋭
化用の探索テーブルの部分である。
【図6】 データの各々のオリジナル走査ラインの間に
新たなピクセル走査ラインを形成する本発明の方法であ
る。
【図7】 Y方向にアップサンプルの方法のフローチャ
ートである。
【図8】 データの各々の水平ピクセルの間に新たなピ
クセルを形成する本発明の方法である。
【図9】 X方向にアップサンプルするための方法のフ
ローチャートである。
【図10】 図9の方法で索引が形成される態様を示す
図面である。
【図11】 図9の方法で探索テーブルからデータが検
索される態様を示す図面である。
【図12】 図9の方法で用いられるアップサンプル用
探索テーブルの一部である。
【符号の説明】
202、204、206、208、210、212、2
14、216、218、220、222、224、22
6:ブロック

Claims (10)

    【特許請求の範囲】
  1. 【請求項1】光学式文字認識システムの認識手段に入力
    するためにアップサンプル(拡大サンプリング)された
    データを作成するための、前記アップサンプルされたデ
    ータ内の文字を前記認識手段によってより正確に認識で
    きるようにする、コンピュータ処理によるアップサンブ
    リング方法において、 (a)少なくとも2本のデータ走査ラインで文書を走査
    し、前記走査ラインは階調値を備えるステップと、 (b)前記少なくとも2本の走査ラインは前記階調値か
    らデータの走査ラインを尖鋭化するステップと、 (c)Y方向のデータの前記尖鋭化された走査ラインの
    前記階調値を統合することで、追加のY方向のアップサ
    ンプルされたデータの走査ラインを作成するステップ
    と、 (d)X方向のデータの前記尖鋭化された走査ラインの
    前記階調値を統合することと、X方向に前記追加のY方
    向にアップサンプルされたデータの走査ラインの階調値
    を統合することによって、データのX方向のアップサン
    プルされた走査ラインを生成するステップと、 (e)前記X方向のアップサンプルされたデータの走査
    ラインを前記認識手段に伝送するステップ、 とを有することを特徴とする方法。
  2. 【請求項2】前記ステップ(b)が、データの各走査ラ
    イン内の各ピクセルの近傍の全ピクセルの階調値を統合
    するステップを有することを特徴とする請求項1記載の
    方法。
  3. 【請求項3】前記ステップ(b)が、尖鋭化されたピク
    セルを作成するために、各走査ライン内の各ピクセルの
    Y方向の上方のピクセルの階調値と、各ピクセルのY方
    向の下方のピクセルの階調値とを統合するステップを有
    することを特徴とする請求項1記載の方法。
  4. 【請求項4】前記統合ステップが、 各ピクセルの上方の前記ピクセルと、各ピクセルの下方
    の前記ピクセルが等しいか、より暗い階調値を持つ場合
    は、3つのピクセル全てについて階調値を平均して前記
    尖鋭化されたピクセルの階調値を作成し、 各ピクセルの上方の前記ピクセルと、各ピクセルの下方
    の前記ピクセルが等しくない階調値を持つか、いずれか
    がより暗くない階調値を持つ場合は、各ピクセルの上方
    の前記ピクセルの階調値と、各ピクセルの下方の前記ピ
    クセルの階調値を合計し、前記ピクセルの4倍の階調値
    から加算結果を減算し、且つその結果を2で割って、前
    記尖鋭化されたピクセルの階調値を作成するステップを
    有することを特徴とする請求項3記載の方法。
  5. 【請求項5】前記統合ステップが、 各ピクセルの上方の前記ピクセルの階調値と、各ピクセ
    ルの階調値と、各ピクセルの下方の前記ピクセルの階調
    値とを索引値へと連結し、且つ、 前記索引値を用いてテーブルから前記尖鋭化されたピク
    セルの階調値を検索するステップを有することを特徴と
    する請求項4記載の方法。
  6. 【請求項6】前記ステップ(c)が、データの連続する
    一対の尖鋭化された走査ラインの間の第3の走査ライン
    を作成するステップを有し、その際、前記第3の走査ラ
    インの各ピクセルの階調値が、尖鋭化された走査ライン
    の前記連続する一対の各ライン内の対応するピクセルの
    階調値の統合をするステップを有することを特徴とする
    請求項1記載の方法。
  7. 【請求項7】前記ステップ(c)が、前記一対のデータ
    のラインの各ライン内の対応するピクセルの階調値を平
    均することで、データの前記第3のピクセル走査ライン
    内にピクセルの階調値を作成するステップを有すること
    を特徴とする請求項6記載の方法。
  8. 【請求項8】前記ステップ(d)が、尖鋭化されたデー
    タの各走査ライン内の各オリジナル・ピクセルのための
    前記X方向にアップサンプルされたデータの走査ライン
    内、および、追加のY方向にアップサンプルされたデー
    タの各走査ライン内の、一対の行き先ピクセルを作成す
    るステップを有し、その際、前記一対のピクセルの階調
    値は、前記オリジナル・ピクセルからの階調値と、前記
    オリジナル・ピクセルからの前記階調値と各データの走
    査ライン内の前記オリジナル・ピクセルに先行するピク
    セルからの階調値との統合値を有する階調値とを有す
    る、ことを特徴とする請求項1記載の方法。
  9. 【請求項9】前記ステップ(d)が、前記オリジナル・
    ピクセルからの前記の階調値と、前記オリジナル・ピク
    セルに先行する前記ピクセルからの前記階調値とを平均
    化することにより前記統合値を形成するステップを有す
    ることを特徴とする請求項8記載の方法。
  10. 【請求項10】前記ステップ(d)が、 走査ラインから4つのピクセルの階調値を検索するステ
    ップと、 先行して作成された最後のピクセルの階調値と、前記4
    つのピクセルの階調値とを連結して、連結された索引を
    作成するステップと、 前記連結された索引の最初の3つのピクセルを第1の索
    引へと分離するステップと、 前記連結された索引の最後の3つのピクセルを第2の索
    引へと分離するステップと、 前記最初の索引値を利用してテーブルから最初の4つの
    尖鋭化されたピクセルの階調値を検索するステップと、 前記第2の索引値を利用してテーブルから第2の4つの
    尖鋭化されたピクセルの階調値を検索するステップと、 前記最初の4つの尖鋭化されたピクセルの階調値と、前
    記第2の4つの尖鋭化されたピクセルの階調値とを前記
    X方向にアップサンプルされたデータの走査ラインに記
    憶するステップ、とを有することを特徴とする請求項1
    記載の方法。
JP6319309A 1993-11-29 1994-11-29 光学式文字認識方法 Pending JPH07200729A (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US15941593A 1993-11-29 1993-11-29
US159,415 1993-11-29

Publications (1)

Publication Number Publication Date
JPH07200729A true JPH07200729A (ja) 1995-08-04

Family

ID=22572524

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6319309A Pending JPH07200729A (ja) 1993-11-29 1994-11-29 光学式文字認識方法

Country Status (2)

Country Link
EP (1) EP0655703A2 (ja)
JP (1) JPH07200729A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020022329A1 (ja) * 2018-07-26 2020-01-30 日本電信電話株式会社 物体検出認識装置、方法、及びプログラム

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11741732B2 (en) 2021-12-22 2023-08-29 International Business Machines Corporation Techniques for detecting text

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020022329A1 (ja) * 2018-07-26 2020-01-30 日本電信電話株式会社 物体検出認識装置、方法、及びプログラム

Also Published As

Publication number Publication date
EP0655703A2 (en) 1995-05-31

Similar Documents

Publication Publication Date Title
US6347156B1 (en) Device, method and storage medium for recognizing a document image
EP0741487B1 (en) Method and apparatus for performing text/image segmentation
US7460710B2 (en) Converting digital images containing text to token-based files for rendering
US5524070A (en) Local adaptive contrast enhancement
WO1999038319A1 (fr) Dispositif et procede de traitement d'image
US5075895A (en) Method and apparatus for recognizing table area formed in binary image of document
JP2001175807A (ja) テキスト領域選択方法
US5054091A (en) Method for determining coordinates of circumscribed rectangular frame of each character for use in optical character reader
JP2000132690A (ja) ト―クン化によるイメ―ジ分割を用いたイメ―ジ処理方法および装置
US5317679A (en) Digital image processor including correction for undesirable edge emphasis in outline-demarcated fonts
JP4077919B2 (ja) 画像処理方法及び装置及びその記憶媒体
JPH07322057A (ja) 2進入力画像の解像度の増大方法及びその増大装置、ならびに2進入力画像の外観の改良方法
JP2004120092A (ja) 画像処理装置、画像処理システム、画像処理方法、記憶媒体、及びプログラム
EP0510694A2 (en) Method of and apparatus for extracting image data
JPH07200729A (ja) 光学式文字認識方法
US7508987B2 (en) Method, apparatus, system, and program for image processing capable of recognizing, reproducing, and enhancing an image, and a medium storing the program
JP2000261653A (ja) 画像処理装置
JP3268542B2 (ja) 微細文字画像の拡大方法
JP3417753B2 (ja) 階調キャラクタ生成方法ならびにその装置
JP2755299B2 (ja) 画像処理方法
JPH07210669A (ja) 画像処理装置及びその制御方法
JP2000066658A (ja) 画像処理装置および記録媒体
JP2729278B2 (ja) 画像の2値化表現方法
EP0263584A2 (en) Scan-in polygonal extraction of video images
JP2954218B2 (ja) 画像処理方法及び装置