JP2000011089A - 光学式文字認識システムの2値化方法 - Google Patents

光学式文字認識システムの2値化方法

Info

Publication number
JP2000011089A
JP2000011089A JP11129654A JP12965499A JP2000011089A JP 2000011089 A JP2000011089 A JP 2000011089A JP 11129654 A JP11129654 A JP 11129654A JP 12965499 A JP12965499 A JP 12965499A JP 2000011089 A JP2000011089 A JP 2000011089A
Authority
JP
Japan
Prior art keywords
text
pixel
pixels
image
analyzed
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP11129654A
Other languages
English (en)
Other versions
JP3251918B2 (ja
Inventor
Andre Heilper
アンドレ・ヘイルパー
Yaakov Navon
ヤーコヴ・ナヴォン
Eugene Walach
ユージーン・ワラチ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of JP2000011089A publication Critical patent/JP2000011089A/ja
Application granted granted Critical
Publication of JP3251918B2 publication Critical patent/JP3251918B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/16Image preprocessing
    • G06V30/162Quantising the image signal
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Input (AREA)
  • Image Processing (AREA)
  • Facsimile Image Signal Circuits (AREA)

Abstract

(57)【要約】 (修正有) 【課題】OCRシステムのテキストと背景の強度間の相
対しきい値を推定する。 【解決手段】ピクセル10の値と、これから所定距離に
位置する複数のピクセルの値との差が、テキストと背景
との強度差に対応する相対しきい値よりも大かどうかに
よってテキスト・ピクセルを決定し、テキストのカーネ
ルを検出するために2つのピクセルに対応するレートで
像をサブサンプリングし、複数ストローク幅の側面を有
しテキストのカーネルを含むタイルでのみ、推定された
絶対しきい値を使用して像ピクセルを2値化する。テキ
スト・ピクセルの決定は、分析されるピクセルについ
て、分析されるピクセルを中心としストローク幅Wに等
しい半径を有する円12が行線、列線、及び45゜の角
度を有する2つの線と交差する位置にある2つのピクセ
ルの値と分析されるピクセルの値との差のいずれが相対
しきい値よりも大きいかを検査する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は光学式文字認識(O
CR)システムに関し、更に具体的には、そのような光
学式文字認識システムにおける新しい2値化方法に関す
る。
【0002】
【従来の技術】走査されるグレー・スケール像の2値化
は、光学式文字認識システムのようなドキュメント像分
析システムで使用される最初のステップである。2値化
の方法は各ピクセルをテキスト又は背景として分類する
ことを含む。
【0003】自動小包分類システムにおいて、アドレス
はグレー・スケール像から読み取られ解読される。像
は、小包がコンベヤを通るとき、小包の上部に置かれた
カメラによって捕捉される。当然のことながら、システ
ムは開放空間ビルディングの中に置かれ、困難な条件下
で動作する。グレー・スケール像は不安定な光条件、傾
斜及びピクセルの汚染に起因する歪み、貧弱なコントラ
スト、小包の高さの変化に起因する変動解像度の悪影響
を受ける。さらに、小包は反射を引き起こすプラスチッ
ク、アドレス・ラベルを切り詰めるテープ、ロゴ、織
布、及び模様によって覆われている。これら変動要因の
すべては、分類システムにおける2値化処理を非常に複
雑なものにする。「最良」の2値化方法を選択すること
は非常に困難である。このような広範囲の像を処理する
ためには、幾つかのステップを含む2値化方法が必要で
ある。
【0004】種々の2値化方法(1995年12月の
「パターン分析及び機械知能に関するIEEE議事録」
(IEEE Transactions on pattern analysis and machin
e intelligence,vol 17,N゜12)に発表されたO.Trierら
の記事「2値化方法の目的指向的評価」(Goal-directe
d evaluation of binarization methods)を参照)を評
価してみると、ポストプロセシング・ステップを伴うニ
ブラック(Niblack)法が、最良の方法であるように思
われる。しかし、この方法では、推定されるしきい値は
絶対しきい値であり、このしきい値を超えたピクセルは
テキストへ設定され、そうでなければ背景へ設定され
る。そのような推定では、テキスト・ストロークの幅は
考慮されず、逆に背景ピクセルが推定に寄与し不正確な
しきい値を生じる。
【0005】
【発明が解決しようとする課題】従って、本発明の主な
目的は、OCRシステムにおいて、テキストのピクセル
に基づいて、テキストと背景の強度間の相対しきい値を
推定する2値化方法を達成することである。
【0006】
【課題を解決するための手段】本発明は、走査されるグ
レー・スケール像が幾つかの像ピクセルに対応する既知
のストローク幅を有するストロークの形式で認識される
べきテキストを含む光学式文字認識システムにおいて、
ピクセルの値と、そのピクセルからの所定距離に位置す
る複数のピクセルの値との間の差が、像のテキストと背
景との間の強度差に対応する相対しきい値よりも大きい
ことを各ピクセルについて検査することによってテキス
ト・ピクセルを決定するステップと、テキストのカーネ
ルを検出するために少なくとも2つのピクセルに対応す
るレートで像をサブサンプリングするステップと、複数
ストローク幅の側面を有しテキストのカーネルを含むタ
イルでのみ、各タイルで推定された絶対しきい値をその
タイルで使用することによって、像ピクセルを2値化す
るステップとを含む2値化方法に関する。
【0007】本発明の必須の特徴に従えば、テキスト・
ピクセルを決定するステップは、それぞれの分析される
ピクセルについて、分析されるピクセルを中心としスト
ローク幅に等しい半径を有する円が行線、列線、及び4
5゜の角度を有する2つの線の各々と交差する位置にあ
るそれぞれ2つのピクセルの値と前記分析されるピクセ
ルの値とのそれぞれの差のいずれが相対しきい値よりも
大きいかを検査するステップを含む。
【0008】本発明の好ましい実施例に従えば、相対し
きい値は、所定サイズ(好ましくはストローク幅に等し
いサイズ)の側面を有し、テキスト・ピクセルであると
決定されたピクセルを全面的に配列されたタイルの数
が、ピクセルの「テキスト」設定条件を満足させる前記
線の任意の1つと前記円との交点にある2つの近隣ピク
セルの値と前記分析されるピクセルの値との最小差であ
るしきい値の関数として与えられるヒストグラムの支配
的ローブの尾部に対応するしきい値である
【0009】
【発明の実施の形態】本発明に従った2値化の方法は次
のステップを含む。 ・ テキスト・カーネルの探索 ・ ノイズの除去 ・ テキスト・カーネル領域のタイルの2値化
【0010】テキスト・カーネルの探索 グレー・スケール像において、テキストは2つの主なパ
ラメータによって特徴づけられる。すなわち、それらの
パラメータとは、ペンの幅にほぼ対応するストローク幅
と、テキストの縁部で相対しきい値を定義する鋭い強度
変化である。これらの2つのパラメータは像ごとに変化
し、最初にグレー・スケール像から推定される。
【0011】ストローク幅の推定は、グレー・スケール
像における行プロフィルの分析に基づいている。通常、
グレー・スケール像の中のテキストは、背景に対して低
い強度値を有する。テキストを含む行に沿って、テキス
トの近傍でピクセル強度の鋭い勾配が存在する。これら
の勾配はピクセル強度の行プロフィルで「穴」を形成す
る。「穴」の幅は像の中の複数の行にわたって推定さ
れ、幅の平均がストローク幅である。
【0012】この手順によって計算されたストローク幅
は正確であるが、その正確性は2値化の結果に重要では
ない。ストローク幅はテキストのカーネルを探索するた
めにのみ必要である。最悪の場合、その正確性は、テキ
ストが45゜回転された場合に、正確なストローク幅よ
りもファクタ2だけ大きくてよい。以下で説明するよう
に、探索は複数の方向及び2つのストローク幅に対応す
る空間の近隣で実行される。従って、幅の正確度の重要
性は無視することができる。
【0013】本発明の必須の特徴である相対しきい値
は、テキストと背景の間の強度差を表す。この相対しき
い値は領域ごとに変動する。貧弱なコントラストの領域
では、しきい値は低く、高コントラストの領域では、し
きい値は高くなる。本発明の原理は、ピクセルの強度が
近隣ピクセルの強度よりも低いとき、そのピクセルをテ
キストと判断することである。
【0014】まず、像は3ストローク幅の側面サイズを
有する複数の正方形タイルへ分割される。実施例では、
1つのストローク幅は4つのピクセルに等しい。
【0015】図1に示されるように、分析されるべきピ
クセル10は、円12の上に置かれた近隣ピクセルに対
して検査される。円12の半径はストローク幅に等し
く、その中心はピクセル10にある。これらの近隣ピク
セルは、円12と4つの線(すなわち、行線、列線、及
び行線に関して45゜の角度を有する2つの線)の交点
に存在する。各々の線について、中心ピクセルの値が2
つの近隣ピクセルの値と比較され、これら3つのピクセ
ルが相対しきい値よりも深い「強度の穴」を形成するか
どうかが検査される。もし形成すれば、中心ピクセルは
「テキスト」へ設定される。
【0016】上記の処理を定式化するために、ストロー
ク幅がwであり、相対しきい値がtであり、P(x,y)が位
置(x,y)におけるピクセル値であると仮定する。このピ
クセルは、もし次の条件が起これば、「テキスト」へ設
定される。 P(x-w,y)-P(x,y)>t AND P(x+w,y)-P(x,y)>t OR P(x,y-w)-P(x,y)>t AND P(x,y+w)-P(x,y)>t OR P(x+d,y+d)-P(x,y)>t AND P(x-d,y-d)-P(x,y)>t OR P(x-d,y+d)-P(x,y)>t AND P(x+d,y-d)-P(x,y)>t ここで、座標(x+/-d,y+/-d)は、45゜及び135゜の
線に対する円の上の座標であり、dは
【外1】 に等しい。
【0017】前記の探索は一組のしきい値tについて実
行される。1つのしきい値tについて、すべてのピクセ
ルが「テキスト」へ設定されたタイルが決定される。そ
のようなタイルについて、最小tが決定される。最小t
は、ピクセルを「テキスト」へ設定する条件が満足され
るような(すなわち、3つのピクセルが「強度の穴」を
形成するような)、分析されるピクセルの値と前記で定
義された線の中の1つにある2つの近隣ピクセルの値と
の間の最小差である。この最小値は、全面的に配列され
るタイルの数N(最小t)を定義するために、ヒストグラ
ムの横座標として使用される。そのようなヒストグラム
は、図2に示されるように、いくつかのローブを有する
ことができる。
【0018】推定される相対しきい値は、前記の手順で
作成されたヒストグラムの支配的ローブの尾部から選択
される。従って、図2のヒストグラムで、選択される相
対しきい値はt=18であり、これはN=0となるt=19の前のt
の値に対応する。最高のしきい値はピクセルを「テキス
ト」に設定する条件を更に厳しくするので、そのような
最高しきい値を選択するのが望ましい(それより低いし
きい値を選択できた場合でも)。それによって、テキス
ト・ピクセルの一部が誤って「背景」へ設定される場合
もあるが、後に説明するようなタイルの2値化ステップ
で、それらのピクセルは「テキスト」へ再設定される。
更に、もし低いしきい値が選択されると、そのような低
いしきい値はピクセルを「テキスト」へ設定する条件の
厳密度を低くするので、ノイズ・ピクセルが「テキス
ト」へ設定される可能性がある。すべてのピクセルが
「テキスト」へ設定されたタイルを得る条件は非常に難
しいので、ピクセルの一部のみが「テキスト」へ設定さ
れたタイルがより多く発見されるものと想定することが
できる。従って、この処理はテキスト・ピクセルである
ようなピクセルをそれほど多く見過ごすことはなく、後
続のタイル2値化ステップが、見過ごされたそれらのピ
クセルを再設定する。
【0019】テキスト・カーネルの探索は2値化の予備
ステップであり、そのステップでは、テキスト・ピクセ
ルの一部分のみが設定される。前のセクションで定義さ
れた条件が起こると、ピクセルは「テキスト」へ設定さ
れる。今や、t及びwは、それぞれ推定された相対しきい
値及び推定されたストローク幅である。
【0020】この2値化の予備ステップでは、サブサン
プリングされた像空間又はオリジナルの像空間のいずれ
かで、探索がピクセルごとに実行される。図3に示され
るように、像は4つのピクセルから成るストローク幅を
有する文字Lを含むものと想定する。2のサブサンプリ
ング・レートを使用して、サブサンプリング像空間が走
査され、走査の間に、図3の行0及び行2のドットで示
されるように、各行内で2番目ごとのピクセルを分析
し、次の行を分析するために2つのピクセル分だけ増分
される。従って、検査されるパターンは次のようにな
る。 行0:p(0,0),p(0,2),p(0,4),p(0,6)...p(0,26) 行2:p(2,0),p(2,2),p(2,4),p(2,6)...p(2,26) 行4:p(4,0),p(4,2),p(4,4),p(4,6) ピクセルp(4,6)が「テキスト」へ設定されると、処理は
オリジナルの像空間へ切り替わり、すべてのピクセルは
今や1の増分で検査される。
【0021】今や、検査されているピクセルは「x」に
よって表される。テキスト・ピクセルとして検査された
ピクセルは、行4:p(4,6),p(4,7),p(4,8),p(4,9)に存
在する。しかし、ピクセルp(4,10)は背景ピクセルであ
り、処理は、2によって増分される元のサブサンプリン
グ像空間へ切り替わる。 行4:p(4,10),p(4,12)...p(4,26) 行6:p(6,0),p(6,2),p(6,4),p(6,6) ピクセルp(6,6)が「テキスト」へ設定され、処理はp(6,
10)までオリジナルの像空間へ再び切り替わり(1によ
って増分される)、次に元のサブサンプリング空間へ切
り替わる。以下同様である。
【0022】像の中のピクセルの大部分は背景ピクセル
であるから、ピクセルの1つ1つの探索は時間を消費す
る。それが、ピクセルが背景ピクセルとして発見された
とき、サンプリングの増分が1から2(又は、それより
も多く)へ変更される理由である。ピクセルが「テキス
ト」へ設定されたときにのみ、各ピクセルを検査するの
が合理的である。
【0023】理想的には、このステップの結果は、テキ
スト・カーネル及び幅が推定ストローク幅に等しい線を
含む2値像となる。「平坦」な明領域及び暗領域(例え
ば、小包の上に張り付けられた大きなテープ)は、2値
像の中に現れることはないと予想される。明領域と暗領
域の間の縁部(例えば、暗色の小包の上にある白ラベ
ル)は、2値像の中に現れることはないと想像される。
その理由は、黒いテープの縁部にピクセルが存在し、2
つの近隣ピクセルが同じ行にある場合を例として説明で
きる。このピクセルの強度p(x,y)は、その近隣ピクセ
ル値p(x-w,y)及びp(x+w,y)の1つのみよりも低いか等
しい。もしそれらの1つがテープ上に位置していれば、
他の1つは背景に位置している。その逆の場合もある。
このピクセルを黒へ設定する条件は、前のステップで説
明したように決して満足されない。
【0024】ノイズの除去 実際には、前に言及したように、像は理想的な条件では
捕捉されない。像は証明の勾配、織り目付き背景、ノイ
ズ、などによって悪影響を受ける。従って、2値化予備
段階での像は、次の2値化ステップへ進む前に除去され
なければならないノイズを含む。そのために、2つの順
次的ステップが適用される。すなわち、高強度のピクセ
ルを除去するステップと、孤立化したピクセルを除去す
るステップである。
【0025】高強度のピクセルを除去するためには、前
のステップでテキストへ設定されたピクセルの強度ヒス
トグラムが分析される。この分析から、テキスト・カー
ネルの像で生じた背景ピクセルを発見することができ
る。通常、これらのピクセルは正しいテキスト・ピクセ
ルよりも高い強度を有するが、誤って「テキスト」へ設
定されている。おそらく、これらのピクセルは「ノイ
ズ」領域又は織り目領域に置かれており、前述したよう
にピクセルを「テキスト」へ設定する規則を満足させ
る。もしそのようなテキストが発見されるならば、それ
らはテキスト・カーネルの2値像から除去される(すな
わち、「背景」ピクセルへ再設定される)。テキストへ
設定されたにも係わらず他のテキスト・ピクセルから孤
立しているピクセルは、ノイズと考えられる。テキスト
はストローク幅によって特徴づけられるから、テキスト
・カーネルのサイズはストローク幅に近接しているもの
と予想される。そのようなピクセルは「背景」へ再設定
される。
【0026】テキスト・カーネル領域のタイル2値化 この段階で、像の中のテキストである大多数のピクセル
は「テキスト」へ設定される。「テキスト」ピクセルの
近傍にあるピクセルは、「テキスト」ピクセルであるか
「背景」ピクセルである。更に、「テキスト」へ設定さ
れたいくつかのピクセル(少数)は「背景」ピクセルで
ある可能性がある。従って、「タイル2値化」と呼ばれ
る第2の2値化が実行される。像空間は複数のストロー
ク幅から成る側面を有する複数の正方形タイルへ分割さ
れ、「テキスト」ピクセルを含むタイルのみが再2値化
される。
【0027】例えば、図4では、像空間はそれぞれが1
2x12ピクセルを含む複数の正方形タイルに分割さ
れ、1つの正方形タイルの側面は3つのストローク幅に
対応している。従って、テキスト(文字Lの一部分)を
含むタイル20、24、26は再2値化されるが、テキ
ストを含まないタイル22は再2値化されない。
【0028】再2値化されるべきタイル(例えば、タイ
ル20)は、テキスト・ピクセル(例えば、図4の
「x」によって定義されるピクセル)及びテキスト・ピ
クセルの近隣にある非テキスト・ピクセル(例えば、ド
ットによって定義されるピクセル)を含む。各タイル
(例えば、タイル20)について、絶対しきい値が推定
される。このしきい値よりも低い値を有するピクセルは
「テキスト」へ設定され、そうでないピクセルは「背
景」へ設定される。
【0029】実施例では、絶対しきい値は、タイル内の
「テキスト」ピクセル及び「テキスト」ピクセルの近隣
にある「非テキスト」ピクセル(近隣にある2〜3個の
ピクセル)から評価される。しきい値は「テキスト」ピ
クセル値の平均及び「非テキスト」ピクセル値の平均の
算術平均へ設定される。
【0030】この2値化は、「テキスト・カーネルの探
索」ステップの後で受け取られたテキスト・カーネル像
を「滑らかにし」、ギャップを充填する。「背景」へ設
定されたピクセルは、今や「テキスト」へ再設定され
る。他方では、誤って「テキスト」へ設定された孤立化
ピクセル及びノイズ・ピクセルは、今や「背景」へ再設
定される。
【0031】本発明に従う方法の利点 多くの2値化の方法が存在する。しかし、それらの大部
分のものと比較して、本発明の方法はOCRを目的とし
ている。実際に、理想的には、OCRへの入力像は汚染
されておらずテキストのみを含む必要がある。これは、
文字の位置が認識ステップの前に定義されるOCR処理
のセグメンテーション・ステップでは重要である。
【0032】従って、本発明の方法の利点は次のとおり
である。 ・ 1つの必須の特徴は相対しきい値の推定である。相
対しきい値は、テキストのピクセルのみがその推定に寄
与するので、より正確である。 ・ 小包像上の細片のような暗領域では、ピクセルはテ
キストに近い強度を有する。本発明の方法では、ピクセ
ルは、所与のストローク幅の線又はテキストの一部分で
あるときにのみ、「テキスト」へ設定される。従って、
暗領域は2値化された像の中に現れない。なぜなら、そ
の「幅」はストローク幅よりもはるかに大きいからであ
る。更に、暗領域の縁部も現れない。 ・ テキスト(例えば、アドレス)及び図形及び太いテ
キストから成るロゴを含む像では、ロゴの大部分は2値
化された像の中に現れない。これはOCRの場合に重要
である。なぜなら、OCRによって「ノイズ」領域を処
理すると、長い時間を必要とし、多くの問題を生じるか
らである。例えば、図形が2値化された像の中に現れる
と、OCRでテキスト領域をテキスト線へ区分すること
は非常に困難である。 ・ テキストを含む像では、ピクセルの大部分は「背
景」ピクセルである。本発明におけるテキスト・パター
ンの探索は、ピクセルの小部分だけを検査すればよい。
例えば、2のサブサンプリング・レートが使用されると
すれば、ピクセルの4分の1より少し多いピクセルが検
査される。タイル2値化ステップでは、テキストを含む
タイルのみが再2値化され、これは多くの時間を節約す
る。 ・ タイル2値化ステップの前に、誤って「テキスト」
へ設定されたピクセルが「背景」へ再設定されるノイズ
除去ステップが存在する。これはタイル2値化ステップ
における絶対しきい値の推定を正確し、2値像の品質を
改善する。 ・ 織り目を含む背景では、「テキスト」へ設定される
条件を満足させる多くの「孤立化」ピクセルが存在す
る。従って、タイル2値化ステップで再2値化される
「テキスト」を含む多くのタイルが存在する。そのよう
なピクセルを除去することは、処理時間を短縮し2値像
の品質を改善する。
【0033】まとめとして、本発明の構成に関して以下
の事項を開示する。 (1)走査されたグレー・スケール像が、認識されるべ
きテキストを、複数の像ピクセルに対応する既知のスト
ローク幅を有するストロークの形式で含む光学式文字認
識システムにおいて、各ピクセルについて、そのピクセ
ルの値と、そのピクセルから所定の距離だけ離れた複数
のピクセルの値との差が、像のテキストと背景との強度
差に対応する相対しきい値よりも大きいことを検査する
ことによってテキスト・ピクセルを決定するステップ
と、テキストのカーネルを検出するために少なくとも2
つのピクセルに対応するレートでグレー・スケール像を
サブサンプリングするステップと、複数ストローク幅の
側面を有し前記テキストのカーネルを含むタイルでの
み、前記タイル中で推定された絶対しきい値を前記タイ
ルの各々で使用することによって、像ピクセルを2値化
するステップとを含む、2値化方法。 (2)テキスト・ピクセルを決定する前記ステップが、
前記分析されるピクセルを中心とし前記ストローク幅に
等しい半径を有する円が行線、列線、及び前記行線に対
して45゜の角度を有する2つの線の各々と交差する位
置にあるそれぞれ2つのピクセルの値と前記分析される
ピクセルの値とのそれぞれの差のいずれが前記相対しき
い値よりも大きいかを前記分析されるピクセルの各々に
ついて検査するステップを含む、上記(1)に記載の2
値化方法。 (3)前記相対しきい値が、所定のサイズを有しテキス
ト・ピクセルであると決定されたピクセルを全面的に配
列されたタイルの数が前記分析されるピクセルの「テキ
スト」設定条件を満足させる前記線の任意の1つと前記
円との交点にある2つのピクセルの値と前記分析される
ピクセルの値との最小差であるしきい値の関数として与
えられるヒストグラムの支配的ローブの尾部に対応する
しきい値である、上記(2)に記載の2値化方法。 (4)前記円の前記半径が前記ストローク幅に等しい、
上記(2)又は(3)に記載の2値化方法。 (5)前記サブサンプリングするステップが、前記分析
されるテキストがテキスト・ピクセルとして決定される
まで、少なくとも2つのピクセルに対応するサンプリン
グ・レートで走査される行の中のピクセルを反復して分
析し、次に、ピクセルが背景ピクセルとして決定される
まで、前記行の各ピクセルを分析するステップを含む、
上記(1)から(4)までの任意の1つに記載の2値化
方法。 (6)前記像の前記行が、それぞれの行の中のピクセル
を走査するために使用されたサンプリング・レートと同
じサンプリング・レートで走査される、上記(5)に記
載の2値化方法。 (7)前記絶対しきい値が、テキスト・ピクセル及びそ
の近傍に存在する非テキスト・ピクセルから推定され、
前記推定がテキスト・ピクセル値の平均及び非テキスト
・ピクセル値の平均の算術平均である、上記(1)から
(6)までの任意の1つに記載の2値化方法。 (8)前記像の2値化ステップで使用される前記タイル
が、3つのストローク幅に等しい側面を有する正方形の
タイルである、上記(7)に記載の2値化方法。 (9)前記サブサンプリングするステップの後及び前記
2値化するステップの前に、高い強度のピクセルを除去
するステップを含み、前記除去するステップが正しいテ
キスト・ピクセルよりも高い強度のテキスト・ピクセル
を背景ピクセルへ変更するステップを含む、上記(1)
から(8)までの任意の1つに記載の2値化方法。 (10)他のテキスト・ピクセルから孤立したテキスト
・ピクセルを背景ピクセルへ変更するステップを含む、
上記(1)から(9)までの任意の1つに記載の2値化
方法。
【図面の簡単な説明】
【図1】本発明に従った方法で使用される相対しきい値
を計算するために、分析されるべきピクセルが、ストロ
ーク幅に等しい半径を有する円の中心に配置され、8つ
の近隣ピクセルが、前記円と行線、列線、及び行線に対
して45゜の角度を有する線の各々との間の交点に配置
される状態を示す図である。
【図2】全面的に配列されたタイルの数が推定相対しき
い値の関数として与えられるヒストグラムを示す図であ
る。
【図3】識別されるべきテキスト・カーネルである文字
Lを含み、背景がドット・ピクセルで表され、テキスト
がxピクセルで表される像を概略的に示す図である。
【図4】文字Lを含み、タイルの2値化ステップに使用
される複数のタイルへ分割された像を概略的に示す図で
ある。
【符号の説明】
10 ピクセル 12 円 20 タイル 22 タイル 24 タイル 26 タイル
───────────────────────────────────────────────────── フロントページの続き (72)発明者 ヤーコヴ・ナヴォン イスラエル共和国40696 エイン・ヴァー ド、 ピー・オー・ビー 190 (72)発明者 ユージーン・ワラチ イスラエル共和国34990 ハイファ、 ラ マ・エスコル ウォーレンバーグ・ストリ ート 54

Claims (10)

    【特許請求の範囲】
  1. 【請求項1】走査されたグレー・スケール像が、認識さ
    れるべきテキストを、複数の像ピクセルに対応する既知
    のストローク幅を有するストロークの形式で含む光学式
    文字認識システムにおいて、 各ピクセルについて、そのピクセルの値と、そのピクセ
    ルから所定の距離だけ離れた複数のピクセルの値との差
    が、像のテキストと背景との強度差に対応する相対しき
    い値よりも大きいことを検査することによってテキスト
    ・ピクセルを決定するステップと、 テキストのカーネルを検出するために少なくとも2つの
    ピクセルに対応するレートでグレー・スケール像をサブ
    サンプリングするステップと、 複数ストローク幅の側面を有し前記テキストのカーネル
    を含むタイルでのみ、前記タイル中で推定された絶対し
    きい値を前記タイルの各々で使用することによって、像
    ピクセルを2値化するステップとを含む、 2値化方法。
  2. 【請求項2】テキスト・ピクセルを決定する前記ステッ
    プが、前記分析されるピクセルを中心とし前記ストロー
    ク幅に等しい半径を有する円が行線、列線、及び前記行
    線に対して45゜の角度を有する2つの線の各々と交差
    する位置にあるそれぞれ2つのピクセルの値と前記分析
    されるピクセルの値とのそれぞれの差のいずれが前記相
    対しきい値よりも大きいかを前記分析されるピクセルの
    各々について検査するステップを含む、請求項1に記載
    の2値化方法。
  3. 【請求項3】前記相対しきい値が、所定のサイズを有し
    テキスト・ピクセルであると決定されたピクセルを全面
    的に配列されたタイルの数が前記分析されるピクセルの
    「テキスト」設定条件を満足させる前記線の任意の1つ
    と前記円との交点にある2つのピクセルの値と前記分析
    されるピクセルの値との最小差であるしきい値の関数と
    して与えられるヒストグラムの支配的ローブの尾部に対
    応するしきい値である、請求項2に記載の2値化方法。
  4. 【請求項4】前記円の前記半径が前記ストローク幅に等
    しい、請求項2又は3に記載の2値化方法。
  5. 【請求項5】前記サブサンプリングするステップが、前
    記分析されるテキストがテキスト・ピクセルとして決定
    されるまで、少なくとも2つのピクセルに対応するサン
    プリング・レートで走査される行の中のピクセルを反復
    して分析し、次に、ピクセルが背景ピクセルとして決定
    されるまで、前記行の各ピクセルを分析するステップを
    含む、請求項1から4までの任意の1つに記載の2値化
    方法。
  6. 【請求項6】前記像の前記行が、それぞれの行の中のピ
    クセルを走査するために使用されたサンプリング・レー
    トと同じサンプリング・レートで走査される、請求項5
    に記載の2値化方法。
  7. 【請求項7】前記絶対しきい値が、テキスト・ピクセル
    及びその近傍に存在する非テキスト・ピクセルから推定
    され、前記推定がテキスト・ピクセル値の平均及び非テ
    キスト・ピクセル値の平均の算術平均である、請求項1
    から6までの任意の1つに記載の2値化方法。
  8. 【請求項8】前記像の2値化ステップで使用される前記
    タイルが、3つのストローク幅に等しい側面を有する正
    方形のタイルである、請求項7に記載の2値化方法。
  9. 【請求項9】前記サブサンプリングするステップの後及
    び前記2値化するステップの前に、高い強度のピクセル
    を除去するステップを含み、前記除去するステップが正
    しいテキスト・ピクセルよりも高い強度のテキスト・ピ
    クセルを背景ピクセルへ変更するステップを含む、請求
    項1から8までの任意の1つに記載の2値化方法。
  10. 【請求項10】他のテキスト・ピクセルから孤立したテ
    キスト・ピクセルを背景ピクセルへ変更するステップを
    含む、請求項1から9までの任意の1つに記載の2値化
    方法。
JP12965499A 1998-05-28 1999-05-11 光学式文字認識システムにおける2値化方法 Expired - Fee Related JP3251918B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
EP98480038A EP0961218B1 (en) 1998-05-28 1998-05-28 Method of binarization in an optical character recognition system
EP98480038.3 1998-05-28

Publications (2)

Publication Number Publication Date
JP2000011089A true JP2000011089A (ja) 2000-01-14
JP3251918B2 JP3251918B2 (ja) 2002-01-28

Family

ID=8235758

Family Applications (1)

Application Number Title Priority Date Filing Date
JP12965499A Expired - Fee Related JP3251918B2 (ja) 1998-05-28 1999-05-11 光学式文字認識システムにおける2値化方法

Country Status (4)

Country Link
US (1) US6438265B1 (ja)
EP (1) EP0961218B1 (ja)
JP (1) JP3251918B2 (ja)
DE (1) DE69822608T2 (ja)

Families Citing this family (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6411741B1 (en) * 1998-01-14 2002-06-25 Kabushiki Kaisha Toshiba Image processing apparatus
JP2000350021A (ja) * 1999-06-04 2000-12-15 Ricoh Co Ltd デジタル画像処理装置
US6738496B1 (en) * 1999-11-01 2004-05-18 Lockheed Martin Corporation Real time binarization of gray images
US6512849B1 (en) * 2000-05-22 2003-01-28 International Business Machines Corporation Finding objects in an image
JP2002271611A (ja) * 2001-03-14 2002-09-20 Fujitsu Ltd 画像処理装置
US6778700B2 (en) * 2001-03-14 2004-08-17 Electronics For Imaging, Inc. Method and apparatus for text detection
CN1310183C (zh) * 2003-07-08 2007-04-11 摩托罗拉公司 二进制化文字图像的方法
JP2005275900A (ja) * 2004-03-25 2005-10-06 Noritsu Koki Co Ltd 粒子状ノイズ抑制のための画像処理方法及びプログラム及びこの方法を実施する画像処理装置
US7499588B2 (en) 2004-05-20 2009-03-03 Microsoft Corporation Low resolution OCR for camera acquired documents
US7555172B2 (en) * 2005-10-31 2009-06-30 Xerox Corporation Dynamic range detection and adjustment
US7734092B2 (en) * 2006-03-07 2010-06-08 Ancestry.Com Operations Inc. Multiple image input for optical character recognition processing systems and methods
US8311329B2 (en) 2006-09-07 2012-11-13 Lumex As Relative threshold and use of edges in optical character recognition process
US20080101703A1 (en) * 2006-10-30 2008-05-01 Lockheed Martin Corporation Systems and methods for recognizing shapes in an image
US8223395B2 (en) 2007-07-20 2012-07-17 Sharp Laboratories Of America, Inc. Methods and systems for refining text color in a digital image
US8009928B1 (en) 2008-01-23 2011-08-30 A9.Com, Inc. Method and system for detecting and recognizing text in images
TWI394457B (zh) * 2009-04-30 2013-04-21 Novatek Microelectronics Corp 文字保護裝置及動態適應性去交錯裝置
US8825409B2 (en) * 2010-09-08 2014-09-02 International Business Machines Corporation Tracing seismic sections to convert to digital format
EP3380990B1 (en) * 2015-11-24 2023-06-07 Ceske vysoke uceni technicke v Praze Efficient unconstrained stroke detector
US10192132B1 (en) * 2016-09-27 2019-01-29 Matrox Electronic Systems Ltd. Method and apparatus for detection of dots in an image
US10176399B1 (en) 2016-09-27 2019-01-08 Matrox Electronic Systems Ltd. Method and apparatus for optical character recognition of dot text in an image
US10176400B1 (en) 2016-09-27 2019-01-08 Matrox Electronic Systems Ltd. Method and apparatus for locating dot text in an image
US10223618B1 (en) 2016-09-27 2019-03-05 Matrox Electronic Systems Ltd. Method and apparatus for transformation of dot text in an image into stroked characters based on dot pitches
CN107689047B (zh) * 2017-08-16 2021-04-02 汕头大学 一种自动裁剪眼底图像的方法、装置及其可读存储介质
JP7379876B2 (ja) * 2019-06-17 2023-11-15 株式会社リコー 文字認識装置、文書ファイル生成方法、文書ファイル生成プログラム
CN111178362B (zh) * 2019-12-16 2023-05-26 平安国际智慧城市科技股份有限公司 文本图像处理方法、装置、设备和存储介质

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4742557A (en) * 1985-11-08 1988-05-03 Ncr Corporation Adaptive character extraction method and system
JPH0743754B2 (ja) 1985-12-26 1995-05-15 富士電機株式会社 文字画像2値化装置
JPH0799533B2 (ja) 1986-05-16 1995-10-25 富士電機株式会社 2値化装置
US5058182A (en) * 1988-05-02 1991-10-15 The Research Foundation Of State Univ. Of New York Method and apparatus for handwritten character recognition
JP2507811B2 (ja) 1989-01-13 1996-06-19 富士電機株式会社 2値化装置
JP3037781B2 (ja) 1991-06-10 2000-05-08 古野電気株式会社 データ二値化方法
US5379130A (en) * 1992-12-02 1995-01-03 Industrial Technology Research Institute Text/image separation method
US5568571A (en) * 1992-12-14 1996-10-22 University Microfilms, Inc. Image enhancement system
EP0694862A3 (en) * 1994-07-22 1996-07-24 At & T Corp Detection of degraded, grayscale documents using two-dimensional hidden pseudo-Markov models and N-best hypotheses
US5583659A (en) * 1994-11-10 1996-12-10 Eastman Kodak Company Multi-windowing technique for thresholding an image using local image properties
JP3334385B2 (ja) 1994-12-20 2002-10-15 セイコーエプソン株式会社 画像読み取り装置および読み取り方法
CA2211258C (en) * 1995-01-31 2000-12-26 United Parcel Service Of America, Inc. Method and apparatus for separating foreground from background in images containing text
US5649025A (en) * 1995-02-03 1997-07-15 Xerox Corporation Multithresholding for document image segmentation

Also Published As

Publication number Publication date
JP3251918B2 (ja) 2002-01-28
DE69822608D1 (de) 2004-04-29
US6438265B1 (en) 2002-08-20
EP0961218A1 (en) 1999-12-01
EP0961218B1 (en) 2004-03-24
DE69822608T2 (de) 2005-01-05

Similar Documents

Publication Publication Date Title
JP3251918B2 (ja) 光学式文字認識システムにおける2値化方法
CN106407883B (zh) 一种复杂表格及其内部手写数字识别方法
EP0784827B1 (en) Method and apparatus for determining the fine angular orientation of bar code symbols in two-dimensional ccd images
EP0569962B1 (en) Method and apparatus for processing a two dimensional digital image
US6674904B1 (en) Contour tracing and boundary detection for object identification in a digital image
EP3176751B1 (en) Information processing device, information processing method, computer-readable recording medium, and inspection system
US9965695B1 (en) Document image binarization method based on content type separation
US6047893A (en) Method of locating an object-applied optical code
JPH096957A (ja) 濃度画像の2値化方法および画像2値化装置
US8687895B2 (en) Image processing apparatus, image processing method, and computer-readable medium
US5748804A (en) Method and apparatus for processing images with symbols with dense edges
CN112699704B (zh) 一种条形码的检测方法、装置、设备、存储装置
CN110060239B (zh) 一种用于瓶子瓶口的缺陷检测方法
Gilly et al. A survey on license plate recognition systems
JPH09130614A (ja) 画像処理装置
CN106530292B (zh) 一种基于线扫描相机的带钢表面缺陷图像快速辨识方法
Chetverikov Structural defects: General approach and application to textile inspection
JP4132822B2 (ja) 画像内のオブジェクトの発見
CN110717890B (zh) 一种对接环识别方法及介质
CN114120320A (zh) 一种图像多目标信息识别方法、系统及介质
JP2005250786A (ja) 画像認識方法
EP0569982B1 (en) Method and apparatus for processing images with symbols with dense edges
Baharlou et al. Fast and adaptive license plate recognition algorithm for persian plates
JP2710685B2 (ja) 外観検査による欠陥検出方法
JPH05342412A (ja) グラディエントベクトルの抽出方式及び文字認識用特徴抽出方式

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071116

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081116

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081116

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091116

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091116

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101116

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101116

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111116

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111116

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121116

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121116

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131116

Year of fee payment: 12

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

LAPS Cancellation because of no payment of annual fees