JP2003198861A - カラー文書画像を二値化する方法及び装置 - Google Patents

カラー文書画像を二値化する方法及び装置

Info

Publication number
JP2003198861A
JP2003198861A JP2002336964A JP2002336964A JP2003198861A JP 2003198861 A JP2003198861 A JP 2003198861A JP 2002336964 A JP2002336964 A JP 2002336964A JP 2002336964 A JP2002336964 A JP 2002336964A JP 2003198861 A JP2003198861 A JP 2003198861A
Authority
JP
Japan
Prior art keywords
low
yiq
image
variable
value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2002336964A
Other languages
English (en)
Other versions
JP3833993B2 (ja
Inventor
Jinhong K Guo
ジンホン・ケイ・グオ
Yichun Zhang
イーチュン・ハン
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Publication of JP2003198861A publication Critical patent/JP2003198861A/ja
Application granted granted Critical
Publication of JP3833993B2 publication Critical patent/JP3833993B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/40Picture signal circuits
    • H04N1/403Discrimination between the two tones in the picture signal of a two-tone original
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/16Image preprocessing
    • G06V30/162Quantising the image signal
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V2201/00Indexing scheme relating to image or video recognition or understanding
    • G06V2201/01Solutions for problems related to non-uniform document background
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Signal Processing (AREA)
  • Image Processing (AREA)
  • Facsimile Image Signal Circuits (AREA)
  • Color Image Communication Systems (AREA)

Abstract

(57)【要約】 【課題】 複雑背景下でのカラー画像の二値化法及び装
置を提供することである。 【解決手段】 二値化画素のアレイを形成する方法は、
画像の各行について行の局所的に低い画素値及び行の局
所的に高い画素値を表す変数の第1の組と、画像の各列
について列の局所的に低い画素値及び列の局所的に高い
画素値を表す変数の第2の組とを初期設定する段階を有
する。以下の段階は各画素について繰り返す:位置指標
の行の第1変数及び第2変数と位置指標の列の第3変数
及び第4変数とに依存するスレショルド値を決定する段
階であって、位置指標が繰り返される行と繰り返される
列とに依存する段階と、位置指標での画像画素を表す値
を決定されたスレショルド値と比較する段階と、比較結
果により位置指標についての二値化画素を第1の値又は
第2の値のいずれかに設定し、比較結果により第1変数
および第3変数か第2変数および第4変数かのいずれか
の値を調整する段階。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、画像二値化法及び
装置に関するものであり、特に具体的には、複雑な背景
(バックグランド)のもとでのカラー又はグレイスケー
ル画像の二値化法及び装置に関するものである。
【0002】
【従来の技術及び発明が解決しようとする課題】白黒画
像の光学式文字読取装置(OCR)は公知である。しか
しながら、カラー文書の人気で、複雑な背景を伴うグレ
ー階調及び/又はカラー文字のテキスト認識の必要性が
生じている。例えば、この種の背景を有するテキストは
よく広告及び雑誌で目にする。時々、複雑な模様の背景
にテキストが描かれ、又は、背景が一の色から他の色へ
徐々に変化するものがある。この種の背景は従来のグロ
ーバルスレショルド(全域しきい値)法によって処理す
ることは困難である。
【0003】より具体的には、グローバルスレショルド
法は、少なくとも一の最新の光学式文字読取装置(OC
R)のソフトウェアパッケージで利用されている。全画
像についての単一グローバルスレショルドの生成は高速
で簡単である。しかしながら、グローバルスレショルド
は、画像の均一性が高い背景を有するときにだけ、満足
した結果を提供する。ユーザーの介入がある場合、グロ
ーバルスレショルドを有するOCRソフトウェアは、均
一でない照明を有する画像又は複雑な模様の背景のよう
な複雑な背景を有する画像を処理することはできない。
【0004】
【課題を解決するための手段】従って、本発明の一の構
成は、第1行が画像の第1の端を形成し、最終行が第1
の端と反対側に画像の第2の端を形成し、画像の第1列
が画像の第3の端を形成し、画像の最終列が第3の端の
反対側に第4の端を形成しているN行M列の画素を有す
る画像を二値化する方法を提供するものである。二値化
された画素列を形成する方法が:
【0005】(a)画像の各行については、行の局所的
(ローカル)に低い画素値を表す第1の変数と、行の局
所的に高い画素値を表す第2の変数と、画像の各列につ
いては、列の局所的に低い画素値を表す第3の変数と、
列の局所的に高い画素値を表す第4の変数と、を初期設
定する段階と;
【0006】(b)第1行から最終行まで、画像の各行
について段階(c)から段階(f)を反復して繰り返す
段階と;
【0007】(c)第1列から最終列まで、画像の各列
について段階(d)から段階(f)を反復して繰り返す
段階と;
【0008】(d)位置指標(ロケーション指標)の行
における第1の変数及び第2の変数と、位置指標の列に
おける第3の変数及び第4の変数とに依存するスレショ
ルド値を決定する段階であって、位置指標が繰り返され
る行と繰り返される列とに依存する段階と;
【0009】(e)位置指標での画像画素を表す値を決
定されたスレショルド値と比較する段階と;
【0010】(f)比較結果によって、位置指標につい
ての二値化画素を第1の値又は第2の値のいずれかに設
定し、かつ、比較結果によって、第1の変数および第3
の変数か第2の変数および第4の変数かのいずれかの値
を調整する段階と;を備えている。
【0011】本発明の他の構成は、N行M列の画素であ
って、第1行は画像の第1の端を形成し、最終行は第1
の端と反対側に画像の第2の端を形成し、画像の第1列
が画像の第3の端を形成し、画像の最終列が第4の端を
形成している画像を二値化する計算装置である。計算装
置は、メモリと値を読みかつ格納するためにメモリに動
作可能に結合されたプロセッサとを含み、計算装置は;
【0012】(a)画像の各行については、局所的に低
い第1の方向画素値を表す第1の変数と、局所的に高い
第1の方向画素値を表す第2の変数と、画像の各列につ
いては、局所的に低い第2の方向画素値を表す第3の変
数と、局所的に高い第2の方向画素値を表す第4の変数
とをメモリに初期設定し;
【0013】(b)第1行から最終行まで、画像の各行
について段階(c)から段階(f)を反復して繰り返
し;
【0014】(c)第1列から最終列まで、画像の各列
について段階(d)から段階(f)を反復して繰り返
し;
【0015】(d)位置指標の行において第1の変数及
び第2の変数と、位置指標の列において第3の変数及び
第4の変数とに依存するスレショルド値を決定し、ここ
で、位置指標は繰り返される行と繰り返される列とに依
存するものであり;
【0016】(e)位置指標での画像画素を表す値を決
定されたスレショルド値と比較し;
【0017】(f)メモリにおいて、比較結果に依存し
て、位置指標についての二値化画素を第1の値又は第2
の値のいずれかに格納し、また、比較結果に依存して、
第1の変数および第3の変数か第2の変数および第4の
変数かのいずれかの格納された値に調整するように;構
成され、
【0018】ここで、(b)及び(c)の繰り返しがメ
モリで格納された二値化画素のアレイを形成する。
【0019】本発明のさらに他の構成は、メモリと値を
読込みかつ格納するためにメモリに動作可能に結合され
たプロセッサとを有する計算装置に命令するように構成
された命令を記録して有する機械可読媒体を提供するも
のであって、
【0020】(a)第1行が画像の第1の端を形成し、
最終行が第1の端と反対側に画像の第2の端を形成し、
画像の第1列が画像の第3の端を形成し、画像の最終列
が第3の端の反対側に第4の端を形成しているN行M列
の画素を有する画像において、各カラムについて、局所
的に低い第1の方向画素値を表す第1の変数と局所的に
高い第1の方向画素値を表す第2の変数と、画像の各列
については、局所的に低い第2の方向画素値を表す第3
の変数と局所的に高い第2の方向画素値を表す第4の変
数とをメモリにおいて初期設定し;
【0021】(b)第1行から最終行まで、画像の各行
について段階(c)から段階(f)を反復して繰り返
し;
【0022】(c)第1列から最終列まで、画像の各列
について段階(d)から段階(f)を反復して繰り返
し;
【0023】(d)位置指標の行において第1の変数及
び第2の変数と、位置指標の列において第3の変数及び
第4の変数とに依存するスレショルド値を決定し、ここ
で、位置指標は繰り返される行と繰り返される列とに依
存するものであり;
【0024】(e)位置指標での画素を表す値を決定さ
れたスレショルド値と比較し;
【0025】(f)メモリにおいて、比較結果に依存し
て、位置指標についての二値化画素を第1の値又は第2
の値のいずれかに格納し、また、比較結果に依存して、
第1の変数および第3の変数か第2の変数および第4の
変数かのいずれかの格納された値を調整するように;構
成され、
【0026】ここで、(b)及び(c)の繰り返しがメ
モリで格納された二値化画素のアレイを形成する。
【0027】本発明のその他の応用用途は以下に示す詳
細な説明から明らかである。詳細な説明及び特別の実施
形態は本発明の好適な実施形態を示すものであるが、例
示だけの目的であり、本発明の範囲を限定する意図では
ないことは理解されたい。
【0028】本発明は、詳細な説明及び添付図面によっ
てさらによく理解できるだろう。
【0029】図1は、カラー画像を二値化する方法の一
の構成を示す流れ図である。
【0030】図2は、図1で示した方法に入力として用
いられるような、画像における画素の配列を示す図であ
る。
【0031】図3は、図1の方法を実施するのに適した
計算システムの一の構成を示すブロック図である。
【0032】
【発明の実施の形態】好適な実施形態の以下の説明は単
に例示だけのものであり、本発明、その用途あるいは使
用について限定する意図ではない。
【0033】図1に示したように、本発明の一の構成1
0は、種々の複雑な背景のもとでカラー又はグレイスケ
ール画像の二値化においてセルフラーニング(自己学
習)法を具体化するものである。
【0034】複雑な背景を有する多くの文書について、
文書の背景は、テキストから裏のテキストへの移行及び
その逆の移行を除いて、通常、走査の際に徐々に変化す
ることがわかっている。画素が暗い領域ならば、周囲の
領域のカラー背景の相関の結果として次の画素が暗い領
域である確率が比較的高い。この仮定を用いると、走査
が低コントラスト領域を通ると、次の隣接画素について
のスレショルドは同様に低く調整される。
【0035】一の構成において図1に示したように、カ
ラーで走査された書類をグレイスケール像に変換する
(12)。例えば、RGB像(すなわち、各画素がR
(赤)値、G(緑)値及びB(青)値を表す)をYIQ
形式に変換する。輝度又はグレイスケール値を表すYI
Q_Y値を二値化に用いる。(YIQ形式はNTSCカ
ラーテレビ標準から公知のものであり、ここで、“Y”
は知覚された輝度信号であり、“I”はR−Yから導出
された色差信号であり、“Q”はB−Yから導出された
色差信号である。ここで、“R”は赤信号であり、
“B”は青色信号である。ここで用いたように、輝度信
号又はグレイスケール信号がYIQ_Yと表示され
る。)
【0036】カラー画像ではなくグレイスケールを用い
た構成では、YIQへの変換12は必要なく、画素のグ
レイ値を直接用いる。
【0037】第1の方向にN画素×第2の直交方向にM
画素の画像について、以下の変数のメモリ所在を割当て
て初期設定する(14):
【数28】 ここで、iは、0からN−1の範囲の画像に行の指標
(インデックス)であり、jは、0からM−1の範囲の
画像に列の指標であり、Xlow(i)は局所的に低い行
の値Xhigh(i)は局所的に高い行の値Ylow(j)は
局所的に低い列の値 Yhigh(j)は局
所的に高い列の値である。
【0038】図2は、画像100の第1の端102を形
成する第1行(行番号0)と、第1の端102の反対側
の第2の端104を示す最終行(行番号N−1)とを示
した矩形画像の方位を示す図である。同様に、第1列
(列番号0)は画像100の第3の端106を示し、最
終列(列番号M−1)は端106の反対側の第4の端1
08を形成する。このマッピングはいくらか任意であ
り、できたマッピングが方法を通して首尾一貫して使用
される限り、列及び/又は行を反対の順番で番号付けし
てもよいし、画像をいずれかの方向に90度回転しても
よい(すなわち、列と行の役割を交換してもよい)。し
かしながら、例として、ここでは図2に示したマッピン
グを仮定する。
【0039】一の構成では、ローカル変数の初期設定
(14)は、走査された画像のYIQ表示から輝度YI
Q_Yの最小値及び最大値を用いて実施する。そして、
ローカル変数の初期設定(14)は、以下で示した関係
を用いて決定する:
【数29】 ここで、
【数30】 すなわち、YIQ_YminはNxM画像における最小輝
度であり、YIQ_Ym axはNxM画像における最大輝
度であり、YIQ_Y(i,j)は指数i及び指数jで
の画像の画素の強度である。
【0040】繰り返しが完成するとき、走査された画像
のYIQ表示の位置指標(i,j)で各画素にわたって
繰り返し、二値化された画像を戻すために(20)、入
れ子ループのセットを用いる。図1で示した構成では、
変数i及びjはゼロに設定し(16)、iが画像の全幅
にわたって繰り返されたか否かを決定するためにテスト
を行う(18)。繰り返されていたならば、繰り返しが
完成(終了)し、二値化画像が戻る(20)。さもなけ
れば、jが現在の指数iでの画像高さ全体にわたってj
が繰り返されたか否かを決定するテストを行う。繰り返
されたならば、i指数が増加し(24)、iが画像の全
幅にわたって繰り返されていないならば、j全体の他の
ループが実施される。
【0041】位置(i,j)では、以下に記載された関
係を用いて、ローカルスレショルドT(i,j)を決定
する(26):
【数31】 対応する位置(i,j)でのY値YIQ_Y(i,j)
を、この局所スレショルドと比較する(28)。もし
も、
【数32】 ならば、符号30に進み、
【数33】 さもなければ、符号32に進む:
【数34】 ここで、*(アスタリスク)は掛け算を意味し、B
(i,j)は、メモリに格納された位置指標(i,j)
での決定された二値化された画像画素であり、wはパラ
メータである。
【0042】一の構成では、0のB(i,j)は黒にマ
ッピングされ、1の値は白にマッピングされる。しかし
ながら、他の構成では、異なるが対応するマッピングが
適用される。
【0043】Xlow(i)及びYlow(j)、又は、X
high(i)及びYhigh(j)のいずれかにおける変化を
観察することによって評価されるように、各スレショル
ドの比較(28)の結果(30,32)に依存して、ス
レショルドT(i,j)は画像が走査されるときに適用
できるように変化する。また、画像の二値化中、Xlow
(i)、Ylow(j)、Xhigh(i)及びYhigh(j)
になされる更新のために、特定の(i,j)画素位置で
の値は、実際の最小及び最大、輝度の値を全域的(グロ
ーバル)に又は局所的(ローカル)に表示する必要はな
い。
【0044】一の構成におけるパラメータwは、Xlow
(i)、Ylow(j)、Xhigh(i)及びYhigh(j)
についての“局在化領域”を規定するものと考えてもよ
いユーザー調整可能なパラメータである。しかしなが
ら、パラメータwは、本発明の全構成において調整可能
である必要でない。一の構成では、パラメータwは画像
解像度に依存して設定される。当業者であれば、Xlow
(i)、Ylow(j)、Xhi gh(i)及びYhigh(j)
に対する変化が、計算カーネルを利用して一の演算を表
すことが理解できる。上述の式によって示されたカーネ
ルは、i及びjの現在の位置指標値にだけ依存するが、
他の構成では、隣接する列及び行のような付加的な列又
は行でのXlow(i)、Ylow(j)、Xhigh(i)及び
high(j)の重み付きの値についての依存性を含む他
のカーネルを用いる。
【0045】処理される画素が多いほど、スレショルド
T(i,j)の二値化について信頼性は向上する。T
(i,j)の各値を決定するためのXlow(i)、Ylow
(j)、Xhigh(i)及びYhigh(j)の値の信頼性も
向上する。
【0046】本発明の一の構成におけるパフォーマンス
をさらに向上するために、一の構成では、ローカル変数
の初期設定(14)の後でかつループ繰り返しの前(例
えば、図1の段階14と段階16の間)に、プレトレー
ニング(予め教え込む)工程を変数Xlow(i)及びX
high(i)と変数Ylow(j)及びYhigh(j)に適用
する。以下の擬コードは、4つの分離したプレトレーニ
ング処理を示す。ここで、A_1,A_2,A_3,A
_4は各手続についてのラベルである: A_1: i=N_1からi=N_2について、j=M_1からj=M_2に
ついて、YIQ_Y(i,j)<(Xlow(i)+Xhigh(i))/2なら
ば、Xlow(i)=(Xlow(i)*YIQ_Y(i,j))/(w+1)と
し、さもなければ、Xhigh(i)=(Xhigh(i)*YIQ_Y(i,
j))/(w+1)とする。 A_2: i=N_2からi=N_1について、j=M_2からj=M_1に
ついて、YIQ_Y(i,j)<(Xlow(i)+Xhigh(i))/2なら
ば、Xlow(i)=(Xlow(i)*YIQ_Y(i,j))/(w+1)と
し、さもなければ、Xhigh(i)=(Xhigh(i)*YIQ_Y(i,
j))/(w+1)とする。 A_3: i=N_1からi=N_2について、j=M_1からj=M_2に
ついて、YIQ_Y(i,j)<(Ylow(i)+Yhigh(i))/2なら
ば、Ylow(i)=(Ylow(i)*YIQ_Y(i,j))/(w+1)と
し、さもなければ、Yhigh(i)=(Yhigh(i)*YIQ_Y(i,
j))/(w+1)とする。 A_4: i=N_2からi=N_1について、j=M_2からj=M_1に
ついて、YIQ_Y(i,j)<(Ylow(i)+Yhigh(i))/2なら
ば、Ylow(i)=(Ylow(i)*YIQ_Y(i,j))/(w+1)と
し、さもなければ、Yhigh(i)=(Yhigh(i)*YIQ_Y(i,
j))/(w+1)とする。
【0047】本発明の一の構成では、プレトレーニング
は、A_1,A_2,A_3,A_4の全4つのプレト
レーニング処理を行うことによって実施する。他の構成
では、2つのプレトレーニング処理、すなわち、A_1
及びA_2から一の処理をかつA_3及びA_4から他
の処理を選択して行う。(例えば、一のこのような構成
では、プレトレーニング処理A_1及びA_3を実施す
る。)このような構成であってもよいが、そうでなくて
もよく、プレトレーニング処理の4つの異なる組合せの
うちから選択してもよい。他の構成では、4つのプレト
レーニング処理のいずれも実施しない。
【0048】M_1,N_1,M_2,N_2は、初期
トレーニングを実施する領域(エリア)のサイズを規定
する:
【数35】 である。(通常、境界M_1及びM_2又はN_1及び
N_2が等しいループでは、ループを一度実施する。)
【0049】プレトレーニング処理A_1,A_2,A
_3,A_4のうちのいずれかを用いる構成でも、画像
(全画像であってもよい)の矩形サブセット全体でプレ
トレーニングを実施する。サブセットが大きいときは、
を実施する。パラメータXlo w(i)、Ylow(j)、X
high(i)及びYhigh(j)についてさらにトレーニン
グ又は学習を実行する。本発明の一の構成におけるM_
1,N_1,M_2,N_2の値を所望の計算速度に対
応して選択される。というのは、大きなプレトレーニン
グ領域にはより長い計算時間がかかるからである。
【0050】本発明の一の構成は、図3に示したよう
に、本明細書で開示した方法を実施するのに適した計算
装置200を備える。計算装置200は、プロセッサと
プロセッサに動作可能に結合されたメモリとを備える。
図3にはプロセッサもメモリも示していないが、いずれ
もプロセッサをメモリに動作可能に結合する技術ととも
に、当業者には周知である。プロセッサは、メモリにお
ける画像及び変数(または変数群)に関して動作し、メ
モリに変数(または変数群)を格納し又はメモリから変
数(または変数群)を読み込むことができる。計算装置
200はさらに、外部の装置読取可能な媒体206から
の指示を読むように構成された装置と、画像を走査する
ためのスキャナー204とを備える。一の構成では、本
明細書で開示した方法の一又は二以上の構成を実施する
ために計算装置200に指示を与えるように構成された
指示を媒体206に記録する。
【0051】所定のスレショルドを有する方法とは異な
り、本発明の構成は、画像の背景が変化するときに自己
学習を利用する。自己学習工程の範囲では、既存の知識
を蓄積し、反復して用いる。工程が画素化された画像の
列及び行を介して進行しながら、スレシュルドは一の構
成において自己調整される。従って、本発明の構成は、
均一でない背景又はテクスチャー背景と共によく作用す
る。一の構成では、方法は、すでに横断された画像の画
素を利用してそれ自身で学習する。できた二値化画像
は、光学式文字読取(OCR)の目的に特に適し、本発
明の少なくとも一の構成でOCRを用いて処理される。
【0052】本発明の他の構成では、二値化は、“リア
ルタイムで”すなわち画像の操作中に実施される。この
構成は、上述の式(2)及び(3)のようにX
low(i)、Ylow(j)、Xhigh(i)及びY
high(j)を初期設定することを除いて、図1に示した
かつ上述した構成と同様であり、Xlow(i)及びYlow
(j)を最小可能画素輝度値に初期設定しかつX
high(i)及びYhigh(j)を最大可能画素輝度値に初
期設定にする。(例えば、8ビット整数値内の全輝度値
が可能である一の構成が、最小可能輝度値0及び最大可
能輝度値255を有する。)また、画像の各走査線を得
るときに図1の段階18で始まる変数j全体のループを
実施する。しかしながら、画像は二値化が生ずるまでは
プレトレーニングに適していないので、プレトレーニン
グは実施しない。
【0053】上述の本発明の構成では、二値化に際して
は各画像画素の輝度又はグレー値を利用する。しかしな
がら、他の値(例えば、画素のRGB表示からR値又は
画素のYIQ表示からQ値)を特定目的のために仕立て
られた構成における輝度又はグレイ値につじつまが合う
ように置換することも可能である。
【0054】本発明の記載は単なる例示であり、本発明
の要旨から逸脱しない変更は本発明の範囲内になるよう
に意図されている。このような変更は、本発明の精神及
び範囲から逸脱するとはみなされない。
【図面の簡単な説明】
【図1】 カラー画像を二値化する方法の一の構成を示
す流れ図である。
【図2】 図1で示した方法に入力として用いられるよ
うな、画像における画素の配列を示す図である。
【図3】 図1の方法を実施するのに適した計算システ
ムの一の構成を示すブロック図である。
【符号の説明】
100 画像 102 第1の端 104 第2の端 106 第3の端 108 第4の端 200 計算装置 204 読取可能な媒体 206 スキャナー
───────────────────────────────────────────────────── フロントページの続き Fターム(参考) 5B057 CA01 CA08 CA12 CA16 CB02 CB07 CB12 CB16 CC01 CE12 CE18 CH07 CH08 CH11 CH18 5C077 LL19 MP08 PP32 PP34 PQ08 PQ20 PQ22 RR02 5C079 HA11 HB01 HB04 LA02 LA31 LA34 LB11 MA02 MA04 MA11 NA01

Claims (30)

    【特許請求の範囲】
  1. 【請求項1】 第1行が画像の第1の端を形成し、最終
    行が第1の端と反対側に画像の第2の端を形成し、画像
    の第1列が画像の第3の端を形成し、画像の最終列が第
    3の端の反対側に第4の端を形成しているN行M列の画
    素を有する画像を二値化する方法であって、二値化され
    た画素のアレイを形成する方法が: (a)画像の各行について、行の局所的に低い画素値を
    表す第1の変数と、行の局所的に高い画素値を表す第2
    の変数と、画像の各列について、列の局所的に低い画素
    値を表す第3の変数と、列の局所的に高い画素値を表す
    第4の変数と、を初期設定する段階と; (b)第1行から最終行まで、画像の各行について段階
    (c)から段階(f)を反復して繰り返す段階と; (c)第1列から最終列まで、画像の各列について段階
    (d)から段階(f)を反復して繰り返す段階と; (d)位置指標の行における第1の変数及び第2の変数
    と位置指標の列における第3の変数及び第4の変数とに
    依存するスレショルド値を決定する段階であって、位置
    指標が繰り返される行と繰り返される列とに依存する段
    階と; (e)位置指標での画像画素を表す値を決定されたスレ
    ショルド値と比較する段階と; (f)比較結果によって、位置指標についての二値化画
    素を第1の値又は第2の値のいずれかに設定し、かつ、
    比較結果によって、第1の変数および第3の変数か第2
    の変数および第4の変数かのいずれかの値を調整する段
    階と;を備えている方法。
  2. 【請求項2】 画像がカラー画像であり、画像画素を表
    す前記の値が画像画素を表すグレイスケール値であり、
    さらに、カラー画像をグレイスケール画像に変換する段
    階を備えた請求項1に記載の方法。
  3. 【請求項3】 カラー画像をグレイスケール画像に変換
    する段階が、RGB表示によって表された画像をYIQ
    表示で表された画像に変換する段階を備え、前記グレイ
    スケール値がYIQ_Y(輝度)値である請求項2に記
    載の方法。
  4. 【請求項4】 さらに、N行M列の画素を得るために、
    カラー画像を走査する段階を備えた請求項2に記載の方
    法。
  5. 【請求項5】 さらに、二値化された画素のアレイにつ
    いて光学式文字読取を実施する段階を備えた請求項1に
    記載の方法。
  6. 【請求項6】 i=0,…,N−1についての前記第1
    の変数をXlow(i)と記述し、i=0,…,N−1に
    ついての前記第2の変数をXhigh(i)と記述し、j=
    0からM−1についての前記第3の変数をYlow(j)
    と記述し、j=0からM−1についての前記第4の変数
    をYhigh(j)と記述すると、比較結果によって第1の
    変数および第3の変数か第2の変数および第4の変数か
    のいずれかの値を調整する段階が、比較結果によって以
    下のいずれかの式を調整する段階を備えた請求項1に記
    載の方法: 【数1】 または 【数2】 ここで、wはパラメータを示し、*(アスタリスク)は
    掛け算を示し、iは行の位置指数を示し、jは列の位置
    指数を示し、YIQ_Y(i,j)は位置指数での画像
    の画素の輝度値を示す。
  7. 【請求項7】 スレショルドが以下の式で表される請求
    項6に記載の方法: 【数3】
  8. 【請求項8】 前記第1の変数、第2の変数、第3の変
    数及び第4の変数を初期設定する段階が以下のように初
    期設定する段階を備えた請求項6に記載の方法: 【数4】 ここで、 【数5】 ここで、minimum{YIQ_Y(i,j)}はYIQ_
    Y(i,j)の最小値を示し、maximum{YIQ_Y
    (i,j)}はYIQ_Y(i,j)の最大値を示す。
  9. 【請求項9】 さらに、A_1とA_2とから成る群か
    ら選択された第1のプレトレーニング処理とA_3とA
    _4とから成る群から選択された第2のプレトレーニン
    グ処理とを用いて、Xlow(i)、Xhigh(i)、Ylow
    (j)及びY high(j)の値をプレトレーニングする段
    階を備えた請求項8に記載の方法:ここで、プレトレー
    ニング処理A_1は、 A_1: i=N_1からi=N_2について、j=M_1からj=M_2に
    ついて、YIQ_Y(i,j)<(Xlow(i)+Xhigh(i))/2なら
    ば、Xlow(i)=(Xlow(i)*YIQ_Y(i,j))/(w+1)と
    し、さもなければ、Xhigh(i)=(Xhigh(i)*YIQ_Y(i,
    j))/(w+1)と記述され、プレトレーニング処理A_
    2は、 A_2: i=N_2からi=N_1について、j=M_2からj=M_1に
    ついて、YIQ_Y(i,j)<(Xlow(i)+Xhigh(i))/2なら
    ば、Xlow(i)=(Xlow(i)*YIQ_Y(i,j))/(w+1)と
    し、さもなければ、Xhigh(i)=(Xhigh(i)*YIQ_Y(i,
    j))/(w+1)と記述され、プレトレーニング処理A_
    3は、 A_3: i=N_1からi=N_2について、j=M_1からj=M_2に
    ついて、YIQ_Y(i,j)<(Ylow(i)+Yhigh(i))/2なら
    ば、Ylow(i)=(Ylow(i)*YIQ_Y(i,j))/(w+1)と
    し、さもなければ、Yhigh(i)=(Yhigh(i)*YIQ_Y(i,
    j))/(w+1)と記述され、プレトレーニング処理A_
    4は、 A_4: i=N_2からi=N_1について、j=M_2からj=M_1に
    ついて、YIQ_Y(i,j)<(Ylow(i)+Yhigh(i))/2なら
    ば、Ylow(i)=(Ylow(i)*YIQ_Y(i,j))/(w+1)と
    し、さもなければ、Yhigh(i)=(Yhigh(i)*YIQ_Y(i,
    j))/(w+1)と記述され、ここで、 【数6】 及び 【数7】 である。
  10. 【請求項10】 さらに、A_1とA_2とA_3とA
    _4の4つのプレトレーニング処理を用いて、X
    low(i)、Xhigh(i)、Ylow(j)及びY
    high(j)の値をプレトレーニングする段階を備えた請
    求項8に記載の方法:ここで、プレトレーニング処理A
    _1は、 A_1: i=N_1からi=N_2について、j=M_1からj=M_2に
    ついて、YIQ_Y(i,j)<(Xlow(i)+Xhigh(i))/2なら
    ば、Xlow(i)=(Xlow(i)*YIQ_Y(i,j))/(w+1)と
    し、さもなければ、Xhigh(i)=(Xhigh(i)*YIQ_Y(i,
    j))/(w+1)と記述され、プレトレーニング処理A_
    2は、 A_2: i=N_2からi=N_1について、j=M_2からj=M_1に
    ついて、YIQ_Y(i,j)<(Xlow(i)+Xhigh(i))/2なら
    ば、Xlow(i)=(Xlow(i)*YIQ_Y(i,j))/(w+1)と
    し、さもなければ、Xhigh(i)=(Xhigh(i)*YIQ_Y(i,
    j))/(w+1)と記述され、プレトレーニング処理A_
    3は、 A_3: i=N_1からi=N_2について、j=M_1からj=M_2に
    ついて、YIQ_Y(i,j)<(Ylow(i)+Yhigh(i))/2なら
    ば、Ylow(i)=(Ylow(i)*YIQ_Y(i,j))/(w+1)と
    し、さもなければ、Yhigh(i)=(Yhigh(i)*YIQ_Y(i,
    j))/(w+1)と記述され、プレトレーニング処理A_
    4は、 A_4: i=N_2からi=N_1について、j=M_2からj=M_1に
    ついて、YIQ_Y(i,j)<(Ylow(i)+Yhigh(i))/2なら
    ば、Ylow(i)=(Ylow(i)*YIQ_Y(i,j))/(w+1)と
    し、さもなければ、Yhigh(i)=(Yhigh(i)*YIQ_Y(i,
    j))/(w+1)と記述され、ここで、 【数8】 及び 【数9】 である。
  11. 【請求項11】 N行M列の画素であって、第1行は画
    像の第1の端を形成し、最終行は第1の端と反対側に画
    像の第2の端を形成し、画像の第1列が画像の第3の端
    を形成し、画像の最終列が第4の端を形成している画像
    を二値化する計算装置であって、メモリと値を読みかつ
    格納するためにメモリに動作可能に結合されたプロセッ
    サとを含む計算装置は; (a)画像の各行について、局所的に低い第1の方向画
    素値を表す第1の変数と、局所的に高い第1の方向画素
    値を表す第2の変数と、画像の各列について、局所的に
    低い第2の方向画素値を表す第3の変数と、局所的に高
    い第2の方向画素値を表す第4の変数とをメモリに初期
    設定し; (b)第1行から最終行まで、画像の各行について
    (c)から(f)を反復して繰り返し; (c)第1列から最終列まで、画像の各列について
    (d)から(f)を反復して繰り返し; (d)繰り返される行と繰り返される列とに依存する位
    置指標の行における第1の変数及び第2の変数と位置指
    標の列における第3の変数及び第4の変数とに依存する
    スレショルド値を決定し; (e)位置指標での画像画素を表す値を決定されたスレ
    ショルド値と比較し; (f)前記メモリにおいて、比較結果に依存して、位置
    指標についての二値化画素を第1の値又は第2の値のい
    ずれかに格納し、かつ、比較結果に依存して、第1の変
    数および第3の変数か第2の変数および第4の変数かの
    いずれかの格納された値を調整するように;構成され、 (b)及び(c)の繰り返しが前記メモリで格納された
    二値化画素のアレイを形成する計算装置。
  12. 【請求項12】 画像がカラー画像であり、画像画素を
    表す前記の値が画像画素を表すグレイスケール値であ
    り、さらに、カラー画像をグレイスケール画像に変換す
    るように構成された請求項11に記載の装置。
  13. 【請求項13】 カラー画像をグレイスケール画像に変
    換するために、さらに、RGB表示によって表された画
    像をYIQ表示で表された画像に変換するように構成さ
    れ、前記グレイスケール値がYIQ_Y(輝度)値であ
    る請求項12に記載の装置。
  14. 【請求項14】 さらにスキャナーを備え、さらに、N
    行M列のカラー画像を得るために、カラー画像を走査す
    るように構成された請求項12に記載の装置。
  15. 【請求項15】 さらに、二値化された画素の前記アレ
    イについて光学式文字読取を実施するように構成された
    請求項11に記載の装置。
  16. 【請求項16】 i=0,…,N−1についての前記第
    1の変数をXlow(i)と記述し、i=0,…,N−1
    についての前記第2の変数をXhigh(i)と記述し、j
    =0からM−1についての前記第3の変数をY
    low(j)と記述し、j=0からM−1についての前記
    第4の変数をYhigh(j)と記述すると、比較結果によ
    って第1の変数および第3の変数か第2の変数および第
    4の変数かのいずれかの値を調整するために、以下のい
    ずれかの式を調整するように構成された請求項11に記
    載の装置: 【数10】 または 【数11】 ここで、wはパラメータを示し、*(アスタリスク)は
    掛け算を示し、iは行の位置指数を示し、jは列の位置
    指数を示し、YIQ_Y(i,j)は位置指数での画像
    の画素の輝度値を示す。
  17. 【請求項17】 スレショルドが以下の式で表される請
    求項16に記載の装置: 【数12】
  18. 【請求項18】 前記第1の変数、第2の変数、第3の
    変数及び第4の変数を初期設定するために、前記メモリ
    に以下の値を格納するように構成された請求項17に記
    載の装置: 【数13】 ここで、 【数14】
  19. 【請求項19】 さらに、A_1とA_2とから成る群
    から選択された第1のプレトレーニング処理とA_3と
    A_4とから成る群から選択された第2のプレトレーニ
    ング処理とを用いて、前記メモリに格納されたX
    low(i)、Xhigh(i)、Ylow(j)及びY
    high(j)の値をプレトレーニングするように構成され
    た請求項18に記載の装置:ここで、プレトレーニング
    処理A_1は、 A_1: i=N_1からi=N_2について、j=M_1からj=M_2に
    ついて、YIQ_Y(i,j)<(Xlow(i)+Xhigh(i))/2なら
    ば、Xlow(i)=(Xlow(i)*YIQ_Y(i,j))/(w+1)と
    し、さもなければ、Xhigh(i)=(Xhigh(i)*YIQ_Y(i,
    j))/(w+1)と記述され、プレトレーニング処理A_
    2は、 A_2: i=N_2からi=N_1について、j=M_2からj=M_1に
    ついて、YIQ_Y(i,j)<(Xlow(i)+Xhigh(i))/2なら
    ば、Xlow(i)=(Xlow(i)*YIQ_Y(i,j))/(w+1)と
    し、さもなければ、Xhigh(i)=(Xhigh(i)*YIQ_Y(i,
    j))/(w+1)と記述され、プレトレーニング処理A_
    3は、 A_3: i=N_1からi=N_2について、j=M_1からj=M_2に
    ついて、YIQ_Y(i,j)<(Ylow(i)+Yhigh(i))/2なら
    ば、Ylow(i)=(Ylow(i)*YIQ_Y(i,j))/(w+1)と
    し、さもなければ、Yhigh(i)=(Yhigh(i)*YIQ_Y(i,
    j))/(w+1)と記述され、プレトレーニング処理A_
    4は、 A_4: i=N_2からi=N_1について、j=M_2からj=M_1に
    ついて、YIQ_Y(i,j)<(Ylow(i)+Yhigh(i))/2なら
    ば、Ylow(i)=(Ylow(i)*YIQ_Y(i,j))/(w+1)と
    し、さもなければ、Yhigh(i)=(Yhigh(i)*YIQ_Y(i,
    j))/(w+1)と記述され、ここで、 【数15】 及び 【数16】 である。
  20. 【請求項20】 さらに、A_1とA_2とA_3とA
    _4の4つのプレトレーニング処理を用いて、前記メモ
    リに格納されたXlow(i)、Xhigh(i)、Y
    low(j)及びYhigh(j)の値をプレトレーニングす
    るように構成された請求項18に記載の装置:ここで、
    プレトレーニング処理A_1は、 A_1: i=N_1からi=N_2について、j=M_1からj=M_2に
    ついて、YIQ_Y(i,j)<(Xlow(i)+Xhigh(i))/2なら
    ば、Xlow(i)=(Xlow(i)*YIQ_Y(i,j))/(w+1)と
    し、さもなければ、Xhigh(i)=(Xhigh(i)*YIQ_Y(i,
    j))/(w+1)と記述され、プレトレーニング処理A_
    2は、 A_2: i=N_2からi=N_1について、j=M_2からj=M_1に
    ついて、YIQ_Y(i,j)<(Xlow(i)+Xhigh(i))/2なら
    ば、Xlow(i)=(Xlow(i)*YIQ_Y(i,j))/(w+1)と
    し、さもなければ、Xhigh(i)=(Xhigh(i)*YIQ_Y(i,
    j))/(w+1)と記述され、プレトレーニング処理A_
    3は、 A_3: i=N_1からi=N_2について、j=M_1からj=M_2に
    ついて、YIQ_Y(i,j)<(Ylow(i)+Yhigh(i))/2なら
    ば、Ylow(i)=(Ylow(i)*YIQ_Y(i,j))/(w+1)と
    し、さもなければ、Yhigh(i)=(Yhigh(i)*YIQ_Y(i,
    j))/(w+1)と記述され、プレトレーニング処理A_
    4は、 A_4: i=N_2からi=N_1について、j=M_2からj=M_1に
    ついて、YIQ_Y(i,j)<(Ylow(i)+Yhigh(i))/2なら
    ば、Ylow(i)=(Ylow(i)*YIQ_Y(i,j))/(w+1)と
    し、さもなければ、Yhigh(i)=(Yhigh(i)*YIQ_Y(i,
    j))/(w+1)と記述され、ここで、 【数17】 及び 【数18】 である。
  21. 【請求項21】 メモリと値を読込みかつ格納するため
    にメモリに動作可能に結合されたプロセッサとを有する
    計算装置に指示するための命令を記録して有する機械読
    込可能媒体であって: (a)第1行が画像の第1の端を形成し、最終行が第1
    の端と反対側に画像の第2の端を形成し、画像の第1列
    が画像の第3の端を形成し、画像の最終列が第3の端の
    反対側に第4の端を形成しているN行M列の画素を有す
    る画像において、各カラムについて、局所的に低い第1
    の方向画素値を表す第1の変数と局所的に高い第1の方
    向画素値を表す第2の変数と、画像の各列について、局
    所的に低い第2の方向画素値を表す第3の変数と局所的
    に高い第2の方向画素値を表す第4の変数とをメモリに
    おいて初期設定し; (b)第1行から最終行まで、画像の各行について
    (c)から(f)を反復して繰り返し; (c)第1列から最終列まで、画像の各列について
    (d)から(f)を反復して繰り返し; (d)繰り返される行と繰り返される列とに依存する位
    置指標の行における第1の変数及び第2の変数と位置指
    標の列における第3の変数及び第4の変数とに依存する
    スレショルド値を決定し; (e)位置指標での画素を表す値を決定されたスレショ
    ルド値と比較し; (f)比較結果に依存して、位置指標についての二値化
    画素を第1の値又は第2の値のいずれかをメモリに格納
    し、かつ、比較結果に依存して、第1の変数および第3
    の変数か第2の変数および第4の変数かのいずれかにつ
    いての格納された値を調整するように;構成され、 (b)及び(c)の繰り返しがメモリで格納された二値
    化画素のアレイを形成する機械読込可能媒体。
  22. 【請求項22】 画像がカラー画像であり、画像画素を
    表す前記の値が画像画素を表すグレイスケール値であ
    り、さらに、カラー画像をグレイスケール画像に変換す
    るように計算装置に指示する命令を記録して有するよう
    に構成された請求項21に記載の媒体。
  23. 【請求項23】 カラー画像をグレイスケール画像に変
    換するために、さらに、RGB表示によって表された画
    像をYIQ表示で表された画像に変換するように計算装
    置に指示する命令を記録して有するように構成され、前
    記グレイスケール値がYIQ_Y(輝度)値である請求
    項22に記載の媒体。
  24. 【請求項24】 さらにスキャナーを備え、さらに、N
    行M列のカラー画像を得るためにスキャナーを用いて、
    カラー画像を走査するという命令を記録して有するよう
    に構成され請求項22に記載の媒体。
  25. 【請求項25】 さらに、二値化された画素の前記アレ
    イについて光学式文字読取を実施するように計算装置に
    指示する命令を記録して有するように構成された請求項
    21に記載の媒体。
  26. 【請求項26】 i=0,…,N−1についての前記第
    1の変数をXlow(i)と記述し、i=0,…,N−1
    についての前記第2の変数をXhigh(i)と記述し、j
    =0からM−1についての前記第3の変数をY
    low(j)と記述し、j=0からM−1についての前記
    第4の変数をYhigh(j)と記述すると、比較結果によ
    って第1の変数および第3の変数か第2の変数および第
    4の変数かのいずれかの値を調整するために、以下のい
    ずれかの式を調整するように計算装置に指示する命令を
    記録して有するように構成された請求項21に記載の媒
    体: 【数19】 または 【数20】 ここで、wはパラメータを示し、*(アスタリスク)は
    掛け算を示し、iは行の位置指数を示し、jは列の位置
    指数を示し、YIQ_Y(i,j)は位置指数での画像
    の画素の輝度値を示す。
  27. 【請求項27】 スレショルドが以下の式で表される請
    求項26に記載の媒体: 【数21】
  28. 【請求項28】 前記第1の変数、第2の変数、第3の
    変数及び第4の変数を初期設定するために、前記メモリ
    に以下の値を格納するように計算装置に指示する命令を
    記録して有するように構成された請求項27に記載の媒
    体: 【数22】 ここで、 【数23】
  29. 【請求項29】 さらに、A_1とA_2とから成る群
    から選択された第1のプレトレーニング処理とA_3と
    A_4とから成る群から選択された第2のプレトレーニ
    ング処理とを用いて、前記メモリに格納されたX
    low(i)、Xhigh(i)、Ylow(j)及びY
    high(j)の値をプレトレーニングするように計算装置
    に指示する命令を記録して有するように構成された請求
    項28に記載の媒体:ここで、プレトレーニング処理A
    _1は、 A_1: i=N_1からi=N_2について、j=M_1からj=M_2に
    ついて、YIQ_Y(i,j)<(Xlow(i)+Xhigh(i))/2なら
    ば、Xlow(i)=(Xlow(i)*YIQ_Y(i,j))/(w+1)と
    し、さもなければ、Xhigh(i)=(Xhigh(i)*YIQ_Y(i,
    j))/(w+1)と記述され、プレトレーニング処理A_
    2は、 A_2: i=N_2からi=N_1について、j=M_2からj=M_1に
    ついて、YIQ_Y(i,j)<(Xlow(i)+Xhigh(i))/2なら
    ば、Xlow(i)=(Xlow(i)*YIQ_Y(i,j))/(w+1)と
    し、さもなければ、Xhigh(i)=(Xhigh(i)*YIQ_Y(i,
    j))/(w+1)と記述され、プレトレーニング処理A_
    3は、 A_3: i=N_1からi=N_2について、j=M_1からj=M_2に
    ついて、YIQ_Y(i,j)<(Ylow(i)+Yhigh(i))/2なら
    ば、Ylow(i)=(Ylow(i)*YIQ_Y(i,j))/(w+1)と
    し、さもなければ、Yhigh(i)=(Yhigh(i)*YIQ_Y(i,
    j))/(w+1)と記述され、プレトレーニング処理A_
    4は、 A_4: i=N_2からi=N_1について、j=M_2からj=M_1に
    ついて、YIQ_Y(i,j)<(Ylow(i)+Yhigh(i))/2なら
    ば、Ylow(i)=(Ylow(i)*YIQ_Y(i,j))/(w+1)と
    し、さもなければ、Yhigh(i)=(Yhigh(i)*YIQ_Y(i,
    j))/(w+1)と記述され、ここで、 【数24】 及び 【数25】 である。
  30. 【請求項30】 さらに、A_1とA_2とA_3とA
    _4の4つのプレトレーニング処理を用いて、前記メモ
    リに格納されたXlow(i)、Xhigh(i)、Y
    low(j)及びYhigh(j)の値をプレトレーニングす
    るように計算装置に指示する命令を記録して有するよう
    に構成された請求項28に記載の媒体:ここで、プレト
    レーニング処理A_1は、 A_1: i=N_1からi=N_2について、j=M_1からj=M_2に
    ついて、YIQ_Y(i,j)<(Xlow(i)+Xhigh(i))/2なら
    ば、Xlow(i)=(Xlow(i)*YIQ_Y(i,j))/(w+1)と
    し、さもなければ、Xhigh(i)=(Xhigh(i)*YIQ_Y(i,
    j))/(w+1)と記述され、プレトレーニング処理A_
    2は、 A_2: i=N_2からi=N_1について、j=M_2からj=M_1に
    ついて、YIQ_Y(i,j)<(Xlow(i)+Xhigh(i))/2なら
    ば、Xlow(i)=(Xlow(i)*YIQ_Y(i,j))/(w+1)と
    し、さもなければ、Xhigh(i)=(Xhigh(i)*YIQ_Y(i,
    j))/(w+1)と記述され、プレトレーニング処理A_
    3は、 A_3: i=N_1からi=N_2について、j=M_1からj=M_2に
    ついて、YIQ_Y(i,j)<(Ylow(i)+Yhigh(i))/2なら
    ば、Ylow(i)=(Ylow(i)*YIQ_Y(i,j))/(w+1)と
    し、さもなければ、Yhigh(i)=(Yhigh(i)*YIQ_Y(i,
    j))/(w+1)と記述され、プレトレーニング処理A_
    4は、 A_4: i=N_2からi=N_1について、j=M_2からj=M_1に
    ついて、YIQ_Y(i,j)<(Ylow(i)+Yhigh(i))/2なら
    ば、Ylow(i)=(Ylow(i)*YIQ_Y(i,j))/(w+1)と
    し、さもなければ、Yhigh(i)=(Yhigh(i)*YIQ_Y(i,
    j))/(w+1)と記述され、ここで、 【数26】 及び 【数27】 である。
JP2002336964A 2001-11-21 2002-11-20 カラー文書画像を二値化する方法及び装置 Expired - Fee Related JP3833993B2 (ja)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US09/990,096 US6950210B2 (en) 2001-11-21 2001-11-21 Method and apparatus for adaptively binarizing color document images
US09/990,096 2001-11-21

Publications (2)

Publication Number Publication Date
JP2003198861A true JP2003198861A (ja) 2003-07-11
JP3833993B2 JP3833993B2 (ja) 2006-10-18

Family

ID=25535754

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002336964A Expired - Fee Related JP3833993B2 (ja) 2001-11-21 2002-11-20 カラー文書画像を二値化する方法及び装置

Country Status (3)

Country Link
US (1) US6950210B2 (ja)
JP (1) JP3833993B2 (ja)
CN (1) CN1237475C (ja)

Families Citing this family (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101042735B (zh) * 2006-03-23 2010-11-17 株式会社理光 图像二值化方法和装置
JP4834603B2 (ja) * 2007-05-09 2011-12-14 京セラミタ株式会社 画像処理装置、画像形成装置
CN101727583B (zh) * 2008-10-22 2013-03-20 富士通株式会社 用于文档图像的自适应二值化方法和设备
US8761511B2 (en) * 2009-09-30 2014-06-24 F. Scott Deaver Preprocessing of grayscale images for optical character recognition
CN102270340B (zh) * 2011-09-05 2014-09-17 上海盛轩网络科技有限公司 基于笔画算子的文本图像增强方法及系统
KR101996917B1 (ko) * 2012-07-20 2019-10-02 삼성디스플레이 주식회사 평판 검사 방법 및 장치
US9542736B2 (en) * 2013-06-04 2017-01-10 Paypal, Inc. Evaluating image sharpness
US9652817B2 (en) * 2015-03-12 2017-05-16 Samsung Electronics Co., Ltd. Automated compute kernel fusion, resizing, and interleave
CN105180732B (zh) * 2015-07-24 2018-07-27 成都市计量检定测试院 钢卷尺刻度误差测量方法
CN105809715B (zh) * 2016-03-07 2018-07-27 南京航空航天大学 一种基于帧间累计变化矩阵的视觉运动目标检测方法
US20180122079A1 (en) * 2016-10-27 2018-05-03 Qualcomm Incorporated Systems and methods for determining histograms
US10922801B2 (en) 2017-07-19 2021-02-16 Lockheed Martin Corporation Channel-based binarization of color
US11508172B2 (en) * 2017-12-28 2022-11-22 Dst Technologies, Inc. Identifying location of shreds on an imaged form

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4823194A (en) * 1986-08-01 1989-04-18 Hitachi, Ltd. Method for processing gray scale images and an apparatus thereof
US5184213A (en) * 1989-09-20 1993-02-02 Toyo Ink Mfg. Co., Ltd. Binarizing method for color image using modified error diffusion method
JPH07104921B2 (ja) * 1989-11-17 1995-11-13 松下電器産業株式会社 画像閾値決定方法
US5268773A (en) * 1990-03-30 1993-12-07 Samsung Electronics Co., Ltd. Document image signal processor having an adaptive threshold
US5200841A (en) * 1990-05-25 1993-04-06 Nikon Corporation Apparatus for binarizing images
JPH04227581A (ja) * 1990-06-08 1992-08-17 Omron Corp 画像の2値化閾値算出装置
US5915049A (en) * 1992-02-25 1999-06-22 Pfu Limited Binarization system for an image scanner
JP3313447B2 (ja) * 1993-03-19 2002-08-12 株式会社リコー 画像処理装置
KR0136067B1 (ko) * 1994-08-12 1998-04-27 김광호 이치화상 프로세서
US5621815A (en) * 1994-09-23 1997-04-15 The Research Foundation Of State University Of New York Global threshold method and apparatus
JPH096957A (ja) * 1995-06-23 1997-01-10 Toshiba Corp 濃度画像の2値化方法および画像2値化装置
US5949901A (en) * 1996-03-21 1999-09-07 Nichani; Sanjay Semiconductor device image inspection utilizing image subtraction and threshold imaging
US6192163B1 (en) * 1996-10-29 2001-02-20 Seiko Epson Corporation Image processing method and image processing apparatus
US6055336A (en) * 1996-11-18 2000-04-25 Canon Kabushiki Kaisha Image processing system which converts multi-value image data into binary image data
GB9711024D0 (en) * 1997-05-28 1997-07-23 Rank Xerox Ltd Image enhancement and thresholding of images
US6061476A (en) * 1997-11-24 2000-05-09 Cognex Corporation Method and apparatus using image subtraction and dynamic thresholding
US6195467B1 (en) * 1999-03-25 2001-02-27 Image Processing Technologies, Inc. Method and apparatus for sharpening a grayscale image
US6498660B2 (en) * 2001-02-16 2002-12-24 Oak Technology, Inc. System and method for the dynamic thresholding of grayscale image data

Also Published As

Publication number Publication date
JP3833993B2 (ja) 2006-10-18
CN1237475C (zh) 2006-01-18
US6950210B2 (en) 2005-09-27
US20030095270A1 (en) 2003-05-22
CN1420472A (zh) 2003-05-28

Similar Documents

Publication Publication Date Title
US6985631B2 (en) Systems and methods for automatically detecting a corner in a digitally captured image
US10666873B2 (en) Exposure-related intensity transformation
US8472726B2 (en) Document comparison and analysis
CA2851598C (en) Apparatus and method for automatically recognizing a qr code
RU2726185C1 (ru) Детектирование и идентификация объектов на изображениях
US9697583B2 (en) Image processing apparatus, image processing method, and computer-readable recording medium
CN111476737A (zh) 一种图像处理方法、智能设备及计算机可读存储介质
RU2721187C1 (ru) Обучение языковых моделей с использованием текстовых корпусов, содержащих реалистичные ошибки оптического распознавания символов (ocr)
KR20070008652A (ko) 촬영된 이미지로부터 원 데이터를 추출하는 방법
JP2003198861A (ja) カラー文書画像を二値化する方法及び装置
KR20070046946A (ko) 사진 문서 이미징 시스템
JP2002516440A (ja) 画像認識および相関システム
CN112101349A (zh) 一种车牌样本生成方法及装置
CN115812221A (zh) 图像生成及着色方法及装置
CN113052170A (zh) 一种无约束场景下的小目标车牌识别方法
CN116645592A (zh) 一种基于图像处理的裂缝检测方法和存储介质
JP2021189527A (ja) 情報処理装置、情報処理方法及びプログラム
CN113496133A (zh) 二维码识别方法、装置、电子设备及存储介质
Bala et al. Image simulation for automatic license plate recognition
JP2021196451A (ja) 画像変換装置、画像変換方法及び画像変換用コンピュータプログラム
JP4756436B2 (ja) パターン認識装置とそのパターン認識方法、及びパターン認識プログラム
CN108133205B (zh) 复制图像中文本内容的方法及装置
JP4550768B2 (ja) 画像検出方法および画像検出装置
CN115909378A (zh) 单据文本检测模型的训练方法及单据文本检测方法
JP5337844B2 (ja) 領域検出装置、領域検出方法及びプログラム

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060131

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060313

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20060620

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20060720

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees