JPH11338976A - 文書画像認識装置、その方法、及び記録媒体 - Google Patents

文書画像認識装置、その方法、及び記録媒体

Info

Publication number
JPH11338976A
JPH11338976A JP10145322A JP14532298A JPH11338976A JP H11338976 A JPH11338976 A JP H11338976A JP 10145322 A JP10145322 A JP 10145322A JP 14532298 A JP14532298 A JP 14532298A JP H11338976 A JPH11338976 A JP H11338976A
Authority
JP
Japan
Prior art keywords
pixel
image
value
subpixel
local
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP10145322A
Other languages
English (en)
Other versions
JP3345350B2 (ja
Inventor
Hiroshi Kamata
洋 鎌田
Katsuto Fujimoto
克仁 藤本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP14532298A priority Critical patent/JP3345350B2/ja
Priority to US09/216,712 priority patent/US6347156B1/en
Publication of JPH11338976A publication Critical patent/JPH11338976A/ja
Application granted granted Critical
Publication of JP3345350B2 publication Critical patent/JP3345350B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/40Picture signal circuits
    • H04N1/40068Modification of image resolution, i.e. determining the values of picture elements at new relative positions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/16Image preprocessing
    • G06V30/162Quantising the image signal
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/40Picture signal circuits
    • H04N1/40012Conversion of colour to monochrome
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Character Input (AREA)
  • Processing Or Creating Images (AREA)
  • Image Processing (AREA)
  • Facsimile Image Signal Circuits (AREA)

Abstract

(57)【要約】 【課題】高速で認識精度の高い文書画像認識装置を提供
する。 【解決手段】文書画像入力部10から入力されたカラー
画像は、明度画像抽出部11でグレースケール画像に変
換される。次に、可変解像度2値化部12で、元のグレ
ースケール画像の解像度に対応した解像度であって、よ
り高い解像度の画像に変換される。この変換の際には、
元画像間にサブピクセルを生成し、画素値を補間によっ
て求める。更に、この原画素とサブピクセルの画素値を
使用して、2値化の為の閾値を発生し、画素値と閾値を
比較することにより、画像を2値化する。2値化された
画像は2値画像認識部13において、文字認識され、認
識結果出力部14から認識結果が出力される。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、画像認識装置に関
する。
【0002】
【従来の技術】パーソナルコンピュータの普及とネット
ワークの整備により、電子化文書が多くなっている。し
かし、情報流通の主要媒体は依然として紙文書であり、
既存の紙文書も多く存在する。そこで、紙文書から電子
化文書へ変換を行い、変換結果を編集する文書画像認識
装置の需要が拡大している。文書画像認識装置は、文書
画像を入力とし、文書画像中の文字等を認識することに
よるコード化処理を行う装置であり、現在は2値文書画
像を入力とする製品がある。2値文書画像とは、文字の
ある部分の画像データを、例えば、“1”で表し、背景
の部分の画像データを“0”で表した文書画像のことで
ある。
【0003】近年、画像ファイリング装置が普及してき
ており、画像ファイリング装置でファイリングした画像
を文書画像認識装置に入力して認識する需要も増加して
いる。特に、写真を含むグレースケール文書やカラー文
書が多くなっているため、2値文書のみならず、グレー
スケール文書やカラー文書を認識する需要が拡大してい
る。
【0004】カラー文書画像認識装置は、カラー文書画
像やグレースケール文書画像をも認識対象とする。従来
のカラー文書画像認識装置では、入力文書画像が2値画
像でなく、グレースケール画像やカラー画像である場
合、明度成分を一定の閾値で2値化して2値画像を求
め、2値画像を認識する。
【0005】図19は、従来のカラー文書画像認識装置
の構成とカラーテキスト画像を拡大した様子を示す図で
ある。同図(a)は、従来のカラー文書画像認識装置の
構成を示す図である。
【0006】文書画像入力部170は、文書画像を入力
する装置であり、一般にはスキャナ等である。通常、文
書に光を当て、反射してきた光を受光して、これを解析
することによって、カラー文書の場合には色彩や明度等
のパラメータを各画素毎に割り当てるものである。スキ
ャンすべき文書がグレースケール文書である場合には、
文書から反射してきた光を解析し、明度に関する情報を
取得し、これを各画素毎に割り当てるものである。この
とき、グレースケール文書の色彩は、全ての画素が無彩
色であることが取得され、これが、各画素毎の色彩のパ
ラメータとして設定される。
【0007】明度画像抽出部171は、入力画像がカラ
ー画像である場合、画素毎に明度成分を抽出し、グレー
スケール画像である明度画像を一定閾値2値化部に出力
する。入力画像がグレースケール画像である場合には、
既に全ての画素の色彩に関するパラメータが無彩色に設
定されているので、明度画像抽出部171によって処理
されたグレースケール画像は、パラメータの内、色彩に
関するものが取り除かれているのみで、原理的には入力
画像であるグレースケール画像と処理結果であるグレー
スケール画像とは明度に関して同じデータを持った画像
データとなる。
【0008】一定閾値2値化部172は、明度画像であ
るグレースケール画像が入力された場合、一定の閾値で
2値化して2値画像を求める。この閾値は、外部から指
示入力される値である。なお、以後グレースケール画像
といった場合には、基本的に明度画像抽出部171によ
って処理された結果の明度画像を示し、文書画像入力部
170がスキャンした、色彩に関するパラメータが無彩
色に設定されているグレースケール画像ではないとす
る。すなわち、色彩に関するパラメータは持っておら
ず、明度に関するパラメータのみを持っているものとす
る。しかし、色彩パラメータを持っていても、全ての画
素について、このパラメータが無彩色に設定されている
場合には、実質的に画像認識に有効なのは明度のパラメ
ータのみであるので、このようなグレースケール画像を
用いても画像認識を行うことは可能である。
【0009】2値画像認識部173は、2値画像を認識
する。すなわち、一定閾値2値化部172で2値化され
た文書画像を2値化された画像の特徴を捉えることによ
って、文字を認識し、それをコンピュータ内部で使用し
ている認識された文字に対応するコードに置き換えるも
のである。
【0010】認識結果出力部174は、2値画像認識部
173で行われた文字認識結果、すなわち、文書画像を
文字を表すコードの配列に再構成したファイルを出力す
る。
【0011】
【発明が解決しようとする課題】従来のカラー文書画像
認識装置では、認識精度が低い、という欠点がある。カ
ラー文書画像は、1画素あたりのデータ量が、2値画像
の8倍以上であるため、2値画像と比較して、低解像度
でカラー文書画像認識装置に入力される。スキャナなど
の画像入力装置の処理時間の低減、画像ファイリングす
る際の使用メモリ量の低減等のためである。
【0012】図19(b)は、低解像度カラーテキスト
画像の拡大図を示す図である。同図(b)は、フルカラ
ーの150dpiテキスト画像であるが、カラー表示で
は、文字の周辺部分に多種類の色が確認でき、同一色の
抽出により領域を同定することが困難であることが推定
できる。
【0013】従来の文書画像認識装置は、基本的にデー
タ量の少ない2値画像を入力する仕様であり、標準的に
は400dpi程度の文書画像の解像度を前提としてい
る。このため、150dpi以下のカラー文書画像を入
力した場合、150dpi以下の同じ解像度の2値画像
に変換して認識するため、十分な精度で認識することが
できない、欠点がある。
【0014】本発明の課題は、高速で認識精度の高い文
書画像認識装置を提供することである。
【0015】
【課題を解決するための手段】本発明の画像認識装置
は、入力文書画像が、カラー画像であればグレースケー
ル画像に変換し、グレースケール画像であれば、新たに
グレースケール画像を出力する画像変換手段と、該グレ
ースケール画像の解像度に応じた、より解像度の高い2
値画像に変換する可変解像度2値化手段と、該2値化さ
れた画像を認識する手段とを備えることを特徴とする。
【0016】本発明の画像認識方法は、(a)入力文書
画像が、カラー画像であればグレースケール画像に変換
し、グレースケール画像であれば、新たにグレースケー
ル画像を出力するステップと、(b)該グレースケール
画像の解像度に応じた、より解像度の高い2値画像に変
換するステップと、(c)該2値化された画像を認識す
るステップとを備えることを特徴とする。
【0017】本発明によれば、カラー文書画像から変換
によって求められたグレースケール文書画像、あるい
は、入力されたグレースケール画像に対し、その解像度
に応じて、適切なより高い解像度の画像データに変換す
るので、グレースケールの持っている明度に関する情報
の欠落を起こすことなく、画像を2値化することができ
る。従って、2値画像に表れる文字がつぶれてしまうこ
とを避けることが出来、より精度の高い、文字認識をす
ることができる。
【0018】更に、文字等が含まれる描画領域を文書画
像から粗抽出し、その抽出された領域に対してのみ、本
発明の2値化処理を施すことにより処理速度を高速化す
ることができる。
【0019】
【発明の実施の形態】本発明では、従来装置の問題点を
解決するために、入力画像の解像度に応じて解像度を高
くした2値画像に変換する。
【0020】すなわち、入力画像の解像度が低くとも、
カラー画像やグレースケール画像であれば人間は判読で
きる。また、従来装置で2値化した結果の画像は、人間
でも非常に読みにくい。2値化結果の画像が読みにくい
理由は、画像の明度成分にある情報が欠落するためであ
る。2値化結果画像を読みやすくするためには、画像の
明度成分にある情報を2値化結果画像に反映する必要が
ある。このためには、2値化結果画像の解像度を増すの
が有効な手段である。
【0021】入力文書画像が、カラー画像であればグレ
ースケール画像に変換した後、2値画像に変換し、グレ
ースケール画像であれば2値画像に変換するものにおい
て、入力画像の解像度に応じた解像度の2値画像に変換
する。そして、変換もしくは入力された2値画像を認識
して電子コード化する。
【0022】入力画像の解像度に応じた解像度の2値画
像に変換する具体的な手段としては、グレースケール画
像の画素値を補間して画像の画素数を増加させるサブピ
クセル化処理を行った後、2値画像を求める方法が考え
られる。サブピクセル化処理の具体的な方法としては画
素値の線形補間がある。
【0023】あるいは、カラー画像またはグレースケー
ル画像の認識率を高める方法としては、文字の存在する
部分とその周辺のみを全画像から抽出し、抽出された部
分画像の中で適切に閾値を生成して文字認識を行うよう
にする方法がある。この場合には、明度成分にある情報
の欠落を防ぐと言うよりは、背景の明度の高い領域の濃
淡、即ち、ノイズ成分を少なくすることにより、2値化
処理の結果がより文字の形をはっきり反映することが出
来るようにするものである。
【0024】図1は、本実施形態のカラー文書画像認識
装置の原理構成である。文書画像入力部10は、前述の
従来技術と同様にスキャナに相当する部分であり、カラ
ー文書画像やグレースケール文書画像(色彩パラメータ
を含む)を光を当てて、画像として取り込むユニットで
ある。
【0025】明度画像抽出部11は、文書画像入力部1
0で入力された画像から明度成分のみを抽出し、グレー
スケール画像(色彩パラメータを含まない)を生成する
ユニットである。明度画像抽出部11の出力であるグレ
ースケール画像は、次の可変解像度2値化部12に入力
される。
【0026】可変解像度2値化部12は、入力された解
像度の低いグレースケール画像を基に、文字が含まれて
いる部分領域を抽出(粗抽出)したり、グレースケール
画像の原画素間にサブピクセルを生成して、明度成分に
関する情報の補間を行うことにより、後段の2値画像認
識部13に、より文字の認識のしやすい2値画像を提供
するものである。
【0027】2値画像認識部13は、可変解像度2値化
部12から渡された2値画像に基づいて文字認識を行
い、画像としての文字を電子コードに置き換える処理を
行う。認識結果出力部14は、2値画像認識部13から
の電子コードの配列としての文書ファイルを受け取り、
これをハードディスク等の記録媒体等に記録したり、表
示モニタに認識結果としての文書ファイルを出力したり
するものである。
【0028】なお、同図の文書画像入力部10、明度画
像抽出部11、2値化画像認識部13、及び認識結果出
力部14は、従来の構成と同様であるので、以下、詳細
な説明は省略する。すなわち、現在、白黒文書の認識装
置やソフトウェアが商品化されている現在において、ス
キャナである文書画像入力部10や、2値画像認識部1
3、及び認識結果出力部14の構成は、詳細な説明をす
るまでもなく、当業者によれば容易にその構造を理解で
き、また、実際に使用することができるからである。ま
た、明度画像抽出部11においても、カラー画像等をグ
レースケール画像に置き換える装置であり、テレビ放送
等において、カラー画像を白黒画像に置き換えて放送さ
れる現状を考えると、当業者によれば、容易にその構成
は理解され、また、実際の装置も容易に手に入れること
が出来ると考えられるので、説明は省略する。
【0029】従って、本発明の実施形態においては、図
19で示した従来装置の構成における、一定閾値2値化
部172が可変解像度2値化部12に換えることを特徴
としており、以下の説明では、この可変解像度2値化部
12について詳細に説明する。可変解像度2値化部12
では、グレースケール画像を入力画像の解像度に応じた
解像度の2値画像に変換、あるいは、グレースケール画
像から文字の含まれる部分の粗抽出後に画像を2値化し
て文字認識に使用できるようにする。また、解像度の変
換と粗抽出を共に行う構成を取ることも可能である。
【0030】図2は、可変解像度2値化部の構成例を示
した図である。可変解像度2値化部の第1の構成例とし
ては、同図(a)に示すように、サブピクセル化処理部
20において、グレースケール画像の原画素間にサブピ
クセルを生成し、入力画像であるグレースケール画像の
解像度に従った高解像度化を行った後、一定閾値2値化
部21で、従来の一定閾値の2値化処理を行う構成が考
えられる。
【0031】一定閾値とは、1つの文書画像に対して一
定の閾値を使用することを意味しており、例えば、1ペ
ージ分の文書画像の2値画像化には、ただ1つの閾値が
使用される。
【0032】サブピクセル化は、そのままでは2値化し
ても認識率の向上が望めないグレースケール画像の原画
素間を更に細分化して、データ上に仮想の画素データを
生成してやることである。詳細は後述するが、サブピク
セルの持つ画素値(明度)は、入力されるグレースケー
ル画像の原画素の明度を補間処理して得る。補間方法の
代表としては線形補間が考えられる。
【0033】可変解像度2値化部の第2の構成例として
は、同図(b)に示すように、同図(a)における一定
閾値2値化部21の代りに、局所2値化処理部23を設
ける構成が考えられる。局所2値化処理部23は、一定
の閾値を使用した場合より認識精度を向上可能な2値画
像を得るために、グレースケール文書画像全体の中か
ら、処理を行おうとする局所領域を描画領域内の画素ご
とに設定し、局所領域内の画素データを用いて生成した
閾値を使って画像を2値化して2値画像を求める。
【0034】すなわち、画素毎に局所的な範囲(局所領
域;例えば、注目画素を中心とした正方形領域)で明度
の閾値を求め、2値化する。つまり、明度の値が閾値未
満の画素が黒(例えば、“1”に設定する)、明度の値
が閾値以上の画素が白(例えば、“0”に設定する)に
なるように2値化する。局所領域内における閾値は、具
体的には、画素値の平均、標準偏差、分散の線形和を用
いる方法がある。閾値の定義例としては、以下のものが
考えられる。局所2値化パラメータは定数であり、この
値を適切に設定することによって最適な閾値を得るよう
にする。なお、以下の式では、グレースケールは明度と
ほぼ同意に用いている。
【0035】(閾値)=(グレースケール平均)+(局
所2値化パラメータ)×(グレースケール標準偏差) 図3は、サブピクセル化処理の原理を説明する図であ
る。
【0036】同図で、黒丸はグレースケール画像の原画
素を示し、白丸はサブピクセルを表す。また、IA〜I
Dは、原画素A〜Dのグレースケールである。また、I
1〜I5は、原画素のグレースケールから補間処理によ
って求められるべきサブピクセル1〜5のグレースケー
ルである。
【0037】同図のように、4つの原画素に囲まれた内
部にサブピクセルを線形補間で生成する場合には、先
ず、原画素間に幾つのサブピクセルを設けるかを決定す
る。次に、サブピクセルを、設けるべきサブピクセルの
数に合わせて原画素間に均等に配置する。そして、それ
ぞれのサブピクセルに対して原画素のグレースケールか
ら補間によって、グレースケールを割り当てる。
【0038】例えば、p、qを1より小さく0より大き
い数として、サブピクセルを原画素A〜Dで囲まれる領
域に配置する場合を考える。サブピクセル1は、原画素
Aと原画素Bを結ぶ直線AB上にp:1−pで表される
位置に配置されている。この場合、サブピクセル1のグ
レースケールを原画素AとBのグレースケールIAとI
Bから線形補間で求めるには、以下のような式によって
求める。
【0039】 I1=p・IB+(1−p)・IA 同様に、サブピクセル2、3、4のグレースケールは、 I2=q・IC+(1−q)・IA I3=q・ID+(1−q)・IB I4=p・ID+(1−p)・IC のように求められる。
【0040】また、原画素点A〜Dで囲まれる領域の内
部にあるサブピクセル5のグレースケールI5は、以下
のような式によって求めることができる。 I5=p・q・ID+p・(1−q)・IB+q・(1
−p)・IC+(1−p)・(1−q)・IA 以上のような、計算を原画素間に設けられた全てのサブ
ピクセルに対し行うことによってサブピクセル化を完了
する。得られたグレースケールは、対応するサブピクセ
ルの位置と共に、原画素データと同様の方法で記録して
おく。
【0041】図4は、入力画像であるグレースケール画
像の解像度に対して、どの程度のサブピクセルを生成す
るかを指定するテーブルの例である。図3で説明した計
算処理の最初に、原画素の間にサブピクセルを配置する
必要がある。サブピクセルをどの位の数設けるかは、任
意性のあるところであるが、サブピクセル化して2値化
した画像から十分な文字認識精度が得られるように設定
する必要がある。従って、入力画像の解像度に対して、
どのくらいのサブピクセルを設けるかを一義的に定める
数式があるわけではなく、ある程度実験データに基づい
て決定されるべきものである。
【0042】同図では、左の欄に入力画像の解像度が、
右の欄にサブピクセル化パラメータが対応して記録され
ている。例えば、入力画像の解像度が“100”dpi
である場合には、サブピクセルは原画素1つに対して、
6×6の格子を形成するように生成される。また、入力
画像の解像度が“150”dpiである場合には、サブ
ピクセルは原画素1つに対して、3×3の格子を形成す
るように生成される。
【0043】このように、前述のピクセル化処理部は、
同図のようなテーブルを保持しておき、グレースケール
画像が入力された場合には、その解像度からサブピクセ
ルの生成数を取得し、先ず、サブピクセルの位置を決定
する。次に図3で説明した算出方法により、各サブピク
セルに対し、グレースケールを原画素のグレースケール
から補間処理で値を求め、入力画像の解像度に従った高
解像度の画像データを生成する。
【0044】図5は、可変解像度2値化部の別の構成例
を示した図である。図2(b)の構成の場合、全画像領
域を局所2値化するため、比較的、処理時間がかかるの
で、グレースケール画像の画素値に対する大域閾値によ
り、閾値未満の画像部分を文字の周辺部として、描画領
域を粗く抽出する大局処理を描画領域粗抽出部により行
った後、局所2値化処理を行う構成が考えられる。
【0045】すなわち、描画領域粗抽出部50で文書画
像のうち、文字が記載されている部分及びその周辺部を
抽出し、局所2値化処理部は、この抽出された領域にお
いてグレースケール画像を2値化する。粗抽出の仕方と
しては、後述するように、文書画像の画素全体に渡っ
て、グレースケール、あるいは明度に対して、その明度
を有している画素数を集計する。そして、明度の大きい
部分で画素数が大きくなっている場合は、文書画像の背
景を表しており、明度の小さい部分で画素数が大きくな
っている場合には、文書画像の文字が分布している部分
を表しているとして、これらの2つの山の中間にあたる
画素数の少ない部分に閾値を設定する。この閾値の設定
は、2値化処理の場合と同様であって、ただし、閾値の
設定位置を少し明度の高い方にずらした位置に設定す
る。このような閾値(大域閾値)を用いて、文書画像中
の画素を抽出すると、これはちょうど文字とその周辺を
含む部分になる。このように粗抽出した領域に対して、
局所2値化処理部51が別の閾値を用いて画像を2値化
することにより、文書画像の背景の濃淡によるノイズ成
分を削除することができるので、より文字認識のしやす
い2値画像を得ることが出来る。
【0046】大域閾値は、具体的には、画素値の平均、
標準偏差、分散の線形和を用いる方法があり、例えば、
以下のような定めかたも可能である。大局処理パラメー
タは定数である。
【0047】(閾値)=(全画素値の平均)+(大局処
理パラメータ)×(全画素値の標準偏差) この大局処理パラメータ調整することによって、大域閾
値の位置を調整し、粗抽出が最も効果的に行える位置に
設定する。
【0048】図6は、粗抽出処理の場合に使用される大
域閾値の設定の仕方を説明する図である。同図のよう
に、粗抽出を行う場合には、文書画像全体にわたって一
定閾値を設定する場合と同様に、文書画像全体を構成す
る画素全てに対して、明度(明るさ)を取得し、どの明
るさの画素がどのような頻度で文書画像に含まれている
かの統計をとる。同図では、明るさに対する画素の頻度
が滑らかな曲線を描くようにしているが、これはあくま
で、閾値設定方法を説明するために模式的に描いたもの
であって、実際に装置を使って特定の明度の発生頻度を
表す統計処理を行う場合には、ヒストグラムのようにな
る。
【0049】同図では、明度の小さい部分に1つの頻度
の山と、明度の大きい部分に1つの頻度の山とが出来て
いる。明るさの大きい部分は文書画像の背景であり、文
書が作成されている用紙の明るさである。一方、明るさ
の小さい部分の山は、文字や図形等が描かれている描画
領域である。このように、画素の発生頻度を明度に対し
て整理すると、描画領域に含まれる画素と背景に含まれ
る画素とに大きく分かれるので、2つの山の中間当たり
に明度の閾値を設け、この閾値よりも小さい明度を有す
る画素を文書画像から抜き出すことにより、粗抽出を行
うことができる。
【0050】なお、文書が白黒反転画像で構成されてい
る場合には、同図の2つの山の描画領域と背景が入れ替
わるので、設定した閾値よりも大きな明度を持つ画素を
描画領域として抽出する。
【0051】文書画像全体を一定の閾値で2値化する場
合には、閾値は、2つの山のちょうど中間当たり、すな
わち、頻度が谷のそこになっているような位置に設定さ
れる。これは、文字の形を認識するに当たって、背景の
画素まで取り込んでは精度の良い認識が出来ないからで
ある。しかし、粗抽出を行う場合には、むしろ、文字の
周辺の背景部分を含んでいたほうが、抽出された領域内
で2値化する場合の閾値を設定するのに都合がよいの
で、閾値を谷間の底から少し背景の山の方向にずらした
位置に設定する。このようにすることによって、文字等
の描画領域とその周辺の背景を含む領域が抽出されるこ
とになる。
【0052】図7は、可変解像度2値化部の更に別の構
成例を示す図である。図2と図5の構成を合わせると、
グレースケール画像に対して、サブピクセル化処理を行
った後、描画領域を粗く抽出する大局処理を行い、その
後、描画領域内の画素毎に、局所2値化処理を行う構成
になり、図2の構成よりも高速に処理でき、図5の構成
よりも精度が高くなる効果がある。
【0053】同図(a)は、サブピクセル化処理部70
によるサブピクセルを最初に行い、後に、描画領域粗抽
出部71によって、文書画像の粗抽出を行う。サブピク
セル化を行うことによってグレースケール画像の明度に
関する情報を欠落させず、むしろ、明度に関する情報を
補うので、2値化処理における精度を向上させることが
できる。また、粗抽出を行うことによって、文書画像の
全体を処理対象とする必要がないので、処理する画素数
が削減され、局所2値化処理部における処理速度を向上
することが出来る。
【0054】サブピクセル処理部70は、図3で説明し
たサブピクセル処理を文書画面全体に対して行い、描画
領域粗抽出部71は、サブピクセルも処理対象として、
粗抽出を行う。したがって、サブピクセル化のみ、ある
いは、粗抽出処理のみを行う場合に比べて、精度や速度
の面で有効であるが、サブピクセル化を文書画像全体に
対して行わなくてはならないので、局所2値化処理部7
2の処理速度は向上する事が出来るが、サブピクセル化
処理部70や、描画領域粗抽出部71で扱う処理データ
量が多くなり、処理の速度を遅くしたり、データを格納
するメモリの容量が余分に必要になったりする。
【0055】同図(b)は、同図(a)の処理速度をよ
り向上するための構成例である。すなわち、同図(a)
の構成において、サブピクセル化処理部70と描画領域
粗抽出部71の処理順序を逆にしたのが、同図(b)の
構成である。描画領域粗抽出部73の処理が、サブピク
セル化によって、画素数の拡大されない元のグレースケ
ール画像に対して行われるため、描画領域粗抽出部73
の扱うデータ量が少なく、より処理が高速になる。
【0056】また、サブピクセル化処理部74も、入力
されたグレースケール画像全体ではなく、描画領域粗抽
出部73によって抽出された領域に対してのみサブピク
セル化を行えば良いので、同図(a)のように、入力さ
れたグレースケール画像全体に対しサブピクセル化を行
うよりも、扱う画素数が格段に減少するので、データを
格納するメモリ容量も少なくて済み、処理速度もより向
上することが出来る。
【0057】また、局所2値化処理部75の処理量は、
同図(a)の場合と同じ程度となるので、同図(b)の
構成においては、全体としての処理速度を向上すること
が出来るとともに、メモリなどの必要とされるハードウ
ェア資源の量も削減することができる。
【0058】一般に、サブピクセル化の後に局所2値化
を行う構成(図2、図7)では、局所2値化の閾値は、
サブピクセル化の補間点(サブピクセル)における画素
値から計算される。しかし、サブピクセル化の補間点に
おける画素値は原画素値から求められるため、サブピク
セル化の補間点における画素値を原画素値から求める数
式を、局所閾値を補間点における画素値から求める数式
に代入して得る数式から、局所2値化処理を行うことが
できる。
【0059】図8は、局所2値化処理部のより詳細な第
1の構成例である。サブピクセル化処理部80の処理内
容は図3に基づいて説明したので、説明を省略する。局
所2値化部81は、閾値計算部82と比較部83とから
なっている。閾値計算部82では、グレースケール画像
から直接に局所2値化処理の閾値を求める。比較部83
は、サブピクセル化処理部80で求めたサブピクセル化
点における画素値と該閾値を比較して、2値化結果を出
力する。
【0060】すなわち、閾値計算部82には、入力グレ
ースケール画像の画素点情報が直接入力される。更に、
閾値計算部82は、特定の画素点に注目して局所領域を
定め、該局所領域内での各画素点でのグレースケール
(明度)を図6で説明したように統計的に整理し、背景
を表すと考えられる明度を持つ画素と描画領域を表すと
考えられる明度を持つ画素を出来るだけはっきりと区別
することが出来るような値に閾値を設定する。図6で
は、粗抽出について説明したので、閾値は、背景の明度
にシフトしたものを用いることを述べたが、2値化処理
を行う場合には、図6の真ん中の谷の底に当たる部分に
閾値を設定するようにする。このように設定すれば、文
字等を構成する画素を背景を構成する画素と明確に区別
することが出来るので、より認識のしやすい2値画像を
得ることが出来る。
【0061】閾値計算部82で計算された閾値は比較部
83に入力される。また、サブピクセル化処理部80で
は、サブピクセル化されたグレースケール画像の各画素
点とその画素点における明度の情報を生成し、閾値計算
部82が注目した画素点の明度に関する情報を比較部8
3に入力し、該画素点の明度が閾値と比較される。そし
て、例えば、明度が閾値より大きい画素点の明度を
“0”、明度が閾値より小さい画素点の明度を“1”と
する。そして、注目する画素点を順次変更していき、上
記処理を繰り返し行うことによって、入力グレースケー
ル画像に対応する2値画像が得られる。ここで、画素点
と呼んでいるのは、入力グレースケール画像の原画素と
サブピクセル化によって生成されたサブピクセルの両方
を含んでいる。入力グレースケール画像の原画素を示す
ときには原画素点と呼ぶことにする。従って、図8の構
成では、入力グレースケール画像の全体をサブピクセル
化することによって、画素点の数の増加した画像データ
全体に対して、2値化を行うことになる。
【0062】図9は、局所2値化処理部の詳細な第2の
構成例である。同図においては、グレースケール画像の
原画素点においてのみ、サブピクセル化後の局所閾値を
求め、補間点(サブピクセル)における局所閾値は、グ
レースケール画像の該画素点における局所閾値を補間し
て求める。すなわち、図8の構成においては、サブピク
セルもグレースケール画像の原画素点も同等に扱って、
局所2値化の為の閾値を算出していたが、同図の構成に
おいては、原画素点における閾値のみを算出し、サブピ
クセルに対応する閾値は補間処理によって求める。実際
には、図3で説明した補間処理を各原画素点における明
度について行うのではなく、各原画素点について求めら
れた閾値を明度値と同じようにして補間して求めるので
ある。
【0063】すなわち、画素点閾値計算部91では、グ
レースケール画像の原画素点においてのみ、サブピクセ
ル化後の局所閾値を求める。補間部92では、補間点
(サブピクセル)における局所閾値を、グレースケール
画像の該画素点における局所閾値を補間して求める。比
較部83は、サブピクセル化処理部80で求めた画素点
における画素値と補間部92で求めた該閾値と比較し
て、2値化結果を出力する。このような、2値化処理を
サブピクセル化処理部80で求められた画素点全体に対
して行うことによって、2値画像を得る。
【0064】画素点閾値計算部91におけるグレースケ
ール画像の原画素点における局所閾値の求めかたとして
は、下記の方法がある。 (1)グレースケール画像の原画素点を補間することに
よって求めたサブピクセルにおける画素値を用いて、グ
レースケール画像の原画素点における局所閾値を求め
る。 (2)原画素値から補間点(サブピクセル)における画
素値を求める数式を、補間点(サブピクセル)における
画素値から局所閾値を求める数式に代入して得る数式か
ら求める。 (3)原画素値から補間点(サブピクセル)における画
素値を求める数式を、補間点(サブピクセル)における
画素値から画素値の平均、2乗平均を求める数式に代入
して得る数式から、グレースケール画像の原画素点にお
けるサブピクセル化後の平均、2乗平均を求めた後、標
準偏差、分散を求め、平均、標準偏差、分散の線形結合
により求める。(1)の構成は図9に示したものであ
る。(2)の構成は、図10になる。画素点閾値計算部
は、グレースケール画像の画素値のみを使用する。
(3)は、局所2値化閾値が局所領域における画素値の
平均、標準偏差、分散の線形結合である場合である。
(3)の構成は、図11になる。分散値は、平均、2乗
平均から求められる。標準偏差は分散値から求められ
る。下記に具体式を示す。
【0065】分散=2乗平均−平均の2乗 標準偏差=√(分散) (2)、(3)において、局所領域が原画素を境界とす
る場合、局所閾値や平均などを求める数式がより単純に
なり高速処理ができる効果がある。そこで、この数式を
用いる方法もある。
【0066】また、局所領域の指定部を有し、局所領域
が原画素を境界としない場合と、局所領域が原画素を境
界とする場合とを区別して処理する構成が可能である
(図12)。局所領域の指定部は、サブピクセル化の補
間画素数と局所領域の大きさを指定データとし、局所領
域が原画素を境界とするか否かを局所領域原画素境界判
定部で自動判別する装置である。
【0067】以下に、図10〜図12の構成について説
明する。図10は、局所2値化処理部の第3の構成例を
示す図である。局所2値化処理部100は、画素点閾値
計算部101、補間部102、及び比較部83からなっ
ている。
【0068】グレースケール画像が入力されると、グレ
ースケール画像の原画素に関するデータは、サブピクセ
ル化処理部80と、画素点閾値計算部101に入力され
る。サブピクセル化処理部80は、前述の処理により、
原画素間に所定の数のサブピクセルを生成する。画素点
閾値計算部101は、原画素点における閾値を、原画素
の画素値のみから求める。閾値の求めかたは、前述した
ように、図6に示したようなデータを生成し、平均値や
分散等を用いて算出する。各原画素点について求められ
た閾値は、補間部102において、前述のように、線形
補間などの方法によってサブピクセルに対する閾値を求
めるのに使用される。
【0069】比較部83では、サブピクセル化処理部8
0によって生成された原画素値及びサブピクセルの画素
値と、画素点閾値計算部101及び補間部102によっ
て求められた各画素点に対する閾値とを比較し、画素値
を2値化する。このような処理を全ての画素点について
行うことによって、2値画像を得る。
【0070】図11は、局所2値化処理部の第4の構成
例を示す図である。局所2値化処理部110は、画素点
閾値計算部111、補間部117、及び比較部118か
らなっている。サブピクセル化処理部80の処理内容は
前述したものと同様である。入力されたグレースケール
画像のデータは、サブピクセル化処理部80に入力され
ると共に、局所2値化処理部110の画素点閾値計算部
111に入力される。画素点閾値計算部111では、注
目した画素点を中心とする局所領域内の画素点に関する
画素値を取得し、画素点平均値計算部112で、画素値
の平均を算出する。また、画素点2乗平均値計算部11
3では、画素値の2乗の平均値を局所領域内で計算す
る。画素点平均値計算部112からの画素値の平均値
と、画素点2乗平均値計算部113からの画素値の2乗
の平均値は、画素点分散値計算部114に入力されて、
画素値の分布に対する分散が求められる。算出された分
散は画素点標準偏差値計算部115に入力されて、画素
値の分布の標準偏差が求められる。
【0071】画素値の平均値、分散値、標準偏差値は線
形結合計算部116に入力されて、閾値が算出される。
閾値を算出する式は、当業者によって適宜設定されるべ
きものであるが、本実施形態においては、前述したよう
に、平均値と標準偏差の線形結合を用いており、標準偏
差をどの程度閾値の設定に影響させるかの度合いを調整
するために、標準偏差にパラメータを掛けて、閾値の調
整をするようにしている。
【0072】このようにして、ある注目する画素点に対
して閾値が求まると、これを入力グレースケール画像の
各原画素点に対して、繰り返し計算し、全ての原画素に
対して閾値を得る。これらの閾値は補間部117に送ら
れ、今度はサブピクセルに対する閾値が、補間によって
求められる。以上の処理の結果、原画素とサブピクセル
に対して、それぞれ閾値が求められたので、サブピクセ
ル化処理部80から送られてくる画素値と比較部118
において比較され、画素値を2値化して出力する。
【0073】図12は、局所2値化処理部の第5の構成
例を示す図である。本構成例においては、局所2値化処
理部120は、局所領域原画素境界判定部121、原画
素境界画素点閾値計算部122、原画素非境界画素点閾
値計算部123、補間部124、及び比較部125から
なっている。
【0074】入力されたグレースケール画像データは、
サブピクセル化処理部80に入力され、前述の処理が行
われた後、サブピクセル化後のデータが比較部125に
入力される。
【0075】また、入力されたグレースケール画像のデ
ータは、局所2値化処理部120の局所領域原画素境界
判定部121に入力される。局所領域指定部126から
は特定の原画素に対して、局所領域をどの範囲に定める
かを指定する入力装置であり、手動で指定するように構
成しても良いし、自動で指定するようにしてもよい。特
に、局所領域が、文字を構成する線に含まれてしまう場
合には、局所2値化の処理が上手く行かない場合がある
ので、局所領域は、注目する画素を中心として、文字を
構成する線の部分と背景の部分がほぼ1対1の割合で含
まれるようにするのが好ましい。
【0076】局所領域指定部126によって局所領域を
注目する画素に対してどの範囲にするか指定されると、
局所領域原画素境界判定部121は、局所領域の境界に
原画素が存在するか否かを判定する。そして、原画素が
局所領域の境界にある場合には、原画素境界画素点閾値
計算部122にデータを送って、原画素に対する閾値を
計算させる。また、原画素が局所領域の境界にない場合
には、原画素非境界画素点閾値計算部123にデータを
送って、原画素に対する閾値の計算をさせる。原画素境
界画素点閾値計算部122と原画素非境界画素点閾値計
算部123の閾値の算出方法は後述する。
【0077】原画素画素点閾値計算部122、あるい
は、原画素非境界画素点閾値計算部123によって算出
された閾値は原画素に対するものだけであるので、補間
部124に送られ、サブピクセルに対する閾値が補間処
理によって得られる。
【0078】このようにして、原画素及びサブピクセル
に対して求められた閾値は、比較部に送られ、サブピク
セル化処理部80より送られてくる画素値と比較され、
2値化されて出力される。
【0079】ここで、原画素値からの局所平均値と局所
2乗平均値の直接計算式を示す。局所平均値と局所2乗
平均値を求めることにより、局所分散値や局所標準偏差
値が基本的な算術計算で得られ、これらの線形結合を用
いることによって、例えば、前述の図2の説明で示した
式にしたがって閾値を求めることが出来る。
【0080】図13は、原画素値からの局所平均値と局
所2乗平均値の算出方法を説明する図である。最初に記
号を定義する。図13に原画素を中心とする局所領域を
図示する。簡単のため、注目する原画素の座標を(0、
0)とする。一般の原画素の座標に対する記述は、座標
を平行移動して得られる。サブピクセル化度をn(≧
1)と表し、2つの原画素間に新たなサブピクセル画素
がn−1個挿入されるものとする。局所領域は、注目す
る原画素を中心とする正方形の領域であるが、局所領域
が含む原画素のうち、注目する原画素から最も離れた原
画素からなる正方形の左上端点(すなわち、左上の原画
素の座標)を(−M、−M)とし、1≦Mと制約する。
この正方形からはみ出した局所領域の一方向のサブピク
セル化後のサブピクセル数をrとした。0≦r<nであ
る。座標(i、j)の原画素値をI(i、j)と表す。
【0081】局所領域の一辺の長さをLとすると、下式
の関係がある。 L=2(M*n+r)+1 (0≦r<n) すなわち、注目画素を中心として例えば縦方向には、M
個の原画素があり、原画素間にn−1個のサブピクセル
があり、M個目の原画素の外にはr個のサブピクセルが
ある。これが上下2方向にあるので、2(M*n+r)
となり、更に、注目画素1つを加えると、上記式にな
る。
【0082】Lは2nよりも大きい奇数である。逆に、
正数nと2nよりも大きい奇数であるLが与えられれ
ば、上式を満たすMとrが一意に定まる。すなわち、
(L−1)/2をnで割って、その商と余りを算出すれ
ば、商がMに、余りがrに対応する。
【0083】以下に、(1)局所領域の境界が原画素で
ある場合(r=0)と、(2)一般の場合に分けて、局
所平均値と局所2乗平均値の数式を示す。(1)の場合
の式の方が、(2)の場合の式よりも簡単である。下式
の様に表す。
【0084】局所平均値=E(I) 局所2乗平均値=E(I2) 以下において、Ci(i=0、1、2、3、・・・)は
各式における係数である。同じ記号であっても、式によ
って異なる。また、以下の式においては、E(I)及び
E(I2)の前にC0が掛かっている形に書かれている
が、E(I)、E(I2)を求める場合には、右辺をC0
で割れば良いことは容易に理解されるであろう。 (1)局所領域の境界が原画素である場合(r=0の場
合)
【0085】
【数1】
【0086】ただし、係数の定義は下式の通りである。
【0087】
【数2】
【0088】
【数3】
【0089】ただし、係数の定義は下式の通りである。
【0090】
【数4】
【0091】(2)一般の場合
【0092】
【数5】
【0093】ただし、係数の定義は下式の通りである。
【0094】
【数6】
【0095】
【数7】
【0096】
【数8】
【0097】ただし、係数の定義は下式の通りである。
【0098】
【数9】
【0099】なお、上記(2)ではMが1以上という場
合の式を示したが、M=0の場合の式は、(1)の場合
の式から下記(1)〜(3)のようにして得られる。
(1)Mを1と置く。(2)nをrと置き換える。
(3)Iの値を局所領域の境界値で置き換える。
【0100】上記各式で求められた画素値の局所領域に
おける平均値と2乗平均値を用いれば、分散値及び標準
偏差値が求められ、閾値を決定する式を構成することが
できる。
【0101】図14は、局所2値化処理部の第6の構成
例を示す図である。本構成は、補間点(サブピクセル)
において、グレースケール画像の原画素点における画素
値とサブピクセル化後の局所閾値の差を補間した値を求
め、該補間値の符号により、該補間点における2値画像
の値を決定する構成である。本構成においては、補間処
理が2度から1度に減るため、高速化できる効果があ
る。特に、サブピクセル化が線形補間の場合、下式から
分かるように、それぞれを補間して比較する場合と同じ
結果が得られる。 {原画素値−2値化閾値}に対するサブピクセル値=原
画素値に対するサブピクセル化値−2値化閾値のサブピ
クセル化値 すなわち、局所2値化処理部140は、画素点閾値計算
部141、差計算部142、補間部143、及び符号判
定部144からなっている。
【0102】入力されたグレースケール画像データは、
差計算部142に直接入力されると共に、画素点閾値計
算部141に入力される。画素点閾値計算部141で
は、入力グレースケール画像の原画素点に対して、局所
領域内における閾値を局所領域に含まれる原画素値のみ
から算出し、注目する原画素に対する閾値を生成する。
次に、注目する原画素値とこの閾値が差計算部142に
入力され、両者の差が取られる。そして、この差を前述
の明度(グレースケール)に対する補間処理と同様に、
補間処理してサブピクセルに対する値を得る。すると、
この値は、既に、サブピクセルの画素値と閾値との差を
求めたものとなっているので、原画素に対する差とサブ
ピクセルに対する差とを符号判定部144に入力して、
差の符号を調べる。
【0103】例えば、画素値の方が閾値よりも大きい場
合には、上記差は正となり、2値化するときは、その画
素に、例えば、“0”の値を付与する。また、画素値の
方が閾値よりも小さい場合には、上記差は負となり、2
値化するときは、その画素に、例えば、“1”の値を付
与する。このような処理を全ての画素点について行うこ
とによって、2値画像を得る。
【0104】図15は、局所2値化処理部の第7の構成
例を示す図である。本構成においては、グレースケール
画像の画素点において、サブピクセル化後の局所閾値を
求め、グレースケール画像の4画素点における画素値と
局所閾値を入力キー項目とし、4画素点の間の2値画像
を出力データとするテーブルにより、2値画像を求める
構成である。
【0105】すなわち、局所2値化処理部150は、画
素点閾値計算部151、2値画像検索部152、及びメ
モリ153からなっている。画素点閾値計算部151
は、入力されたグレースケール画像の画素値から局所領
域における閾値を各画素毎に求め、2値画像検索部15
2に与えるものである。2値画像検索部152は、画素
点閾値計算部151からの閾値と、グレースケール画像
の原画素値とを受け取り、その中から、原画素点によっ
て形成される格子の最小単位である正方形を形成する4
つの原画素を選択する。そして、その4つの原画素に関
する画素値と閾値を下に、メモリ153に記録されるテ
ーブルを参照して、2値画像を得る。メモリ153に記
録されるテーブルは、4つの原画素の画素値と閾値の組
合せに対して、2値画像データを登録しているものであ
る。2値画像検索部152は、このテーブルを入力され
たグレースケール画像の原画素で形成される単位格子
(格子を形成する最小の正方形)全てにわたって2値画
像データを取得し、これらを組み合わせることによって
全体の2値画像を形成し、出力する。
【0106】以上においては、可変解像度2値化部の構
成についてのみ説明したが、図5に示すように、まず、
グレースケール画像に対して、描画領域を粗く抽出する
粗抽出処理を行い、抽出された描画領域に対してのみ、
上記した処理を行うことにより処理時間を短縮すること
ができる。
【0107】図16、17は、本実施形態に従った処理
によるカラー画像あるいはグレースケール画像の2値化
までの処理例を示す図である。図16は、150dpi
のカラー画像の処理例を示す。
【0108】上段は、カラー画像文書であって、150
dpiの解像度を持っている。実際のカラー画像では、
文字を表す黒の周囲にいろいろな色が表れる。これをグ
レースケール画像に変換したものが、中段の画像であ
る。このグレースケール画像を従来の方法で2値化した
ものが下段の右側にある2値画像である。これによれ
ば、文字の詳細な部分がつぶれてしまい、文字認識を行
うのが困難になっているのが分かる。これに対し、下段
の左側に示したのが、本実施形態の処理を行った場合の
2値画像である。本実施形態においては、サブピクセル
を生成しているので、2値画像は、元のカラー画像の解
像度よりも実質的に高い解像度となっている。従って、
情報量は増えるが、プリンタ等で印刷するのに使用する
のではなくて、データをそのまま使って文字認識に使用
することを考えると、文字がよりはっきりと表されてお
り、より文字認識をしやすくなっている。
【0109】図17は、150dpi、100dpiの
グレースケール画像の処理例を示す。グレースケール画
像が150dpiの場合も、100dpiの場合も、従
来の装置によって2値化した場合には、文字がつぶれて
しまって、文字認識を行う場合、誤った認識結果が得ら
れる可能性が高い。これに対し、本実施形態を適用した
場合には、サブピクセルを生成して、明度に関する情報
の欠落を防いだことにより、文字がよりはっきりと認識
でき、文字認識処理を施しても、より高い認識率を期待
することができる。
【0110】図18は、本実施形態をソフトウェアで実
現する場合に必要となるハードウェア構成の説明であ
る。本実施形態では、サブピクセル化や補間処理、ある
いは、閾値の計算等をコンピュータ上で動作するプログ
ラムとして構成することが可能である。この場合、コン
ピュータに要求されるハードウェア構成としては、上記
種類の計算などを行うCPU181や、これらの処理を
するためのプログラムを実行可能なように記憶するRA
M183等がバス180によってコミュニケーション可
能なように接続されている必要がある。その他には、C
PU181の動作に基本的なBIOS等を記憶しておく
ROM182や、当該プログラムを保存しておく記憶装
置189等を設ける。記憶装置189は、例えば、ハー
ドディスクなどである。その他に、当該プログラムをフ
ロッピーディスクやCD−ROM等の可搬記録媒体18
8に記録して使用する場合には、記録媒体読取装置18
7が必要となる。記憶装置189や可搬記録媒体188
から読み出されたプログラムはRAM183にCPU1
81が実行可能なように展開されて記憶される。また、
装置を操作するユーザの命令をCPU181に伝達した
り、CPU181の処理結果をユーザに見せるため、モ
ニタやキーボード、マウス等からなる入出力装置186
が設けられる。
【0111】更に、当該プログラムは、必ずしもユーザ
の使用するコンピュータ内に存在している必要はなく、
通信インタフェース184を介して、プログラム提供者
185の有するデータベースからダウンロードして、必
要なときにのみ使用するようにしてもよい。また、プロ
グラム提供者185とLAN等で接続しておき、ネット
ワーク上でプログラムを実行させて、命令の入力と結果
の表示のみをユーザの有するコンピュータ行わせるよう
にしてもよい。
【0112】
【発明の効果】以上説明したように、本発明によれば、
高精度かつ高速にカラー文書画像、あるいは、グレース
ケール画像を2値化できるので、高精度かつ高速に認識
できる。
【図面の簡単な説明】
【図1】本実施形態のカラー文書画像認識装置の原理構
成である。
【図2】可変解像度2値化部の構成例を示した図であ
る。
【図3】サブピクセル化処理の原理を説明する図であ
る。
【図4】入力画像であるグレースケール画像の解像度に
対して、どの程度のサブピクセルを生成するかを指定す
るテーブルの例である。
【図5】可変解像度2値化部の別の構成例を示した図で
ある。
【図6】粗抽出処理の場合に使用される大域閾値の設定
の仕方を説明する図である。
【図7】可変解像度2値化部の更に別の構成例を示す図
である。
【図8】局所2値化処理部のより詳細な第1の構成例で
ある。
【図9】局所2値化処理部の詳細な第2の構成例であ
る。
【図10】局所2値化処理部の第3の構成例を示す図で
ある。
【図11】局所2値化処理部の第4の構成例を示す図で
ある。
【図12】局所2値化処理部の第5の構成例を示す図で
ある。
【図13】原画素値からの局所平均値と局所2乗平均値
の算出方法を説明する図である。
【図14】局所2値化処理部の第6の構成例を示す図で
ある。
【図15】局所2値化処理部の第7の構成例を示す図で
ある。
【図16】本実施形態に従った処理によるカラー画像あ
るいはグレースケール画像の2値化までの処理例を示す
図(その1)である。
【図17】本実施形態に従った処理によるカラー画像あ
るいはグレースケール画像の2値化までの処理例を示す
図(その2)である。
【図18】本実施形態をソフトウェアで実現する場合に
必要となるハードウェア構成の説明である。
【図19】従来のカラー文書画像認識装置の構成とカラ
ーテキスト画像を拡大した様子を示す図である。
【符号の説明】
10 文書画像入力部 11 明度画像抽出部 12 可変解像度2値化部 13 2値画像認識部 14 認識結果出力部 20、22、70、74、80 サブピクセル化処
理部 21 一定値閾値2値化部 23、51、72、75、81、90、100、11
0、120、140、150 局所2値化処理部 50、71、73 描画領域粗抽出部 82 閾値計算部 83、118、125 比較部 91、101、111、141、151 画素点閾
値計算部 92、102、117、124、143 補間部 112 画素点平均値計算部 113 画素点2乗平均値計算部 114 画素点分散値計算部 115 画素点標準偏差値計算部 116 線形結合計算部 121 局所領域原画素境界判定部 122 原画素境界画素点閾値計算部 123 原画素非境界画素点閾値計算部 142 差計算部 144 符号判定部 152 2値画像検索部 153 メモリ 170 文書画像入力部 171 明度画像抽出部 172 一定閾値2値化部 173 2値画像認識部 174 認識結果出力部 180 バス 181 CPU 182 ROM 183 RAM 184 通信インタフェース 185 プログラム提供者 186 入出力装置 187 記録媒体読み取り装置 188 可搬記録媒体 189 記憶装置

Claims (57)

    【特許請求の範囲】
  1. 【請求項1】入力文書画像が、カラー画像であればグレ
    ースケール画像に変換し、グレースケール画像であれ
    ば、新たにグレースケール画像を出力する画像変換手段
    と、 該グレースケール画像の解像度に応じた、より解像度の
    高い2値画像に変換する可変解像度2値化手段と、 該2値化された画像を認識する手段と、を備えることを
    特徴とする装置。
  2. 【請求項2】前記認識手段は、変換もしくは入力された
    2値画像を認識して電子コード化することを特徴とする
    請求項1に記載の装置。
  3. 【請求項3】更に、グレースケール画像の画素値に対す
    る大域閾値により、描画領域を粗く抽出する大局処理を
    行う描画領域粗抽出手段を備え、 該認識手段は、該描画領域粗抽出手段によって抽出され
    た領域の2値画像を認識することを特徴とする請求項1
    に記載の装置。
  4. 【請求項4】大域閾値は、画素値の平均、標準偏差、分
    散の線形和を用いることを特徴とする請求項3に記載の
    装置。
  5. 【請求項5】前記可変解像度2値化手段は、グレースケ
    ール画像の画素値を補間して画像の画素数を増加させる
    サブピクセル化処理を行い、特定の画素を中心とする局
    所領域内で閾値を設定し、該局所閾値を用いて2値画像
    を求めることを特徴とする請求項1に記載の装置。
  6. 【請求項6】該サブピクセル化処理は該グレースケール
    画像の原画素値の線形補間によって行うことを特徴とす
    る請求項5に記載の装置。
  7. 【請求項7】該可変解像度2値化手段は、画素を含む局
    所領域における画素値の分布から求めた局所閾値によ
    り、該画素値を2値化して2値画像を求め、局所閾値
    は、画素値の平均、標準偏差、分散の線形和を用いるこ
    とを特徴とする請求項5に記載の装置。
  8. 【請求項8】更に、グレースケール画像の画素値に対す
    る大域閾値により、描画領域を粗く抽出する大局処理を
    行う描画領域粗抽出手段を備え、 前記可変解像度2値化手段は、該大局処理によって粗抽
    出された描画領域に対し、グレースケール画像の画素値
    を補間して画像の画素数を増加させるサブピクセル化処
    理を行い、該粗抽出された領域内の画素毎に、局所閾値
    を用いた局所2値化処理を行うことを特徴とする請求項
    5に記載の装置。
  9. 【請求項9】前記可変解像度2値化手段は、入力された
    グレースケール画像全体に対しサブピクセル化を行い、 該描画領域粗抽出手段は、該サブピクセル化されたグレ
    ースケール画像データに対して、描画領域を粗抽出する
    ことを特徴とする請求項3に記載の装置。
  10. 【請求項10】サブピクセル化後の画像点における局所
    閾値を、サブピクセル化のサブピクセルにおける画素値
    を原画素値から求める数式を、局所閾値をサブピクセル
    における画素値から求める数式に代入して得る数式か
    ら、求めることを特徴とする請求項5に記載の装置。
  11. 【請求項11】グレースケール画像の画素点において、
    サブピクセル化後の局所閾値を求め、サブピクセルにお
    ける局所閾値は、グレースケール画像の該画素点におけ
    る局所閾値を補間して求めることを特徴とする請求項5
    に記載の装置。
  12. 【請求項12】グレースケール画像の画素点をサブピク
    セル化したサブピクセルにおける画素値を用いて、グレ
    ースケール画像の画素点における局所閾値を求めること
    を特徴とする請求項11に記載の装置。
  13. 【請求項13】グレースケール画像の画素点におけるサ
    ブピクセル化後の局所閾値は、原画素値からサブピクセ
    ルにおける画素値を求める数式を、サブピクセルにおけ
    る画素値から局所閾値を求める数式に代入して得る数式
    から、求めることを特徴とする請求項11に記載の装
    置。
  14. 【請求項14】グレースケール画像の原画素点における
    サブピクセル化後の局所閾値は、原画素値からサブピク
    セルにおける画素値を求める数式を、サブピクセルにお
    ける画素値から画素値の平均、2乗平均を求める数式に
    代入して得る数式から、グレースケール画像の画素点に
    おけるサブピクセル化後の平均、2乗平均を求めた後、
    標準偏差、分散を求め、平均、標準偏差、分散の線形結
    合により求めることを特徴とする請求項5に記載の装
    置。
  15. 【請求項15】局所閾値を求める数式は、原画素を境界
    とする局所領域における局所閾値をサブピクセルにおけ
    る画素値から求める数式であることを特徴とする請求項
    13に記載の装置。
  16. 【請求項16】局所領域は原画素を境界とし、グレース
    ケール画像の画素点におけるサブピクセル化後の局所閾
    値は、原画素値からサブピクセルにおける画素値を求め
    る数式を、サブピクセルにおける画素値から画素値の平
    均、2乗平均を求める数式に代入して得る数式から、グ
    レースケール画像の画素点におけるサブピクセル化後の
    平均、2乗平均を求めた後、標準偏差、分散を求め、平
    均、標準偏差、分散の線形結合により求めることを特徴
    とする請求項5に記載の装置。
  17. 【請求項17】更に、局所領域の範囲を指定する指定手
    段を有し、 サブピクセル化のサブピクセルの画素数と局所領域の大
    きさを指定データとし、局所領域が原画素を境界とする
    か否かを自動判別することを特徴とする請求項5に記載
    の装置。
  18. 【請求項18】サブピクセルにおいて、グレースケール
    画像の画素点における画素値とサブピクセル化後の局所
    閾値の差を補間した値を求め、該補間値の符号により、
    該サブピクセルにおける2値画像の値を決定することを
    特徴とする請求項11に記載の装置。
  19. 【請求項19】グレースケール画像の画素点において、
    サブピクセル化後の局所閾値を求め、グレースケール画
    像の4画素点における画素値と局所閾値を入力キー項目
    とし、4画素点の間の2値画像を出力データとするテー
    ブルを更に備え、該テーブルを使用して2値画像を求め
    ることを特徴とする請求項5に記載の装置。
  20. 【請求項20】(a)入力文書画像が、カラー画像であ
    ればグレースケール画像に変換し、グレースケール画像
    であれば、新たにグレースケール画像を出力するステッ
    プと、 (b)該グレースケール画像の解像度に応じた、より解
    像度の高い2値画像に変換するステップと、 (c)該2値化された画像を認識するステップと、 を備えることを特徴とする方法。
  21. 【請求項21】前記ステップ(c)は、変換もしくは入
    力された2値画像を認識して電子コード化することを特
    徴とする請求項20に記載の方法。
  22. 【請求項22】更に、(d)グレースケール画像の画素
    値に対する大域閾値により、描画領域を粗く抽出する大
    局処理を行うステップを備え、 該ステップ(c)は、該ステップ(d)によって抽出さ
    れた領域の2値画像を認識することを特徴とする請求項
    20に記載の方法。
  23. 【請求項23】大域閾値は、画素値の平均、標準偏差、
    分散の線形和を用いることを特徴とする請求項22に記
    載の方法。
  24. 【請求項24】前記ステップ(b)は、グレースケール
    画像の画素値を補間して画像の画素数を増加させるサブ
    ピクセル化処理を行い、特定の画素を中心とする局所領
    域内で閾値を求め、該局所閾値を用いて2値画像を求め
    ることを特徴とする請求項20に記載の方法。
  25. 【請求項25】該サブピクセル化処理は該グレースケー
    ル画像の原画素値の線形補間によって行うことを特徴と
    する請求項24に記載の方法。
  26. 【請求項26】該ステップ(b)は、画素を含む局所領
    域における画素値の分布から求めた局所閾値により、該
    画素値を2値化して2値画像を求め、局所閾値は、画素
    値の平均、標準偏差、分散の線形和を用いることを特徴
    とする請求項20に記載の方法。
  27. 【請求項27】更に、(d)グレースケール画像の画素
    値に対する大域閾値により、描画領域を粗く抽出する大
    局処理を行うステップを備え、 前記ステップ(b)は、該大局処理によって粗抽出され
    た描画領域に対し、グレースケール画像の画素値を補間
    して画像の画素数を増加させるサブピクセル化処理を行
    い、該粗抽出された領域内の画素毎に、局所閾値を用い
    た局所2値化処理を行うことを特徴とする請求項24に
    記載の方法。
  28. 【請求項28】前記ステップ(b)は、入力されたグレ
    ースケール画像全体に対しサブピクセル化を行い、 前記スイッチ(d)は、該サブピクセル化されたグレー
    スケール画像データに対して、描画領域を粗抽出するこ
    とを特徴とする請求項22に記載の方法。
  29. 【請求項29】サブピクセル化後の画像点における局所
    閾値を、サブピクセル化のサブピクセルにおける画素値
    を原画素値から求める数式を、局所閾値をサブピクセル
    における画素値から求める数式に代入して得る数式か
    ら、求めることを特徴とする請求項24に記載の方法。
  30. 【請求項30】グレースケール画像の画素点において、
    サブピクセル化後の局所閾値を求め、サブピクセルにお
    ける局所閾値は、グレースケール画像の該画素点におけ
    る局所閾値を補間して求めることを特徴とする請求項2
    4に記載の方法。
  31. 【請求項31】グレースケール画像の画素点をサブピク
    セル化したサブピクセルにおける画素値を用いて、グレ
    ースケール画像の画素点における局所閾値を求めること
    を特徴とする請求項30に記載の方法。
  32. 【請求項32】グレースケール画像の画素点におけるサ
    ブピクセル化後の局所閾値は、原画素値からサブピクセ
    ルにおける画素値を求める数式を、サブピクセルにおけ
    る画素値から局所閾値を求める数式に代入して得る数式
    から、求めることを特徴とする請求項30に記載の方
    法。
  33. 【請求項33】グレースケール画像の原画素点における
    サブピクセル化後の局所閾値は、原画素値からサブピク
    セルにおける画素値を求める数式を、サブピクセルにお
    ける画素値から画素値の平均、2乗平均を求める数式に
    代入して得る数式から、グレースケール画像の画素点に
    おけるサブピクセル化後の平均、2乗平均を求めた後、
    標準偏差、分散を求め、平均、標準偏差、分散の線形結
    合により求めることを特徴とする請求項24に記載の方
    法。
  34. 【請求項34】局所閾値を求める数式は、原画素を境界
    とする局所領域における局所閾値をサブピクセルにおけ
    る画素値から求める数式であることを特徴とする請求項
    32に記載の方法。
  35. 【請求項35】局所領域は原画素を境界とし、グレース
    ケール画像の画素点におけるサブピクセル化後の局所閾
    値は、原画素値からサブピクセルにおける画素値を求め
    る数式を、サブピクセルにおける画素値から画素値の平
    均、2乗平均を求める数式に代入して得る数式から、グ
    レースケール画像の画素点におけるサブピクセル化後の
    平均、2乗平均を求めた後、標準偏差、分散を求め、平
    均、標準偏差、分散の線形結合により求めることを特徴
    とする請求項24に記載の方法。
  36. 【請求項36】更に、(e)局所領域の範囲を指定する
    ステップを有し、 サブピクセル化のサブピクセルの画素数と局所領域の大
    きさを指定データとし、局所領域が原画素を境界とする
    か否かを自動判別することを特徴とする請求項24に記
    載の方法。
  37. 【請求項37】サブピクセルにおいて、グレースケール
    画像の画素点における画素値とサブピクセル化後の局所
    閾値の差を補間した値を求め、該補間値の符号により、
    該サブピクセルにおける2値画像の値を決定することを
    特徴とする請求項30に記載の方法。
  38. 【請求項38】グレースケール画像の画素点において、
    サブピクセル化後の局所閾値を求め、グレースケール画
    像の4画素点における画素値と局所閾値を入力キー項目
    とし、4画素点の間の2値画像を出力データとするテー
    ブルを更に備え、該テーブルを使用して2値画像を求め
    ることを特徴とする請求項24に記載の方法。
  39. 【請求項39】コンピュータに、(a)入力文書画像
    が、カラー画像であればグレースケール画像に変換し、
    グレースケール画像であれば、新たにグレースケール画
    像を出力するステップと、 (b)該グレースケール画像の解像度に応じた、より解
    像度の高い2値画像に変換するステップと、 (c)該2値化された画像を認識するステップと、 を備える処理を実現させることを特徴とするコンピュー
    タ読み取り可能な記録媒体。
  40. 【請求項40】前記ステップ(c)は、変換もしくは入
    力された2値画像を認識して電子コード化する処理をコ
    ンピュータに実現させることを特徴とする請求項39に
    記載の記録媒体。
  41. 【請求項41】更に、(d)グレースケール画像の画素
    値に対する大域閾値により、描画領域を粗く抽出する大
    局処理を行うステップを備え、 該ステップ(c)は、該ステップ(d)によって抽出さ
    れた領域の2値画像を認識する処理をコンピュータに実
    現させることを特徴とする請求項39に記載の記録媒
    体。
  42. 【請求項42】大域閾値は、画素値の平均、標準偏差、
    分散の線形和を用いることを特徴とする請求項41に記
    載の記録媒体。
  43. 【請求項43】前記ステップ(b)は、グレースケール
    画像の画素値を補間して画像の画素数を増加させるサブ
    ピクセル化処理を行い、特定の画素を中心とする局所領
    域内での閾値を求め、該局所閾値を用いて2値画像を求
    める処理をコンピュータに実現させることを特徴とする
    請求項39に記載の記録媒体。
  44. 【請求項44】該サブピクセル化処理は該グレースケー
    ル画像の原画素値の線形補間によって行うことを特徴と
    する請求項43に記載の記録媒体。
  45. 【請求項45】該ステップ(b)は、画素を含む局所領
    域における画素値の分布から求めた局所閾値により、該
    画素値を2値化して2値画像を求め、局所閾値は、画素
    値の平均、標準偏差、分散の線形和を用いることを特徴
    とする請求項39に記載の記録媒体。
  46. 【請求項46】更に、(d)グレースケール画像の画素
    値に対する大域閾値により、描画領域を粗く抽出する大
    局処理を行うステップを備え、 前記ステップ(b)は、該大局処理によって粗抽出され
    た描画領域に対し、グレースケール画像の画素値を補間
    して画像の画素数を増加させるサブピクセル化処理を行
    い、該粗抽出された領域内の画素毎に、局所閾値を用い
    た局所2値化処理をコンピュータに実現させることを特
    徴とする請求項43に記載の記録媒体。
  47. 【請求項47】前記ステップ(b)は、入力されたグレ
    ースケール画像全体に対しサブピクセル化を行い、 前記スイッチ(d)は、該サブピクセル化されたグレー
    スケール画像データに対して、描画領域を粗抽出する処
    理をコンピュータに実現させることを特徴とする請求項
    41に記載の記録媒体。
  48. 【請求項48】サブピクセル化後の画像点における局所
    閾値を、サブピクセル化のサブピクセルにおける画素値
    を原画素値から求める数式を、局所閾値をサブピクセル
    における画素値から求める数式に代入して得る数式か
    ら、求めることを特徴とする請求項43に記載の記録媒
    体。
  49. 【請求項49】グレースケール画像の画素点において、
    サブピクセル化後の局所閾値を求め、サブピクセルにお
    ける局所閾値は、グレースケール画像の該画素点におけ
    る局所閾値を補間して求めることを特徴とする請求項4
    3に記載の記録媒体。
  50. 【請求項50】グレースケール画像の画素点をサブピク
    セル化したサブピクセルにおける画素値を用いて、グレ
    ースケール画像の画素点における局所閾値を求めること
    を特徴とする請求項49に記載の記録媒体。
  51. 【請求項51】グレースケール画像の画素点におけるサ
    ブピクセル化後の局所閾値は、原画素値からサブピクセ
    ルにおける画素値を求める数式を、サブピクセルにおけ
    る画素値から局所閾値を求める数式に代入して得る数式
    から、求めることを特徴とする請求項49に記載の記録
    媒体。
  52. 【請求項52】グレースケール画像の原画素点における
    サブピクセル化後の局所閾値は、原画素値からサブピク
    セルにおける画素値を求める数式を、サブピクセルにお
    ける画素値から画素値の平均、2乗平均を求める数式に
    代入して得る数式から、グレースケール画像の画素点に
    おけるサブピクセル化後の平均、2乗平均を求めた後、
    標準偏差、分散を求め、平均、標準偏差、分散の線形結
    合により求めることを特徴とする請求項43に記載の記
    録媒体。
  53. 【請求項53】局所閾値を求める数式は、原画素を境界
    とする局所領域における局所閾値をサブピクセルにおけ
    る画素値から求める数式であることを特徴とする請求項
    51に記載の記録媒体。
  54. 【請求項54】局所領域は原画素を境界とし、グレース
    ケール画像の画素点におけるサブピクセル化後の局所閾
    値は、原画素値からサブピクセルにおける画素値を求め
    る数式を、サブピクセルにおける画素値から画素値の平
    均、2乗平均を求める数式に代入して得る数式から、グ
    レースケール画像の画素点におけるサブピクセル化後の
    平均、2乗平均を求めた後、標準偏差、分散を求め、平
    均、標準偏差、分散の線形結合により求めることを特徴
    とする請求項43に記載の記録媒体。
  55. 【請求項55】更に、(e)局所領域の範囲を指定する
    ステップを有し、サブピクセル化のサブピクセルの画素
    数と局所領域の大きさを指定データとし、局所領域が原
    画素を境界とするか否かを自動判別する処理をコンピュ
    ータに実現させることを特徴とする請求項43に記載の
    記録媒体。
  56. 【請求項56】サブピクセルにおいて、グレースケール
    画像の画素点における画素値とサブピクセル化後の局所
    閾値の差を補間した値を求め、該補間値の符号により、
    該サブピクセルにおける2値画像の値を決定することを
    特徴とする請求項49に記載の記録媒体。
  57. 【請求項57】グレースケール画像の画素点において、
    サブピクセル化後の局所閾値を求め、グレースケール画
    像の4画素点における画素値と局所閾値を入力キー項目
    とし、4画素点の間の2値画像を出力データとするテー
    ブルを更に備え、該テーブルを使用して2値画像を求め
    ることを特徴とする請求項43に記載の記録媒体。
JP14532298A 1998-05-27 1998-05-27 文書画像認識装置、その方法、及び記録媒体 Expired - Fee Related JP3345350B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP14532298A JP3345350B2 (ja) 1998-05-27 1998-05-27 文書画像認識装置、その方法、及び記録媒体
US09/216,712 US6347156B1 (en) 1998-05-27 1998-12-21 Device, method and storage medium for recognizing a document image

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP14532298A JP3345350B2 (ja) 1998-05-27 1998-05-27 文書画像認識装置、その方法、及び記録媒体

Publications (2)

Publication Number Publication Date
JPH11338976A true JPH11338976A (ja) 1999-12-10
JP3345350B2 JP3345350B2 (ja) 2002-11-18

Family

ID=15382488

Family Applications (1)

Application Number Title Priority Date Filing Date
JP14532298A Expired - Fee Related JP3345350B2 (ja) 1998-05-27 1998-05-27 文書画像認識装置、その方法、及び記録媒体

Country Status (2)

Country Link
US (1) US6347156B1 (ja)
JP (1) JP3345350B2 (ja)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001351068A (ja) * 2000-04-03 2001-12-21 Ricoh Co Ltd 文字認識装置、文字認識方法、画像処理装置、画像処理方法、並びにコンピュータ読み取り可能な記録媒体
JP2001357380A (ja) * 2000-06-13 2001-12-26 Pasuko:Kk 画像処理による森林地域の評価方法及びこの評価に関するプログラムを記憶した記憶媒体
WO2002063868A3 (en) * 2001-02-05 2002-10-03 Hewlett Packard Co System and method for scaling and enhancing color text images
JP2003016444A (ja) * 2001-07-03 2003-01-17 Nec Corp パターン認識装置とそのパターン認識方法、及びパターン認識プログラム
US7508987B2 (en) 2003-08-08 2009-03-24 Ricoh Company, Ltd. Method, apparatus, system, and program for image processing capable of recognizing, reproducing, and enhancing an image, and a medium storing the program
CN101986711A (zh) * 2010-11-24 2011-03-16 清华大学 一种1/8像素精度插值方法及插值装置
JP2013058966A (ja) * 2011-09-09 2013-03-28 Fuji Xerox Co Ltd 画像処理装置および画像処理プログラム
KR20150107186A (ko) * 2014-03-13 2015-09-23 (주)에이텍티앤 신분증인식기의 영상 전처리장치

Families Citing this family (38)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3748172B2 (ja) * 1998-12-09 2006-02-22 富士通株式会社 画像処理装置
JP4046465B2 (ja) * 1999-09-17 2008-02-13 株式会社リコー 画像処理装置、画像処理方法、及び画像処理システム
JP2001184453A (ja) * 1999-12-22 2001-07-06 Hitachi Ltd 帳票処理システムおよび帳票ファイリングシステム
AU3047801A (en) * 2000-02-03 2001-08-14 Alst Technical Excellence Center Image resolution improvement using a color mosaic sensor
US7123768B2 (en) * 2000-04-26 2006-10-17 Minolta Co., Ltd. Apparatus and method for detecting a pattern
US20020016750A1 (en) * 2000-06-20 2002-02-07 Olivier Attia System and method for scan-based input, storage and retrieval of information over an interactive communication network
US6677941B2 (en) * 2000-08-05 2004-01-13 American Gnc Corporation Three-dimensional relative positioning and tracking using LDRI
US6792142B1 (en) * 2001-01-16 2004-09-14 Micron Technology, Inc. Image sensing system with histogram modification
JP4271878B2 (ja) * 2001-03-22 2009-06-03 株式会社日立製作所 映像中の文字検索方法及び装置並びに文字検索処理プログラム
CN1213592C (zh) * 2001-07-31 2005-08-03 佳能株式会社 采用自适应二值化的图象处理方法和设备
US7162098B1 (en) 2002-09-20 2007-01-09 Lockheed Martin Corporation System and method for increasing temporal and spatial capacity of systems that amplitude quantize data prior to processing
JP4112968B2 (ja) 2002-12-26 2008-07-02 富士通株式会社 ビデオテキスト処理装置
US7156311B2 (en) * 2003-07-16 2007-01-02 Scanbuy, Inc. System and method for decoding and analyzing barcodes using a mobile device
US7242816B2 (en) * 2003-08-11 2007-07-10 Scanbuy, Inc. Group average filter algorithm for digital image processing
US7760943B2 (en) * 2003-10-02 2010-07-20 Hewlett-Packard Development Company, L.P. Method to speed-up Retinex-type algorithms
ES2353017T3 (es) * 2003-12-04 2011-02-24 Scanbuy, Inc. Algoritmo basado en secciones para la mejora de imágenes.
US7387250B2 (en) * 2003-12-04 2008-06-17 Scanbuy, Inc. System and method for on the spot purchasing by scanning barcodes from screens with a mobile device
US7382915B2 (en) * 2004-03-16 2008-06-03 Xerox Corporation Color to grayscale conversion method and apparatus
US7296747B2 (en) * 2004-04-20 2007-11-20 Michael Rohs Visual code system for camera-equipped mobile devices and applications thereof
US20050246196A1 (en) * 2004-04-28 2005-11-03 Didier Frantz Real-time behavior monitoring system
US7309015B2 (en) * 2004-07-14 2007-12-18 Scanbuy, Inc. Mobile device gateway providing access to instant information
JP2006053690A (ja) 2004-08-10 2006-02-23 Ricoh Co Ltd 画像処理装置、画像処理方法、画像処理プログラムおよび記録媒体
GB0422930D0 (en) * 2004-10-15 2004-11-17 Chui Kui M Image processing
KR100670003B1 (ko) * 2004-12-28 2007-01-19 삼성전자주식회사 적응형 문턱치를 이용한 영상의 평탄 영역 검출장치 및 그방법
US20070153024A1 (en) * 2005-12-29 2007-07-05 Samsung Electronics Co., Ltd. Multi-mode pixelated displays
US8016187B2 (en) * 2006-02-21 2011-09-13 Scanbury, Inc. Mobile payment system using barcode capture
US8150163B2 (en) * 2006-04-12 2012-04-03 Scanbuy, Inc. System and method for recovering image detail from multiple image frames in real-time
WO2009021996A2 (en) * 2007-08-15 2009-02-19 I.R.I.S. S.A. Method for fast up-scaling of color images and method for interpretation of digitally acquired documents
JP5159226B2 (ja) * 2007-09-25 2013-03-06 株式会社東芝 画像データ処理システム
WO2009089451A1 (en) * 2008-01-10 2009-07-16 Copanion, Inc. System for optimal document scanning
CN101826159B (zh) * 2009-03-07 2013-01-09 鸿富锦精密工业(深圳)有限公司 实现灰度图像分区二值化的方法和数据处理设备
JP5992567B1 (ja) * 2015-03-20 2016-09-14 株式会社Pfu 日付識別装置
JP6631360B2 (ja) * 2016-03-29 2020-01-15 ブラザー工業株式会社 画像処理装置および画像処理方法
CN105913032A (zh) * 2016-04-15 2016-08-31 天地(常州)自动化股份有限公司 一种矿用皮带工作状态检测方法及系统
CN106341926B (zh) * 2016-10-08 2017-10-31 南华大学 基于图像识别控制照明的led数字驱动电源及其控制方法
US9986128B1 (en) * 2017-03-10 2018-05-29 Kabushiki Kaisha Toshiba Image forming apparatus and image forming method facilitating processing color
CN110245667A (zh) * 2018-03-08 2019-09-17 中华映管股份有限公司 物件辨识方法及其装置
CN111369923B (zh) * 2020-02-26 2023-09-29 歌尔光学科技有限公司 显示屏幕异常点检测方法、检测设备和可读存储介质

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01243668A (ja) 1988-03-24 1989-09-28 Toshiba Corp 画像処理装置
JPH029268A (ja) 1988-06-27 1990-01-12 Canon Inc 画像処理装置
US5128748A (en) * 1989-02-15 1992-07-07 Hitachi, Ltd. Image processing system and apparatus for processing color documents
KR100188439B1 (ko) * 1990-11-28 1999-06-01 윤종용 문서화상데이터의 해상도 및 계조변환장치
EP0645736B1 (en) * 1993-09-27 2003-02-05 Canon Kabushiki Kaisha Image processing apparatus
CA2144793C (en) * 1994-04-07 1999-01-12 Lawrence Patrick O'gorman Method of thresholding document images
DE69519323T2 (de) * 1994-04-15 2001-04-12 Canon Kk System zur Seitensegmentierung und Zeichenerkennung
US5583659A (en) * 1994-11-10 1996-12-10 Eastman Kodak Company Multi-windowing technique for thresholding an image using local image properties
US5850466A (en) * 1995-02-22 1998-12-15 Cognex Corporation Golden template comparison for rotated and/or scaled images
US5742703A (en) * 1995-10-11 1998-04-21 Xerox Corporation Method and apparatus for the resolution enhancement of gray-scale images that include text and line art
US6055336A (en) * 1996-11-18 2000-04-25 Canon Kabushiki Kaisha Image processing system which converts multi-value image data into binary image data

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001351068A (ja) * 2000-04-03 2001-12-21 Ricoh Co Ltd 文字認識装置、文字認識方法、画像処理装置、画像処理方法、並びにコンピュータ読み取り可能な記録媒体
JP2001357380A (ja) * 2000-06-13 2001-12-26 Pasuko:Kk 画像処理による森林地域の評価方法及びこの評価に関するプログラムを記憶した記憶媒体
JP4484183B2 (ja) * 2000-06-13 2010-06-16 株式会社パスコ 森林情報処理システム
WO2002063868A3 (en) * 2001-02-05 2002-10-03 Hewlett Packard Co System and method for scaling and enhancing color text images
JP2003016444A (ja) * 2001-07-03 2003-01-17 Nec Corp パターン認識装置とそのパターン認識方法、及びパターン認識プログラム
US7508987B2 (en) 2003-08-08 2009-03-24 Ricoh Company, Ltd. Method, apparatus, system, and program for image processing capable of recognizing, reproducing, and enhancing an image, and a medium storing the program
CN101986711A (zh) * 2010-11-24 2011-03-16 清华大学 一种1/8像素精度插值方法及插值装置
JP2013058966A (ja) * 2011-09-09 2013-03-28 Fuji Xerox Co Ltd 画像処理装置および画像処理プログラム
KR20150107186A (ko) * 2014-03-13 2015-09-23 (주)에이텍티앤 신분증인식기의 영상 전처리장치

Also Published As

Publication number Publication date
JP3345350B2 (ja) 2002-11-18
US6347156B1 (en) 2002-02-12

Similar Documents

Publication Publication Date Title
JP3345350B2 (ja) 文書画像認識装置、その方法、及び記録媒体
US7460710B2 (en) Converting digital images containing text to token-based files for rendering
KR100938099B1 (ko) 클러스터링 시스템, 클러스터링 방법, 문서 인코딩 시스템 및 클러스터링 방법을 수행하기 위한 컴퓨터 판독가능 매체
JP4859025B2 (ja) 類似画像検索装置、類似画像検索処理方法、プログラム及び情報記録媒体
WO2018223994A1 (zh) 中文打印字符图像合成方法及装置
US10867171B1 (en) Systems and methods for machine learning based content extraction from document images
JP6139396B2 (ja) 文書を表す二値画像を圧縮する方法及びプログラム
US7965892B2 (en) Image processing apparatus, control method thereof, and program
US10477063B2 (en) Character detection and binarization
US20080199081A1 (en) Image processing apparatus, image processing method and computer-readable medium
JP2006260274A (ja) 文字方向識別装置、画像形成装置、プログラム、記憶媒体および文字方向識別方法
US8086040B2 (en) Text representation method and apparatus
JP6743092B2 (ja) 画像処理装置、画像処理の制御方法、及びプログラム
JP4582204B2 (ja) 画像処理装置、画像変換方法、およびコンピュータプログラム
US6055336A (en) Image processing system which converts multi-value image data into binary image data
JP2000181992A (ja) カラー文書画像認識装置
JP5893379B2 (ja) 画像圧縮装置、画像圧縮方法、コンピュータプログラム
US20100329551A1 (en) Image processing apparatus and image processing method
JP2010056827A (ja) 画像処理装置および画像処理プログラム
US6360006B1 (en) Color block selection
JP4582200B2 (ja) 画像処理装置、画像変換方法、およびコンピュータプログラム
JP4605260B2 (ja) ベクタ画像生成方法、画像処理装置、およびコンピュータプログラム
JP2011013900A (ja) 画像処理装置、画像処理方法、プログラム、及び記憶媒体
US8270722B2 (en) Image processing with preferential vectorization of character and graphic regions
JP2004199622A (ja) 画像処理装置、画像処理方法、記録媒体およびプログラム

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20020820

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080830

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090830

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090830

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100830

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110830

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120830

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120830

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130830

Year of fee payment: 11

LAPS Cancellation because of no payment of annual fees