JP2005071088A - 画像処理装置、画像処理方法ならびにプログラム、記憶媒体 - Google Patents

画像処理装置、画像処理方法ならびにプログラム、記憶媒体 Download PDF

Info

Publication number
JP2005071088A
JP2005071088A JP2003300049A JP2003300049A JP2005071088A JP 2005071088 A JP2005071088 A JP 2005071088A JP 2003300049 A JP2003300049 A JP 2003300049A JP 2003300049 A JP2003300049 A JP 2003300049A JP 2005071088 A JP2005071088 A JP 2005071088A
Authority
JP
Japan
Prior art keywords
image
character
binary image
output
edge
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2003300049A
Other languages
English (en)
Other versions
JP4250483B2 (ja
Inventor
Tetsuomi Tanaka
哲臣 田中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2003300049A priority Critical patent/JP4250483B2/ja
Priority to EP04254752A priority patent/EP1510963A3/en
Priority to CN200410057142A priority patent/CN100585621C/zh
Priority to US10/923,806 priority patent/US7437002B2/en
Publication of JP2005071088A publication Critical patent/JP2005071088A/ja
Application granted granted Critical
Publication of JP4250483B2 publication Critical patent/JP4250483B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/16Image preprocessing
    • G06V30/162Quantising the image signal
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Input (AREA)
  • Facsimile Image Signal Circuits (AREA)
  • Image Processing (AREA)
  • Image Analysis (AREA)

Abstract

【課題】 反転文字が含まれた画像や多値画像が入力された場合であっても、文字認識処理を行うのに適した画像を出力する。
【解決手段】 多値画像401を処理する画像処理装置であって、多値画像401のエッジを抽出してエッジ画像404を生成する手段(402)と、多値画像401から二値画像405を生成する手段(403)と、生成されたエッジ画像404および二値画像405に基づいて文字領域を抽出し(406)、該文字領域について、多値画像401を二値化し、出力二値画像を生成する部分二値化手段(410、411)と、部分二値化手段(410、411)により生成された出力二値画像412を出力する手段と、を備え、部分二値化手段(410、411)は、エッジ画像404から抽出された文字領域の文字が反転文字である場合、該文字を反転二値化して出力二値画像412を生成することを特徴とする。
【選択図】 図4

Description

本発明は、入力された画像から文字認識処理に適した二値画像を抽出するための画像処理技術に関するものである。
従来より、入力された画像に含まれる文字を識別する文字認識技術が実用化されている。例えば、PCでは文字認識処理を用いて、スキャナより取り込まれた画像をテキストデータに変換することが可能である。また、複写機では大量の原稿をADFでスキャンする際に、当該技術を用いることにより原稿の向きを判定し、正しい向きに補正した上でプリントアウトすることができる。
文字認識処理を行うにあたっては、処理前に、入力された多値画像を文字認識を行うのに適した画像に変換しておくことが重要となってくる。ここで、文字認識を行うのに適した画像とは、入力された画像中に含まれる情報の中から、文字のみを、その大きさ、配置、太さ、フォント等を維持しつつ抽出し(つまり、文字部分以外の情報を削除し)、下地部分を白色、文字部分を黒色で表現した二値画像をいう。そして、このような二値画像を得るための二値化方法が、例えば特許文献1や特許文献2に開示されている。
特開平08−223409号公報 特開平09−305754号公報
しかしながら、上記従来の二値化方法によれば、入力された画像中に反転文字が含まれていた場合、二値画像は反転文字のまま出力されるため、該反転文字画像部分が文字と認識されずに文字認識の対象とならない場合があった。しかし、二値化後の画像について反転文字であるか否かを判定することは非常に難しく、反転文字が含まれていた場合には文字認識精度が低下してしまうという問題があった。
また、近年、コンピュータの処理能力の向上、メモリの増大、スキャナの発達等によりカラー文書画像が増えたことに伴い、画像中の下地色と文字色とのコントラストが小さい画像や、写真等の文字以外の画像と文字とが混在した画像が増えてきている。この結果、二値化にあたり、二値閾値の調整やブロックサイズの調整だけでは文字認識に適した二値画像が得られないケースがでてきた。例えば、二値閾値を全面単一にすると、一般に、小さな画像むらに影響されない画像が得られるが、画像中に文字色や文字部下地色が複数存在するカラー画像の場合には、画質の低下を招くこととなる。また、小ブロック毎に閾値を適応的に決めて二値化すると、処理ブロック毎に文字部下地色の変化に対応することが可能となる一方で、処理単位毎に濃度むらが出たり、同一の処理ブロック内に文字領域と写真等の他の領域とが混在していた場合にノイズを拾いやすくなってしまう。さらに、処理ブロックに複数の領域が混在しないようにブロックサイズを小さくするとブロック内のノイズ等の影響が大きくなり、かえって濃度むらが増大し、ノイズもより出やすいものとなってしまう。
このように、従来の二値化方法では、反転文字が含まれていた場合や、カラー画像等のように下地色と文字色とのコントラストが比較的小さい画像や、写真等の文字以外の画像が文字と混在した画像の場合に、高い文字認識精度を実現する二値化画像を出力することができなかった。
本発明は、上記課題に鑑みてなされたものであり、反転文字が含まれた画像や多値画像が入力された場合であっても、文字認識処理を行うのに適した画像を出力することにより、文字認識精度を向上させることを目的とする。
上記の目的を達成するために本発明に係る画像処理装置は以下のような構成を備える。即ち、
入力される多値画像を処理する画像処理装置であって、
前記多値画像のエッジを抽出してエッジ画像を生成するエッジ画像生成手段と、
前記多値画像から二値画像を生成する二値画像生成手段と、
前記生成されたエッジ画像および二値画像に基づいて文字領域を抽出し、該抽出された文字領域について、前記入力される多値画像を二値化し、出力二値画像を生成する部分二値化手段と、
前記部分二値化手段により生成された出力二値画像を出力する出力手段と、を備え、
前記部分二値化手段は、
前記生成されたエッジ画像から抽出された文字領域の文字が反転文字であるか否かを判定し、反転文字であると判定された場合には、該文字を反転二値化して出力二値画像を生成することを特徴とする。
本発明によれば、反転文字が含まれた画像や多値画像が入力された場合であっても、文字認識処理を行うのに適した画像を出力することにより、文字認識精度を向上させることが可能となる。
以下、本発明の各実施形態を図面を用いて説明する。
[第1の実施形態]
<画像処理装置の構成>
図1は本実施形態にかかる画像処理装置の構成を示す図である。101はCPU、102はCPU101のプログラムやデータを記憶するROMである。103はRAMであり処理する文書画像を一時的に保持したりする等、CPU101の作業領域として機能する。104は記憶装置であり、文書画像やファイル等を格納する。105はスキャナであり、対象となる文書画像を読み込む。106はプリンタであり、文書画像を印刷出力する。107はネットワークI/Fであり、作成した圧縮画像を配信する。108、109はそれぞれキーボード、ディスプレイであり操作や表示のためのユーザI/Fである。
<画像処理装置における処理の流れ>
図2は本実施形態にかかる画像処理装置の処理の流れを示すフローチャートであり、図4は当該フローチャートに従って処理されるデータの流れを表したデータフロー図である。
ステップS201では、記憶装置104またはスキャナ105から多値の文書画像をRAM103に多値画像401として読み込む。多値画像401の具体例を図5の501に示す。
ステップS202では、ステップS201で入力された多値画像401からエッジ抽出処理(402)により画像のエッジを抽出してエッジ画像404を作成する。エッジ画像404の具体例を図5の502に示す。
ステップS203では、エッジ画像404を領域識別処理(406)し、文字領域408を抽出する。
ステップS204では多値画像401から二値化処理(403)により二値画像405を作成する。二値化手法は任意であるが特開平08-223409号公報や特開平09-305754号公報の様に文字部分の画質が良い二値化手法が望ましい。二値画像405の具体例を図5の503に示す。
ステップS205では二値画像405を領域識別処理(407)により文字領域409を抽出する。
領域識別処理(406、407)はデータフローとしては分かれているが、同一のものを使用できる。エッジ画像404に含まれる比較的小さい文字は502を見れば分かる様に太字文字とほぼ同じで、比較的大きい文字はアウトライン文字と同じ形状を持つため同一の領域識別方法により文字領域を抽出できる。
ステップS206では、文字領域の抽出可否を判定し、ステップS203およびステップS205の両方で文字領域の抽出ができなかった場合は、ステップS204で作成した二値画像407を出力結果として出力する(ステップS210)。
ステップS207では出力二値画像412のメモリの初期化を行う。これはステップS202およびS204においては多値画像401の全領域に対してエッジ抽出および二値化処理が行われるが、次のステップS208、S209の処理では文字領域部分しか出力を行わないため、全面を白画素で初期化をしておく必要があるからである。
ステップS208ではステップS203の領域識別結果408に基づいて得られた文字領域について多値画像401を部分二値化処理し、二値画像を格納メモリに出力する。また、ステップS209ではステップS205の領域識別結果409に基づいて得られた文字領域について多値画像401を部分二値化処理し、二値画像を格納メモリに出力する。
ステップS210ではS208、S209で処理された結果を出力二値画像412のメモリに出力する。図5の504はこの出力二値画像412の具体例であり、多値画像の具体例501を本方法により処理した結果である。文字部分のみを出力二値画像412として二値化出力するため反転文字部と非反転文字部の境界部分が分からない自然な形で出力することが可能になる(なお、従来のように画像の全領域に対して出力を行った場合には、この境界部分が不自然な形になり、この出力二値画像412を利用する後の処理に悪影響を及ぼすこととなる)。
図3はステップS208及びステップS209に示す部分二値化処理の処理の流れを示すフローチャートである。
ステップS301では抽出された文字領域を選択する。ステップS302で選択された文字領域があればステップS303へ、なければ処理を終了する。
ステップS303では選択された文字領域の二値化閾値を決定する二値化閾値演算処理を行う。閾値演算の方法は任意であるが文字画質が良い演算方法が望ましい。
次にステップS304へ進み、現在処理している領域が領域識別結果408のデータであるか、領域識別結果409のデータであるかを判定する。領域識別結果408のデータすなわちエッジ画像から抽出された文字領域であると判定された場合にはステップS305へ進み、そうでなければステップS308へ進む。ステップS305は反転/非反転文字領域判定処理であり、対象の文字領域が明るい下地に暗い文字の非反転文字領域か、暗い下地に明るい文字の反転文字領域かの判定を行う。
ステップS305の判定結果に基づきステップS306で反転文字と判定された場合は、ステップS307においてステップS303で決定された閾値により反転二値化処理をし、その文字領域の部分のみを出力二値画像412のメモリに出力する。逆にステップS306で非反転文字と判定された場合は、ステップS308においてステップS303で決定された閾値により通常の二値化処理をしてその文字領域の部分のみを出力二値画像412のメモリに出力する。
ステップS307、S308の処理が終わるとステップS301へ戻り次の文字領域の処理に移る。
<反転/非反転判定方法>
ここで、上記ステップS305で用いられる反転/非反転文字領域判定方法について具体例を挙げて以下に説明する。なお、反転/非反転文字領域判定方法は、以下のいずれの方法を用いてもよく、また、他の方法であってもよい。
(反転/非反転文字領域判定方法その1)
文字領域の反転非反転判定方法であるが、当該選択された領域に関してステップS303で演算された閾値で二値化した場合の白黒比を計算して、白の割合が大きくなった場合は非反転文字領域と判定し、黒の割合が大きくなった場合は反転文字領域と判定する。
(反転/非反転文字領域判定方法その2)
対象となる文字領域の境界部分に対してステップS303で演算された閾値で二値化した場合の白黒比を計算して白の割合が大きくなった場合は非反転文字領域と判定し、黒の割合が大きくなった場合は反転文字領域と判定する。
(反転/非反転文字領域判定方法その3)
ステップS303の二値化閾値演算処理において特開平08-223409号公報や特開平09-305754号公報の方法を用い、ヒストグラムの偏り(スキュー)の符号により反転か非反転か決定を行う。スキューの値が負値であれば非反転、正値であれば反転領域である。スキュー値は二値化閾値を決定する際に演算が終了しているため処理を高速化できる。
(反転/非反転文字領域判定方法その4)
上記反転/非反転判定方法(その1)で白黒比の差が予め決められた値より小さく、上記反転/非反転判定方法(その3)でスキュー値の絶対値が予め決められた値より小さい場合に反転/非反転判定方法(その2)を行い判定する。
(反転/非反転文字領域判定方法その5)
一般文書において非反転文字が存在する確率が高いため、その1〜その4の判定方法において判定の基準を非反転が優先されるように設定する。
<部分二値化処理の順番>
文字領域の部分二値化処理はエッジ画像から抽出された文字領域を処理した後に、二値画像から抽出された文字領域を処理する。オーバーラップした領域は後から処理された結果が残るが、エッジ画像からの文字領域を先にすることによりオーバーラップ部分に関しては後の二値画像の文字領域に対する処理により上書きされることで反転/非反転の誤判定を回避する効果を持つ。
<画像処理装置における処理の特徴>
次に図4に示すフローチャートにおける各処理の特徴について説明する。
A.エッジ画像404の利点
本実施形態にかかる画像処理装置では、エッジ画像404からも領域識別処理を行う点に特徴がある。エッジ抽出402を行うことで得られたエッジ画像404は、非反転文字も反転文字も同じように出力されるため、特に区別することなく領域識別処理が可能となる。
図6の601はある入力画像の一部分で602はそのエッジ画像、603は二値画像である。601の様に入力画像の一部分に濃い下地を有する場合に、従来のような入力画像全体を一様に二値化処理を行うのみでは、603の様になることがあり、領域識別処理407において画像領域と判断されてしまい、文字領域として抽出することができない。これに対して、エッジ抽出407により得られたエッジ画像404は画素間の相対的な輝度変位のみに反応するため、601に示すような画像が入力された場合であっても、エッジ画像602を得ることができ、その結果、下地の影響を受けず文字領域の抽出が可能である。よって出力される二値画像412は604のようになる。
B.二値画像405の利点
本実施形態にかかる画像処理装置では、エッジ抽出402と二値化処理403とを併用し、互いに補完する点に更に特徴がある。
エッジ抽出(402)は下地の濃淡による影響が小さいが、画像として見た場合、エッジは文字の周辺部に存在するため文字の大きさが大きくなる。そのため、例えば、図7の画像701に示す表中の文字についてエッジ抽出を行うと、罫線部分も太るため文字と罫線が接触しやすくなる(702参照)。その結果、他の部分と接触した文字を分離するのは難易度が高いため、領域識別処理を行う際に、安定して文字領域を抽出することができない。また、エッジ抽出はフィルタ処理であり局所的な輝度変位に反応してノイズを生ずることがあり文字抽出の障害になる。これに対して、二値化処理403により得られる二値画像405は、文字の大きさが維持されるため、図7の場合、画像703に示すように文字と罫線とが接触せず、文字を容易に分離することが可能となる(704参照)。
C.文字領域単位の二値化(410、411)
本実施形態にかかる画像処理装置では、二値画像403から抽出された文字領域409に対して、多値画像401について二値化閾値を計算して再度二値化処理(部分二値化処理)を行う点に更に特徴がある。
これは、従来技術の問題点として上述したように、ステップS204における二値化手法のみでは、以下のような問題が生じるからである。つまり、全面単一閾値による場合、小ノイズが出ないように二値化することが可能である一方、画像中の文字の色や文字部下地色が複数存在している場合には、画質の悪い文字部分がでてしまう。また、入力画像を格子状に予め定めた大きさのブロック(処理ブロック)に分け、該処理ブロック毎に閾値を適応的に決めて二値化した場合、処理ブロック毎に文字下地色の変化に対応可能である一方、処理ブロック単位毎に濃度むらが出たり、処理ブロック内で文字領域と写真等の他の領域とが混在した場合にノイズを拾いやすくなる。さらに処理ブロックに複数の領域が混在しないようにブロックサイズを小さくするとブロック内のノイズ等の影響が大きくなるため、濃度むらがさらに大きくノイズもより出やすくなる。
これに対して、ステップS208、S209において文字領域に対して部分二値化処理を行うことで、文字領域毎に閾値が決定され、領域毎の文字下地色の変化に対応し、かつ文字領域に限定された比較的広いエリアから安定して閾値を演算することができる。すなわち、適応的に最適な処理ブロックサイズを決定するのと等価の働きをするため、濃度むらやノイズの少ない文字画質が高い画像を得ることができる。
以上の説明から明らかなように、本実施形態によれば、入力される画像に対してエッジ抽出を行うことで、反転文字が含まれる場合であっても文字認識に適した画像を得ることが可能となる。また、二値化処理と併用することにより、エッジ抽出により処理した場合の欠点を補完することが可能となる。さらに、エッジ抽出または二値化処理の結果得られた文字領域に対して、再度二値化処理を行うことで、最適なブロックサイズによる二値化画像を得ることが可能となる。この結果、文字認識処理を行うのに適した画像を出力することが可能となり、従来よりも文字認識精度を向上させることができる。
[第2の実施形態]
上記エッジ画像404は領域識別結果408が得られれば必要なくなり、二値画像405は領域識別結果409が得られた時点で必要なくなる。したがって、エッジ画像404、二値画像405、出力された二値画像412についてメモリを共有することにより、メモリを節約することができる。
また一方、図4の402、404、406、408と403、405、407、409のデータフローの処理は独立しているため、独立した資源(メモリ)を割り当てて処理を並列に行うようにすることで、処理の高速化を実現することが可能となる。
さらにS208、S209の処理に加えて、入力画像全体の二値画像405を反転して反転画像を生成し、該反転画像に対して領域識別処理を行うことにより、反転文字に特化した文字抽出を行う処理を行うようにしてもよい。ただしこの場合、図3のS304からはS307へ分岐する。
[第3の実施形態]
上記ステップS303で得られた二値化閾値と、二値化処理405での二値化閾値との差が予め決められた範囲内であった場合に、保持している二値画像405の該当部分を出力する出力二値画像412へコピーすることにより二値化処理時間を短縮することが可能となる。
[他の実施形態]
なお、本発明は、複数の機器(例えばホストコンピュータ、インタフェイス機器、リーダ、プリンタなど)から構成されるシステムに適用しても、一つの機器からなる装置(例えば、複写機、ファクシミリ装置など)に適用してもよい。
また、本発明の目的は、前述した実施形態の機能を実現するソフトウェアのプログラムコードを記録した記憶媒体を、システムあるいは装置に供給し、そのシステムあるいは装置のコンピュータ(またはCPUやMPU)が記憶媒体に格納されたプログラムコードを読出し実行することによっても、達成されることは言うまでもない。
この場合、記憶媒体から読出されたプログラムコード自体が前述した実施形態の機能を実現することになり、そのプログラムコードを記憶した記憶媒体は本発明を構成することになる。
プログラムコードを供給するための記憶媒体としては、例えば、フロッピ(登録商標)ディスク、ハードディスク、光ディスク、光磁気ディスク、CD−ROM、CD−R、磁気テープ、不揮発性のメモリカード、ROMなどを用いることができる。
また、コンピュータが読出したプログラムコードを実行することにより、前述した実施形態の機能が実現されるだけでなく、そのプログラムコードの指示に基づき、コンピュータ上で稼働しているOS(オペレーティングシステム)などが実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
さらに、記憶媒体から読出されたプログラムコードが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書込まれた後、そのプログラムコードの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPUなどが実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
本発明の活用例として、例えば、パソコン(PC)、スキャナ、複写機等への適用が考えられる。
本発明の第1の実施形態にかかる画像処理装置の構成を示す図である。 本発明の第1の実施形態にかかる画像処理装置の処理の流れを示すフローチャートである。 本発明の第1の実施形態にかかる画像処理装置における部分二値化処理の処理の流れを示すフローチャートである。 本発明の第1の実施形態にかかる画像処理装置において処理されるデータの流れを表したデータフロー図である。 多値画像の具体例を示す図である。 多値画像の具体例を示す図である。 多値画像の具体例を示す図である。

Claims (8)

  1. 入力される画像を処理する画像処理装置であって、
    前記入力される画像のエッジを抽出してエッジ画像を生成するエッジ画像生成手段と、
    前記入力される画像から二値画像を生成する二値画像生成手段と、
    前記生成されたエッジ画像および二値画像に基づいて文字領域を抽出し、該抽出された文字領域について、前記入力される画像を二値化し、出力二値画像を生成する部分二値化手段と、
    前記部分二値化手段により生成された出力二値画像を出力する出力手段と、を備え、
    前記部分二値化手段は、
    前記生成されたエッジ画像から抽出された文字領域の文字が反転文字であるか否かを判定し、反転文字であると判定された場合には、該文字を反転二値化して出力二値画像を生成することを特徴とする画像処理装置。
  2. 前記部分二値化手段は、
    前記エッジ画像生成手段で生成されたエッジ画像から抽出された文字領域について、前記入力される画像を二値化した後に、前記二値画像生成手段で生成された二値画像から抽出された文字領域について、前記入力される画像を二値化することを特徴とする請求項1に記載の画像処理装置。
  3. 前記部分二値化手段は、
    前記二値画像生成手段で二値画像を生成する際の二値化閾値と、前記出力二値画像を生成する際の二値化閾値との差が所定値以下であった場合に、当該文字領域に対応する前記二値画像を出力二値画像として出力することを特徴とする請求項1に記載の画像処理装置。
  4. 入力される画像を処理する画像処理方法であって、
    前記入力される画像のエッジを抽出してエッジ画像を生成するエッジ画像生成工程と、
    前記入力される画像から二値画像を生成する二値画像生成工程と、
    前記生成されたエッジ画像および二値画像に基づいて文字領域を抽出し、該抽出された文字領域について、前記入力される画像を二値化し、出力二値画像を生成する部分二値化工程と、
    前記部分二値化工程により生成された出力二値画像を出力する出力工程と、を備え、
    前記部分二値化工程は、
    前記生成されたエッジ画像から抽出された文字領域の文字が反転文字であるか否かを判定し、反転文字であると判定された場合には、該文字を反転二値化して出力二値画像を生成することを特徴とする画像処理方法。
  5. 前記部分二値化工程は、
    前記エッジ画像生成工程で生成されたエッジ画像から抽出された文字領域について、前記入力される画像を二値化した後に、前記二値画像生成工程で生成された二値画像から抽出された文字領域について、前記入力される画像を二値化することを特徴とする請求項4に記載の画像処理方法。
  6. 前記部分二値化工程は、
    前記二値画像生成工程で二値画像を生成する際の二値化閾値と、前記出力二値画像を生成する際の二値化閾値との差が所定値以下であった場合に、当該文字領域に対応する前記二値画像を出力二値画像として出力することを特徴とする請求項4に記載の画像処理方法。
  7. 請求項4乃至6のいずれか1つに記載の画像処理方法をコンピュータによって実現させるための制御プログラムを格納した記憶媒体。
  8. 請求項4乃至6のいずれか1つに記載の画像処理方法をコンピュータによって実現させるための制御プログラム。
JP2003300049A 2003-08-25 2003-08-25 画像処理装置、画像処理方法ならびにプログラム、記憶媒体 Expired - Fee Related JP4250483B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2003300049A JP4250483B2 (ja) 2003-08-25 2003-08-25 画像処理装置、画像処理方法ならびにプログラム、記憶媒体
EP04254752A EP1510963A3 (en) 2003-08-25 2004-08-06 Image processing apparatus, image processing method, program and storage medium
CN200410057142A CN100585621C (zh) 2003-08-25 2004-08-24 图像处理装置和图像处理方法
US10/923,806 US7437002B2 (en) 2003-08-25 2004-08-24 Image recognition system utilizing an edge image and a binary image

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003300049A JP4250483B2 (ja) 2003-08-25 2003-08-25 画像処理装置、画像処理方法ならびにプログラム、記憶媒体

Publications (2)

Publication Number Publication Date
JP2005071088A true JP2005071088A (ja) 2005-03-17
JP4250483B2 JP4250483B2 (ja) 2009-04-08

Family

ID=34101155

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003300049A Expired - Fee Related JP4250483B2 (ja) 2003-08-25 2003-08-25 画像処理装置、画像処理方法ならびにプログラム、記憶媒体

Country Status (4)

Country Link
US (1) US7437002B2 (ja)
EP (1) EP1510963A3 (ja)
JP (1) JP4250483B2 (ja)
CN (1) CN100585621C (ja)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007166287A (ja) * 2005-12-14 2007-06-28 Fuji Xerox Co Ltd 画像処理装置、および画像処理方法
JP2007183742A (ja) * 2006-01-05 2007-07-19 Canon Inc 画像処理装置、画像処理方法、コンピュータプログラム
JP2008299673A (ja) * 2007-05-31 2008-12-11 Sharp Corp 画像処理装置、画像処理プログラムおよび該画像処理プログラムを記録したコンピュータ読み取り可能な記録媒体、ならびに画像処理方法
JP2009182655A (ja) * 2008-01-30 2009-08-13 Fuji Xerox Co Ltd 画像処理装置
JP2010081604A (ja) * 2008-09-25 2010-04-08 Sharp Corp デジタル画像のテキストの位置決定を行う方法およびシステム
JP2010527190A (ja) * 2007-05-04 2010-08-05 イー・エル・イー・エス・ソシエテ・アノニム スキャンされたドキュメントを含むデジタル画像の圧縮
US8077986B2 (en) 2006-06-14 2011-12-13 Canon Kabushiki Kaisha Information processing apparatus, method of controlling same and computer program
US8385651B2 (en) 2009-03-18 2013-02-26 Fuji Xerox Co., Ltd. Character recognition device, image-reading device, computer readable medium, and character recognition method
JP2016004553A (ja) * 2014-06-19 2016-01-12 株式会社東芝 文字検出装置、方法およびプログラム
WO2020089985A1 (ja) * 2018-10-29 2020-05-07 株式会社Pfu 画像処理装置、制御方法及び制御プログラム

Families Citing this family (15)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005073015A (ja) * 2003-08-26 2005-03-17 Canon Inc 画像処理装置及び画像処理方法及びコンピュータプログラム
JP2007088782A (ja) * 2005-09-21 2007-04-05 Ricoh Co Ltd 画像処理装置、画像処理方法および画像処理プログラム
CN100517374C (zh) * 2005-12-29 2009-07-22 佳能株式会社 从复杂背景文档图像提取文本的装置、方法
KR100812347B1 (ko) * 2006-06-20 2008-03-11 삼성전자주식회사 스트록 필터를 이용한 문자 추출 방법 및 그 장치
CN100535931C (zh) * 2006-09-06 2009-09-02 中国科学院自动化研究所 一种多分辨率退化字符自适应识别系统及方法
US20090195811A1 (en) * 2008-02-04 2009-08-06 Konica Minolta Systems Laboratory, Inc. Method for printing text-only content of pdf documents
US9092668B2 (en) * 2009-07-18 2015-07-28 ABBYY Development Identifying picture areas based on gradient image analysis
US8812538B2 (en) * 2010-01-29 2014-08-19 Wendy Muzatko Story generation methods, story generation apparatuses, and articles of manufacture
KR101812341B1 (ko) * 2011-06-24 2017-12-26 엘지이노텍 주식회사 이미지의 에지 향상 방법
JP5730274B2 (ja) * 2012-11-27 2015-06-03 京セラドキュメントソリューションズ株式会社 画像処理装置
FR3002354A1 (fr) * 2013-02-18 2014-08-22 Sagemcom Documents Sas Procede d'affectation aux pixels d'une image d'une premiere valeur ou d'une seconde valeur
FR3002352B1 (fr) * 2013-02-18 2018-04-06 Sagemcom Documents Sas Procede d'affectation aux pixels d'une image d'une premiere valeur ou d'une seconde valeur
US9092690B2 (en) 2013-03-12 2015-07-28 Google Inc. Extraction of financial account information from a digital image of a card
JP6370080B2 (ja) 2014-04-02 2018-08-08 キヤノン株式会社 画像処理装置、画像処理方法及びプログラム。
US20230094787A1 (en) * 2021-09-30 2023-03-30 Adobe Inc. Utilizing machine-learning based object detection to improve optical character recognition

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS62147584A (ja) 1985-12-23 1987-07-01 Toshiba Corp 文字読取装置
US5732153A (en) * 1987-03-27 1998-03-24 Canon Kabushiki Kaisha Color image processing apparatus
JPH04302375A (ja) * 1991-03-29 1992-10-26 Eastman Kodak Japan Kk 画像二値化装置
JPH078007A (ja) 1993-06-25 1995-01-13 Kubota Corp ロータリの正逆転切換装置
JPH07160815A (ja) 1993-12-02 1995-06-23 Hitachi Eng Co Ltd 輪郭強調による画像二値化処理方法及び装置
JPH08223409A (ja) 1995-02-10 1996-08-30 Canon Inc 画像処理装置およびその方法
JP3673598B2 (ja) 1996-05-17 2005-07-20 キヤノン株式会社 画像処理方法及び画像処理装置
US5956421A (en) * 1996-02-28 1999-09-21 Canon Kabushiki Kaisha Image processing method and apparatus for determining a binarization threshold value used for binarizing a multi-valued image and performing binarization processing
JP3904840B2 (ja) * 2000-08-15 2007-04-11 富士通株式会社 多値画像から罫線を抽出する罫線抽出装置
JP2002283614A (ja) 2001-03-23 2002-10-03 Ricoh Co Ltd 画像形成装置、画像形成方法及び該方法を実行するためのプログラムを格納したコンピュータ読み取り可能な記憶媒体
US6771836B2 (en) * 2001-06-21 2004-08-03 Microsoft Corporation Zero-crossing region filtering for processing scanned documents
JP3972751B2 (ja) * 2001-08-27 2007-09-05 コニカミノルタビジネステクノロジーズ株式会社 画像処理装置

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007166287A (ja) * 2005-12-14 2007-06-28 Fuji Xerox Co Ltd 画像処理装置、および画像処理方法
JP2007183742A (ja) * 2006-01-05 2007-07-19 Canon Inc 画像処理装置、画像処理方法、コンピュータプログラム
JP4745830B2 (ja) * 2006-01-05 2011-08-10 キヤノン株式会社 画像処理装置、画像処理方法、コンピュータプログラム
US8077986B2 (en) 2006-06-14 2011-12-13 Canon Kabushiki Kaisha Information processing apparatus, method of controlling same and computer program
US8666185B2 (en) 2007-05-04 2014-03-04 I.R.I.S. Compression of digital images of scanned documents
JP2010527190A (ja) * 2007-05-04 2010-08-05 イー・エル・イー・エス・ソシエテ・アノニム スキャンされたドキュメントを含むデジタル画像の圧縮
US8995780B2 (en) 2007-05-04 2015-03-31 I.R.I.S. Compression of digital images of scanned documents
JP2008299673A (ja) * 2007-05-31 2008-12-11 Sharp Corp 画像処理装置、画像処理プログラムおよび該画像処理プログラムを記録したコンピュータ読み取り可能な記録媒体、ならびに画像処理方法
JP2009182655A (ja) * 2008-01-30 2009-08-13 Fuji Xerox Co Ltd 画像処理装置
JP2010081604A (ja) * 2008-09-25 2010-04-08 Sharp Corp デジタル画像のテキストの位置決定を行う方法およびシステム
JP4745430B2 (ja) * 2008-09-25 2011-08-10 シャープ株式会社 デジタル画像のテキストの位置決定を行う方法およびシステム
US8385651B2 (en) 2009-03-18 2013-02-26 Fuji Xerox Co., Ltd. Character recognition device, image-reading device, computer readable medium, and character recognition method
JP2016004553A (ja) * 2014-06-19 2016-01-12 株式会社東芝 文字検出装置、方法およびプログラム
WO2020089985A1 (ja) * 2018-10-29 2020-05-07 株式会社Pfu 画像処理装置、制御方法及び制御プログラム
JPWO2020089985A1 (ja) * 2018-10-29 2021-05-13 株式会社Pfu 画像処理装置、制御方法及び制御プログラム
JP7106672B2 (ja) 2018-10-29 2022-07-26 株式会社Pfu 画像処理装置、制御方法及び制御プログラム

Also Published As

Publication number Publication date
US7437002B2 (en) 2008-10-14
CN100585621C (zh) 2010-01-27
EP1510963A3 (en) 2006-09-27
CN1607542A (zh) 2005-04-20
JP4250483B2 (ja) 2009-04-08
US20050047660A1 (en) 2005-03-03
EP1510963A2 (en) 2005-03-02

Similar Documents

Publication Publication Date Title
JP4250483B2 (ja) 画像処理装置、画像処理方法ならびにプログラム、記憶媒体
US7751648B2 (en) Image processing apparatus, image processing method, and computer program
JP4646797B2 (ja) 画像処理装置及びその制御方法、プログラム
JP4632443B2 (ja) 画像処理装置及び画像処理方法並びにプログラム
JPWO2007049340A1 (ja) 電子透かしの埋め込み及び検出
JP2007214695A (ja) 電子透かし埋め込み装置および電子透かし埋め込み方法
JP2006050551A (ja) 画像処理装置及びその方法、並びにプログラム及び記憶媒体
JP4364809B2 (ja) 画像処理装置、画像処理方法、プログラム、及び記録媒体
JP5178490B2 (ja) 画像処理装置、画像処理方法、コンピュータプログラム
JP4441300B2 (ja) 画像処理装置、画像処理方法、画像処理プログラムおよびこのプログラムを記憶した記録媒体
JP2001076095A (ja) 情報処理装置及びその方法
JP2003046746A (ja) 画像処理方法及び画像処理装置
JP4324058B2 (ja) 画像処理装置及びその方法
JP2000022945A (ja) 画像処理装置及び画像処理方法
JP2008225654A (ja) 画像処理方法、画像処理装置、及び、プログラム、プログラム記憶媒体
JP3756660B2 (ja) 画像認識方法、装置および記録媒体
JP2004048130A (ja) 画像処理方法、画像処理装置、および画像処理プログラム
JP2005341098A (ja) 画像処理装置、プログラム、及び記憶媒体
JP4027016B2 (ja) 画像処理装置、画像処理方法及び記憶媒体
JP2005311992A (ja) 画像処理装置および画像処理方法ならびに記憶媒体、プログラム
JP4957570B2 (ja) 画像処理装置
JP2006345456A (ja) 画像処理装置、方法、プログラム及び記憶媒体
JPH0548870A (ja) 枠消し方法
JP2001134773A (ja) 画像処理装置およびその方法
JP2005328348A (ja) 画像処理装置、プログラム、及び記憶媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050613

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20080605

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080609

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080710

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080912

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080919

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090109

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090119

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120123

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4250483

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130123

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140123

Year of fee payment: 5

LAPS Cancellation because of no payment of annual fees