JP4366011B2 - 文書処理装置及び方法 - Google Patents

文書処理装置及び方法 Download PDF

Info

Publication number
JP4366011B2
JP4366011B2 JP2000388887A JP2000388887A JP4366011B2 JP 4366011 B2 JP4366011 B2 JP 4366011B2 JP 2000388887 A JP2000388887 A JP 2000388887A JP 2000388887 A JP2000388887 A JP 2000388887A JP 4366011 B2 JP4366011 B2 JP 4366011B2
Authority
JP
Japan
Prior art keywords
image
area
region
luminance
binary
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2000388887A
Other languages
English (en)
Other versions
JP2002190957A5 (ja
JP2002190957A (ja
Inventor
知俊 金津
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2000388887A priority Critical patent/JP4366011B2/ja
Priority to US10/013,675 priority patent/US7170647B2/en
Publication of JP2002190957A publication Critical patent/JP2002190957A/ja
Publication of JP2002190957A5 publication Critical patent/JP2002190957A5/ja
Application granted granted Critical
Publication of JP4366011B2 publication Critical patent/JP4366011B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N1/00Scanning, transmission or reproduction of documents or the like, e.g. facsimile transmission; Details thereof
    • H04N1/46Colour picture communication systems
    • H04N1/56Processing of colour picture signals

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Facsimile Image Signal Circuits (AREA)
  • Image Analysis (AREA)
  • Character Input (AREA)
  • Controls And Circuits For Display Device (AREA)
  • Color Image Communication Systems (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、文書の電子化処理を行うための文書処理装置及び方法に関し、特に文書の電子化処理に際して実行される像域分離処理に関する。
【0002】
【従来の技術】
近年、情報の電子化が進み、文書を紙ではなく電子化して保存、あるいは送信するという需要が高まっている。特に、蓄積メディアの低価格化、および通信帯域の増大により、電子化の対象となる文書は白黒2値のものから、フルカラーの文書へと広がりつつある。
【0003】
ここでいう文書の電子化とは、単に紙文書をスキャナなどにより光電変換し、画像データ化することのみにとどまらず、記載されている内容を認識して、文書を構成するテキスト、記号、図、写真、表などそれぞれ性質の異なる領域に分割し、文字部は文字コード情報、図はベクトルデータ、写真は画像データ、表は構造データ、といったように各々最も適した形態でデータ化する処理のことを指す。
【0004】
そのような文書の電子化処理の第1段階として行われるのが、1頁の文書画像に書かれた内容を分析し、文字や図、写真、表など異なる性質の部分要素に分割する処理、すなわち領域分割処理である。図25は領域分割の一例を示す図である。
【0005】
このような領域分割処理の実現例としては、米国特許第5680478号の“Methodand Apparatus for character recognition”(Shin-Ywangら/CanonK.K)などが挙げられる。この例では、文書画像中の黒画素の8連結輪郭塊、白画素の4連結輪郭塊の集合を抽出し、その形状、大きさ、集合状態などから、文字領域、絵や図、表、枠、線といった文書に特徴的な領域を抽出している。図25の例では、文字領域(ブロック1、3、4、6)、絵や図領域(ブロック2)、表領域(ブロック5)、枠、線(7)といった文書に特徴的な領域を抽出している。
【0006】
ここで、黒画素の8連結輪郭塊(以下、黒画素塊)とは、図14のように、ある黒画素から8方向のいずれかで連結している黒画素の集合体である。また、白画素の4連結輪郭塊(以下、白画素塊)とは、図16のようにある白画素から4方向のいずれかで連結している白画素の集合体を指す。
【0007】
上述の領域分割処理は、その動作原理より、入力となる文書画像が白黒2値であることが前提となる。従って、この技術を利用してカラー文書の領域分割を行うためには、あらかじめ文書画像の2値化を行う必要がある。一般にカラー画像の2値化は、画素の輝度分布から閾値を求め、画像の各画素を、前出の輝度閾値を境に白又は黒の画素へと変換することで行われる。
【0008】
【発明が解決しようとする課題】
カラー画像の2値化のための閾値の求め方には、全画面単一で求める方法と、領域毎に求める方法が考えられる。本出願人による特願平11−238581号にて提案されている2値化方法では、入力原稿の内容に応じて、領域毎に動的に最適な閾値を求め、これを用いることで領域毎に最適な2値化が行われる。特に低輝度下地上の高輝度文字と、高輝度下地上の低輝度文字が混在するカラー画像から、それらすべてが白地上の黒文字に自動的に変換されるような2値化を可能とし、領域分割処理の入力として最適な2値画像を得ることが可能である。
【0009】
図24は先に提案された2値化手法によって色付きの下地を含む文書に領域分離を行った様子を説明する図である。図24において、カラーの文書2301は、下半分に濃い色付の下地領域があり、その上に薄い色の文字が載っているものとし、それ以外は薄い色の下地に濃い色の文字となっているものとする。この様な文書においては、上半分と下半分は意味的に分離しているであろうことが理解できる。
【0010】
文書2301のようなカラー文書に対して、前述の2値化方式で2値化を行うと、図24の2302で示されるような2値画像が生成される。2値画像2302では、下地は除去されてすべて白画素になり、文字はすべて黒画素になっている。このとき、2値画像2302に対し従来通り領域分割処理を行うと、図24中2303のような結果が得られる、画面の下半分に存在した下地付の領域の情報が欠落しているために、本来TEXT1およびTEXT2はそれぞれ中央で2つに分離すべきなのにもかかわらず、結合してしまっている。
【0011】
つまり、本来カラー画像の持っている下地色による文字領域の範囲指定情報は2値化の際に失われてしまう。
【0012】
本発明は上記の問題に鑑みてなされたものであり、色によって表された領域の区別を維持した領域分割を可能にすることを目的とする。
【0013】
【課題を解決するための手段】
上記の目的を達成するための本発明の一態様による文書処理装置は、
輝度画像を2値化するための閾値を複数決定する第1決定手段と、
前記第1決定手段で決定された複数の閾値それぞれを用いて前記輝度画像を2値化することにより、複数の2値画像を取得する取得手段と、
前記取得手段で取得した複数の2値画像それぞれに含まれる黒画素の連結成分の領域に基づいて、下地の輝度が異なる各領域の位置と大きさ示す領域情報を生成する生成手段と、
前記輝度画像における前記領域情報で示される各領域について、輝度値の反転を行うか否かを決定する第2決定手段と、
前記輝度画像における前記領域情報で示される各領域について、当該各領域を2値化するための閾値をそれぞれ設定する設定手段と、
前記輝度画像における前記領域情報で示される各領域について、前記第2決定手段で反転を行うと決定された領域に関しては、輝度値を反転した前記輝度画像内の対応する領域を、前記設定手段で当該領域に対して設定された閾値で2値化することにより2値部分画像を取得し、一方、前記第2決定手段で反転を行わないと決定された領域に関しては、輝度値を反転していない前記輝度画像内の対応する領域を、前記設定手段で当該領域に対して設定された閾値で2値化することにより2値部分画像を取得する2値部分画像取得手段と、
前記輝度画像の全面を所定閾値で2値化して得られる2値画像における対応する領域に、前記2値部分画像取得手段で取得した各領域の2値部分画像を上書きすることにより、前記輝度画像に関する第2の2値画像を得る2値化手段と、
前記2値化手段で得られた第2の2値画像から文書要素を抽出し、前記生成手段で生成された領域情報で示される各領域を枠の要素とし、前記文書要素と枠の要素とに基づいて木構造を得て、当該木構造に基づいて前記輝度画像の領域分割を行う分割処理手段とを備え、
前記分割処理手段で得る木構造は、前記抽出した文書要素のうち前記領域情報で示される各領域に含まれる文書要素を当該各領域に対応する枠の要素の子孫にした木構造である
【0014】
また、上記の目的を達成するための本発明の文書処理方法は、
第1決定手段が、輝度画像を2値化するための閾値を複数決定する第1決定工程と、
取得手段が、前記第1決定工程で決定された複数の閾値それぞれを用いて前記輝度画像を2値化することにより、複数の2値画像を取得する取得工程と、
生成手段が、前記取得工程で取得した複数の2値画像それぞれに含まれる黒画素の連結成分の領域に基づいて、下地の輝度が異なる各領域の位置と大きさ示す領域情報を生成する生成工程と、
第2決定手段が、前記輝度画像における前記領域情報で示される各領域について、輝度値の反転を行うか否かを決定する第2決定工程と、
設定手段が、前記輝度画像における前記領域情報で示される各領域について、当該各領域を2値化するための閾値をそれぞれ設定する設定工程と、
2値部分画像取得手段が、前記輝度画像における前記領域情報で示される各領域について、前記第2決定工程で反転を行うと決定された領域に関しては、輝度値を反転した前記輝度画像内の対応する領域を、前記設定工程で当該領域に対して設定された閾値で2値化することにより2値部分画像を取得し、一方、前記第2決定工程で反転を行わないと決定された領域に関しては、輝度値を反転していない前記輝度画像内の対応する領域を、前記設定工程で当該領域に対して設定された閾値で2値化することにより2値部分画像を取得する2値部分画像取得工程と、
2値化手段が、前記輝度画像の全面を所定閾値で2値化して得られる2値画像における対応する領域に、前記2値部分画像取得工程で取得した各領域の2値部分画像を上書きすることにより、前記輝度画像に関する第2の2値画像を得る2値化工程と、
分割処理手段が、前記2値化工程で得られた第2の2値画像から文書要素を抽出し、前記生成工程で生成された領域情報で示される各領域を枠の要素とし、前記文書要素と枠の要素とに基づいて木構造を得て、当該木構造に基づいて前記輝度画像の領域分割を行う分割処理工程とを有し、
前記分割処理工程で得る木構造は、前記抽出した文書要素のうち前記領域情報で示される各領域に含まれる文書要素を当該各領域に対応する枠の要素の子孫にした木構造である
【0015】
【発明の実施の形態】
以下、添付の図面を参照して本発明の好適な実施形態を説明する。
【0016】
図1は本実施形態による文書処理装置の装置概観を示す図である。図1において、101はコンピュータ装置であり、添付のフローチャートを参照して以下で説明する処理を実現するためのプログラムを含む、文書の電子化処理プログラムを実行する。コンピュータ装置101は、ユーザに状況や画像を表示するためのディスプレイ装置102、およびユーザの操作を受け付けるキーボードやマウス等のポインティングデバイスを含んで構成される入力装置103が付随する。ディスプレイ102表示デバイスとしては、CRTやLCD等が用いられる。104はスキャナ装置であり、文書画像を光学的に読み取り、電子化し、得られた画像データをコンピュータ装置101に送る。本実施形態では、カラースキャナを用いる。
【0017】
図2は本実施形態による文書処理装置の構成を示すブロック図である。図1において、201はCPUであり、ROM202或いはRAM203に格納された制御プログラムを実行することにより、後述の電子化処理を含む各種機能を実現する。202はROMであり、CPU201によって実行される各種制御プログラムやデータが格納される。203はRAMであり、CPU201によって実行される各種制御プログラムを格納したり、CPU201が各種処理を実行するのに必要な作業領域を提供する。204は外部記憶装置であり、添付のフローチャートを参照して説明する処理をCPU101によって実現するための制御プログラムや、画像入力装置104を読み取って得られた文書画像データ等を格納する。205はコンピュータバスであり、上述の各構成を接続する。
【0018】
図3は本実施形態の文書処理装置による文書の電子化処理の概要を示す図である。本実施形態による電子化処理の流れは、まず入力部301において電子化の対象とするカラー文書をスキャナ104を用いて読み込み、文書を画像データとして外部記憶装置204に格納する。次に、2値化部302において、後段の領域分割処理のために外部記憶装置204に格納された文書画像データに対して2値化処理を施す。領域分割部303では、2値化部302で得られた2値画像から、文字、図、表、枠、線などの要素を抽出し、各領域に分割する。電子化文書作成部304は、分割された各要素毎の属性に基づいて文字認識データや用いたり表構造データを用いたりして電子化文書を作成する。出力部305は生成された電子化文書を外部記憶装置204に格納する。なお、出力部305における出力の形態は外部記憶装置204への格納に限られるものではなく、ディスプレイ102へ表示出力したり、不図示のネットワークインターフェースを介してネットワーク上の他の装置へ出力したり、不図示のプリンタへ出力したりすることも可能である。
【0019】
以下、図3に示した2値化部302の動作について図面参照して説明する。図4は本実施形態による2値化処理を説明するフローチャートである。また、図5は本実施形態の説明に用いるカラー文書画像の例を示す図である。なお、図5に示すカラー文書画像は、3つの下地色(下地A501、下地B502、下地C503)を含み、下地A501の部分が白、下地B502の部分が黄色、下地C503の部分が青であるとする。一方、文字色は、文字列A504,文字列B505が共に黒、文字列C506は白である。
【0020】
まず、ステップS401にて処理対象のカラー文書画像を輝度画像に変換する。ここでは一般的に元画像のカラー形式をRGB形式、輝度画像は1画素あたり0〜255のグレイスケール形式とし、各画素の輝度Yは元画像の画素値R,G,Bに対し、Y=0.299R+0.587G+0.114Bによって求めることにするが、他の形式/変換式を用いてもよいことはもちろんである。これにより図5の下地色A501,下地色B502,下地色C503の各部分の輝度はそれぞれ255,200,40(実際は紙面状態や光電変換時のばらつきによって、同じ下地色であっても位置によって輝度値がばらつく。したがって、図6のようなヒストグラム曲線の山は、ある程度の幅を有することになる)へと変換される。
【0021】
次に、ステップS402にて、ステップS401で得られた輝度画像データのヒストグラムをとる。図6は図5に示したカラー画像から得られる輝度値のヒストグラムを示す図である。ヒストグラムが得られたならば、ステップS403において、そのヒストグラムから複数の閾値を決定する。例えば図6に示したヒストグラムからは、t1,t2の2個の閾値が抽出される。
【0022】
この複数の閾値t1,t2は例えば以下のような手順で決定できる。ヒストグラムの輝度値255(白)から0(黒)まで参照する。参照した輝度値から閾値を選択する条件は、例えば、以下の各条件を設定する。
【0023】
条件1:当該ヒストグラム曲線において、現在の参照点と、その参照点から横軸の輝度値の大きい方向に例えば10画素分だけさかのぼった点との間に含まれる合計度数(面積)が、所定の第1の値より大きい。
【0024】
条件2:当該ヒストグラム曲線における縦軸の度数の急激な減少が発生(例えば「所定の第1の傾きより大」が1回、または「所定の第2の傾きより大」が連続して2回発生)。
【0025】
条件3:当該ヒストグラム曲線の緩い減少、または上昇が発生(所定の第3の傾きより小)。
【0026】
本実施形態において、図6に示すt1、t2の各点は、上記の各条件のうち、「条件1」が満足された後に「条件2」が満足され、その後更に「条件3」が満足された結果として検出した。尚、参照点は、当該ヒストグラム曲線を所定の間隔で参照するようにしてもよい。また、本実施形態では以上のような条件を用いたが、閾値の決定はこれに限るものではない。例えば更に以下のような条件4〜6を同時に満たす場合を閾値として選択しても良い。
【0027】
条件4:当該ヒストグラム曲線において、現在の参照点と、その参照点から横軸の輝度値の大きい方向に例えば40画素さかのぼった点との間に含まれる合計度数(面積)が、所定の第2の値より大きい。
【0028】
条件5:当該ヒストグラム曲線上の現在の参照点における縦軸の度数が、所定の第3の値より小さい。
【0029】
条件6:当該ヒストグラム曲線において、現在の参照点と、その参照点から横軸の輝度値の大きい方向に例えば20画素さかのぼった点におけるヒストグラム値が、所定の第4の値より大きい。
【0030】
ステップS404にて、各閾値から複数の2値画像を作成する。これらはテンポラリの2値画像である。本例では、閾値t1で2値化することにより、図7の(a)に示す2値画像701が、閾値t2で2値化することにより図7の(b)に示す2値画像702が生成される。ここで、領域703及び704はそれぞれ図5に示す下地B502、C503の領域である。閾値t1では下地B502と下地C503の部分も黒となり、閾値t2では、下地502の部分は白となり、下地C503の部分は黒となる。
【0031】
次に、ステップS405にて、ステップS404で得られた各2値画像中の黒領域を抽出し、これを下地色の異なる領域を示す領域情報として記録する。これは、2値画像上の黒画素の連結成分を追跡して、一定の大きさ以上となる四角形の領域を抽出する処理である。図7の例では、2値画像701より領域703が、2値画像702より領域704がそれぞれ抽出される。
【0032】
次に、ステップS406にて、ステップS405で抽出した各領域内の解析を行う。ここでは、ステップS401で得られた輝度画像より、ステップS405で抽出された各領域の範囲を切り出し、各範囲毎に輝度値のヒストグラムをとり、このヒストグラムから各領域について輝度値の反転が必要か否か判断し、必要な場合は輝度値を反転する。更に、このヒストグラムから各領域内に最適な2値化閾値を、図6と同様にして求める(ただし、対象とする領域の大きさが小さくなるので判断に用いる所定の値は異なる)。求められた2値化閾値及び反転情報は、各領域情報に付随するように出力される。尚、反転が必要か否かは、例えば以下に示す計算式により、ヒストグラムの平均値(average)とそのスキュー(skew)とを求めて判断できる。
【0033】
(average)=Σip(i),
σ2=Σ(i-av)2p(i),
(skew)=1/σ2Σ(i-av)3p(i),
但し、Σip(i)は、ip(i)のi=0からi=255までの場合の総和、p(i)は確率密度、avは平均値を表わす。
【0034】
このスキューの絶対値がしきい値より大きいときには、その領域は文字を含むと判断し、更に文字を含むと判断されて且つスキューが正のときには、領域の画像を反転すべきと判断して反転フラグがyesになる。
【0035】
本例では、領域703より図8に示されるヒストグラムが求められて反転必要なしと判断されて該ヒストグラムから閾値t21が求められる。さらに、領域704より図9に示されるヒストグラムが求められて反転必要ありと判断され、図9のヒストグラムを反転して閾値t22が求められる(尚、図9は反転前のヒストグラムを表し、閾値t22は反転前のヒストグラムの対応する値として示している)。そして、図10に示すように、それぞれの領域毎に、座標値と2値化閾値、反転情報を1組とした領域情報が記憶される。
【0036】
本例では、領域703に対する領域情報1001は、座標値として矩形の左端のx座標l1、右端のx座標r1、上端のt1、下端のb1を、2値化閾値として図8のヒストグラムから求まった閾値t21を、反転情報として反転無し(no)を有する。同様に、領域704に対する領域情報1002は、座標値として矩形の左端のx座標l2、右端のx座標r2、上端のt2、下端のb2を、2値化閾値として図9のヒストグラムから求まった閾値t22を、反転情報として反転有り(yes)を有する。
【0037】
次いで、ステップS407にて、ステップS406で得られた領域情報を基に、ステップS401で得た輝度画像から最終的な2値画像を生成する。本例によれば、
(1)全面を閾値t1で2値化して2値画像701を得る。
(2)2値画像701上の領域703の部分の輝度画像について、領域情報1001の内容にしたがって処理(この場合閾値(t21)で2値化)を行い、得られた画像を領域703の部分に上書きする。この結果、2値画像702が得られる。
(3)領域704については、対応する領域情報1002が反転有りを示すので、領域704の部分の輝度画像について反転処理を行い、閾値t22を用いて2値化して得られた画像を領域704の部分に上書きする。この結果、図5に示したカラー画像から図11に示すような最終2値画像が得られることになる。
【0038】
次に、以上のようにして2値化部302によって得られた2値画像と領域情報を用いて、領域分割部303が領域分割を行う。以下、領域分割部303の処理について説明する。
【0039】
図12は本実施形態の領域分割処理を説明するフローチャートである。領域分割部303では、ステップS1201にて、2値化部302により得られた2値化された文書画像から文書要素が抽出され、それらの木構造表現が作られる。このステップS1201の処理の詳細について図13のフローチャートを用いて説明する。図13は図12のステップS1201の要素抽出及び木構造化の処理を説明するフローチャートである。
【0040】
ステップS1301では、2値化画像からすべての黒画素塊を抽出する。なお、黒画素塊とは、上述したように黒画素の8連結輪郭塊であり、図14に示すように、縦横斜めに接触した画素で作られた輪郭を持つ黒画素の集合のことである。続くステップS1302では、抽出した黒画素塊が、予め予想される最大文字高さおよび幅(予め実験的に求めた値)に対し定められた閾値以下の大きさを有するかどうかを判定し、閾値以下である場合はステップS1308に進み、当該黒画素塊を文字要素と判定する。これを“CHAR”と呼ぶ。
【0041】
ステップS1303では、抽出した黒画素が一定比率以上で縦長あるいは横長であるかどうかを判断する。当該黒画素塊が一定比率以上で縦長あるいは横長であった場合は、ステップS1309において“LINE”と判定する。また、ステップS1304では、抽出した黒画素塊中の黒画素のなす輪郭に注目し、その形状が細い斜めの線状であった場合は、ステップS1309へ進み、当該黒画素塊を“LINE”と判定する。
【0042】
ステップS1305では、黒画素塊の輪郭形状が四角形かどうかを調べる。図15は、(a)黒画素塊の輪郭が四角形の場合と、(b)黒画素塊の輪郭が非四角形である場合の例を示す図である。ステップS1305において、黒画素塊の輪郭形状が四角形でなければ、ステップS1312へ進み、当該黒画素塊を“PICTURE”と判定する。
【0043】
一方、黒画素塊が四角形ならばステップS1306へ進む。ステップS1306では、黒画素塊の内部に存在する白画素の4連結輪郭塊を抽出する。白画素の4連結輪郭塊とは、図16のように、縦横のみに接触した画素で作られた輪郭を持つ白画素の集合のことである。以降この集合を白画素塊と呼ぶ。
【0044】
ステップS1307では、ステップS1306で黒画素塊から抽出された白画素塊の形状がすべて四角形であり、かつ黒画素塊内を所定の間隔で隙間なく埋めているかどうかを判定する。この判定の結果がYESであった場合は、ステップS1311へ進み、当該黒画素塊を“FRAME”と判定する。図17は、枠(FRAME)と図(PICTURE)における内部白画素塊の配置例を示す図である。ステップS1307の判定によれば、(a)、(b)はステップS1307の判定条件を満たすので、ステップS1311で枠(FRAME)であると判定されることになる。
【0045】
また、図17の(c)に示した白画素塊の配列は、「黒画素塊から抽出された白画素塊の形状がすべて四角形であり、かつ黒画素塊内を隙間なく埋めている」という条件を満たしておらず、ステップS1312において図(PICTURE)と判定されることになる。結局、ステップS1312では、ステップS1307までの条件のいずれにもあてはまらない黒画素塊を、“PICTURE”としている。
【0046】
さて、本実施形態では、各要素の親となる要素“GROUND”を導入する。画面全体をひとつの“GROUND”とすると、これまで画像から抽出された各要素は、すべてその子供の要素として表現される。そして、“FRAME”と判定された黒画素塊の内部から抽出された白画素塊のひとつひとつをそれぞれ“GROUND”とし、更にこの白画素の内部で、上述したステップS1301〜S1312の処理を行って子供となる要素を抽出する(ステップS1313)。なお、“FRAME”の内部で更に“FRAME”が抽出されたときには、これをGROUNDとしてさらに再帰的に処理を行う。
【0047】
すべての再帰的内部探索が終了した時点で、画像から抽出された要素は木構造を構成することになる。図18は、文書画像の例と、これをステップS1201の要素抽出、木構造化によって処理して得られる木構造の例を示す図である。図18の(a)に示されるように、文書画像1801は、テキスト列(CHAR)1802、1807、1808と、フレーム(FRAME)1804と、図(PICTURE)1803、1809とを有する。
【0048】
この文書画像1801を上述の処理によって木構造化すると、図18の(b)のようになる。GROUND1821は文書画像1801の全体を示し、その要素の一つであるFRAME1824は文書画像1801中のフレーム1804に対応する。更にフレーム1804は2つのフレームに分けられ、木構造上では、それぞれGROUND1825、1826として示されている。
【0049】
以上のようにして、図12のステップS1201で文書画像要素の木構造を得ると、ステップS1202において、ステップS406で取得した領域情報を木構造に当てはめる。即ち、2値化部302による2値化処理の際に記録された領域情報を参照して、ステップS301で得られた木構造を変更する。このステップS1202の処理について、図19のフローチャートを用いて説明する。
【0050】
ステップS1901では、領域情報が存在するかどうかを調べる。領域情報がなければ、そのまま本処理を終了する。領域情報が存在する場合は、ステップS1902へ進み、領域を仮想的に“FRAME”および“GROUND”の組と考えて要素の木構造の適当な箇所に挿入する。すなわち、領域を内包する“GROUND”を親とする位置に、その領域情報が表す矩形に対応する新たな“FRAME”を挿入し、その子として新たな“GROUND”を置く。
【0051】
ステップS1903では、ステップS1902で挿入した“FRAME”と同じ親(GROUND)を持つ兄弟のうち、当該領域内部に位置する要素をすべて自分の子孫、すなわち新たな“GROUND”の子供へと移動する。
【0052】
図20は、上述した木構造変更処理の例を説明する図である。文書画像2001は色付きの下地領域2002を有する。2値化部302はこの文書画像2001を2値化して2値画像2010を生成するとともに、領域2002に対応する領域情報2020を生成する(図4)。領域分割部303は、2値画像2010について図13のフローチャートで説明した処理を施すことにより、画像全体をGROUND2031とする木構造2030を生成する(S1201)。そして、木構造2030に、領域情報2020を当てはめて、木構造を変更し、木構造2040を得る。
【0053】
より具体的には、GROUND2031を親として、領域2002に相当する枠(FRAME)を挿入して、その子としてGROUND2041を置く。そして、領域2002に含まれる各要素(A,B,C,図形)をGROUND2041の子として配置することにより、木構造を変更する。
【0054】
以上のようにして、ステップS1202の処理を終えたならば、ステップS1203へ進む。ステップS1203では、文字要素をグループ化して行および文字領域を作成する。ステップS1203の処理について、図21のフローチャートを用いて説明する。図21はステップS1203における文字領域の作成処理を説明するフローチャートである。
【0055】
ステップS2101では、各“CHAR”に対し、それぞれ隣り合う“CHAR”との水平距離が閾値内にあるもの同志をグループ化する。このグループを“TEXTLINE”と呼ぶ。但し、これらのグループ化は、同じ親を持つ“CHAR”間のみで行われる。
【0056】
次に、ステップS2102において、更にこの“TEXTLINE”同志で、それぞれ隣り合う垂直距離が閾値内にあるもの同志をグループ化する。こうして得られた“TEXTLINE”のグループを“TEXT”あるいは文字領域と呼ぶ。但し、これらのグループ化は同じ親をもつ“CHAR”からなる“TEXTLINE”の間のみで行う。
【0057】
以上の処理で、文書画像は文字領域である“TEXT”、線の画像部分である“LLINE”、図や写真の領域である“PICTURE”、表や枠の領域である“FRAME”という各要素に分割される。
【0058】
なお、ステップS2103における文字領域作成時のグループ化は、木構造を意識して行われるので、例えば図22のように、2値画像上の実線の枠=“FRAME1”がある場合、“FRAME1”内外それぞれの文字は必ず異なるグループとなる。すなわち、“TEXT1”と“TEXT3”、“TEXT2”と“TEXT4”のように異なる文字領域にグループ化される。
【0059】
同様に、図23におけるようなカラー画像の処理の場合、2値化処理後の画像上では枠となるような情報がなくても、ステップS1202における処理により、2値化処理時に得られた領域情報が領域分割に反映され、色下地上の文字は他と異なる文字領域となり、図22と同様な正しい領域分割結果が得られる。即ち、2値化処理部302によって、文書画像2301の2値画像2310が得られるとともに領域情報2320が得られる。2値画像2310を領域分割する際に、ステップS1202の処理により、領域情報2320が反映されて、2330に示す如く領域分割結果が得られる。
【0060】
もし、ステップS1202の処理を行わないで領域分割処理を行った場合は、下地の情報が反映されることがないので、図24のように誤った文字領域が得られることになる。
【0061】
以上説明したように、本実施形態によれば、カラー画像を2値化して領域分割処理を行う際に、2値化処理時に記憶された色付下地の領域情報を用いて領域分割処理の解析内容を変更するので、カラー画像の分割処理に際して2値化の際に失われてしまった情報をも正しく反映した文字領域の抽出が可能になり、より高精度な領域分割処理が可能になる。
【0062】
なお、上記実施形態によれば、2値化部302が保存する領域情報、および領域分割部303が処理する“FRAME”領域は四角形に限定していたが、これは矩形の任意連接体、あるいは円、楕円などの領域を対象とするようにしてもよい。この場合でも、カラー画像にあって、2値化の際に失われてしまった情報をも正しく反映した文字領域の抽出が可能になり、より高精度な領域分割処理が可能になる。
【0063】
なお、本発明は、複数の機器(例えばホストコンピュータ、インタフェイス機器、リーダ、プリンタなど)から構成されるシステムに適用しても、一つの機器からなる装置(例えば、複写機、ファクシミリ装置など)に適用してもよい。
【0064】
また、本発明の目的は、前述した実施形態の機能を実現するソフトウェアのプログラムコードを記録した記憶媒体(または記録媒体)を、システムあるいは装置に供給し、そのシステムあるいは装置のコンピュータ(またはCPUやMPU)が記憶媒体に格納されたプログラムコードを読み出し実行することによっても、達成されることは言うまでもない。この場合、記憶媒体から読み出されたプログラムコード自体が前述した実施形態の機能を実現することになり、そのプログラムコードを記憶した記憶媒体は本発明を構成することになる。また、コンピュータが読み出したプログラムコードを実行することにより、前述した実施形態の機能が実現されるだけでなく、そのプログラムコードの指示に基づき、コンピュータ上で稼働しているオペレーティングシステム(OS)などが実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
【0065】
さらに、記憶媒体から読み出されたプログラムコードが、コンピュータに挿入された機能拡張カードやコンピュータに接続された機能拡張ユニットに備わるメモリに書込まれた後、そのプログラムコードの指示に基づき、その機能拡張カードや機能拡張ユニットに備わるCPUなどが実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
【0066】
【発明の効果】
以上説明したように、本発明によれば、色によって表された領域の区別を維持した領域分割が可能となる。
【図面の簡単な説明】
【図1】本実施形態による文書処理装置の装置概観を示す図である。
【図2】本実施形態による文書処理装置の構成を示すブロック図である。
【図3】本実施形態の文書処理装置による文書の電子化処理の概要を示す図である。
【図4】本実施形態による2値化処理を説明するフローチャートである。
【図5】本実施形態の説明に用いるカラー文書画像の例を示す図である。
【図6】図5に示したカラー画像から得られる輝度値のヒストグラムを示す図である。
【図7】(a)は図5に示したカラー画像を図6に示す閾値t1で2値化した画像を示し、(b)は閾値t2で2値化した画像を示す図である。
【図8】図7の領域703における輝度値のヒストグラムを示す図である。
【図9】図7の領域704における輝度値のヒストグラムを示す図である。
【図10】領域情報を示す図である。
【図11】図5に示したカラー画像の最終的な2値画像を示す図である。
【図12】本実施形態の領域分割処理を説明するフローチャートである。
【図13】図12のステップS1201の要素抽出及び木構造化の処理を説明するフローチャートである。
【図14】黒画素の8連結輪郭塊の例を示す図である。
【図15】(a)黒画素塊の輪郭が四角形の場合と、(b)黒画素塊の輪郭が非四角形である場合の例を示す図である。
【図16】白画素の4連結輪郭塊の例を示す図である。
【図17】枠(FRAME)と図(PICTURE)における内部白画素塊の配置例を示す図である。
【図18】文書画像の例と、これをステップS1201の要素抽出、木構造化によって処理して得られる木構造の例を示す図である。
【図19】図12のステップS1202による木構造の変更処理を説明するフローチャートである。
【図20】上述した木構造変更処理の例を説明する図である。
【図21】ステップS1203における文字領域の作成処理を説明するフローチャートである。
【図22】枠領域を持つ文書の領域分割処理例を示す図である。
【図23】本実施形態により色付き下地領域を持つカラー文書が正しく領域分割される様子を示す図である。
【図24】一般的な手法により色付きの下地領域を持つカラー文書に領域分割を行った様子を説明する図である。
【図25】領域分割の一例を示す図である。

Claims (9)

  1. 輝度画像を2値化するための閾値を複数決定する第1決定手段と、
    前記第1決定手段で決定された複数の閾値それぞれを用いて前記輝度画像を2値化することにより、複数の2値画像を取得する取得手段と、
    前記取得手段で取得した複数の2値画像それぞれに含まれる黒画素の連結成分の領域に基づいて、下地の輝度が異なる各領域の位置と大きさ示す領域情報を生成する生成手段と、
    前記輝度画像における前記領域情報で示される各領域について、輝度値の反転を行うか否かを決定する第2決定手段と、
    前記輝度画像における前記領域情報で示される各領域について、当該各領域を2値化するための閾値をそれぞれ設定する設定手段と、
    前記輝度画像における前記領域情報で示される各領域について、前記第2決定手段で反転を行うと決定された領域に関しては、輝度値を反転した前記輝度画像内の対応する領域を、前記設定手段で当該領域に対して設定された閾値で2値化することにより2値部分画像を取得し、一方、前記第2決定手段で反転を行わないと決定された領域に関しては、輝度値を反転していない前記輝度画像内の対応する領域を、前記設定手段で当該領域に対して設定された閾値で2値化することにより2値部分画像を取得する2値部分画像取得手段と、
    前記輝度画像の全面を所定閾値で2値化して得られる2値画像における対応する領域に、前記2値部分画像取得手段で取得した各領域の2値部分画像を上書きすることにより、前記輝度画像に関する第2の2値画像を得る2値化手段と、
    前記2値化手段で得られた第2の2値画像から文書要素を抽出し、前記生成手段で生成された領域情報で示される各領域を枠の要素とし、前記文書要素と枠の要素とに基づいて木構造を得て、当該木構造に基づいて前記輝度画像の領域分割を行う分割処理手段とを備え、
    前記分割処理手段で得る木構造は、前記抽出した文書要素のうち前記領域情報で示される各領域に含まれる文書要素を当該各領域に対応する枠の要素の子孫にした木構造であることを特徴とする文書処理装置。
  2. 前記生成手段は、前記複数の2値画像それぞれに含まれる黒画素の連結成分の領域が所定サイズより大きい領域を、前記下地の輝度が異なる領域と判断して、当該下地の輝度が異なる領域の位置と大きさを表す領域情報を生成する
    ことを特徴とする請求項1に記載の文書処理装置。
  3. 前記設定手段は、前記輝度画像における前記領域情報で示される各領域のヒストグラムに基づいて、当該各領域を2値化するための閾値をそれぞれ設定する
    ことを特徴とする請求項1または2に記載の文書処理装置。
  4. 前記第2決定手段は、前記輝度画像における前記領域情報で示される各領域のヒストグラムに基づいて、当該各領域について輝度値の反転を行うか否かを決定する
    ことを特徴とする請求項1乃至のいずれか1項に記載の文書処理装置。
  5. 前記分割処理手段は、
    前記2値化手段で得られた第2の2値画像から前記文書要素を抽出して木構造を形成する形成手段と、
    前記形成手段で形成した木構造の中に前記領域情報で示される各領域を枠の要素として挿入し前記抽出された文書要素のうち前記領域情報で示される各文書要素を当該各領域に対応する枠の要素の子孫に移動することにより、前記木構造を変更する変更手段とを備え、
    前記変更手段で変更された木構造に基づいて領域分割を行う
    ことを特徴とする請求項1乃至4のいずれか1項に記載の文書処理装置。
  6. カラー画像を前記輝度画像に変換する変換手段を更に備えることを特徴とする請求項1乃至のいずれか1項に記載の文書処理装置。
  7. 前記第1決定手段は、前記輝度画像のヒストグラムをとり、当該ヒストグラムから前記複数の閾値を決定することを特徴とする請求項1乃至のいずれか1項に記載の文書処理装置。
  8. 第1決定手段が、輝度画像を2値化するための閾値を複数決定する第1決定工程と、
    取得手段が、前記第1決定工程で決定された複数の閾値それぞれを用いて前記輝度画像を2値化することにより、複数の2値画像を取得する取得工程と、
    生成手段が、前記取得工程で取得した複数の2値画像それぞれに含まれる黒画素の連結成分の領域に基づいて、下地の輝度が異なる各領域の位置と大きさ示す領域情報を生成する生成工程と、
    第2決定手段が、前記輝度画像における前記領域情報で示される各領域について、輝度値の反転を行うか否かを決定する第2決定工程と、
    設定手段が、前記輝度画像における前記領域情報で示される各領域について、当該各領域を2値化するための閾値をそれぞれ設定する設定工程と、
    2値部分画像取得手段が、前記輝度画像における前記領域情報で示される各領域について、前記第2決定工程で反転を行うと決定された領域に関しては、輝度値を反転した前記輝度画像内の対応する領域を、前記設定工程で当該領域に対して設定された閾値で2値化することにより2値部分画像を取得し、一方、前記第2決定工程で反転を行わないと決定された領域に関しては、輝度値を反転していない前記輝度画像内の対応する領域を、前記設定工程で当該領域に対して設定された閾値で2値化することにより2値部分画像を取得する2値部分画像取得工程と、
    2値化手段が、前記輝度画像の全面を所定閾値で2値化して得られる2値画像における対応する領域に、前記2値部分画像取得工程で取得した各領域の2値部分画像を上書きすることにより、前記輝度画像に関する第2の2値画像を得る2値化工程と、
    分割処理手段が、前記2値化工程で得られた第2の2値画像から文書要素を抽出し、前記生成工程で生成された領域情報で示される各領域を枠の要素とし、前記文書要素と枠の要素とに基づいて木構造を得て、当該木構造に基づいて前記輝度画像の領域分割を行う分割処理工程とを有し、
    前記分割処理工程で得る木構造は、前記抽出した文書要素のうち前記領域情報で示される各領域に含まれる文書要素を当該各領域に対応する枠の要素の子孫にした木構造であることを特徴とする文書処理方法。
  9. コンピュータを、
    輝度画像を2値化するための閾値を複数決定する第1決定手段、
    前記第1決定手段で決定された複数の閾値それぞれを用いて前記輝度画像を2値化することにより、複数の2値画像を取得する取得手段と
    前記取得手段で取得した複数の2値画像それぞれに含まれる黒画素の連結成分の領域に基づいて、下地の輝度が異なる各領域の位置と大きさ示す領域情報を生成する生成手段、
    前記輝度画像における前記領域情報で示される各領域について、輝度値の反転を行うか否かを決定する第2決定手段、
    前記輝度画像における前記領域情報で示される各領域について、当該各領域を2値化するための閾値をそれぞれ設定する設定手段、
    前記輝度画像における前記領域情報で示される各領域について、前記第2決定手段で反転を行うと決定された領域に関しては、輝度値を反転した前記輝度画像内の対応する領域を、前記設定手段で当該領域に対して設定された閾値で2値化することにより2値部分画像を取得し、一方、前記第2決定手段で反転を行わないと決定された領域に関しては、輝度値を反転していない前記輝度画像内の対応する領域を、前記設定手段で当該領域に対して設定された閾値で2値化することにより2値部分画像を取得する2値部分画像取得手段、
    前記輝度画像の全面を所定閾値で2値化して得られる2値画像における対応する領域に、前記2値部分画像取得手段で取得した各領域の2値部分画像を上書きすることにより、前記輝度画像に関する第2の2値画像を得る2値化手段、
    前記2値化手段で得られた第2の2値画像から文書要素を抽出し、前記生成手段で生成された領域情報で示される各領域を枠の要素とし、前記文書要素と枠の要素とに基づいて木構造を得て、ここで、前記木構造は、前記抽出した文書要素のうち前記領域情報で示される各領域に含まれる文書要素を当該各領域に対応する枠の要素の子孫にした木構造であり、当該木構造に基づいて前記輝度画像の領域分割を行う分割処理手段、
    として機能させるためのプログラムを格納した、コンピュータ読取り可能な記憶媒体。
JP2000388887A 2000-12-21 2000-12-21 文書処理装置及び方法 Expired - Fee Related JP4366011B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2000388887A JP4366011B2 (ja) 2000-12-21 2000-12-21 文書処理装置及び方法
US10/013,675 US7170647B2 (en) 2000-12-21 2001-12-13 Document processing apparatus and method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000388887A JP4366011B2 (ja) 2000-12-21 2000-12-21 文書処理装置及び方法

Publications (3)

Publication Number Publication Date
JP2002190957A JP2002190957A (ja) 2002-07-05
JP2002190957A5 JP2002190957A5 (ja) 2008-02-14
JP4366011B2 true JP4366011B2 (ja) 2009-11-18

Family

ID=18855549

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000388887A Expired - Fee Related JP4366011B2 (ja) 2000-12-21 2000-12-21 文書処理装置及び方法

Country Status (2)

Country Link
US (1) US7170647B2 (ja)
JP (1) JP4366011B2 (ja)

Families Citing this family (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3950777B2 (ja) * 2002-09-30 2007-08-01 キヤノン株式会社 画像処理方法、画像処理装置および画像処理プログラム
JP4423076B2 (ja) * 2004-03-22 2010-03-03 キヤノン株式会社 認識対象切出し装置および方法
JP4713107B2 (ja) * 2004-08-20 2011-06-29 日立オムロンターミナルソリューションズ株式会社 景観中文字列認識方式および装置
US7848567B2 (en) * 2004-09-23 2010-12-07 Fuji Xerox Co., Ltd. Determining regions of interest in synthetic images
KR101037936B1 (ko) 2004-11-16 2011-05-30 삼성전자주식회사 컬러문서의 선택적 스캔 시스템 및 방법
JP4646797B2 (ja) * 2005-02-01 2011-03-09 キヤノン株式会社 画像処理装置及びその制御方法、プログラム
US7570403B2 (en) * 2005-03-16 2009-08-04 Kabushiki Kaisha Toshiba Color image processing apparatus
TWI289809B (en) * 2005-07-05 2007-11-11 Compal Electronics Inc A method for undistorting image frame
JP4717562B2 (ja) * 2005-09-02 2011-07-06 キヤノン株式会社 画像処理装置及び方法
JP5215545B2 (ja) * 2006-09-13 2013-06-19 Towa株式会社 電子部品の装着状況の検査方法
US20090007128A1 (en) * 2007-06-28 2009-01-01 International Business Machines Corporation method and system for orchestrating system resources with energy consumption monitoring
JP4960817B2 (ja) 2007-09-19 2012-06-27 キヤノン株式会社 画像処理装置、および画像処理方法
US8262457B2 (en) 2007-11-01 2012-09-11 Wms Gaming Inc. Wagering game apparatus and method to provide a trusted gaming environment
JP5656353B2 (ja) * 2007-11-07 2015-01-21 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation マルチリンガル・テキスト・リソースのアクセスを制御するための方法および装置
JP5121599B2 (ja) 2008-06-30 2013-01-16 キヤノン株式会社 画像処理装置、画像処理方法およびそのプログラムならびに記憶媒体
JP5572926B2 (ja) * 2008-07-18 2014-08-20 カシオ計算機株式会社 表示装置、表示方法及びプログラム
US8103098B2 (en) * 2008-09-03 2012-01-24 Primax Electronics Ltd. Method for generating a non-graphical digital image from an original digital image
JP5208043B2 (ja) * 2009-04-16 2013-06-12 キヤノン株式会社 画像処理装置、画像処理方法及びプログラム
JP5462522B2 (ja) * 2009-05-07 2014-04-02 キヤノン株式会社 画像処理装置、画像処理方法、当該画像処理方法をコンピュータに実現させるためのプログラム
JP5462557B2 (ja) * 2009-09-03 2014-04-02 キヤノン株式会社 画像処理装置及びその制御方法
JP5511450B2 (ja) * 2010-03-16 2014-06-04 キヤノン株式会社 画像処理装置、画像処理方法及びプログラム
JP5733907B2 (ja) 2010-04-07 2015-06-10 キヤノン株式会社 画像処理装置、画像処理方法、コンピュータプログラム
US9367899B1 (en) * 2015-05-29 2016-06-14 Konica Minolta Laboratory U.S.A., Inc. Document image binarization method
CN105761230B (zh) * 2016-03-16 2018-12-11 西安电子科技大学 基于天空区域分割处理的单幅图像去雾方法
JP6452657B2 (ja) * 2016-09-07 2019-01-16 キヤノン株式会社 画像処理装置、その制御方法、及びプログラム
US10838699B2 (en) 2017-01-18 2020-11-17 Oracle International Corporation Generating data mappings for user interface screens and screen components for an application
US10489126B2 (en) * 2018-02-12 2019-11-26 Oracle International Corporation Automated code generation
CN111476067B (zh) * 2019-01-23 2023-04-07 腾讯科技(深圳)有限公司 图像的文字识别方法、装置、电子设备及可读存储介质
CN113554658B (zh) * 2020-04-23 2024-06-14 北京达佳互联信息技术有限公司 图像处理方法、装置、电子设备及存储介质
CN111611783B (zh) * 2020-06-18 2023-04-25 山东旗帜信息有限公司 一种图形表格的定位分割方法及装置

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5617485A (en) * 1990-08-15 1997-04-01 Ricoh Company, Ltd. Image region segmentation system
JP3100391B2 (ja) * 1990-08-15 2000-10-16 株式会社リコー カラー画像の領域分離装置
US5680479A (en) * 1992-04-24 1997-10-21 Canon Kabushiki Kaisha Method and apparatus for character recognition
US5872864A (en) * 1992-09-25 1999-02-16 Olympus Optical Co., Ltd. Image processing apparatus for performing adaptive data processing in accordance with kind of image
JP3258122B2 (ja) * 1993-03-31 2002-02-18 株式会社東芝 画像処理装置
US5768412A (en) * 1994-09-19 1998-06-16 Hitachi, Ltd. Region segmentation method for particle images and apparatus thereof
US5848185A (en) * 1994-12-28 1998-12-08 Canon Kabushiki Kaisha Image processing apparatus and method
US5920655A (en) * 1995-02-10 1999-07-06 Canon Kabushiki Kaisha Binarization image processing for multi-level image data
JPH11238581A (ja) 1998-02-23 1999-08-31 Matsushita Electric Works Ltd 出力容量増幅器
US6360006B1 (en) * 1998-09-29 2002-03-19 Canon Kabushiki Kaisha Color block selection
JP4018310B2 (ja) * 1999-04-21 2007-12-05 株式会社リコー 画像二値化装置、画像撮像装置、画像二値化方法、画像撮像方法およびその方法の各工程としてコンピュータを機能させるためのプログラムを記録したコンピュータ読取可能な記録媒体
JP3708363B2 (ja) * 1999-05-07 2005-10-19 シャープ株式会社 カラー画像形成装置
US6473522B1 (en) * 2000-03-14 2002-10-29 Intel Corporation Estimating text color and segmentation of images
GB2364416B (en) * 2000-06-30 2004-10-27 Post Office Image processing for clustering related text objects
JP3904840B2 (ja) * 2000-08-15 2007-04-11 富士通株式会社 多値画像から罫線を抽出する罫線抽出装置
US6580433B2 (en) * 2001-03-06 2003-06-17 Mitsubishi Heavy Industries, Ltd. Automatic reverse method for reversing the black-and-white monochrome image, and printer unit using the same
US6983078B2 (en) * 2001-05-01 2006-01-03 Hewlett-Packard Development Company, L.P. System and method for improving image quality in processed images

Also Published As

Publication number Publication date
US20020085243A1 (en) 2002-07-04
JP2002190957A (ja) 2002-07-05
US7170647B2 (en) 2007-01-30

Similar Documents

Publication Publication Date Title
JP4366011B2 (ja) 文書処理装置及び方法
JP4646797B2 (ja) 画像処理装置及びその制御方法、プログラム
US7903307B2 (en) Image processing method and image processing apparatus
JP3950777B2 (ja) 画像処理方法、画像処理装置および画像処理プログラム
JP2003132358A (ja) 画像処理方法、装置およびシステム
JP2003152995A (ja) 画像処理装置
EP0949579A2 (en) Multiple size reductions for image segmentation
JP4632443B2 (ja) 画像処理装置及び画像処理方法並びにプログラム
JP3753357B2 (ja) 文字抽出方法および記録媒体
JP2010056827A (ja) 画像処理装置および画像処理プログラム
JP3715905B2 (ja) 画像処理装置、画像処理方法、プログラム並びに記憶媒体
US6360006B1 (en) Color block selection
JP2003018412A (ja) 画像圧縮装置及び画像圧縮方法並びにプログラムコード、記憶媒体
JP2003244447A (ja) 画像処理装置及び画像処理方法
JP4441300B2 (ja) 画像処理装置、画像処理方法、画像処理プログラムおよびこのプログラムを記憶した記録媒体
JP4693289B2 (ja) 画像圧縮装置及び画像圧縮方法並びにプログラムコード、記憶媒体
JP4208520B2 (ja) 画像処理装置および画像処理方法、プログラムおよび記憶媒体
US8295602B2 (en) Image processing apparatus and image processing method
JP2003046746A (ja) 画像処理方法及び画像処理装置
JP4228905B2 (ja) 画像処理装置及びプログラム
JP2003338934A (ja) 画像処理装置および方法
JP2006345456A (ja) 画像処理装置、方法、プログラム及び記憶媒体
JP2001043312A (ja) 文書画像処理装置
JP4587167B2 (ja) 画像処理装置及び画像処理方法
JP4027016B2 (ja) 画像処理装置、画像処理方法及び記憶媒体

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20071221

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20071221

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20071221

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20080829

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20090327

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20090403

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090601

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090807

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090824

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120828

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120828

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130828

Year of fee payment: 4

LAPS Cancellation because of no payment of annual fees