JP4731748B2 - 画像処理装置、方法、プログラム及び記憶媒体 - Google Patents

画像処理装置、方法、プログラム及び記憶媒体 Download PDF

Info

Publication number
JP4731748B2
JP4731748B2 JP2001212035A JP2001212035A JP4731748B2 JP 4731748 B2 JP4731748 B2 JP 4731748B2 JP 2001212035 A JP2001212035 A JP 2001212035A JP 2001212035 A JP2001212035 A JP 2001212035A JP 4731748 B2 JP4731748 B2 JP 4731748B2
Authority
JP
Japan
Prior art keywords
ruled line
extracted
histogram
image
row direction
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2001212035A
Other languages
English (en)
Other versions
JP2003030585A (ja
Inventor
裕章 池田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2001212035A priority Critical patent/JP4731748B2/ja
Publication of JP2003030585A publication Critical patent/JP2003030585A/ja
Application granted granted Critical
Publication of JP4731748B2 publication Critical patent/JP4731748B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Character Input (AREA)
  • Image Analysis (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、文書上の記入枠内にあらかじめ印刷された文字等(プレプリント)を含まないように記入された文字画像を切り出して、読み取りを行うための画像処理装置、方法、プログラム及び記憶媒体に関するものである。
【0002】
【従来の技術】
申し込み用紙や帳票などの文書には、あらかじめ記入項目を示す文字等がプレプリントされており、記入者はその項目に応じた内容を記入するようになっている。
【0003】
このような帳票にユーザが記入した文字を自動的に読み取るようにするため、記入枠やプレプリントされた文字をドロップアウトカラーで印刷して、ユーザが記入した文字のみを読み取るようにしたものが一般的に用いられているが、ドロップアウトカラーを用いる場合、専用の色を用いて帳票をデザインして印刷し、また、ドロップアウトカラーの帳票を読み取れる専用のイメージスキャナを使用する必要があるためコストがかかっていた。
【0004】
そのためドロップアウトカラーを用いない帳票であっても、ユーザが記入した文字を読み取ることが可能な読み取り方法が望まれている。
【0005】
特開平9−259220号公報では、多値濃淡画像で文書を読み取り、記入文字部とプレプリント部の濃淡情報の差異に基づき、文字部とプレプリント部とを分離するように構成されている。
【0006】
また、特開平9−231291号公報では、抽出した文字を文字認識し、該文字が活字であると認識すればプレプリントされた文字であると判定するように構成されている。
【0007】
【発明が解決しようとする課題】
しかしながら、上記特開平9−259220号公報では、記入文字部とプレプリント部の濃淡情報に違いがあることが前提で、プレプリント部とほぼ同等の濃度で手書きされたもの、あるいはプリンタ等を使用し、プレプリントされた文書にプレプリント部とほぼ同等の濃度で文字が記入印刷されたものは文字部とプレプリント部を分離できないという問題点があった。
【0008】
また、上記特開平9−231291号公報では、記入文字部が手書きであることが前提となっており、プリンタ等を使用して記入された文字はプレプリント部と区別できないという問題点があった。
【0009】
本発明は上記の課題を解消するためになされたもので、記入枠内にあるプレプリント文字を分離し、記入枠内に記入された文字を区別して読み取ることを目的とする。
【0010】
【課題を解決するための手段】
上記課題を解決するために、本発明の画像処理装置は、2値の文書画像から行方向の罫線を抽出する行方向罫線抽出手段と、前記抽出された行方向罫線の間の領域から列方向の罫線を抽出する列方向罫線抽出手段と、前記抽出された行方向罫線および列方向罫線に囲まれ且つ該罫線を除いた領域を記入枠領域とし、該記入枠領域に対して行方向に射影してヒストグラムをとるヒストグラム取得手段と、前記ヒストグラムのブランク部分を判断し、前記ヒストグラムにおいて当該判断したブランク部分より上側の部分の大きさと当該判断したブランク部分より下側の部分の大きさとを比較し、小さい方の部分を該記入枠領域内のプレプリント部分とし、大きい方の部分を該記入枠領域内の記入文字部分として区別する区別手段とを有することを特徴とする。
【0011】
上記課題を解決するために、本発明の画像処理方法は、行方向罫線抽出手段が、2値の文書画像から行方向の罫線を抽出する行方向罫線抽出ステップと、列方向罫線抽出手段が、前記抽出された行方向罫線の間の領域から列方向の罫線を抽出する列方向罫線抽出ステップと、ヒストグラム取得手段が、前記抽出された行方向罫線および列方向罫線に囲まれ且つ該罫線を除いた領域を記入枠領域とし、該記入枠領域に対して行方向に射影してヒストグラムをとるヒストグラム取得ステップと、区別手段が、前記ヒストグラムのブランク部分を判断し、前記ヒストグラムにおいて当該判断したブランク部分より上側の部分の大きさと当該判断したブランク部分より下側の部分の大きさとを比較し、小さい方の部分を該記入枠領域内のプレプリント部分とし、大きい方の部分を該記入枠領域内の記入文字部分として区別する区別ステップとを有することを特徴とする。
【0012】
【発明の実施の形態】
[第1の実施形態]
図1は本実施形態における文書を読み取るための画像処理装置の構成を示すブロック図である。101はROM102に格納されている制御プログラムに従って本装置全体の制御を行うCPU、102はCPU101に後述するフローチャートに示す処理を実行させるためのプログラム等を格納するROM、103はCPUが処理を行う際のワークエリアとして用いたり文書画像データ等を記憶したりするRAM、104は磁気ディスク等の外部記憶装置であり、105はディスプレイ、106はキーボード、107はマウス等のポインティングデバイス、108は画像を読み取るためのイメージスキャナである。また、109はネットワークインターフェースであり、図示しない遠隔地に存在する装置と通信し、プログラムやデータなどを読み込んだり、書き込んだりする。
【0013】
図11は、各種データ処理プログラムを格納するROM102のメモリマップである。なお、特に図示しないが、各種プログラムに従属するデータも上記ディレクトリに管理されている。なお、本実施形態では、ROMにプログラムが格納されているものとしたが、このプログラムは、フロッピーディスクやCD−ROMなどの外部記憶媒体に格納され、必要に応じて読み込まれて実行されるものであってもよいし、ネットワークを介して外部装置から受信されて実行されるものであってもよい。
【0014】
次に、上述したような画像処理装置において実現される第1の実施形態について、図2乃至図10を用いて説明する。
【0015】
図2は、文字記入枠を抽出し、文字記入枠内に記入された文字を切り出す方法を示すフローチャートである。また、図5は、本実施形態が処理する帳票の記入枠部分を一例として示したものであり、501は文字記入枠、502は処理を行う範囲を示している。
【0016】
ステップS201では、イメージスキャナ108等の光電変換装置から読み込まれ二値化された画像(以下「二値画像」)、あるいは、すでに読み込まれ外部記憶装置104等に記憶している二値画像の処理範囲502から横方向の罫線(以下「横罫線」)を抽出する。
【0017】
ステップS201での横罫線抽出処理の一例を図3のフローチャートに示す。
【0018】
ステップS301では、二値画像に対し、処理範囲502を縦方向の短冊状に分割する。図6(A)は図5の帳票の一例を縦方向の短冊状に分割したことを示す図である。図6(B)及び図6(E)は、処理範囲502の短冊状に分割した領域の1つ(602_1及び602_2)を示す。
【0019】
ステップS302では、短冊領域毎に水平方向に射影を取り黒画素の度数分布を作成する。図6(C)は、図6(B)の短冊領域602_1の範囲内の水平方向射影に対する黒画素の度数分布(ヒストグラム)を示し、図6(F)は、図6(E)の短冊領域602_2の範囲内の水平方向射影に対する黒画素の度数分布(ヒストグラム)を示す。
【0020】
ステップS303で、この度数分布と閾値SHとを比較し、黒画素の度数が所定の閾値SH以上あれば、その範囲である図6(B)の604_11、604_12および図6(E)の604_21、604_22を罫線の断片とする。図6(D)及び図6(G)は、それぞれ図6(B)の短冊領域602_1および図6(E)の短冊領域602_2に含まれる横罫線の断片を抽出した図である。
【0021】
ステップS304で隣り合う短冊同士で、行方向に連続性のある罫線断片が存在するか判断し、存在すればステップS305に進み、存在しなければステップS308に進む。
【0022】
ステップS305にて、連続性のある罫線断片の太さがほぼ同じであるか判断し、ほぼ同じであれば、ステップS306でそれらを結合していく。すなわち、ステップS303で抽出された短冊602_1の2本の罫線断片の太さをそれぞれWk11,Wk12(図6(C))、短冊602_2の2本の罫線断片の太さをWk21、Wk22(図6(F))としたとき、Wk11=Wk21なら、604_11は604_21と、また、Wk12=Wk22なら、604_12は604_22とそれぞれ結合する。ここで上述の「連続性がある」とは、隣り合う短冊間の短冊境界線において各短冊内の罫線断片が縦方向に重複した部分を有する(罫線断片の存在する縦軸方向の位置がほぼ同じ)ことをいう。また、結合とは、短冊毎の罫線断片が連続性のある1つの直線であると認識することをいう。
【0023】
罫線断片の太さが異なると判断された場合は、ステップS307で太い罫線断片を細い罫線断片の位置および太さと同じであると仮定して結合を続けていく。
【0024】
複数の短冊領域に対して順次ステップS304〜S307の処理を行い、結合できる罫線断片がなくなった時点で、ステップS308に進む。
【0025】
一方、上記のような罫線断片の抽出方法では、本来、抽出すべき横罫線以外のものを罫線断片として抽出することが起こり得る。すなわち、例えば文字記入枠に記入された文字「7」の横棒部分は、各短冊内における水平方向の黒画像の度数が多く、黒画素の度数が所定値SH以上となる場合があり、それらも罫線の断片と認識され抽出されてしまうことがある。このように、上記罫線断片抽出方法にて抽出された横罫線断片は、本来の横罫線断片以外の断片も含んでいる場合があり、処理範囲502から抽出されて結合された横罫線断片は、図8(A)のようになる。ここで、最終的に抽出すべき横罫線であるかどうかは、予め罫線の最低の長さを決めておくか、あるいは処理範囲502の幅AWを基準にした閾値を決めるなどして判断する。すなわち、ステップS308にて、長さの短い罫線断片結合が除去される。図8(B)は、ステップS308にて長さの短い罫線断片結合が除去されたことを示す図である。この結果、本来抽出すべき横罫線を抽出することができる。
【0026】
ステップS309において、このようにして求めた横罫線を横罫線の位置や太さ、長さを記憶する。
【0027】
図2に戻って、ステップS202において、ステップS201で抽出された横罫線が2本以上存在するかどうか判断する。横罫線が2本抽出できなかった場合は、文字記入枠が存在しないとして処理を終了する。
【0028】
横罫線が2本以上存在すると判断した場合は、ステップS203に進み、横罫線間の領域から縦方向の罫線(以下「縦罫線」)を抽出する。縦罫線抽出処理を、図4のフローチャートを用いて説明する。
【0029】
ステップS401で、抽出した2つの横罫線間の領域で、垂直方向に射影し黒画素の度数分布(ヒストグラム)を取る。このとき、横罫線抽出処理で求めた2本の横罫線部分は度数に含まないようにする。図9は、図5において横罫線抽出処理で求められた2本の横罫線(図8)の間の領域に対して、垂直方向のヒストグラムを取った結果である。
【0030】
ステップS402で、射影が存在する部分の度数の平均値をTbとして求める。さらにステップS403で、閾値Tbより大きいヒストグラムの山の部分を取り出し(901〜912)、その個数をNとする。まず閾値Tbを使うことにより、明らかに縦罫線ではない部分(914、913)が除かれる。ステップS404で個数Nが0より大きいか否か判断し、Nが0なら縦罫線はないとして処理は終了する。Nが0より大きい場合には、ステップS405に進み、Tbより大きい部分N個のうち上位N/2個分の度数の平均値をTpとして求める。ステップS406でTpより度数が大きい部分(901〜908、910、911)を山の部分のピークとして取り出す。このTpを用いることにより、1つの山の部分に複数の縦罫線のピークが含まれている場合に各ピークを別々に取り出すことができる。例えば、記入枠に大きく文字が記入されて、記入された文字の両側にある縦罫線が1つの山部分としてステップS403で取り出された場合などにおいても、縦罫線を2本取り出すことができる。
【0031】
そして、各山のピーク付近の分布形状を調べ、その形状がなだらかであれば縦罫線候補からはずす。図9の山911は最大度数付近の度数も大きくなだらかな形状となっているので縦罫線候補から外される。結果として図9では、901〜908及び910が縦罫線候補として抽出される。
【0032】
なお、上述の手順では1つのTpを決めて用いていたが、ステップS402で取り出された山の部分毎にTpを定めるようにしてもよい。例えば、ステップS403で取り出されたTb以上のヒストグラムの山の部分(901〜912)のそれぞれに対して、各山部分の最大値の80%を閾値Tpとして求めるようにしてもよい。その場合、909は2つのピークが取り出されることになるが、ピーク付近の分布形状がなだらかなので、縦罫線候補から外されることになる。
【0033】
ステップS407では、縦罫線候補が抽出されたかどうか判断し、抽出されていれば、ステップS408に進んで、それらの位置、太さ、長さを記憶する。抽出されていなければ縦罫線はないとして終了する。
【0034】
図2に戻って、ステップS204では、ステップS203で抽出された縦罫線候補が2本以上存在するか否かを判断し、2本以上存在しない場合には、文字記入枠が存在しないとして処理を終了する。
【0035】
縦罫線候補が2本以上存在した場合には、ステップS205にて、抽出した横罫線と縦罫線で囲まれた内側部分を文字記入枠領域として抽出する。図10の1001〜1008は、抽出した文字記入枠領域の大きさを図示したものである。
図9の910が閾値Tpより大きく、縦罫線候補となっているので、1004と1005は、実際の文字記入枠領域を二分割した形となっている。
【0036】
ステップS206において、抽出された文字記入枠領域の幅から標準ピッチを求める。ピッチとは、隣り合う縦罫線間の距離、すなわち各文字記入枠領域の幅である。標準ピッチは、各文字記入枠のピッチの統計をとって決定する。すなわち、処理を行う範囲502内の文字記入枠のピッチは、すべて均等であるという前提のもと、文字記入枠のピッチの統計をとって、最大分布となる文字記入枠の幅を標準ピッチとする。
【0037】
ステップS207において、標準ピッチに基づいて、分割されている文字記入枠領域は結合される。したがって、図10の1004と1005は結合されることになる。
【0038】
ステップS208において、各文字記入枠内の黒画素が連結した画像を抽出する。
【0039】
ステップS209において、文字記入枠内に黒画素連結画像があるかどうか判断し、画像がなければ、ステップS210に進んで、その文字記入枠を空欄とする。
【0040】
一方、ステップS209で文字記入枠内に画像があると判断すれば、ステップS211に進み、抽出された画像からプレプリント部分を除去する。抽出された画像からプレプリント部分を除去する手順を図7のフローチャートを用いて説明する。
【0041】
ステップS701で、画像が存在する記入枠内について、ステップS208で抽出された記入枠内の領域それぞれに対して、水平方向に射影してヒストグラムを取り、各記入枠の上端を基準原点としてヒストグラムを累積していく。つまり、罫線を除いた記入枠領域の水平方向のヒストグラムが得られる。なお、ここで各記入枠の上端を基準としてヒストグラムを累積しているのは、画像が傾いている場合に記入枠の位置が上下にずれるのに対応するためである。図13に、罫線を除いた記入枠領域の水平方向ヒストグラムを示す。
【0042】
ステップS702において、S701で得られたヒストグラムから最大の幅を持つブランク部分を見つける。理想的には、射影が全く存在しない部分をブランクとするが、ノイズがある場合や、プレプリント部分と記入文字部分の一部が接触している場合等を考慮して、ブランク部分を判断するための度数の閾値を数個にする(例えば度数が5個までの部分はブランクとして判断する)ようにしてもよい。
【0043】
ステップS703において、ブランクが見つかったかどうかを判断し、見つからなければ、プレプリント部分が存在しないと判断し、処理を終了する。また、見つけられた最大のブランクの幅が、あらかじめ定めた閾値以下の場合もブランクが存在しないとして判断する。
【0044】
ステップS703でブランクが見つかったと判断した場合、ステップS704に進み、ブランクの位置からプレプリント部の位置を決定する。すなわち、プレプリント文字は記入文字より小さな文字であることが多いので、本実施形態では、ヒストグラムの上端座標をTh、下端座標をBh、ブランクの上端座標をt、下端座標をbとすると、|t−Th|<|Bh−b|ならブランクの上がプレプリント部、そうでなければブランクの下がプレプリント部とする。(なお、本実施形態ではヒストグラムの垂直軸の下方向にいくほど座標値は大きくなるようにとっている)。
【0045】
ステップS705で、ステップS208で抽出された画像を記入文字部分とプレプリント部分に分割する。例えば、ブランクの上端t及び下端bに基づいて、分割基準位置となる閾値th、bhを定めて、ステップS704でブランクの上側がプレプリント部であるとした場合、抽出された画像の下端がbhよりも上なら、その画像はプレプリント部分であるとし、抽出された画像の上端がthよりも下なら、その画像は記入された文字部分であるとする。なお、閾値はth=t、bh=bとしてもよいし、th=t+A、bh=b−A’(A、A’は誤差を考慮して経験的に求めた値)としてもよい。また、thとbhが同じ値になるようにしてもよく、例えば、th=bh=(tとbの中間位置)とするようにしてもよい。
【0046】
なお、プレプリント部分の下の文字記入枠内に文字が記入されていた場合、ステップS208では文字記入枠毎に黒画素連結画像を抽出するので、抽出された文字記入枠内の画像にはプレプリント部分黒画素連結画像と記入文字部分黒画素連結画像の両方が含まれているが、この場合、th≦c≦bhなるcで画像を分割する。このcは、その画像の水平方向の射影を取って射影がブランクになる部分からcを選んで、画像を分割する。
【0047】
また、プレプリント部分の下の文字記入枠内に文字が記入されていた場合で、且つプレプリント部分に接触して文字が記入されていた場合、ステップS208で抽出された画像には、プレプリント部分と記入文字部分とが含まれるが、この場合、その画像を囲む最少矩形領域において水平方向に射影してヒストグラムをとって、thとbhの間でヒストグラムが最少となる個所c(th≦c≦bh)で、その画像を分割する。このように、記入欄全体のヒストグラムに基づいて、プレプリント部分と記入文字部分との境界位置を予測する(S704)ことによって、記入文字がプレプリント部分と接触している画像においても、記入文字とプレプリント部分を分離することができる。
【0048】
ステップS706において、プレプリント部分があったか判断し、プレプリント部分があれば、ステップS707に進んで、ステップS208で抽出された画像からプレプリント部分を除去する。
【0049】
図2に戻って、上述したようにステップS211でプレプリント部分を除去した後、ステップS212で、文字記入枠内の残った画像(記入文字部分)が存在するか調べる。画像がなければ、ステップS210に進み、その文字記入枠を空欄とする。画像があれば、ステップS213に進み、その文字記入枠内の画像を記入文字画像とする。
【0050】
更に、以上のようにして抽出した記入文字画像に対して、文字認識処理を実行して文字コードを出力し、帳票解析などの処理を行なう。
【0051】
以上説明したように、罫線を除いた記入枠内の画像に対して、水平方向のヒストグラムを取って、そのヒストグラムからプレプリント部の位置を決定するので、文字を記入する部分が1文字毎に区切られた形状のもので、なおかつプレプリントの位置が記入枠の上部であっても下部であっても、記入文字部分を正しく抽出できる効果がある。
【0052】
また、本実施形態により罫線内部領域の上端を原点にして抽出画像のヒストグラムを取るので、画像に傾きがあってもプレプリント部の位置を正しく決定できる効果がある。
【0053】
なお、本実施形態では文字記入枠を構成する垂直罫線が、上部で水平方向の罫線に接しない形状の例を用いて説明したが、図12にあるように、垂直罫線が上部の水平方向の罫線に接していても、同様の処理で記入された文字画像のみを抽出できることは言うまでもない。また、縦罫線が点線であっても本発明を適用できる。
【0054】
また、本実施形態では横書きの文字記入枠について説明したが、縦書きであっても処理方向を変えれば同様の処理で記入文字画像を抽出できることは用意に想像できる。
【0055】
また、プレプリント部分が文字ではなく、記号や絵などであっても本実施形態を適用可能である。
【0056】
[第2の実施形態]
第1の実施形態では、プレプリント部分を除去していたが、プレプリント部分をプレプリント文字として抽出して文字認識処理を施すことも可能である。
【0057】
具体的には、図2のステップS211(図7のステップS707)において、プレプリント部分を除去する代わりに、プレプリント部分を抽出するようにすればよい。
【0058】
そして、抽出したプレプリント部分に対して文字認識処理を行い、例えば、ステップS213で抽出する記入文字のインデックス情報として付加したり、項目の照合に利用したりすることができる。
【0059】
以上説明したように、プレプリント部分および記入文字部分を区別して抽出することができる。また、プレプリント部分の文字を文字認識処理して、その後の処理に役立てることができる。
【0060】
【発明の効果】
以上説明したように、本発明によれば、文字記入枠の位置や大きさをあらかじめ正確に求め、帳票定義として記憶しておかなくても、文字記入枠内のプレプリント部分と記入文字部分とを区別して、正しく抽出することができる。
【図面の簡単な説明】
【図1】本発明の実施形態に係る画像処理装置のブロック図である。
【図2】記入文字抽出手順を示すフローチャートである。
【図3】横罫線抽出手順を示すフローチャートである。
【図4】縦罫線抽出手順を示すフローチャートである。
【図5】帳票の一例を示す図である。
【図6】横罫線抽出時の処理を説明するための図である。
【図7】プレプリント除去手順を示すフローチャートである。
【図8】横罫線を抽出した状態を示す図である。
【図9】縦罫線抽出時の処理を説明するための図である。
【図10】文字記入枠領域を決定する際の説明図である。
【図11】本画像処理装置で読みだし実行可能な各種データ処理プログラムを格納する記憶媒体のメモリマップを説明する図である。
【図12】帳票の一例を示す図である。
【図13】プレプリント除去(抽出)手順を説明するための図である。
【符号の説明】
101 CPU
102 ROM
103 RAM
104 外部記憶装置
105 ディスプレイ
106 キーボード
107 ポインティングデバイス
108 イメージスキャナ
109 ネットワークインターフェース

Claims (16)

  1. 2値の文書画像から行方向の罫線を抽出する行方向罫線抽出手段と、
    前記抽出された行方向罫線の間の領域から列方向の罫線を抽出する列方向罫線抽出手段と、
    前記抽出された行方向罫線および列方向罫線に囲まれ且つ該罫線を除いた領域を記入枠領域とし、該記入枠領域に対して行方向に射影してヒストグラムをとるヒストグラム取得手段と、
    前記ヒストグラムのブランク部分を判断し、前記ヒストグラムにおいて当該判断したブランク部分より上側の部分の大きさと当該判断したブランク部分より下側の部分の大きさとを比較し、小さい方の部分を該記入枠領域内のプレプリント部分とし、大きい方の部分を該記入枠領域内の記入文字部分として区別する区別手段と
    を有することを特徴とする画像処理装置。
  2. 更に、前記区別手段で区別した結果に基づいて、前記文書画像から、前記記入文字部分の画像を抽出する記入文字抽出手段を有することを特徴とする請求項1に記載の画像処理装置。
  3. 更に、該抽出された記入文字部分の画像を文字認識する文字認識手段を有することを特徴とする請求項2に記載の画像処理装置。
  4. 更に、前記区別手段で区別した結果に基づいて、前記文書画像から、前記プレプリント部分の画像を抽出するプレプリント抽出手段と、
    該抽出されたプレプリント部分の画像を文字認識する文字認識手段と
    を有することを特徴とする請求項1乃至3のいずれかに記載の画像処理装置。
  5. 前記ヒストグラム取得手段は、各記入枠領域を行方向に射影して得たヒストグラムを、各記入枠領域の上端を基準点として累積したヒストグラムを取得することを特徴とする請求項1乃至4のいずれかに記載の画像処理装置。
  6. 前記行方向罫線抽出手段は、前記文書画像を列方向の短冊状領域に分割し、前記短冊状領域ごとに行方向に射影して求めたヒストグラムから行方向罫線断片を抽出し、前記行方向罫線断片の位置に応じて、隣り合う短冊状領域に含まれる該行方向罫線断片を結合していき、該結合された行方向罫線断片のうち、所定の長さ以上の行方向罫線断片を前記行方向罫線とすることを特徴とする請求項1に記載の画像処理装置。
  7. 前記列方向罫線抽出手段は、前記抽出された行方向の罫線の間の領域に対して列方向に射影して求めたヒストグラムに基づき、列方向罫線候補を抽出し、隣り合う列方向罫線候補のピッチの統計を取ることにより、前記抽出された行方向の罫線の間の領域から列方向罫線を抽出することを特徴とする請求項1に記載の画像処理装置。
  8. 行方向罫線抽出手段が、2値の文書画像から行方向の罫線を抽出する行方向罫線抽出ステップと、
    列方向罫線抽出手段が、前記抽出された行方向罫線の間の領域から列方向の罫線を抽出する列方向罫線抽出ステップと、
    ヒストグラム取得手段が、前記抽出された行方向罫線および列方向罫線に囲まれ且つ該罫線を除いた領域を記入枠領域とし、該記入枠領域に対して行方向に射影してヒストグラムをとるヒストグラム取得ステップと、
    区別手段が、前記ヒストグラムのブランク部分を判断し、前記ヒストグラムにおいて当該判断したブランク部分より上側の部分の大きさと当該判断したブランク部分より下側の部分の大きさとを比較し、小さい方の部分を該記入枠領域内のプレプリント部分とし、大きい方の部分を該記入枠領域内の記入文字部分として区別する区別ステップと
    を有することを特徴とする画像処理方法。
  9. 更に、記入文字抽出手段が、前記区別ステップで区別した結果に基づいて、前記文書画像から、前記記入文字部分の画像を抽出する記入文字抽出ステップを有することを特徴とする請求項に記載の画像処理方法。
  10. 更に、文字認識手段が、該抽出された記入文字部分の画像を文字認識する文字認識ステップを有することを特徴とする請求項に記載の画像処理方法。
  11. 更に、プレプリント抽出手段が、前記区別ステップで区別した結果に基づいて、前記文書画像から、前記プレプリント部分の画像を抽出するプレプリント抽出ステップと、
    文字認識手段が、該抽出されたプレプリント部分の画像を文字認識する文字認識ステップと
    を有することを特徴とする請求項乃至10のいずれかに記載の画像処理方法。
  12. 前記ヒストグラム取得ステップでは、各記入枠領域を行方向に射影して得たヒストグラムを、各記入枠領域の上端を基準点として累積したヒストグラムを取得することを特徴とする請求項乃至11のいずれかに記載の画像処理方法。
  13. 前記行方向罫線抽出ステップでは、前記文書画像を列方向の短冊状領域に分割し、前記短冊状領域ごとに行方向に射影して求めたヒストグラムから行方向罫線断片を抽出し、前記行方向罫線断片の位置に応じて、隣り合う短冊状領域に含まれる該行方向罫線断片を結合していき、該結合された行方向罫線断片のうち、所定の長さ以上の行方向罫線断片を前記行方向罫線とすることを特徴とする請求項に記載の画像処理方法。
  14. 前記列方向罫線抽出ステップでは、前記抽出された行方向の罫線の間の領域に対して列方向に射影して求めたヒストグラムに基づき、列方向罫線候補を抽出し、隣り合う列方向罫線候補のピッチの統計を取ることにより、前記抽出された行方向の罫線の間の領域から列方向罫線を抽出することを特徴とする請求項8に記載の画像処理方法。
  15. コンピュータを、請求項乃至のいずれかに記載の画像処理装置として機能させるためのコンピュータ実行可能なプログラム。
  16. 請求項15記載のプログラムを格納した、コンピュータ読み取り可能な記憶媒体。
JP2001212035A 2001-07-12 2001-07-12 画像処理装置、方法、プログラム及び記憶媒体 Expired - Fee Related JP4731748B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001212035A JP4731748B2 (ja) 2001-07-12 2001-07-12 画像処理装置、方法、プログラム及び記憶媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001212035A JP4731748B2 (ja) 2001-07-12 2001-07-12 画像処理装置、方法、プログラム及び記憶媒体

Publications (2)

Publication Number Publication Date
JP2003030585A JP2003030585A (ja) 2003-01-31
JP4731748B2 true JP4731748B2 (ja) 2011-07-27

Family

ID=19047261

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001212035A Expired - Fee Related JP4731748B2 (ja) 2001-07-12 2001-07-12 画像処理装置、方法、プログラム及び記憶媒体

Country Status (1)

Country Link
JP (1) JP4731748B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006018655A (ja) * 2004-07-02 2006-01-19 Ricoh Co Ltd 文書処理システム
JP4909311B2 (ja) 2008-03-31 2012-04-04 富士通フロンテック株式会社 文字認識装置
JP6690264B2 (ja) * 2016-02-02 2020-04-28 コニカミノルタ株式会社 文字認識装置及びプログラム

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2796561B2 (ja) * 1989-10-30 1998-09-10 株式会社エフ・エフ・シー 表形式文書認識方式
JPH0713996A (ja) * 1993-06-25 1995-01-17 Hitachi Ltd 文字認識装置
JPH09231291A (ja) * 1996-02-27 1997-09-05 Mitsubishi Electric Corp 帳票読取方法及びその装置
JP3294995B2 (ja) * 1996-06-21 2002-06-24 三菱電機株式会社 帳票読取装置
JP3524339B2 (ja) * 1997-08-25 2004-05-10 沖電気工業株式会社 光学式文字読取装置用帳票のフォーマット情報生成方法
JP2000020641A (ja) * 1998-07-07 2000-01-21 Oki Electric Ind Co Ltd 文字認識システム

Also Published As

Publication number Publication date
JP2003030585A (ja) 2003-01-31

Similar Documents

Publication Publication Date Title
US10152648B2 (en) Method and apparatus for determining a document type of a digital document
US6754385B2 (en) Ruled line extracting apparatus for extracting ruled line from normal document image and method thereof
JP3904840B2 (ja) 多値画像から罫線を抽出する罫線抽出装置
Xi et al. A video text detection and recognition system
JP3278471B2 (ja) 領域分割方法
JP4771804B2 (ja) レイアウト解析プログラム、レイアウト解析装置、レイアウト解析方法
US7194144B1 (en) Document image processing device, document image merging method, and storage medium recording a document image merging program
EP0779592B1 (en) Automatic method of identifying drop words in a document image without performing OCR
JPH0652354A (ja) スキュー補正方法並びにスキュー角検出方法並びにドキュメントセグメンテーションシステムおよびスキュー角検出装置
US7796817B2 (en) Character recognition method, character recognition device, and computer product
Yin Skew detection and block classification of printed documents
US9965678B2 (en) Method for recognizing table and flowchart in document images
CN111209865A (zh) 文件内容提取方法、装置、电子设备及存储介质
JP2002015280A (ja) 画像認識装置、画像認識方法および画像認識プログラムを記録したコンピュータ読取可能な記録媒体
JPH09311905A (ja) 行検出方法および文字認識装置
JP4731748B2 (ja) 画像処理装置、方法、プログラム及び記憶媒体
JP3268552B2 (ja) 領域抽出方法、宛名領域抽出方法、宛名領域抽出装置、及び画像処理装置
US20030123730A1 (en) Document recognition system and method using vertical line adjacency graphs
JP4810853B2 (ja) 文字画像切出装置、文字画像切出方法およびプログラム
JP3957471B2 (ja) 分離文字列統合装置
JP4194309B2 (ja) 文書方向推定方法および文書方向推定プログラム
Chitrakala et al. An efficient character segmentation based on VNP algorithm
JPH05174185A (ja) 日本語文字認識装置
JP3517077B2 (ja) パターン抽出装置及びパターン領域の切り出し方法
JP3190794B2 (ja) 文字切り出し装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080710

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20100201

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100624

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20100630

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100706

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100903

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110412

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110420

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140428

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees