JP2003030585A - 画像処理装置、方法、プログラム及び記憶媒体 - Google Patents
画像処理装置、方法、プログラム及び記憶媒体Info
- Publication number
- JP2003030585A JP2003030585A JP2001212035A JP2001212035A JP2003030585A JP 2003030585 A JP2003030585 A JP 2003030585A JP 2001212035 A JP2001212035 A JP 2001212035A JP 2001212035 A JP2001212035 A JP 2001212035A JP 2003030585 A JP2003030585 A JP 2003030585A
- Authority
- JP
- Japan
- Prior art keywords
- image
- ruled
- row
- line
- histogram
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Character Input (AREA)
- Image Analysis (AREA)
Abstract
枠内にあるプレプリント文字とを区別して読み取る。 【解決手段】 罫線を抽出し、該罫線を除いた記入枠領
域に対して行方向に射影してヒストグラムをとり、該ヒ
ストグラムの分布に基づいて、記入枠領域内のプレプリ
ント部分と記入文字部分を区別する。
Description
にあらかじめ印刷された文字等(プレプリント)を含ま
ないように記入された文字画像を切り出して、読み取り
を行うための画像処理装置、方法、プログラム及び記憶
媒体に関するものである。
らかじめ記入項目を示す文字等がプレプリントされてお
り、記入者はその項目に応じた内容を記入するようにな
っている。
自動的に読み取るようにするため、記入枠やプレプリン
トされた文字をドロップアウトカラーで印刷して、ユー
ザが記入した文字のみを読み取るようにしたものが一般
的に用いられているが、ドロップアウトカラーを用いる
場合、専用の色を用いて帳票をデザインして印刷し、ま
た、ドロップアウトカラーの帳票を読み取れる専用のイ
メージスキャナを使用する必要があるためコストがかか
っていた。
帳票であっても、ユーザが記入した文字を読み取ること
が可能な読み取り方法が望まれている。
濃淡画像で文書を読み取り、記入文字部とプレプリント
部の濃淡情報の差異に基づき、文字部とプレプリント部
とを分離するように構成されている。
は、抽出した文字を文字認識し、該文字が活字であると
認識すればプレプリントされた文字であると判定するよ
うに構成されている。
開平9−259220号公報では、記入文字部とプレプ
リント部の濃淡情報に違いがあることが前提で、プレプ
リント部とほぼ同等の濃度で手書きされたもの、あるい
はプリンタ等を使用し、プレプリントされた文書にプレ
プリント部とほぼ同等の濃度で文字が記入印刷されたも
のは文字部とプレプリント部を分離できないという問題
点があった。
では、記入文字部が手書きであることが前提となってお
り、プリンタ等を使用して記入された文字はプレプリン
ト部と区別できないという問題点があった。
れたもので、記入枠内にあるプレプリント文字を分離
し、記入枠内に記入された文字を区別して読み取ること
を目的とする。
に、本発明の画像処理装置は、2値の文書画像から行方
向の罫線を抽出する行方向罫線抽出手段と、前記抽出さ
れた行方向罫線に基づき、前記文書2値画像から列方向
の罫線を抽出する列方向罫線抽出手段と、前記抽出され
た行方向罫線および列方向罫線に囲まれ且つ該罫線を除
いた領域を記入枠領域とし、該記入枠領域に対して行方
向に射影してヒストグラムをとるヒストグラム取得手段
と、前記ヒストグラムの分布に基づいて、該記入枠領域
内のプレプリント部分と記入文字部分を区別する区別手
段とを有することを特徴とする。
処理方法は、2値の文書画像から行方向の罫線を抽出す
る行方向罫線抽出ステップと、前記抽出された行方向罫
線に基づき、前記文書2値画像から列方向の罫線を抽出
する列方向罫線抽出ステップと、前記抽出された行方向
罫線および列方向罫線に囲まれ且つ該罫線を除いた領域
を記入枠領域とし、該記入枠領域に対して行方向に射影
してヒストグラムをとるヒストグラム取得ステップと、
前記ヒストグラムの分布に基づいて、該記入枠領域内の
プレプリント部分と記入文字部分を区別する区別ステッ
プとを有することを特徴とする。
形態における文書を読み取るための画像処理装置の構成
を示すブロック図である。101はROM102に格納
されている制御プログラムに従って本装置全体の制御を
行うCPU、102はCPU101に後述するフローチ
ャートに示す処理を実行させるためのプログラム等を格
納するROM、103はCPUが処理を行う際のワーク
エリアとして用いたり文書画像データ等を記憶したりす
るRAM、104は磁気ディスク等の外部記憶装置であ
り、105はディスプレイ、106はキーボード、10
7はマウス等のポインティングデバイス、108は画像
を読み取るためのイメージスキャナである。また、10
9はネットワークインターフェースであり、図示しない
遠隔地に存在する装置と通信し、プログラムやデータな
どを読み込んだり、書き込んだりする。
納するROM102のメモリマップである。なお、特に
図示しないが、各種プログラムに従属するデータも上記
ディレクトリに管理されている。なお、本実施形態で
は、ROMにプログラムが格納されているものとした
が、このプログラムは、フロッピー(登録商標)ディス
クやCD−ROMなどの外部記憶媒体に格納され、必要
に応じて読み込まれて実行されるものであってもよい
し、ネットワークを介して外部装置から受信されて実行
されるものであってもよい。
て実現される第1の実施形態について、図2乃至図10
を用いて説明する。
内に記入された文字を切り出す方法を示すフローチャー
トである。また、図5は、本実施形態が処理する帳票の
記入枠部分を一例として示したものであり、501は文
字記入枠、502は処理を行う範囲を示している。
108等の光電変換装置から読み込まれ二値化された画
像(以下「二値画像」)、あるいは、すでに読み込まれ
外部記憶装置104等に記憶している二値画像の処理範
囲502から横方向の罫線(以下「横罫線」)を抽出す
る。
例を図3のフローチャートに示す。
処理範囲502を縦方向の短冊状に分割する。図6
(A)は図5の帳票の一例を縦方向の短冊状に分割した
ことを示す図である。図6(B)及び図6(E)は、処
理範囲502の短冊状に分割した領域の1つ(602_
1及び602_2)を示す。
方向に射影を取り黒画素の度数分布を作成する。図6
(C)は、図6(B)の短冊領域602_1の範囲内の
水平方向射影に対する黒画素の度数分布(ヒストグラ
ム)を示し、図6(F)は、図6(E)の短冊領域60
2_2の範囲内の水平方向射影に対する黒画素の度数分
布(ヒストグラム)を示す。
SHとを比較し、黒画素の度数が所定の閾値SH以上あ
れば、その範囲である図6(B)の604_11、60
4_12および図6(E)の604_21、604_2
2を罫線の断片とする。図6(D)及び図6(G)は、
それぞれ図6(B)の短冊領域602_1および図6
(E)の短冊領域602_2に含まれる横罫線の断片を
抽出した図である。
行方向に連続性のある罫線断片が存在するか判断し、存
在すればステップS305に進み、存在しなければステ
ップS308に進む。
断片の太さがほぼ同じであるか判断し、ほぼ同じであれ
ば、ステップS306でそれらを結合していく。すなわ
ち、ステップS303で抽出された短冊602_1の2
本の罫線断片の太さをそれぞれWk11,Wk12(図
6(C))、短冊602_2の2本の罫線断片の太さを
Wk21、Wk22(図6(F))としたとき、Wk1
1=Wk21なら、604_11は604_21と、ま
た、Wk12=Wk22なら、604_12は604_
22とそれぞれ結合する。ここで上述の「連続性があ
る」とは、隣り合う短冊間の短冊境界線において各短冊
内の罫線断片が縦方向に重複した部分を有する(罫線断
片の存在する縦軸方向の位置がほぼ同じ)ことをいう。
また、結合とは、短冊毎の罫線断片が連続性のある1つ
の直線であると認識することをいう。
は、ステップS307で太い罫線断片を細い罫線断片の
位置および太さと同じであると仮定して結合を続けてい
く。
04〜S307の処理を行い、結合できる罫線断片がな
くなった時点で、ステップS308に進む。
は、本来、抽出すべき横罫線以外のものを罫線断片とし
て抽出することが起こり得る。すなわち、例えば文字記
入枠に記入された文字「7」の横棒部分は、各短冊内に
おける水平方向の黒画像の度数が多く、黒画素の度数が
所定値SH以上となる場合があり、それらも罫線の断片
と認識され抽出されてしまうことがある。このように、
上記罫線断片抽出方法にて抽出された横罫線断片は、本
来の横罫線断片以外の断片も含んでいる場合があり、処
理範囲502から抽出されて結合された横罫線断片は、
図8(A)のようになる。ここで、最終的に抽出すべき
横罫線であるかどうかは、予め罫線の最低の長さを決め
ておくか、あるいは処理範囲502の幅AWを基準にし
た閾値を決めるなどして判断する。すなわち、ステップ
S308にて、長さの短い罫線断片結合が除去される。
図8(B)は、ステップS308にて長さの短い罫線断
片結合が除去されたことを示す図である。この結果、本
来抽出すべき横罫線を抽出することができる。
て求めた横罫線を横罫線の位置や太さ、長さを記憶す
る。
て、ステップS201で抽出された横罫線が2本以上存
在するかどうか判断する。横罫線が2本抽出できなかっ
た場合は、文字記入枠が存在しないとして処理を終了す
る。
は、ステップS203に進み、横罫線間の領域から縦方
向の罫線(以下「縦罫線」)を抽出する。縦罫線抽出処
理を、図4のフローチャートを用いて説明する。
線間の領域で、垂直方向に射影し黒画素の度数分布(ヒ
ストグラム)を取る。このとき、横罫線抽出処理で求め
た2本の横罫線部分は度数に含まないようにする。図9
は、図5において横罫線抽出処理で求められた2本の横
罫線(図8)の間の領域に対して、垂直方向のヒストグ
ラムを取った結果である。
の度数の平均値をTbとして求める。さらにステップS
403で、閾値Tbより大きいヒストグラムの山の部分
を取り出し(901〜912)、その個数をNとする。
まず閾値Tbを使うことにより、明らかに縦罫線ではな
い部分(914、913)が除かれる。ステップS40
4で個数Nが0より大きいか否か判断し、Nが0なら縦
罫線はないとして処理は終了する。Nが0より大きい場
合には、ステップS405に進み、Tbより大きい部分
N個のうち上位N/2個分の度数の平均値をTpとして
求める。ステップS406でTpより度数が大きい部分
(901〜908、910、911)を山の部分のピー
クとして取り出す。このTpを用いることにより、1つ
の山の部分に複数の縦罫線のピークが含まれている場合
に各ピークを別々に取り出すことができる。例えば、記
入枠に大きく文字が記入されて、記入された文字の両側
にある縦罫線が1つの山部分としてステップS403で
取り出された場合などにおいても、縦罫線を2本取り出
すことができる。
べ、その形状がなだらかであれば縦罫線候補からはず
す。図9の山911は最大度数付近の度数も大きくなだ
らかな形状となっているので縦罫線候補から外される。
結果として図9では、901〜908及び910が縦罫
線候補として抽出される。
用いていたが、ステップS402で取り出された山の部
分毎にTpを定めるようにしてもよい。例えば、ステッ
プS403で取り出されたTb以上のヒストグラムの山
の部分(901〜912)のそれぞれに対して、各山部
分の最大値の80%を閾値Tpとして求めるようにして
もよい。その場合、909は2つのピークが取り出され
ることになるが、ピーク付近の分布形状がなだらかなの
で、縦罫線候補から外されることになる。
されたかどうか判断し、抽出されていれば、ステップS
408に進んで、それらの位置、太さ、長さを記憶す
る。抽出されていなければ縦罫線はないとして終了す
る。
テップS203で抽出された縦罫線候補が2本以上存在
するか否かを判断し、2本以上存在しない場合には、文
字記入枠が存在しないとして処理を終了する。
ステップS205にて、抽出した横罫線と縦罫線で囲ま
れた内側部分を文字記入枠領域として抽出する。図10
の1001〜1008は、抽出した文字記入枠領域の大
きさを図示したものである。図9の910が閾値Tpよ
り大きく、縦罫線候補となっているので、1004と1
005は、実際の文字記入枠領域を二分割した形となっ
ている。
字記入枠領域の幅から標準ピッチを求める。ピッチと
は、隣り合う縦罫線間の距離、すなわち各文字記入枠領
域の幅である。標準ピッチは、各文字記入枠のピッチの
統計をとって決定する。すなわち、処理を行う範囲50
2内の文字記入枠のピッチは、すべて均等であるという
前提のもと、文字記入枠のピッチの統計をとって、最大
分布となる文字記入枠の幅を標準ピッチとする。
基づいて、分割されている文字記入枠領域は結合され
る。したがって、図10の1004と1005は結合さ
れることになる。
内の黒画素が連結した画像を抽出する。
に黒画素連結画像があるかどうか判断し、画像がなけれ
ば、ステップS210に進んで、その文字記入枠を空欄
とする。
画像があると判断すれば、ステップS211に進み、抽
出された画像からプレプリント部分を除去する。抽出さ
れた画像からプレプリント部分を除去する手順を図7の
フローチャートを用いて説明する。
枠内について、ステップS208で抽出された記入枠内
の領域それぞれに対して、水平方向に射影してヒストグ
ラムを取り、各記入枠の上端を基準原点としてヒストグ
ラムを累積していく。つまり、罫線を除いた記入枠領域
の水平方向のヒストグラムが得られる。なお、ここで各
記入枠の上端を基準としてヒストグラムを累積している
のは、画像が傾いている場合に記入枠の位置が上下にず
れるのに対応するためである。図13に、罫線を除いた
記入枠領域の水平方向ヒストグラムを示す。
られたヒストグラムから最大の幅を持つブランク部分を
見つける。理想的には、射影が全く存在しない部分をブ
ランクとするが、ノイズがある場合や、プレプリント部
分と記入文字部分の一部が接触している場合等を考慮し
て、ブランク部分を判断するための度数の閾値を数個に
する(例えば度数が5個までの部分はブランクとして判
断する)ようにしてもよい。
つかったかどうかを判断し、見つからなければ、プレプ
リント部分が存在しないと判断し、処理を終了する。ま
た、見つけられた最大のブランクの幅が、あらかじめ定
めた閾値以下の場合もブランクが存在しないとして判断
する。
と判断した場合、ステップS704に進み、ブランクの
位置からプレプリント部の位置を決定する。すなわち、
プレプリント文字は記入文字より小さな文字であること
が多いので、本実施形態では、ヒストグラムの上端座標
をTh、下端座標をBh、ブランクの上端座標をt、下
端座標をbとすると、|t−Th|<|Bh−b|なら
ブランクの上がプレプリント部、そうでなければブラン
クの下がプレプリント部とする。(なお、本実施形態で
はヒストグラムの垂直軸の下方向にいくほど座標値は大
きくなるようにとっている)。
抽出された画像を記入文字部分とプレプリント部分に分
割する。例えば、ブランクの上端t及び下端bに基づい
て、分割基準位置となる閾値th、bhを定めて、ステ
ップS704でブランクの上側がプレプリント部である
とした場合、抽出された画像の下端がbhよりも上な
ら、その画像はプレプリント部分であるとし、抽出され
た画像の上端がthよりも下なら、その画像は記入され
た文字部分であるとする。なお、閾値はth=t、bh
=bとしてもよいし、th=t+A、bh=b−A’
(A、A’は誤差を考慮して経験的に求めた値)として
もよい。また、thとbhが同じ値になるようにしても
よく、例えば、th=bh=(tとbの中間位置)とす
るようにしてもよい。
内に文字が記入されていた場合、ステップS208では
文字記入枠毎に黒画素連結画像を抽出するので、抽出さ
れた文字記入枠内の画像にはプレプリント部分黒画素連
結画像と記入文字部分黒画素連結画像の両方が含まれて
いるが、この場合、th≦c≦bhなるcで画像を分割
する。このcは、その画像の水平方向の射影を取って射
影がブランクになる部分からcを選んで、画像を分割す
る。
内に文字が記入されていた場合で、且つプレプリント部
分に接触して文字が記入されていた場合、ステップS2
08で抽出された画像には、プレプリント部分と記入文
字部分とが含まれるが、この場合、その画像を囲む最少
矩形領域において水平方向に射影してヒストグラムをと
って、thとbhの間でヒストグラムが最少となる個所
c(th≦c≦bh)で、その画像を分割する。このよ
うに、記入欄全体のヒストグラムに基づいて、プレプリ
ント部分と記入文字部分との境界位置を予測する(S7
04)ことによって、記入文字がプレプリント部分と接
触している画像においても、記入文字とプレプリント部
分を分離することができる。
部分があったか判断し、プレプリント部分があれば、ス
テップS707に進んで、ステップS208で抽出され
た画像からプレプリント部分を除去する。
211でプレプリント部分を除去した後、ステップS2
12で、文字記入枠内の残った画像(記入文字部分)が
存在するか調べる。画像がなければ、ステップS210
に進み、その文字記入枠を空欄とする。画像があれば、
ステップS213に進み、その文字記入枠内の画像を記
入文字画像とする。
画像に対して、文字認識処理を実行して文字コードを出
力し、帳票解析などの処理を行なう。
内の画像に対して、水平方向のヒストグラムを取って、
そのヒストグラムからプレプリント部の位置を決定する
ので、文字を記入する部分が1文字毎に区切られた形状
のもので、なおかつプレプリントの位置が記入枠の上部
であっても下部であっても、記入文字部分を正しく抽出
できる効果がある。
端を原点にして抽出画像のヒストグラムを取るので、画
像に傾きがあってもプレプリント部の位置を正しく決定
できる効果がある。
る垂直罫線が、上部で水平方向の罫線に接しない形状の
例を用いて説明したが、図12にあるように、垂直罫線
が上部の水平方向の罫線に接していても、同様の処理で
記入された文字画像のみを抽出できることは言うまでも
ない。また、縦罫線が点線であっても本発明を適用でき
る。
について説明したが、縦書きであっても処理方向を変え
れば同様の処理で記入文字画像を抽出できることは用意
に想像できる。
記号や絵などであっても本実施形態を適用可能である。
プレプリント部分を除去していたが、プレプリント部分
をプレプリント文字として抽出して文字認識処理を施す
ことも可能である。
7のステップS707)において、プレプリント部分を
除去する代わりに、プレプリント部分を抽出するように
すればよい。
て文字認識処理を行い、例えば、ステップS213で抽
出する記入文字のインデックス情報として付加したり、
項目の照合に利用したりすることができる。
よび記入文字部分を区別して抽出することができる。ま
た、プレプリント部分の文字を文字認識処理して、その
後の処理に役立てることができる。
文字記入枠の位置や大きさをあらかじめ正確に求め、帳
票定義として記憶しておかなくても、文字記入枠内のプ
レプリント部分と記入文字部分とを区別して、正しく抽
出することができる。
ク図である。
る。
る。
ある。
る。
る。
ータ処理プログラムを格納する記憶媒体のメモリマップ
を説明する図である。
めの図である。
Claims (18)
- 【請求項1】 2値の文書画像から行方向の罫線を抽出
する行方向罫線抽出手段と、 前記抽出された行方向罫線に基づき、前記文書2値画像
から列方向の罫線を抽出する列方向罫線抽出手段と、 前記抽出された行方向罫線および列方向罫線に囲まれ且
つ該罫線を除いた領域を記入枠領域とし、該記入枠領域
に対して行方向に射影してヒストグラムをとるヒストグ
ラム取得手段と、 前記ヒストグラムの分布に基づいて、該記入枠領域内の
プレプリント部分と記入文字部分を区別する区別手段と
を有することを特徴とする画像処理装置。 - 【請求項2】 更に、前記文書画像から、前記記入文字
部分の画像を抽出する記入文字抽出手段を有することを
特徴とする請求項1に記載の画像処理装置。 - 【請求項3】 更に、該抽出された記入文字部分の画像
を文字認識する文字認識手段を有することを特徴とする
請求項2に記載の画像処理装置。 - 【請求項4】 更に、前記文書画像から、前記プレプリ
ント部分の画像を抽出するプレプリント抽出手段と、 該抽出されたプレプリント部分の画像を文字認識する文
字認識手段とを有することを特徴とする請求項1乃至3
のいずれかに記載の画像処理装置。 - 【請求項5】 前記ヒストグラム取得手段は、各記入枠
領域を行方向に射影して得たヒストグラムを、各記入枠
領域の上端を基準点として累積したヒストグラムを取得
することを特徴とする請求項1乃至4のいずれかに記載
の画像処理装置。 - 【請求項6】 前記区別手段は、前記ヒストグラムのブ
ランク部分を基準として記入枠領域の画像を分割するこ
とにより、前記プレプリント部分と前記記入文字部分と
を区別することを特徴とする請求項1乃至5のいずれか
に記載の画像処理装置。 - 【請求項7】 前記行方向罫線抽出手段は、前記文書画
像を列方向の短冊状領域に分割し、前記短冊状領域ごと
に行方向に射影して求めたヒストグラムから行方向罫線
断片を抽出し、前記行方向罫線断片の位置に応じて、隣
り合う短冊状領域に含まれる該行方向罫線断片を結合し
ていき、該結合された行方向罫線断片のうち、所定の長
さ以上の行方向罫線断片を行方向罫線とすることを特徴
とする請求項1に記載の画像処理装置。 - 【請求項8】 前記列方向罫線抽出手段は、前記抽出し
た横罫線の間の領域に対して列方向に射影して求めたヒ
ストグラムに基づき、列方向罫線候補を抽出し、隣り合
う列方向罫線候補のピッチの統計を取ることにより列方
向罫線を抽出することを特徴とする請求項1に記載の画
像処理装置。 - 【請求項9】 2値の文書画像から行方向の罫線を抽出
する行方向罫線抽出ステップと、 前記抽出された行方向罫線に基づき、前記文書2値画像
から列方向の罫線を抽出する列方向罫線抽出ステップ
と、 前記抽出された行方向罫線および列方向罫線に囲まれ且
つ該罫線を除いた領域を記入枠領域とし、該記入枠領域
に対して行方向に射影してヒストグラムをとるヒストグ
ラム取得ステップと、 前記ヒストグラムの分布に基づいて、該記入枠領域内の
プレプリント部分と記入文字部分を区別する区別ステッ
プとを有することを特徴とする画像処理方法。 - 【請求項10】 更に、前記文書画像から、前記記入文
字部分の画像を抽出する記入文字抽出ステップを有する
ことを特徴とする請求項9に記載の画像処理方法。 - 【請求項11】 更に、該抽出された記入文字部分の画
像を文字認識する文字認識ステップを有することを特徴
とする請求項10に記載の画像処理方法。 - 【請求項12】 更に、前記文書画像から、前記プレプ
リント部分の画像を抽出するプレプリント抽出ステップ
と、 該抽出されたプレプリント部分の画像を文字認識する文
字認識ステップとを有することを特徴とする請求項9乃
至11のいずれかに記載の画像処理方法。 - 【請求項13】 前記ヒストグラム取得ステップでは、
各記入枠領域を行方向に射影して得たヒストグラムを、
各記入枠領域の上端を基準点として累積したヒストグラ
ムを取得することを特徴とする請求項9乃至12のいず
れかに記載の画像処理方法。 - 【請求項14】 前記区別ステップでは、前記ヒストグ
ラムのブランク部分を基準として記入枠領域の画像を分
割することにより、前記プレプリント部分と前記記入文
字部分とを区別することを特徴とする請求項9乃至13
のいずれかに記載の画像処理方法。 - 【請求項15】 前記行方向罫線抽出ステップでは、前
記文書画像を列方向の短冊状領域に分割し、前記短冊状
領域ごとに行方向に射影して求めたヒストグラムから行
方向罫線断片を抽出し、前記行方向罫線断片の位置に応
じて、隣り合う短冊状領域に含まれる該行方向罫線断片
を結合していき、該結合された行方向罫線断片のうち、
所定の長さ以上の行方向罫線断片を行方向罫線とするこ
とを特徴とする請求項9に記載の画像処理方法。 - 【請求項16】 前記列方向罫線抽出ステップでは、前
記抽出した横罫線の間の領域に対して列方向に射影して
求めたヒストグラムに基づき、列方向罫線候補を抽出
し、隣り合う列方向罫線候補のピッチの統計を取ること
により列方向罫線を抽出することを特徴とする請求項9
に記載の画像処理方法。 - 【請求項17】 請求項9乃至16のいずれかに記載の
画像処理方法をコンピュータに実現させるためのコンピ
ュータ実行可能なプログラム。 - 【請求項18】 請求項9乃至16のいずれかに記載の
画像処理方法をコンピュータに実現させるためのコンピ
ュータ読み取り可能なプログラムを格納する記憶媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001212035A JP4731748B2 (ja) | 2001-07-12 | 2001-07-12 | 画像処理装置、方法、プログラム及び記憶媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001212035A JP4731748B2 (ja) | 2001-07-12 | 2001-07-12 | 画像処理装置、方法、プログラム及び記憶媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2003030585A true JP2003030585A (ja) | 2003-01-31 |
JP4731748B2 JP4731748B2 (ja) | 2011-07-27 |
Family
ID=19047261
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2001212035A Expired - Fee Related JP4731748B2 (ja) | 2001-07-12 | 2001-07-12 | 画像処理装置、方法、プログラム及び記憶媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4731748B2 (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006018655A (ja) * | 2004-07-02 | 2006-01-19 | Ricoh Co Ltd | 文書処理システム |
JP2009245036A (ja) * | 2008-03-31 | 2009-10-22 | Fujitsu Frontech Ltd | 文字認識装置 |
JP2017138703A (ja) * | 2016-02-02 | 2017-08-10 | コニカミノルタ株式会社 | 文字認識装置及びプログラム |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH03142691A (ja) * | 1989-10-30 | 1991-06-18 | Fuji Facom Corp | 表形式文書認識方式 |
JPH0713996A (ja) * | 1993-06-25 | 1995-01-17 | Hitachi Ltd | 文字認識装置 |
JPH09231291A (ja) * | 1996-02-27 | 1997-09-05 | Mitsubishi Electric Corp | 帳票読取方法及びその装置 |
JPH1011531A (ja) * | 1996-06-21 | 1998-01-16 | Mitsubishi Electric Corp | 帳票読取装置 |
JPH1166228A (ja) * | 1997-08-25 | 1999-03-09 | Oki Electric Ind Co Ltd | 光学式文字読取装置用帳票のフォーマット情報生成方法 |
JP2000020641A (ja) * | 1998-07-07 | 2000-01-21 | Oki Electric Ind Co Ltd | 文字認識システム |
-
2001
- 2001-07-12 JP JP2001212035A patent/JP4731748B2/ja not_active Expired - Fee Related
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH03142691A (ja) * | 1989-10-30 | 1991-06-18 | Fuji Facom Corp | 表形式文書認識方式 |
JPH0713996A (ja) * | 1993-06-25 | 1995-01-17 | Hitachi Ltd | 文字認識装置 |
JPH09231291A (ja) * | 1996-02-27 | 1997-09-05 | Mitsubishi Electric Corp | 帳票読取方法及びその装置 |
JPH1011531A (ja) * | 1996-06-21 | 1998-01-16 | Mitsubishi Electric Corp | 帳票読取装置 |
JPH1166228A (ja) * | 1997-08-25 | 1999-03-09 | Oki Electric Ind Co Ltd | 光学式文字読取装置用帳票のフォーマット情報生成方法 |
JP2000020641A (ja) * | 1998-07-07 | 2000-01-21 | Oki Electric Ind Co Ltd | 文字認識システム |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2006018655A (ja) * | 2004-07-02 | 2006-01-19 | Ricoh Co Ltd | 文書処理システム |
JP2009245036A (ja) * | 2008-03-31 | 2009-10-22 | Fujitsu Frontech Ltd | 文字認識装置 |
US8189921B2 (en) | 2008-03-31 | 2012-05-29 | Fujitsu Frontech Limited | Character recognition device |
JP2017138703A (ja) * | 2016-02-02 | 2017-08-10 | コニカミノルタ株式会社 | 文字認識装置及びプログラム |
Also Published As
Publication number | Publication date |
---|---|
JP4731748B2 (ja) | 2011-07-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6754385B2 (en) | Ruled line extracting apparatus for extracting ruled line from normal document image and method thereof | |
Antonacopoulos | Page segmentation using the description of the background | |
US6512848B2 (en) | Page analysis system | |
US5892842A (en) | Automatic method of identifying sentence boundaries in a document image | |
JP3308032B2 (ja) | スキュー補正方法およびスキュー角検出方法およびスキュー補正装置およびスキュー角検出装置 | |
JP3904840B2 (ja) | 多値画像から罫線を抽出する罫線抽出装置 | |
JP4771804B2 (ja) | レイアウト解析プログラム、レイアウト解析装置、レイアウト解析方法 | |
EP0779592B1 (en) | Automatic method of identifying drop words in a document image without performing OCR | |
US7796817B2 (en) | Character recognition method, character recognition device, and computer product | |
JP6900164B2 (ja) | 情報処理装置、情報処理方法及びプログラム | |
JPH0713995A (ja) | 自動テキスト特徴決定装置 | |
JP7244223B2 (ja) | 電子文書における強調テキストの識別 | |
US8538154B2 (en) | Image processing method and image processing apparatus for extracting heading region from image of document | |
US6947596B2 (en) | Character recognition method, program and recording medium | |
JP4613397B2 (ja) | 画像認識装置、画像認識方法および画像認識プログラムを記録したコンピュータ読取可能な記録媒体 | |
JPH10171922A (ja) | 罫線消去装置及び記録媒体 | |
JP4731748B2 (ja) | 画像処理装置、方法、プログラム及び記憶媒体 | |
US20030123730A1 (en) | Document recognition system and method using vertical line adjacency graphs | |
JP2006277149A (ja) | 文字画像切出装置、文字画像切出方法およびプログラム | |
JP7417116B2 (ja) | 情報処理システム、情報処理方法、プログラム | |
JP3190794B2 (ja) | 文字切り出し装置 | |
JP4738645B2 (ja) | 網掛け領域検出装置、網掛け領域検出方法、プログラムおよび記憶媒体 | |
JPH0950488A (ja) | 異サイズ混在文字列の読取り方法 | |
JPH04241074A (ja) | 自動文書清書装置 | |
JP3517077B2 (ja) | パターン抽出装置及びパターン領域の切り出し方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20080710 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20100201 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20100624 |
|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20100630 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100706 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100903 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110412 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110420 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140428 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |