JP2871590B2 - 画像抽出方式 - Google Patents
画像抽出方式Info
- Publication number
- JP2871590B2 JP2871590B2 JP8118059A JP11805996A JP2871590B2 JP 2871590 B2 JP2871590 B2 JP 2871590B2 JP 8118059 A JP8118059 A JP 8118059A JP 11805996 A JP11805996 A JP 11805996A JP 2871590 B2 JP2871590 B2 JP 2871590B2
- Authority
- JP
- Japan
- Prior art keywords
- pixel
- character
- ruled line
- image
- interference
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Landscapes
- Character Input (AREA)
Description
特に、光学的文字読み取り装置において文字枠や罫線な
どの直線に干渉した文字・図形・記号などを抽出するた
めの画像抽出するための画像抽出方式に関する。
線と文字等を含む帳票画像を読み取る方法として特開平
7−334619号公報に記載された技術が提案されて
いる。この公報に開示された発明では、文字の方が罫線
よりも濃い帳票を仮定し、文字認識のためのしきい値と
直線検出のためのしきい値を入力画像の状態から決定す
る。文字認識のためのしきい値よりも画素値が大きい画
素を選出すれば一意的に文字だけを抽出することができ
る。
む2値画像から、直線に干渉した文字等を抽出するため
の方法として特公昭63−251874号公報、特開平
6−309498号公報等に開示された技術が知られて
いる。特公昭63−251874号公報や特開平6−3
09498号公報に記載された方法は、帳票画像を2値
画像として取り込み、その文字枠の線幅や文字ストロー
クの連続性などの特徴から文字等を抽出している。
開平7−334619号公報に記載された方法は、罫線
と文字の濃度が明確な場合には非常に有効であるが、実
際の帳票では必ずしも罫線と文字の濃度が明確に分離す
るとは限らない。例えば、同じインクで印刷された罫線
でも太い罫線と細い罫線では濃淡値が異なり、一本の罫
線でも罫線の中心部と周辺部では濃度が大きく異なる。
また、罫線に微妙な傾きがある場合には、罫線の方向に
沿って濃度値が微妙に変化していく。筆記文字も筆圧の
かかっている部分とそうでない部分では全く濃度が異な
る。
特開平6−309498号公報などに記載された2値画
像に基づく手法は、文字と罫線を一意的に分離できない
ことがある。これは、2値画像上での文字枠幅や文字ス
トロークの連続性といった特徴がかならずしも文字と罫
線を一意的に分離できる特徴ではないことによる。
1874号公報に開示された発明では複数の分離状態を
仮説として生成し、これを文字認識により検証するとい
う仮説検証方式を採用している。しかしながら、ブロッ
ク文字枠や罫線から構成される帳票などでは、一文字枠
から構成される帳票に比べて枠線や罫線(以下では2つ
をまとめて単に罫線と呼ぶ)等の直線と文字等が複雑に
干渉する場合が増えるために、仮説の数が指数関数的に
増加するという問題がある。また、数字“2”の最下部
にある横線や英字“A”の中央部の横線などが罫線に重
なった場合でも正しく文字を抽出できるようにするため
には、非常に多くの分離状態を仮説として生成する必要
があるという問題もある。
術に内在する上記の問題点を解決するためになされたも
のであり、従って本発明の目的は、罫線等の直線と文字
等の濃度差があまり明確でない帳票画像からでも高精度
にかつ一意的に文字等を分離することを可能とした新規
な画像抽出方式を提供することにある。
に、請求項1に記載の発明(第1の発明)は、少なくと
も枠線や罫線等の直線と、文字・図形もしくは記号等を
含んで構成される濃淡画像から、文字・図形・記号等を
抽出する画像抽出方式において、前記濃淡画像から罫線
等の直線・文字・図形・記号等と背景を分離して2値画
像を取得する2値化手段と、前記2値画像から罫線等の
直線を除去するとともに、除去した罫線等に属する画素
(以下罫線画素と略記する)及び罫線除去後の2値画像
に含まれる文字等に属する画素(以下文字画素と略記す
る)の位置を記憶する罫線除去手段と、前記文字画素に
隣接している前記罫線画素の中で最も濃度の高い画素を
各隣接箇所において種画素として選出する種画素選出手
段と、前記種画素とそれに対して直線方向に存在する罫
線画素の平均濃度を前記濃淡画像を参照して算出する平
均罫線濃度算出手段と、前記種画素の位置を開始点とし
て前記濃淡画像中の画素を直線の方向に走査し、画素値
が前記平均罫線濃度に定数を加算した値よりも大きい場
合には文字と直線が重なった画素(以下干渉画素と呼
ぶ)と判定してその位置座標を記憶し、一方画素値が前
記平均罫線濃度値に定数を加算した値よりも小さい場合
にはその方向への画素走査を終了する干渉画素復元手段
とを有し、前記干渉画素復元手段により干渉画素が抽出
された場合、抽出された干渉画素を文字画素と同様に扱
って、これと罫線画素が隣接する箇所に対して前記種画
素選出手段以降の処理を繰り返し適用し、文字等を抽出
することを特徴としている。
は、少なくとも枠線や罫線等の直線と文字・図形もしく
は記号等を含んで構成される濃淡画像から、文字・図形
・記号等を抽出する画像抽出方式において、前記濃淡画
像から罫線等の直線・文字・図形・記号と背景を抽出し
て2値画像を取得する2値化手段と、前記2値画像から
罫線等の直線を除去するとともに、除去した罫線画素及
び罫線除去後の2値画像に含まれる文字画素の位置を記
憶する罫線除去手段と、前記文字画素と前記罫線画素が
隣接する箇所毎に、隣接箇所付近の罫線画素を直線方向
に並ぶ幅1の画素列に分割し、各画素列の中から最大濃
度値を持つ画素を種画素として抽出する種画素選出手段
と、前記種画素が属する画素列に存在する罫線画素の平
均濃度を前記濃淡画像を参照して算出する平均罫線濃度
算出手段と、前記隣接箇所付近の罫線画素に対し、前記
濃淡画像中におけるその濃淡値とその画素が属する画素
列の前記平均濃度との差から、その画素が干渉画素であ
る確からしさを算出する干渉画素らしさ算出手段と、前
記干渉画素らしさの高い画素がどの程度連続的に存在す
るかをその画素の文字ストロークらしさとして算出する
文字ストロークらしさ算出手段と、前記種画素を開始点
としてその種画素が属する罫線の方向に画素を走査し、
前記文字ストロークらしさがしきい値よりも大きい場合
には干渉画素と判定してその位置座標を記憶し、一方文
字ストロークらしさが前記しきい値よりも小さい場合に
はその方向への画素走査を終了する干渉画素復元手段と
を備えることを特徴としている。
い帳票でも 、罫線と文字が重なっている干渉画素は、
罫線方向においてそれと同じ画素列上に存在する近傍の
罫線画素よりも濃度が高い傾向がある。
学的特徴などから同定(設定)した罫線画素のうち、干
渉画素が存在する可能性の高い箇所、すなわち罫線画素
と文字画素が隣接する箇所周辺に存在する罫線画素に対
して画素列毎に平均濃度を調べ、この平均濃度よりも濃
度が高い画素を干渉画素と判定することにより、罫線等
と文字等の濃度値が明確に分離していない画像からでも
干渉画素を高精度にかつ一意的に抽出することができ
る。罫線除去手段によって抽出された文字画素と干渉画
素とを合成すれば文字を抽出することができる。また、
種画素の周辺から順番に干渉画素の復元を行い、復元の
途中で干渉画素でない画素がみつかったならばその方向
への画素探索を中止することにより、入力画像が多少の
ノイズ成分を含んでいる画像でも、本来干渉画素でない
画素を誤って復元しないようにすることができる。
は、周囲に存在する罫線画素よりも濃い罫線画素がどの
程度連続的に存在するかという特徴から文字ストローク
らしさを算出し、これを干渉画素抽出のための基準とし
ているので、濃淡差の抽出できない罫線画素が数画素あ
っても周囲に濃淡差の明確な罫線画素があれば、滑らか
な形状で干渉画素を抽出することができるようになる。
図面を参照しながら詳細に説明する。
明)に基づき構成した帳票画像からの文字抽出方式の一
実施例を示すブロック図である。図2に本実施例の入力
画像の一例を示す。
0は入力画像を2値化し、文字及び罫線と背景とを分離
する。2値化の方法としては、画像全体を一様なしきい
値で2値化する方法や局所領域毎にしきい値を変化させ
る方法などが一般的に知られている。図3は、図2に示
した入力画像を一様なしきい値で2値化した画像の一部
を示す図である。罫線除去手段101は、2値化手段1
00が出力する2値画像から帳票に印刷されている罫線
を抽出し、除去する。また、罫線除去手段101は除去
した罫線画素の位置を記憶する。具体的な記憶方法とし
ては、2値画像と同じ大きさの画像領域を確保して罫線
位置を記憶してもよいし、2値画像中の罫線画素に第3
番目の値を書き込んで3値画像としてもよい。本実施例
では後者の方法で罫線位置を記憶するものとする。
画像の一部を示す図である。この図4からわかるよう
に、罫線除去手段101の動作が終了した時点で、背景
画素400、文字画素401、罫線画素402(但し罫
線画素は文字と罫線が重なった画素=干渉画素を含んで
いる)の位置が同定(設定)される。
図4、図5を用いて説明する。
402が隣接している箇所が2箇所ある。抽出対象であ
る干渉画素は、文字ストロークの一部であるから、既に
文字画素と判明している画素401に隣接する位置に存
在する確率が高い。また、干渉画素は周囲の罫線濃度よ
りも濃度が高いという仮定から、各隣接箇所においても
っとも干渉画素である確率が高い画素を種画素として選
出する。例えば、図4のような画像に対しては、図5に
示すような2つの種画素500、及び501が選出され
る。
出手段102で選出された各種画素周辺の平均罫線濃度
を算出する。横罫線の場合には種画素を中心としてその
左右方向に存在するwh 個の罫線画素の平均濃度を算出
する。縦罫線の場合には種画素を中心として、その上下
方向に存在するwv 個の罫線画素の平均濃度を算出す
る。一般的に、横罫線との重なり長の方が縦罫線との重
なり長よりも短いので、wh <wv となるようにする。
また、平均罫線濃度算出のための罫線画素が上記の個数
に達しない場合でも、そこにある罫線画素のみから平均
値を算出する。
ら平均値を算出する理由を図6を用いて説明する。
罫線と縦方向の文字ストロークが交差している箇所の濃
度値を示す図である。この図から、罫線方向に並んだ画
素列600の中では、干渉画素とそれ以外の罫線画素の
値が明確に分離しているが、罫線の中心部付近と周辺部
付近では濃度値が異なることがわかる。例えば、罫線中
心部にある罫線画素601と、罫線輪郭部にある干渉画
素602では罫線画素601の方が濃度値が高い。これ
は、画像入力装置が備える1つのCCD画素が光を感知
する領域の直径が罫線幅に対してかなり大きいことに依
っており、このことから、罫線画素を干渉画素とそれ以
外の画素に分離するには各画素列毎に濃淡変化を調べる
のが有効であることがわかる。
図7を用いて説明する。横方向をx軸、縦方向をy軸と
すると、干渉画素復元手段104は、各種画素を開始点
として、横罫線なら左右方向、縦罫線なら上下方向に画
素を探索し、その濃淡値g(x,y)とその種画素に対
して平均罫線濃度算出手段103が算出した平均濃度値
を比較して、 g(xs +x,y)>平均値+α ・・・・・・・・ (1) を満たす画素P(xs +x,y)を干渉画素として復元
し、ラベル画像中に干渉画素に対応する第4の値を書き
込む。ここで、xs は種画素のx座標、αは定数を示
す。図7は横罫線の場合を示しており、まず種画素70
0の濃度と平均値を比較し、式(1)を満たしていたら
干渉画素と判定して、その左の画素701の濃度を調べ
る。画素701も式(1)を満たしたならば、さらに左
方向の画素を探索していき、式(1)を満たさない画素
が現れたら種画素の右側に存在する画素について同様に
探索を行っていく。右側の画素に対しての探索が終了し
た場合にはこの種画素に対する干渉画素の復元を終了す
る。
同じように扱って再びこれと罫線画素の隣接箇所に対し
て種画素選出手段102以降の処理を繰り返す。すると
さらに干渉画素が復元されて、図4のような画像に対し
ては、図8に示すようなラベル画像が得られる。ここ
で、文字画素ラベルがついた画素と干渉画素ラベルがつ
いた画素のみを抽出すれば、文字を正しく抽出すること
ができる。図8において、803は干渉画素である。
明)に基づいて構成した帳票画像からの文字抽出方式の
一実施例を図9を用いて説明する。
罫線除去手段901は上述した第1の発明に示したもの
と完全に同機能を有するものである。
段902の機能について説明する。種画素選出手段90
2は、罫線除去手段901が出力する画像にて、罫線ラ
ベル画素と文字ラベル画素が隣接している全干渉箇所付
近の各画素列1000〜1003において最大濃度値の
画素1004〜1007を種画素として選出する。各画
素列の長さ、すなわち種画素の探索範囲は以下のように
して定めるとよい。まず、文字画素列1008に隣接す
る罫線画素列1000、及び文字画素列1009に隣接
する罫線画素列1002は、文字画素に4連結で接して
いる罫線画素のみから構成される。そして文字画素列1
008、1009から離れるほど画素列の長さをやや長
めに設定する。こうすることにより、文字ストロークが
罫線と鋭角的に交わる場合でも、本来干渉画素であるは
ずの画素が種画素として選ばれる確率を増すことができ
る。
素選出手段902が選出した各種画素に対して、同一列
上に存在する罫線画素の平均罫線濃度を算出する。
と同一列上に存在する罫線画素の濃淡値とその種画素に
ついて算出した平均罫線濃度とを比較し、各罫線画素が
干渉画素である確信度(干渉画素らしさ)を計算する。
干渉画素らしさは、横罫線なら種画素を中心としてその
左右に存在するwh 個、縦罫線なら種画素を中心として
その上下に存在するwv 個の罫線画素についてのみ算出
し、種画素より遠く離れた罫線画素に対しては求める必
要はない。また、干渉画素らしさO(x,y)は、 O(x,y)=f(g(x,y)−平均値) ・・・・・・・(2) で定義する。ここで関数fはシグモイド関数のような形
をした単調増加の関数を表す。また、本関数の値域の上
限をOmax 、下限をOmin とする。
すると、1つの罫線画素に対して複数の干渉画素らしさ
が定義されうるが、そうした場合には最大値である値を
その画素の干渉画素らしさとする。但し、縦罫線と横罫
線の交点部の罫線画素に対しては最小値を採用する。
干渉画素らしさの算出された画素に対して、干渉画素ら
しさの高い画素がどのくらい連続的に並んでいるかを
“文字ストロークらしさ”という定量的な値で表す。ま
ず、微小領域における方向性を以下の式(3)により定
義する。
景ラベル画素に対する干渉画素らしさはそれぞれO
(x,y)=Omax 、O(x,y)=0min とする。こ
の計算式の理解を容易にするために、例としてD
0 (x,y)の算出原理を図11を用いて説明する。D
O (x,y)は横方向に長い2つのフィルタ1100、
及び1101を使って算出した積和演算結果の大きい方
を採用するのと等しく、従って幅2画素程度以上の横方
向ストロークの抽出をつかさどる。D45(x,y)、D
90(x,y)、D135 (x,y)もこれを45度ずつ傾
けたようなフィルタで計算することができる。
(x,y),L90(x,y),L135(x,y)は、そ
れぞれ画素(x,y)付近に横方向、右斜め方向、縦方
向、左斜め方向の干渉画素の並びが存在する確からしさ
を示す。
2を用いてLO (x,y)の算出方法を説明する。画素
1200において横方向の干渉画素列(=文字ストロー
ク)があるということは、その周囲にもそれに接続する
文字ストロークがあるはずである。そこで、画素位置1
201〜1203、1204〜1206のそれぞれにお
いて図示した方向のDの値が最大になるものをそれぞれ
選出してきて、これと画素位置1200におけるD0 の
値から画素位置1200における横方向文字ストローク
の存在可能性を算出する。L45(x,y),L90(x,
y),L135 (x,y)もこれを45度ずつ傾けた場合
に等しい。
らしさの大きい画素を干渉画素として復元する。復元順
序は前記した第1の発明と同じように、文字ラベル画素
と接している罫線画素列から開始して、罫線の反対側の
方向へ進めていく。ひとつの罫線画素列内においては、
種画素を開始点として罫線方向に画素探索し、その文字
ストロークらしさがしきい値よりも大きければ復元して
その隣の画素に着目し、しきい値よりも小さければそこ
でその方向への探索を中止する。
0枚から文字を抽出する実験を行った。その結果、罫線
と文字ストロークが長い区間で重複している、比較的文
字抽出が難しい箇所に対して、94.1%の抽出成功率
を得た。
例を述べたが、帳票画像以外でも直線線分が文字・記号
・図形に接触する画像から文字・記号・図形を抽出する
場合に有効である。例として、アンダーライン除去など
が挙げられる。
発明に基づいて構成した帳票画像からの文字コード抽出
方式の実施例を図13に示すブロック図を用いて説明す
る。本実施例は、図1に示した干渉画素復元手段130
4(図1では104)の後段に、文字切り出し手段13
05及び文字認識手段1306を付加したシステムであ
る。本ブロック図が示すシステムに図14のような濃淡
画像を入力した場合には、請求項1の発明、即ち干渉画
素復元手段1304の最終的出力画像は図15に示す文
字だけを含む画像となる。
各文字毎の画像を生成する手段である。本手段の具体的
実現方法としては、縦方向に黒画素を投影したときに得
られる黒画素ヒストグラムの谷点を用いる方法や、連結
黒画素のラベリング結果を用いる方法等が一般的に知ら
れている。
これらの方法によって図15に示す画像の最上段の文字
列から抽出した文字画像の例を示す図である。文字認識
手段1306は、図16に示した各文字画像を認識し、
それぞれの文字コードを出力する。干渉画素復元手段1
304が出力する画像は、図15に示したように、罫線
等の直線成分と文字が干渉している部分付近の文字形状
が実形状に近い状態に復元されるために、従来の個別文
字認識方法を用いて高い読み取り率を得ることができ
る。しかし、前記した特公昭63−251874号公報
に示された発明などを用いた文字読み取り方法では、罫
線等の直線成分と文字の干渉箇所付近の文字形状が階段
状になるために、文字認識のための特徴量として不適当
な値が抽出され、文字認識を困難にするという問題があ
る。
枠線や罫線等の直線と文字・図形・記号を含む濃淡画像
から文字・図形・記号を高精度に抽出することができ
る。
来の文字の形を忠実に復元するために、本発明の後段で
実行される可能性の高い文字認識処理の入力画像として
優れた品質の画像を提供することができる。
図である。
図である。
ある。
ル画像の例を示す図である。
画素の位置の例を示す図である。
図である。
索する順序を示す図である。
ある。
図である。
る種画素の位置の例を示す図である。
向)を算出するための2種類のフィルタを示す図であ
る。
法を説明する図である。
ロック図である。
復元手段の出力画像を示す図である。
示す図である。
索範囲 1004、1005、1006、1007…種画素の検
索範囲1000、10 01、1002、1003の中から選出された種画素 1008、1009…罫線画素に隣接する文字画素 1100、1101…微小領域における干渉画素の方向
性(横方向)を算出する為のフィルタ 1200、1201、1202、1203、1204、
1205、1206…画素 1300…2値化手段 1301…罫線除去手段 1302…種画素選出手段 1303…平均罫線濃度算出手段 1304…干渉画素復元手段 1305…文字切り出し手段 1306…文字認識手段
Claims (4)
- 【請求項1】 少なくとも枠線や罫線等の直線と、文字
・図形もしくは記号等を含んで構成される濃淡画像か
ら、文字・図形・記号等を抽出する画像抽出方式におい
て、 前記濃淡画像から罫線等の直線・文字・図形・記号等と
背景を分離して2値画像を取得する2値化手段と、前記
2値画像から罫線等の直線を除去するとともに、除去し
た罫線等に属する画素(以下罫線画素と略記する)及び
罫線除去後の2値画像に含まれる文字等に属する画素
(以下文字画素と略記する)の位置を記憶する罫線除去
手段と、前記文字画素に隣接している前記罫線画素の中
で最も濃度の高い画素を各隣接箇所において種画素とし
て選出する種画素選出手段と、前記種画素とそれに対し
て直線方向に存在する罫線画素の平均濃度を前記濃淡画
像を参照して算出する平均罫線濃度算出手段と、前記種
画素の位置を開始点として前記濃淡画像中の画素を直線
の方向に走査し、画素値が前記平均罫線濃度に定数を加
算した値よりも大きい場合には文字と直線が重なった画
素(以下干渉画素と呼ぶ)と判定してその位置座標を記
憶し、一方画素値が前記平均罫線濃度値に定数を加算し
た値よりも小さい場合にはその方向への画素走査を終了
する干渉画素復元手段とを有し、前記干渉画素復元手段
により干渉画素が抽出された場合、抽出された干渉画素
を文字画素と同様に扱って、これと罫線画素が隣接する
箇所に対して前記種画素選出手段以降の処理を繰り返し
適用し、文字等を抽出することを特徴とする画像抽出方
式。 - 【請求項2】 前記干渉画素復元手段により生成される
文字等を含む画像から各文字等の存在領域を定め、1つ
の文字だけを含む文字画像を出力する文字切り出し手段
と、前記文字画像を文字認識して文字コードを出力する
文字認識手段とを有することを更に特徴とする請求項1
に記載の画像抽出方式。 - 【請求項3】 少なくとも枠線や罫線等の直線と文字・
図形もしくは記号等を含んで構成される濃淡画像から、
文字・図形・記号等を抽出する画像抽出方式において、 前記濃淡画像から罫線等の直線・文字・図形・記号と背
景を抽出して2値画像を取得する2値化手段と、前記2
値画像から罫線等の直線を除去するとともに、除去した
罫線画素及び罫線除去後の2値画像に含まれる文字画素
の位置を記憶する罫線除去手段と、前記文字画素と前記
罫線画素が隣接する箇所毎に、隣接箇所付近の罫線画素
を直線方向に並ぶ幅1の画素列に分割し、各画素列の中
から最大濃度値を持つ画素を種画素として抽出する種画
素選出手段と、前記種画素が属する画素列に存在する罫
線画素の平均濃度を前記濃淡画像を参照して算出する平
均罫線濃度算出手段と、前記隣接箇所付近の罫線画素に
対し、前記濃淡画像中におけるその濃淡値とその画素が
属する画素列の前記平均濃度との差から、その画素が干
渉画素である確からしさを算出する干渉画素らしさ算出
手段と、前記干渉画素らしさの高い画素がどの程度連続
的に存在するかをその画素の文字ストロークらしさとし
て算出する文字ストロークらしさ算出手段と、前記種画
素を開始点としてその種画素が属する罫線の方向に画素
を走査し、前記文字ストロークらしさがしきい値よりも
大きい場合には干渉画素と判定してその位置座標を記憶
し、一方文字ストロークらしさが前記しきい値よりも小
さい場合にはその方向への画素走査を終了する干渉画素
復元手段とを備えることを特徴とする画像抽出方式。 - 【請求項4】 前記干渉画素復元手段により生成される
文字等を含む画像から各文字等の存在領域を定め、1つ
の文字だけを含む文字画像を出力する文字切り出し手段
と、前記文字画像を文字認識して文字コードを出力する
文字認識手段とを有することを更に特徴とする請求項3
に記載の画像抽出方式。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP8118059A JP2871590B2 (ja) | 1996-05-13 | 1996-05-13 | 画像抽出方式 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP8118059A JP2871590B2 (ja) | 1996-05-13 | 1996-05-13 | 画像抽出方式 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH09305707A JPH09305707A (ja) | 1997-11-28 |
JP2871590B2 true JP2871590B2 (ja) | 1999-03-17 |
Family
ID=14727006
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP8118059A Expired - Lifetime JP2871590B2 (ja) | 1996-05-13 | 1996-05-13 | 画像抽出方式 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2871590B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7796817B2 (en) | 2006-09-14 | 2010-09-14 | Fujitsu Limited | Character recognition method, character recognition device, and computer product |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4416890B2 (ja) | 1999-12-20 | 2010-02-17 | 富士通株式会社 | 帳票識別装置 |
JP4603807B2 (ja) * | 2004-03-10 | 2010-12-22 | 富士通株式会社 | 文字認識装置,文字認識方法,媒体処理方法,文字認識プログラムおよび文字認識プログラムを記録したコンピュータ読取可能な記録媒体 |
JP5724454B2 (ja) | 2011-02-25 | 2015-05-27 | 村田機械株式会社 | 画像処理装置及び画像処理方法 |
CN112488108A (zh) * | 2020-12-11 | 2021-03-12 | 广州小鹏自动驾驶科技有限公司 | 一种车位号识别方法、装置、电子设备及存储介质 |
-
1996
- 1996-05-13 JP JP8118059A patent/JP2871590B2/ja not_active Expired - Lifetime
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7796817B2 (en) | 2006-09-14 | 2010-09-14 | Fujitsu Limited | Character recognition method, character recognition device, and computer product |
Also Published As
Publication number | Publication date |
---|---|
JPH09305707A (ja) | 1997-11-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6080259B2 (ja) | 文字切り出し装置及び文字切り出し方法 | |
US5410611A (en) | Method for identifying word bounding boxes in text | |
JP3904840B2 (ja) | 多値画像から罫線を抽出する罫線抽出装置 | |
Yuan et al. | Text extraction from gray scale document images using edge information | |
CN114529459B (zh) | 一种对图像边缘进行增强处理的方法和系统及介质 | |
JP3830998B2 (ja) | 罫線除去方法及びこれを用いた文字認識装置 | |
CN110598566A (zh) | 图像处理方法、装置、终端和计算机可读存储介质 | |
CN114863492B (zh) | 一种低质量指纹图像的修复方法及修复装置 | |
CN112686265A (zh) | 一种基于层级轮廓提取的象形文字分割方法 | |
JP2871590B2 (ja) | 画像抽出方式 | |
CN112036294B (zh) | 一种纸质表格结构自动识别的方法及装置 | |
JP2010191724A (ja) | 画像処理装置および制御プログラム | |
JP4049560B2 (ja) | 網点除去方法及びシステム | |
JP2001043313A (ja) | 文字切出し方法 | |
KR100295360B1 (ko) | 쉐이딩알고리즘을이용한영상처리방법 | |
Mostafa | An adaptive algorithm for the automatic segmentation of printed Arabic text | |
JP2868134B2 (ja) | 画像処理方法及び装置 | |
CN111027521B (zh) | 文本处理方法及系统、数据处理设备及存储介质 | |
JP2002133424A (ja) | 文書の傾き角度及び境界の検出方法 | |
CN109086766B (zh) | 一种基于积分图的多阈值融合冠字号提取方法 | |
JP2785747B2 (ja) | 文字読取装置 | |
JP2795860B2 (ja) | 文字認識装置 | |
JP3710164B2 (ja) | 画像処理装置及び方法 | |
Martyshkin et al. | Research of the Handwriting Recognition Methods | |
JP2580976B2 (ja) | 文字切出し装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20080108 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20090108 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100108 Year of fee payment: 11 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110108 Year of fee payment: 12 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110108 Year of fee payment: 12 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120108 Year of fee payment: 13 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130108 Year of fee payment: 14 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130108 Year of fee payment: 14 |
|
EXPY | Cancellation because of completion of term |