JP2004046528A - 文書方向推定方法および文書方向推定プログラム - Google Patents
文書方向推定方法および文書方向推定プログラム Download PDFInfo
- Publication number
- JP2004046528A JP2004046528A JP2002202959A JP2002202959A JP2004046528A JP 2004046528 A JP2004046528 A JP 2004046528A JP 2002202959 A JP2002202959 A JP 2002202959A JP 2002202959 A JP2002202959 A JP 2002202959A JP 2004046528 A JP2004046528 A JP 2004046528A
- Authority
- JP
- Japan
- Prior art keywords
- rectangles
- rectangle
- area
- character
- document direction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Character Input (AREA)
- Image Analysis (AREA)
Abstract
【解決手段】画像をレイアウト解析してテキスト領域を抽出する第1のステップと、抽出したテキスト領域内の矩形について距離が近い矩形をまとめることを、まとめた矩形が指定数あるいはまとめ処理が指定回数となるまで繰り返して矩形数を減らす第2のステップと、まとめた矩形をもとに文書方向を決定する第3のステップとを有する文書方向推定方法である。
【選択図】 図1
Description
【発明の属する技術分野】
本発明は、画像中の文書方向を推定する文書方向推定方法および文書方向推定プログラムに関するものである。
【0002】
【従来の技術】
従来、文書をスキャナー装置で読み取った文書画像の文字認識は、文書画像から文字領域を抽出し、抽出した文字領域について文字の配置されている方向に文字認識するようにしていた。
【0003】
この際、抽出した文字領域について、4方向に順次回転して文字認識をそれぞれ行い、領域内文字の信頼度の平均値を求め、次に、全体の画像での平均値が最も高い方向を文書の方向とし、文字認識していた(特開平8−212298号公報)。
【0004】
また、文書画像から文字領域を抽出し、抽出した文字領域に属性(タイトル、本文など)をつける。文字領域を4方向に回転して文字認識を行い、領域内文字の信頼度を予め定めた属性の優先順位を使って文書方向を決定する。このとき、方向決定には、各文字領域から求めた方向をもとに文書全体の方向を多数決で決める(特開平9−69136号公報)。
【0005】
また、文書画像から文字領域を抽出し、抽出した文字領域を4方向に回転して文字認識を行い、領域内文字の信頼度からそれぞれの領域の方向を決める。文書全体では、部分領域の面積を考慮して方向を決定する(特開平2001−312697号公報)。
【0006】
【発明が解決しようとする課題】
上述した従来の技術では、全て文字領域を求め、当該文字領域について画像を回転し、回転後の画像の文字認識をそれぞれ行い、信頼度の高い方向を文書方向と決定していた。
【0007】
このため、以下のような課題があった。
(1) 文字領域が正しく行われていればよいが、例えば文字領域の中に一部図形がかかる場合は、そのパターンの文字認識結果の信頼度や距離値が、領域全体の信頼度や距離値の平均などに影響を与えてしまい、領域の文書方向を正しく求められないという問題があった。
【0008】
(2) 文書画像から抽出した文字領域の全てについて文字認識してその信頼度から方向を推定することは、当該文字領域に含まれる文字数分の文字認識処理が必要となり、文書方向決定のための処理時間が長くかかってしまうという問題があった。
【0009】
(3) (2)の問題を避けるため、文書方向を決定する文字領域の数を制限して少なくして高速化を図ることが考えられるが、文字領域を減らしたのでは文書全体としての方向を誤る可能性が大となってしまう問題があった。
【0010】
本発明は、これらの問題を解決するため、文書画像から文字方向を決定する際に、文書方向の推定精度を保ちながら処理速度を速くし、かつ文書画像全体から文書方向を推定することを目的としている。
【0011】
【課題を解決するための手段】
図1を参照して課題を解決するための手段を説明する。
【0012】
図1において、レイアウト解析手段14は、画像をレイアウト解析してテキスト領域、表領域などを抽出するものである。
【0013】
探索領域抽出手段15は、テキスト領域内の矩形について距離が近い矩形をまとめることを、まとめた矩形が指定数あるいはまとめ処理が指定回数となるまで繰り返して矩形数を減らすなどするものである。
【0014】
文字認識手段16は、文字を認識するものである。
次に、動作を説明する。
【0015】
レイアウト解析手段14が画像をレイアウト解析してテキスト領域を抽出し、探索領域抽出手段15が抽出したテキスト領域内の矩形について距離が近い矩形をまとめることを、まとめた矩形が指定数あるいはまとめ処理が指定回数となるまで繰り返して矩形数を減らし、まとめた矩形をもとに文書方向を決定するようにしている。
【0016】
この際、探索領域抽出手段15が抽出したテキスト領域内の各矩形について、矩形サイズが所定サイズの範囲内、かつ当該矩形を中心にした所定探索領域内で白から黒あるいは黒から白あるいは両者の変化数を当該探索領域で除算した値が所定範囲内、かつ前記探索範囲内に大きな矩形がない当該矩形について前記距離が近いを矩形をまとめることを、まとめた矩形が指定数あるいはまとめ処理が指定回数となるまで繰り返すようにしている。
【0017】
また、探索領域抽出手段15がまとめた矩形の重心を算出して当該重心に最も近い矩形を選択して当該選択した矩形を中心に探索領域を決定するようにしている。
【0018】
また、まとめた矩形内の全矩形あるいは探索領域内の全矩形を4方向に回転させてそれぞれの文字認識を行い、最も確からしい文書方向を決定するようにしている。
【0019】
また、画像をレイアウト解析して抽出した表領域内の、各セルについてレイアウト解析して抽出したテキスト領域について、レイアウト解析してテキスト領域を抽出するようにしている。
【0020】
従って、文書画像から文字方向を決定する際に、文書方向の推定精度を保ちながら処理速度を速くし、かつ文書画像全体から文書方向を推定することが可能となる。
【0021】
【発明の実施の形態】
次に、図1から図8を用いていて本発明の実施の形態および動作を順次詳細に説明する。
【0022】
図1は、本発明のシステム構成図を示す。
図1において、処理装置1は、プログラムに従い各種処理を実行するものであって、入力手段11、ラベリング手段12、文字サイズ推定手段13、レイアウト解析手段14、探索領域抽出手段15、文字認識手段16、および出力手段17などから構成されるものである。
【0023】
入力手段11は、OCR2で読み取った文書の画像を取り込んだりなどするものである。
【0024】
ラベリング手段12は、画像上で、ある黒画素に注目して当該黒画素に隣接する他の黒画素を順次連結した当該領域にラベルを付与するものである。
【0025】
文字サイズ推定手段13は、ラベリング手段12によってラベルを付与した、画素の連結した領域中の文字サイズ(文字に相当する矩形のサイズ)の最頻度のサイズ(縦H0、横W0のサイズ)を算出するものである(図5の(b)参照)。
【0026】
レイアウト解析手段14は、画像中の表領域、図形領域、およびテキスト領域を解析するものである(図4参照)。
【0027】
探索領域抽出手段15は、テキスト領域内の矩形について、距離が近い矩形をまとめることを、まとめた矩形が指定数あるいはまとめ処理が指定回数となるまで繰り返して矩形数を減らし、当該まとめた矩形の重心に最も近い矩形を中心とした所定サイズの探索領域を抽出するものである(図7参照)。
【0028】
文字認識手段16は、文字を認識するものである。
出力手段17は、文字認識結果をファイル4に出力するものである。
【0029】
OCR2は、書類をスキャナで読み取って画像を生成するものである。
画像データ3は、書類をスキャナで読み取った画像である。
【0030】
ファイル4は、画像データ3について文字認識した結果を格納するファイルである。
【0031】
次に、図2および図3のフローチャートの順番に従い、図1の構成の動作を順次詳細に説明する。
【0032】
図2および図3は、本発明の動作説明フローチャートを示す。
図2において、S1は、入力する。これは、文書をスキャナーなどで読み取った文書画像を図1の処理装置1に入力する。
【0033】
S2は、黒画素連結領域を抽出する。これは、画像上で例えば左上の黒画素に連結する他の黒画素を全て抽出し当該領域にラベルを付与する(ラベリング)。
【0034】
S3は、文字サイズを推定する。これは、S1でラベリングした黒画素を連結した各領域をもとに,文字サイズを推定する(図5の(b)で後述)。
【0035】
S4は、レイアウト解析を行う。これは、S2で抽出した黒画素の連結領域についてレイアウト解析、即ち、表領域、図領域、およびテキスト領域を解析する(図4を用いて後述する)。そして、テキスト領域については、S11以降の処理を実行する。表領域については、S31以降を実行する。
【0036】
S11は、S4のレイアウト解析でテキスト領域と解析された領域(テキスト領域)について、1つのテキスト領域を選択する。
【0037】
S12は、テキスト領域内の1矩形を選択する。
S13は、条件3,4,5の判定を行う。これは、テキスト領域内の矩形につて、後述する図7の条件3,4、5の判定を行う。ここで、
・条件3は、矩形の幅WとS3で推定した文字サイズW0との差の絶対値が閾値以下、かつ、矩形の高HがS3で推定した文字サイズH0との差の絶対値が閾値以下かを判別する。
【0038】
・条件4は、探索領域(図7の(b)参照)内の線密度が閾値以下か判別する(図7を用いて後述する)。
【0039】
・条件5は、探索矩形内に大きな矩形がない。
以上の3つの条件を全て満たしたときにYESとなり、S14で文字候補として抽出し、S15に進む。一方、NOの場合には、S15に進む。
【0040】
S15は、テキスト領域内の矩形について全てS12からS15の処理を終了したか判別する。YESの場合には、S16に進む。NOの場合には、S12以下を繰り返す。
【0041】
S16は、全てのテキスト領域が終了か判別する。YESの場合には、全てのテキスト領域について、文字候補の抽出を終了したので、S17に進む。NOの場合には、S11に戻り繰り返す。
【0042】
S17は、文字候補をクラスタリングする。
S18は、クラスタが指定の数か判別する。これらS17、S18は、S14で抽出したテキスト領域内の文字候補の矩形についてクラスタリング、即ち、ある矩形に近い他の矩形をまとめることを順次行い、全体のまとめた矩形の数が所定数(例えば3個)になるまで繰り返す(図8を用いて後述する)。YESの場合には、クラスタの数が指定の数になったので、S19に進む。NOの場合には、S17を繰り返す。
【0043】
S19は、矩形候補を生成する。これは、S18のYESでクラスタリングして指定個数になったので、当該指定個数になった矩形の集合を矩形候補とする。
【0044】
S20は、重心を計算する。これは、S19で矩形の集合の矩形候補の全体の重心を求める(図8参照)。
【0045】
S21は、重心に最も近い矩形候補を選択する。これは、S20で求めた重心に最も近い矩形候補を選択する(図8の矩形候補□(中が黒)を選択する)。
【0046】
S22は、S21で選択した矩形を中心とした探索領域を求める。これは、S21で求めた例えば図8の矩形候補□(中が黒)を中心として探索領域を求める。そして、図2のS41に進む。
【0047】
S41は、探索領域の取り込みを行う。
S42は、4方向に回転した画像を作成する。これらS41、S42は、図2のS22で求めた、例えば図8の探索領域の画像を取り込み、4方向に回転させた画像をそれぞれ作成する。
【0048】
S43は、文字認識する。これは、S44で4方向に回転させた探索領域の画像について、それぞれ文字認識を行う。
【0049】
S44は、最も確からしい方向を判定する。これは、S43で4方向に回転させた探索領域の画像について、それぞれ文字認識を行い、文字認識度の最も高い方向を文字方向として判定する。
【0050】
S45は、領域終了か判別する。YESの場合には、S46に進む。NOの場合には、S41に戻り、次の探索領域について繰り返す。
【0051】
S46は、各探索領域の方向を決定する。
S47は、多数決で方向を決定する。これらS46、S47は、各探索領域の文字認識率の高い方向をそれぞれ決定し、テキスト領域内で当該決定した探索領域内の文字方向について多数決で1つを決定する。
【0052】
S48は、全体を多数決した方向で文字認識する。これは、S47で決めた方向で、当該テキスト領域内の全ての文字矩形について文字認識を行う。
【0053】
以上によって、文書画像上でテキスト領域を抽出し、条件3,4,5の判定で文字候補矩形のみを抽出し、抽出した文字候補についてクラスタリングを行ってまとめた矩形を生成して矩形数を減らし(例えば3個、5個などに減らし)、当該減らしたまとめた矩形の重心に最も近い文字候補矩形を中心に探索領域を設定し、当該探索領域内について文字認識して文字方向を判定してテキスト領域の全体の文字方向を多数決で決定し、当該決定した文字方向でテキスト領域内の矩形の文字認識を行うことにより、テキスト領域内の文字方向を少ない探索領域内のみで迅速かつに処理量少なくして決定し、決定した文字方向でテキスト領域内の文字認識を行うことが可能となる。
【0054】
図2のS31は、S4のレイアウト解析で表領域と判定されたので、当該表領域内のセルを抽出する。
【0055】
S32は、セル内をレイアウト解析してテキスト領域だけ抽出する。これは、S4のレイアウト解析と同様に行う。
【0056】
S33は、条件1,2に合致した領域を抽出する。これは、表のセル内のテキスト領域について、後述する図6の(a)の条件1,2に合致する領域を抽出する。ここで、
・条件1は、領域サイズが閾値の範囲内
・条件2は、領域内の黒画素密度が閾値の範囲内
とそれぞれ判定し、両者が満たされた領域のみを抽出する。
【0057】
S34は、閾値サイズ以上の領域か判別する。YESの場合には、表領域のセル内のテキスト領域と判明したので、既述したS11からS22で探索領域を求め、続いて図3のS41からS48で文字方向を決定して文字認識する。一方、S34のNOの場合には、S35で面積でソートし、S36で大きな指定個を探索領域として求め、当該求めた探索領域について既述した図3のS41からS48で文字方向を決定して文字認識する。
【0058】
以上によって、表領域内のセルがテキスト領域の場合にも、同様に探索領域を求めて文字方向を迅速かつ処理量少なく決定し、当該文字方向でテキスト領域の文字認識を行うことが可能となる。
【0059】
図4は、本発明の説明図(その1)を示す。
図4の(a)は、原画像例を示す。ここでは、画像上に図示のように、図、テキスト、表があるとする。
【0060】
図4の(b)は、レイアウト解析結果例を示す。これは、図4の(a)の原画像について、既述した図2のS4のレイアウト解析して得たレイアウト解析結果の例を示す。ここで、
・表領域は、黒画素が所定以上の長さ連結する罫線で構成されている領域として判定する。
【0061】
・図領域は、サイズが閾値より大きな黒画素連結領域がある領域として判定する。
【0062】
・テキスト領域は、原画像中で、表領域、図領域でない領域をここでは、テキスト領域と判定する。
【0063】
以上の処理によって、原画像中からテキスト領域を抽出したり、更に、表領域内のセルについてレイアウト解析してテキスト領域を抽出(既述した図2のS32)したりなどすることが可能となる。
【0064】
図5は、本発明の説明図(その2)を示す。
図5の(a)は、ラベリング結果例を示す。ここで、各矩形は、原画像上で、ある黒画素に連結する他の黒画素をまとめ、当該まとめた黒画素のあつまりについて内接する矩形として生成したものである。
【0065】
図5の(b)は、文字サイズ推定例を示す。
図5の(b−1)は、文字サイズの幅W0を推定する説明図を示す。図示の曲線は、図5の(a)などのラベリング結果の各文字矩形の幅Wを全て求め、横軸を当該求めた幅、縦軸をその頻度で表した曲線である。そして、図示のように求めた最頻度の幅を文字サイズ幅W0と推定する。本実施例は最頻度の文字サイズ幅を文字サイズ幅W0として推定したが、平均文字サイズ幅を文字サイズ幅W0として推定してもよい。
【0066】
図5の(b−2)は、文字サイズの高H0を推定する説明図を示す。図示の曲線は、図5の(a)などのラベリング結果の各文字矩形の高Hを全て求め、横軸を当該求めた高、縦軸をその頻度で表した曲線である。そして、最頻度の高H0を図示のように求め、文字サイズ高H0と推定する。本実施例は最頻度の文字サイズ高を文字サイズ高H0として推定したが、平均文字サイズ高を文字サイズ高H0として推定してもよい。
【0067】
図6は、本発明の説明図(その3)を示す。
図6の(a)は、条件を示す。これは、既述した図2の表領域内のセルについてレイアウト解析して抽出したテキスト領域について、テキストが含まれている可能性が高い領域を抽出する条件であって、ここでは、
・条件1は、閾値<領域サイズ<閾値
・条件2は、閾値<領域内の黒画素密度<閾値
である。即ち、条件1で表領域内のセルについてテキスト領域とレイアウト解析された領域について、当該領域のサイズが所定の閾値の範囲内(条件1)、かつ当該領域内の黒画素の密度が所定の閾値の範囲内(条件2)のときに、可能性大のテキスト領域として抽出する。
【0068】
図7は、本発明の説明図(その4)を示す。
図7の(a)は、条件を示す。これら条件3,4,5は、既述した図2のS13の条件3,4,5であって、文字矩形として抽出する条件であり、
・条件3は、ΔW=|W−W0|<閾値 かつ ΔH=|H−H0|<閾値
(W0,H0は推定文字サイズの幅、高(図5の(b)))
・条件4は、閾値<探索領域の線密度<閾値
(線密度は領域内をラスタスキャンしたときの白から黒の変化点数/領域面積)
・条件5は、探索矩形内に大きな矩形が無い
(探索領域内をラベリングして大きな矩形を探索して無い)
である。ここで、条件3は、テキスト領域内の矩形の幅Wと高Hが、既述した図5の(b)で推定した文字サイズの幅W0と高H0とのそれぞれの差が所定閾値以内であるという条件である。条件4は、文字矩形を中心とした探索領域の線密度(探索領域内を一定方向にスキャンして例えば白から黒に変わる点の数を当該探索領域の面積で除算した値)が所定の閾値の範囲内であるという条件である。条件5は、文字矩形を中心とした探索領域内に、大きな矩形がないという条件である。
【0069】
以上の条件3,4,5を満たした場合、既述した図2のS13のYESとなり、当該文字矩形を文字候補として抽出することが可能となる。
【0070】
図7の(b)は、探索領域の決定例を示す。図示のテキスト領域内の例えばほぼ中央の文字”か”の矩形に注目し、当該矩形の幅W,高Hとし、当該矩形を中心にして探索領域を図示のように設け、図7の(a)の条件3,4,5を適用し、ここでは、文字矩形候補として抽出する。
【0071】
図8は、本発明の説明図(クラスタリングと最終探索領域の抽出例)を示す。図8において、▲1▼の文字矩形は、既述した図2のS14で文字候補として抽出された矩形を示す。
【0072】
▲2▼のクラスタリング結果のクラスタは、文字矩形をクラスタリング、即ち、文字矩形に最も距離の近い他の文字矩形同士をまとめることを繰り返し行い、文字矩形の数を減らすことで求められた。文字矩形間の距離は、本実施例の場合、各矩形の左上の座標同士の距離とした。図8では3個に減らした、クラスタとしてまとめた文字矩形を示す。
【0073】
▲3▼の×は、クラスタ重心である。本実施例では、クラスタ重心は、クラスタを構成する文字矩形の左上の座標値の平均値から求められる。
▲4▼の探索領域は、クラスタ重心に最も近い矩形□(中が黒)を中心に求めた探索領域を示す。
【0074】
以上のようにして算出した▲4▼の探索領域について、既述した図3のS41からS48の処理により、文字方向を迅速かつ処理量を少なくして決定し、当該決定した文字方向でテキスト領域内の文字認識を行うことが可能となる。
【0075】
【発明の効果】
以上説明したように、本発明によれば、画像中からテキスト領域を抽出し、当該テキスト領域中の矩形のうちから条件3,4,5により文字矩形候補を抽出し、当該文字矩形候補をまとめて数を減らし、当該減らした後のまとめた矩形の重心に近い文字矩形候補を中心に所定サイズの探索領域を決定し、当該探索領域で文字方向を決め、当該決めた文字方向でテキスト領域の文字認識を行う構成を採用しているため、文書画像から文字方向を決定する際に、文書方向の推定精度を保ちながら処理量を削減して迅速、かつ文書画像全体から文書方向を推定することが可能となる。そして、推定した文字方向でテキスト領域の文字認識を行うことが可能となる。
【図面の簡単な説明】
【図1】本発明のシステム構成図である。
【図2】本発明の動作説明フローチャート(その1)である。
【図3】本発明の動作説明フローチャート(その2)である。
【図4】本発明の説明図(その1)である。
【図5】本発明の説明図(その2)である。
【図6】本発明の説明図(その3)である。
【図7】本発明の説明図(その4)である。
【図8】本発明の説明図(クラスタリングと最終探索領域の抽出例)である。
【符号の説明】
1:処理装置
11:入力手段
12:ラベリング手段
13:文字サイズ推定手段
14:レイアウト解析手段
15:探索領域抽出手段
16:文字認識手段
17:出力手段
2:OCR
3:画像データ
4:ファイル(認識結果)
Claims (6)
- 画像中の文書方向を推定する文書方向推定方法において、
画像をレイアウト解析してテキスト領域を抽出する第1のステップと、
前記抽出したテキスト領域内の矩形について距離が近い矩形をまとめることを、まとめた矩形が指定数あるいはまとめ処理が指定回数となるまで繰り返して矩形数を減らす第2のステップと、
前記まとめた矩形をもとに文書方向を決定する第3のステップと
を有する文書方向推定方法。 - 前記抽出したテキスト領域内の各矩形について、当該矩形サイズが所定サイズの範囲内、かつ当該矩形を中心にした所定探索領域内で白から黒あるいは黒から白あるいは両者の変化数を当該探索領域で除算した値が所定範囲内、かつ前記探索範囲内に大きな矩形がない当該矩形について前記距離が近いを矩形をまとめることを、まとめた矩形が指定数あるいはまとめ処理が指定回数となるまで繰り返すことを特徴とする請求項1記載の文書方向推定方法。
- 前記まとめた矩形の重心を算出して当該重心に最も近い矩形を選択して当該選択した矩形を中心に探索領域を決定することを特徴とする請求項1あるいは請求項2記載の文書方向推定方法。
- 前記まとめた矩形内の全矩形あるいは前記探索領域内の全矩形を4方向に回転させてそれぞれの文字認識を行い、最も確からしい文書方向を決定することを特徴とする請求項1から請求項3のいずれかに記載の文書方向推定方法。
- 前記画像をレイアウト解析して抽出した表領域内の、各セルについてレイアウト解析して抽出したテキスト領域について、前記第2のステップ以降を実行することを特徴とする請求項1から請求項4のいずれかに記載の文書方向推定方法。
- 画像中の文書方向を推定する文書方向推定プログラムにおいて
コンピュータに、
画像をレイアウト解析してテキスト領域を抽出する第1のステップと、
前記抽出したテキスト領域内の矩形について距離が近い矩形をまとめることを、まとめた矩形が指定数あるいはまとめ処理が指定回数となるまで繰り返して矩形数を減らす第2のステップと、
前記まとめた矩形をもとに文書方向を決定する第3のステップと
を実行させるための文書方向推定プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002202959A JP4194309B2 (ja) | 2002-07-11 | 2002-07-11 | 文書方向推定方法および文書方向推定プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002202959A JP4194309B2 (ja) | 2002-07-11 | 2002-07-11 | 文書方向推定方法および文書方向推定プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2004046528A true JP2004046528A (ja) | 2004-02-12 |
JP4194309B2 JP4194309B2 (ja) | 2008-12-10 |
Family
ID=31708998
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002202959A Expired - Fee Related JP4194309B2 (ja) | 2002-07-11 | 2002-07-11 | 文書方向推定方法および文書方向推定プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4194309B2 (ja) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009098777A (ja) * | 2007-10-15 | 2009-05-07 | Fuji Xerox Co Ltd | データ処理装置及びデータ処理プログラム |
JP5950317B1 (ja) * | 2016-02-25 | 2016-07-13 | 有限会社Ics Sakabe | コード認識システム、コード認識方法、コード認識プログラム、及び荷物仕分システム |
JP2019128839A (ja) * | 2018-01-25 | 2019-08-01 | 富士ゼロックス株式会社 | 画像処理装置及びプログラム |
CN112560599A (zh) * | 2020-12-02 | 2021-03-26 | 上海眼控科技股份有限公司 | 文本识别方法、装置、计算机设备和存储介质 |
CN113869314A (zh) * | 2021-10-13 | 2021-12-31 | 广东金赋科技股份有限公司 | 一种文本方向聚类矫正的图像信息提取方法及系统 |
-
2002
- 2002-07-11 JP JP2002202959A patent/JP4194309B2/ja not_active Expired - Fee Related
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2009098777A (ja) * | 2007-10-15 | 2009-05-07 | Fuji Xerox Co Ltd | データ処理装置及びデータ処理プログラム |
JP5950317B1 (ja) * | 2016-02-25 | 2016-07-13 | 有限会社Ics Sakabe | コード認識システム、コード認識方法、コード認識プログラム、及び荷物仕分システム |
JP2019128839A (ja) * | 2018-01-25 | 2019-08-01 | 富士ゼロックス株式会社 | 画像処理装置及びプログラム |
JP7234495B2 (ja) | 2018-01-25 | 2023-03-08 | 富士フイルムビジネスイノベーション株式会社 | 画像処理装置及びプログラム |
CN112560599A (zh) * | 2020-12-02 | 2021-03-26 | 上海眼控科技股份有限公司 | 文本识别方法、装置、计算机设备和存储介质 |
CN113869314A (zh) * | 2021-10-13 | 2021-12-31 | 广东金赋科技股份有限公司 | 一种文本方向聚类矫正的图像信息提取方法及系统 |
CN113869314B (zh) * | 2021-10-13 | 2024-07-16 | 广东金赋科技股份有限公司 | 一种文本方向聚类矫正的图像信息提取方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
JP4194309B2 (ja) | 2008-12-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6731788B1 (en) | Symbol Classification with shape features applied to neural network | |
US6614930B1 (en) | Video stream classifiable symbol isolation method and system | |
US6970601B1 (en) | Form search apparatus and method | |
Xi et al. | A video text detection and recognition system | |
CN110050277A (zh) | 用于将手写文本转换成数字墨水的方法和系统 | |
CN114529925B (zh) | 一种全线表表格结构识别方法 | |
Arai et al. | Method for automatic e-comic scene frame extraction for reading comic on mobile devices | |
EP1017011A2 (en) | Block selection of table features | |
Yadav et al. | Text extraction in document images: highlight on using corner points | |
CN112560849A (zh) | 基于神经网络算法的文理分割方法及系统 | |
JPH0256708B2 (ja) | ||
JP3728224B2 (ja) | 文書処理装置及び方法 | |
JP2001043313A (ja) | 文字切出し方法 | |
Lue et al. | A novel character segmentation method for text images captured by cameras | |
JP2004046528A (ja) | 文書方向推定方法および文書方向推定プログラム | |
Chang et al. | Caption analysis and recognition for building video indexing systems | |
KR100449486B1 (ko) | 수직선 인접 그래프를 이용한 문서 인식 시스템 및 방법 | |
JP3544324B2 (ja) | 文字列情報抽出装置及び方法及びその方法を記録した記録媒体 | |
Zhang et al. | Extraction of karyocytes and their components from microscopic bone marrow images based on regional color features | |
Qiu et al. | A Post-processing method for text detection based on geometric features | |
CN107545261A (zh) | 文本检测的方法及装置 | |
JP2003208568A (ja) | 画像処理装置、画像処理方法、及び同方法に用いるプログラム | |
JP3661774B2 (ja) | 文字列認識方法、文字認識装置およびプログラム | |
JP3187894B2 (ja) | 文書画像傾き検出方法 | |
JPH08305804A (ja) | 文字認識用辞書作成装置及び文字認識装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20050315 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20080624 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20080821 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20080916 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20080922 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4194309 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111003 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111003 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121003 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121003 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131003 Year of fee payment: 5 |
|
LAPS | Cancellation because of no payment of annual fees |