JPH04142685A - 行認識方式 - Google Patents
行認識方式Info
- Publication number
- JPH04142685A JPH04142685A JP2266057A JP26605790A JPH04142685A JP H04142685 A JPH04142685 A JP H04142685A JP 2266057 A JP2266057 A JP 2266057A JP 26605790 A JP26605790 A JP 26605790A JP H04142685 A JPH04142685 A JP H04142685A
- Authority
- JP
- Japan
- Prior art keywords
- line
- distance
- recognition
- data
- document
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 claims description 20
- 238000004364 calculation method Methods 0.000 description 8
- 238000010586 diagram Methods 0.000 description 7
- 230000001186 cumulative effect Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 241000277331 Salmonidae Species 0.000 description 1
- 241000282887 Suidae Species 0.000 description 1
- 238000009825 accumulation Methods 0.000 description 1
- 230000007423 decrease Effects 0.000 description 1
- 238000001514 detection method Methods 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
〔産業上の利用分野〕
本発明は、文字認識装置における行認識方式に関する。
文字認識の前処理として、イメージスキャナによって読
み取られた文書画像から文字を切り出す処理が行われる
が、通常この処理においては文字行が利用されている。
み取られた文書画像から文字を切り出す処理が行われる
が、通常この処理においては文字行が利用されている。
従来の行認識のアルゴリズムとしては、横書き文書を例
に採ると、次のような二つの方式がある。
に採ると、次のような二つの方式がある。
すなわち、その一つの方式は、文書イメージデータを横
方向のビットライン毎に黒ビットの累積を求め、累積数
の分布によって行を認識する方式であり(画像電子学会
誌、第15巻、第2号、1986年、108〜109頁
)、他の一つの方式は、矩形データ(矩形データは文字
の一部であり、複数の矩形によって一文字が形成される
)の矩形間の距離がある閾値以下の場合、同一の行であ
ると判断することによって行を認識する方式である(
t 子連(i学会論文誌、’86/8Vol、J69−
DNo、8.1190〜1193頁)。
方向のビットライン毎に黒ビットの累積を求め、累積数
の分布によって行を認識する方式であり(画像電子学会
誌、第15巻、第2号、1986年、108〜109頁
)、他の一つの方式は、矩形データ(矩形データは文字
の一部であり、複数の矩形によって一文字が形成される
)の矩形間の距離がある閾値以下の場合、同一の行であ
ると判断することによって行を認識する方式である(
t 子連(i学会論文誌、’86/8Vol、J69−
DNo、8.1190〜1193頁)。
前者の方式では、入力時の文書が傾いている場合、累積
数の分布波形が不明瞭になるため、認識の精度が悪化す
るという問題があり、これを改善するために、縦方向に
分割して分割領域毎に処理するようにしているが、処理
が複雑になるという新たな問題を生じた。
数の分布波形が不明瞭になるため、認識の精度が悪化す
るという問題があり、これを改善するために、縦方向に
分割して分割領域毎に処理するようにしているが、処理
が複雑になるという新たな問題を生じた。
また、後者の方式では、隣接する矩形データの検索処理
が必要であるため、矩形データが多くなるにつれ処理速
度が大幅に低下するという問題があった。
が必要であるため、矩形データが多くなるにつれ処理速
度が大幅に低下するという問題があった。
本発明の目的は、入力時に文書が傾いていても高精度で
行を認識することができる行認識方式を提供することに
ある。
行を認識することができる行認識方式を提供することに
ある。
前記目的を達成するために、印刷文書の画像データを黒
連結処理することによって生成される矩形データから文
書の行を認識する方式において、文書の縦方向にソート
された矩形データを順次読み込み、該読み込まれた行矩
形データ群から回帰直線を算出し、該回帰直線と次に読
みだされた矩形データとの距離を算出し、該距離が所定
の閾値を越えている場合、次に読みだされた矩形データ
を次行として認識することを特徴としている。
連結処理することによって生成される矩形データから文
書の行を認識する方式において、文書の縦方向にソート
された矩形データを順次読み込み、該読み込まれた行矩
形データ群から回帰直線を算出し、該回帰直線と次に読
みだされた矩形データとの距離を算出し、該距離が所定
の閾値を越えている場合、次に読みだされた矩形データ
を次行として認識することを特徴としている。
[作 用]
請求項(1)記載の行認識方式によれば、矩形ブタを用
いて行を認識しているので、データ処理量が削減され、
行認識処理が高速化されると共に、入力文書の傾きが行
認識の精度に何ら影響しない。
いて行を認識しているので、データ処理量が削減され、
行認識処理が高速化されると共に、入力文書の傾きが行
認識の精度に何ら影響しない。
[実施例]
以下、本発明の一実施例を図面を用いて具体的に説明す
る。
る。
第1図は、本発明の行認識の処理手順を示すフローチャ
ート、第2図は、本発明の機能ブロック図で、21は各
部を制御する制御部、22は矩形データが記憶されてい
る矩形メモリ、23は矩形データから回帰直線を算出す
る算出部、24は回帰直線と対象矩形データとの距離を
算出する距離算出部、25は該距離と行間認識閾値とを
比較する第1の比較部、26は次行候補矩形データの個
数をカウントするカウンタ、27は該カウンタの値と次
行候補閾値とを比較する第2の比較部である。
ート、第2図は、本発明の機能ブロック図で、21は各
部を制御する制御部、22は矩形データが記憶されてい
る矩形メモリ、23は矩形データから回帰直線を算出す
る算出部、24は回帰直線と対象矩形データとの距離を
算出する距離算出部、25は該距離と行間認識閾値とを
比較する第1の比較部、26は次行候補矩形データの個
数をカウントするカウンタ、27は該カウンタの値と次
行候補閾値とを比較する第2の比較部である。
以下、本発明の行認識処理を第1図および第2図を参照
しつつ詳細に説明する。
しつつ詳細に説明する。
矩形データの読み込み(ステップ1);矩形データは従
来からよく知られているが、簡単に説明する。第6図に
ランの例を、第7図に矩形の例をそれぞれ示す。第6図
に示すように、画像を1ライン毎にラスクスキャンし、
黒連結(ラン)を探し、その始点と終点の座標を求める
。そのラインの始点と終点の座標と、前ラインの始点と
終点の座標とを比較し、接していれば前ラインのランが
含まれる矩形に現在のランを統合する。
来からよく知られているが、簡単に説明する。第6図に
ランの例を、第7図に矩形の例をそれぞれ示す。第6図
に示すように、画像を1ライン毎にラスクスキャンし、
黒連結(ラン)を探し、その始点と終点の座標を求める
。そのラインの始点と終点の座標と、前ラインの始点と
終点の座標とを比較し、接していれば前ラインのランが
含まれる矩形に現在のランを統合する。
具体的には座標を比較し、矩形の座標のデータを更新す
る。前ラインのとのランにも接していなければ新しい矩
形として矩形データに登録する。このような処理を全画
像について行い、ランに抽出と矩形の統合を行い矩形デ
ータを生成する。
る。前ラインのとのランにも接していなければ新しい矩
形として矩形データに登録する。このような処理を全画
像について行い、ランに抽出と矩形の統合を行い矩形デ
ータを生成する。
まず、第3図に示すように、入力文書31の左上の位l
を座標0として、その縦方向をy軸、横方向をX軸とし
た座標系において、入力文書をX軸方向にラスクスキャ
ンして文書を読み取り、上述したようにして矩形データ
41を生成して、第4図の如く矩形メモリ22上に展開
する。そして、制御部2】は、後述する次行候補矩形デ
ータ群がなければ、矩形データを矩形メモリ22から読
み込み、対象矩形データとする(xi、yi)。ただし
、矩形データは文書、の縦方向yでソートされ、xiは
矩形の右下端のX座標、yiは矩形の右下端のX座標で
ある。また、iは読み込む順番である。
を座標0として、その縦方向をy軸、横方向をX軸とし
た座標系において、入力文書をX軸方向にラスクスキャ
ンして文書を読み取り、上述したようにして矩形データ
41を生成して、第4図の如く矩形メモリ22上に展開
する。そして、制御部2】は、後述する次行候補矩形デ
ータ群がなければ、矩形データを矩形メモリ22から読
み込み、対象矩形データとする(xi、yi)。ただし
、矩形データは文書、の縦方向yでソートされ、xiは
矩形の右下端のX座標、yiは矩形の右下端のX座標で
ある。また、iは読み込む順番である。
矩形データの終了の判定(ステップ2);読み込む矩形
データがあるか否かを判定し、ない場合は処理を終了し
、ある場合は次のステップに進む。
データがあるか否かを判定し、ない場合は処理を終了し
、ある場合は次のステップに進む。
行矩形データ群の回帰直線の計算(ステップ3);回帰
直線算出部23は、読み込まれた第1番目の対象矩形デ
ータ(xl、yl)と第2番目の対象矩形データ(x2
.y2)から回帰直線を算出する。
直線算出部23は、読み込まれた第1番目の対象矩形デ
ータ(xl、yl)と第2番目の対象矩形データ(x2
.y2)から回帰直線を算出する。
距離の算出と行識別(ステップ4〜7);次いで、距離
算出部24は前記回帰直線と第3の対象矩形データとの
距離を算出しくステップ4)、その距離と行間認識閾値
Th1(例えば平均行間ドツト数の1/2とする)とを
第1の比較部25によって比較する(ステップ5)。そ
の距離が行間認識閾値Thlを越えない場合は、第5図
に示すように行矩形データ群51に追加する(ステップ
6)。
算出部24は前記回帰直線と第3の対象矩形データとの
距離を算出しくステップ4)、その距離と行間認識閾値
Th1(例えば平均行間ドツト数の1/2とする)とを
第1の比較部25によって比較する(ステップ5)。そ
の距離が行間認識閾値Thlを越えない場合は、第5図
に示すように行矩形データ群51に追加する(ステップ
6)。
一方、その距離が行間認識閾値Thlを越えた場合は(
第5図の第6番目の対象矩形データ)、第5図に示すよ
うに該対象矩形データを次行候補矩形データ群52に追
加する(ステップ7)。
第5図の第6番目の対象矩形データ)、第5図に示すよ
うに該対象矩形データを次行候補矩形データ群52に追
加する(ステップ7)。
対象行終了検出(ステップ8.9);
カウンタ26は、次行候補矩形データ群の矩形データの
個数をカウントし、第2の比較部27は該カウント値と
次行候補閾値Th2 (1行の文字数によって決まるが
、約10)とを比較する(ステップ8)。該カウント値
が次行候補閾値Th2を越えた場合、制御部21は行矩
形データ群51を一行の矩形データとして出力し、該カ
ウンタ26をゼロにクリアする(ステップ9)。
個数をカウントし、第2の比較部27は該カウント値と
次行候補閾値Th2 (1行の文字数によって決まるが
、約10)とを比較する(ステップ8)。該カウント値
が次行候補閾値Th2を越えた場合、制御部21は行矩
形データ群51を一行の矩形データとして出力し、該カ
ウンタ26をゼロにクリアする(ステップ9)。
そして、次行(第5図の例では次行候補)に処理を移し
て、前述したと同様にして行を認識する。
て、前述したと同様にして行を認識する。
以上、説明したように、本発明によれば、文書が入力時
に傾いていても、行認識の精度が保証されると共に、従
来のものに比べて処理方式が単純化されているので、処
理速度が速くなる。
に傾いていても、行認識の精度が保証されると共に、従
来のものに比べて処理方式が単純化されているので、処
理速度が速くなる。
第1図は本発明の行認識の処理手順を示すフローチャー
ト、第2図は本発明の機能ブロック図、第3図は読み取
り対象となる入力文書を示す図、第4図はメモリ上に展
開された矩形データを示す図、第5図は行認識を説明す
るための図、第6図はランの例を示す図、第7図は矩形
の例を示す図である。 21・・・制御部、 22・・・矩形メモリ、23・
・・回帰直線算出部、 24・・・距離算出部、25
・・・第1の比較部、 26・・・カウンタ、27・
・・第2の比較部。 第 図 鱒 第3図 第4 図 第6図 第7図
ト、第2図は本発明の機能ブロック図、第3図は読み取
り対象となる入力文書を示す図、第4図はメモリ上に展
開された矩形データを示す図、第5図は行認識を説明す
るための図、第6図はランの例を示す図、第7図は矩形
の例を示す図である。 21・・・制御部、 22・・・矩形メモリ、23・
・・回帰直線算出部、 24・・・距離算出部、25
・・・第1の比較部、 26・・・カウンタ、27・
・・第2の比較部。 第 図 鱒 第3図 第4 図 第6図 第7図
Claims (1)
- (1)印刷文書の画像データを黒連結処理することによ
って生成される矩形データから文書の行を認識する方式
において、文書の縦方向にソートされた矩形データを順
次読み込み、該読み込まれた行矩形データ群から回帰直
線を算出し、該回帰直線と次に読みだされた矩形データ
との距離を算出し、該距離が所定の閾値を越えている場
合、次に読みだされた矩形データを次行として認識する
ことを特徴とする行認識方式。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2266057A JPH04142685A (ja) | 1990-10-03 | 1990-10-03 | 行認識方式 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2266057A JPH04142685A (ja) | 1990-10-03 | 1990-10-03 | 行認識方式 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH04142685A true JPH04142685A (ja) | 1992-05-15 |
Family
ID=17425783
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2266057A Pending JPH04142685A (ja) | 1990-10-03 | 1990-10-03 | 行認識方式 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH04142685A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5581633A (en) * | 1993-06-11 | 1996-12-03 | Fujitsu Limited | Method and apparatus for segmenting a character and for extracting a character string based on a histogram |
WO2006080568A1 (ja) * | 2005-01-31 | 2006-08-03 | Nec Corporation | 文字読取り装置、文字読取り方法及び該文字読取り装置に用いられる文字読取り制御プログラム |
-
1990
- 1990-10-03 JP JP2266057A patent/JPH04142685A/ja active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5581633A (en) * | 1993-06-11 | 1996-12-03 | Fujitsu Limited | Method and apparatus for segmenting a character and for extracting a character string based on a histogram |
WO2006080568A1 (ja) * | 2005-01-31 | 2006-08-03 | Nec Corporation | 文字読取り装置、文字読取り方法及び該文字読取り装置に用いられる文字読取り制御プログラム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP2940936B2 (ja) | 表領域識別方法 | |
JP5508359B2 (ja) | 文字認識装置、文字認識方法及びプログラム | |
KR100322982B1 (ko) | 얼굴화상처리장치 | |
JP2018055255A (ja) | 情報処理装置、情報処理方法及びプログラム | |
JP4128837B2 (ja) | 路面走行レーン検出装置 | |
JP4011646B2 (ja) | 行検出方法および文字認識装置 | |
Kim et al. | Word segmentation of printed text lines based on gap clustering and special symbol detection | |
JPH02306386A (ja) | 文字認識装置 | |
JPH1173475A (ja) | 行方向判定装置、画像傾き検出装置及び画像傾き補正装置 | |
JPH04142685A (ja) | 行認識方式 | |
JP3090342B2 (ja) | 文字列方向判別装置 | |
CN113343866A (zh) | 表格信息的识别方法及装置、电子设备 | |
JPH0452974A (ja) | 指紋紋様分類装置 | |
JPH09179982A (ja) | 特定パターン検出方法 | |
JPH0696275A (ja) | 画像処理装置 | |
JP2812391B2 (ja) | パターン処理方法 | |
JPH04142686A (ja) | 行認識方式 | |
Fadeel | An efficient segmentation algorithm for Arabic handwritten characters recognition system | |
JP2925303B2 (ja) | 画像処理方法及び装置 | |
JP3000480B2 (ja) | 文字領域区切り検出方法 | |
JPH06139338A (ja) | 指紋紋様分類装置 | |
JPH0830725A (ja) | 画像処理装置及び方法 | |
JP2982221B2 (ja) | 文字読み取り装置 | |
CN114943973A (zh) | 一种文本校正方法、装置、计算机设备及存储介质 | |
JP2976856B2 (ja) | 手書き文字入力装置及び文字の切り出し方法 |