JPH04142685A - 行認識方式 - Google Patents

行認識方式

Info

Publication number
JPH04142685A
JPH04142685A JP2266057A JP26605790A JPH04142685A JP H04142685 A JPH04142685 A JP H04142685A JP 2266057 A JP2266057 A JP 2266057A JP 26605790 A JP26605790 A JP 26605790A JP H04142685 A JPH04142685 A JP H04142685A
Authority
JP
Japan
Prior art keywords
line
distance
recognition
data
document
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2266057A
Other languages
English (en)
Inventor
Masajirou Iwasaki
雅二郎 岩崎
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2266057A priority Critical patent/JPH04142685A/ja
Publication of JPH04142685A publication Critical patent/JPH04142685A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔産業上の利用分野〕 本発明は、文字認識装置における行認識方式に関する。
〔従来技術〕
文字認識の前処理として、イメージスキャナによって読
み取られた文書画像から文字を切り出す処理が行われる
が、通常この処理においては文字行が利用されている。
従来の行認識のアルゴリズムとしては、横書き文書を例
に採ると、次のような二つの方式がある。
すなわち、その一つの方式は、文書イメージデータを横
方向のビットライン毎に黒ビットの累積を求め、累積数
の分布によって行を認識する方式であり(画像電子学会
誌、第15巻、第2号、1986年、108〜109頁
)、他の一つの方式は、矩形データ(矩形データは文字
の一部であり、複数の矩形によって一文字が形成される
)の矩形間の距離がある閾値以下の場合、同一の行であ
ると判断することによって行を認識する方式である( 
t 子連(i学会論文誌、’86/8Vol、J69−
DNo、8.1190〜1193頁)。
〔発明が解決しようとする課題〕
前者の方式では、入力時の文書が傾いている場合、累積
数の分布波形が不明瞭になるため、認識の精度が悪化す
るという問題があり、これを改善するために、縦方向に
分割して分割領域毎に処理するようにしているが、処理
が複雑になるという新たな問題を生じた。
また、後者の方式では、隣接する矩形データの検索処理
が必要であるため、矩形データが多くなるにつれ処理速
度が大幅に低下するという問題があった。
本発明の目的は、入力時に文書が傾いていても高精度で
行を認識することができる行認識方式を提供することに
ある。
〔課題を解決するための手段〕
前記目的を達成するために、印刷文書の画像データを黒
連結処理することによって生成される矩形データから文
書の行を認識する方式において、文書の縦方向にソート
された矩形データを順次読み込み、該読み込まれた行矩
形データ群から回帰直線を算出し、該回帰直線と次に読
みだされた矩形データとの距離を算出し、該距離が所定
の閾値を越えている場合、次に読みだされた矩形データ
を次行として認識することを特徴としている。
[作 用] 請求項(1)記載の行認識方式によれば、矩形ブタを用
いて行を認識しているので、データ処理量が削減され、
行認識処理が高速化されると共に、入力文書の傾きが行
認識の精度に何ら影響しない。
[実施例] 以下、本発明の一実施例を図面を用いて具体的に説明す
る。
第1図は、本発明の行認識の処理手順を示すフローチャ
ート、第2図は、本発明の機能ブロック図で、21は各
部を制御する制御部、22は矩形データが記憶されてい
る矩形メモリ、23は矩形データから回帰直線を算出す
る算出部、24は回帰直線と対象矩形データとの距離を
算出する距離算出部、25は該距離と行間認識閾値とを
比較する第1の比較部、26は次行候補矩形データの個
数をカウントするカウンタ、27は該カウンタの値と次
行候補閾値とを比較する第2の比較部である。
以下、本発明の行認識処理を第1図および第2図を参照
しつつ詳細に説明する。
矩形データの読み込み(ステップ1);矩形データは従
来からよく知られているが、簡単に説明する。第6図に
ランの例を、第7図に矩形の例をそれぞれ示す。第6図
に示すように、画像を1ライン毎にラスクスキャンし、
黒連結(ラン)を探し、その始点と終点の座標を求める
。そのラインの始点と終点の座標と、前ラインの始点と
終点の座標とを比較し、接していれば前ラインのランが
含まれる矩形に現在のランを統合する。
具体的には座標を比較し、矩形の座標のデータを更新す
る。前ラインのとのランにも接していなければ新しい矩
形として矩形データに登録する。このような処理を全画
像について行い、ランに抽出と矩形の統合を行い矩形デ
ータを生成する。
まず、第3図に示すように、入力文書31の左上の位l
を座標0として、その縦方向をy軸、横方向をX軸とし
た座標系において、入力文書をX軸方向にラスクスキャ
ンして文書を読み取り、上述したようにして矩形データ
41を生成して、第4図の如く矩形メモリ22上に展開
する。そして、制御部2】は、後述する次行候補矩形デ
ータ群がなければ、矩形データを矩形メモリ22から読
み込み、対象矩形データとする(xi、yi)。ただし
、矩形データは文書、の縦方向yでソートされ、xiは
矩形の右下端のX座標、yiは矩形の右下端のX座標で
ある。また、iは読み込む順番である。
矩形データの終了の判定(ステップ2);読み込む矩形
データがあるか否かを判定し、ない場合は処理を終了し
、ある場合は次のステップに進む。
行矩形データ群の回帰直線の計算(ステップ3);回帰
直線算出部23は、読み込まれた第1番目の対象矩形デ
ータ(xl、yl)と第2番目の対象矩形データ(x2
.y2)から回帰直線を算出する。
距離の算出と行識別(ステップ4〜7);次いで、距離
算出部24は前記回帰直線と第3の対象矩形データとの
距離を算出しくステップ4)、その距離と行間認識閾値
Th1(例えば平均行間ドツト数の1/2とする)とを
第1の比較部25によって比較する(ステップ5)。そ
の距離が行間認識閾値Thlを越えない場合は、第5図
に示すように行矩形データ群51に追加する(ステップ
6)。
一方、その距離が行間認識閾値Thlを越えた場合は(
第5図の第6番目の対象矩形データ)、第5図に示すよ
うに該対象矩形データを次行候補矩形データ群52に追
加する(ステップ7)。
対象行終了検出(ステップ8.9); カウンタ26は、次行候補矩形データ群の矩形データの
個数をカウントし、第2の比較部27は該カウント値と
次行候補閾値Th2 (1行の文字数によって決まるが
、約10)とを比較する(ステップ8)。該カウント値
が次行候補閾値Th2を越えた場合、制御部21は行矩
形データ群51を一行の矩形データとして出力し、該カ
ウンタ26をゼロにクリアする(ステップ9)。
そして、次行(第5図の例では次行候補)に処理を移し
て、前述したと同様にして行を認識する。
〔発明の効果〕
以上、説明したように、本発明によれば、文書が入力時
に傾いていても、行認識の精度が保証されると共に、従
来のものに比べて処理方式が単純化されているので、処
理速度が速くなる。
【図面の簡単な説明】
第1図は本発明の行認識の処理手順を示すフローチャー
ト、第2図は本発明の機能ブロック図、第3図は読み取
り対象となる入力文書を示す図、第4図はメモリ上に展
開された矩形データを示す図、第5図は行認識を説明す
るための図、第6図はランの例を示す図、第7図は矩形
の例を示す図である。 21・・・制御部、  22・・・矩形メモリ、23・
・・回帰直線算出部、  24・・・距離算出部、25
・・・第1の比較部、  26・・・カウンタ、27・
・・第2の比較部。 第 図 鱒 第3図 第4 図 第6図 第7図

Claims (1)

    【特許請求の範囲】
  1. (1)印刷文書の画像データを黒連結処理することによ
    って生成される矩形データから文書の行を認識する方式
    において、文書の縦方向にソートされた矩形データを順
    次読み込み、該読み込まれた行矩形データ群から回帰直
    線を算出し、該回帰直線と次に読みだされた矩形データ
    との距離を算出し、該距離が所定の閾値を越えている場
    合、次に読みだされた矩形データを次行として認識する
    ことを特徴とする行認識方式。
JP2266057A 1990-10-03 1990-10-03 行認識方式 Pending JPH04142685A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2266057A JPH04142685A (ja) 1990-10-03 1990-10-03 行認識方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2266057A JPH04142685A (ja) 1990-10-03 1990-10-03 行認識方式

Publications (1)

Publication Number Publication Date
JPH04142685A true JPH04142685A (ja) 1992-05-15

Family

ID=17425783

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2266057A Pending JPH04142685A (ja) 1990-10-03 1990-10-03 行認識方式

Country Status (1)

Country Link
JP (1) JPH04142685A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5581633A (en) * 1993-06-11 1996-12-03 Fujitsu Limited Method and apparatus for segmenting a character and for extracting a character string based on a histogram
WO2006080568A1 (ja) * 2005-01-31 2006-08-03 Nec Corporation 文字読取り装置、文字読取り方法及び該文字読取り装置に用いられる文字読取り制御プログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5581633A (en) * 1993-06-11 1996-12-03 Fujitsu Limited Method and apparatus for segmenting a character and for extracting a character string based on a histogram
WO2006080568A1 (ja) * 2005-01-31 2006-08-03 Nec Corporation 文字読取り装置、文字読取り方法及び該文字読取り装置に用いられる文字読取り制御プログラム

Similar Documents

Publication Publication Date Title
JP2940936B2 (ja) 表領域識別方法
JP5508359B2 (ja) 文字認識装置、文字認識方法及びプログラム
KR100322982B1 (ko) 얼굴화상처리장치
JP2018055255A (ja) 情報処理装置、情報処理方法及びプログラム
JP4128837B2 (ja) 路面走行レーン検出装置
JP4011646B2 (ja) 行検出方法および文字認識装置
Kim et al. Word segmentation of printed text lines based on gap clustering and special symbol detection
JPH02306386A (ja) 文字認識装置
JPH1173475A (ja) 行方向判定装置、画像傾き検出装置及び画像傾き補正装置
JPH04142685A (ja) 行認識方式
JP3090342B2 (ja) 文字列方向判別装置
CN113343866A (zh) 表格信息的识别方法及装置、电子设备
JPH0452974A (ja) 指紋紋様分類装置
JPH09179982A (ja) 特定パターン検出方法
JPH0696275A (ja) 画像処理装置
JP2812391B2 (ja) パターン処理方法
JPH04142686A (ja) 行認識方式
Fadeel An efficient segmentation algorithm for Arabic handwritten characters recognition system
JP2925303B2 (ja) 画像処理方法及び装置
JP3000480B2 (ja) 文字領域区切り検出方法
JPH06139338A (ja) 指紋紋様分類装置
JPH0830725A (ja) 画像処理装置及び方法
JP2982221B2 (ja) 文字読み取り装置
CN114943973A (zh) 一种文本校正方法、装置、计算机设备及存储介质
JP2976856B2 (ja) 手書き文字入力装置及び文字の切り出し方法