JPH04142685A

JPH04142685A - 行認識方式

Info

Publication number: JPH04142685A
Application number: JP2266057A
Authority: JP
Inventors: Masajirou Iwasaki; 雅二郎岩崎
Original assignee: Ricoh Co Ltd
Current assignee: Ricoh Co Ltd
Priority date: 1990-10-03
Filing date: 1990-10-03
Publication date: 1992-05-15

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】〔産業上の利用分野〕本発明は、文字認識装置における行認識方式に関する。

〔従来技術〕

文字認識の前処理として、イメージスキャナによって読
み取られた文書画像から文字を切り出す処理が行われる
が、通常この処理においては文字行が利用されている。

従来の行認識のアルゴリズムとしては、横書き文書を例
に採ると、次のような二つの方式がある。

すなわち、その一つの方式は、文書イメージデータを横
方向のビットライン毎に黒ビットの累積を求め、累積数
の分布によって行を認識する方式であり（画像電子学会
誌、第１５巻、第２号、１９８６年、１０８〜１０９頁
）、他の一つの方式は、矩形データ（矩形データは文字
の一部であり、複数の矩形によって一文字が形成される
）の矩形間の距離がある閾値以下の場合、同一の行であ
ると判断することによって行を認識する方式である（　
ｔ　子連（ｉ学会論文誌、’８６／８Ｖｏｌ、Ｊ６９−
ＤＮｏ、８．１１９０〜１１９３頁）。

〔発明が解決しようとする課題〕

前者の方式では、入力時の文書が傾いている場合、累積
数の分布波形が不明瞭になるため、認識の精度が悪化す
るという問題があり、これを改善するために、縦方向に
分割して分割領域毎に処理するようにしているが、処理
が複雑になるという新たな問題を生じた。

また、後者の方式では、隣接する矩形データの検索処理
が必要であるため、矩形データが多くなるにつれ処理速
度が大幅に低下するという問題があった。

本発明の目的は、入力時に文書が傾いていても高精度で
行を認識することができる行認識方式を提供することに
ある。

〔課題を解決するための手段〕

前記目的を達成するために、印刷文書の画像データを黒
連結処理することによって生成される矩形データから文
書の行を認識する方式において、文書の縦方向にソート
された矩形データを順次読み込み、該読み込まれた行矩
形データ群から回帰直線を算出し、該回帰直線と次に読
みだされた矩形データとの距離を算出し、該距離が所定
の閾値を越えている場合、次に読みだされた矩形データ
を次行として認識することを特徴としている。

［作　用］請求項（１）記載の行認識方式によれば、矩形ブタを用
いて行を認識しているので、データ処理量が削減され、
行認識処理が高速化されると共に、入力文書の傾きが行
認識の精度に何ら影響しない。

［実施例］以下、本発明の一実施例を図面を用いて具体的に説明す
る。

第１図は、本発明の行認識の処理手順を示すフローチャ
ート、第２図は、本発明の機能ブロック図で、２１は各
部を制御する制御部、２２は矩形データが記憶されてい
る矩形メモリ、２３は矩形データから回帰直線を算出す
る算出部、２４は回帰直線と対象矩形データとの距離を
算出する距離算出部、２５は該距離と行間認識閾値とを
比較する第１の比較部、２６は次行候補矩形データの個
数をカウントするカウンタ、２７は該カウンタの値と次
行候補閾値とを比較する第２の比較部である。

以下、本発明の行認識処理を第１図および第２図を参照
しつつ詳細に説明する。

矩形データの読み込み（ステップ１）；矩形データは従
来からよく知られているが、簡単に説明する。第６図に
ランの例を、第７図に矩形の例をそれぞれ示す。第６図
に示すように、画像を１ライン毎にラスクスキャンし、
黒連結（ラン）を探し、その始点と終点の座標を求める
。そのラインの始点と終点の座標と、前ラインの始点と
終点の座標とを比較し、接していれば前ラインのランが
含まれる矩形に現在のランを統合する。

具体的には座標を比較し、矩形の座標のデータを更新す
る。前ラインのとのランにも接していなければ新しい矩
形として矩形データに登録する。このような処理を全画
像について行い、ランに抽出と矩形の統合を行い矩形デ
ータを生成する。

まず、第３図に示すように、入力文書３１の左上の位ｌ
を座標０として、その縦方向をｙ軸、横方向をＸ軸とし
た座標系において、入力文書をＸ軸方向にラスクスキャ
ンして文書を読み取り、上述したようにして矩形データ
４１を生成して、第４図の如く矩形メモリ２２上に展開
する。そして、制御部２】は、後述する次行候補矩形デ
ータ群がなければ、矩形データを矩形メモリ２２から読
み込み、対象矩形データとする（ｘｉ、ｙｉ）。ただし
、矩形データは文書、の縦方向ｙでソートされ、ｘｉは
矩形の右下端のＸ座標、ｙｉは矩形の右下端のＸ座標で
ある。また、ｉは読み込む順番である。

矩形データの終了の判定（ステップ２）；読み込む矩形
データがあるか否かを判定し、ない場合は処理を終了し
、ある場合は次のステップに進む。

行矩形データ群の回帰直線の計算（ステップ３）；回帰
直線算出部２３は、読み込まれた第１番目の対象矩形デ
ータ（ｘｌ、ｙｌ）と第２番目の対象矩形データ（ｘ２
．ｙ２）から回帰直線を算出する。

距離の算出と行識別（ステップ４〜７）；次いで、距離
算出部２４は前記回帰直線と第３の対象矩形データとの
距離を算出しくステップ４）、その距離と行間認識閾値
Ｔｈ１（例えば平均行間ドツト数の１／２とする）とを
第１の比較部２５によって比較する（ステップ５）。そ
の距離が行間認識閾値Ｔｈｌを越えない場合は、第５図
に示すように行矩形データ群５１に追加する（ステップ
６）。

一方、その距離が行間認識閾値Ｔｈｌを越えた場合は（
第５図の第６番目の対象矩形データ）、第５図に示すよ
うに該対象矩形データを次行候補矩形データ群５２に追
加する（ステップ７）。

対象行終了検出（ステップ８．９）；カウンタ２６は、次行候補矩形データ群の矩形データの
個数をカウントし、第２の比較部２７は該カウント値と
次行候補閾値Ｔｈ２　（１行の文字数によって決まるが
、約１０）とを比較する（ステップ８）。該カウント値
が次行候補閾値Ｔｈ２を越えた場合、制御部２１は行矩
形データ群５１を一行の矩形データとして出力し、該カ
ウンタ２６をゼロにクリアする（ステップ９）。

そして、次行（第５図の例では次行候補）に処理を移し
て、前述したと同様にして行を認識する。

〔発明の効果〕

以上、説明したように、本発明によれば、文書が入力時
に傾いていても、行認識の精度が保証されると共に、従
来のものに比べて処理方式が単純化されているので、処
理速度が速くなる。

【図面の簡単な説明】

第１図は本発明の行認識の処理手順を示すフローチャー
ト、第２図は本発明の機能ブロック図、第３図は読み取
り対象となる入力文書を示す図、第４図はメモリ上に展
開された矩形データを示す図、第５図は行認識を説明す
るための図、第６図はランの例を示す図、第７図は矩形
の例を示す図である。２１・・・制御部、　　２２・・・矩形メモリ、２３・
・・回帰直線算出部、　　２４・・・距離算出部、２５
・・・第１の比較部、　　２６・・・カウンタ、２７・
・・第２の比較部。第図鱒第３図第４図第６図第７図

Claims

【特許請求の範囲】

（１）印刷文書の画像データを黒連結処理することによ
って生成される矩形データから文書の行を認識する方式
において、文書の縦方向にソートされた矩形データを順
次読み込み、該読み込まれた行矩形データ群から回帰直
線を算出し、該回帰直線と次に読みだされた矩形データ
との距離を算出し、該距離が所定の閾値を越えている場
合、次に読みだされた矩形データを次行として認識する
ことを特徴とする行認識方式。