JPH0713994A - 文字認識装置 - Google Patents
文字認識装置Info
- Publication number
- JPH0713994A JPH0713994A JP5030995A JP3099593A JPH0713994A JP H0713994 A JPH0713994 A JP H0713994A JP 5030995 A JP5030995 A JP 5030995A JP 3099593 A JP3099593 A JP 3099593A JP H0713994 A JPH0713994 A JP H0713994A
- Authority
- JP
- Japan
- Prior art keywords
- line
- lines
- character recognition
- characters
- image data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Character Input (AREA)
Abstract
(57)【要約】
【目的】 従来は文字画像データの外接矩形の並びを基
にして行切り出しを行ない、その後、切り出された行間
の重なりチェックを行なっていないため、複数の行間に
またがる文字を含む文字画像データを正確に行切り出し
することができなかったので、これを解決する。 【構成】 認識対象文書を読み取る画像読み取り部1
と、認識対象文書の画像データから行単位の画像データ
を切り出す行切り出し部2と、複数行間にまたがる文字
の有無を検出する同行見出し検出部3と、複数行間にま
たがる文字を持つ行が正しく認識されるように切り出し
直す同行見出し処理部4と、切り出された結果を基にし
て文字認識を行なう文字認識部5とを備えている。 【効果】 複数行間にまたがる大きな文字を含む文字画
像データであっても、正しく行切り出しすることがで
き、認識率の向上を図ることができる。
にして行切り出しを行ない、その後、切り出された行間
の重なりチェックを行なっていないため、複数の行間に
またがる文字を含む文字画像データを正確に行切り出し
することができなかったので、これを解決する。 【構成】 認識対象文書を読み取る画像読み取り部1
と、認識対象文書の画像データから行単位の画像データ
を切り出す行切り出し部2と、複数行間にまたがる文字
の有無を検出する同行見出し検出部3と、複数行間にま
たがる文字を持つ行が正しく認識されるように切り出し
直す同行見出し処理部4と、切り出された結果を基にし
て文字認識を行なう文字認識部5とを備えている。 【効果】 複数行間にまたがる大きな文字を含む文字画
像データであっても、正しく行切り出しすることがで
き、認識率の向上を図ることができる。
Description
【0001】
【産業上の利用分野】本発明は、文書に書かれた文字を
認識するための文字認識装置に関する。
認識するための文字認識装置に関する。
【0002】
【従来の技術】従来、この種の文字認識装置では、新
聞、雑誌、小説などの活字、ドット文字および手書き文
字パターン等をスキャナなどの画像読み取り装置から画
像データとして読み込み、1文字ずつJISコード等の
コード情報に変換して出力していた。
聞、雑誌、小説などの活字、ドット文字および手書き文
字パターン等をスキャナなどの画像読み取り装置から画
像データとして読み込み、1文字ずつJISコード等の
コード情報に変換して出力していた。
【0003】
【発明が解決しようとする課題】しかしながら、従来の
文字認識装置では、文字画像データの外接矩形の並びを
基にして行切り出しを行ない、その後、切り出された行
間の重なりチェックを行なっていないため、複数の行間
にまたがる文字を含む文字画像データを正確に行切り出
しすることができなかった。
文字認識装置では、文字画像データの外接矩形の並びを
基にして行切り出しを行ない、その後、切り出された行
間の重なりチェックを行なっていないため、複数の行間
にまたがる文字を含む文字画像データを正確に行切り出
しすることができなかった。
【0004】例えば、認識対象文書の原文が、図10に
示すように、文頭に2行にまたがる文字がある場合、こ
れを行切り出しすると、図11のように、1行目の「か
し、むかし」と、文頭の「む」を含む2行目とに切り出
されてしまうため、文字認識の結果は、図12のよう
に、「かし、むかし」と「むあるところに」とに分離さ
れてしまい、正しい認識結果が得られなかった。
示すように、文頭に2行にまたがる文字がある場合、こ
れを行切り出しすると、図11のように、1行目の「か
し、むかし」と、文頭の「む」を含む2行目とに切り出
されてしまうため、文字認識の結果は、図12のよう
に、「かし、むかし」と「むあるところに」とに分離さ
れてしまい、正しい認識結果が得られなかった。
【0005】本発明は、このような従来の問題を解決す
るものであり、複数行にまたがる文字があっても、それ
を正しく認識することのできる文字認識装置を提供する
ことを目的とする。
るものであり、複数行にまたがる文字があっても、それ
を正しく認識することのできる文字認識装置を提供する
ことを目的とする。
【0006】
【課題を解決するための手段】本発明は、上記目的を達
成するために、認識対象文書を読み取る画像読み取り部
と、認識対象文書の画像データから行単位の画像データ
を切り出す行切り出し部と、複数行間にまたがる文字の
有無を検出する同行見出し検出部と、複数行間にまたが
る文字を持つ行が正しく認識されるように切り出し直す
同行見出し処理部と、切り出された結果を基にして文字
認識を行なう文字認識部とを備えたものである。
成するために、認識対象文書を読み取る画像読み取り部
と、認識対象文書の画像データから行単位の画像データ
を切り出す行切り出し部と、複数行間にまたがる文字の
有無を検出する同行見出し検出部と、複数行間にまたが
る文字を持つ行が正しく認識されるように切り出し直す
同行見出し処理部と、切り出された結果を基にして文字
認識を行なう文字認識部とを備えたものである。
【0007】
【作用】本発明は、上記構成により、複数行間にまたが
る大きさの文字を有する文字画像データであっても、正
しく行切り出しすることができ、認識率の向上を図るこ
とができる。
る大きさの文字を有する文字画像データであっても、正
しく行切り出しすることができ、認識率の向上を図るこ
とができる。
【0008】
【実施例】以下、本発明の実施例について説明する。ま
ず語句の定義を行なう。複数行にまたがる大きさを持つ
文字を「同行見出し」と呼ぶことにする。図1は本発明
の一実施例における文字認識装置のブロック図である。
図1において、1は認識対象を光電変換する画像読み取
り部、2は認識対象文書の画像データから行単位の画像
データを切り出す行切り出し部、3は複数行間にまたが
る文字の有無を検出する同行見出し検出部、4は複数行
間にまたがる文字を持つ行が正しく認識されるように切
り出し直す同行見出し処理部、5は切り出された結果を
基にして文字認識を行なう文字認識部である。
ず語句の定義を行なう。複数行にまたがる大きさを持つ
文字を「同行見出し」と呼ぶことにする。図1は本発明
の一実施例における文字認識装置のブロック図である。
図1において、1は認識対象を光電変換する画像読み取
り部、2は認識対象文書の画像データから行単位の画像
データを切り出す行切り出し部、3は複数行間にまたが
る文字の有無を検出する同行見出し検出部、4は複数行
間にまたがる文字を持つ行が正しく認識されるように切
り出し直す同行見出し処理部、5は切り出された結果を
基にして文字認識を行なう文字認識部である。
【0009】以上のように構成された本実施例の文字認
識装置について、以下その動作を図2のフローチャート
を参照しながら説明する。なお、原画像は、図3に示す
ように、2行にまたがる文字を有する横書き文書である
とする。
識装置について、以下その動作を図2のフローチャート
を参照しながら説明する。なお、原画像は、図3に示す
ように、2行にまたがる文字を有する横書き文書である
とする。
【0010】まずステップ11で、画像読み取り部1に
より認識対象文書を光電変換し、画像データを得る。次
いでステップ12で、行切り出し部2により原画像デー
タから行単位の画像データを切り出す。切り出された行
数をlineMax とする。
より認識対象文書を光電変換し、画像データを得る。次
いでステップ12で、行切り出し部2により原画像デー
タから行単位の画像データを切り出す。切り出された行
数をlineMax とする。
【0011】次にステップ13でdにline Maxを代入
し、sにd−1を代入する。これは、切り出された行を
下から2行ずつ順番に処理するので、最初の処理対象行
となる2行を設定するものである。sは上部に位置する
行(source)を表わし、dは下部に位置する行(destinati
on) を表わす。
し、sにd−1を代入する。これは、切り出された行を
下から2行ずつ順番に処理するので、最初の処理対象行
となる2行を設定するものである。sは上部に位置する
行(source)を表わし、dは下部に位置する行(destinati
on) を表わす。
【0012】次にステップ14でs行の上下端のy座標
を得、次いでステップ15でd行の上下端のy座標を得
る。
を得、次いでステップ15でd行の上下端のy座標を得
る。
【0013】次にステップ16で、同行見出し処理を行
なうかどうかを判定する。判定基準を以下に示す。 s行およびd行ともに高さが10ドット以上であ
る。 d行の上端がs行の下端から許容値を引いたものよ
り小さいか、またはs行の下端がd行の上端に許容値を
加えたものより大きい。 以上の2点を満足する場合は、同行見出し処理を行なう
ためにステップ17に移り、満足しない場合は、ステッ
プ22へ飛ぶ。
なうかどうかを判定する。判定基準を以下に示す。 s行およびd行ともに高さが10ドット以上であ
る。 d行の上端がs行の下端から許容値を引いたものよ
り小さいか、またはs行の下端がd行の上端に許容値を
加えたものより大きい。 以上の2点を満足する場合は、同行見出し処理を行なう
ためにステップ17に移り、満足しない場合は、ステッ
プ22へ飛ぶ。
【0014】次にステップ17で、図4に示すように、
s行およびd行中の文字画像の外接矩形の座標を求め、
次いでステップ18でs行、d行間の境界線を求める。
s行およびd行中の文字画像の外接矩形の座標を求め、
次いでステップ18でs行、d行間の境界線を求める。
【0015】以下、ステップ18におけるs行、d行間
の境界線を求める処理について説明する。 まず図5のように、s行、d行からx座標が重なっ
ている外接矩形を求める。 次に図6のように、で求めた外接矩形の高さが、
他方の外接矩形の高さの2倍を越えないものを求める。 次に図7のように、で求めた外接矩形が他の外接
矩形に接触していないものを求める。 次にで求めた外接矩形のみを境界線割り出しの候
補として認め、2行間で最も狭いと思われる間隔を求め
る。 そして図8のように、で求めた間隔の中央を境界
線とする。
の境界線を求める処理について説明する。 まず図5のように、s行、d行からx座標が重なっ
ている外接矩形を求める。 次に図6のように、で求めた外接矩形の高さが、
他方の外接矩形の高さの2倍を越えないものを求める。 次に図7のように、で求めた外接矩形が他の外接
矩形に接触していないものを求める。 次にで求めた外接矩形のみを境界線割り出しの候
補として認め、2行間で最も狭いと思われる間隔を求め
る。 そして図8のように、で求めた間隔の中央を境界
線とする。
【0016】以上のようにしてs行、d行間の境界線を
求めた後、図2のステップ19でs行、d行中の外接矩
形をマージして、1行分のデータとしてまとめる。
求めた後、図2のステップ19でs行、d行中の外接矩
形をマージして、1行分のデータとしてまとめる。
【0017】次にステップ20で、マージした外接矩形
データからノイズを取り除く。ノイズとみなされる条件
は以下に示すとおりである。 外接矩形の幅、高さともに5ドット以下である。 他の外接矩形と接触していない。 以上の2点を満足する外接矩形はノイズとみなし、除去
する。
データからノイズを取り除く。ノイズとみなされる条件
は以下に示すとおりである。 外接矩形の幅、高さともに5ドット以下である。 他の外接矩形と接触していない。 以上の2点を満足する外接矩形はノイズとみなし、除去
する。
【0018】次にステップ21で、外接矩形データを
x,y座標、境界線によりソートし、新しい行を構築す
る。その手順を以下に示す。 x1座標の小さい外接矩形から順番に並べる。 s行、d行にまたがる外接矩形を捜す。 その外接矩形が発見されたならば、その外接矩形の
直前までの外接矩形をy2座標の小さいものから順番に
並べる。 境界線に沿って上下に分割することにより細分化さ
れた2行を得る。 またがった外接矩形から順番に外接矩形データ群を
検索し、またがらない外接矩形を捜す。 その外接矩形が発見されたならば、その外接矩形の
直前までの外接矩形を1つの行とする。 以上の手順を繰り返す。但し、またがった外接矩形
が発見されないまますべての外接矩形データを探索し終
わったならば、未処理の外接矩形は境界線で上下に分割
し、新しい行を得る。
x,y座標、境界線によりソートし、新しい行を構築す
る。その手順を以下に示す。 x1座標の小さい外接矩形から順番に並べる。 s行、d行にまたがる外接矩形を捜す。 その外接矩形が発見されたならば、その外接矩形の
直前までの外接矩形をy2座標の小さいものから順番に
並べる。 境界線に沿って上下に分割することにより細分化さ
れた2行を得る。 またがった外接矩形から順番に外接矩形データ群を
検索し、またがらない外接矩形を捜す。 その外接矩形が発見されたならば、その外接矩形の
直前までの外接矩形を1つの行とする。 以上の手順を繰り返す。但し、またがった外接矩形
が発見されないまますべての外接矩形データを探索し終
わったならば、未処理の外接矩形は境界線で上下に分割
し、新しい行を得る。
【0019】次に、すべての行切り出しが終了するまで
以上の処理を繰り返し(ステップ22、23)、最終行
の切り出しが終了した時点で行切り出し結果を基にして
文字認識を行なう(ステップ24)。図9は上記例の行
切り出し結果である。
以上の処理を繰り返し(ステップ22、23)、最終行
の切り出しが終了した時点で行切り出し結果を基にして
文字認識を行なう(ステップ24)。図9は上記例の行
切り出し結果である。
【0020】
【発明の効果】本発明は、上記実施例から明らかなよう
に、認識対象文書を読み取る画像読み取り部と、認識対
象文書の画像データから行単位の画像データを切り出す
行切り出し部と、複数行間にまたがる文字の有無を検出
する同行見出し検出部と、複数行間にまたがる文字を持
つ行が正しく認識されるように切り出し直す同行見出し
処理部と、切り出された結果を基にして文字認識を行な
う文字認識部とを備えているので、複数行にまたがる大
きさを持つ文字を含む文字画像データを正確に行切り出
しすることができ、正しい文字認識結果を得て認識率の
向上を図ることができる。
に、認識対象文書を読み取る画像読み取り部と、認識対
象文書の画像データから行単位の画像データを切り出す
行切り出し部と、複数行間にまたがる文字の有無を検出
する同行見出し検出部と、複数行間にまたがる文字を持
つ行が正しく認識されるように切り出し直す同行見出し
処理部と、切り出された結果を基にして文字認識を行な
う文字認識部とを備えているので、複数行にまたがる大
きさを持つ文字を含む文字画像データを正確に行切り出
しすることができ、正しい文字認識結果を得て認識率の
向上を図ることができる。
【図1】本発明の一実施例における文字認識装置のブロ
ック図。
ック図。
【図2】本発明の一実施例におけるフローチャート。
【図3】本発明の一実施例における原画像図。
【図4】本発明の一実施例における外接矩形図。
【図5】本発明の一実施例における境界線判定の際の行
切り出し図。
切り出し図。
【図6】本発明の一実施例における境界線判定の際の行
切り出し図。
切り出し図。
【図7】本発明の一実施例における境界線判定の際の行
切り出し図。
切り出し図。
【図8】本発明の一実施例における境界線判定の際の行
切り出し図。
切り出し図。
【図9】本発明の一実施例における行切り出し結果図。
【図10】従来例における原画像図。
【図11】従来例における行切り出し結果図
【図12】従来例における文字認識結果図。
1 画像読み取り部 2 行切り出し部 3 同行見出し検出部 4 同行見出し処理部 5 文字認識部
Claims (2)
- 【請求項1】 認識対象文書を読み取る画像読み取り部
と、認識対象文書の画像データから行単位の画像データ
を切り出す行切り出し部と、複数行間にまたがる文字の
有無を検出する同行見出し検出部と、複数行間にまたが
る文字を持つ行が正しく認識されるように切り出し直す
同行見出し処理部と、切り出された結果を基にして文字
認識を行なう文字認識部とを備えた文字認識装置。 - 【請求項2】 切り出された隣接する2行間で文字が重
なっている場合、2行間で文字の重なっていない領域を
検出し、その領域の中心を2行の境界線と定めて境界線
に重ならない領域と境界線に重なる領域とに分割し、境
界線に重ならない領域は境界線を境にして2行分の行を
切り出し、境界線に重なる領域は1行分の行を切り出す
ことを特徴とする請求項1記載の文字認識装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP5030995A JPH0713994A (ja) | 1993-02-19 | 1993-02-19 | 文字認識装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP5030995A JPH0713994A (ja) | 1993-02-19 | 1993-02-19 | 文字認識装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JPH0713994A true JPH0713994A (ja) | 1995-01-17 |
Family
ID=12319190
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP5030995A Pending JPH0713994A (ja) | 1993-02-19 | 1993-02-19 | 文字認識装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JPH0713994A (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8213748B2 (en) | 2008-02-26 | 2012-07-03 | Fuji Xerox Co., Ltd. | Generating an electronic document with reference to allocated font corresponding to character identifier from an image |
US8411955B2 (en) | 2007-02-21 | 2013-04-02 | Fuji Xerox Co., Ltd. | Image processing apparatus, image processing method and computer-readable medium |
JP2020201864A (ja) * | 2019-06-13 | 2020-12-17 | キヤノン株式会社 | 行分割装置および方法、ならびにプログラム |
CN117079282A (zh) * | 2023-08-16 | 2023-11-17 | 读书郎教育科技有限公司 | 一种基于图像处理的智能词典笔 |
-
1993
- 1993-02-19 JP JP5030995A patent/JPH0713994A/ja active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8411955B2 (en) | 2007-02-21 | 2013-04-02 | Fuji Xerox Co., Ltd. | Image processing apparatus, image processing method and computer-readable medium |
US8213748B2 (en) | 2008-02-26 | 2012-07-03 | Fuji Xerox Co., Ltd. | Generating an electronic document with reference to allocated font corresponding to character identifier from an image |
JP2020201864A (ja) * | 2019-06-13 | 2020-12-17 | キヤノン株式会社 | 行分割装置および方法、ならびにプログラム |
CN117079282A (zh) * | 2023-08-16 | 2023-11-17 | 读书郎教育科技有限公司 | 一种基于图像处理的智能词典笔 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6226402B1 (en) | Ruled line extracting apparatus for extracting ruled line from normal document image and method thereof | |
US6970601B1 (en) | Form search apparatus and method | |
US4903312A (en) | Character recognition with variable subdivisions of a character region | |
JP2951814B2 (ja) | 画像抽出方式 | |
JPH05233873A (ja) | 領域分割方法 | |
JP3411472B2 (ja) | パターン抽出装置 | |
Lehal et al. | Text segmentation of machine-printed Gurmukhi script | |
JPH0713994A (ja) | 文字認識装置 | |
JPH08320914A (ja) | 表認識方法および装置 | |
JP4194309B2 (ja) | 文書方向推定方法および文書方向推定プログラム | |
JP3276555B2 (ja) | フォーマット認識装置及び文字読取り装置 | |
JPH07160810A (ja) | 文字認識装置 | |
JPH0652358A (ja) | 文字認識方法 | |
JP3517077B2 (ja) | パターン抽出装置及びパターン領域の切り出し方法 | |
JPH076202A (ja) | 文字認識装置 | |
JPH04260980A (ja) | 図形認識装置 | |
JP2571826B2 (ja) | 文字列パターン切り出し装置 | |
JP2917394B2 (ja) | 文字認識装置及び文字切り出し方法 | |
JPH0757047A (ja) | 文字切出し方式 | |
JPH1069522A (ja) | 文字認識装置及び文字認識方法並びに文字認識方法を記録した記録媒体 | |
JPH05282487A (ja) | 文字認識装置 | |
JPH05233877A (ja) | 単語読み取り方法 | |
JPH0728933A (ja) | 文字認識装置 | |
JPH04343192A (ja) | 文字認識装置の文字切り出し方法 | |
JPH05135204A (ja) | 文字認識装置 |