JP2002157550A - 文字認識装置、文字認識方法、および記録媒体 - Google Patents

文字認識装置、文字認識方法、および記録媒体

Info

Publication number
JP2002157550A
JP2002157550A JP2000351634A JP2000351634A JP2002157550A JP 2002157550 A JP2002157550 A JP 2002157550A JP 2000351634 A JP2000351634 A JP 2000351634A JP 2000351634 A JP2000351634 A JP 2000351634A JP 2002157550 A JP2002157550 A JP 2002157550A
Authority
JP
Japan
Prior art keywords
character
image
line
character recognition
recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2000351634A
Other languages
English (en)
Other versions
JP4204185B2 (ja
Inventor
Yoshihisa Oguro
慶久 大黒
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2000351634A priority Critical patent/JP4204185B2/ja
Publication of JP2002157550A publication Critical patent/JP2002157550A/ja
Application granted granted Critical
Publication of JP4204185B2 publication Critical patent/JP4204185B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】 【課題】 文字認識処理の前処理で画像データのノイズ
を高精度に除去することによって、文字認識の全体とし
ての精度を向上させる文字認識装置を提供する。 【解決手段】 文字画像から行を切り出す行切出し部4
0と、行切出し部40で切り出された行に関する情報を
基に画像の一部を取捨選択する基準値を設定し、この基
準値により切り出された行から画像の一部を選択してか
ら文字画像を切り出す文字切出し部50と、文字切出し
部50で切り出された文字画像に対し文字認識を行う文
字認識部60とを備えた。また、文字切出し部50は行
切出し部40で切り出された行に関する情報を基に画像
の一部を取捨選択する基準値を設定し、この基準値によ
り切り出された行から画像の一部を選択してから文字画
像を切り出す。文字認識部60は文字切出し部50で切
り出された文字画像に対し文字認識を行って、認識結果
の文字ごとに確信度を算出する。そして、文字認識部6
0で算出された確信度の低い行に対し、画像の一部を取
捨選択する基準値を変更して、再度、行切り出しを行っ
て文字認識するようにした。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、入力された画像デ
ータから文字画像を切り出し、文字認識する文字認識装
置、文字認識方法および記録媒体に関し、特に、文字認
識する際の文字行の切出しの仕方を改良した技術に関す
る。
【0002】
【従来の技術】近年、スキャナ等から計算機に取り込ん
だ文書画像データ中の文字画像を識別し、文字コードと
して出力する光学的文字読取(OCR)ソフトウェア
は、非常に広範囲に用いられている。これは、文字コー
ドとして電子データ化した情報は紙ベースのものや画像
データと比較して、再利用が容易であって、保管や交換
も効率的に行えるというメリットを持つためである。一
般に、画像中の文字を認識する場合は、印刷文字、手書
き文字等を光学的に走査し、読み取って量子化された画
像データを得る。次に、この画像データから画像上の文
字行と対応する文字行データを切り出す。次に、この文
字行データから文字パターンデータを切り出して、正規
化、雑音除去等を行った文字画像データを得る。次に、
この文字画像データから特徴を抽出し、この特徴に基づ
いて画像データをパターンマッチング等の手法により判
断して文字認識する。
【0003】このような文字認識処理中での画像データ
から文字行データを切り出す方法には、次のような二つ
の方法に大別される。 (A)黒画素を行方向に射影する方法 文字行方向を主走査方向、文字列方向を副走査方向とし
て、文書を走査し、主走査方向の黒画素を副走査方向に
射影した黒画素の分布を作成する。この黒画素の分布が
「0」から「1」以上に変化する位置から、「1」以上
から「0」に変化する直前の位置までの領域に対応する
画像データ部分が文字行データとして切り出される。 (B)黒画素の連結矩形を統合する方法 画像データの連結黒画素の外接矩形を設定し、近隣の矩
形同士は同一行に属すると判断し、その近隣の矩形を統
合していき、一つの行を作成する。また、文字の切り出
し方法には、切り出された行の画像を垂直射影すること
によって文字存在部分の矩形領域を切り出し、この矩形
領域を予め設定された標準文字サイズをもとに結合また
は分離することによって、個々の文字の矩形を生成する
方法がある(特開平6−325207号公報)。また、
特開平5−35913号公報の技術では、横書きの場
合、従来技術では横方向の分割しか行わなかった行切り
出し処理を、縦方向にも行い、複雑なレイアウトの行を
正しく切り出すようにしている。
【0004】
【発明が解決しようとする課題】しかしながら、特開平
5−35913号公報の方法では、原稿全般にわたって
のノイズ混入や、形の不定な、原稿汚れなど、縦横の直
線で分離できないものに対しては効果を発揮することが
できない。また、特開平6−325207号公報の方法
でも、原稿全般にわたってのノイズ混入や、形の不定、
原稿汚れ等は、短い仮文字行の範囲でも行に包含されて
しまうので、それらの連結によって行全体を正しく切り
出しはできない。本発明は、上記の問題点を解決するた
めに、文字認識処理の前処理において、画像データのノ
イズを高精度に除去することによって、文字認識の全体
としての精度を向上させる文字認識装置、文字認識方
法、および記録媒体を提案することを目的とする。
【0005】
【課題を解決するための手段】上記の問題を解決するた
めに、請求項1に記載の発明は、文字画像に対し文字認
識を行う文字認識装置において、前記文字画像から行を
切り出す行切出し部と、前記行切出し部で切り出された
行に関する情報を基に画像の一部を取捨選択する基準値
を設定し、この基準値により切り出された行から画像の
一部を選択してから文字画像を切り出す文字切出し部
と、前記文字切出し部で切り出された文字画像に対し文
字認識を行う文字認識部とを備えたことを特徴とする。
また、請求項2に記載の発明は、文字画像に対し文字認
識を行う文字認識装置において、前記文字画像から行を
切り出す行切出し部と、前記行切出し部で切り出された
行に関する情報を基に画像の一部を取捨選択する基準値
を設定し、この基準値により切り出された行から画像の
一部を選択してから文字画像を切り出す文字切出し部
と、前記文字切出し部で切り出された文字画像に対し文
字認識を行って、認識結果の文字ごとに確信度を算出す
る文字認識部とを備え、前記文字認識部で算出された確
信度の低い行に対し、画像の一部を取捨選択する基準値
を変更して、再度、行切り出しを行って文字認識するよ
うにしたことを特徴とする。また、請求項3に記載の発
明は、請求項1または請求項2に記載の文字認識装置に
おいて、前記文字認識部で文字認識された結果と、その
結果に対応する文字画像とを対比させて出力する結果出
力部とを備えたことを特徴とする。また、請求項4に記
載の発明は、文字画像に対し文字認識を行う文字認識方
法において、前記文字画像から行を切り出し、この切り
出された行に関する情報を基に画像の一部を取捨選択す
る基準値を設定し、この基準値により切り出された行か
ら画像の一部を選択してから文字画像を切り出して、そ
の文字画像に対し文字認識を行うようにしたことを特徴
とする。
【0006】また、請求項5に記載の発明は、文字画像
に対し文字認識を行う文字認識方法において、前記文字
画像から行を切り出し、この切り出された行に関する情
報を基に画像の一部を取捨選択する基準値を設定し、こ
の基準値により切り出された行から画像の一部を選択し
てから文字画像を切り出し、この切り出された文字画像
に対し文字認識を行って、認識結果の文字ごとに確信度
を算出し、算出された確信度の低い行に対し、画像の一
部を取捨選択する基準値を変更して、再度、行切り出し
を行うようにして文字認識することを特徴とする。ま
た、請求項6に記載の発明は、コンピュータを、文字画
像に対し文字認識を行う文字認識装置として機能させる
ためのプログラムを記録したコンピュータ読み取り可能
な記録媒体であって、前記文字画像から行を切り出す行
切出し部と、前記行切出し部で切り出された行に関する
情報を基に画像の一部を取捨選択する基準値を設定し、
この基準値により切り出された行から画像の一部を選択
してから文字画像を切り出す文字切出し部と、前記文字
切出し部で切り出された文字画像に対し文字認識を行う
文字認識部と、前記文字認識部で文字認識された結果
と、その結果に対応する文字画像とを対比させて出力す
る結果出力部とを備えた文字認識プログラムを記録した
ことを特徴とする。また、請求項7に記載の発明は、コ
ンピュータを、文字画像に対し文字認識を行う文字認識
装置として機能させるためのプログラムを記録したコン
ピュータ読み取り可能な記録媒体であって、前記文字画
像から行を切り出す行切出し部と、前記行切出し部で切
り出された行に関する情報を基に画像の一部を取捨選択
する基準値を設定し、この基準値により切り出された行
から画像の一部を選択してから文字画像を切り出す文字
切出し部と、前記文字切出し部で切り出された文字画像
に対し文字認識を行って、認識結果の文字ごとに確信度
を算出する文字認識部と、前記文字認識部で文字認識さ
れた結果と、その結果に対応する文字画像とを対比させ
て出力する結果出力部とを備え、前記文字認識部で算出
された確信度の低い行に対し、画像の一部を取捨選択す
る基準値を変更して、再度、行切り出しを行って文字認
識する文字認識プログラムを記録したことを特徴とす
る。
【0007】
【発明の実施の形態】以下に、図面を用いて本発明の実
施の形態の構成および動作を詳細に述べる。この実施の
形態を説明するために、図2に示すような原稿を用い
る。なお、この実施の形態では、日本語文の横書原稿を
例に用いるが、特にことわらない限り、本発明はここで
説明する実施の形態に限定されるものではなく、一旦、
行切り出し処理を確定し、文字サイズを推定した後、推
定した文字サイズを利用して有効画像を判断し、文字認
識処理を行うことによって、高精度に文字切り出し処理
を行うことを示すものであり特定の言語、文字画像種類
(手書き/活字文字など)、書式(縦書き/横書き)に限
定されるものではない。
【0008】<実施の形態> (1)実施の形態の構成 図1は、本発明の実施の形態の文字認識装置の構成を示
すブロック図である。この実施の形態の文字認識装置1
00は、制御部10、画像入力部20、矩形抽出部3
0、行切出し部40、文字切出し部50、文字認識部6
0、結果出力部70、原画像記憶部25、認識辞書6
5、認識結果記憶部75から構成されている。制御部1
0は、スキャナやファイルからの画像を読み取り、画像
情報から文字認識し、最終結果である認識結果を出力す
るまでの全体を制御する。画像入力部20は、スキャナ
やファイルからの画像(図2参照)を読み取り、その画
像データを原画像記憶部25へ格納する。矩形抽出部3
0は、原画像記憶部25に記憶された画像データの黒画
素の連結を探索し、それと外接する矩形を作成する(図
3参照)。行切出し部40は、矩形抽出部30で抽出さ
れた矩形から行を切り出す。図2や図4の原稿のよう
に、文字画像は、さまざまのサイズの黒画素から構成さ
れているが、行を切り出すとき、ノイズや罫線等、文字
画像を構成している黒画素とは思えない著しく大きい矩
形、あるいは著しく小さい矩形を予め設定している有効
矩形を判定する基準値(矩形サイズ、矩形の存在位置等
の矩形を特徴付ける複数の値から決定される)を用いて
無効と判定し、残りの有効と判断された近隣同士の矩形
を統合して行き、これを行として切り出す。図3や図5
は、文字矩形範囲を求めた後の結果であり、図中の矩形
が文字矩形候補となる。文字切出し部50は、切り出さ
れた行から文字を切り出し、その文字部分を囲む矩形の
対角座標値を抽出し、その文字部分の大きさを正規化
し、特徴量を計算する。まず、行切り出し部40で行を
切り出した後、文字行の高さが求まるので、そこから文
字サイズを推定し、その結果に基づいて、有効矩形を判
定する基準値を再設定し、全矩形の有効/無効判定を再
度行い、有効として残った矩形に対して文字切出しを行
う。一般的な原稿では、行ごとに文字サイズが統一され
ている場合がほとんどであるから、行ごとに文字サイズ
を設定し直せば効果的である。一般的な活字フォントの
場合、文字サイズは行の高さとほぼ等しいと考えて良
い。手書きの場合でも、文字サイズは行の高さとほぼ等
しいと考えて良い。このような性質がない特殊な場合に
は、予め、行の高さと文字サイズとの関係を調査してお
き、行の高さから文字サイズを推定する関係式を作成し
ておけばよい。
【0009】図5の行切り出し結果では、行の高さ a,
b, c の文字サイズの異る3行が切り出されており、文
字サイズが異ると同一文字であっても、その矩形サイズ
は著しく異っている。図6に、行の高さ b の行と、行
の高さ c の行に属する「プ」を取り出して示す。(説
明のため、画像は拡大しているが、両者の相対的な比率
は図4と等しい。) 今、図7に示すように、図6の画像データに対してノイ
ズが混入している場合を考えると、有効矩形を判定する
基準値が、文字サイズによらず固定値の場合には、 文字画像の一部(「プ」の半濁点)を削除してしまう(図
8) 本来ノイズとして削除したい矩形が残ってしまう(図9) ことがあり、このため、正しい文字認識結果を得られな
い原因となる。そこで、有効矩形を判定する基準値を固
定値ではなく、行の高さ(文字サイズはこの行の高さと
ほぼ同一と考える)に応じて有効矩形を判定する基準値
を設定すれば、矩形の有効/無効判定を精度よく行え
る。たとえば、 有効矩形最小サイズ(基準値)= 行の高さ /5 程度に設定しておけば、行の高さ b の場合、および 行
の高さ c の場合、いずれも問題なくノイズを除去でき
る。文字認識部60は、文字切出し部50で切り出した
文字画像の特徴量と標準パターンの認識辞書65とから
パターンマッチングを行い、1文字あたり単数または複
数の認識候補文字とその順位、およびそれらに対応する
標準パターンとの距離値を認識結果記憶部75へ記憶す
る。認識辞書65は、文字ごとに文字コード、その文字
の標準パターンの特徴量等の情報を保持する。結果出力
部70は、認識結果記憶部75に格納されている認識結
果をディスプレイ、プリンタまたはファイル等の出力装
置に原画像記憶部25に記憶された原画像データと対応
させて認識結果の文字を出力したり、ネットワークを介
して他のコンピュータへ送信したりすることによってオ
ペレータ結果を提供する。本発明の文字認識装置を本実
施の形態のように構成すると、一旦、行切り出し処理を
確定し、行の高さから文字サイズを推定し、矩形の有効
サイズを設定することによって、矩形の有効/無効を高
精度に判定できるため、不要な矩形が混入することな
く、文字画像範囲を正しく特定することができるので、
高精度かつ原稿品質によらず安定した性能を発揮する文
字認識装置を実現することができる。
【0010】(2)処理手順 図10は、本実施の形態の文字認識装置の処理の手順を
説明するためのフローチャートである。スキャナやファ
イルからの画像を読み取り、その画像データを原画像記
憶部25へ格納する(ステップS100)。これにより
画像入力部20を構成する。原画像記憶部25に格納さ
れた画像データの黒画素の連結を探索し、それと外接す
る矩形を作成する(ステップS110)。これにより矩
形抽出部30を構成する。行切り出しのために、矩形の
有効/無効を判断するための基準値を予め調整済みの値
に設定する(ステップS120)。この矩形の有効/無
効を判断するために利用する基準値は、矩形サイズ、矩
形の存在位置等の矩形を特徴づける複数の値によって定
義される。文字認識用の認識サブルーティンを呼び出す
(ステップS130)。認識サブルーティンで文字認識
された結果を認識結果記憶部75から取り出して、原画
像記憶部25に記憶された原画像データと対応させて、
ディスプレイ、プリンタまたはファイル等の出力装置へ
出力したり、ネットワークを介して他のコンピュータへ
送信したりすることによってオペレータへ結果を提供す
る(ステップS140)。これにより結果出力部70を
構成する。
【0011】(3)認識サブルーティンの処理手順 図11は、文字認識を行うための認識サブルーティンの
処理手順を説明するフローチャートである。ステップS
120で設定した有効矩形の判定基準値によって、ステ
ップS110で抽出された矩形の有効/無効を判定する
(ステップS200)。この判定は、ノイズや罫線等、
文字画像を構成している黒画素とは思えない著しく大き
い矩形、あるいは著しく小さい矩形をこの基準値を用い
て無効と判定することによって排除するためである。ス
テップS200で有効と判断した矩形を対象に行を切り
出す(ステップS210)。行切り出し処理は、近隣の
矩形同士を統合していき、一つの行を作成する。図5
は、行切り出し結果であり、図中の矩形が文字矩形候補
となる。ステップS200とステップS210により行
切出し部40を構成する。行を切り出した後、各文字行
の高さを求め、その高さから各行における文字サイズを
推定する(ステップS220)。一般には、文字のサイ
ズは行の高さとほぼ同程度であるとする。しかし、特殊
な場合には、予め、行の高さと文字サイズとの関係を調
査しておき、行の高さから文字サイズを推定する関係式
を作成しておき、これを用いて文字サイズを推定する。
各行について、その文字サイズから矩形の有効/無効を
判断するための基準値を再設定する(ステップS23
0)。たとえば、基準値を(文字サイズ / 5)程度に設
定する。この基準値により、ステップS110で求めた
矩形の有効/無効を再度、判定する(ステップS24
0)。各行において、有効として残った矩形に対して文
字切出しを行い、その文字部分を囲む矩形の対角座標値
を抽出する(ステップS250)。切り出された文字画
像に対して正規化を行い、文字画像の特徴量を計算する
(ステップS260)。ステップS220からステップ
S260で文字切出し部50を構成する。ステップS2
60で求めた特徴量と標準パターンの認識辞書65とで
パターンマッチングを行い、1文字あたり単数または複
数の認識候補文字とその順位、およびそれらに対応する
標準パターンとの距離値を認識結果記憶部75へ記憶す
る(ステップS270)。上記のように文字認識部60
を構成する。
【0012】<実施の形態の変形例1>上記の実施の形
態のように、有効矩形の判定を高精度に行ったとして
も、誤って判定する可能性がなくなったわけではない。
一般的には、文字認識処理結果として、文字ごとに認識
結果の確からしさ(確信度)が算出される。たとえば、認
識辞書との照合距離が遠いほど、もとの文字画像と認識
結果の文字の特徴は類似していないことから、文字認識
の確からしさ(確信度)を算出することができる。また、
認識結果の複数候補に、小さい距離のものが多ければ、
認識結果として類似している文字が複数存在しているこ
とを示すから、認識結果もあいまいであり確からしくな
いと考えられるので、このことから確からしさ(確信度)
を算出する方法もある。また、有効矩形の判定が誤って
いた場合には、行切り出し処理が誤ってしまうことがあ
る。行切り出し処理を誤ると、正しく1文字ずつ範囲を
特定することができず、結果的にその行に属する文字の
ほとんどが誤った認識結果となってしまう。この場合、
各文字の認識結果の確からしさは低いものであることが
多い。したがって、本実施の形態の変形例1は、文字認
識した結果、各行で確信度の低い認識結果が多い場合に
は、有効矩形の判定が間違っていたものとし、有効矩形
判定基準値を別の算出式によって設定し直し、再度、有
効矩形の判定を試みて、行切り出し処理から文字認識処
理までを実行することによって、正しい認識結果に到達
する可能性を高める。
【0013】図12は、本変形例1の処理を説明するた
めのフローチャートである。スキャナやファイルからの
画像を読み取り、その画像データを原画像記憶部25へ
格納する(ステップS300)。これにより画像入力部
20を構成する。原画像記憶部25に格納された画像デ
ータの黒画素の連結を探索し、それと外接する矩形を作
成する(ステップS310)。これにより矩形抽出部3
0を構成する。行切り出しのために、矩形の有効/無効
を判断するための基準値を予め調整済みの値に設定する
(ステップS320)。この矩形の有効/無効を判断す
るために利用する基準値は、矩形サイズ、矩形の存在位
置等の矩形を特徴づける複数の値によって定義される。
文字認識用の認識サブルーティンを呼び出す(ステップ
S330)。認識サブルーティンで文字認識された結果
の各文字候補に関して、認識結果の確からしさ(確信度)
を計算する(ステップS340)。認識辞書55の標準
パターンとの照合距離や、認識結果の複数候補間におけ
る照合距離のばらつき具合等から確からしさ(確信度)を
算出する。認識結果の確信度の低い文字が多い行を検出
する(ステップS350)。たとえば、行に属する総文
字数に対して確信度の低い文字の総数の割合が、規定値
よりも多ければ行切り出し処理が誤っていると判断す
る。この確信度の低い文字が多いとして検出された(ス
テップS360)行に対して、矩形の有効/無効を判断
するための基準値を別に用意した基準値に設定し(ステ
ップS370)、再度、その行に対して認識処理をする
ためにステップS330へ戻る。確信度の低い行がなけ
れば、認識サブルーティンで文字認識された結果を認識
結果記憶部75から取り出して、原画像記憶部25に記
憶された原画像データと対応させて、ディスプレイ、プ
リンタまたはファイル等の出力装置へ出力したり、ネッ
トワークを介して他のコンピュータへ送信したりするこ
とによってオペレータへ結果を提供する(ステップS3
80)。これにより結果出力部70を構成する。
【0014】<実施の形態の変形例2>原稿に書かれた
文字の文字サイズが予めわかっている場合には、オペレ
ータがその文字サイズの値を入力することによって、基
準値を設定する構成にしておけば、上記の実施の形態や
変形例1のようなことを行うことなく、精度良く文字認
識を行うことができる。したがって、本変形例2は、原
稿の文字サイズが予めわかっている時には、その値をオ
ペレータが入力し、有効矩形の判定基準値をこの文字サ
イズによって設定するように構成する。なお、上記の実
施の形態、変形例1または変形例2を組み合わせた構成
とすると、より広範囲なノイズ等の削除に貢献できる文
字認識装置を構成することができる。
【0015】<コンピュータによる実施の形態>さら
に、本発明は上記の実施の形態のみに限定されたもので
はない。たとえば、図1に示した文字認識装置は、図1
3のようなハードウェア構成を持つコンピュータ装置2
00によっても実現が可能である。すなわち、コンピュ
ータ装置200は、キーボード、マウス、タッチパネ
ル、スキャナ等により構成され、情報の入力に使用され
る入力装置1と、種々の出力情報や入力装置1からの入
力された情報などを表示したり、プリンタ等へ出力させ
る出力装置2と、種々のプログラムを動作させるCPU
(Central Processing Unit;
中央処理ユニット)3と、プログラム自身を保持し、ま
たそのプログラムがCPU3によって実行されるときに
一時的に作成される情報等を保持するメモリ4と、本発
明の文字認識装置の原画像記憶部25、認識辞書55、
認識結果記憶部65およびプログラムやプログラム実行
時の一時的な情報等を保持する記憶装置5と、プログラ
ムやデータ等を記憶した記録媒体を装着してそれらを読
み込み、メモリ4または記憶装置5へ格納するのに用い
られる媒体駆動装置6と、ネットワーク9へ接続するた
めのインタフェースであるネットワーク接続装置7とか
ら構成され、それらはバス8で接続されている。また、
ネットワーク9は、コンピュータ装置200と他のコン
ピュータ装置200とを結合するための伝送路であっ
て、一般には、ケーブルで実現され、通信プロトコルに
はTCP/IPが使われる。ただし、伝送路としてはケ
ーブルだけではなく、それらの間の通信プロトコルが一
致するものであれば無線、有線および放送波のいずれで
もよく、たとえば、LAN(Local Area N
etwork)、WAN(Wide Area Net
work)、インターネット、アナログ電話網、デジタ
ル電話網(ISDN:Integral Servic
e Digital Network)、PHS(パー
ソナルハンディシステム)、携帯電話網、衛星通信網な
どを用いることができる。このようなコンピュータ装置
200の構成において、図1に示した文字認識装置を構
成する各機能をそれぞれプログラム化し、予めCD−R
OM等の記録媒体に書き込んでおき、このCD−ROM
を各サイトのCD−ROMドライブのような媒体駆動装
置6を搭載したコンピュータ装置に装着して、これらの
プログラムをそれぞれのコンピュータ装置のメモリ4あ
るいは記憶装置5に格納し、それを実行することによっ
て、上記の実施の形態と同様な機能を実現することがで
きる。
【0016】なお、記録媒体としては半導体媒体(たと
えば、ROM、ICメモリカード等)、光媒体(たとえ
ば、DVD、MO、MD、CD−R等)、磁気媒体(た
とえば、磁気テープ、フレキシブルディスク等)のいず
れであってもよい。また、コンピュータ装置200のメ
モリ4へロードしたプログラムを実行することにより上
記した実施の形態の機能が実現されるだけでなく、その
プログラムの指示に基づき、オペレーティングシステム
等が実際の処理の一部または全部を行い、その処理によ
って上記した実施の形態の機能が実現される場合も含ま
れる。また、上記した実施の形態を実現するプログラム
がROM等のような半導体の記録媒体である場合には、
媒体駆動装置6からではなく、直接、メモリ4へロード
して実行される。
【0017】<本発明のネットワーク環境での運用>図
14は、本発明を有線または無線の通信ネットワークに
接続して運用する形態の構成を示している。たとえば、
文字認識プログラムを保持するサーバー210と複数の
オペレータが利用する端末220とをネットワーク9で
接続する。この場合、サーバー210およびオペレータ
の端末220は、図13に示した汎用のコンピュータ装
置200で構成される。オペレータは、端末220から
サーバー210に対してログインしたり、文字認識のた
めの画像データを入力し、サーバー210の文字認識プ
ログラムへ文字認識の実行を依頼する。サーバー210
の文字認識プログラムは送信された画像データの文字領
域に対する文字認識結果を要求もとの端末220へ戻
す。オペレータの端末220は、この認識結果やもとの
画像データとを対比させながら出力する。このようにす
ることで、常に最新の文字認識プログラムを使えるとい
う利点がある。また、図14のようにサーバー210と
端末220とを有線または無線の通信ネットワークで接
続した場合、サーバー210の磁気ディスク等の記憶装
置に本発明の機能を実現する文字認識プログラムを格納
しておき、端末220に対してダウンロード等の形式で
頒布することも可能である。さらに、本発明の機能を実
現する文字認識プログラムを媒体や放送波による配布で
提供するようにしてもよい。
【0018】
【発明の効果】以上説明したように、本発明によれば、
オペレータの入力により、あるいは、一旦、行切り出し
処理を確定し、行の高さから文字サイズを推定して、矩
形の有効サイズを設定することによって、矩形の有効/
無効を高精度に判定できるため、不要な矩形が混入する
ことなく、文字画像範囲を正しく特定することができの
で、高精度かつ原稿品質によらず安定した性能を発揮す
る文字認識装置を実現できる。
【図面の簡単な説明】
【図1】実施の形態の機能構成を示すブロック図であ
る。
【図2】実施の形態の説明に用いる原稿を例示した図で
ある。
【図3】図2の原稿の矩形抽出結果を示す図である。
【図4】複数サイズの文字が混在する原稿の例を示す図
である。
【図5】図4の原稿の行切り出し結果を示す図である。
【図6】図3の原稿から異なるサイズの文字を抽出した
例を示す図である。
【図7】図6にノイズが混入している例を示す図であ
る。
【図8】有効矩形の判定の基準値が大きいときの判定結
果を示す図である。
【図9】有効矩形の判定の基準値が小さいときの判定結
果を示す図である。
【図10】実施の形態の処理手順を説明するフローチャ
ートである。
【図11】認識サブルーティンの処理手順を説明するフ
ローチャートである。
【図12】変形例1の処理手順を説明するフローチャー
トである。
【図13】本発明の文字認識装置が稼動するためのコン
ピュータ装置を示す図である。
【図14】本発明のネットワーク環境での運用例を説明
するための図である。
【符号の説明】
1 … 入力装置 2 … 出力装置 3 … CPU 4 … メモリ 5 … 記憶装置 6 … 媒体駆動装置 7 … ネットワーク接続装置 8 … バス 9 … ネットワーク 10 … 制御部 20 … 画像入力部 30 … 矩形抽出部 40 … 行切出し部 50 … 文字切出し部 60 … 文字認識部 70 … 結果出力部 25 … 原画像記憶部 55 … 認識辞書 65 … 認識結果記憶部 100 … 文字認識装置 200 … コンピュータ装置 210 … サーバー 220 … 端末

Claims (7)

    【特許請求の範囲】
  1. 【請求項1】 文字画像に対し文字認識を行う文字認識
    装置において、 前記文字画像から行を切り出す行切出し部と、 前記行切出し部で切り出された行に関する情報を基に画
    像の一部を取捨選択する基準値を設定し、この基準値に
    より切り出された行から画像の一部を選択してから文字
    画像を切り出す文字切出し部と、 前記文字切出し部で切り出された文字画像に対し文字認
    識を行う文字認識部と、 を備えたことを特徴とする文字認識装置。
  2. 【請求項2】 文字画像に対し文字認識を行う文字認識
    装置において、 前記文字画像から行を切り出す行切出し部と、 前記行切出し部で切り出された行に関する情報を基に画
    像の一部を取捨選択する基準値を設定し、この基準値に
    より切り出された行から画像の一部を選択してから文字
    画像を切り出す文字切出し部と、 前記文字切出し部で切り出された文字画像に対し文字認
    識を行って、認識結果の文字ごとに確信度を算出する文
    字認識部とを備え、 前記文字認識部で算出された確信度の低い行に対し、画
    像の一部を取捨選択する基準値を変更して、再度、行切
    り出しを行って文字認識するようにしたことを特徴とす
    る文字認識装置。
  3. 【請求項3】 請求項1または請求項2に記載の文字認
    識装置において、 前記文字認識部で文字認識された結果と、その結果に対
    応する文字画像とを対比させて出力する結果出力部とを
    備えたことを特徴とする文字認識装置。
  4. 【請求項4】 文字画像に対し文字認識を行う文字認識
    方法において、 前記文字画像から行を切り出し、この切り出された行に
    関する情報を基に画像の一部を取捨選択する基準値を設
    定し、この基準値により切り出された行から画像の一部
    を選択してから文字画像を切り出して、その文字画像に
    対し文字認識を行うようにしたことを特徴とする文字認
    識方法。
  5. 【請求項5】 文字画像に対し文字認識を行う文字認識
    方法において、 前記文字画像から行を切り出し、この切り出された行に
    関する情報を基に画像の一部を取捨選択する基準値を設
    定し、この基準値により切り出された行から画像の一部
    を選択してから文字画像を切り出し、この切り出された
    文字画像に対し文字認識を行って、認識結果の文字ごと
    に確信度を算出し、算出された確信度の低い行に対し、
    画像の一部を取捨選択する基準値を変更して、再度、行
    切り出しを行うようにして文字認識することを特徴とす
    る文字認識方法。
  6. 【請求項6】 コンピュータを、文字画像に対し文字認
    識を行う文字認識装置として機能させるためのプログラ
    ムを記録したコンピュータ読み取り可能な記録媒体であ
    って、 前記文字画像から行を切り出す行切出し部と、 前記行切出し部で切り出された行に関する情報を基に画
    像の一部を取捨選択する基準値を設定し、この基準値に
    より切り出された行から画像の一部を選択してから文字
    画像を切り出す文字切出し部と、 前記文字切出し部で切り出された文字画像に対し文字認
    識を行う文字認識部と、 前記文字認識部で文字認識された結果と、その結果に対
    応する文字画像とを対比させて出力する結果出力部とを
    備えた文字認識プログラムを記録したコンピュータ読み
    取り可能な記録媒体。
  7. 【請求項7】 コンピュータを、文字画像に対し文字認
    識を行う文字認識装置として機能させるためのプログラ
    ムを記録したコンピュータ読み取り可能な記録媒体であ
    って、 前記文字画像から行を切り出す行切出し部と、 前記行切出し部で切り出された行に関する情報を基に画
    像の一部を取捨選択する基準値を設定し、この基準値に
    より切り出された行から画像の一部を選択してから文字
    画像を切り出す文字切出し部と、 前記文字切出し部で切り出された文字画像に対し文字認
    識を行って、認識結果の文字ごとに確信度を算出する文
    字認識部と、 前記文字認識部で文字認識された結果と、その結果に対
    応する文字画像とを対比させて出力する結果出力部とを
    備え、 前記文字認識部で算出された確信度の低い行に対し、画
    像の一部を取捨選択する基準値を変更して、再度、行切
    り出しを行って文字認識する文字認識プログラムを記録
    したコンピュータ読み取り可能な記録媒体。
JP2000351634A 2000-11-17 2000-11-17 文字認識装置、文字認識方法、および記録媒体 Expired - Fee Related JP4204185B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000351634A JP4204185B2 (ja) 2000-11-17 2000-11-17 文字認識装置、文字認識方法、および記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000351634A JP4204185B2 (ja) 2000-11-17 2000-11-17 文字認識装置、文字認識方法、および記録媒体

Publications (2)

Publication Number Publication Date
JP2002157550A true JP2002157550A (ja) 2002-05-31
JP4204185B2 JP4204185B2 (ja) 2009-01-07

Family

ID=18824656

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000351634A Expired - Fee Related JP4204185B2 (ja) 2000-11-17 2000-11-17 文字認識装置、文字認識方法、および記録媒体

Country Status (1)

Country Link
JP (1) JP4204185B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090028435A1 (en) * 2007-07-23 2009-01-29 Bo Wu Character image extracting apparatus and character image extracting method
US8452095B2 (en) 2008-07-08 2013-05-28 Canon Kabushiki Kaisha Image processing for post-processing rate of character rectangle extraction and character recognition accuracy

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090028435A1 (en) * 2007-07-23 2009-01-29 Bo Wu Character image extracting apparatus and character image extracting method
JP2009026287A (ja) * 2007-07-23 2009-02-05 Sharp Corp 文字画像抽出装置および文字画像抽出方法
US8750616B2 (en) 2007-07-23 2014-06-10 Sharp Kabushiki Kaisha Character image extracting apparatus and character image extracting method
US8452095B2 (en) 2008-07-08 2013-05-28 Canon Kabushiki Kaisha Image processing for post-processing rate of character rectangle extraction and character recognition accuracy

Also Published As

Publication number Publication date
JP4204185B2 (ja) 2009-01-07

Similar Documents

Publication Publication Date Title
JP4607633B2 (ja) 文字方向識別装置、画像形成装置、プログラム、記憶媒体および文字方向識別方法
JP7013182B2 (ja) 情報処理装置、情報処理方法およびプログラム
JP5508359B2 (ja) 文字認識装置、文字認識方法及びプログラム
US7796817B2 (en) Character recognition method, character recognition device, and computer product
JP2018055255A (ja) 情報処理装置、情報処理方法及びプログラム
US7146047B2 (en) Image processing apparatus and method generating binary image from a multilevel image
US6947596B2 (en) Character recognition method, program and recording medium
JP5538812B2 (ja) 画像処理装置、画像処理方法及びプログラム
JP4613397B2 (ja) 画像認識装置、画像認識方法および画像認識プログラムを記録したコンピュータ読取可能な記録媒体
JP2001209756A (ja) ユーザ囲み領域を用いたファックス送信簡易化方法及び装置
JP3571128B2 (ja) 図面の寸法数値認識方法及びその装置
US7095891B1 (en) Pattern segmentation apparatus and pattern recognition apparatus
JP4849883B2 (ja) 行方向判定プログラム、方法及び装置
JP3215163B2 (ja) 罫線識別方法及び領域識別方法
JP4204185B2 (ja) 文字認識装置、文字認識方法、および記録媒体
JPH10171920A (ja) 文字認識装置、その文字認識方法およびその記録媒体
JP2003030654A (ja) パターン識別装置、パターン識別方法及びパターン識別用プログラム
JP2004246546A (ja) 画像処理方法、該方法の実行に用いるプログラム及び画像処理装置
JP4162195B2 (ja) 画像処理装置、及び画像処理プログラム
JP4070486B2 (ja) 画像処理装置、画像処理方法及び同方法の実行に用いるプログラム
JP2000076378A (ja) 文字認識方法
JPH07282193A (ja) 表を含む帳票処理装置
JP3960756B2 (ja) 文書画像レイアウト識別方法および装置
JP2020047138A (ja) 情報処理装置
JP2002056356A (ja) 文字認識装置、文字認識方法および記録媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050124

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20050225

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080422

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080623

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080715

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080912

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20081007

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20081014

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111024

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121024

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131024

Year of fee payment: 5

LAPS Cancellation because of no payment of annual fees