JP2003256772A - 文字認識装置及び記録媒体 - Google Patents

文字認識装置及び記録媒体

Info

Publication number
JP2003256772A
JP2003256772A JP2002060405A JP2002060405A JP2003256772A JP 2003256772 A JP2003256772 A JP 2003256772A JP 2002060405 A JP2002060405 A JP 2002060405A JP 2002060405 A JP2002060405 A JP 2002060405A JP 2003256772 A JP2003256772 A JP 2003256772A
Authority
JP
Japan
Prior art keywords
character
line
character recognition
recognition device
rectangle
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2002060405A
Other languages
English (en)
Inventor
Yoshihisa Oguro
慶久 大黒
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2002060405A priority Critical patent/JP2003256772A/ja
Publication of JP2003256772A publication Critical patent/JP2003256772A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】本発明はレイアウト構造の複雑な原稿の文字画
像の文字行の切り出しを高精度に行って高精度に文字認
識を行う文字認識装置を提供する。 【解決手段】文字認識装置は入力した画像の文字領域/
図領域/表領域等の領域識別を行い、黒画素の連続する
範囲毎に、当該範囲と外接する矩形を抽出して、抽出し
た矩形の有効/無効を判断する基準値を予め調整済みの
値に設定する行切り出しパラメータ設定処理を行う。文
字認識装置は設定した基準値に基づいて矩形の有効/無
効を判断する有効矩形の設定処理を行って、領域識別処
理の結果に基づいて行方向の設定を行い、有効矩形を対
象に行切り出し処理を行って、切り出された行矩形を1
文字単位に分割する文字切り出し処理を行う。文字認識
装置は切り出した1文字の画像特徴を抽出し、パターン
辞書の文字特徴とを比較して、文字認識する文字認識処
理を行う(ステップS101〜S110)。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、文字認識装置及び
記録媒体に関し、詳細には、レイアウト構造の複雑な原
稿の文字画像の文字行の切り出しを高精度に行って、高
精度に文字認識を行う文字認識装置及び記録媒体に関す
る。
【0002】
【従来の技術】従来、画像として取り込んだ文字を認識
することにより、文字情報の正確な入力や文字の入力の
省力化することが行われており、また、この認識した文
字を音声により出力したり、認識した文字を翻訳するこ
とが行われている。
【0003】文書画像中の文字を認識する場合、一般に
は、スキャナ等で紙原稿の文書画像を、例えば、文字線
部を黒画素、背景部を白画素で表現した白黒2値に量子
化して、文書画像データを得る。次に、この文書画像デ
ータから文書画像上の文字行と対応する文字行データを
切り出し、この文字行データから文字パタンデータを切
り出して文字単位の認識を行なう。
【0004】ところが、文字行切り出し対象である文書
の中には特殊なレイアウト構成を有したものが多く、こ
れらの文書画像からは、上記従来の文字行切り出し方法
では、文字行データを正確に切り出すことができない場
合があった。
【0005】そこで、従来、文書画像データから文字行
データを切り出す文字行切り出し装置において、文書画
像データを、該データ中の全ての行と交差する方向が分
割線となるように複数のサブブロックに分割する領域分
割部と、前記分割された各サブブロックから行画像デー
タの切り出しをそれぞれ行う行画像データ切り出し部
と、前記行画像データ切り出し部に接続された文字行判
定部と、前記文字行判定部に接続された文字行データ再
生部とを具え、前記文字行判定部は、前記行画像データ
切り出し部で切り出された各行画像データが単一文字行
から切り出されたものか否かを、着目行画像データを含
むサブブロックに隣接するサブブロック中に着目行画像
データと列方向において重なる行画像データがいくつか
あるかにより判定し、着目行画像データが単一文字行か
ら切り出されたものである場合は該行画像データを前記
文字行再生部に出力し、着目行画像データが複数の文字
行を含むものである場合は該行画像データを文書画像デ
ータとして前記領域分割部に出力する構成としてあり、
前記文字行データ再生部は、前記文字行判定部から入力
された各行画像データのうちの隣接するサブブロックの
行画像データ同士をこれら行画像データの位置情報に基
づいて接続し文字行データとする構成としてあることを
特徴とする文字行切り出し装置が提案されている(特開
平5−35913号公報参照)。
【0006】すなわち、この従来技術は、横書きの場
合、行切り出し処理で、横方向の分割を行うとともに、
縦方向にも行って、複雑なレイアウトの行を正しく切り
出し、文字高さが通常の文字行よりも高い文字を含む文
書から文字行データを正確に切り出そうとしている。
【0007】
【発明が解決しようとする課題】しかしながら、このよ
うな従来の技術にあっては、横書きの場合、行切り出し
処理で、横方向の分割を行うとともに、縦方向にも行っ
て、複雑なレイアウトの行を正しく切り出しを行おうと
していたため、大きな文字が小さな文字行の横に配置さ
れている特定のパターンにしか対応することができず、
一般的なレイアウトの原稿に対しては、適切に処理する
ことができず、改良の必要があった。
【0008】すなわち、一般的に、一枚の原稿中でもタ
イトル行(見出し行)と本文行とは、文字のサイズが異
り、タイトル行は、比較的大きなサイズの文字が使用さ
れ、目立ちやすくなっており、本文は、10.5ポイン
ト程度のサイズの文字が使用されることが多い。また、
行方向についても、新聞等によくみられるように、縦書
き文書の中に、見出しとして、大きなサイズの文字を使
用して横書きで書かれるものもあり、逆に、横書き文書
において、縦書きのタイトル等が用いられていることが
あり、1枚の原稿において、行方向も縦横存在し、ま
た、文字サイズも複数存在する。
【0009】これら縦横の行が混在し、文字サイズも複
数存在する可能性のある原稿においても、従来では、行
切り出し処理の前に領域識別処理を行い、各領域の範囲
と行方向を決定してから、その結果の基づいて、1度だ
け行切り出し処理を行っている。
【0010】しかし、領域識別処理は、原稿全体の画像
特徴から領域を区分し、その領域の属性を判定してお
り、実際に行切り出しをするわけではないため、行方向
を間違えることや大きなサイズの文字を図領域であると
誤って判定してしまうことがある。この誤った判定結果
に基づいて行切り出し処理やそれに後続する文字切り出
し処理、認識処理を行っても、正しい結果を得ることが
できない。
【0011】そこで、本発明は、タイトル行等の本文行
とは異る特徴的な行のみを専用に切り出す処理を、切り
出す目的行の種類だけ、基準値を変えて複数回実行する
ことによって、当該行を高精度に抽出し、また、各抽出
結果を合成して、最終的な行切り出し結果とすることに
より、原稿中に変則的にレイアウトされることの多いタ
イトル行を積極的に検出して、その行に惑わされること
なく本文行の行切り出しを行い、大きなサイズの文字と
図領域とを明確に区別して、高精度かつ頑強な文字認識
装置を提供することを目的としている。
【0012】具体的には、請求項1記載の発明は、少な
くとも文字を含む画像に対して所定の画像処理を施した
後、当該画像処理後の画像の特徴を抽出し、当該抽出し
た画像の特徴を予め各文字の特徴が格納されている画像
特徴辞書と照合して文字認識を行うに際して、行切り出
し処理で使用する基準値を変更可能なものとし、当該基
準値に基づいて行切り出し処理を実行することにより、
複数サイズの行が存在するレイアウト構造の複雑な原稿
の文字行切り出し精度を向上し、文字認識を高精度かつ
頑強に行うことのできる文字認識装置を提供することを
目的としている。
【0013】請求項2記載の発明は、行方向を縦と横の
両方向に仮定して、当該両方に対する行切り出し処理を
実行することにより、縦横両方向に行方向が存在した
り、複数サイズの行が存在するレイアウト構造の複雑な
原稿の文字行切り出し精度を向上し、文字認識を高精度
かつ頑強に行うことのできる文字認識装置を提供するこ
とを目的としている。
【0014】請求項3記載の発明は、基準値を段階的に
変化させて、行切り出し処理を複数回実行することによ
り、縦横両方向に行方向が存在したり、複数サイズの行
が存在するレイアウト構造の複雑な原稿の文字行切り出
し精度をより一層向上し、文字認識をより一層高精度か
つ頑強に行うことのできる文字認識装置を提供すること
を目的としている。
【0015】請求項4記載の発明は、段階的に変化させ
た各基準値毎に行った行切り出し処理の処理結果を統合
して、行切り出しを行うことにより、縦横両方向に行方
向が存在したり、複数サイズの行が存在するレイアウト
構造の複雑な原稿の文字行切り出し精度をより一層向上
し、文字認識をより一層高精度かつ頑強に行うことので
きる文字認識装置を提供することを目的としている。
【0016】請求項5記載の発明は、段階的に変化させ
た各基準値毎に行った行切り出し処理の処理結果を統合
する際、矩形範囲が重複している矩形に対しては、矩形
面積が広い方の矩形を行として選択することにより、大
きな行に含まれている小さな行と同程度のサイズの行を
削除することを防止して、縦横両方向に行方向が存在し
たり、複数サイズの行が存在するレイアウト構造の複雑
な原稿の文字行切り出し精度をより一層向上し、文字認
識をより一層高精度かつ頑強に行うことのできる文字認
識装置を提供することを目的としている。
【0017】請求項6記載の発明は、基準値毎に抽出し
た行切り出し結果に対応する行画像を削除することによ
り、文字行を積極的に抽出することで最終的に残った行
を文字領域以外と判定して、縦横両方向に行方向が存在
したり、複数サイズの行が存在するレイアウト構造の複
雑な原稿の文字行切り出し精度をより一層向上し、文字
認識をより一層高精度かつ頑強に行うことのできる文字
認識装置を提供することを目的としている。
【0018】請求項7記載の発明は、記録媒体に、情報
処理装置に導入されて実行されることで、上記請求項1
から請求項6のいずれかに記載の文字認識装置を構築す
る文字認識方法のプログラム及びデータを記録すること
により、記録媒体を、コンピュータ等の情報処理装置に
読み取らせることで、複数サイズの行が存在するレイア
ウト構造の複雑な原稿の文字行切り出し精度を向上し、
文字認識を高精度かつ頑強に行うことのできる文字認識
装置を実現する記録媒体を提供することを目的としてい
る。
【0019】
【課題を解決するための手段】請求項1記載の発明の文
字認識装置は、少なくとも文字を含む画像に対して所定
の画像処理を施した後、当該画像処理後の画像から文字
行を切り出す行切り出し処理を行って、当該行切り出し
を行った行の画像の特徴を抽出し、当該抽出した画像の
特徴を予め各文字の特徴が格納されている画像特徴辞書
と照合して文字認識を行う文字認識装置であって、前記
行切り出し処理で使用する基準値を変更可能なものと
し、当該基準値に基づいて行切り出し処理を実行するこ
とにより、上記目的を達成している。
【0020】上記構成によれば、少なくとも文字を含む
画像に対して所定の画像処理を施した後、当該画像処理
後の画像の特徴を抽出し、当該抽出した画像の特徴を予
め各文字の特徴が格納されている画像特徴辞書と照合し
て文字認識を行うに際して、行切り出し処理で使用する
基準値を変更可能なものとし、当該基準値に基づいて行
切り出し処理を実行するので、複数サイズの行が存在す
るレイアウト構造の複雑な原稿の文字行切り出し精度を
向上させることができ、文字認識を高精度かつ頑強に行
うことができる。
【0021】この場合、例えば、請求項2に記載するよ
うに、前記文字認識装置は、行方向を縦と横の両方向に
仮定して、当該両方に対する行切り出し処理を実行する
ものであってもよい。
【0022】上記構成によれば、行方向を縦と横の両方
向に仮定して、当該両方に対する行切り出し処理を実行
するので、縦横両方向に行方向が存在したり、複数サイ
ズの行が存在するレイアウト構造の複雑な原稿の文字行
切り出し精度を向上させることができ、文字認識を高精
度かつ頑強に行うことができる。
【0023】また、例えば、請求項3に記載するよう
に、前記文字認識装置は、前記基準値を段階的に変化さ
せて、前記行切り出し処理を複数回実行するものであっ
てもよい。
【0024】上記構成によれば、基準値を段階的に変化
させて、行切り出し処理を複数回実行するので、縦横両
方向に行方向が存在したり、複数サイズの行が存在する
レイアウト構造の複雑な原稿の文字行切り出し精度をよ
り一層向上させることができ、文字認識をより一層高精
度かつ頑強に行うことができる。
【0025】さらに、例えば、請求項4に記載するよう
に、前記文字認識装置は、前記段階的に変化させた各基
準値毎に行った行切り出し処理の処理結果を統合して、
行切り出しを行うものであってもよい。
【0026】上記構成によれば、段階的に変化させた各
基準値毎に行った行切り出し処理の処理結果を統合し
て、行切り出しを行うので、縦横両方向に行方向が存在
したり、複数サイズの行が存在するレイアウト構造の複
雑な原稿の文字行切り出し精度をより一層向上させるこ
とができ、文字認識をより一層高精度かつ頑強に行うこ
とができる。
【0027】また、例えば、請求項5に記載するよう
に、前記文字認識装置は、前記段階的に変化させた各基
準値毎に行った行切り出し処理の処理結果を統合する
際、矩形範囲が重複している矩形に対しては、矩形面積
が広い方の矩形を行として選択するものであってもよ
い。
【0028】上記構成によれば、段階的に変化させた各
基準値毎に行った行切り出し処理の処理結果を統合する
際、矩形範囲が重複している矩形に対しては、矩形面積
が広い方の矩形を行として選択するので、大きな行に含
まれている小さな行と同程度のサイズの行を削除するこ
とを防止して、縦横両方向に行方向が存在したり、複数
サイズの行が存在するレイアウト構造の複雑な原稿の文
字行切り出し精度をより一層向上させることができ、文
字認識をより一層高精度かつ頑強に行うことができる。
【0029】さらに、例えば、請求項6に記載するよう
に、前記文字認識装置は、前記基準値毎に抽出した行切
り出し結果に対応する行画像を削除するものであっても
よい。
【0030】上記構成によれば、基準値毎に抽出した行
切り出し結果に対応する行画像を削除するので、文字行
を積極的に抽出することで最終的に残った行を文字領域
以外と判定して、縦横両方向に行方向が存在したり、複
数サイズの行が存在するレイアウト構造の複雑な原稿の
文字行切り出し精度をより一層向上させることができ、
文字認識をより一層高精度かつ頑強に行うことができ
る。
【0031】請求項7記載の発明の記録媒体は、情報処
理装置に導入されて実行されることで、上記請求項1か
ら請求項6のいずれかに記載の文字認識装置を構築する
文字認識方法のプログラム及びデータを記録しているこ
とにより、上記目的を達成している。
【0032】上記構成によれば、記録媒体に、情報処理
装置に導入されて実行されることで、上記請求項1から
請求項6のいずれかに記載の文字認識装置を構築する文
字認識方法のプログラム及びデータを記録しているの
で、記録媒体を、コンピュータ等の情報処理装置に読み
取らせることで、複数サイズの行が存在するレイアウト
構造の複雑な原稿の文字行切り出し精度を向上させて、
文字認識を高精度かつ頑強に行うことのできる文字認識
装置を実現することができる。
【0033】
【発明の実施の形態】以下、本発明の好適な実施の形態
を添付図面に基づいて詳細に説明する。なお、以下に述
べる実施の形態は、本発明の好適な実施の形態であるか
ら、技術的に好ましい種々の限定が付されているが、本
発明の範囲は、以下の説明において特に本発明を限定す
る旨の記載がない限り、これらの態様に限られるもので
はない。
【0034】図1〜図9は、本発明の文字認識装置及び
記録媒体の第1の実施の形態を示す図であり、本実施の
形態は、請求項1及び請求項7に対応するものである。
【0035】図1は、本発明の文字認識装置及び記録媒
体の第1の実施の形態を適用した文字認識装置1の概略
ブロック構成図である。
【0036】図1において、文字認識装置1は、パーソ
ナルコンピュータ等が用いられており、後述するよう
に、文字認識ソフトウェアが導入されることで、文字認
識装置1として構築される。文字認識装置1は、CPU
(Central Processing Unit )2、メモリ3、通信部
4、表示部5、ハードディスク6、キーボード7、CD
−ROM(Compact Disc Read Only Memory )ドライブ
8及びFD(フロッピィディスク:登録商標)ドライブ
9等を備えており、上記主要各部は、バス10で接続さ
れている。
【0037】メモリ3は、ROM(Read Only Memor
y)、RAM(Random Access Memory)等で構成され、
文字認識装置1としての基本処理プログラムや後述する
文字認識処理プログラムを処理するのに必要な各種デー
タやCPU2が処理するのに必要な各種データやCPU
2の処理したデータを記憶する。
【0038】CPU2は、メモリ3またはハードディス
ク6内のプログラムに基づいてメモリ3をワークメモリ
として利用しつつ、文字認識装置1の各部を制御して、
文字認識処理路実行する。
【0039】通信部4は、CPU2の制御下で、接続さ
れる通信回線を介して、他の装置等との間で各種データ
の送受信を行う。
【0040】表示部5は、LCD(Liquid Crystal Dis
play)やCRT(陰極線管:Cathode Ray Tube)等が用
いられ、文字認識装置1から利用者に通知する各種情
報、例えば、キーボード7等の入力ディバイスから入力
された情報、文字認証の対象の画像、文字認識結果の文
字データ等を表示出力する。
【0041】ハードディスク6は、OS(Operating Sy
stem)や当該OS上で動作する各種アプリケーションソ
フトウェア(アプリケーションプログラム)、特に、文
字認識ソフトウェア及び各種データを記憶し、文字認識
装置1は、CD−ROMドライブ8やFDドライブ9で
読み取ったCD−ROMやフロッピー(登録商標)ディ
スクに記録されている文字認識ソフトウェアがハードデ
ィスク6に導入されて、起動されることで、構築され
る。ハードディスク6には、文字認識処理のデータとし
て、各種データ、例えば、文字パターンのパターン辞書
等が格納されている。
【0042】キーボード7は、文字認識装置1に必要な
命令や文字入力等を行うのに使用される。
【0043】CD−ROMドライブ8には、文字認識ソ
フトウェアのプログラムやそのデータ(パターン辞書
等)の記録されたCD−ROM(記録媒体)が着脱可能
に挿入され、CD−ROMドライブ8は、CPU2の制
御下で、挿入されたCD−ROMに記録されているプロ
グラムやデータを読み取る。
【0044】FDドライブ9には、FD(フロッピィデ
ィスク)が着脱可能に挿入され、FDドライブ9は、C
PU2の制御下で、認識した文字データ等の各種データ
を書き込んだり、FDに記録されているデータ等を読み
取る。
【0045】次に、本実施の形態の作用を説明する。本
実施の形態の文字認識装置1は、記録媒体としてのCD
−ROM等に記録されている文字認識プログラム(文字
認識ソフトウェア)がCD−ROM8等で読み取られ
て、ハードディスク6に導入され、当該文字認識プログ
ラムが起動されることで構築される。
【0046】そして、文字認識装置1は、少なくとも文
字を含む画像から文字行を切り出す行切り出し処理を行
って、当該行切り出しを行った行の画像の特徴を抽出
し、当該抽出した画像の特徴を予め各文字の特徴が格納
されている画像特徴辞書と照合して文字認識を行う際
に、行切り出し処理で使用する基準値を変更可能なもの
とし、当該基準値に基づいて行切り出し処理を実行する
ところにその特徴がある。
【0047】なお、以下の説明では、図2に示すように
日本語文の行が縦横混在する原稿を認識するものとす
る。なお、認識する原稿は、図2の例のようなレイアウ
トのものに限られるものではなく、また、原稿の言語、
文字画像種類(手書き/活字文字等)、書式(縦書き/横
書き)も図2の例のものに限定されるものではない。
【0048】図1の原稿は、一般的な原稿であり、さま
ざまのサイズの文字、文字フォントから構成され、行方
向も一枚の原稿内で縦方向と横方向が混在している。
【0049】文字認識装置1は、図3に示すように、こ
の原稿の画像データを図示しないスキャナ等で読み取っ
たり、CD−ROMドライブ8またはFDドライブ9に
挿入されたCD−ROMまたはFDから読み取ったり、
あるいは、通信部4を介して他の装置から受信して取得
し、取得した原稿の画像データをハードディスク6に格
納する画像入力処理を行う(ステップS101)。
【0050】文字認識装置1は、認識対象の画像データ
をハードディスク6に格納すると、文字領域/図領域/
表領域等の領域の範囲の予め決められ各領域の特徴を求
めて、例えば、文字領域であると、行方向を判定すると
いう領域識別を行う(ステップS102)。なお、ステ
ップS103以降は、文字領域の場合のみの処理であ
る。
【0051】次に、文字認識装置1は、黒画素の連続す
る範囲毎に、当該範囲と外接する矩形を求め(抽出し)
(ステップS103)、抽出した矩形の有効/無効を判
断するための基準値を予め調整済みの値に設定する行切
り出しパラメータ設定処理を行う(ステップS10
4)。この、矩形の有効/無効を判断するために利用す
る基準値は、矩形サイズ、矩形の存在位置等の矩形を特
徴づける複数の値によって定義される。
【0052】文字認識装置1は、ステップS104で設
定した基準値に基づいて、ステップS103で求めた矩
形の有効/無効を判断する有効矩形の設定処理を行い
(ステップS105)、領域識別処理の結果に基づいて
行方向の設定を行う(ステップS106)。
【0053】文字認識装置1は、ステップS105にお
いて有効と判断した矩形を対象に、行切り出し処理を行
う(ステップS107)。この行切り出し処理では、一
般的な方法として、近隣の矩形同士は同一行に属すると
判断して、同一行に属する矩形を統合していき、一つの
行を作成していく方法を用いることができる(図5及び
図6参照)。
【0054】次に、文字認識装置1は、切り出された行
矩形を1文字単位に分割して文字を切り出す文字切り出
し処理を行い(ステップS108)、当該切り出した1
文字の画像特徴を抽出する(ステップS109)。
【0055】文字認識装置1は、最後に、ステップS1
09で抽出した特徴と、パターン辞書に格納されている
文字特徴とを比較し、最も類似している文字パターンを
選択して、文字として認識する文字認識処理を行う(ス
テップS110)。
【0056】すなわち、本実施の形態の文字認識装置1
は、切り出し処理の前に、原稿中の黒画素の連結を探索
して、それと外接する矩形を作成する。ノイズや罫線等
の文字画像を構成している黒画素とは思われない、著し
く大きい矩形あるいは著しく小さい矩形を、予め設定し
ている基準値を用いて無効と判定する。例えば、図2に
示した原稿の場合、矩形抽出を行うと、例えば、図4に
示すような矩形抽出結果(抜粋)となる。
【0057】そして、文字認識装置1は、残った有効矩
形に対して、行切り出し処理を行う。
【0058】一般的な行切り出し方法としては、図5に
示すように、矩形間の水平距離、あるいは、図6に示す
ように、矩形間の垂直距離を測定し、設定値よりも近け
れば、同一行に属するものとして矩形を統合して、より
大きな外接矩形とする。そして、その大きくした外接矩
形に対して、同様に、近隣の矩形を探し、近ければ統合
するという処理を繰り返して、徐々に行を成長させてい
く方法がある。
【0059】そして、本実施の形態の文字認識装置1
は、行切り出しの前に有効矩形を判定する際に利用する
基準値を固定値ではなく可変にし、抽出したい行を構成
すると思われる矩形のみが有効になるような値に設定す
る(ステップS104参照)。この基準の下で有効矩形
と判断された矩形を、行切り出し処理で行にまとめる。
例えば、図2の原稿の場合、有効矩形のうち、本文文字
サイズ以上のサイズの文字矩形のみを残すと、例えば、
図7に示すようになる。
【0060】この際、本文文字よりも大きな文字の一部
の孤立点などが、本文文字サイズと同じ程度の大きさで
あれると、図2の原稿の場合、図8に示すように、矢印
で示している矩形が削除されることになる。
【0061】ところが、ほとんどの場合、図8に示すよ
うに、矢印で示している矩形は、他の矩形の範囲内にあ
ることが多いため、後続の行切り出し処理で問題になる
ことは少ない。
【0062】そして、文字認識装置1は、行切り出し処
理で、近隣の矩形同士を統合し、より大きな矩形を作成
することによって行を成長させていくが、矩形同士が近
隣か否かを判断する矩形間距離に対する基準値も、有効
矩形サイズによって変更する。
【0063】例えば、大きな文字であれば同一行に属す
る文字であっても文字矩形間距離は比較的広いし、小さ
な文字であれば同一行に属する文字矩形の矩形間距離は
小さい。
【0064】したがって、行切り出し処理で使用する基
準値も、有効矩形サイズに応じて変更する。
【0065】例えば、図8に示した有効矩形に対して、
図5及び図6に示した、近隣矩形の統合処理を施すと、
図9に一点鎖線で示すように、大きな文字の行が切り出
される(横方向のみ)。
【0066】なお、上記説明では、本文文字以上のサイ
ズの文字から構成される行を抽出する例を示したが、有
効矩形のサイズ範囲及び矩形統合の垂直距離・水平距離
の定義を変えることで、所望のサイズの文字から構成さ
れる行のみを抽出することもできる。例えば、有効矩形
サイズ等の基準値を調整して、本文行のみ抽出すること
も可能である。
【0067】すなわち、所望の文字サイズの行のみを抽
出することができ、見出し行等に代表される大きなサイ
ズの行のみを抽出して、文字認識処理することができ
る。したがって、原稿の内容を少量のテキストで表現す
ることができる。
【0068】このように、本実施の形態の文字認識装置
1は、少なくとも文字を含む画像に対して所定の画像処
理を施した後、当該画像処理後の画像の特徴を抽出し、
当該抽出した画像の特徴を予め各文字の特徴が格納され
ている画像特徴辞書と照合して文字認識を行うに際し
て、行切り出し処理で使用する基準値を変更可能なもの
とし、当該基準値に基づいて行切り出し処理を実行して
いる。
【0069】したがって、複数サイズの行が存在するレ
イアウト構造の複雑な原稿の文字行切り出し精度を向上
させることができ、文字認識を高精度かつ頑強に行うこ
とができる。
【0070】図10〜図11は、本発明の文字認識装置
及び記録媒体の第2の実施の形態を示す図であり、本実
施の形態は、請求項2及び請求項7に対応するものであ
る。
【0071】なお、本実施の形態は、上記第1の実施の
形態の文字認識装置1と同様な文字認識装置に適用した
ものであり、本実施の形態の説明においては、必要に応
じて、上記第1の実施の形態の説明で用いた符号をその
まま用いて説明する。
【0072】本実施の形態の文字認識装置1は、CD−
ROMドライブ8やFDドライブ9で読み取ったCD−
ROMやフロッピーディスクに記録されている文字認識
ソフトウェアがハードディスク6に導入されて、起動さ
れることで、構築される。
【0073】そして、文字認識装置1は、上記第1の実
施の形態の文字認識装置1が領域識別処理による判定は
全体的な画像特徴のみで判定していたのに対して、縦横
の2方向を別々に仮定して、それぞれ単独で領域識別処
理を行い、各結果を最終的に合成して、いずれの行方向
についても領域識別する。
【0074】すなわち、文字認識装置1は、図10に示
すように、原稿(例えば、図2に示す原稿)の画像デー
タを図示しないスキャナ等で読み取ったり、CD−RO
Mドライブ8またはFDドライブ9に挿入されたCD−
ROMまたはFDから読み取ったり、あるいは、通信部
4を介して他の装置から受信して取得し、取得した原稿
の画像データをハードディスク6に格納する画像入力処
理を行う(ステップS201)。
【0075】文字認識装置1は、認識対象の画像データ
をハードディスク6に格納すると、黒画素の連続する範
囲毎に、当該範囲と外接する矩形を求め(抽出し)(ス
テップS202)、行方向を横に設定して(ステップS
203)、抽出した矩形に対する行切り出しサブルーチ
ン処理を行う(ステップS204)。
【0076】次に、文字認識装置1は、行方向を縦に設
定して(ステップS205)、当該設定した方向の行切
り出しサブルーチン処理を行い(ステップS206)、
ステップS204とステップS206での横方向と縦方
向の切り出し結果を合成する(ステップS207)。
【0077】文字認識装置1は、切り出した行矩形を1
文字単位に分割して文字を切り出す文字切り出し処理を
行い(ステップS208)、切り出した文字の画像特徴
を抽出する特徴抽出処理を行う(ステップS209)。
【0078】次に、文字認識装置1は、ステップS20
9で抽出した画像特徴と、パターン辞書に格納されてい
る文字特徴とを比較し、最も類似している文字パターン
を選択して、文字として認識する文字認識処理を行い
(ステップS210)、最後に、各文字の認識確信度
(認識結果の確からしさ)であるパターンマッチ距離や
言語解析の妥当さを算出して、処理を終了する(ステッ
プS211)。
【0079】そして、文字認識装置1は、上記ステップ
S204及びステップS206での行切り出しサブルー
チン処理を、図11に示すように行う。
【0080】すなわち、文字認識装置1は、行切り出し
サブルーチン処理では、図11に示すように、行切り出
しパラメータに基づいて有効矩形を設定し(ステップS
221)、設定した有効矩形を行切り出しパラメータに
基づいて統合して、行を成長させて、行切り出しを行う
(ステップS222)。
【0081】このように、本実施の形態の文字認識装置
1は、行方向を縦と横の両方向に仮定して、当該両方に
対する行切り出し処理を実行している。
【0082】したがって、縦横両方向に行方向が存在し
たり、複数サイズの行が存在するレイアウト構造の複雑
な原稿の文字行切り出し精度を向上させることができ、
文字認識を高精度かつ頑強に行うことができる。
【0083】すなわち、領域識別処理による判定は全体
的な画像特徴のみで判定するため、行方向を誤る場合も
少くない。また、原稿に含まれる行方向は縦横混在であ
り、予め知ることはできない。
【0084】ところが、縦横の2方向を別々に仮定し
て、それぞれ単独で処理し、各結果を最終的に合成して
いるので、いずれの行方向の結果も得ることができ、ま
た、実際に行切り出し処理を行うので、高精度に行切り
出し結果を得られる。
【0085】そして、合成する方法としては、縦横の両
方の結果を単純に連結してもよいが、後続の認識処理に
おいて、誤った行切り出しに対応する認識精度は著しく
低いことが予想されるので、認識結果の確からしさ(パ
ターンマッチ距離や言語解析の妥当さ)が、基準値より
も低ければ、その行切り出し結果は棄却すればよい。
【0086】図12〜図17は、本発明の文字認識装置
及び記録媒体の第3の実施の形態を示す図であり、本実
施の形態は、請求項3から請求項6及び請求項7に対応
するものである。
【0087】なお、本実施の形態は、上記第1の実施の
形態の文字認識装置1と同様な文字認識装置に適用した
ものであり、本実施の形態の説明においては、必要に応
じて、上記第1の実施の形態の説明で用いた符号をその
まま用いて説明する。
【0088】本実施の形態の文字認識装置1は、CD−
ROMドライブ8やFDドライブ9で読み取ったCD−
ROMやフロッピーディスクに記録されている文字認識
ソフトウェアがハードディスク6に導入されて、起動さ
れることで、構築される。
【0089】文字認識装置1は、行切り出し処理を行う
際に、行切り出し処理で使用する基準値を段階的に変化
させて、複数回行切り出し処理を実行するものである。
【0090】すなわち、文字認識装置1は、図12に示
すように、原稿(例えば、図2に示す原稿)の画像デー
タを図示しないスキャナ等で読み取ったり、CD−RO
Mドライブ8またはFDドライブ9に挿入されたCD−
ROMまたはFDから読み取ったり、あるいは、通信部
4を介して他の装置から受信して取得し、取得した原稿
の画像データをハードディスク6に格納する画像入力処
理を行う(ステップS301)。
【0091】文字認識装置1は、認識対象の画像データ
をハードディスク6に格納すると、黒画素の連続する範
囲毎に、当該範囲と外接する矩形を求め(抽出し)(ス
テップS302)、行切り出し回数をカウントする行切
り出し回数カウンタを「0」にセットする(ステップS
303)。
【0092】次に、文字認識装置1は、行切り出し回数
カウンタをインクリメントし(ステップS304)、行
切り出し回数カウンタのカウント値に応じた行切り出し
パラメータの組を処理パラメータとして設定し(ステッ
プS305)、図11に示した行切り出しサブルーチン
処理を行って(ステップS306)、未処理の行切り出
しパラメータ組みがあるかチェックする(ステップS3
07)。
【0093】ステップS307で、未処理の行切り出し
パラメータ組があるときには、文字認識装置1は、ステ
ップS304に戻って、行切り出し回数カウンタのイン
クリメント処理から上記同様に処理することで、基準値
を段階的に変化させて、複数回行切り出し処理を実行す
る(ステップS304〜S307)。
【0094】ステップS307で、未処理の行切り出し
パラメータ組がないときには、文字認識装置1は、複数
回行った行切り出し処理の切り出し結果を合成し(ステ
ップS308)、切り出した行矩形を1文字単位に分割
して文字を切り出す文字切り出し処理を行う(ステップ
S309)。
【0095】文字認識装置1は、切り出した文字の画像
特徴を抽出する特徴抽出処理を行い(ステップS31
0)、ステップS310で抽出した画像特徴と、パター
ン辞書に格納されている文字特徴とを比較して、最も類
似している文字パターンを選択して、文字として認識す
る文字認識処理を行う(ステップS311)。
【0096】文字認識装置1は、最後に、各文字の認識
確信度(認識結果の確からしさ)であるパターンマッチ
距離や言語解析の妥当さを算出して、処理を終了する
(ステップS312)。
【0097】すなわち、本文行サイズ以外の行であって
も、行の大きさには複数の段階があり、各々意味がある
場合が多い。例えば、図2の原稿においては、最も大き
なサイズの文字行が見出し行であり、その次に大きな文
字が副題行である。また、原稿によっては、最も大きな
文字行が見出し行で、次に大きな文字行が章題である場
合もある。
【0098】このような複雑な構造を有する原稿の画像
は、一度に行切り出し処理を実行すると、近傍の別のサ
イズの矩形と誤って統合してしまうおそれがある。例え
ば、図2の原稿の画像について、本文文字行よりも大き
いサイズの文字行を一度に切り出そうとすると、図13
に示すような複数のサイズの矩形が同時に有効になり、
最も大きな行と、次に大きな行が近接しているため、行
方向が正しくない場合には、行方向で統合されて、図1
4に示すように、不正な行切り出し結果が混入する結果
となるおそれがある。
【0099】そこで、本実施の形態の文字認識装置1
は、上述のように、行切り出しの対象となる文字行の範
囲を段階的に設定し、注目しているサイズより大きくて
も小さくても、行切り出し処理に影響しないようにし
て、行切り出し処理を高精度に行っている。
【0100】例えば、図15に示した原稿においては、
最も大きな文字行を切り出す処理においては、最も大き
な行の認識結果を第一に提示して、2番目に大きな文字
行に相当する矩形を無視し、その次に大きな行の認識結
果を提示することで、原稿の内容を簡潔に表現して、た
とえ行方向が正しくない場合であっても、不正な統合を
してしまうことを防止し、図16に示すように、正しい
行方向で行の切り出しを行うことができる。
【0101】したがって、行抽出結果を行の大きさ別に
まとめることによって、当該原稿において、意味のある
重要な行を効率的に求めることができる。
【0102】そして、上記大きさの異る文字行を段階的
に抽出するには、各文字行に対応した行切り出し基準値
(有効矩形サイズ、矩形統合距離等)の組を複数組用意
し、基準値を変えて複数回、行切り出し処理を繰り返す
ことで、対応することができる。
【0103】なお、文字のサイズの変化は、他のサイズ
の文字との差異を強調するために使用されるものである
ため、なだらかに変化はせず、段階的に変化することが
通常である。したがって、本文文字(通常の文章では、
10.5point)を基に、行切り出し処理の基準値
の組を段階的に設定することができる。
【0104】このように、本実施の形態の文字認識装置
1は、基準値を段階的に変化させて、行切り出し処理を
複数回実行している。
【0105】したがって、縦横両方向に行方向が存在し
たり、複数サイズの行が存在するレイアウト構造の複雑
な原稿の文字行切り出し精度をより一層向上させること
ができ、文字認識をより一層高精度かつ頑強に行うこと
ができる。
【0106】また、上記行切り出し処理においては、縦
方向と横方向との両方の行切り出し処理を独立して行
い、それぞれの行切り出し結果を最後に合成し、また、
文字サイズ行の大きさ毎に行切り出し処理を独立して行
い、最後に合成している。
【0107】したがって、縦横両方向に行方向が存在し
たり、複数サイズの行が存在するレイアウト構造の複雑
な原稿の文字行切り出し精度をより一層向上させること
ができ、文字認識をより一層高精度かつ頑強に行うこと
ができる。
【0108】ところが、各々の行切り出し処理を独立し
て実行すると、図14に示したように、重複した範囲を
別々の行切り出し結果となるおそれがある。
【0109】そして、誤った行方向を仮定した場合に
は、文字間隔よりも行間隔の方が広いが一般的であるた
め、偶然、狭い行間隔の付近で誤って統合されてしまっ
ても、近隣の矩形がやがて存在しなくなり、行は長く成
長していかない。
【0110】一方、行方向を正しく仮定した場合には、
近隣の矩形を統合していき、行は長く成長していく。
【0111】そこで、同一範囲を共有する行切り出し結
果のうち、行矩形が最も広い面積の結果を正しい行選択
として選択すると、誤った行方向を仮定した切り出し結
果を棄却することができる。なお、行矩形の縦横比を用
いて行選択を行っても、同様に誤った行方向を仮定した
切り出し結果を棄却することができるが、行が細く切り
出された場合に選択を誤るおそれがあるため、面積比を
用いて行選択を行うことが望ましい。例えば、誤った行
方向で行を切り出した場合を示している図14と正しい
行方向で行を切り出した場合を示している図16を比較
すると、図14の場合の行矩形よりも、明らかに図16
の場合の行矩形の面積が広いため、図16の方の行切り
出しを選択することになる。
【0112】このようにすると、大きな行に含まれてい
る小さな行と同程度のサイズの行を削除することを防止
して、縦横両方向に行方向が存在したり、複数サイズの
行が存在するレイアウト構造の複雑な原稿の文字行切り
出し精度をより一層向上させることができ、文字認識を
より一層高精度かつ頑強に行うことができる。
【0113】さらに、図領域の判定を行う場合、大きな
文字行の抽出結果が確定した後、当該範囲を削除する
と、図領域と混同していた部分が削除されるため、図領
域の判定が高精度に行うことができる。すなわち、大き
な文字画像は削除されているため、大きな矩形のうち、
正方形に近い矩形を図領域と判定しても、正しく図領域
を高い確率で判定することができる。
【0114】また、文字行と判定した範囲を削除する
と、大きな文字行が存在していた範囲が空白になるた
め、大きな文字行とは関係のない行、例えば、本文文字
行の矩形が、大きな文字行に誤って統合されてしまうこ
とを防止することができ、より高精度に図領域と文字行
を判定することができる。
【0115】すなわち、図17に示すように、大きな文
字行の範囲を削除した画像を領域識別処理して、領域を
判定し、その後、領域に応じた処理を加える。例えば、
文字領域であれば、行切り出し処理→文字切り出し処理
→認識処理という一連の処理を行う。
【0116】このようにすると、文字行を積極的に抽出
することで最終的に残った行を文字領域以外と判定し
て、縦横両方向に行方向が存在したり、複数サイズの行
が存在するレイアウト構造の複雑な原稿の文字行切り出
し精度をより一層向上させることができ、文字認識をよ
り一層高精度かつ頑強に行うことができる。
【0117】なお、上記各実施の形態においては、図1
に示した1つの装置として文字認識装置1が構成されて
いる場合について説明したが、文字認識装置は、図18
に示すように、文字認識装置20が、インターネット等
通信回線21で相互に接続された複数の装置22a、2
2b、22c、・・・で構築されていてもよい。この場
合、装置22a、22b、22c、・・・が、図1に示
した文字認識装置1としての機能を分担し、例えば、装
置22aがCPU2としての機能、装置22bが、ハー
ドディスク6としての機能、装置22cが、原稿の画像
を読み取るスキャナ等としての機能を果たすことにな
る。
【0118】以上、本発明者によってなされた発明を好
適な実施の形態に基づき具体的に説明したが、本発明は
上記のものに限定されるものではなく、その要旨を逸脱
しない範囲で種々変更可能であることはいうまでもな
い。
【0119】
【発明の効果】請求項1記載の発明の文字認識装置によ
れば、少なくとも文字を含む画像に対して所定の画像処
理を施した後、当該画像処理後の画像の特徴を抽出し、
当該抽出した画像の特徴を予め各文字の特徴が格納され
ている画像特徴辞書と照合して文字認識を行うに際し
て、行切り出し処理で使用する基準値を変更可能なもの
とし、当該基準値に基づいて行切り出し処理を実行する
ので、複数サイズの行が存在するレイアウト構造の複雑
な原稿の文字行切り出し精度を向上させることができ、
文字認識を高精度かつ頑強に行うことができる。
【0120】請求項2記載の発明の文字認識装置によれ
ば、行方向を縦と横の両方向に仮定して、当該両方に対
する行切り出し処理を実行するので、縦横両方向に行方
向が存在したり、複数サイズの行が存在するレイアウト
構造の複雑な原稿の文字行切り出し精度を向上させるこ
とができ、文字認識を高精度かつ頑強に行うことができ
る。
【0121】請求項3記載の発明の文字認識装置によれ
ば、基準値を段階的に変化させて、行切り出し処理を複
数回実行するので、縦横両方向に行方向が存在したり、
複数サイズの行が存在するレイアウト構造の複雑な原稿
の文字行切り出し精度をより一層向上させることがで
き、文字認識をより一層高精度かつ頑強に行うことがで
きる。
【0122】請求項4記載の発明の文字認識装置によれ
ば、段階的に変化させた各基準値毎に行った行切り出し
処理の処理結果を統合して、行切り出しを行うので、縦
横両方向に行方向が存在したり、複数サイズの行が存在
するレイアウト構造の複雑な原稿の文字行切り出し精度
をより一層向上させることができ、文字認識をより一層
高精度かつ頑強に行うことができる。
【0123】請求項5記載の発明の文字認識装置によれ
ば、段階的に変化させた各基準値毎に行った行切り出し
処理の処理結果を統合する際、矩形範囲が重複している
矩形に対しては、矩形面積が広い方の矩形を行として選
択するので、大きな行に含まれている小さな行と同程度
のサイズの行を削除することを防止して、縦横両方向に
行方向が存在したり、複数サイズの行が存在するレイア
ウト構造の複雑な原稿の文字行切り出し精度をより一層
向上させることができ、文字認識をより一層高精度かつ
頑強に行うことができる。
【0124】請求項6記載の発明の文字認識装置によれ
ば、基準値毎に抽出した行切り出し結果に対応する行画
像を削除するので、文字行を積極的に抽出することで最
終的に残った行を文字領域以外と判定して、縦横両方向
に行方向が存在したり、複数サイズの行が存在するレイ
アウト構造の複雑な原稿の文字行切り出し精度をより一
層向上させることができ、文字認識をより一層高精度か
つ頑強に行うことができる。
【0125】請求項7記載の発明の記録媒体によれば、
記録媒体に、情報処理装置に導入されて実行されること
で、上記請求項1から請求項6のいずれかに記載の文字
認識装置を構築する文字認識方法のプログラム及びデー
タを記録しているので、記録媒体を、コンピュータ等の
情報処理装置に読み取らせることで、複数サイズの行が
存在するレイアウト構造の複雑な原稿の文字行切り出し
精度を向上させて、文字認識を高精度かつ頑強に行うこ
とのできる文字認識装置を実現することができる。
【図面の簡単な説明】
【図1】本発明の文字認識装置及び記録媒体の第1の実
施の形態を適用した文字認識装置の要部ブロック構成
図。
【図2】図1の文字認識装置で読み取られる原稿の一例
を示す図。
【図3】図1の文字認識装置による文字認識処理を示す
フローチャート。
【図4】図3の行切り出し処理での図2の原稿からの矩
形抽出結果の一例を示す図。
【図5】矩形間の水平距離を測定して矩形を統合して行
切り出しを行う行切り出し方法の説明図。
【図6】矩形間の垂直距離を測定して矩形を統合して行
切り出しを行う行切り出し方法の説明図。
【図7】図3の行切り出し処理で本文文字の矩形以上の
矩形のみを残した場合の画像を示す図。
【図8】図3の行切り出し処理で本文文字の矩形以上の
矩形のみを残す処理を行った場合に本文文字よりも大き
な文字の一部に本文文字サイズと同じ程度の大きさの孤
立点などがある画像を示す図。
【図9】図8の有効矩形に対して図5及び図6の近隣矩
形の統合処理を施した際に大きな文字の行が切り出され
ことを示す図。
【図10】本発明の文字認識装置及び記録媒体の第2の
実施の形態を適用した文字認識装置による文字認識処理
を示すフローチャート。
【図11】図10の行切り出しサブルーチン処理を示す
フローチャート。
【図12】本発明の文字認識装置及び記録媒体の第3の
実施の形態を適用した文字認識装置による文字認識処理
を示すフローチャート。
【図13】図2の原稿の画像に対して複数のサイズの矩
形が同時に有効になる行切り出しの一例を示す図。
【図14】図2の原稿の画像に対して行方向が誤った行
方向で行切り出しを行った場合の一例を示す図。
【図15】図2の原稿の画像に対して1回の行切り出し
処理では同程度のサイズの矩形のみを有効にする行切り
出しを行った場合の一例を示す図。
【図16】図2の原稿の画像に対して正しい行方向での
行切り出しを行った場合の一例を示す図。
【図17】図2の原稿の画像を行切り出しで段階的に文
字領域を削除した原稿の図。
【図18】文字認識装置をネットワーク接続された複数
の装置で構成する場合の構成例を示す図。
【符号の説明】
1 文字認識装置 2 CPU 3 メモリ 4 通信部 5 表示部 6 ハードディスク 7 キーボード 8 CD−ROMドライブ 9 FDドライブ 10 バス 20 文字認識装置 21 通信回線 22a、22b、22c、・・・ 装置

Claims (7)

    【特許請求の範囲】
  1. 【請求項1】少なくとも文字を含む画像に対して所定の
    画像処理を施した後、当該画像処理後の画像から文字行
    を切り出す行切り出し処理を行って、当該行切り出しを
    行った行の画像の特徴を抽出し、当該抽出した画像の特
    徴を予め各文字の特徴が格納されている画像特徴辞書と
    照合して文字認識を行う文字認識装置であって、前記行
    切り出し処理で使用する基準値を変更可能なものとし、
    当該基準値に基づいて行切り出し処理を実行することを
    特徴とする文字認識装置。
  2. 【請求項2】前記文字認識装置は、行方向を縦と横の両
    方向に仮定して、当該両方に対する行切り出し処理を実
    行することを特徴とする請求項1記載の文字認識装置。
  3. 【請求項3】前記文字認識装置は、前記基準値を段階的
    に変化させて、前記行切り出し処理を複数回実行するこ
    とを特徴とする請求項1または請求項2記載の文字認識
    装置。
  4. 【請求項4】前記文字認識装置は、前記段階的に変化さ
    せた各基準値毎に行った行切り出し処理の処理結果を統
    合して、行切り出しを行うことを特徴とする請求項3記
    載の文字認識装置。
  5. 【請求項5】前記文字認識装置は、前記段階的に変化さ
    せた各基準値毎に行った行切り出し処理の処理結果を統
    合する際、矩形範囲が重複している矩形に対しては、矩
    形面積が広い方の矩形を行として選択することを特徴と
    する請求項4記載の文字認識装置。
  6. 【請求項6】前記文字認識装置は、前記基準値毎に抽出
    した行切り出し結果に対応する行画像を削除することを
    特徴とする請求項4記載の文字認識装置。
  7. 【請求項7】情報処理装置に導入されて実行されること
    で、上記請求項1から請求項6のいずれかに記載の文字
    認識装置を構築する文字認識方法のプログラム及びデー
    タを記録していることを特徴とする記録媒体。
JP2002060405A 2002-03-06 2002-03-06 文字認識装置及び記録媒体 Pending JP2003256772A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2002060405A JP2003256772A (ja) 2002-03-06 2002-03-06 文字認識装置及び記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2002060405A JP2003256772A (ja) 2002-03-06 2002-03-06 文字認識装置及び記録媒体

Publications (1)

Publication Number Publication Date
JP2003256772A true JP2003256772A (ja) 2003-09-12

Family

ID=28669780

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2002060405A Pending JP2003256772A (ja) 2002-03-06 2002-03-06 文字認識装置及び記録媒体

Country Status (1)

Country Link
JP (1) JP2003256772A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2016038821A (ja) * 2014-08-08 2016-03-22 京セラドキュメントソリューションズ株式会社 画像処理装置
CN107220648A (zh) * 2017-04-11 2017-09-29 平安科技(深圳)有限公司 理赔单据的字符识别方法及服务器
CN109117848A (zh) * 2018-09-07 2019-01-01 泰康保险集团股份有限公司 一种文本行字符识别方法、装置、介质和电子设备
US10339657B2 (en) 2014-06-19 2019-07-02 Kabushiki Kaisha Toshiba Character detection apparatus and method

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10339657B2 (en) 2014-06-19 2019-07-02 Kabushiki Kaisha Toshiba Character detection apparatus and method
JP2016038821A (ja) * 2014-08-08 2016-03-22 京セラドキュメントソリューションズ株式会社 画像処理装置
CN107220648A (zh) * 2017-04-11 2017-09-29 平安科技(深圳)有限公司 理赔单据的字符识别方法及服务器
US10650231B2 (en) 2017-04-11 2020-05-12 Ping An Technology (Shenzhen) Co., Ltd. Method, device and server for recognizing characters of claim document, and storage medium
CN109117848A (zh) * 2018-09-07 2019-01-01 泰康保险集团股份有限公司 一种文本行字符识别方法、装置、介质和电子设备
CN109117848B (zh) * 2018-09-07 2022-11-18 泰康保险集团股份有限公司 一种文本行字符识别方法、装置、介质和电子设备

Similar Documents

Publication Publication Date Title
JPH06176188A (ja) 認識文字の情報作成方法及び装置
JP2002203207A (ja) 文字認識方法,プログラム及び記録媒体
JP5950700B2 (ja) 画像処理装置、画像処理方法及びプログラム
JP2003256772A (ja) 文字認識装置及び記録媒体
JPH0612540B2 (ja) 文書作成支援装置
US6681046B1 (en) Method and apparatus for analyzing image data, storage medium for storing software product for analyzing image data
JP2000148788A (ja) 文書画像からのタイトル領域抽出装置およびタイトル領域抽出方法,並びに文書検索方法
JP3276555B2 (ja) フォーマット認識装置及び文字読取り装置
JPH0991371A (ja) 文字表示装置
JPH0660222A (ja) 文字認識装置
JPH0728935A (ja) 文書画像処理装置
JP4109738B2 (ja) 画像処理方法及び装置及びその記憶媒体
JP2792037B2 (ja) 表および文書画像編集装置
JP2995818B2 (ja) 文字切り出し方法
JPH1166230A (ja) 文書認識装置、文書認識方法及び媒体
JPH05346974A (ja) 文字認識装置
JP2002056357A (ja) 文字認識装置、その方法および記録媒体
JP2001266070A (ja) 文字認識装置、文字認識方法および記憶媒体
JPH09269970A (ja) 文字認識方法とその装置
JP2002157550A (ja) 文字認識装置、文字認識方法、および記録媒体
CN113392285A (zh) 票单处理装置以及记录介质
JPH09212580A (ja) 文書画像処理装置
JPH04276885A (ja) 文字切出し装置
JPH11242716A (ja) 画像処理方法および記録媒体
JPH0728934A (ja) 文書画像処理装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20041224

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20050310

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20070830

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070905

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20071105

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20071219