JP2002269495A - 文字認識装置および文字認識プログラム - Google Patents

文字認識装置および文字認識プログラム

Info

Publication number
JP2002269495A
JP2002269495A JP2001071180A JP2001071180A JP2002269495A JP 2002269495 A JP2002269495 A JP 2002269495A JP 2001071180 A JP2001071180 A JP 2001071180A JP 2001071180 A JP2001071180 A JP 2001071180A JP 2002269495 A JP2002269495 A JP 2002269495A
Authority
JP
Japan
Prior art keywords
recognition
target area
area
region
document image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2001071180A
Other languages
English (en)
Inventor
Toshihiro Suzuki
俊博 鈴木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2001071180A priority Critical patent/JP2002269495A/ja
Publication of JP2002269495A publication Critical patent/JP2002269495A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Character Input (AREA)

Abstract

(57)【要約】 【課題】 複数頁の原稿画像をスキャナで読取る場合、
原稿画像上の認識対象領域のみを精度よく効率的に読み
取れるようにする。 【解決手段】 手動で領域情報を設定する場合におい
て、原稿10のタイトル領域11を認識対象領域として
指定する場合、オペレータは、原稿10が表示されてい
るディスプレイ画面上のマウスカーソルを制御すること
により設定する。設定された領域は枠として画面に即座
に表示される。次に、原稿10のロゴ領域15を読み取
りたくない場合は、マウス・クリックによって、認識条
件として「非読取対象」が設定される。原稿10の頁番
号領域14についても同様に、頁番号が不要である場合
には「非読取対象」に設定することができる。このよう
に、各領域を手動で設定し、特定の領域については「非
読取対象」に設定することができる。これらの認識条件
を読み取って文字認識処理を実行し、読み取り結果をデ
ィスプレイ画面に表示する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、文字認識装置、お
よび文字認識をコンピュータに実行させるためのプログ
ラムに関し、特に原稿画像の読取領域指定における文字
認識装置および文字認識プログラムに関する。
【0002】
【従来の技術】文字認識装置における認識対象となる領
域を指定する方式における現在の主流を考える。これ
は、自動的に対象領域を抽出する領域識別手段を用いる
方式と、手動で対象領域を用いる方式(例えば特開平5
−151387号公報)の二つであり、通常は両者を選
択できるように実現されている。確かに、読取対象画像
が一頁だけであれば、これらの手段で十分である。文字
認識処理の妨げになるのは、読取対象にならないもの
(図、ロゴ、写真など)であるが、これらは、領域とし
て選ばなければよいのである。また、入り組んで分離が
難しい場合であっても、消しゴムツールのようなもの
で、手動で除去することが可能だからである。
【0003】
【発明が解決しようとする課題】ところが、読取対象が
複数頁である場合に問題が生じる。これは、読取対象外
となるものが、複数頁に繰り返し出現することがあるか
らである。すなわち、手動での領域指定を何度も繰り返
す必要があるため、煩雑となる。また、読取対象外のも
のとして、図、ロゴ、写真などに加えて、書籍折り返し
部の黒スジ、スキャナの汚れによるノイズなどがあり得
る。また、使用者から見て読み取る必要のないものとし
て、例えば頁周辺部の頁番号などがあるが、これは使用
目的などに応じて決められるものであり、領域識別技術
の側で自動的に判定することは困難である。
【0004】このように、本来的な意味で、あるいは使
用目的において、読取対象外となるべきものがあって、
これが読取精度に大きく影響するのであるが、それらを
すべて領域識別技術の側で自動的に判定することは困難
である。一方、すべての頁で手動で指定するならば、作
業が繁雑になるという問題がある。
【0005】本発明は、このような状況に鑑みてなされ
たものであり、非読取対象領域という属性(読取条件)
を指定する機能を導入することによって、複数頁にまた
がる同一の調整作業をなくし、読取作業を容易にし、か
つ読取精度を高めることを目的としている。
【0006】
【課題を解決するための手段】上記の目的を達成するた
めに、本発明による第1の文字認識装置においては、原
稿画像をディスプレイの画面に表示し、ディスプレイの
画面上で原稿画像における認識対象領域とその認識対象
領域の認識条件とを入力装置により決定するようにした
文字認識装置において、入力装置の指示に応じて原稿画
像における「非読取対象領域」を認識条件として設定す
る非読取対象領域設定手段を設けている。
【0007】本発明による第2の文字認識装置において
は、原稿画像における認識対象領域とその認識対象領域
の認識条件とを領域識別手段により自動的に決定するよ
うにした文字認識装置において、入力装置の指示に応じ
て原稿画像における「非読取対象領域」を認識条件とし
て設定する非読取対象領域設定手段を設けている。
【0008】本発明による第1の文字認識プログラム
は、原稿画像をディスプレイの画面に表示し、ディスプ
レイの画面上で原稿画像における認識対象領域とその認
識対象領域の認識条件とを入力装置により決定する決定
処理と、入力装置の指示に応じて原稿画像における「非
読取対象領域」を認識条件として設定する非読取対象領
域設定処理とをコンピュータに実行させるようにしてい
る。
【0009】本発明による第2の文字認識プログラム
は、原稿画像における認識対象領域とその認識対象領域
の認識条件を自動的に決定する領域識別処理と、入力装
置の指示に応じて原稿画像における「非読取対象領域」
を認識条件として設定する非読取対象領域設定処理とを
コンピュータに実行させるようにしている。
【0010】
【発明の実施の形態】以下、本発明の実施形態を図面と
ともに説明する。図1は本発明の実施形態による光学的
文字認識システムの全体的構成を示す。本システムはス
キャナ1、ディスプレイ2、キーボード3、マウス4、
文字認識装置100等を有して構成されている。また、
文字認識装置100は制御部5、認識対象領域指定部
6、領域識別部7、領域条件記憶部8、文字認識部9等
を有している。制御部5、は認識対象領域指定部6、領
域識別部7、領域条件記憶部8、および文字認識部9の
制御を行い、スキャナ1、ディスプレイ2、キーボード
3、およびマウス4との橋渡しをする部分である。
【0011】処理対象画像(文書・帳票等)は、スキャ
ナ1によって読み取られ、制御部5を介して文字認識装
置100に入力され、ディスプレイ2に表示される。認
識対象領域指定部6は、オペレータとの対話的処理によ
って認識対象領域(矩形領域)の始終点座標と、認識対
象領域に関する認識条件とを決定し、領域条件記憶部8
に記憶する。認識条件とは、文字列の行方向、文字方
向、文字種、文字サイズ、対象/非対象などのことであ
る。あるいは、領域識別部7によって、自動的に認識対
象領域と条件とを決定し、これを領域条件記憶部8に記
憶するようにしてもよい。文字認識部9は、領域条件記
憶部8に指定された認識対象領域毎に、指定された認識
条件によって認識処理を実行する。
【0012】以下の各実施形態の説明においては、図2
に示すような原稿10を処理対象として、これをスキャ
ナ1により読み取り、この原稿10のタイトル領域1
1、テキスト文字列領域12および13、頁番号領域1
4、およびロゴ領域15を抽出し、その認識条件を設定
するものとする。図2において、タイトル領域11は、
やや文字が大きめなタイトル領域(テキスト文字列)と
する。テキスト文字列領域12および13は通常のテキ
スト文字列の領域とする。頁番号領域14は頁番号と
し、認識対象から除きたいものであるとする。ロゴ領域
15のロゴもまた、認識対象から除きたいものであると
する。
【0013】次に、第1の実施形態について説明する。
本実施形態は、手動で領域情報を設定する場合であると
する。このときの処理の流れは、図4に示す通りであ
る。同図は一つの領域に対する処理の流れである。原稿
10のタイトル領域11を指定する場合、オペレータ
は、原稿10のイメージが表示されているディスプレイ
2の画面上のマウスカーソルを制御して、タイトル領域
11の左上角である始点に移動させ、そこでマウスボタ
ンを押す。認識対象領域指定部6は、その動作を検出す
る(S101)と、その時点でのマウスカーソル座標を
領域の始点座標として設定(S102)する。
【0014】次にオペレータは、マウスボタンを押した
まま移動(ドラッグ)させ、マウスカーソルがテキスト
文字列領域12の右下角である終点に合わせて、マウス
ボタンを離す。認識対象領域指定部6は、マウスボタン
が離されたことを検出する(S103)と、その時点で
のマウスカーソル座標を領域の終点座標として設定(S
104)する。これで一つの対象領域について、その座
標値が設定されたことになる。
【0015】座標値を除く領域情報については、既定値
(デフォルト値)を用いて、すべての認識条件が初期的
に設定される。既定値は、他のメニューなどから設定で
きるようになっている。また、指定領域は枠として画面
に即座に表示されるものとする。これは後述の各実施形
態においても同様である。
【0016】本実施形態では、図3のように認識条件の
なかで行方向を主に表示したタグが表示されている。こ
れは、マウス・クリックによってサイクリック(循環
的)に変更される。デフォルト(既定値)では横方向で
あり、マウス・クリックによって縦方向、さらに「非読
取対象」に変更される。図3は、原稿10のロゴ領域1
5についてであり、2回のクリックによって、認識条件
に「非読取対象」が設定される(S106からS10
7)。
【0017】原稿10の頁番号領域14についても同様
に、頁番号が不要である場合には「非読取対象」に設定
することができる。このように、各領域を手動で設定
し、特定の領域については「非読取対象」に設定するこ
とができる。
【0018】これらの認識条件が、領域条件記憶部8に
記憶される。文字認識部9は、この条件を読み取って文
字認識処理を実行し、結果をディスプレイ2に表示す
る。
【0019】次に、第2の実施形態について説明する。
本実施の形態は、領域識別部7によって領域情報を自動
設定したのちに、認識条件を変更する場合であるとす
る。このときの処理の流れは、図5に示す通りである。
スキャナ1から原稿10が読み込まれた場合、オペレー
タは、まず図示されない領域識別ボタンをクリックす
る。このクリックに反応して、領域識別部7は原稿全体
に対する領域識別処理を実行する(S201)。このと
き、それぞれの領域情報に関し、既定値(デフォルト
値)または領域識別結果を用いて、すべての認識条件が
自動設定される。
【0020】ここで、オペレータは、頁番号領域14と
ロゴ領域15とを非読取対象としたいわけであるから、
それぞれの領域に対して、第1の実施形態と同様の方法
により、行方向タグをマウス・クリックすることによっ
て領域条件を、「非読取対象」に変更することができ
る。図3は、原稿10のロゴ領域15についてであり、
2回のクリックによって、認識条件に「非読取対象」が
設定される(S203からS204)。これらの処理は
認識条件を変更する必要な回数だけ(S202)繰り返
される。
【0021】これらの認識条件が、領域条件記憶部8に
記憶される。文字認識部9は、この条件を読み取って文
字認識処理を実行し、結果をディスプレイ2に表示す
る。
【0022】次に、第3の実施形態について説明する。
本実施形態は、第1の実施形態と第2の実施形態との併
用を実現するものである。すなわち、第1の実施形態の
方法で「非読取対象」だけをあらかじめ指定したうえ
で、第2の実施形態のように領域識別部7による領域情
報の自動設定するというアプローチになる。このときの
処理の流れは、図6に示す通りである。この場合の原稿
としては、原稿10と同じ形式のものが複数頁であると
仮定する。
【0023】オペレータは、まず代表的な原稿(例えば
1枚目)を取り出して、第1の実施形態の方法により、
手動で「非読取対象領域」を設定する(S301)。こ
れらは、他の頁でも適用されるものとして、領域条件記
憶部8に設定される。
【0024】以下の処理は、頁数分だけ繰り返される。
まず頁を取り出して(S302)、「非読取対象領域」
を除去(あるいはマスク)する(S304)。続いて、
第2の実施形態と同様に領域識別処理を実行する(S3
05)。このようにすることで、領域識別処理の対象か
ら除外することができるので、原稿10のタイトル領域
11とロゴ領域15とのように入り組んでいた場合でも
正しく領域を切り出すことが可能となる。
【0025】領域識別の結果は、認識条件とともに、領
域条件記憶部8に記憶される。文字認識部9は、この条
件を読み取って当該頁に対する文字認識処理を実行(S
306)する。
【0026】次に、本発明は計算機上のソフトウェアと
して実現することもできる。図7は一般的な計算機の構
成図である。CD−ROMなどの記録媒体27に記録さ
れたプログラムは、ドライバ26を通じて補助記憶装置
に読み込まれる。計算機の動作を制御するCPU22
が、補助記憶装置24や記憶装置23との間で情報をや
り取りしながら、プログラムの各ステップを実行する。
なお、21は入力I/F、25は出力I/F、28はコ
ントローラである。このような構成のもとに、請求項1
から3に記載の発明をソフトウェアとして実現すること
が可能であり、これが請求項4から6に記載の発明であ
る。
【0027】
【発明の効果】以上説明したように本発明を適用した文
字認識装置および文字認識プログラムよれば、認識条件
として「非読取対象領域」を設定する手段を設けたこと
ことにより、特に複数頁にわたる同一形式の原稿におけ
る領域指定の操作を簡略化し、かつ認識精度を高める認
識対象領域指定方式による文字認識装置および文字認識
プログラム提供することができる。
【図面の簡単な説明】
【図1】本発明を適用した実施形態による光学的文字認
識システムの構成を示すブロック図である。
【図2】読み取られる原稿の例を示す構成図である。
【図3】原稿上におけるロゴを例とする認識条件変更を
説明する構成図である。
【図4】本発明を適用した第1の実施形態による手動時
の処理の流れを示すフローチャートである。
【図5】本発明を適用した第2の実施形態による領域識
別手段使用時の処理の流れを示すフローチャートであ
る。
【図6】本発明を適用した第3の実施形態による手動と
領域識別手段との併用時の処理の流れを示すフローチャ
ートである。
【図7】一般的な計算機の構成を示すブロック図であ
る。
【符号の説明】
1 スキャナ 2 ディスプレイ 3 キーボード 4 マウス 5 制御部 6 認識対象領域指定部 7 領域識別部 8 領域条件記憶部 9 文字認識部 10 原稿 11 タイトル領域 12、13 テキスト文字列領域 14 頁番号領域 15 ロゴ領域 100 文字認識装置

Claims (6)

    【特許請求の範囲】
  1. 【請求項1】 原稿画像をディスプレイの画面に表示
    し、該ディスプレイの画面上で前記原稿画像における認
    識対象領域と該認識対象領域の認識条件とを入力装置に
    より決定するようにした文字認識装置において、 前記入力装置の指示に応じて前記原稿画像における「非
    読取対象領域」を前記認識条件として設定する非読取対
    象領域設定手段を設けたことを特徴とする文字認識装
    置。
  2. 【請求項2】 原稿画像における認識対象領域と該認識
    対象領域の認識条件を領域識別手段により自動的に決定
    するようにした文字認識装置において、 入力装置の指示に応じて前記原稿画像における「非読取
    対象領域」を前記認識条件として設定する非読取対象領
    域設定手段を設けたことを特徴とする文字認識装置。
  3. 【請求項3】 前記原稿画像が複数頁のとき、前記領域
    識別手段は、前記非読取対象領域設定手段により設定さ
    れた前記非読取対象領域を前記原稿画像から除去した
    後、該原稿画像の頁毎に前記認識対象領域を決定するこ
    とを特徴とする請求項2記載の文字認識装置。
  4. 【請求項4】 原稿画像をディスプレイの画面に表示
    し、該ディスプレイの画面上で前記原稿画像における認
    識対象領域と該認識対象領域の認識条件とを入力装置に
    より決定する決定処理と、 前記入力装置の指示に応じて前記原稿画像における「非
    読取対象領域」を前記認識条件として設定する非読取対
    象領域設定処理とをコンピュータに実行させることを特
    徴とするプログラム。
  5. 【請求項5】 原稿画像における認識対象領域と該認識
    対象領域の認識条件を自動的に決定する領域識別処理
    と、 入力装置の指示に応じて前記原稿画像における「非読取
    対象領域」を前記認識条件として設定する非読取対象領
    域設定処理とをコンピュータに実行させることを特徴と
    するプログラム。
  6. 【請求項6】 前記原稿画像が複数頁のとき、前記領域
    識別処理は、前記非読取対象領域設定処理により設定さ
    れた前記非読取対象領域を前記原稿画像から除去した
    後、該原稿画像の頁毎に前記認識対象領域を決定するこ
    とを特徴とする請求項5記載のプログラム。
JP2001071180A 2001-03-13 2001-03-13 文字認識装置および文字認識プログラム Pending JP2002269495A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001071180A JP2002269495A (ja) 2001-03-13 2001-03-13 文字認識装置および文字認識プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001071180A JP2002269495A (ja) 2001-03-13 2001-03-13 文字認識装置および文字認識プログラム

Publications (1)

Publication Number Publication Date
JP2002269495A true JP2002269495A (ja) 2002-09-20

Family

ID=18928940

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001071180A Pending JP2002269495A (ja) 2001-03-13 2001-03-13 文字認識装置および文字認識プログラム

Country Status (1)

Country Link
JP (1) JP2002269495A (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070195378A1 (en) * 2006-02-21 2007-08-23 Brother Kogyo Kabushiki Kaisha Image-reading device
US7486821B2 (en) 2003-06-10 2009-02-03 Samsung Electronics Co., Ltd. Method for recognizing characters in a portable terminal having an image input unit
JP2012093866A (ja) * 2010-10-26 2012-05-17 Rubic Jp:Kk 手書きデータの清書テキスト化システム

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7486821B2 (en) 2003-06-10 2009-02-03 Samsung Electronics Co., Ltd. Method for recognizing characters in a portable terminal having an image input unit
US20070195378A1 (en) * 2006-02-21 2007-08-23 Brother Kogyo Kabushiki Kaisha Image-reading device
US8849033B2 (en) 2006-02-21 2014-09-30 Brother Kogyo Kabushiki Kaisha Image-reading device
JP2012093866A (ja) * 2010-10-26 2012-05-17 Rubic Jp:Kk 手書きデータの清書テキスト化システム

Similar Documents

Publication Publication Date Title
JP4807999B2 (ja) 画像表示装置、画像表示方法、画像形成装置、画像形成方法、および、それらの方法をコンピュータに実行させるプログラム
JP2007041866A (ja) 情報処理装置及び情報処理方法並びにプログラム
JPH11272871A (ja) 文書画像処理装置、文書画像処理方法、及び記録媒体
JP4138231B2 (ja) 複合ユーザーインタフェース方法、コンピュータシステム及びコンピュータ読み取り可能な記録媒体
US6504540B1 (en) Method and apparatus for altering one or more attributes of one or more blocks of image data in a document
JP2002269495A (ja) 文字認識装置および文字認識プログラム
JP4305325B2 (ja) 付箋情報処理方法、付箋情報処理システム及び付箋情報処理プログラム
JPH0883331A (ja) 画像処理装置
JP4631261B2 (ja) 撮影画像投影装置、その画像処理方法及びプログラム
JP3897772B2 (ja) ファイル名作成装置及びファイル名作成プログラム
JP4501731B2 (ja) 画像処理装置
JP3171626B2 (ja) 文字認識の処理領域・処理条件指定方法
JPH03276260A (ja) 文字コードのタイトル処理機能を備えた電子フアイリング装置
JP2001005911A (ja) 文字入力装置及び表示制御方法
US9912834B2 (en) Document camera device and cutout assistance method
JP2020150364A (ja) 情報処理システム、情報処理装置およびプログラム
JP4756149B2 (ja) フォトアルバム作成システム及びフォトアルバム作成コンピュータプログラム
JPH06149465A (ja) 手書き入力装置
JP3761923B2 (ja) 画像処理装置及び方法
JP6680203B2 (ja) 編集支援装置及び編集支援方法
JPH1055431A (ja) 画像処理装置
JP4155059B2 (ja) 電子黒板システム
JPH07302322A (ja) 画像表示装置
JP2635312B2 (ja) 画像処理装置
JPH1185733A (ja) 文書編集装置及びその文書編集方法並びに記録媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060327

RD02 Notification of acceptance of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7422

Effective date: 20060420

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20081016

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20081021

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20081218

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20090303