JP2002269495A - 文字認識装置および文字認識プログラム - Google Patents
文字認識装置および文字認識プログラムInfo
- Publication number
- JP2002269495A JP2002269495A JP2001071180A JP2001071180A JP2002269495A JP 2002269495 A JP2002269495 A JP 2002269495A JP 2001071180 A JP2001071180 A JP 2001071180A JP 2001071180 A JP2001071180 A JP 2001071180A JP 2002269495 A JP2002269495 A JP 2002269495A
- Authority
- JP
- Japan
- Prior art keywords
- recognition
- target area
- area
- region
- document image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Character Input (AREA)
Abstract
原稿画像上の認識対象領域のみを精度よく効率的に読み
取れるようにする。 【解決手段】 手動で領域情報を設定する場合におい
て、原稿10のタイトル領域11を認識対象領域として
指定する場合、オペレータは、原稿10が表示されてい
るディスプレイ画面上のマウスカーソルを制御すること
により設定する。設定された領域は枠として画面に即座
に表示される。次に、原稿10のロゴ領域15を読み取
りたくない場合は、マウス・クリックによって、認識条
件として「非読取対象」が設定される。原稿10の頁番
号領域14についても同様に、頁番号が不要である場合
には「非読取対象」に設定することができる。このよう
に、各領域を手動で設定し、特定の領域については「非
読取対象」に設定することができる。これらの認識条件
を読み取って文字認識処理を実行し、読み取り結果をデ
ィスプレイ画面に表示する。
Description
よび文字認識をコンピュータに実行させるためのプログ
ラムに関し、特に原稿画像の読取領域指定における文字
認識装置および文字認識プログラムに関する。
域を指定する方式における現在の主流を考える。これ
は、自動的に対象領域を抽出する領域識別手段を用いる
方式と、手動で対象領域を用いる方式(例えば特開平5
−151387号公報)の二つであり、通常は両者を選
択できるように実現されている。確かに、読取対象画像
が一頁だけであれば、これらの手段で十分である。文字
認識処理の妨げになるのは、読取対象にならないもの
(図、ロゴ、写真など)であるが、これらは、領域とし
て選ばなければよいのである。また、入り組んで分離が
難しい場合であっても、消しゴムツールのようなもの
で、手動で除去することが可能だからである。
複数頁である場合に問題が生じる。これは、読取対象外
となるものが、複数頁に繰り返し出現することがあるか
らである。すなわち、手動での領域指定を何度も繰り返
す必要があるため、煩雑となる。また、読取対象外のも
のとして、図、ロゴ、写真などに加えて、書籍折り返し
部の黒スジ、スキャナの汚れによるノイズなどがあり得
る。また、使用者から見て読み取る必要のないものとし
て、例えば頁周辺部の頁番号などがあるが、これは使用
目的などに応じて決められるものであり、領域識別技術
の側で自動的に判定することは困難である。
用目的において、読取対象外となるべきものがあって、
これが読取精度に大きく影響するのであるが、それらを
すべて領域識別技術の側で自動的に判定することは困難
である。一方、すべての頁で手動で指定するならば、作
業が繁雑になるという問題がある。
たものであり、非読取対象領域という属性(読取条件)
を指定する機能を導入することによって、複数頁にまた
がる同一の調整作業をなくし、読取作業を容易にし、か
つ読取精度を高めることを目的としている。
めに、本発明による第1の文字認識装置においては、原
稿画像をディスプレイの画面に表示し、ディスプレイの
画面上で原稿画像における認識対象領域とその認識対象
領域の認識条件とを入力装置により決定するようにした
文字認識装置において、入力装置の指示に応じて原稿画
像における「非読取対象領域」を認識条件として設定す
る非読取対象領域設定手段を設けている。
は、原稿画像における認識対象領域とその認識対象領域
の認識条件とを領域識別手段により自動的に決定するよ
うにした文字認識装置において、入力装置の指示に応じ
て原稿画像における「非読取対象領域」を認識条件とし
て設定する非読取対象領域設定手段を設けている。
は、原稿画像をディスプレイの画面に表示し、ディスプ
レイの画面上で原稿画像における認識対象領域とその認
識対象領域の認識条件とを入力装置により決定する決定
処理と、入力装置の指示に応じて原稿画像における「非
読取対象領域」を認識条件として設定する非読取対象領
域設定処理とをコンピュータに実行させるようにしてい
る。
は、原稿画像における認識対象領域とその認識対象領域
の認識条件を自動的に決定する領域識別処理と、入力装
置の指示に応じて原稿画像における「非読取対象領域」
を認識条件として設定する非読取対象領域設定処理とを
コンピュータに実行させるようにしている。
ともに説明する。図1は本発明の実施形態による光学的
文字認識システムの全体的構成を示す。本システムはス
キャナ1、ディスプレイ2、キーボード3、マウス4、
文字認識装置100等を有して構成されている。また、
文字認識装置100は制御部5、認識対象領域指定部
6、領域識別部7、領域条件記憶部8、文字認識部9等
を有している。制御部5、は認識対象領域指定部6、領
域識別部7、領域条件記憶部8、および文字認識部9の
制御を行い、スキャナ1、ディスプレイ2、キーボード
3、およびマウス4との橋渡しをする部分である。
ナ1によって読み取られ、制御部5を介して文字認識装
置100に入力され、ディスプレイ2に表示される。認
識対象領域指定部6は、オペレータとの対話的処理によ
って認識対象領域(矩形領域)の始終点座標と、認識対
象領域に関する認識条件とを決定し、領域条件記憶部8
に記憶する。認識条件とは、文字列の行方向、文字方
向、文字種、文字サイズ、対象/非対象などのことであ
る。あるいは、領域識別部7によって、自動的に認識対
象領域と条件とを決定し、これを領域条件記憶部8に記
憶するようにしてもよい。文字認識部9は、領域条件記
憶部8に指定された認識対象領域毎に、指定された認識
条件によって認識処理を実行する。
に示すような原稿10を処理対象として、これをスキャ
ナ1により読み取り、この原稿10のタイトル領域1
1、テキスト文字列領域12および13、頁番号領域1
4、およびロゴ領域15を抽出し、その認識条件を設定
するものとする。図2において、タイトル領域11は、
やや文字が大きめなタイトル領域(テキスト文字列)と
する。テキスト文字列領域12および13は通常のテキ
スト文字列の領域とする。頁番号領域14は頁番号と
し、認識対象から除きたいものであるとする。ロゴ領域
15のロゴもまた、認識対象から除きたいものであると
する。
本実施形態は、手動で領域情報を設定する場合であると
する。このときの処理の流れは、図4に示す通りであ
る。同図は一つの領域に対する処理の流れである。原稿
10のタイトル領域11を指定する場合、オペレータ
は、原稿10のイメージが表示されているディスプレイ
2の画面上のマウスカーソルを制御して、タイトル領域
11の左上角である始点に移動させ、そこでマウスボタ
ンを押す。認識対象領域指定部6は、その動作を検出す
る(S101)と、その時点でのマウスカーソル座標を
領域の始点座標として設定(S102)する。
まま移動(ドラッグ)させ、マウスカーソルがテキスト
文字列領域12の右下角である終点に合わせて、マウス
ボタンを離す。認識対象領域指定部6は、マウスボタン
が離されたことを検出する(S103)と、その時点で
のマウスカーソル座標を領域の終点座標として設定(S
104)する。これで一つの対象領域について、その座
標値が設定されたことになる。
(デフォルト値)を用いて、すべての認識条件が初期的
に設定される。既定値は、他のメニューなどから設定で
きるようになっている。また、指定領域は枠として画面
に即座に表示されるものとする。これは後述の各実施形
態においても同様である。
なかで行方向を主に表示したタグが表示されている。こ
れは、マウス・クリックによってサイクリック(循環
的)に変更される。デフォルト(既定値)では横方向で
あり、マウス・クリックによって縦方向、さらに「非読
取対象」に変更される。図3は、原稿10のロゴ領域1
5についてであり、2回のクリックによって、認識条件
に「非読取対象」が設定される(S106からS10
7)。
に、頁番号が不要である場合には「非読取対象」に設定
することができる。このように、各領域を手動で設定
し、特定の領域については「非読取対象」に設定するこ
とができる。
記憶される。文字認識部9は、この条件を読み取って文
字認識処理を実行し、結果をディスプレイ2に表示す
る。
本実施の形態は、領域識別部7によって領域情報を自動
設定したのちに、認識条件を変更する場合であるとす
る。このときの処理の流れは、図5に示す通りである。
スキャナ1から原稿10が読み込まれた場合、オペレー
タは、まず図示されない領域識別ボタンをクリックす
る。このクリックに反応して、領域識別部7は原稿全体
に対する領域識別処理を実行する(S201)。このと
き、それぞれの領域情報に関し、既定値(デフォルト
値)または領域識別結果を用いて、すべての認識条件が
自動設定される。
ロゴ領域15とを非読取対象としたいわけであるから、
それぞれの領域に対して、第1の実施形態と同様の方法
により、行方向タグをマウス・クリックすることによっ
て領域条件を、「非読取対象」に変更することができ
る。図3は、原稿10のロゴ領域15についてであり、
2回のクリックによって、認識条件に「非読取対象」が
設定される(S203からS204)。これらの処理は
認識条件を変更する必要な回数だけ(S202)繰り返
される。
記憶される。文字認識部9は、この条件を読み取って文
字認識処理を実行し、結果をディスプレイ2に表示す
る。
本実施形態は、第1の実施形態と第2の実施形態との併
用を実現するものである。すなわち、第1の実施形態の
方法で「非読取対象」だけをあらかじめ指定したうえ
で、第2の実施形態のように領域識別部7による領域情
報の自動設定するというアプローチになる。このときの
処理の流れは、図6に示す通りである。この場合の原稿
としては、原稿10と同じ形式のものが複数頁であると
仮定する。
1枚目)を取り出して、第1の実施形態の方法により、
手動で「非読取対象領域」を設定する(S301)。こ
れらは、他の頁でも適用されるものとして、領域条件記
憶部8に設定される。
まず頁を取り出して(S302)、「非読取対象領域」
を除去(あるいはマスク)する(S304)。続いて、
第2の実施形態と同様に領域識別処理を実行する(S3
05)。このようにすることで、領域識別処理の対象か
ら除外することができるので、原稿10のタイトル領域
11とロゴ領域15とのように入り組んでいた場合でも
正しく領域を切り出すことが可能となる。
域条件記憶部8に記憶される。文字認識部9は、この条
件を読み取って当該頁に対する文字認識処理を実行(S
306)する。
して実現することもできる。図7は一般的な計算機の構
成図である。CD−ROMなどの記録媒体27に記録さ
れたプログラムは、ドライバ26を通じて補助記憶装置
に読み込まれる。計算機の動作を制御するCPU22
が、補助記憶装置24や記憶装置23との間で情報をや
り取りしながら、プログラムの各ステップを実行する。
なお、21は入力I/F、25は出力I/F、28はコ
ントローラである。このような構成のもとに、請求項1
から3に記載の発明をソフトウェアとして実現すること
が可能であり、これが請求項4から6に記載の発明であ
る。
字認識装置および文字認識プログラムよれば、認識条件
として「非読取対象領域」を設定する手段を設けたこと
ことにより、特に複数頁にわたる同一形式の原稿におけ
る領域指定の操作を簡略化し、かつ認識精度を高める認
識対象領域指定方式による文字認識装置および文字認識
プログラム提供することができる。
識システムの構成を示すブロック図である。
説明する構成図である。
の処理の流れを示すフローチャートである。
別手段使用時の処理の流れを示すフローチャートであ
る。
領域識別手段との併用時の処理の流れを示すフローチャ
ートである。
る。
Claims (6)
- 【請求項1】 原稿画像をディスプレイの画面に表示
し、該ディスプレイの画面上で前記原稿画像における認
識対象領域と該認識対象領域の認識条件とを入力装置に
より決定するようにした文字認識装置において、 前記入力装置の指示に応じて前記原稿画像における「非
読取対象領域」を前記認識条件として設定する非読取対
象領域設定手段を設けたことを特徴とする文字認識装
置。 - 【請求項2】 原稿画像における認識対象領域と該認識
対象領域の認識条件を領域識別手段により自動的に決定
するようにした文字認識装置において、 入力装置の指示に応じて前記原稿画像における「非読取
対象領域」を前記認識条件として設定する非読取対象領
域設定手段を設けたことを特徴とする文字認識装置。 - 【請求項3】 前記原稿画像が複数頁のとき、前記領域
識別手段は、前記非読取対象領域設定手段により設定さ
れた前記非読取対象領域を前記原稿画像から除去した
後、該原稿画像の頁毎に前記認識対象領域を決定するこ
とを特徴とする請求項2記載の文字認識装置。 - 【請求項4】 原稿画像をディスプレイの画面に表示
し、該ディスプレイの画面上で前記原稿画像における認
識対象領域と該認識対象領域の認識条件とを入力装置に
より決定する決定処理と、 前記入力装置の指示に応じて前記原稿画像における「非
読取対象領域」を前記認識条件として設定する非読取対
象領域設定処理とをコンピュータに実行させることを特
徴とするプログラム。 - 【請求項5】 原稿画像における認識対象領域と該認識
対象領域の認識条件を自動的に決定する領域識別処理
と、 入力装置の指示に応じて前記原稿画像における「非読取
対象領域」を前記認識条件として設定する非読取対象領
域設定処理とをコンピュータに実行させることを特徴と
するプログラム。 - 【請求項6】 前記原稿画像が複数頁のとき、前記領域
識別処理は、前記非読取対象領域設定処理により設定さ
れた前記非読取対象領域を前記原稿画像から除去した
後、該原稿画像の頁毎に前記認識対象領域を決定するこ
とを特徴とする請求項5記載のプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001071180A JP2002269495A (ja) | 2001-03-13 | 2001-03-13 | 文字認識装置および文字認識プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001071180A JP2002269495A (ja) | 2001-03-13 | 2001-03-13 | 文字認識装置および文字認識プログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2002269495A true JP2002269495A (ja) | 2002-09-20 |
Family
ID=18928940
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2001071180A Pending JP2002269495A (ja) | 2001-03-13 | 2001-03-13 | 文字認識装置および文字認識プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2002269495A (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070195378A1 (en) * | 2006-02-21 | 2007-08-23 | Brother Kogyo Kabushiki Kaisha | Image-reading device |
US7486821B2 (en) | 2003-06-10 | 2009-02-03 | Samsung Electronics Co., Ltd. | Method for recognizing characters in a portable terminal having an image input unit |
JP2012093866A (ja) * | 2010-10-26 | 2012-05-17 | Rubic Jp:Kk | 手書きデータの清書テキスト化システム |
-
2001
- 2001-03-13 JP JP2001071180A patent/JP2002269495A/ja active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7486821B2 (en) | 2003-06-10 | 2009-02-03 | Samsung Electronics Co., Ltd. | Method for recognizing characters in a portable terminal having an image input unit |
US20070195378A1 (en) * | 2006-02-21 | 2007-08-23 | Brother Kogyo Kabushiki Kaisha | Image-reading device |
US8849033B2 (en) | 2006-02-21 | 2014-09-30 | Brother Kogyo Kabushiki Kaisha | Image-reading device |
JP2012093866A (ja) * | 2010-10-26 | 2012-05-17 | Rubic Jp:Kk | 手書きデータの清書テキスト化システム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4807999B2 (ja) | 画像表示装置、画像表示方法、画像形成装置、画像形成方法、および、それらの方法をコンピュータに実行させるプログラム | |
JP2007041866A (ja) | 情報処理装置及び情報処理方法並びにプログラム | |
JPH11272871A (ja) | 文書画像処理装置、文書画像処理方法、及び記録媒体 | |
JP4138231B2 (ja) | 複合ユーザーインタフェース方法、コンピュータシステム及びコンピュータ読み取り可能な記録媒体 | |
US6504540B1 (en) | Method and apparatus for altering one or more attributes of one or more blocks of image data in a document | |
JP2002269495A (ja) | 文字認識装置および文字認識プログラム | |
JP4305325B2 (ja) | 付箋情報処理方法、付箋情報処理システム及び付箋情報処理プログラム | |
JPH0883331A (ja) | 画像処理装置 | |
JP4631261B2 (ja) | 撮影画像投影装置、その画像処理方法及びプログラム | |
JP3897772B2 (ja) | ファイル名作成装置及びファイル名作成プログラム | |
JP4501731B2 (ja) | 画像処理装置 | |
JP3171626B2 (ja) | 文字認識の処理領域・処理条件指定方法 | |
JPH03276260A (ja) | 文字コードのタイトル処理機能を備えた電子フアイリング装置 | |
JP2001005911A (ja) | 文字入力装置及び表示制御方法 | |
US9912834B2 (en) | Document camera device and cutout assistance method | |
JP2020150364A (ja) | 情報処理システム、情報処理装置およびプログラム | |
JP4756149B2 (ja) | フォトアルバム作成システム及びフォトアルバム作成コンピュータプログラム | |
JPH06149465A (ja) | 手書き入力装置 | |
JP3761923B2 (ja) | 画像処理装置及び方法 | |
JP6680203B2 (ja) | 編集支援装置及び編集支援方法 | |
JPH1055431A (ja) | 画像処理装置 | |
JP4155059B2 (ja) | 電子黒板システム | |
JPH07302322A (ja) | 画像表示装置 | |
JP2635312B2 (ja) | 画像処理装置 | |
JPH1185733A (ja) | 文書編集装置及びその文書編集方法並びに記録媒体 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20060327 |
|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20060420 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20081016 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20081021 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20081218 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20090303 |