JP2002049890A - 画像認識装置、画像認識方法および画像認識プログラムを記録したコンピュータ読取可能な記録媒体 - Google Patents

画像認識装置、画像認識方法および画像認識プログラムを記録したコンピュータ読取可能な記録媒体

Info

Publication number
JP2002049890A
JP2002049890A JP2000233485A JP2000233485A JP2002049890A JP 2002049890 A JP2002049890 A JP 2002049890A JP 2000233485 A JP2000233485 A JP 2000233485A JP 2000233485 A JP2000233485 A JP 2000233485A JP 2002049890 A JP2002049890 A JP 2002049890A
Authority
JP
Japan
Prior art keywords
character
image
data
character code
image data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2000233485A
Other languages
English (en)
Inventor
Yoko Fujiwara
葉子 藤原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Minolta Co Ltd
Original Assignee
Minolta Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Minolta Co Ltd filed Critical Minolta Co Ltd
Priority to JP2000233485A priority Critical patent/JP2002049890A/ja
Publication of JP2002049890A publication Critical patent/JP2002049890A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Processing Or Creating Images (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】 【課題】 画像データ中の文字画像を文字コードとして
認識し、文字コードデータに変換した上でファイルを作
成する画像認識装置において、ファイル容量の増大を抑
えつつ、かつ画像データの情報を確保する。 【解決手段】 出力形式判定部は、画像データ中の注目
単語内に文字認識確度Cが所定の閾値Th2以下となる文
字画像が含まれている場合には(S23:NO)、注目
単語内の全文字画像を文字コードデータおよび文字画像
データの双方で出力する旨の出力形式の判定を行う(S
24)。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、画像認識技術に関
し、特に、画像データ中の文字画像を文字コードとして
認識して文字コードデータに変換した上でファイルを作
成する画像認識技術に関する。
【0002】
【従来の技術】最近の画像認識装置は、読取に関する条
件の良い原稿(例えば同一フォントの文字のみで構成さ
れた原稿)であれば、極めて高い精度で文字画像を文字
コードとして認識可能である。
【0003】
【発明が解決しようとする課題】しかしながら、原稿上
の文字の品質が悪かったり、原稿上の文字等のレイアウ
トが複雑であると、文字画像を文字コードとして認識す
る認識精度が大きく低下し、誤認識される文字画像が増
加してしまう。
【0004】このような問題に対し、原稿を読み取って
得られた画像データのすべてを、文字画像から変換され
た文字コードデータとともに保存するシステムが知られ
ている。しかし、文字コードデータのほかに、画像デー
タのすべてを含むファイルの容量は、当然ながら大幅に
増えてしまう。
【0005】本発明の目的は、画像データ中の文字画像
を文字コードとして認識し、文字コードデータに変換し
た上でファイルを作成する画像認識装置において、ファ
イル容量の増大を抑えつつ、かつ画像データの情報を確
保することである。
【0006】
【課題を解決するための手段】本発明の目的は、下記す
る手段により達成される。
【0007】(1) 画像認識装置において、画像デー
タ中の文字画像から文字コードを認識する文字コード認
識手段と、文字コードを認識した確からしさの度合いで
ある文字認識確度を検出する文字認識確度検出手段と、
文字コードが認識された文字画像を文字コードデータに
変換して出力する文字コードデータ出力手段と、文字認
識確度に応じて、文字コードデータに対し文字画像デー
タを出力するか否かを判定する判定手段と、を有するこ
とを特徴とする画像認識装置。
【0008】(2) 前記判定手段は、文字コードデー
タに対する文字認識確度が所定値より小さいときに、文
字画像データを出力すると判定することを特徴とする上
記(1)に記載の画像認識装置。
【0009】(3) 前記文字画像は、単語を形成して
いることを特徴とする上記(1)または(2)に記載の
画像認識装置。
【0010】(4) 前記単語の中に、文字認識確度が
所定確度より低い文字画像が含まれるか否かを検出する
低確度文字画像検出手段をさらに有し、文字コードが認
識された単語内に低確度文字画像が含まれている場合、
前記判定手段は、当該単語全体に対し文字画像データを
出力すると判定することを特徴とする上記(3)に記載
の画像認識装置。
【0011】(5) 文字コードが認識された文字画像
についての、近隣の文字画像との連続性の度合いである
文字連続性度を検出する文字連続性度検出手段をさらに
有し、前記判定手段は、文字認識確度と文字連続性度と
に基づいて前記判定を行うことを特徴とする上記(1)
〜(4)のいずれかに記載の画像認識装置。
【0012】(6) 前記判定手段の判定結果にしたが
って所定の形式の電子ファイルを作成するファイル作成
部をさらに有し、前記ファイル作成部は、出力時に文字
画像データが見えて当該文字画像データに対応する文字
コードデータが見えない形で、両データをファイル内に
配置することを特徴とする上記(1)〜(5)のいずれ
かに記載の画像認識装置。
【0013】(7) 出力された文字画像データに対応
する文字コードデータがユーザにより修正された場合、
前記ファイル作成部は、出力時に修正後の文字コードデ
ータが見えて当該文字コードデータに対応する文字画像
データが見えない形で、両データをファイル内に配置す
ることを特徴とする上記(1)〜(6)のいずれかに記
載の画像認識装置。
【0014】(8) 出力された文字画像データに対応
する文字コードデータがユーザにより修正された場合、
前記ファイル作成部は、当該文字画像データを消去する
ことを特徴とする上記(1)〜(6)のいずれかに記載
の画像認識装置。
【0015】(9) 原稿を読み取ることによって画像
データを得るスキャナ部をさらに有することを特徴とす
る上記(1)〜(8)のいずれかに記載の画像認識装
置。
【0016】(10) データを用紙に印刷するプリン
ト部をさらに有することを特徴とする上記(1)〜
(9)のいずれかに記載の画像認識装置。
【0017】(11) 画像認識方法において、画像デ
ータ中の文字画像から文字コードを認識する過程と、文
字コードを認識した確からしさの度合いである文字認識
確度を検出する過程と、文字コードが認識された文字画
像を文字コードデータに変換して出力する過程と、文字
認識確度に応じて、文字コードデータに対し文字画像デ
ータを出力するか否かを判定する過程と、を有すること
を特徴とする画像認識方法。
【0018】(12) 画像認識プログラムを記録した
コンピュータ読取可能な記録媒体であって、画像データ
中の文字画像から文字コードを認識する過程と、文字コ
ードを認識した確からしさの度合いである文字認識確度
を検出する過程と、文字コードが認識された文字画像を
文字コードデータに変換して出力する過程と、文字認識
確度に応じて、文字コードデータに対し文字画像データ
を出力するか否かを判定する過程と、をコンピュータに
実行させるための画像認識プログラムを記録したコンピ
ュータ読取可能な記録媒体。
【0019】
【発明の実施の形態】以下、添付した図面を参照して、
本発明の実施形態を説明する。
【0020】図1は、本発明の一実施形態に係る画像認
識装置を含む情報機器システムの構成図である。
【0021】情報機器システム100は、画像認識装置
としての機能を有するコンピュータ10、スキャナ等の
画像入力装置50、プリンタ等の画像出力装置60、お
よび、別のコンピュータ70等の情報機器がネットワー
クN上に接続されて構成されている。また、スキャナや
デジタルカメラ等の別の画像入力装置51、およびプリ
ンタ等の別の画像出力装置61がコンピュータ10を介
してネットワークNに接続されている。コンピュータ1
0,70、画像入力装置50,51、および、画像出力
装置60,61は、互いにデータの授受を行うことがで
きる。
【0022】図2は、コンピュータ10の概略構成を示
すブロック図である。
【0023】コンピュータ10は、各情報機器との間で
データの授受を行うためのインターフェース(I/F)
18と、所定のプログラムやデータを記憶するROM1
5と、一時的にデータを記憶するRAM16と、プログ
ラムやデータを記憶するハードディスク17と、各種情
報の表示やユーザからの指示入力が可能な操作パネル1
2と、文字認識等の処理を行う画像処理部13(詳細後
述)と、上記各部を制御する主制御部11とを有してい
る。
【0024】また、画像入力装置50,51を制御する
ドライバソフト、画像出力装置60,61を制御するド
ライバソフト、電子メールの送受信を管理する電子メー
ルソフト、ファクシミリ送受信機能を利用するためのF
AX通信ソフト、ネットワークシステムを制御するネッ
トワークソフト等の各種ソフトウェアが、例えばハード
ディスク17に記憶されている。
【0025】図1に示す情報機器システムの動作指示
は、コンピュータ10の操作パネル12から行うことが
できる。図3は、コンピュータの操作パネルに表示され
たメニュー画面の一例を示す図である。本実施形態にお
いて操作パネル12は、コンピュータ10のディスプレ
イ上に表示される架空のパネルであり、コンピュータ1
0を操作するためのキーボードやマウス等の機器によ
り、画像入力装置51および画像出力装置61等に対
し、スキャン(原稿読み取り)やプリント(印刷)等の
動作指示を行う。なお、画像入力装置51および画像出
力装置61は、ネットワークNを介して接続された別の
コンピュータ70からの指示によっても動作する。
【0026】次に、画像処理部13について詳細に説明
する。
【0027】図4に示すように、画像処理部13は、主
として、文字認識部31、文字色検出部32、出力形式
判定部33、文字画像データ作成部34、およびファイ
ル作成部35を備えている。
【0028】文字認識部31は、文字画像から文字コー
ドを認識して文字コードデータを得るほか、文字コード
を認識する確からしさの度合いである文字認識確度を検
出する。文字画像から文字コードを認識する方法は、例
えば、各文字画像の特徴量とあらかじめ記憶されている
辞書パターンとの類似度に基づいて行われる。文字認識
確度は、例えば20段階で与えられ、値が大きいと文字
認識確度が高いことを意味する。なお、文字認識確度
は、上記類似度を基本にして、前後の個々の文字画像か
ら言語的にチェックした結果を考慮して求めることもで
きる。この言語的なチェックは、あらかじめ用意された
単語辞書と比べることにより行われる。例えば、前後の
個々の文字画像との関係から、一つの文字画像を独立で
認識した結果としての第1候補文字コードをそれ以下の
順位の候補文字コードと入れ替えた場合、当該文字画像
の認識の確からしさは低い値とされ、また、認識された
文字画像に該当する単語が辞書になかった場合、当該単
語全体の個々の文字画像すべての認識の確からしさは低
い値とされ得る。
【0029】文字認識部31はまた、文字画像の位置情
報を認識する。個々の文字画像の位置情報は、例えば図
5に示すように、画像データの左上を原点として、各文
字画像の外接矩形の左上および右下の座標として得られ
る。文字認識部31はさらに、文字画像から、フォント
の種類やフォントサイズ、さらには斜体などのスタイ
ル、等の文字属性を認識する。フォントは、所定の数種
類の代表的な出力フォントに分類されて判別される。
【0030】また、文字色検出部32は、文字コードが
認識された個々の文字画像の色を検出する。出力形式判
定部33は、文字認識確度に応じて、文字コードデータ
に対し文字画像データを出力するか否かを判定する。
【0031】そして、文字画像データ作成部34は、画
像データから必要に応じて文字画像を切り出して文字画
像データを作成する。ファイル作成部35は、入力され
た画像データ中の文字画像から得られた文字コードデー
タや文字画像データを用いて、所定の形式のファイルを
作成する。
【0032】次に、画像処理部13の動作を図6および
図7のフローチャートを用いて説明する。
【0033】まず、画像入力装置で原稿を読み取ること
によって得られた画像データに対し、RGB表色系から
Lab表色系へと色空間の変換を行う(S11)。La
b表色系は、スキャナあるいはプリンタ等の個々の情報
機器に依存しないので、ネットワークN上で共通の色情
報として扱うことができるものである。
【0034】次に、文字認識部31に入力する画像デー
タを作成するために、OCR前処理が行われる(S1
2)。後に文字認識部31がモノクロ2値画像データか
ら特徴量を抽出して文字コードの認識を行うことから、
OCR前処理では、まず、Lab表色系で表示されたカ
ラー画像データに対して2値化処理を行うことにより、
文字画像が黒で、その背景画像が白のモノクロ2値画像
データを作成する。本実施形態では、文字画像およびそ
の背景画像のL、a、bのレベルを検出することによ
り、例えば白地に書かれた色文字や、色地に書かれた黒
文字等が原稿上に表されていても、画像データ中の文字
画像から十分に文字コードを認識することができるよう
に2値化処理を行う。この他、OCR前処理では、画像
データ中の孤立点等のノイズの除去、原稿が傾いて読み
取られた場合の補正処理、つぶれたりかすれたりしてい
る文字画像の補正なども行われる。
【0035】OCR前処理により得られたモノクロ2値
画像データは、文字認識部31に入力され、文字認識処
理が行われる(S13)。文字認識部31は、モノクロ
2値画像データから文字画像が存在する文字領域の抽出
を行った後、文字領域内の文字画像から文字コードを認
識する。また、文字認識部31は、文字コードを認識す
る確からしさの度合いである文字認識確度を検出するこ
とができ、さらに、文字画像の位置情報のほか、フォン
トの種類、フォントサイズ、斜体などのスタイル等の文
字属性を認識する。この結果、文字認識部31からは、
個々の文字画像に対して、文字コードデータの他、文字
認識確度、位置情報、およびフォントの種類等の文字属
性などの情報が出力される。
【0036】次いで、文字色検出処理が行われる(S1
4)。すなわち、文字コードが認識された個々の文字画
像の色は、文字色検出部32により検出される。ここで
は、Lab表色系に色変換された画像データが使用され
る。文字画像の色の検出は、例えば、画像データ中の文
字画像が存在する文字領域のLabの値を読み取り、文
字画像を構成する全画素について、L、a、bそれぞれ
の平均値を求めることにより行う。文字画像とその背景
画像との画素の区別は、OCR前処理(S12)で得ら
れたモノクロ2値画像データを用いて行う。つまり、個
々の文字画像の外接矩形内において、モノクロ2値画像
データにおける黒画素を文字画像の画素、白画素を背景
画像の画素と区別することができる。
【0037】文字画像を文字コードデータに変換して出
力する場合、文字色検出部32により検出された個々の
文字画像の色情報に基づいて、色を指定して文字コード
データが出力される。これにより、例えば原稿上の文字
の色を再現することができる。
【0038】次に、画像データ中の文字画像について出
力形式の判定処理が行われる(S15)。
【0039】本実施形態では、出力形式判定部33は、
大きく分けて2つの評価量に基づいて、出力形式の判定
を行う。出力形式の判定を行うための第1の評価量は、
上記の文字認識確度である。第2の評価量は、文字コー
ドが認識された文字画像についての、近隣の文字画像と
の連続性の度合いである文字連続性度である。この文字
連続性度は、文字画像から認識される文字属性の連続性
の面から、文字らしさを評価した値である。文字認識処
理では、ある程度周辺の文字画像との位置関係を調べ
て、より文字らしい部分を文字領域として画像データか
ら抽出するが、抽出された文字領域内に非文字画像であ
る図形画像が文字画像と間違えられて含まれている場合
がある。本実施形態では、これらの孤立した画像を誤っ
て文字コードデータに変換することのないように、文字
連続性度を出力形式の判定に用いる。文字連続性度は、
例えば、文字コードが認識された文字画像と該文字画像
の近隣の文字画像との距離、近隣文字画像とのフォント
サイズの差、近隣の認識不可能な文字画像の割合、近隣
文字画像との色の統一性、1文字画像内における色の変
化、および近隣文字画像の文字認識確度の平均値などの
各項目について評価値を求め、項目ごとにウェイトをか
けて足し合わせることにより得られる。なお、評価量と
して文字認識確度のみを用い、文字連続性度を用いない
構成を採ることもできる。
【0040】次に、出力形式の判定処理について詳細に
説明する。
【0041】本実施形態では、出力形式判定部33は、
単語単位で出力形式の判定を行う。図7に示すように、
まず、注目する単語の順番を示す変数nが初期化される
(S21)。
【0042】ステップS22では、注目単語内における
個々の文字画像の文字連続性度Pの平均値Paが、所定
の閾値Th1より小さいか否かが判断される。上記Paが
所定の閾値Th1より小さい場合(S22:YES)、当
該画像は、文字画像以外の画像が文字画像と誤認識され
たものと判断されて、文字コードデータおよび文字画像
データとして出力しない旨の判定が行われる。但し、こ
の場合、当該画像に対し、入力された画像データのまま
元の位置に残す旨の判定を行うことも可能である。
【0043】ステップS23では、注目単語内における
個々の文字画像の文字認識確度Cすべてが所定の閾値T
h2より大きいか否かが判断される。上記文字認識確度C
すべてが所定の閾値Th2より大きい場合(S23:YE
S)、ステップS27に進み、注目単語全体を文字コー
ドデータに変換して出力する旨の判定が行われる。
【0044】本実施形態では特に、ステップS23で、
注目単語内に文字認識確度Cが所定の閾値Th2以下とな
る文字画像が含まれていると判断された場合(S23:
NO)、ステップS24に進み、注目単語内の全文字画
像を、文字コードデータおよび文字画像データの双方で
出力する旨の出力形式の判定を行う。なお、閾値Th2
は、適宜設定することができる。また、注目単語内にお
ける文字認識確度Cが所定の閾値Th2以下となる文字画
像の数Nを判定に使用したり、当該数Nを単語内の個々
の文字画像の総数で除した割合を判定に使用したりする
ことも可能である。
【0045】そして、注目する単語の順番を示す変数n
が繰り上げられ(S25)、画像データ中の全単語につ
いて、上記の判定処理が繰り返し行われる(S26)。
【0046】このようにして、画像データ中の全単語
は、文字コードデータのみで出力するもの、文字コード
データに加えて文字画像データでも出力するもの、およ
び文字画像以外の画像が文字画像と誤認識されたとして
文字コードデータおよび文字画像データを出力しないも
の、の3つに分類される。
【0047】次に、図6に示すメインフローチャートに
戻り、文字画像データの作成が行われる(S16)。す
なわち、文字認識部31から出力される文字画像の位置
情報にしたがって、画像データ中から、上記のステップ
S23でNOと判定された文字画像を切り出して文字画
像データを作成する。このとき、個々の文字画像ごとに
外接矩形領域の画像データが切り出される。但し、本実
施形態のように単語等の連続した文字画像を切り出して
文字画像データを作成する場合には、単語内の全文字画
像を含む矩形領域の画像データを一括して切り出しても
よい。
【0048】ここで、文字画像データとして出力する文
字画像を、原稿を読み取って得られた画像データとして
元の位置に残さず、例えば単語単位で切り出すのは、隣
接する文字コードデータと文字画像データとが重ならな
いようにするためである。つまり、一般に原稿上の入力
フォントと画像認識装置で用意されている出力フォント
とが全く同じである場合は少ないので、例えば文字画像
から変換された文字コードデータが配置される位置と、
入力された画像データ中の当該文字画像の位置とは、多
少ずれてしまう。そこで、本実施形態では、一文字画像
ずつ、あるいは一単語ずつ切り出しておいて、文字画像
データを作成し、例えば隣接する文字コードデータを出
力フォントで配置した位置に続けて、切り出しておいた
文字画像データを配置する。
【0049】次いで、出力形式判定部33の判定結果に
したがって所定の形式の電子ファイルが作成される(S
17)。ファイルの形式は特に限定されるものではな
い。このとき、ファイル作成部35は、ユーザに対し、
出力時に文字画像データが見えて当該文字画像データに
対応する文字コードデータが見えない形で、両データを
ファイル内に配置する。
【0050】具体的には、本実施形態のファイル作成部
35は、文字認識部31から出力される文字コードデー
タを配置した後で、同じ位置に重ねて、当該文字コード
データに対応する文字画像データ作成部34から出力さ
れる文字画像データを配置する。これにより、文字コー
ドデータが文字画像データの背後に隠れて表示されない
状態となる。なお、ファイル形式によっては、文字コー
ドデータに対応する文字属性として、文字の色を「透
明」に設定したり、文字の表示を「非表示」に設定した
りしてもよい。なお、本実施形態では、画像データ中の
全単語について出力形式の判定処理を終えた後に、当該
判定結果に応じて文字画像データを作成してファイル内
に配置したが、例えば各単語について出力形式の判定処
理を終えるごとに、その判定結果に応じて文字画像デー
タを作成してファイル内に配置してもよい。
【0051】したがって、図8に示すように、文字認識
確度が所定値より低い文字画像は、例えば操作パネル1
2の画面上に文字画像データD2 で表示され、ユーザは
正しい情報を画面上で見ることができる。しかも、一部
の文字画像データD2 の部分を除いて、文字コードデー
タD1 が表示されるので、画面上の表示は高画質となる
(用紙に印刷する場合も同様)。
【0052】このように本実施形態によれば、画像デー
タ中の文字画像を文字コードとして認識し、文字コード
データに変換した上でファイルを作成する場合に、誤認
識の可能性がある一部の単語のみを、文字コードデータ
および文字画像データで出力させることができるので、
ファイル容量の増大を抑えつつ、かつ画像データの情報
を確保することができる。
【0053】次に、作成されたファイルに対する検索・
編集機能について説明する。
【0054】本実施形態では、文字コードが認識された
単語は、すべて文字コードデータに変換されてファイル
として出力されるので、ユーザは、作成されたファイル
に対して、検索や編集などの機能を最大限に利用するこ
とができる。この場合、図3に示される操作パネル12
上に表示される検索ボタン121や編集ボタン122が
選択される。なお、文字検索は、ファイル形式に対応し
た一般のアプリケーションソフトでファイルを開いて一
般的な手順で行うことも可能である。
【0055】本実施形態では、編集機能は、基本的には
専用のアプリケーションソフトを用いることによって利
用される。すなわち、図3の操作パネル12上で編集ボ
タン122を選択して、編集対象となるファイルを開
き、文字コードの変更を行うことができる。編集ボタン
122が選択された場合、文字画像データが作成された
単語は、編集を効率的に行う観点から、文字コードデー
タが見えて当該文字コードデータに対応する文字画像デ
ータが見えない形で画面に表示される。この表示は、前
述した文字画像データが見えて文字コードデータが見え
ない形で画面に表示させる方法と同様な方法で行うこと
ができる。なお、適宜ユーザが確認するために、文字コ
ードデータまたは文字画像データのいずれかのみを見え
る形で画面に一時的に表示させる表示切り替え機能が備
えられている。
【0056】そして、文字コードデータがユーザにより
修正された場合、ファイル作成部35は、対応する文字
画像データを消去する。これにより、ユーザにより文字
コードデータが確認されたため不要となった文字画像デ
ータを削除してファイルの容量をより小さくすることが
できる。なお、文字コードデータがユーザにより修正さ
れた場合、ファイル作成部35は、当該単語を、出力時
に修正後の文字コードデータが見えて当該文字コードデ
ータに対応する文字画像データが見えない形でファイル
内に再度配置するようにしてもよい。
【0057】本発明は、上記した実施形態のみに限定さ
れるものではなく、特許請求の範囲内において、種々改
変することができる。
【0058】例えば、上記実施形態では、入力された画
像データの色空間を、RGB表色系からLab表色系に
変換して画像処理するようにしたが、画像入力装置で読
み取って得られた画像データのRGB表色系等、他の色
空間を使用して画像処理を行うことも可能である。
【0059】また、上記実施形態では、出力形式判定部
33は、上記ステップS23で、注目単語を、文字コー
ドデータおよび文字画像データで出力するか否かを、文
字認識確度のみを用いて判定しているが、文字認識確度
と文字連続性度とを組み合わせたものに基づいて総合的
に判定してもよい。また、上記実施形態では、出力形式
判定部33は、単語単位で上記判定を行うが、単語がさ
らに集合して形成されたブロックや段落、さらにはペー
ジ単位で判定を行ってもよい。一方、個々の文字画像ご
とに判定を行うことも可能である。
【0060】また、上記実施形態では、画像認識装置と
しての機能を有するコンピュータを例に挙げて説明した
が、本発明の画像認識装置はこれに限定されるものでは
なく、例えば同様の処理を画像入力装置で行ってコンピ
ュータや画像出力装置等に送信するシステム、画像入力
装置から直接画像データを受信して画像出力装置で同様
の処理を行うシステム等にも適用することが可能であ
る。
【0061】なお、上記した実施形態において、画像認
識の制御は、上記した処理手順(図6、図7等参照)を
記述した所定のプログラムを主制御部11が実行するこ
とによって行われるものであり、この所定のプログラム
は、コンピュータ読取可能な記録媒体(例えば、フロッ
ピー(登録商標)ディスクやCD−ROM等)によって
提供されることもできる。また、この所定のプログラム
は、例えば、上記各処理を実行するアプリケーションソ
フトウェアとして提供されてもよいし、コンピュータ、
デジタルコピー機、スキャナ、プリンタ等の各情報機器
や管理サーバの一機能として各情報機器や管理サーバの
ソフトウェアに組み込んでもよい。
【0062】
【発明の効果】以上説明したように、本発明によれば、
画像データ中の文字画像を文字コードとして認識し、文
字コードデータに変換した上でファイルを作成する場合
に、誤認識の可能性がある一部の文字画像のみを、文字
コードデータおよび文字画像データで出力させることが
できるので、ファイル容量の増大を抑えつつ、かつ画像
データの情報を確保することができる。
【図面の簡単な説明】
【図1】 本発明の一実施形態に係る画像認識装置を含
む情報機器システムの構成図である。
【図2】 コンピュータの概略構成を示すブロック図で
ある。
【図3】 コンピュータの操作パネルに表示されたメニ
ュー画面の一例を示す図である。
【図4】 画像処理部の概略構成を示す図である。
【図5】 文字画像の位置情報を説明するための図であ
る。
【図6】 画像認識処理を示すフローチャートである。
【図7】 図5に示される出力形式判定処理を示すサブ
ルーチンのフローチャートである。
【図8】 ファイルの内容を画面に表示した一例を説明
するための図である。
【符号の説明】
10…コンピュータ(画像認識装置)、 13…画像処理部、 31…文字認識部、 33…出力形式判定部、 36…ファイル作成部。

Claims (12)

    【特許請求の範囲】
  1. 【請求項1】 画像認識装置において、 画像データ中の文字画像から文字コードを認識する文字
    コード認識手段と、 文字コードを認識した確からしさの度合いである文字認
    識確度を検出する文字認識確度検出手段と、 文字コードが認識された文字画像を文字コードデータに
    変換して出力する文字コードデータ出力手段と、 文字認識確度に応じて、文字コードデータに対し文字画
    像データを出力するか否かを判定する判定手段と、 を有することを特徴とする画像認識装置。
  2. 【請求項2】 前記判定手段は、文字コードデータに対
    する文字認識確度が所定値より小さいときに、文字画像
    データを出力すると判定することを特徴とする請求項1
    に記載の画像認識装置。
  3. 【請求項3】 前記文字画像は、単語を形成しているこ
    とを特徴とする請求項1または2に記載の画像認識装
    置。
  4. 【請求項4】 前記単語の中に、文字認識確度が所定確
    度より低い文字画像が含まれるか否かを検出する低確度
    文字画像検出手段をさらに有し、 文字コードが認識された単語内に低確度文字画像が含ま
    れている場合、前記判定手段は、当該単語全体に対し文
    字画像データを出力すると判定することを特徴とする請
    求項3に記載の画像認識装置。
  5. 【請求項5】 文字コードが認識された文字画像につい
    ての、近隣の文字画像との連続性の度合いである文字連
    続性度を検出する文字連続性度検出手段をさらに有し、 前記判定手段は、文字認識確度と文字連続性度とに基づ
    いて前記判定を行うことを特徴とする請求項1〜4のい
    ずれかに記載の画像認識装置。
  6. 【請求項6】 前記判定手段の判定結果にしたがって所
    定の形式の電子ファイルを作成するファイル作成部をさ
    らに有し、 前記ファイル作成部は、出力時に文字画像データが見え
    て当該文字画像データに対応する文字コードデータが見
    えない形で、両データをファイル内に配置することを特
    徴とする請求項1〜5のいずれかに記載の画像認識装
    置。
  7. 【請求項7】 出力された文字画像データに対応する文
    字コードデータがユーザにより修正された場合、前記フ
    ァイル作成部は、出力時に修正後の文字コードデータが
    見えて当該文字コードデータに対応する文字画像データ
    が見えない形で、両データをファイル内に配置すること
    を特徴とする請求項1〜6のいずれかに記載の画像認識
    装置。
  8. 【請求項8】 出力された文字画像データに対応する文
    字コードデータがユーザにより修正された場合、前記フ
    ァイル作成部は、当該文字画像データを消去することを
    特徴とする請求項1〜6のいずれかに記載の画像認識装
    置。
  9. 【請求項9】 原稿を読み取ることによって画像データ
    を得るスキャナ部をさらに有することを特徴とする請求
    項1〜8のいずれかに記載の画像認識装置。
  10. 【請求項10】 データを用紙に印刷するプリント部を
    さらに有することを特徴とする請求項1〜9のいずれか
    に記載の画像認識装置。
  11. 【請求項11】 画像認識方法において、 画像データ中の文字画像から文字コードを認識する過程
    と、 文字コードを認識した確からしさの度合いである文字認
    識確度を検出する過程と、 文字コードが認識された文字画像を文字コードデータに
    変換して出力する過程と、 文字認識確度に応じて、文字コードデータに対し文字画
    像データを出力するか否かを判定する過程と、 を有することを特徴とする画像認識方法。
  12. 【請求項12】 画像認識プログラムを記録したコンピ
    ュータ読取可能な記録媒体であって、 画像データ中の文字画像から文字コードを認識する過程
    と、 文字コードを認識した確からしさの度合いである文字認
    識確度を検出する過程と、 文字コードが認識された文字画像を文字コードデータに
    変換して出力する過程と、 文字認識確度に応じて、文字コードデータに対し文字画
    像データを出力するか否かを判定する過程と、 をコンピュータに実行させるための画像認識プログラム
    を記録したコンピュータ読取可能な記録媒体。
JP2000233485A 2000-08-01 2000-08-01 画像認識装置、画像認識方法および画像認識プログラムを記録したコンピュータ読取可能な記録媒体 Pending JP2002049890A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000233485A JP2002049890A (ja) 2000-08-01 2000-08-01 画像認識装置、画像認識方法および画像認識プログラムを記録したコンピュータ読取可能な記録媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000233485A JP2002049890A (ja) 2000-08-01 2000-08-01 画像認識装置、画像認識方法および画像認識プログラムを記録したコンピュータ読取可能な記録媒体

Publications (1)

Publication Number Publication Date
JP2002049890A true JP2002049890A (ja) 2002-02-15

Family

ID=18725997

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000233485A Pending JP2002049890A (ja) 2000-08-01 2000-08-01 画像認識装置、画像認識方法および画像認識プログラムを記録したコンピュータ読取可能な記録媒体

Country Status (1)

Country Link
JP (1) JP2002049890A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20040003722A (ko) * 2002-07-03 2004-01-13 조문국 토토 배당 할인 시스템
JP2007305045A (ja) * 2006-05-15 2007-11-22 Konica Minolta Medical & Graphic Inc 文字読取装置、idカード作成装置及びidカード作成方法
JP2012516508A (ja) * 2009-01-28 2012-07-19 グーグル インコーポレイテッド 出版物からocr認識されたテキストとそれに対応するイメージをクライアント装置において選択に表示すること
US8442813B1 (en) 2009-02-05 2013-05-14 Google Inc. Methods and systems for assessing the quality of automatically generated text

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0290384A (ja) * 1988-09-28 1990-03-29 Ricoh Co Ltd 文字認識装置の後処理方式
JPH0388086A (ja) * 1989-08-31 1991-04-12 Toshiba Corp 文書読取装置
JPH0528324A (ja) * 1991-07-23 1993-02-05 Matsushita Electric Ind Co Ltd 英文字認識装置
JPH07182441A (ja) * 1993-11-09 1995-07-21 Matsushita Electric Ind Co Ltd 文字認識装置
JPH07334611A (ja) * 1994-06-07 1995-12-22 Hitachi Ltd 非認識文字の表示方法
JPH08147329A (ja) * 1994-11-18 1996-06-07 Casio Comput Co Ltd 読み取りイメージ処理装置
JPH0916709A (ja) * 1995-06-29 1997-01-17 Just Syst Corp 文字認識表示システムおよび方法
JPH09274645A (ja) * 1996-04-05 1997-10-21 Ricoh Co Ltd 文字認識方法および装置

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0290384A (ja) * 1988-09-28 1990-03-29 Ricoh Co Ltd 文字認識装置の後処理方式
JPH0388086A (ja) * 1989-08-31 1991-04-12 Toshiba Corp 文書読取装置
JPH0528324A (ja) * 1991-07-23 1993-02-05 Matsushita Electric Ind Co Ltd 英文字認識装置
JPH07182441A (ja) * 1993-11-09 1995-07-21 Matsushita Electric Ind Co Ltd 文字認識装置
JPH07334611A (ja) * 1994-06-07 1995-12-22 Hitachi Ltd 非認識文字の表示方法
JPH08147329A (ja) * 1994-11-18 1996-06-07 Casio Comput Co Ltd 読み取りイメージ処理装置
JPH0916709A (ja) * 1995-06-29 1997-01-17 Just Syst Corp 文字認識表示システムおよび方法
JPH09274645A (ja) * 1996-04-05 1997-10-21 Ricoh Co Ltd 文字認識方法および装置

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20040003722A (ko) * 2002-07-03 2004-01-13 조문국 토토 배당 할인 시스템
JP2007305045A (ja) * 2006-05-15 2007-11-22 Konica Minolta Medical & Graphic Inc 文字読取装置、idカード作成装置及びidカード作成方法
JP2012516508A (ja) * 2009-01-28 2012-07-19 グーグル インコーポレイテッド 出版物からocr認識されたテキストとそれに対応するイメージをクライアント装置において選択に表示すること
US8482581B2 (en) 2009-01-28 2013-07-09 Google, Inc. Selective display of OCR'ed text and corresponding images from publications on a client device
JP2014032665A (ja) * 2009-01-28 2014-02-20 Google Inc 出版物からocr認識されたテキストとそれに対応するイメージをクライアント装置において選択に表示すること
US9280952B2 (en) 2009-01-28 2016-03-08 Google Inc. Selective display of OCR'ed text and corresponding images from publications on a client device
US8442813B1 (en) 2009-02-05 2013-05-14 Google Inc. Methods and systems for assessing the quality of automatically generated text

Similar Documents

Publication Publication Date Title
RU2437152C2 (ru) Устройство обработки изображений, способ и компьютерная программа обработки изображений
US6865290B2 (en) Method and apparatus for recognizing document image by use of color information
US8494280B2 (en) Automated method for extracting highlighted regions in scanned source
CN101820489B (zh) 图像处理设备及图像处理方法
US8126270B2 (en) Image processing apparatus and image processing method for performing region segmentation processing
JP4655335B2 (ja) 画像認識装置、画像認識方法および画像認識プログラムを記録したコンピュータ読取可能な記録媒体
US7321688B2 (en) Image processor for character recognition
US11574489B2 (en) Image processing system, image processing method, and storage medium
US8965125B2 (en) Image processing device, method and storage medium for storing and displaying an electronic document
JP4785655B2 (ja) 文書処理装置及び文書処理方法
JPH11259655A (ja) 画像処理方法及び装置
CN102171708A (zh) 商业文档处理器
AU2009200633A1 (en) Image processing apparatus, image processing method and image processing program
US6360006B1 (en) Color block selection
US8023735B2 (en) Image processing apparatus for extracting representative characteristic from image data and storing image data to be associated with representative characteristic
JP4613397B2 (ja) 画像認識装置、画像認識方法および画像認識プログラムを記録したコンピュータ読取可能な記録媒体
JP2010074342A (ja) 画像処理装置、画像形成装置、及びプログラム
US20100070854A1 (en) Device for editing metadata of divided object
JP7379876B2 (ja) 文字認識装置、文書ファイル生成方法、文書ファイル生成プログラム
JP2002049890A (ja) 画像認識装置、画像認識方法および画像認識プログラムを記録したコンピュータ読取可能な記録媒体
JP3215163B2 (ja) 罫線識別方法及び領域識別方法
US5774570A (en) Document processing system with an image editing function
JP4710672B2 (ja) 文字色判別装置、文字色判別方法、およびコンピュータプログラム
JP4281236B2 (ja) 画像認識装置、画像認識方法、および、画像認識プログラムを記憶したコンピュータ読取り可能な記録媒体
JP2006270589A (ja) 情報処理装置、情報処理方法、プログラムおよび記録媒体

Legal Events

Date Code Title Description
A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20040423

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20050920

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20061011

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20081111

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20090109

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20090217