JP2002015280A - 画像認識装置、画像認識方法および画像認識プログラムを記録したコンピュータ読取可能な記録媒体 - Google Patents

画像認識装置、画像認識方法および画像認識プログラムを記録したコンピュータ読取可能な記録媒体

Info

Publication number
JP2002015280A
JP2002015280A JP2000195146A JP2000195146A JP2002015280A JP 2002015280 A JP2002015280 A JP 2002015280A JP 2000195146 A JP2000195146 A JP 2000195146A JP 2000195146 A JP2000195146 A JP 2000195146A JP 2002015280 A JP2002015280 A JP 2002015280A
Authority
JP
Japan
Prior art keywords
character
image
character image
data
continuity
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2000195146A
Other languages
English (en)
Other versions
JP4613397B2 (ja
Inventor
Yoko Fujiwara
葉子 藤原
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Minolta Co Ltd
Original Assignee
Minolta Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Minolta Co Ltd filed Critical Minolta Co Ltd
Priority to JP2000195146A priority Critical patent/JP4613397B2/ja
Priority to US09/892,617 priority patent/US7149352B2/en
Publication of JP2002015280A publication Critical patent/JP2002015280A/ja
Application granted granted Critical
Publication of JP4613397B2 publication Critical patent/JP4613397B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/413Classification of content, e.g. text, photographs or tables

Abstract

(57)【要約】 【課題】 画像データ中の文字画像が文字コードデータ
に変換される割合を高くしつつ、誤認識の文字コードデ
ータが出力されることを有効に防止する。 【解決手段】 出力形式判定部は、入力された画像デー
タ中の文字画像から文字コードを認識した後に、当該文
字画像を文字コードデータに変換するか否かを、文字認
識確度Cn のほか、近隣の文字画像との連続性の度合い
である文字連続性度Pn を用いて判定する。文字連続性
度は、近隣文字画像との距離、フォントサイズの差、フ
ォントタイプの相違、文字画像列の長さ、および色の差
を検出することにより求められる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、画像認識技術に関
し、特に、入力された画像データ中の文字画像を、文字
コードデータに変換するか否かを判定する処理について
の画像認識技術に関する。
【0002】
【従来の技術】最近の画像認識装置は、読取に関する条
件の良い原稿(例えば同一フォントの文字のみで構成さ
れた原稿)であれば、極めて高い精度で文字画像を文字
コードとして認識可能である。しかしながら、原稿上の
文字の品質が悪かったり、原稿上の文字等のレイアウト
が複雑であると、文字画像を文字コードとして認識する
認識精度が大きく低下し、誤認識される文字画像が増加
してしまう。
【0003】このような問題に対し、原稿を読み取って
得られた画像データのすべてをバックアップ用に保存す
るシステムが知られている。しかし、バックアップ用の
画像データを含んで保存されたファイルの容量は、当然
ながら入力された画像データよりも大幅に増えてしま
う。
【0004】そこで、誤認識されている可能性が高い文
字画像のみを、文字コードデータに変換することなく、
文字画像データ(例えばビットマップ形式の画像デー
タ)のまま出力する画像認識装置が提案されている。こ
こで、誤認識の可能性の判断には、例えばあらかじめ記
憶されている標準パターンとの類似度などの結果から検
出された、文字コードを認識する確からしさの情報が使
用される。
【0005】
【発明が解決しようとする課題】しかしながら、文字コ
ードを認識する確からしさの情報だけでは、画像データ
中の文字画像のうち、どの文字画像が正確に文字コード
として認識されていて、どの文字画像が誤認識されてい
るかという判別の精度はあまり高いものではなく、結果
的に誤認識される文字画像を十分に除去することが困難
である。
【0006】特に、最近では、読み取られる原稿は多様
化しており、カラーの原稿や複雑なレイアウトの原稿な
どが増えている。これに伴って、画像データから文字画
像が存在する文字領域を抽出することが難しくなってき
ている。したがって、例えば、図11に示すような、非
文字である図形が文字部の中に埋め込まれた原稿を読み
取る場合、図12に示すように、得られた画像データ中
の非文字画像である図形画像から誤って文字コードを認
識して、文字コードデータで出力される事態が生じ得
る。なお、図中の符号E1 は、図形画像から文字コード
が誤認識されて得られた文字コードデータ、符号E2
は、文字画像から文字コードが誤認識されて得られた文
字コードデータを示す。しかも、図形画像から文字コー
ドデータE1に変換される際の文字コードを認識する確
からしさが、本来の文字画像とあまり変わらない場合が
ある。このため、文字コードを認識する確からしさの情
報だけで文字コードデータに変換するか否かの判定を行
うと、図形画像から誤認識されて得られた文字コードデ
ータを除去することができない。
【0007】一方、特開平8−55185号公報には、
画像データ中の文字画像が存在する文字領域を抽出する
段階で、近隣の文字画像との位置関係を調べながら文字
領域を抽出するという技術が提案されている。また、特
開平8−161421号公報には、文字領域を抽出する
段階で、近隣の文字画像との位置関係を調べて文字領域
の候補となる文字候補領域をまず抽出し、この文字候補
領域内の画像データのうち文字コードを認識することが
できる文字画像によって文字領域を再構成するという技
術が提案されている。しかしながら、上記公報に開示さ
れたいずれの技術も、画像データ中から文字領域を抽出
するための技術に過ぎない。
【0008】本発明は、上記従来技術の問題点に鑑みて
なされたものであり、本発明の目的は、入力された画像
データ中の文字画像が文字コードデータに変換される割
合を高くしつつ、誤認識の文字コードデータが出力され
ることを有効に防止することにある。
【0009】
【課題を解決するための手段】本発明の目的は、下記す
る手段により達成される。
【0010】(1) 画像認識装置において、入力され
た画像データ中の文字画像から文字コードを認識する文
字認識部と、文字コードが認識された文字画像について
の、近隣の文字画像との連続性の度合いである文字連続
性度を検出する文字連続性度検出部と、文字コードが認
識された文字画像を文字コードデータに変換するか否か
を、文字連続性度を用いて判定する出力形式判定部と、
を有することを特徴とする画像認識装置。
【0011】(2) 前記文字連続性度検出部は、文字
コードが認識された文字画像と該文字画像の近隣の文字
画像との距離、文字コードが認識された文字画像と該文
字画像の近隣の文字画像とのフォントサイズの差、文字
コードが認識された文字画像と該文字画像の近隣の文字
画像とのフォントのタイプの相違、文字コードが認識さ
れた文字画像が含まれる連続した文字画像の列の長さ、
および文字コードが認識された文字画像と該文字画像の
近隣の文字画像との色の差のうち、少なくともいずれか
一つ以上を検出することを特徴とする上記(1)に記載
の画像認識装置。
【0012】(3) 前記文字認識部は、さらに文字コ
ードを認識する確からしさの度合いである文字認識確度
を検出し、前記出力形式判定部は、前記文字認識部によ
り検出された文字認識確度と、前記文字連続性度検出部
により検出された文字連続性度とに基づいて判定するこ
とを特徴とする上記(1)または(2)に記載の画像認
識装置。
【0013】(4) 入力された画像データ中の文字画
像が切り出されて形成され、隣接する文字コードデータ
に重なることなく連続して配置される文字画像データを
作成する文字画像データ作成部、をさらに有し、前記出
力形式判定部は、文字コードデータに変換しないと判定
された文字画像のうち文字連続性度が所定値以上の文字
画像を切り出して、文字画像データを作成すると判定す
ることを特徴とする上記(1)〜(3)のいずれかに記
載の画像認識装置。
【0014】(5) 電子ファイルを作成するファイル
作成部、をさらに有することを特徴とする上記(1)〜
(4)のいずれかに記載の画像認識装置。
【0015】(6) 原稿を読み取ることによって画像
データを得るスキャナ部、をさらに有することを特徴と
する上記(1)〜(5)のいずれかに記載の画像認識装
置。
【0016】(7) 画像データを受信する画像データ
受信部と、データを用紙に印刷するプリント部と、をさ
らに有することを特徴とする上記(1)〜(6)のいず
れかに記載の画像認識装置。
【0017】(8) 画像認識方法において、入力され
た画像データ中の文字画像から文字コードを認識する過
程と、文字コードが認識された文字画像についての、近
隣の文字画像との連続性の度合いである文字連続性度を
検出する過程と、文字コードが認識された文字画像を文
字コードデータに変換するか否かを、文字連続性度を用
いて判定する過程と、を有することを特徴とする画像認
識方法。
【0018】(9) 画像認識プログラムを記録したコ
ンピュータ読取可能な記録媒体であって、入力された画
像データ中の文字画像から文字コードを認識する過程
と、文字コードが認識された文字画像についての、近隣
の文字画像との連続性の度合いである文字連続性度を検
出する過程と、文字コードが認識された文字画像を文字
コードデータに変換するか否かを、文字連続性度を用い
て判定する過程と、をコンピュータに実行させるための
画像認識プログラムを記録したコンピュータ読取可能な
記録媒体。
【0019】
【発明の実施の形態】以下、添付した図面を参照して、
本発明の実施形態を説明する。
【0020】図1は、本発明の第1実施形態に係る画像
認識装置を含む情報機器システムの構成図である。
【0021】情報機器システム100は、画像認識装置
としての機能を有するコンピュータ10、画像入力装置
であるスキャナ50、および、画像出力装置であるプリ
ンタ60等の情報機器がネットワークN上に接続されて
構成されている。
【0022】コンピュータ10、スキャナ50、およ
び、プリンタ60は、ネットワークNを経由して互いに
データの授受を行うことができる。
【0023】図2は、コンピュータ10の概略構成を示
すブロック図である。
【0024】コンピュータ10は、各情報機器との間で
データの授受を行うためのインターフェース(I/F)
18と、スキャナ50を制御するためのスキャナドライ
バ12と、プリンタ60を制御するためのプリンタドラ
イバ14と、所定のプログラムやデータを記憶するRO
M15と、一時的にデータを記憶するRAM16と、各
種情報の表示やユーザからの指示入力が可能な操作パネ
ル17と、文字認識等の処理を行う画像処理部13(詳
細後述)と、上記各部を制御する主制御部11とを有し
ている。なお、スキャナドライバ12、プリンタドライ
バ14は、ソフトウェアであり、図示しないハードディ
スク等の記憶装置に記憶されている。
【0025】図1に示す情報機器システムの動作指示
は、コンピュータ10の操作パネル17から行うことが
できる。本実施形態において操作パネル17は、コンピ
ュータ10のディスプレイ上に表示される架空のパネル
であり、コンピュータ10を操作するためのキーボード
やマウス等の機器により、動作指示を行う。
【0026】例えば、操作パネル17上にはスキャン&
ファイルボタンとスキャン&プリントボタンとが表示さ
れており、スキャン&ファイルボタンで動作指示を行っ
た場合には、スキャナ50は原稿読取動作を開始し、読
み取りによって得られた画像データはコンピュータ10
に送信され、画像処理部13にて文字認識等の画像処理
がなされた後、所定の形式のファイルとしてコンピュー
タ10内の記憶装置に保存される。
【0027】また、スキャン&プリントボタンで動作指
示を行った場合には、スキャナ50の読み取りによって
得られた画像データは、画像処理部13にて文字認識等
の画像処理がなされた後、プリンタ60に送信され用紙
上に印刷される。
【0028】次に、画像処理部13について詳細に説明
する。
【0029】画像処理部13は、文字認識部31、文字
色検出部32、出力形式判定部33、文字画像データ作
成部34、文字消去部35、およびファイル作成部36
を備えている。
【0030】文字認識部31は、個々の文字画像から文
字コードを認識して文字コードデータを得るほか、文字
コードを認識する確からしさの度合いである文字認識確
度を検出する。文字画像から文字コードを認識する方法
は、例えば、各文字画像の特徴量とあらかじめ記憶され
ている辞書パターンとの一致の度合いに基づいて行われ
る。文字認識確度は、例えば10段階で与えられ、値が
大きいと文字認識確度が高いことを意味する。また、文
字認識部31は、文字画像の位置情報を認識する。個々
の文字画像の位置情報は、例えば図3に示すように、画
像データの左上を原点として、各文字画像の外接矩形の
左上および右下の座標として得られる。さらに、文字認
識部31は、文字画像から、フォントのタイプやフォン
トサイズ、さらには太字・斜体などのスタイル、アンダ
ーライン等の文字属性を認識する。
【0031】フォントのタイプは、例えばセリフ系とサ
ンセリフ系などに分類されて判別される。また、フォン
トサイズは、個々の文字画像の外接矩形の大きさと、文
字コードが認識されて得られた文字コードデータを一般
的なフォントで表した場合の大きさとを比較することに
より求められる。所定の代表的なフォントの文字高さや
文字幅などの情報、すなわちフォントメトリックデータ
は、あらかじめデータとして記憶されている。
【0032】文字色検出部32は、文字コードが認識さ
れた個々の文字画像の色を検出する。
【0033】出力形式判定部33は、文字コードが認識
された文字画像を、文字コードデータに変換するか否か
の判定を行う。本実施形態では、出力形式判定部33
は、文字コードが認識された文字画像を調べて、文字コ
ードデータに変換するか、文字コードデータに変換せず
に、入力された画像データ中の文字画像が切り出されて
形成され、隣接する文字コードデータに重なることなく
連続して配置される文字画像データを作成するか、ある
いは入力された画像データのまま元の位置に残すか、の
判定を行う。そして、文字画像データ作成部34は、文
字コードが認識された文字画像のうち、文字画像データ
を作成する旨の判定が行われた文字画像を、入力された
画像データから切り出して文字画像データを作成する。
【0034】文字消去部35は、元の画像データ、すな
わち入力されたカラーの画像データから、文字コードデ
ータまたは文字画像データとされた後の元の文字画像を
消去する。
【0035】ファイル作成部36は、入力された画像デ
ータ中の文字画像から得られた文字コードデータや文字
画像データなどを用いて、所定の形式のファイルを作成
する。
【0036】次に、画像処理部13の動作を図4および
図5のフローチャートを用いて説明する。
【0037】まず、スキャナ50で原稿を読み取ること
によって得られた画像データに対し、RGB表色系から
Lab表色系へと色空間の変換を行う(S11)。La
b表色系は、スキャナあるいはプリンタ等の個々の情報
機器に依存しないので、ネットワークN上で共通の色情
報として扱うことができるものである。
【0038】次に、文字認識部31に入力する画像デー
タを作成するために、OCR前処理が行われる(S1
2)。後に文字認識部31がモノクロ2値画像データか
ら特徴量を抽出して文字コードの認識を行うことから、
OCR前処理では、まず、Lab表色系で表示されたカ
ラー画像データに対して2値化処理を行うことにより、
文字画像が黒で、その背景画像が白のモノクロ2値画像
データを作成する。本実施形態では、文字画像およびそ
の背景画像のL、a、bのレベルを検出することによ
り、例えば白地に書かれた色文字や、色地に書かれた黒
文字等が原稿上に表されていても、原稿を読み取ること
によって入力された画像データ中の文字画像から十分に
文字コードを認識することができるように2値化処理を
行う。この他、OCR前処理では、入力された画像デー
タ中の孤立点等のノイズの除去、原稿が傾いて読み取ら
れた場合の補正処理、つぶれたりかすれたりしている文
字画像の補正なども行われる。
【0039】OCR前処理により得られたモノクロ2値
画像データは、文字認識部31に入力され、文字認識処
理が行われる(S13)。文字認識部31は、モノクロ
2値画像データから文字画像が存在する文字領域の抽出
を行った後、文字領域内の個々の文字画像から文字コー
ドを認識する。また、文字認識部31は、文字コードを
認識する確からしさの度合いである文字認識確度を検出
することができ、さらに、文字画像の位置情報のほか、
フォントのタイプ、フォントサイズ、太字・斜体などの
スタイル、アンダーライン等の文字属性を認識する。
【0040】次いで、文字色検出処理が行われる(S1
4)。すなわち、文字コードが認識された個々の文字画
像の色は、文字色検出部32により検出される。ここで
は、Lab表色系に色変換された画像データが使用され
る。文字画像の色の検出は、例えば、画像データ中の文
字画像が存在する文字領域のLabの値を読み取り、文
字画像を構成する全画素について、L、a、bそれぞれ
の平均値を求めることにより行う。文字画像とその背景
画像との画素の区別は、OCR前処理(S12)で得ら
れたモノクロ2値画像データを用いて行う。つまり、個
々の文字画像の外接矩形内において、モノクロ2値画像
データにおける黒画素を文字画像の画素、白画素を背景
画像の画素と区別することができる。
【0041】文字画像を文字コードデータに変換して出
力する場合、文字色検出部32により検出された個々の
文字画像の色情報に基づいて、色を指定して文字コード
データが出力される。これにより、例えば原稿上の文字
の色を再現することができる。
【0042】そして、文字領域内の個々の文字画像につ
いて出力形式の判定処理が行われる(S15)。すなわ
ち、出力形式判定部33により、文字コードが認識され
た文字画像を、文字コードデータに変換するか否かの判
定が行われる。
【0043】出力形式判定部33は、大きく分けて2つ
の評価量に基づいて、出力形式の判定を行う。出力形式
の判定を行うための第1の評価量は、文字コードを認識
する確からしさの度合いである文字認識確度である。出
力形式の判定を行うための第2の評価量は、文字コード
が認識された文字画像についての、近隣の文字画像との
連続性の度合いである文字連続性度である。この文字連
続性度は、文字画像から認識される文字属性の連続性の
面から、文字らしさを評価した値であり、その詳細は後
述する。
【0044】そして、出力形式判定部33は、文字コー
ドが認識された文字画像のうち、文字コードデータに変
換しないと判定した文字画像を、さらに2つの出力形式
に分類して判定する。すなわち、出力形式判定部33
は、文字コードが認識された文字画像が文字画像には違
いないものの文字認識確度が小さい場合、隣接する文字
コードデータに重なることなく連続して配置するため
に、入力された画像データ中の文字画像を切り出して文
字画像データを作成すると判定する。また、出力形式判
定部33は、文字コードが認識された文字画像が非文字
画像である図形画像であるにもかかわらず誤って文字コ
ードが認識されたと考えられる場合、当該文字画像を入
力された画像データのまま元の位置に残すと判定する。
【0045】次に、文字コードが認識された文字画像に
ついての出力形式の判定処理についてさらに詳しく説明
する。
【0046】文字認識部31からは、個々の文字画像に
対して、文字コードデータのほか、セリフ系・サンセリ
フ系などのフォントのタイプ、フォントサイズ、太字・
斜体などのスタイル、アンダーライン等の文字属性、文
字認識確度、文字コードが認識された各文字画像ごとの
位置情報、などの情報が出力される。そして、これら文
字認識部31からの情報をもとに、文字画像の位置や文
字属性についての連続性を検出して文字らしさを評価す
る。前述したように、文字認識処理では、ある程度周辺
の文字画像との位置関係を調べて、より文字らしい部分
を文字領域として画像データから抽出するが、抽出され
た文字領域内に非文字画像である図形画像が文字画像と
間違えられて含まれている場合がある。本実施形態で
は、特に、これらの孤立した文字画像を誤って文字コー
ドデータに変換することのないように、すべての文字画
像から文字コードを認識した後に、当該文字画像を文字
コードデータに変換するか否かの判定を行うようにして
いる。
【0047】文字連続性度、すなわち文字らしさの評価
量は、文字コードが認識された文字画像と該文字画像の
近隣の文字画像との距離、文字コードが認識された文字
画像と該文字画像の近隣の文字画像とのフォントサイズ
の差、文字コードが認識された文字画像と該文字画像の
近隣の文字画像とのフォントのタイプの相違、文字コー
ドが認識された文字画像が含まれる連続した文字画像の
列の長さ、および文字コードが認識された文字画像と該
文字画像の近隣の文字画像との色の差、の5項目につい
て順に調べ、各項目において文字画像の連続性に着目し
た評価ポイントを算出することにより検出される。
【0048】具体的には、図5に示すように、まず、注
目する個々の文字画像の順番を示す変数nを初期化する
(S21)。
【0049】そして、文字コードが認識された文字画像
と該文字画像の近隣の文字画像との距離に基づいて、第
1の評価ポイントを計算する(S22)。ここでは、注
目文字画像の前後±k個の文字画像の位置情報(図3参
照)が調べられ、次式により第1の評価ポイントP1nが
計算される。なお、式中の添字は、個々の文字画像の順
番を示す(以下の式において同様)。
【0050】
【数1】
【0051】但し、P1n<0のときは、P1n=0 M1 :第1の評価ポイントの最大値 X1 :文字コードが認識された文字画像の外接矩形の左
X座標 X2 :文字コードが認識された文字画像の外接矩形の右
X座標 Y1 :文字コードが認識された文字画像の外接矩形の上
Y座標 Y2 :文字コードが認識された文字画像の外接矩形の下
Y座標 である。
【0052】上記式に示すように、近隣文字画像との距
離が大きい程、第1の評価ポイントは小さくなる。すな
わち、注目文字画像が近隣文字画像から離れている程、
連続性が小さく、文字画像である可能性が低いというこ
とを表している。
【0053】なお、上記式からわかるように、例えば複
数の文字画像が横に並んで形成された行の右端や左端の
文字画像を考慮するため、注目文字画像の右側の近隣文
字画像との距離と左側の近隣文字画像との距離とを調べ
て、両者のうち小さい方が評価ポイントの計算に使用さ
れる。
【0054】次に、文字コードが認識された文字画像と
該文字画像の近隣の文字画像とのフォントサイズの差に
基づいて、第2の評価ポイントを計算する(S23)。
ここでは、注目文字画像の前後±k個の文字画像のフォ
ントサイズが調べられ、次式により第2の評価ポイント
P2nが計算される。
【0055】
【数2】
【0056】但し、P2n<0のときは、P2n=0 M1 :第2の評価ポイントの最大値 S :フォントサイズ である。
【0057】上記式の分母は、近隣文字画像の平均フォ
ントサイズを表す。上記式に示すように、近隣文字画像
とのフォントサイズの差が大きい程、連続性が小さく、
第2の評価ポイントは小さくなる。
【0058】次に、文字コードが認識された文字画像と
該文字画像の近隣の文字画像とのフォントのタイプの相
違に基づいて、第3の評価ポイントを計算する(S2
4)。ここでは、注目文字画像の前後±k個の文字画像
のフォントのタイプが調べられ、注目文字画像とフォン
トのタイプが相違している文字画像の数をNf として、
次式により第3の評価ポイントP3nが計算される。
【0059】P3n=M3 −Nf 但し、P3n<0のときは、P3n=0 M3 :第3の評価ポイントの最大値 である。
【0060】上記式に示すように、近隣文字画像とのフ
ォントのタイプの相違が多い程、連続性が小さく、第3
の評価ポイントは小さくなる。
【0061】次に、文字コードが認識された文字画像が
含まれる連続した文字画像の列の長さに基づいて、第4
の評価ポイントを計算する(S25)。ここでは、注目
文字画像の前後に、順に個々の文字画像の外接矩形の間
隔を調べ、当該間隔が所定の閾値TH以上であれば、文
字画像列の区切りであると判断する。なお、閾値TH
は、例えば近隣文字画像の平均サイズによって変化させ
るのが望ましい。そして、注目文字画像をn番目の文字
画像として、注目文字画像の左側に存在するi1番目の
文字画像から、注目文字画像の右側に存在するi2 番目
の文字画像までが、一つの文字画像列であると判断され
ると、次式により第4の評価ポイントP4nが計算され
る。
【0062】P4n=i2 −i1 +1 但し、P4n>M4 のときは、P4n=M4 M4 :第4の評価ポイントの最大値 である。
【0063】上記式に示すように、文字画像列が長い
程、連続性が大きいとされ、第4の評価ポイントは大き
くなる。
【0064】最後に、文字コードが認識された文字画像
と該文字画像の近隣の文字画像との色の差に基づいて、
第5の評価ポイントを計算する(S26)。ここでは、
注目文字画像の前後±k個の文字画像の色が調べられ、
次式により第5の評価ポイントP5nが計算される。
【0065】
【数3】
【0066】但し、P5n<0のときは、P5n=0 M5 :第5の評価ポイントの最大値 L,a,b:文字画像の色をLab表色系で表した値 である。
【0067】上記式に示すように、近隣文字画像との色
の差が大きい程、連続性が小さく、第5の評価ポイント
は小さくなる。
【0068】以上のようにして求められた第1〜5の評
価ポイントから、総合評価ポイントとしての文字連続性
度Pn が、次式により計算される(S27)。
【0069】Pn =W1 ×P1n+W2 ×P2n+W3 ×P
3n+W4 ×P4n+W5 ×P5n 但し、W1 〜W5 は、それぞれの評価ポイントにたいす
るウェイトであり、適宜設定することができる。
【0070】一方、この文字連続性度Pn とは別に、文
字コードを認識する確からしさの度合いである文字認識
確度Cn が、各文字画像ごとに得られる。
【0071】そして、出力形式判定部33は、文字認識
確度Cn のほか、近隣の文字画像との連続性の度合いで
ある文字連続性度Pn を用いて、既に文字コードが認識
された各文字画像について、出力形式の判定を行う。
【0072】図6は、出力形式の判定基準を説明するた
めの図である。
【0073】まず、文字認識確度Cn の閾値として、例
えば小さい方の閾値CTh1と大きい方の閾値CTh2とが
設定され、文字連続性度Pn の閾値として、例えば小さ
い方の閾値PTh1と大きい方の閾値PTh2とが設定され
る。
【0074】出力形式判定部33は、まず、文字認識確
度Cn が大きい方の閾値CTh2より大きい文字画像を、
文字コードデータに変換する旨の判定を行う(S28で
YES、S33)。出力形式判定部33は、また、文字
認識確度Cn が小さい方の閾値CTh1より大きく、且つ
文字連続性度Pn が小さい方の閾値PTh1より大きい文
字画像も、文字コードを正しく認識していると判断し
て、文字コードデータに変換する旨の判定を行う(S2
9でYES、S33)。すなわち、文字認識確度Cn が
非常に大きい文字画像(Cn >CTh2)は、文字コード
データに変換すると判定され、文字認識確度Cn が中ぐ
らいの文字画像(CTh1<Cn <CTh2)は、文字連続
性度Pn が閾値PTh1より大きい場合に限って文字コー
ドデータに変換すると判定される。
【0075】上記の2つのステップS28およびS29
で文字コードデータに変換しないと判定された文字画像
は、文字連続性度Pn により、さらに2つの出力形式に
分類されて判定される。すなわち、文字コードデータに
変換しないと判定された文字画像のうち、文字連続性度
Pn が閾値PTh2より大きい文字画像は、入力された画
像データ中の文字画像を切り出して文字画像データを作
成すると判定される。一方、文字コードデータに変換し
ないと判定された文字画像のうち、文字連続性度Pn が
閾値PTh2以下の文字画像は、入力された画像データの
まま元の位置に残すと判定される。
【0076】このように、文字認識部31により文字コ
ードが認識された文字画像は、出力形式判定部33によ
り、最終的に3つに分類される。すなわち、個々の文字
画像は、確実に文字コードが認識されたと判断されて、
文字コードデータで出力する旨の判定が行われたもの
(図6中のA1 で示す領域)と、文字画像には違いない
が正しい文字コードが認識できたか否かが疑わしい文字
画像と判断されて、隣接する文字コードデータに重なる
ことなく連続して配置される文字画像データで出力する
旨の判定が行われたもの(図6中のA2 で示す領域)
と、近隣文字画像との連続性が少なく、非文字画像であ
る図形画像であるにもかかわらず誤って文字コードが認
識された文字画像であると判断されて、入力された画像
データのまま元の位置に残す旨の判定が行われたもの
(図6中のA3 で示す領域)と、に分類される。
【0077】そして、注目する文字画像の順番を示す変
数nを繰り上げ(S34)、画像データ内の全文字画像
について、上記の処理を繰り返し行う(S35)。
【0078】このようにして、画像データ中の個々の文
字画像について出力形式の判定処理が終了すると、図4
に示すメインフローチャートに戻り、文字画像データの
作成が行われる(S16)。すなわち、文字画像データ
作成部34は、文字認識部31から出力される文字画像
の位置情報にしたがって、画像データ中の文字画像を切
り出して文字画像データを作成する。このとき、個々の
文字画像ごとに外接矩形領域の画像データが切り出され
る。
【0079】ここで、文字画像データとして出力する文
字画像を、原稿を読み取って得られた画像データとして
元の位置に残さず、個々の文字画像単位で切り出すの
は、文字コードデータと文字画像データとが重ならない
ようにするためである。つまり、一般に、入力フォント
と出力フォントとが全く同じである場合は少ないので、
例えば文字画像から変換された文字コードデータが配置
される位置と、入力時の画像データ中の文字画像の位置
とは、多少ずれてしまう。したがって、文字画像を一文
字画像ずつ切り出さずに元の画像データとして残した場
合、そのままで文字コードデータを配置すると、文字コ
ードデータと原稿を読み取って得られた元の画像データ
中の文字画像とが重なるといった問題が生じ得る。そこ
で、本実施形態では、一文字画像ずつ切り出しておい
て、文字画像データを作成し、例えば文字コードデータ
を出力フォントで配置した位置に続けて、切り出してお
いた文字画像データを配置する。
【0080】また、文字画像データ作成部34は、文字
画像データを作成する際に、文字画像の外接矩形内に対
して、エッジ強調、または当該文字画像に適したγ変換
を行う。これにより、例えばビットマップで表された文
字画像データでも、用紙に印刷して鮮明な文字を再現す
ることができる。
【0081】次に、文字消去処理が行われる(S1
7)。すなわち、文字画像から文字コードデータまたは
文字画像データを得た後、文字消去部35により、原稿
を読み取ることによって入力されたカラーの画像データ
から、文字コードデータまたは文字画像データとされた
後の元の文字画像が消去される。
【0082】図7は、文字消去処理を説明するための図
である。図7に示すように、個々の文字画像の外接矩形
内における画像データ(図7(A))から、文字画像に
当たる部分を一旦消去し(図7(B))、周囲の画像デ
ータで補完する(図7(C))。消去する部分は、当該
文字画像の外接矩形内におけるモノクロ2値画像データ
から黒を2〜3画素膨張させる処理を行うことによって
求める。なお、原稿を読み取ることによって入力された
元の画像データから文字画像に当たる部分を除去した後
の画像データには、図7(B)に示すように、文字画像
以外の画像データ、すなわち、写真や線画に対応する画
像、背景画像などが残っている。
【0083】以上の処理を実施することにより、例えば
図8に示すように、画像データ中の文字画像から、文字
コードデータD1 と文字画像データD2 とが、また、非
文字画像である図形画像をそのまま残した画像データD
3 が得られる。なお、図9は、文字コードデータ、文字
画像データ、および画像データの内容を別々に示す図で
ある。図8および図9に示されるように、非文字画像で
ある図形画像であるにもかかわらず誤って文字コードが
認識された孤立して存在している文字画像は、文字コー
ドデータに変換されないので、図12のように図形画像
の部分に誤認識の文字コードデータが出力されることは
ない。
【0084】そして、これらの文字コードデータ、文字
画像データ、および画像データは、所定のファイル形式
でページ内に配置されて保存される(S18)。なお、
スキャン&プリントボタンが選択されている場合は、所
定のデータがプリンタ60に送信されて用紙に印刷され
る。
【0085】このように、本実施形態によれば、文字画
像から文字コードを認識した後に、当該文字画像を文字
コードデータに変換するか否かの判定を、文字連続性度
を用いて行うようにしたので、非文字画像である図形画
像であるにもかかわらず誤って文字コードが認識され
て、文字コードデータとして出力される事態を有効に防
止することができる。
【0086】しかも、文字連続性度を用いることによ
り、文字コードを認識する確からしさに高目の厳しい閾
値を設けなくても誤認識の文字コードデータを除去する
ことが可能となるため、入力された画像データ中の文字
画像が文字コードデータに変換される割合を高く維持す
ることができる。
【0087】本発明は、上記した実施形態のみに限定さ
れるものではなく、特許請求の範囲内において、種々改
変することができる。
【0088】例えば、上記実施形態では、入力された画
像データの色空間を、RGB表色系からLab表色系に
変換して画像処理するようにしたが、スキャナ50で読
み取って得られた画像データのRGB表色系等、他の色
空間を使用して画像処理を行うことも可能である。
【0089】また、上述した文字画像の連続性に着目し
た第1〜第5の評価ポイントを算出する方法は、上記実
施形態で示した式等に限定されるものではない。例え
ば、次式により第2の評価ポイントP2nを計算すること
も可能である。
【0090】
【数4】
【0091】また、上記実施形態では、文字連続性度P
n は、第1〜5の評価ポイントに基づいて総合的に求め
られるが、これに限定されるものではない。文字連続性
度Pn は、例えば、第1〜5の評価ポイントのうちの一
つ、あるいは二つ以上を任意に組み合わせたものに基づ
いて求められるようにすることも可能である。
【0092】また、上記実施形態では、出力形式判定部
33は、文字認識確度Cn と文字連続性度Pn とに基づ
いて、図6に示す方法で、各文字画像についての出力形
式の判定を行っているが、これに限定されるものではな
い。出力形式判定部33は、例えば、文字認識確度Cn
の閾値CTh を文字連続性度Pn に応じて連続的に変化
させる図10に示す方法で、各文字画像についての出力
形式の判定を行うことも可能である。
【0093】また、簡易な出力形式の判定処理を行う場
合には、文字画像から文字コードを認識する確からしさ
の度合いを定量的に(例えば10段階で)検出すること
なく、文字画像から文字コードを認識できたか否かのみ
を検出し、出力形式判定部33が、文字コードが認識さ
れた文字画像を文字コードデータに変換するか否かを、
文字連続性度を用いて判定するようにしてもよい。
【0094】さらに、上記実施形態では、画像認識装置
としてコンピュータを例に挙げて説明したが、本発明の
画像認識装置はこれに限定されるものではなく、例えば
同様の処理をスキャナで行ってコンピュータやプリンタ
等に送信するシステム、スキャナから直接画像データを
受信してプリンタで同様の処理を行うシステム、原稿の
読み取りから用紙への印刷までの処理をカラーのデジタ
ルコピー機ですべて行うシステム、等にも適用すること
が可能である。
【0095】なお、上記した実施形態において、画像認
識の制御は、上記した処理手順(図4、図5参照)を記
述した所定のプログラムを主制御部11が実行すること
によって行われるものであり、この所定のプログラム
は、コンピュータ読取可能な記録媒体(例えば、フロッ
ピー(登録商標)ディスクやCD−ROM等)によって
提供されることもできる。また、この所定のプログラム
は、上記各処理を実行するアプリケーションソフトウェ
アとして提供されてもよいし、コンピュータ、デジタル
コピー機、スキャナ、プリンタ等の各情報機器や管理サ
ーバの一機能として各情報機器や管理サーバのソフトウ
ェアに組み込んでもよい。
【0096】
【発明の効果】以上説明したように、本発明によれば、
文字画像から文字コードを認識した後に、当該文字画像
を文字コードデータに変換するか否かの判定を、文字連
続性度を用いて行うようにしたので、非文字画像である
図形画像であるにもかかわらず誤って文字コードが認識
されて、文字コードデータとして出力される事態を有効
に防止することができる。
【0097】しかも、文字連続性度を用いることによ
り、文字コードを認識する確からしさに高目の厳しい閾
値を設けなくても誤認識の文字コードデータを除去する
ことが可能となるため、入力された画像データ中の文字
画像が文字コードデータに変換される割合を高く維持す
ることができる。
【0098】また、文字コードデータに変換しないと判
定された文字画像のうち文字連続性度が所定値以上の文
字画像を切り出して文字画像データを作成し、隣接する
文字コードデータに重なることなく連続して配置するよ
うにしたので、文字コードデータと文字画像データとを
重なることなく出力することが可能となる。
【図面の簡単な説明】
【図1】 本発明の実施形態に係る画像認識装置を含む
情報機器システムの構成を示す図である。
【図2】 図1に示されるコンピュータの概略構成を示
すブロック図である。
【図3】 各文字画像の位置情報を説明するための図で
ある。
【図4】 画像認識処理を示すフローチャートである。
【図5】 図4に示される出力形式判定処理を示すサブ
ルーチンのフローチャートである。
【図6】 出力形式の判定基準を説明するための図であ
る。
【図7】 文字消去処理を説明するための図である。
【図8】 文字コードデータ、文字画像データ、および
非文字画像である図形画像をそのまま残した画像データ
をあわせて配置した一例を示す図である。
【図9】 文字コードデータ、文字画像データ、および
画像データの内容を別々に示す図である。
【図10】 出力形式の他の判定基準を説明するための
図である。
【図11】 非文字である図形が文字部の中に埋め込ま
れた原稿の一例を示す図である。
【図12】 従来の画像認識装置により、図11の原稿
を読み取って得られた画像データを画像処理して出力し
た一例を示す図である。
【符号の説明】
10…コンピュータ(画像認識装置)、 31…文字認識部、 33…出力形式判定部、 34…文字画像データ作成部、 36…ファイル作成部。

Claims (9)

    【特許請求の範囲】
  1. 【請求項1】 画像認識装置において、 入力された画像データ中の文字画像から文字コードを認
    識する文字認識部と、 文字コードが認識された文字画像についての、近隣の文
    字画像との連続性の度合いである文字連続性度を検出す
    る文字連続性度検出部と、 文字コードが認識された文字画像を文字コードデータに
    変換するか否かを、文字連続性度を用いて判定する出力
    形式判定部と、 を有することを特徴とする画像認識装置。
  2. 【請求項2】 前記文字連続性度検出部は、文字コード
    が認識された文字画像と該文字画像の近隣の文字画像と
    の距離、文字コードが認識された文字画像と該文字画像
    の近隣の文字画像とのフォントサイズの差、文字コード
    が認識された文字画像と該文字画像の近隣の文字画像と
    のフォントのタイプの相違、文字コードが認識された文
    字画像が含まれる連続した文字画像の列の長さ、および
    文字コードが認識された文字画像と該文字画像の近隣の
    文字画像との色の差のうち、少なくともいずれか一つ以
    上を検出することを特徴とする請求項1に記載の画像認
    識装置。
  3. 【請求項3】 前記文字認識部は、さらに文字コードを
    認識する確からしさの度合いである文字認識確度を検出
    し、 前記出力形式判定部は、前記文字認識部により検出され
    た文字認識確度と、前記文字連続性度検出部により検出
    された文字連続性度とに基づいて判定することを特徴と
    する請求項1または2に記載の画像認識装置。
  4. 【請求項4】 入力された画像データ中の文字画像が切
    り出されて形成され、隣接する文字コードデータに重な
    ることなく連続して配置される文字画像データを作成す
    る文字画像データ作成部、をさらに有し、 前記出力形式判定部は、文字コードデータに変換しない
    と判定された文字画像のうち文字連続性度が所定値以上
    の文字画像を切り出して、文字画像データを作成すると
    判定することを特徴とする請求項1〜3のいずれかに記
    載の画像認識装置。
  5. 【請求項5】 電子ファイルを作成するファイル作成
    部、をさらに有することを特徴とする請求項1〜4のい
    ずれかに記載の画像認識装置。
  6. 【請求項6】 原稿を読み取ることによって画像データ
    を得るスキャナ部、をさらに有することを特徴とする請
    求項1〜5のいずれかに記載の画像認識装置。
  7. 【請求項7】 画像データを受信する画像データ受信部
    と、データを用紙に印刷するプリント部と、をさらに有
    することを特徴とする請求項1〜6のいずれかに記載の
    画像認識装置。
  8. 【請求項8】 画像認識方法において、 入力された画像データ中の文字画像から文字コードを認
    識する過程と、 文字コードが認識された文字画像についての、近隣の文
    字画像との連続性の度合いである文字連続性度を検出す
    る過程と、 文字コードが認識された文字画像を文字コードデータに
    変換するか否かを、文字連続性度を用いて判定する過程
    と、 を有することを特徴とする画像認識方法。
  9. 【請求項9】 画像認識プログラムを記録したコンピュ
    ータ読取可能な記録媒体であって、 入力された画像データ中の文字画像から文字コードを認
    識する過程と、 文字コードが認識された文字画像についての、近隣の文
    字画像との連続性の度合いである文字連続性度を検出す
    る過程と、 文字コードが認識された文字画像を文字コードデータに
    変換するか否かを、文字連続性度を用いて判定する過程
    と、 をコンピュータに実行させるための画像認識プログラム
    を記録したコンピュータ読取可能な記録媒体。
JP2000195146A 2000-06-28 2000-06-28 画像認識装置、画像認識方法および画像認識プログラムを記録したコンピュータ読取可能な記録媒体 Expired - Fee Related JP4613397B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2000195146A JP4613397B2 (ja) 2000-06-28 2000-06-28 画像認識装置、画像認識方法および画像認識プログラムを記録したコンピュータ読取可能な記録媒体
US09/892,617 US7149352B2 (en) 2000-06-28 2001-06-28 Image processing device, program product and system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000195146A JP4613397B2 (ja) 2000-06-28 2000-06-28 画像認識装置、画像認識方法および画像認識プログラムを記録したコンピュータ読取可能な記録媒体

Publications (2)

Publication Number Publication Date
JP2002015280A true JP2002015280A (ja) 2002-01-18
JP4613397B2 JP4613397B2 (ja) 2011-01-19

Family

ID=18693855

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000195146A Expired - Fee Related JP4613397B2 (ja) 2000-06-28 2000-06-28 画像認識装置、画像認識方法および画像認識プログラムを記録したコンピュータ読取可能な記録媒体

Country Status (2)

Country Link
US (1) US7149352B2 (ja)
JP (1) JP4613397B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010020394A (ja) * 2008-07-08 2010-01-28 Canon Inc 画像処理装置および方法
JP2014032665A (ja) * 2009-01-28 2014-02-20 Google Inc 出版物からocr認識されたテキストとそれに対応するイメージをクライアント装置において選択に表示すること

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4189506B2 (ja) * 2000-06-09 2008-12-03 コニカミノルタビジネステクノロジーズ株式会社 画像処理のための装置、方法及び記録媒体
US20050216564A1 (en) * 2004-03-11 2005-09-29 Myers Gregory K Method and apparatus for analysis of electronic communications containing imagery
JP2005301664A (ja) * 2004-04-12 2005-10-27 Fuji Xerox Co Ltd 画像辞書作成装置、符号化装置、データファイル、画像辞書作成方法及びそのプログラム
US7734092B2 (en) * 2006-03-07 2010-06-08 Ancestry.Com Operations Inc. Multiple image input for optical character recognition processing systems and methods
JP2007304864A (ja) * 2006-05-11 2007-11-22 Fuji Xerox Co Ltd 文字認識処理システムおよび文字認識処理プログラム
JP4600491B2 (ja) * 2008-02-26 2010-12-15 富士ゼロックス株式会社 画像処理装置及び画像処理プログラム
US9008425B2 (en) * 2013-01-29 2015-04-14 Xerox Corporation Detection of numbered captions
JP2016015115A (ja) * 2014-06-09 2016-01-28 株式会社リコー 情報処理装置、情報処理方法、及び記録媒体
CN110636181A (zh) * 2016-03-01 2019-12-31 京瓷办公信息系统株式会社 信息处理装置
JP6530432B2 (ja) * 2017-02-03 2019-06-12 株式会社東芝 画像処理装置、画像処理方法及びプログラム
JP2022072391A (ja) * 2020-10-29 2022-05-17 株式会社リコー 画像処理装置、画像処理方法、およびプログラム

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6274181A (ja) * 1985-09-27 1987-04-04 Sony Corp 文字認識装置
JPH0634256B2 (ja) * 1987-03-04 1994-05-02 シャープ株式会社 接触文字切出し方法
JPH01191992A (ja) * 1988-01-28 1989-08-02 Canon Inc 文字認識装置
JPH0290384A (ja) * 1988-09-28 1990-03-29 Ricoh Co Ltd 文字認識装置の後処理方式
JPH04293185A (ja) * 1991-03-20 1992-10-16 Ricoh Co Ltd ファイリング装置
JPH0537700A (ja) 1991-07-26 1993-02-12 Ricoh Co Ltd フアクシミリ装置
JPH05108872A (ja) * 1991-10-18 1993-04-30 Canon Inc 文字認識方法及びその装置
EP0564201B1 (en) * 1992-03-30 2000-05-24 Canon Kabushiki Kaisha Image processing apparatus and method
JPH0620089A (ja) * 1992-06-30 1994-01-28 Canon Inc データ入力装置及びデータ処理装置
JPH0855185A (ja) 1994-08-15 1996-02-27 Matsushita Electric Ind Co Ltd 文字認識装置
JP3400151B2 (ja) * 1994-12-08 2003-04-28 株式会社東芝 文字列領域抽出装置および方法
JP3602596B2 (ja) * 1995-02-22 2004-12-15 株式会社東芝 ドキュメントファイリング装置および方法
JP3345224B2 (ja) * 1995-03-06 2002-11-18 富士通株式会社 パターン抽出装置、パターン再認識用テーブル作成装置及びパターン認識装置
JPH0991371A (ja) 1995-09-21 1997-04-04 Nippon Telegr & Teleph Corp <Ntt> 文字表示装置
JP3427692B2 (ja) * 1996-11-20 2003-07-22 松下電器産業株式会社 文字認識方法および文字認識装置
US6327387B1 (en) * 1996-12-27 2001-12-04 Fujitsu Limited Apparatus and method for extracting management information from image
JPH10290349A (ja) 1997-04-14 1998-10-27 Ricoh Co Ltd ファクシミリ装置
JPH10313372A (ja) 1997-05-13 1998-11-24 Sanyo Electric Co Ltd データ通信装置
JP3190603B2 (ja) * 1997-09-05 2001-07-23 翼システム株式会社 文字読み取り装置、その読み取り方法および記録媒体
JP2000353215A (ja) * 1999-06-11 2000-12-19 Nec Corp 文字認識装置および文字認識プログラムを記録した記録媒体

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010020394A (ja) * 2008-07-08 2010-01-28 Canon Inc 画像処理装置および方法
US8452095B2 (en) 2008-07-08 2013-05-28 Canon Kabushiki Kaisha Image processing for post-processing rate of character rectangle extraction and character recognition accuracy
JP2014032665A (ja) * 2009-01-28 2014-02-20 Google Inc 出版物からocr認識されたテキストとそれに対応するイメージをクライアント装置において選択に表示すること
US9280952B2 (en) 2009-01-28 2016-03-08 Google Inc. Selective display of OCR'ed text and corresponding images from publications on a client device

Also Published As

Publication number Publication date
US7149352B2 (en) 2006-12-12
JP4613397B2 (ja) 2011-01-19
US20020015524A1 (en) 2002-02-07

Similar Documents

Publication Publication Date Title
US6574375B1 (en) Method for detecting inverted text images on a digital scanning device
JP4655335B2 (ja) 画像認識装置、画像認識方法および画像認識プログラムを記録したコンピュータ読取可能な記録媒体
US20010041006A1 (en) Ruled line extracting apparatus for extracting ruled line from normal document image and method thereof
US7805022B2 (en) Image processing apparatus, image processing method and computer program
JP2001297303A (ja) 文書画像認識方法、装置及びコンピュータ読み取り可能な記録媒体
US7796817B2 (en) Character recognition method, character recognition device, and computer product
JPH0713995A (ja) 自動テキスト特徴決定装置
JPH05282488A (ja) 文書画像の復号なしに文書の意味的に重要な部分の自動変更のための方法
US11568623B2 (en) Image processing apparatus, image processing method, and storage medium
JP4613397B2 (ja) 画像認識装置、画像認識方法および画像認識プログラムを記録したコンピュータ読取可能な記録媒体
US7146047B2 (en) Image processing apparatus and method generating binary image from a multilevel image
JP4077919B2 (ja) 画像処理方法及び装置及びその記憶媒体
JP4232679B2 (ja) 画像形成装置およびプログラム
JP2021044803A (ja) 画像処理装置、画像処理方法、及びプログラム
JP5601027B2 (ja) 画像処理装置及び画像処理プログラム
JP4810853B2 (ja) 文字画像切出装置、文字画像切出方法およびプログラム
JP3276555B2 (ja) フォーマット認識装置及び文字読取り装置
US8125691B2 (en) Information processing apparatus and method, computer program and computer-readable recording medium for embedding watermark information
JP4731748B2 (ja) 画像処理装置、方法、プログラム及び記憶媒体
JP2002049890A (ja) 画像認識装置、画像認識方法および画像認識プログラムを記録したコンピュータ読取可能な記録媒体
JP3960756B2 (ja) 文書画像レイアウト識別方法および装置
JP4810995B2 (ja) 画像処理装置、方法及びプログラム
JP2887823B2 (ja) 文書認識装置
JPH06259597A (ja) ドキュメントイメージ処理方法並びに文字認識システムおよびドキュメントイメージ処理装置
JP2022167414A (ja) 画像処理装置、画像処理方法およびプログラム

Legal Events

Date Code Title Description
A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A712

Effective date: 20040423

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070521

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20070601

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100402

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100406

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100603

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20100921

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20101004

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131029

Year of fee payment: 3

S111 Request for change of ownership or part of ownership

Free format text: JAPANESE INTERMEDIATE CODE: R313111

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

LAPS Cancellation because of no payment of annual fees