JP2000306044A - 画像認識装置及びその制御方法及びコンピュータ読み取り可能な記憶媒体 - Google Patents

画像認識装置及びその制御方法及びコンピュータ読み取り可能な記憶媒体

Info

Publication number
JP2000306044A
JP2000306044A JP11113934A JP11393499A JP2000306044A JP 2000306044 A JP2000306044 A JP 2000306044A JP 11113934 A JP11113934 A JP 11113934A JP 11393499 A JP11393499 A JP 11393499A JP 2000306044 A JP2000306044 A JP 2000306044A
Authority
JP
Japan
Prior art keywords
area
character
image
image data
graphic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP11113934A
Other languages
English (en)
Inventor
Yasumasa Sakai
康真 坂井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP11113934A priority Critical patent/JP2000306044A/ja
Publication of JP2000306044A publication Critical patent/JP2000306044A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Character Discrimination (AREA)
  • Character Input (AREA)

Abstract

(57)【要約】 【課題】 図形領域に含まれる文字領域には文字認識処
理を行わない画像認識装置及びその制御方法及びコンピ
ュータ読み取り可能な記憶媒体の提供。 【解決手段】 領域分割処理(S202)によって文字領域と
判断された領域に対して文字認識(S206)を行ったとき
に、当該文字領域をテキストデータに変換できないとき
(S209)には、変換前のイメージデータを、当該文字領域
を含む図形領域の一部として定義し直す(S210)ことによ
り、所定形式の1つのファイルとして編集(S212)した後
で、ディスプレイに再現表示する際には、当該文字領域
に実際には含まれていた文字パターンを、イメージとし
て表示する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、画像認識装置及び
その制御方法及びコンピュータ読み取り可能な記憶媒体
に関し、特に、画像認識結果を原稿画像のレイアウトを
表わす構造情報と共に保存可能な画像認識装置及びその
制御方法及びコンピュータ読み取り可能な記憶媒体に関
する。
【0002】
【従来の技術】従来より、原稿画像を読み取り、その読
み取り結果に基づいて画像の認識を行う画像認識装置
(以下、OCR)においては、読み取った原稿画像のイ
メージを、文字、図形、表等の複数種類の領域に分割
し、その分割した複数の領域の中から文字領域を抽出
し、その抽出した文字領域に含まれる文字のイメージを
テキストデータ等に変換する文字認識処理が行われてい
る。
【0003】また、近年においては、領域分割処理によ
って原稿画像を構成する複数の領域のレイアウト情報を
求め、そのレイアウト情報を文字認識処理等の認識結果
と共に、例えばRTF(Rich Text Format)、HTML(H
yper Text Markup Language)等のファイル形式で保存可
能なOCRも利用されている。
【0004】
【発明が解決しようとする課題】しかしながら、原稿画
像のレイアウト情報をも保存可能な上記のOCRにおい
ては、領域分割処理によって検出した文字領域に対して
文字認識処理を施すに際して、一般に、領域分割処理に
よって得られた文字領域のイメージをそのまま利用して
文字認識を行うため、その認識結果と共にレイアウト情
報を保存すると、以下に述べる問題がある。
【0005】即ち、原稿画像のイメージに対する領域分
割処理によって図形領域として認識された領域内に、実
際の原稿には文字領域が含まれる場合には、その文字領
域に対して文字認識処理を施すのは一般に困難である。
このような場合、保存してある認識結果とレイアウト情
報とに基づいて表示画面に原稿画像を再現表示すると、
図形領域内に含まれる文字領域に相当する表示部分が欠
けて表示される、或いは不完全な文字認識結果が表示さ
れることになり見苦しい場合が多い。
【0006】そこで本発明は、図形領域に含まれる文字
領域には文字認識処理を行わない画像認識装置及びその
制御方法及びコンピュータ読み取り可能な記憶媒体の提
供を目的とする。
【0007】
【課題を解決するための手段】上記の目的を達成するた
め、本発明に係る画像認識装置は、以下の構成を特徴と
する。
【0008】即ち、原稿画像を表わすイメージデータ
を、少なくとも文字領域と図形領域とに領域分割する領
域分割手段と、前記領域分割手段によって検出した文字
領域のイメージデータを、所定のデータコードに変換す
る文字認識手段と、前記領域分割手段によって検出した
図形領域内に含まれる文字領域のイメージデータを、前
記文字認識手段によって変換できないときに、その文字
領域のイメージデータを該図形領域のイメージデータと
して定義する定義手段とを備えることを特徴とする。
【0009】また、原稿画像を表わすイメージデータ
を、少なくとも文字領域と図形領域とに領域分割する領
域分割手段と、前記領域分割手段によって検出した図形
領域内に文字領域のイメージデータが含まれると判断し
たとき、その文字領域のイメージデータを該図形領域の
イメージデータとして定義する定義手段と、前記領域分
割手段によって検出した何れの図形領域にも含まれない
文字領域のイメージデータを、所定のデータコードに変
換する文字認識手段とを備えることを特徴とする。
【0010】好ましくは、更に、前記領域分割手段によ
って検出した各領域の情報及び前記文字認識手段により
認識した文字領域のデータコードを所定のファイル形式
で記憶する記憶手段と、前記記憶手段に所定のファイル
形式で記憶した各領域の情報及びデータコードに基づい
て、前記原稿画像に相当する画面を再現表示する表示手
段とを備えると良い。
【0011】また、上記の目的を達成するため、本発明
に係る画像認識装置の制御方法は、以下の構成を特徴と
する。
【0012】即ち、原稿画像を表わすイメージデータ
を、少なくとも文字領域と図形領域とに領域分割する領
域分割工程と、前記領域分割工程にて検出した文字領域
のイメージデータを、所定のデータコードに変換する文
字認識工程と、前記領域分割工程にて検出した図形領域
内に含まれる文字領域のイメージデータを、前記文字認
識工程にて変換できないときに、その文字領域のイメー
ジデータを該図形領域のイメージデータとして定義する
定義工程とを有することを特徴とする。
【0013】または、原稿画像を表わすイメージデータ
を、少なくとも文字領域と図形領域とに領域分割する領
域分割工程と、前記領域分割工程にて検出した図形領域
内に文字領域のイメージデータが含まれると判断したと
き、その文字領域のイメージデータを該図形領域のイメ
ージデータとして定義する定義工程と、前記領域分割工
程にて検出した何れの図形領域にも含まれない文字領域
のイメージデータを、所定のデータコードに変換する文
字認識工程とを有することを特徴とする。
【0014】更に、上記の画像認識装置及び制御方法
を、コンピュータによって実現するプログラムコードが
格納されている、コンピュータ読み取り可能な記憶媒体
を特徴とする。
【0015】
【発明の実施の形態】以下、本発明に係る画像認識装置
の実施形態を、図面を参照して詳細に説明する。
【0016】[第1の実施形態]図1は、本発明の第1
の実施形態における画像認識装置の構成を示すブロック
図である。
【0017】同図において、1は、原稿画像を読み取る
一般的なスキャナである。2は、スキャナ1によって読
み取った(外部より入手しても良い)原稿画像のデー
タ、並びに認識結果をRTFやHTML等の所定のファ
イル形式で保存する記憶装置としてのハードディスク装
置である。3は、当該画像認識装置に指示を入力可能な
入力装置としてのキーボードである。4は、スキャナ1
によって読み取った原稿画像の再現画像や、認識結果等
が表示されるディスプレイである。5は、一般的な領域
分割処理、文字認識処理等をMPU7が実行する際に一
時記憶領域として使用するRAMである。6は、ブート
プログラム等が予め記憶されているROMである。これ
らの各ブロックは、ハードディスク装置2等に記憶され
ているプログラムに従って動作するMPU7によって制
御される。
【0018】尚、図1に示す画像認識装置は、一般的な
パーソナルコンピュータにスキャナ1を接続したシステ
ムとして構成しても、図1に示す各ブロックの構成を備
える専用のハードウエアとして構成しても良い。
【0019】次に、MPU7によって実行される本実施
形態における画像認識処理のソフトウエアについて説明
する。
【0020】図2は、本発明の第1の実施形態における
画像認識処理を示すフローチャートである。
【0021】同図において、ステップ201:スキャナ
1により、一般的な手法によって原稿画像を読み込む。
読み込まれた原稿画像のデータは、ハードディスク装置
2に格納されると共に、RAM5へロードされる。
【0022】ステップ202:RAM5上の原稿画像の
データに対して、一般的な領域分割処理を施すことによ
り、読み取った原稿画像(イメージデータ)を、文字、
図形、表等の複数種類の領域に分割する。この領域分割
の結果が、文字領域のとき(ステップ203)にはステ
ップS206に、図形領域のとき(ステップ204)に
はステップS207に、そして表領域であるとき(ステ
ップ205)にはステップS208に進む。
【0023】ステップ206:文字領域と判断した画像
データに対して、一般的な文字認識処理を施すことによ
り、当該画像データを、テキストデータ等に変換する。
【0024】ステップ209:ステップS206の文字
認識処理によって対象としている文字領域に対する文字
認識の結果が得られたか否かの判断を行い、文字認識結
果が有る場合にはステップ211に、文字認識結果が無
い場合にはステップ210に進む。
【0025】ステップS211:ステップS206で得
られた文字認識結果を、RAM5上に確保された所定の
領域に書き込む。
【0026】ステップS210:ステップS206で文
字認識できなかったときには、ステップS202で文字
領域と判別した領域を、その文字領域を含む図形領域を
構成するイメージデータの一部として定義することによ
り、当該文字認識を取り消す。
【0027】ステップ207:ステップS202で判別
した図形領域のイメージデータを切り出し(抽出し)、
その切り出したデータをRAM5上に確保された所定の
領域へ書き込む。
【0028】ステップS208:ステップS202で表
領域と判別したイメージデータに対して一般的な表解析
処理を施すことにより、当該表領域を構成する行及び列
数等の解析を行い、その解析によって得られた当該表領
域に関する情報を、RAM5上に確保された所定の領域
に書き込む。
【0029】ステップ212:ステップS210,ステ
ップS211,ステップS208にてRAM5上に保存
した各種領域のデータを所定の形式で編集することによ
って1つのファイルとしてまとめ、そのファイルをハー
ドディスク装置2に格納する。
【0030】このように、本実施形態によれば、領域分
割処理によって文字領域と判断された領域に対して文字
認識を行ったときに、当該文字領域をテキストデータに
変換できないときには、変換前のイメージデータを、当
該文字領域を含む図形領域の一部として定義し直すた
め、所定形式の1つのファイルとして編集した後で、デ
ィスプレイ4に再現表示する際には、当該文字領域に実
際には含まれていた文字パターンを、イメージとして表
示することができ、不完全な文字認識結果を表示する、
或いは全く表示できない上述した従来の場合と比較し
て、表示画面の見栄えを改善することができる。
【0031】[第2の実施形態]次に、上述した第1の
実施形態に係る画像認識装置を基本として、第2の実施
形態を説明する。以下の説明においては、第1の実施形
態と同様な構成については説明を省略し、本実施形態に
おける特徴的な部分を中心に説明する。
【0032】図3は、本発明の第2の実施形態における
画像認識処理を示すフローチャートである。
【0033】同図において、ステップS301からステ
ップS305は、図2に示すステップS201からステ
ップS205の処理と同様な処理である。
【0034】ステップS306:ステップS302の領
域分割処理で文字領域と判定したイメージデータが同ス
テップで図形領域と判定した他の領域に含まれているか
否かを判断し、YESのとき(対象としている文字領域
が図形領域に含まれるとき)にはステップS307に、
NOのとき(対象としている文字領域が単独で存在する
とき)にはステップS308に進む。ここで、ある領域
が他の領域に含まれている(包含されている)か否か
は、例えば各領域が矩形形状のときには、共通の2次元
座標系において、その各領域を構成する4つの角部の座
標値の大小関係を比較することによって容易に判断する
ことができる。
【0035】ステップS307:ステップS306で取
り込まれたイメージデータを含む図形領域が、更に他の
図形領域に含まれているか否かを判断し、YESのとき
(対象としている文字領域が他の図形領域に含まれると
き)にはステップS309に、NOのとき(対象として
いる文字領域がステップS306で検出した図形領域だ
けに含まれるとき)にはステップS308に進む。
【0036】ステップS308:図2のステップS20
6と同様に、文字領域と判断した画像データに対して、
一般的な文字認識処理を施すことにより、当該画像デー
タをテキストデータ等に変換すると共に、得られた文字
認識結果を、RAM5上に確保された所定の領域に書き
込む。
【0037】ステップS309:図2のステップS21
0と同様に、ステップS302で文字領域と判別した領
域を、その文字領域を含む図形領域を構成するイメージ
データの一部として定義することにより、当該文字認識
を取り消す。
【0038】ステップS310:図2のステップS20
7と同様に、判別した図形領域のイメージデータを切り
出し(抽出し)、その切り出したデータをRAM5上に
確保された所定の領域へ書き込む。
【0039】ステップS311:図2のステップS20
8と同様に、表領域と判別したイメージデータに対して
一般的な表解析処理を施すことにより、当該表領域を構
成する行及び列数等の解析を行い、その解析によって得
られた当該表領域に関する情報を、RAM5上に確保さ
れた所定の領域に書き込む。
【0040】ステップS312:図2のステップ212
と同様に、ステップS308,ステップS310,ステ
ップS311にてRAM5上に保存した各種領域のデー
タを所定の形式で編集することによって1つのファイル
としてまとめ、そのファイルをハードディスク装置2に
格納する。
【0041】このように、本実施形態によれば、領域分
割処理によって文字領域と判断された領域に対しては、
文字認識処理を行うのに先立って、その領域が図形領域
に含まれていないかを判断し、その判断で当該文字領域
が図形領域に含まれていると判断したときには、その図
形領域が更に他の図形領域に含まれていないかを判断
し、他の図形領域に含まれていると判断した時点で第1
の実施形態と同様に当該文字領域を含む図形領域の一部
として定義し直す。これにより、所定形式の1つのファ
イルとして編集した後で、ディスプレイ4に再現表示す
る際には、当該文字領域に実際には含まれていた文字パ
ターンを、イメージとして表示することができ、第1の
実施形態と同様に表示画面の見栄えを改善することがで
きると共に、文字認識処理の実行回数を軽減することが
でき、原稿画像を読み取ってから表示するまでのスルー
プットを向上させることができる。
【0042】
【他の実施形態】尚、上述した各実施形態における画像
認識装置は、複数の機器(例えばホストコンピュータ、
インタフェイス機器、リーダ、プリンタなど)から構成
されるシステムに適用しても、一つの機器からなる装置
(例えば、複写機、ファクシミリ装置など)に適用して
もよい。
【0043】また、本発明の目的は、前述した実施形態
の機能を実現するソフトウェアのプログラムコードを記
録した記憶媒体(または記録媒体)を、システムあるい
は装置に供給し、そのシステムあるいは装置のコンピュ
ータ(またはCPUやMPU)が記憶媒体に格納されたプログ
ラムコードを読み出し実行することによっても、達成さ
れることは言うまでもない。この場合、記憶媒体から読
み出されたプログラムコード自体が前述した実施形態の
機能を実現することになり、そのプログラムコードを記
憶した記憶媒体は本発明を構成することになる。また、
コンピュータが読み出したプログラムコードを実行する
ことにより、前述した実施形態の機能が実現されるだけ
でなく、そのプログラムコードの指示に基づき、コンピ
ュータ上で稼働しているオペレーティングシステム(OS)
などが実際の処理の一部または全部を行い、その処理に
よって前述した実施形態の機能が実現される場合も含ま
れることは言うまでもない。
【0044】さらに、記憶媒体から読み出されたプログ
ラムコードが、コンピュータに挿入された機能拡張カー
ドやコンピュータに接続された機能拡張ユニットに備わ
るメモリに書込まれた後、そのプログラムコードの指示
に基づき、その機能拡張カードや機能拡張ユニットに備
わるCPUなどが実際の処理の一部または全部を行い、そ
の処理によって前述した実施形態の機能が実現される場
合も含まれることは言うまでもない。
【0045】
【発明の効果】以上説明したように、本発明によれば、
図形領域に含まれる文字領域には文字認識処理を行わな
い画像認識装置及びその制御方法及びコンピュータ読み
取り可能な記憶媒体の提供が実現する。
【図面の簡単な説明】
【図1】本発明の第1の実施形態における画像認識装置
の構成を示すブロック図である。
【図2】本発明の第1の実施形態における画像認識処理
を示すフローチャートである。
【図3】本発明の第2の実施形態における画像認識処理
を示すフローチャートである。
【符号の説明】
1:スキャナ, 2:ハードディスク装置, 3:キーボード, 4:ディスプレイ, 5:RAM, 6:ROM, 7:マイクロプロセッサ,

Claims (8)

    【特許請求の範囲】
  1. 【請求項1】 原稿画像を表わすイメージデータを、少
    なくとも文字領域と図形領域とに領域分割する領域分割
    手段と、 前記領域分割手段によって検出した文字領域のイメージ
    データを、所定のデータコードに変換する文字認識手段
    と、 前記領域分割手段によって検出した図形領域内に含まれ
    る文字領域のイメージデータを、前記文字認識手段によ
    って変換できないときに、その文字領域のイメージデー
    タを該図形領域のイメージデータとして定義する定義手
    段と、を備えることを特徴とする画像認識装置。
  2. 【請求項2】 原稿画像を表わすイメージデータを、少
    なくとも文字領域と図形領域とに領域分割する領域分割
    手段と、 前記領域分割手段によって検出した図形領域内に文字領
    域のイメージデータが含まれると判断したとき、その文
    字領域のイメージデータを該図形領域のイメージデータ
    として定義する定義手段と、 前記領域分割手段によって検出した何れの図形領域にも
    含まれない文字領域のイメージデータを、所定のデータ
    コードに変換する文字認識手段と、を備えることを特徴
    とする画像認識装置。
  3. 【請求項3】 更に、前記領域分割手段によって検出し
    た各領域の情報及び前記文字認識手段により認識した文
    字領域のデータコードを所定のファイル形式で記憶する
    記憶手段を備えることを特徴とする請求項1または請求
    項2記載の画像認識装置。
  4. 【請求項4】 更に、前記記憶手段に所定のファイル形
    式で記憶した各領域の情報及びデータコードに基づい
    て、前記原稿画像に相当する画面を再現表示する表示手
    段を備えることを特徴とする請求項3記載の画像認識装
    置。
  5. 【請求項5】 原稿画像を表わすイメージデータを、少
    なくとも文字領域と図形領域とに領域分割する領域分割
    工程と、 前記領域分割工程にて検出した文字領域のイメージデー
    タを、所定のデータコードに変換する文字認識工程と、 前記領域分割工程にて検出した図形領域内に含まれる文
    字領域のイメージデータを、前記文字認識工程にて変換
    できないときに、その文字領域のイメージデータを該図
    形領域のイメージデータとして定義する定義工程と、を
    有することを特徴とする画像認識装置の制御方法。
  6. 【請求項6】 原稿画像を表わすイメージデータを、少
    なくとも文字領域と図形領域とに領域分割する領域分割
    工程と、 前記領域分割工程にて検出した図形領域内に文字領域の
    イメージデータが含まれると判断したとき、その文字領
    域のイメージデータを該図形領域のイメージデータとし
    て定義する定義工程と、 前記領域分割工程にて検出した何れの図形領域にも含ま
    れない文字領域のイメージデータを、所定のデータコー
    ドに変換する文字認識工程と、を有することを特徴とす
    る画像認識装置の制御方法。
  7. 【請求項7】 請求項1乃至請求項4の何れかに記載の
    画像認識装置としてコンピュータを動作させるプログラ
    ムコードが格納されていることを特徴とするコンピュー
    タ読み取り可能な記憶媒体。
  8. 【請求項8】 請求項5または請求項6記載の画像認識
    装置の制御方法をコンピュータによって実現可能なプロ
    グラムコードが格納されていることを特徴とするコンピ
    ュータ読み取り可能な記憶媒体。
JP11113934A 1999-04-21 1999-04-21 画像認識装置及びその制御方法及びコンピュータ読み取り可能な記憶媒体 Withdrawn JP2000306044A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP11113934A JP2000306044A (ja) 1999-04-21 1999-04-21 画像認識装置及びその制御方法及びコンピュータ読み取り可能な記憶媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP11113934A JP2000306044A (ja) 1999-04-21 1999-04-21 画像認識装置及びその制御方法及びコンピュータ読み取り可能な記憶媒体

Publications (1)

Publication Number Publication Date
JP2000306044A true JP2000306044A (ja) 2000-11-02

Family

ID=14624870

Family Applications (1)

Application Number Title Priority Date Filing Date
JP11113934A Withdrawn JP2000306044A (ja) 1999-04-21 1999-04-21 画像認識装置及びその制御方法及びコンピュータ読み取り可能な記憶媒体

Country Status (1)

Country Link
JP (1) JP2000306044A (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010113407A (ja) * 2008-11-04 2010-05-20 Sharp Corp 情報クリッピング装置、情報クリッピング方法、および、情報クリッピングプログラム
JP2019074898A (ja) * 2017-10-16 2019-05-16 富士ゼロックス株式会社 情報処理装置及び情報処理プログラム

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010113407A (ja) * 2008-11-04 2010-05-20 Sharp Corp 情報クリッピング装置、情報クリッピング方法、および、情報クリッピングプログラム
JP2019074898A (ja) * 2017-10-16 2019-05-16 富士ゼロックス株式会社 情報処理装置及び情報処理プログラム
JP7069631B2 (ja) 2017-10-16 2022-05-18 富士フイルムビジネスイノベーション株式会社 情報処理装置及び情報処理プログラム

Similar Documents

Publication Publication Date Title
JP4235286B2 (ja) 表認識方法及び装置
JPH11272871A (ja) 文書画像処理装置、文書画像処理方法、及び記録媒体
JP2008146608A (ja) 画像処理装置及びその方法
JPH08129550A (ja) 画像処理装置および画像処理方法
JP2000306044A (ja) 画像認識装置及びその制御方法及びコンピュータ読み取り可能な記憶媒体
JP3370424B2 (ja) ペーパーメディア装置
JP3993025B2 (ja) 文書画像変換方法、文書画像変換プログラム及び文書画像変換装置
JP2002024838A (ja) 画像処理装置及び画像処理方法並びに記憶媒体
JPH0612540B2 (ja) 文書作成支援装置
JP2000168294A (ja) 電子黒板システム
JP2001094760A (ja) 情報処理装置
JPH08329187A (ja) 文書読取装置
JPH11187231A (ja) 画像検索装置及び画像検索方法
JP2001101327A (ja) 情報処理方法及び装置及び印刷システム
JPH11203402A (ja) 画像処理装置及び画像処理方法
JP2803736B2 (ja) 文字認識方式
JP2000112955A (ja) 画像表示方法および画像ファイリング装置および記録媒体
JPH05342325A (ja) 文書処理装置およびその装置のためのフォーム登録装置
JP3154790B2 (ja) 光学的文字読取装置
JPS594358Y2 (ja) 文字修正における文字制御装置
JP2821002B2 (ja) 文字処理装置及び文字処理方法
JPH08161420A (ja) イメージデータの読取方法及び文書作成装置
JP2002082660A (ja) 画面出力制御方法及び装置並びに記録媒体
JPH10289279A (ja) 帳票処理システムおよび方法ならびに記録媒体
JP2002092045A (ja) Dxf解析svg保存方法

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20060704