JPH09190502A

JPH09190502A - 画像処理装置およびその方法

Info

Publication number: JPH09190502A
Application number: JP8001936A
Authority: JP
Inventors: Kazuyuki Saito; 和之齋藤
Original assignee: Canon Inc
Current assignee: Canon Inc
Priority date: 1996-01-10
Filing date: 1996-01-10
Publication date: 1997-07-22
Anticipated expiration: 2016-01-10
Also published as: JP3740203B2

Abstract

(57)【要約】【課題】原稿画像内の所望の属性を有する領域に含ま
れるテキストを抽出するための操作を容易にし、作業効
率を向上する画像処理装置及びその方法を提供する。【解決手段】原稿画像を属性毎の領域に分割し、原稿
画像内に含まれる複数の属性の少なくとも１つを指定す
る。指定された属性を有する領域に含まれる文字を認識
してテキストデータをディスプレイ１０８へ出力する。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、原稿画像に含まれ
る文字を認識してテキストデータを出力する画像処理装
置及びその方法に関するものである。

【０００２】

【従来の技術】従来の画像処理装置においては、スキャ
ナ等で読み込んだ原稿の読み込み結果としてディスプレ
イ等に表示される原稿画像に対し、その原稿画像に含ま
れるテキスト情報を抽出する場合、原稿画像に含まれる
属性に従ってテキスト領域および非テキスト領域に分割
する処理である領域分割を実行した後、各領域毎に存在
するテキストのテキストの抽出処理を行っていた。ま
た、特に、非テキスト領域である表領域の中に含まれる
テキストに対しては、その表を構成する罫線を抽出した
後に、罫線に囲まれた領域内のテキストを抽出してい
た。

【０００３】

【発明が解決しようとする課題】しかしながら、上述の
従来の画像処理装置において、領域分割の処理対象であ
る原稿画像にテキスト領域と非テキスト領域が混在する
場合、例えば、非テキスト領域として表が存在する場
合、その表の中のテキストを表内テキストとして抽出を
行っても、原稿画像内のテキスト領域のテキストと表内
のテキストが区別されずに抽出されてしまい、表内のテ
キストあるいはテキスト領域のテキストだけを抽出する
ことができなかった。

【０００４】そのため、表内のテキストのみが必要な場
合、領域分割処理後、原稿画像内のテキスト領域を削除
するか、あるいは表のみを予め指定する等の操作が必要
であり、原稿画像内の所望のテキストを抽出するための
操作が煩雑になるという問題点があった。また、作業効
率を低下させていた。本発明は上記の問題点に鑑みてな
されたものであり、原稿画像内の所望の属性を有する領
域に含まれるテキストを抽出するための操作を容易に
し、作業効率を向上する画像処理装置及びその方法を提
供することを目的としている。

【０００５】

【課題を解決するための手段】上記の目的を達成するた
めの本発明による画像処理装置は以下の構成を備える。
即ち、原稿画像に含まれる文字を認識してテキストデー
タを出力する画像処理装置であって、前記原稿画像を属
性毎の領域に分割する分割手段と、前記原稿画像内に含
まれる複数の属性の少なくとも１つを指定する指定手段
と、前記指定手段で指定された属性を有する領域に含ま
れる文字を認識してテキストデータを出力する出力手段
とを備える。

【０００６】また、好ましくは、前記指定手段は、前記
原稿画像内において、所定の属性を有する領域の個数を
計数する計数手段を備え、前記計数手段の計数結果に基
づいて、前記原稿画像内に含まれる複数の属性の少なく
とも１つを指定する。また、好ましくは、前記指定手段
は、前記原稿画像内に含まれる所望の属性を、ユーザに
よって指定する。ユーザによって指定することでユーザ
の用途に応じた属性の指定をすることができるからであ
る。

【０００７】また、好ましくは、前記指定手段は、前記
原稿画像内において、所定の属性を有する領域の個数を
計数する計数手段と、前記計数手段の計数結果に基づい
て、前記原稿画像内に含まれる複数の属性の少なくとも
１つを指定する第１指定手段と、前記原稿画像内に含ま
れる所望の属性を、ユーザによって指定する第２指定手
段とを備える。

【０００８】また、好ましくは、前記第１指定手段によ
る指定から前記第２指定手段による指定、あるいは前記
第２指定手段による指定から前記第１指定手段による指
定に切り替える切替手段を更に備える。切替手段を設け
ることで、より自由度の高い属性の指定を行うことがで
きるからである。

【０００９】また、好ましくは、前記指定手段は、前記
計数手段で計数される個数が所定数以上である場合、該
所定の属性を指定する。所定数以上である場合に、所定
の属性を指定することで、原稿画像内に該所定の属性を
持つ領域がく含まれることを判定することができるから
である。また、好ましくは、前記指定手段は、前記計数
手段で計数される個数が所定数未満である場合、前記原
稿画像内に含まれるテキスト領域を指定する。

【００１０】また、好ましくは、前記所定数の変更を指
示する指示手段を更に備える。所定数の変更を指示する
ことで、所望の数を指定することができるからである。
上記の目的を達成するための本発明による画像処理方法
は以下の構成を備える。即ち、原稿画像に含まれる文字
を認識してテキストデータを出力する画像処理方法であ
って、前記原稿画像を属性毎の領域に分割する分割工程
と、前記原稿画像内に含まれる複数の属性の少なくとも
１つを指定する指定工程と、前記指定工程で指定された
属性を有する領域に含まれる文字を認識してテキストデ
ータを出力する出力工程とを備える。

【００１１】また、好ましくは、前記指定工程は、前記
原稿画像内において、所定の属性を有する領域の個数を
計数する計数工程を備え、前記計数工程の計数結果に基
づいて、前記原稿画像内に含まれる複数の属性の少なく
とも１つを指定する。また、好ましくは、前記指定工程
は、前記原稿画像内に含まれる所望の属性を、ユーザに
よって指定する。

【００１２】また、好ましくは、前記指定工程は、前記
原稿画像内において、所定の属性を有する領域の個数を
計数する計数工程と、前記計数工程の計数結果に基づい
て、前記原稿画像内に含まれる複数の属性の少なくとも
１つを指定する第１指定工程と、前記原稿画像内に含ま
れる所望の属性を、ユーザによって指定する第２指定工
程とを備える。

【００１３】また、好ましくは、前記第１指定工程によ
る指定から前記第２指定工程による指定、あるいは前記
第２指定手段による指定から前記第１指定手段による指
定に切り替える切替工程を更に備える。また、好ましく
は、前記指定工程は、前記計数工程で計数される個数が
所定数以上である場合、該所定の属性を指定する。

【００１４】また、好ましくは、前記指定工程は、前記
計数工程で計数される個数が所定数未満である場合、前
記原稿画像内に含まれるテキスト領域を指定する。ま
た、好ましくは、前記所定数の変更を指示する指示工程
を更に備える。上記の目的を達成するための本発明によ
るコンピュータ可読メモリは以下の構成を備える。即
ち、画像処理のプログラムコードが格納されたコンピュ
ータ可読メモリであって、前記原稿画像を属性毎の領域
に分割する分割工程のコードと、前記原稿画像内に含ま
れる複数の属性の少なくとも１つを指定する指定工程の
コードと、前記指定工程で指定された属性を有する領域
に含まれる文字を認識してテキストデータを出力する出
力工程のコードとを備える。

【００１５】

【発明の実施の形態】以下、図面を参照して本発明の好
適な実施の形態を詳細に説明する。図１は本実施の形態
の画像処理装置の機能構成を示すブロック図である。図
１において、１０１はスキャナであり、画像原稿に光を
照射し、その反射光を読み取り電気信号に変換する。ま
た、スキャナ１０１より読み込まれた画像原稿は、イメ
ージデータとしてＲＡＭ１０７のＶＲＡＭ領域に格納さ
れる。１０２はスキャナインターフェースであり、スキ
ャナ１０１で得られた電気信号を２値のデジタル電気信
号に変換し、他の装置構成要素に伝送する。１０３はポ
インティングデバイスとして機能するマウスであり、マ
ウス１０３を移動することでディスプレイ１０８上に表
示されるカーソル１００（図６参照）を移動する。ま
た、画面に表示されるメニューにカーソル１００を位置
し、そのメニュー上で付帯するボタン（不図示）を用い
てドラッグ操作、クリック操作を行うことで、その内容
を実行することができる。１０４はマウスインタフェー
スであり、マウス１０３からの信号を受け、それを他の
装置構成要素に伝送する。１１４はＫＢ（キーボード）
であり、キーボードを介してデータの入力や命令の実行
を行う。１１３はＫＢインターフェースであり、ＫＢ１
１４からの信号を受け、それを他の装置構成要素に伝送
する。

【００１６】１０５はＣＰＵであり、装置全体の制御及
び文字切り出し処理や認識処理を実行する。１０６はＲ
ＯＭであり、ＣＰＵ１０５が実行する制御プログラム、
各種処理プログラムやフォントデータ等の各種データを
格納している。１０７はＲＡＭであり、文字画像の展開
や文字認識処理のための作業領域等として用いる。ま
た、スキャナ１０１より読み込まれたイメージデータを
格納するための所定の記憶領域としてＶＲＡＭ領域を持
つ。１０８はディスプレイであり、ＲＡＭ１０７のＶＲ
ＡＭ領域に格納されているイメージデータや本実施の形
態で実行された認識結果を表示する。１０９はディスプ
レイインターフェースである。

【００１７】１１０はＦＤＤ（フロッピーディスクドラ
イブ）であり、ＦＤを装着しデータの読み書きが可能で
ある。また、装着されたＦＤ（不図示）に後述する処理
フローのプログラムを書き込み、該プログラムを本装置
のＲＡＭ１０７に読み込むことで処理を実行させること
ができる。１１１はＦＤＤインターフェースである。そ
して、１１２は各装置構成要素を接続するバスである。

【００１８】まず、図２のフローチャートを用いて、入
力画像の領域分割処理について説明する。図２は本実施
の形態の入力画像の領域分割処理の処理フローを示すフ
ローチャートである。ステップＳ２０１で、認識しよう
とする文書をスキャナ１０１で読み込み２値画像データ
に変換する。ステップＳ２０２で、得られた２値画像デ
ータに対して領域分割を行い、テキスト領域、図形領
域、表領域等の各種領域を抽出する。また、各種領域に
は、それらの位置を示す座標、属性、認識順序等の情報
を格納した矩形データ（図５の（ａ）を参照）が生成さ
れる。そして、各領域に対して生成された矩形データの
属性に、図５の（ｂ）に示すような各種属性に対応した
識別番号を格納する。

【００１９】図５の（ａ）に示される各領域の矩形デー
タについて説明する。矩形データは、各領域に有する特
徴をまとめて構成させたものであり、各領域に対応する
ＲＡＭ１０６に格納される。図の中の、始点座標と終点
座標は、ディスプレイ１０８上に位置する領域の始点と
終点の座標を格納する。属性は、各領域の属性に対応す
る図５の（ｂ）に示される識別番号を格納する。認識順
序は、ディスプレイ１０８上に表示される複数の領域に
含まれる各テキストの認識順序を格納する。出力フラグ
は、その領域の出力の有無を決定するための情報を格納
する。この詳細については、後述する。

【００２０】ステップＳ２０３で、表や図として抽出さ
れた非テキスト領域については、更に、それらの領域内
のテキスト領域を抽出を行う。抽出された非テキスト領
域内テキストには、その属性として「表内テキスト」や
「図内テキスト」として矩形データに本文のテキスト領
域の属性である「本文テキスト」とは異なる識別番号を
付加する。

【００２１】ステップＳ２０４で、抽出された全領域の
各矩形データに対して、その出力フラグを０にして初期
化する。ステップＳ２０５で、ＲＡＭ１０７上に各領域
の矩形データを保持する。例えば、スキャナ１０１から
読み込まれた原稿画像として図６に示されるような文書
がディスプレイ１０８に表示されたとする。図６の上部
には、本実施の形態で説明される処理を実行するための
命令としてメニューが表示されている。各メニューは、
その表示される位置にカーソル１００をあわせ、その位
置でドラッグ操作あるいはクリック操作することで、表
示されるメニューの内容を実行することができる。

【００２２】６０１は領域分割を行うためのメニューで
あり、このメニューの位置でカーソル１００をクリック
操作することで領域分割処理が実行される。６０２は文
字認識対象を選択するためのメニューであり、このメニ
ューの位置でカーソル１００を合わせマウス１０３のボ
タンを押すと、図７に示すようなプルダウンメニューが
表示される。この詳細については、後述する。６０３は
領域分割された原稿画像のテキスト領域に対して、文字
認識を実行させるためのメニューであり、このメニュー
の位置でカーソル１００をクリック操作することで文字
認識処理が実行される。

【００２３】６０４は領域出力モードを設定するための
メニューであり、このメニューの位置でカーソル１００
をクリック操作することで、認識させる所望の属性を持
つ領域のディスプレイ１０８への出力を「自動」あるい
は「手動」に切り替えて設定することができる。「手
動」の場合は、ユーザによって、所望の属性を持つ領域
をディスプレイ１０８へ出力するための設定を行う。こ
の設定の方法について、図７を用いて説明する。カーソ
ル１００を文字認識対象メニュー６０２にあわせ、マウ
ス１０３のボタンを１回押すとプルダウンメニュー６０
２ａが表示される。プルダウンメニュー６０２ａには、
所望の属性の領域のディスプレイ１０８への出力の設定
を行うために、例えば、「本文テキスト」、「表内テキ
スト」、「図内テキスト」等の領域の属性のメニューが
表示される。各領域の属性のメニューの横には、その属
性を持つ領域をディスプレイ１０８への出力するか否か
を決定するための切替メニュー「無効」／「有効」が表
示され、カーソル１００をその位置に合わせクリック操
作することで「無効」／「有効」が切り替わる。切替メ
ニューに「有効」が表示される場合はその属性を持つ領
域がディスプレイ１０８への出力対象となり、切替メニ
ューに「無効」が表示される場合はその属性を持つ領域
がディスプレイ１０８への非出力対象となる。

【００２４】例えば、図６に示される原稿画像に対し
て、文字認識対象として「本文テキスト」、「表内テキ
スト」を「有効」に設定した場合に、領域分割処理（カ
ーソル１００を領域分割メニュー６０１上でクリック操
作）を実行すると、図８に示されるように、実線の枠で
囲まれたテキスト領域の矩形と、点線の枠で囲まれた非
テキスト領域の矩形が抽出されディスプレイ１０８へ表
示される。

【００２５】一方、「自動」の場合は、予め所望の属性
の領域のディスプレイ１０８への出力の条件を設定して
おき、その条件に従って処理が実行される。次に、本実
施の形態の領域出力モードメニュー６０４の操作によっ
て、実行される処理について図３と図４のフローチャー
トを用いて説明する。図３は本実施の形態の処理フロー
を示すフローチャートである。

【００２６】尚、本実施の形態では、領域出力モードメ
ニュー６０４が「自動」の場合、所定数以上の「表内テ
キスト」が処理対象である原稿画像に存在する場合に、
「表内テキスト」をディスプレイ１０８へ出力するとい
う条件で処理が実行されるものとする。また、説明を簡
略化するために「本文テキスト」と「表内テキスト」を
ディスプレイ１０８への出力対象として説明する。

【００２７】ステップＳ３０１で、領域出力モードが
「自動」であるか否かを判定する。「自動」でない（つ
まり「手動」である）場合（ステップＳ３０１でＮ
Ｏ）、ステップＳ３０２に進む。「自動」である場合
（ステップＳ３０１でＹＥＳ）、ステップＳ３０４に進
む。ステップＳ３０２で、「本文テキスト」や「表内テ
キスト」等のディスプレイ１０８への出力対象を指示す
る。

【００２８】ステップＳ３０３で、出力対象を指示する
際の処理を実行する。この処理を、図４のフローチャー
トを用いて説明する。図４は本実施の形態の出力対象を
指示する際の処理フローを示すフローチャートである。
ステップＳ４０１で、「本文テキスト」が「有効」であ
るか否かを判定する。「有効」でない（つまり「無効」
である）場合（ステップＳ４０１でＮＯ）、ステップＳ
４０３に進む。「有効」である場合（ステップＳ４０１
でＹＥＳ）、ステップＳ４０２に進む。

【００２９】ステップＳ４０２で、「本文テキスト」の
属性を持つ領域である各領域の矩形データの出力フラグ
を「０」に変更する。ステップＳ４０３で、「本文テキ
スト」の属性を持つ領域である各領域の矩形データの出
力フラグを「１」に変更する。同様に、ステップＳ４０
４で、「表内テキスト」が「有効」であるか否かを判定
する。「有効」でない（つまり「無効」である）場合
（ステップＳ４０４でＮＯ）、ステップＳ４０６に進
む。「有効」である場合（ステップＳ４０４でＹＥ
Ｓ）、ステップＳ４０５に進む。

【００３０】ステップＳ４０５で、「表内テキスト」の
属性を持つ領域である各領域の矩形データの出力フラグ
を「０」に変更する。ステップＳ４０６で、「表内テキ
スト」の属性を持つ領域である各領域の矩形データの出
力フラグを「１」に変更する。再び、図３のフローチャ
ートの説明に戻る。

【００３１】ステップＳ３０４で、属性が「表内テキス
ト」である表領域の個数を算出する。ステップＳ３０５
で、算出される個数がｎ個以上（ｎは正の整数）である
か否かを判定する。ｎ個以上ある場合（ステップＳ３０
５でＹＥＳ）、ステップＳ３０６に進む。ｎ個以上ない
場合（ステップＳ３０５でＮＯ）、ステップＳ３０８に
進む。

【００３２】尚、上述のステップＳ３０５の判定で用い
る閾値ｎは、ＫＢ１１４を介してユーザが所望の閾値を
入力する。ステップＳ３０６で、「表内テキスト」のみ
を「有効」と設定し、「本文テキスト」を「無効」に設
定する。ステップＳ３０７で、「表内テキスト」の属性
を持つ領域の矩形データの出力フラグが「０」、「本文
テキスト」の属性を持つ領域の矩形データの出力フラグ
が「１」に変更される。この場合、ステップＳ３１０
で、「表内テキスト」の属性を持つ領域のみがディスプ
レイ１０８へ出力されることになる。

【００３３】一方、ステップＳ３０８で、「本文テキス
ト」のみを「有効」と設定し、「表内テキスト」を「無
効」に設定する。ステップＳ３０９で、「本文テキス
ト」の属性を持つ領域の矩形データの出力フラグが
「０」、「表内テキスト」の属性を持つ領域の矩形デー
タの出力フラグが「１」に変更される。この場合、ステ
ップＳ３１０で、「本文テキスト」の属性を持つ領域の
みがディスプレイ１０８へ出力されることになる。

【００３４】ステップＳ３１０で、矩形データの出力フ
ラグが「０」である領域がディスプレイ１０８へ出力さ
れる。例えば、ステップＳ３０５の判定条件である「表
内テキスト」の個数ｎを「３」と設定し、図６の原稿画
像に対して処理を実行すると、図６の原稿画像には表が
１つしかないため、図９に示されるように「本文テキス
ト」のみが抽出されていることを示す実線がテキスト領
域を囲んでディスプレイ１０８へ出力される。また、図
１０は、表の個数が３個以上ある場合で、「表内テキス
ト」のみが抽出されていることを示す破線が表領域を囲
んでディスプレイ１０８へ出力される。

【００３５】本実施の形態では、領域出力モードが「自
動」である時のディスプレイ１０８への出力対象を、所
定数以上の表が処理対象の原稿画像に存在する場合に、
「表内テキスト」をディスプレイ１０８へ出力するとい
う条件にしていたが、これに限らない。例えば、「表内
テキスト」だけでなく「図内テキスト」やそれ以外の非
テキスト領域を出力対象とすることも可能である。

【００３６】例えば、領域出力モードが「自動」である
時のディスプレイ１０８への出力対象を「表内テキス
ト」と「図内テキスト」として設定し、かつ「表内テキ
スト」が存在する個数ｉと「図内テキスト」が存在する
個数ｊの合計個数（ｉ＋ｊ）がｋ個以上の場合に、「表
内テキスト」と「図内テキスト」をディスプレイ１０８
へ出力するという条件で実行される処理について、図１
１を用いて説明する。この場合、処理を始める前の初期
状態では、図１２に示されるように、プルダウンメニュ
ー６０２ａに表示される「表内テキスト」と「図内テキ
スト」が「有効」に設定され、「本文テキスト」と「無
効」に設定される。

【００３７】図１１は本実施の形態の他の構成による処
理フローを示すフローチャートである。尚、図１１の説
明では、領域出力モードが「自動」に設定されている状
態の時の処理についてのみ説明する。また、領域出力
モードが「手動」に設定されている状態の時の処理は、
ステップＳ３０２、ステップＳ３０３で説明した処理と
同様なので、その説明は省略する。

【００３８】ステップＳ１１０１で、属性が「表内テキ
スト」である表領域の個数ｉ（ｉは正の整数）を算出す
る。ステップＳ１１０２で、属性が「図内テキスト」で
ある図領域の個数ｊ（ｊは正の整数）を算出する。ステ
ップＳ１１０３で、算出される表領域と図領域の合計の
個数（ｉ＋ｊ）がｋ個以上であるか否かを判定する。ｋ
個以上ある場合（ステップＳ１１０３でＹＥＳ）、ステ
ップＳ１１０６に進む。ｋ個以上ない場合（ステップＳ
１１０３でＮＯ）、ステップＳ１１０４に進む。

【００３９】尚、上述のステップＳ１１０３の判定で用
いる閾値ｋは、ＫＢ１１４を介してユーザが所望の閾値
を入力する。ステップＳ１１０４で、「表内テキスト」
と「図内テキスト」を「有効」と設定し、「本文テキス
ト」を「無効」に設定する。ステップＳ１１０５で、
「表内テキスト」と「図内テキスト」の属性を持つ領域
の矩形データの出力フラグが「０」、「本文テキスト」
の属性を持つ領域の矩形データの出力フラグが「１」に
変更される。この場合、ステップＳ１１０８で、「表内
テキスト」と「図内テキスト」の属性を持つ領域がディ
スプレイ１０８へ出力されることになる。

【００４０】一方、ステップＳ１１０６で、「本文テキ
スト」のみを「有効」と設定し、「表内テキスト」と
「図内テキスト」を「無効」に設定する。ステップＳ１
１０７で、「本文テキスト」の属性を持つ領域の矩形デ
ータの出力フラグが「０」、「表内テキスト」と「図内
テキスト」の属性を持つ領域の矩形データの出力フラグ
が「１」に変更される。この場合、ステップＳ１１０８
で、「本文テキスト」の属性を持つ領域のみがディスプ
レイ１０８へ出力されることになる。

【００４１】例えば、図１２は、ステップＳ１３０３の
判定条件である「表内テキスト」と「図内テキスト」の
合計個数ｋを「３」と設定した上で、領域出力モードが
「自動」、「表内テキスト」および「図内テキスト」が
「有効」に設定されている状態で、処理が実行された場
合の処理結果である。この場合、「表内テキスト」およ
び「図内テキスト」の各領域に破線の枠が表示され、
「表内テキスト」および「図内テキスト」が３個以上あ
ることを示している。

【００４２】更に、図１１で説明された領域出力モード
が「自動」の時の出力対象の条件を出力対象となる非テ
キスト領域ごとに指示することも可能である。例えば、
領域出力モードが「自動」である時のディスプレイ１０
８への出力対象を「表内テキスト」と「図内テキスト」
として設定し、かつ「表内テキスト」が存在する個数ｉ
がｇ個以上、「図内テキスト」が存在する個数ｊがｈ個
以上である場合に、それぞれ「表内テキスト」と「図内
テキスト」をディスプレイ１０８へ出力するという条件
で実行される処理について、図１３を用いて説明する。

【００４３】図１３は本実施の形態の他の構成による処
理フローを示すフローチャートである。ステップＳ１３
０１で、まず、「本文テキスト」の属性を持つ領域を
「有効」として、その領域の矩形データの出力フラグを
「０」に初期化する。ステップＳ１３０２で、属性が
「表内テキスト」である表領域の個数ｉを算出する。ス
テップＳ１３０３で、算出される個数ｉがｇ個以上（ｇ
は正の整数）であるか否かを判定する。ｇ個以上ある場
合（ステップＳ１３０３でＹＥＳ）、ステップＳ１３０
４に進む。ｇ個以上ない場合（ステップＳ１３０３でＮ
Ｏ）、ステップＳ１３０６に進む。

【００４４】尚、上述のステップＳ１３０３の判定で用
いる閾値ｇは、ＫＢ１１４を介してユーザが所望の閾値
を入力する。ステップＳ１３０４で、「表内テキスト」
のみを「有効」と設定し、「本文テキスト」を「無効」
に設定する。ステップＳ１３０５で、「表内テキスト」
の属性を持つ領域の矩形データの出力フラグが「０」、
「本文テキスト」の属性を持つ領域の矩形データの出力
フラグが「１」に変更される。この場合、ステップＳ１
３１４で、「表内テキスト」の属性を持つ領域のみがデ
ィスプレイ１０８へ出力されることになる。

【００４５】一方、ステップＳ１３０６で、「本文テキ
スト」のみを「有効」と設定し、「表内テキスト」を
「無効」に設定する。ステップＳ１３０７で、「本文テ
キスト」の属性を持つ領域の矩形データの出力フラグが
「０」、「表内テキスト」の属性を持つ領域の矩形デー
タの出力フラグが「１」に変更される。この場合、ステ
ップＳ１３１４で、「本文テキスト」の属性を持つ領域
のみがディスプレイ１０８へ出力されることになる。

【００４６】ステップＳ１３０８で、属性が「図内テキ
スト」である図領域の個数ｊを算出する。ステップＳ１
３０９で、算出される個数ｊがｈ個以上（ｈは正の整
数）であるか否かを判定する。ｈ個以上ある場合（ステ
ップＳ１３０９でＹＥＳ）、ステップＳ１３１０に進
む。ｈ個以上ない場合（ステップＳ１３０９でＮＯ）、
ステップＳ１３１０に進む。

【００４７】尚、上述のステップＳ１３０９の判定で用
いる閾値ｈは、ＫＢ１１４を介してユーザが所望の閾値
を入力する。ステップＳ１３１０で、「図内テキスト」
のみを「有効」と設定し、「本文テキスト」を「無効」
に設定する。ステップＳ１３１１で、「図内テキスト」
の属性を持つ領域の矩形データの出力フラグが「０」、
「本文テキスト」の属性を持つ領域の矩形データの出力
フラグが「１」に変更される。この場合、ステップＳ１
３１４で、「図内テキスト」の属性を持つ領域のみがデ
ィスプレイ１０８へ出力されることになる。

【００４８】一方、ステップＳ１３１２で、「本文テキ
スト」のみを「有効」と設定し、「図内テキスト」を
「無効」に設定する。ステップＳ１３１３で、「本文テ
キスト」の属性を持つ領域の矩形データの出力フラグが
「０」、「図内テキスト」の属性を持つ領域の矩形デー
タの出力フラグが「１」に変更される。この場合、ステ
ップＳ１３１４で、「本文テキスト」の属性を持つ領域
のみがディスプレイ１０８へ出力されることになる。

【００４９】ステップＳ１３１４で、矩形データの出力
フラグが「０」である領域がディスプレイ１０８へ出力
される。尚、表領域の個数ｉがｇ個未満で図領域の個数
ｊがｋ個以上であれば、「表内テキスト」の属性を持つ
領域の矩形データの出力フラグの変更の処理の際、「本
文テキスト」の属性を持つ領域の矩形データの出力フラ
グは変更されない。しかし、「図内テキスト」の属性を
持つ領域の矩形データの出力フラグの変更の処理の際、
「本文テキスト」の属性を持つ領域の矩形データの出力
フラグが無効に設定されるので、「図内テキスト」の属
性を持つ領域のみがディスプレイ１０８へ出力されるこ
とになる。

【００５０】同様にして、逆の場合は「表内テキスト」
の属性を持つ領域のみがディスプレイ１０８へ出力され
ることになる。更に、表領域の個数ｉがｇ個未満で図領
域の個数ｊもｈ個未満であれば、「本文テキスト」の属
性を持つ領域の矩形データの出力フラグは初期設定のま
ま変わらないので、「本文テキスト」の属性を持つ領域
のみがディスプレイ１０８へ出力されることになる。

【００５１】以上、本実施の形態の領域出力モードが
「自動」の時の出力対象の条件を、いくつか例を挙げて
説明した。以下、本実施の形態で説明される特徴的な処
理の概要を、図１４に示すフローチャートを用いて説明
する。図１４は本実施の形態の処理フローの概要を示す
フローチャートである。ステップＳ１００１で、領域出
力モードが「自動」である時のディスプレイ１０８への
出力対象とする領域の出力条件を設定する。

【００５２】ステップＳ１００２で、領域出力モードが
「自動」であるか否かを判定する。「自動」でない（つ
まり「手動」である）場合（ステップＳ１００１でＮ
Ｏ）、ステップＳ１００３に進む。「自動」である場合
（ステップＳ１００１でＹＥＳ）、ステップＳ１００５
に進む。ステップＳ１００３で、ディスプレイ１０８へ
の出力対象を指示する。

【００５３】ステップＳ１００４で、出力対象を指示す
る際の処理を実行する。一方、ステップＳ１００５で、
予め設定された出力条件に従って出力対象を指示する処
理を実行する。ステップＳ１００６で、矩形データの出
力フラグが「０」である領域がディスプレイ１０８へ出
力される。

【００５４】以上説明したように、本実施の形態によれ
ば、領域出力モードを備え、そのモードを「自動」に設
定することで、予め設定された条件に基づいて、所望の
属性を有する領域を出力することができる。また、モー
ドを「手動」にすることで、ユーザが任意の属性を有す
る領域を出力することができる。その結果、複数の属性
の領域を有する原稿画像の中から、所望の属性を有する
領域を出力するための操作が容易になり作業効率が向上
する。

【００５５】尚、本発明は、複数の機器（例えば、ホス
トコンピュータ、インタフェース機器、リーダ、プリン
タ等）から構成されるシステムに適用しても、一つの機
器からなる装置（例えば、複写機、ファクシミリ装置
等）に適用してもよい。また、本発明の目的は、前述し
た実施形態の機能を実現するソフトウェアのプログラム
コードを記録した記憶媒体を、システムあるいは装置に
供給し、そのシステムあるいは装置のコンピュータ（ま
たはＣＰＵやＭＰＵ）が記憶媒体に格納されたプログラ
ムコードを読出し実行することによっても、達成される
ことは言うまでもない。

【００５６】この場合、記憶媒体から読出されたプログ
ラムコード自体が上述した実施の形態の機能を実現する
ことになり、そのプログラムコードを記憶した記憶媒体
は本発明を構成することになる。プログラムコードを供
給するための記憶媒体としては、例えば、フロッピディ
スク、ハードディスク、光ディスク、光磁気ディスク、
ＣＤ−ＲＯＭ、ＣＤ−Ｒ、磁気テープ、不揮発性のメモ
リカード、ＲＯＭなどを用いることができる。

【００５７】また、コンピュータが読出したプログラム
コードを実行することにより、前述した実施形態の機能
が実現されるだけでなく、そのプログラムコードの指示
に基づき、コンピュータ上で稼働しているＯＳ（オペレ
ーティングシステム）などが実際の処理の一部または全
部を行い、その処理によって前述した実施の形態の機能
が実現される場合も含まれることは言うまでもない。

【００５８】更に、記憶媒体から読出されたプログラム
コードが、コンピュータに挿入された機能拡張ボードや
コンピュータに接続された機能拡張ユニットに備わるメ
モリに書込まれた後、そのプログラムコードの指示に基
づき、その機能拡張ボードや機能拡張ユニットに備わる
ＣＰＵなどが実際の処理の一部または全部を行い、その
処理によって前述した実施形態の機能が実現される場合
も含まれることは言うまでもない。

【００５９】本発明を上記記憶媒体に適用する場合、そ
の記憶媒体には、先に説明したフローチャートに対応す
るプログラムコードを格納することになるが、簡単に説
明すると、図１５のメモリマップ例に示す各モジュール
を記憶媒体に格納することになる。すなわち、少なくと
も「分割モジュール」、「指定モジュール」および「出
力モジュール」の各モジュールのプログラムコードを記
憶媒体に格納すればよい。

【００６０】

【発明の効果】以上の説明からも明らかなように、本発
明によれば、原稿画像内の所望の属性を有する領域に含
まれるテキストを抽出するための操作を容易にし、作業
効率を向上する画像処理装置及びその方法を提供でき
る。

【図面の簡単な説明】

【図１】本実施の形態の画像処理装置の機能構成を示す
ブロック図である。

【図２】本実施の形態の入力画像の領域分割処理の処理
フローを示すフローチャートである。

【図３】本実施の形態の処理フローを示すフローチャー
トである。

【図４】本実施の形態の出力対象を指示する際の処理フ
ローを示すフローチャートである。

【図５】（ａ）は、本実施の形態の矩形データの構造を
示す図であり、（ｂ）は各属性とその識別番号の関係を
示す図である。

【図６】本実施の形態の原稿画像の表示例を示す図であ
る。

【図７】本実施の形態の文字認識対象メニューによる文
字認識対象の指示方法を説明するための図である。

【図８】本実施の形態の出力対象を全ての属性の領域と
した場合の表示例を示す図である。

【図９】本実施の形態の出力対象を「本文テキスト」の
属性を持つ領域とした場合の表示例を示す図である。

【図１０】本実施の形態の出力対象を「表内テキスト」
の属性を持つ領域とした場合の表示例を示す図である。

【図１１】本実施の形態の他の構成による処理フローを
示すフローチャートである。

【図１２】本実施の形態の出力対象を「表内テキスト」
と「図内テキスト」の属性を持つ領域とした場合の表示
例を示す図である。

【図１３】本実施の形態の他の構成による処理フローを
示すフローチャートである。

【図１４】本実施の形態の処理フローの概要を示すフロ
ーチャートである。

【図１５】本発明で実行される処理フローのプログラム
を記憶させたＦＤのメモリマップの構造を示す図であ
る。

【符号の説明】

１０１スキャナ１０２スキャナインタフェース１０３マウス１０４マウスインタフェース１０５ＣＰＵ１０６ＲＯＭ１０７ＲＡＭ１０８ディスプレイ１０９ディスプレイインタフェース１１０ＦＤＤ１１１ＦＤＤインタフェース１１２バス

Claims

【特許請求の範囲】

【請求項１】原稿画像に含まれる文字を認識してテキ
ストデータを出力する画像処理装置であって、前記原稿画像を属性毎の領域に分割する分割手段と、前記原稿画像内に含まれる複数の属性の少なくとも１つ
を指定する指定手段と、前記指定手段で指定された属性を有する領域に含まれる
文字を認識してテキストデータを出力する出力手段とを
備えることを特徴とする画像処理装置。
【請求項２】前記指定手段は、前記原稿画像内におい
て、所定の属性を有する領域の個数を計数する計数手段
を備え、前記計数手段の計数結果に基づいて、前記原稿画像内に
含まれる複数の属性の少なくとも１つを指定することを
特徴とする請求項１に記載の画像処理装置。
【請求項３】前記指定手段は、前記原稿画像内に含ま
れる所望の属性を、ユーザによって指定することを特徴
とする請求項１に記載の画像処理装置。
【請求項４】前記指定手段は、前記原稿画像内におい
て、所定の属性を有する領域の個数を計数する計数手段
と、前記計数手段の計数結果に基づいて、前記原稿画像内に
含まれる複数の属性の少なくとも１つを指定する第１指
定手段と、前記原稿画像内に含まれる所望の属性を、ユーザによっ
て指定する第２指定手段とを備えることを特徴とする請
求項１に記載の画像処理装置。
【請求項５】前記第１指定手段による指定から前記第
２指定手段による指定、あるいは前記第２指定手段によ
る指定から前記第１指定手段による指定に切り替える切
替手段を更に備えることを特徴とする請求項４に記載の
画像処理装置。
【請求項６】前記指定手段は、前記計数手段で計数さ
れる個数が所定数以上である場合、該所定の属性を指定
することを特徴とする請求項２に記載の画像処理装置。
【請求項７】前記指定手段は、前記計数手段で計数さ
れる個数が所定数未満である場合、前記原稿画像内に含
まれるテキスト領域を指定することを特徴とする請求項
２に記載の画像処理装置。
【請求項８】前記所定数の変更を指示する指示手段を
更に備えることを特徴とする請求項６または請求項７に
記載の画像処理装置。
【請求項９】原稿画像に含まれる文字を認識してテキ
ストデータを出力する画像処理方法であって、前記原稿画像を属性毎の領域に分割する分割工程と、前記原稿画像内に含まれる複数の属性の少なくとも１つ
を指定する指定工程と、前記指定工程で指定された属性を有する領域に含まれる
文字を認識してテキストデータを出力する出力工程とを
備えることを特徴とする画像処理方法。
【請求項１０】前記指定工程は、前記原稿画像内にお
いて、所定の属性を有する領域の個数を計数する計数工
程を備え、前記計数工程の計数結果に基づいて、前記原稿画像内に
含まれる複数の属性の少なくとも１つを指定することを
特徴とする請求項９に記載の画像処理方法。
【請求項１１】前記指定工程は、前記原稿画像内に含
まれる所望の属性を、ユーザによって指定することを特
徴とする請求項９に記載の画像処理方法。
【請求項１２】前記指定工程は、前記原稿画像内にお
いて、所定の属性を有する領域の個数を計数する計数工
程と、前記計数工程の計数結果に基づいて、前記原稿画像内に
含まれる複数の属性の少なくとも１つを指定する第１指
定工程と、前記原稿画像内に含まれる所望の属性を、ユーザによっ
て指定する第２指定工程とを備えることを特徴とする請
求項９に記載の画像処理方法。
【請求項１３】前記第１指定工程による指定から前記
第２指定工程による指定、あるいは前記第２指定手段に
よる指定から前記第１指定手段による指定に切り替える
切替工程を更に備えることを特徴とする請求項１２に記
載の画像処理方法。
【請求項１４】前記指定工程は、前記計数工程で計数
される個数が所定数以上である場合、該所定の属性を指
定することを特徴とする請求項１０に記載の画像処理方
法。
【請求項１５】前記指定工程は、前記計数工程で計数
される個数が所定数未満である場合、前記原稿画像内に
含まれるテキスト領域を指定することを特徴とする請求
項１０に記載の画像処理方法。
【請求項１６】前記所定数の変更を指示する指示工程
を更に備えることを特徴とする請求項１４または請求項
１５に記載の画像処理方法。
【請求項１７】画像処理のプログラムコードが格納さ
れたコンピュータ可読メモリであって、前記原稿画像を属性毎の領域に分割する分割工程のコー
ドと、前記原稿画像内に含まれる複数の属性の少なくとも１つ
を指定する指定工程のコードと、前記指定工程で指定された属性を有する領域に含まれる
文字を認識してテキストデータを出力する出力工程のコ
ードとを備えることを特徴とするコンピュータ可読メモ
リ。