JP3744996B2 - 画像処理装置及びその方法 - Google Patents

画像処理装置及びその方法 Download PDF

Info

Publication number
JP3744996B2
JP3744996B2 JP00195296A JP195296A JP3744996B2 JP 3744996 B2 JP3744996 B2 JP 3744996B2 JP 00195296 A JP00195296 A JP 00195296A JP 195296 A JP195296 A JP 195296A JP 3744996 B2 JP3744996 B2 JP 3744996B2
Authority
JP
Japan
Prior art keywords
attribute
text
area
character recognition
recognition target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP00195296A
Other languages
English (en)
Other versions
JPH09190490A (ja
Inventor
和之 齋藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP00195296A priority Critical patent/JP3744996B2/ja
Publication of JPH09190490A publication Critical patent/JPH09190490A/ja
Application granted granted Critical
Publication of JP3744996B2 publication Critical patent/JP3744996B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Character Input (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、原稿画像に含まれる文字を認識してテキストデータを出力する画像処理装置及びその方法に関するものである。
【0002】
【従来の技術】
従来の画像処理装置においては、スキャナ等で読み込んだ原稿の読み込み結果としてディスプレイ等に表示される原稿画像に対し、その原稿画像に含まれるテキスト情報を抽出する場合、原稿画像に含まれる属性に従ってテキスト領域および非テキスト領域に分割する処理である領域分割を実行した後、各領域毎に存在するテキストのテキストの抽出処理を行っていた。また、特に、非テキスト領域である表領域の中に含まれるテキストに対しては、その表を構成する罫線を抽出した後に、罫線に囲まれた領域内のテキストを抽出していた。
【0003】
【発明が解決しようとする課題】
しかしながら、上述の従来の画像処理装置において、領域分割の処理対象である原稿画像にテキスト領域と非テキスト領域が混在する場合、例えば、非テキスト領域として表が存在する場合、その表の中のテキストを表内テキストとして抽出を行っても、原稿画像内のテキスト領域のテキストと表内のテキストが区別されずに抽出されてしまい、表内のテキストあるいはテキスト領域のテキストだけを抽出することができなかった。
【0004】
そのため、表内のテキストのみが必要な場合、領域分割処理後、原稿画像内のテキスト領域を削除するか、あるいは表のみを予め指定する等の操作が必要であり、原稿画像内の所望のテキストを抽出するための操作が煩雑になるという問題点があった。また、作業効率を低下させていた。
本発明は上記の問題点に鑑みてなされたものであり、原稿画像内の所望の属性を有する領域に含まれるテキストを抽出するための操作を容易にし、作業効率を向上する画像処理装置及びその方法を提供することを目的としている。
【0005】
【課題を解決するための手段】
上記の目的を達成するための本発明による画像処理装置は以下の構成を備える。即ち、
原稿画像に含まれる文字を認識してテキストデータを出力する画像処理装置であって、
前記原稿画像を属性毎の領域に分割する分割手段と、
前記原稿画像内において、所定の属性を有する領域の面積前記原稿画像の面積に対して占める割合を算出する算出手段と、
前記算出手段の算出結果と予め定められた条件とを比較した結果に基づいて、各属性に対して文字認識対象にするか否かの設定を自動的に行う第1設定手段と、
前記文字認識対象にすると設定された属性を有する領域に含まれる文字を文字認識してテキストデータを出力する出力手段と
を備える。
また、好ましくは、自動モードと手動モードのいずれかに切り替えて設定するモード切替手段と、
前記モード切替手段で手動モードに設定されている場合は、ユーザの指示に基づき、ユーザ所望の属性を文字認識対象として設定する第2設定手段と、を更に備え、
前記モード切替手段で自動モードに設定されている場合は、前記第1設定手段において、前記算出手段の算出結果と予め定められた条件とを比較した結果に基づき、各属性に対して文字認識対象にするか否かの設定を自動的に行う。
【0006】
また、好ましくは、前記第1設定手段は、前記算出手段で算出される前記所定の属性を有する領域の面積前記原稿画像の面積に対して占める割合が所定数以上である場合、該所定の属性を文字認識対象として設定する。
また、好ましくは、前記第1設定手段は、前記算出手段で算出される割合が前記所定数未満である場合、当該所定の属性を文字認識対象としない。
【0007】
また、好ましくは、前記算出手段は、表内テキストの属性を有する表領域の面積が前記原稿画像の面積に対して占める割合を算出し、
前記第1設定手段は、
前記算出手段で算出される割合が所定数以上である場合、当該表内テキストの属性を文字認識対象とし且つ本文テキストの属性を文字認識対象としないように設定し、
一方、前記算出手段で算出される割合が前記所定数未満である場合、当該表内テキストの属性を文字認識対象とせず且つ本文テキストの属性を文字認識対象とするように設定する。
また、好ましくは、前記算出手段は、表内テキストの属性を有する領域の面積と図内テキストの属性を有する領域の面積との合計が前記原稿画像の面積に対して占める割合を算出し、
前記第1設定手段は、
前記算出手段で算出される割合が所定数以上である場合、当該表内テキストの属性と前記図内テキストの属性とを文字認識対象とし且つ本文テキストの属性を文字認識対象としないように設定し、
一方、前記算出手段で算出される割合が前記所定数未満である場合、当該表内テキストの属性と前記図内テキストの属性とを文字認識対象とせず且つ本文テキストの属性を文字認識対象として設定する。
【0008】
上記の目的を達成するための本発明による画像処理方法は以下の構成を備える。即ち、
原稿画像に含まれる文字を認識してテキストデータを出力する画像処理方法であって、
前記原稿画像を属性毎の領域に分割する分割工程と、
前記原稿画像内において、所定の属性を有する領域の面積前記原稿画像の面積に対して占める割合を算出する算出工程と、
前記算出工程の算出結果と予め定められた条件とを比較した結果に基づいて、各属性に対して文字認識対象にするか否かの設定を自動的に行う第1設定工程と、
前記文字認識対象にすると設定された属性を有する領域に含まれる文字を文字認識してテキストデータを出力する出力工程と
を備える。
また、好ましくは、自動モードと手動モードのいずれかに切り替えて設定するモード切替工程と、
前記モード切替工程で手動モードに設定されている場合は、ユーザの指示に基づき、ユーザ所望の属性を文字認識対象として設定する第2設定工程と、を更に備え、
前記モード切替工程で自動モードに設定されている場合は、前記第1設定工程において、前記算出工程の算出結果と予め定められた条件とを比較した結果に基づき、各属性に対して文字認識対象にするか否かの設定を自動的に行う。
【0009】
また、好ましくは、前記第1設定工程では、前記算出工程で算出される前記所定の属性を有する領域の面積前記原稿画像の面積に対して占める割合が所定数以上である場合、該所定の属性を文字認識対象として設定する。
また、好ましくは、前記第1設定工程では、前記算出工程で算出される割合が前記所定数未満である場合、当該所定の属性を文字認識対象としない。
【0010】
また、好ましくは、前記算出工程では、表内テキストの属性を有する表領域の面積が前記原稿画像の面積に対して占める割合を算出し、
前記第1設定工程では、
前記算出工程で算出される割合が所定数以上である場合、当該表内テキストの属性を文字認識対象とし且つ本文テキストの属性を文字認識対象としないように設定し、
一方、前記算出工程で算出される割合が所定数未満である場合、当該表内テキストの属性を文字認識対象とせず且つ本文テキストの属性を文字認識対象とするように設定する。
また、好ましくは、前記算出工程では、表内テキストの属性を有する領域の面積と図内テキストの属性を有する領域の面積との合計が前記原稿画像の面積に対して占める割合を算出し、
前記第1設定工程では、
前記算出工程で算出される割合が所定数以上である場合、当該表内テキストの属性と前記図内テキストの属性とを文字認識対象とし且つ本文テキストの属性を文字認識対象としないように設定し、
一方、前記算出工程で算出される割合が前記所定数未満である場合、当該表内テキストの属性と前記図内テキストの属性とを文字認識対象とせず且つ本文テキストの属性を文字認識対象として設定する。
【0011】
また、好ましくは、前記所定数の変更を指示する指示工程を
更に備える。
上記の目的を達成するための本発明によるコンピュータ可読メモリは以下の構成を備える。即ち、
画像処理のプログラムコードが格納されたコンピュータ可読メモリであって、
前記原稿画像を属性毎の領域に分割する分割工程のコードと、
前記原稿画像内において、所定の属性を有する領域の面積の前記原稿画像の面積に対する割合を算出する算出工程のコードと、
前記算出工程の算出結果に基づいて、前記原稿画像内に含まれる複数の属性の少なくとも1つを指定する第1指定工程のコードと、
前記第1指定工程で指定された属性を有する領域に含まれる文字を認識してテキストデータを出力する出力工程のコードと
を備えることを特徴とするコンピュータ可読メモリ。
【0012】
【発明の実施の形態】
以下、図面を参照して本発明の好適な実施の形態を詳細に説明する。
図1は本実施の形態の画像処理装置の機能構成を示すブロック図である。
図1において、101はスキャナであり、画像原稿に光を照射し、その反射光を読み取り電気信号に変換する。また、スキャナ101より読み込まれた画像原稿は、イメージデータとしてRAM107のVRAM領域に格納される。102はスキャナインターフェースであり、スキャナ101で得られた電気信号を2値のデジタル電気信号に変換し、他の装置構成要素に伝送する。103はポインティングデバイスとして機能するマウスであり、マウス103を移動することでディスプレイ108上に表示されるカーソル100(図6参照)を移動する。また、画面に表示されるメニューにカーソル100を位置し、そのメニュー上で付帯するボタン(不図示)を用いてドラッグ操作、クリック操作を行うことで、その内容を実行することができる。104はマウスインタフェースであり、マウス103からの信号を受け、それを他の装置構成要素に伝送する。114はKB(キーボード)であり、キーボードを介してデータの入力や命令の実行を行う。113はKBインターフェースであり、KB114からの信号を受け、それを他の装置構成要素に伝送する。
【0013】
105はCPUであり、装置全体の制御及び文字切り出し処理や認識処理を実行する。106はROMであり、CPU105が実行する制御プログラム、各種処理プログラムやフォントデータ等の各種データを格納している。107はRAMであり、文字画像の展開や文字認識処理のための作業領域等として用いる。また、スキャナ101より読み込まれたイメージデータを格納するための所定の記憶領域としてVRAM領域を持つ。108はディスプレイであり、RAM107のVRAM領域に格納されているイメージデータや本実施の形態で実行された認識結果を表示する。109はディスプレイインターフェースである。
【0014】
110はFDD(フロッピーディスクドライブ)であり、FDを装着しデータの読み書きが可能である。また、装着されたFD(不図示)に後述する処理フローのプログラムを書き込み、該プログラムを本装置のRAM107に読み込むことで処理を実行させることができる。111はFDDインターフェースである。そして、112は各装置構成要素を接続するバスである。
【0015】
まず、図2のフローチャートを用いて、入力画像の領域分割処理について説明する。
図2は本実施の形態の入力画像の領域分割処理の処理フローを示すフローチャートである。
ステップS201で、認識しようとする文書をスキャナ101で読み込み2値画像データに変換する。ステップS202で、得られた2値画像データに対して領域分割を行い、テキスト領域、図形領域、表領域等の各種領域を抽出する。また、各種領域には、それらの位置を示す座標、属性、認識順序等の情報を格納した矩形データ(図5の(a)を参照)が生成される。そして、各領域に対して生成された矩形データの属性に、図5の(b)に示すような各種属性に対応した識別番号を格納する。
【0016】
図5の(a)に示される各領域の矩形データについて説明する。矩形データは、各領域に有する特徴をまとめて構成させたものであり、各領域に対応するRAM106に格納される。図の中の、始点座標と終点座標は、ディスプレイ108上に位置する領域の始点と終点の座標を格納する。属性は、各領域の属性に対応する図5の(b)に示される識別番号を格納する。認識順序は、ディスプレイ108上に表示される複数の領域に含まれる各テキストの認識順序を格納する。出力フラグは、その領域の出力の有無を決定するための情報を格納する。この詳細については、後述する。
【0017】
ステップS203で、表や図として抽出された非テキスト領域については、更に、それらの領域内のテキスト領域を抽出を行う。抽出された非テキスト領域内テキストには、その属性として「表内テキスト」や「図内テキスト」として矩形データに本文のテキスト領域の属性である「本文テキスト」とは異なる識別番号を付加する。
【0018】
ステップS204で、抽出された全領域の各矩形データに対して、その出力フラグを0にして初期化する。ステップS205で、RAM107上に各領域の矩形データを保持する。
例えば、スキャナ101から読み込まれた原稿画像として図6に示されるような文書がディスプレイ108に表示されたとする。図6の上部には、本実施の形態で説明される処理を実行するための命令としてメニューが表示されている。各メニューは、その表示される位置にカーソル100をあわせ、その位置でドラッグ操作あるいはクリック操作することで、表示されるメニューの内容を実行することができる。
【0019】
601は領域分割を行うためのメニューであり、このメニューの位置でカーソル100をクリック操作することで領域分割処理が実行される。602は文字認識対象を選択するためのメニューであり、このメニューの位置でカーソル100を合わせマウス103のボタンを押すと、図7に示すようなプルダウンメニューが表示される。この詳細については、後述する。603は領域分割された原稿画像のテキスト領域に対して、文字認識を実行させるためのメニューであり、このメニューの位置でカーソル100をクリック操作することで文字認識処理が実行される。
【0020】
604は領域出力モードを設定するためのメニューであり、このメニューの位置でカーソル100をクリック操作することで、認識させる所望の属性を持つ領域のディスプレイ108への出力を「自動」あるいは「手動」に切り替えて設定することができる。「手動」の場合は、ユーザによって、所望の属性を持つ領域をディスプレイ108へ出力するための設定を行う。この設定の方法について、図7を用いて説明する。カーソル100を文字認識対象メニュー602にあわせ、マウス103のボタンを1回押すとプルダウンメニュー602aが表示される。プルダウンメニュー602aには、所望の属性の領域のディスプレイ108への出力の設定を行うために、例えば、「本文テキスト」、「表内テキスト」、「図内テキスト」等の領域の属性のメニューが表示される。各領域の属性のメニューの横には、その属性を持つ領域をディスプレイ108への出力するか否かを決定するための切替メニュー「無効」/「有効」が表示され、カーソル100をその位置に合わせクリック操作することで「無効」/「有効」が切り替わる。切替メニューに「有効」が表示される場合はその属性を持つ領域がディスプレイ108への出力対象となり、切替メニューに「無効」が表示される場合はその属性を持つ領域がディスプレイ108への非出力対象となる。
【0021】
例えば、図6に示される原稿画像に対して、文字認識対象として「本文テキスト」、「表内テキスト」を「有効」に設定した場合に、領域分割処理(カーソル100を領域分割メニュー601上でクリック操作)を実行すると、図8に示されるように、実線の枠で囲まれたテキスト領域の矩形と、点線の枠で囲まれた非テキスト領域の矩形が抽出されディスプレイ108へ表示される。
【0022】
一方、「自動」の場合は、予め所望の属性の領域のディスプレイ108への出力の条件を設定しておき、その条件に従って処理が実行される。
次に、本実施の形態の領域出力モードメニュー604の操作によって、実行される処理について図3と図4のフローチャートを用いて説明する。
図3は本実施の形態の処理フローを示すフローチャートである。
【0023】
尚、本実施の形態では、領域出力モードメニュー604が「自動」の場合、所定数以上の「表内テキスト」が処理対象である原稿画像に存在する場合に、「表内テキスト」をディスプレイ108へ出力するという条件で処理が実行されるものとする。また、説明を簡略化するために「本文テキスト」と「表内テキスト」をディスプレイ108への出力対象として説明する。
【0024】
ステップS301で、領域出力モードが「自動」であるか否かを判定する。「自動」でない(つまり「手動」である)場合(ステップS301でNO)、ステップS302に進む。「自動」である場合(ステップS301でYES)、ステップS304に進む。
ステップS302で、「本文テキスト」や「表内テキスト」等のディスプレイ108への出力対象を指示する。
【0025】
ステップS303で、出力対象を指示する際の処理を実行する。この処理を、図4のフローチャートを用いて説明する。
図4は本実施の形態の出力対象を指示する際の処理フローを示すフローチャートである。
ステップS401で、「本文テキスト」が「有効」であるか否かを判定する。「有効」でない(つまり「無効」である)場合(ステップS401でNO)、ステップS403に進む。「有効」である場合(ステップS401でYES)、ステップS402に進む。
【0026】
ステップS402で、「本文テキスト」の属性を持つ領域である各領域の矩形データの出力フラグを「0」に変更する。ステップS403で、「本文テキスト」の属性を持つ領域である各領域の矩形データの出力フラグを「1」に変更する。
同様に、ステップS404で、「表内テキスト」が「有効」であるか否かを判定する。「有効」でない(つまり「無効」である)場合(ステップS404でNO)、ステップS406に進む。「有効」である場合(ステップS404でYES)、ステップS405に進む。
【0027】
ステップS405で、「表内テキスト」の属性を持つ領域である各領域の矩形データの出力フラグを「0」に変更する。ステップS406で、「表内テキスト」の属性を持つ領域である各領域の矩形データの出力フラグを「1」に変更する。
再び、図3のフローチャートの説明に戻る。
【0028】
ステップS304で、属性が「表内テキスト」である表領域の面積が画像原稿に対して占める割合を算出する。ステップS305で、算出される面積の割合がn以上(nは正の整数)であるか否かを判定する。n以上である場合(ステップS305でYES)、ステップS306に進む。n以上でない場合(ステップS305でNO)、ステップS308に進む。
【0029】
尚、上述のステップS305の判定で用いる閾値nは、KB114を介してユーザが所望の閾値を入力する。
ステップS306で、「表内テキスト」のみを「有効」と設定し、「本文テキスト」を「無効」に設定する。ステップS307で、「表内テキスト」の属性を持つ領域の矩形データの出力フラグが「0」、「本文テキスト」の属性を持つ領域の矩形データの出力フラグが「1」に変更される。この場合、ステップS310で、「表内テキスト」の属性を持つ領域のみがディスプレイ108へ出力されることになる。
【0030】
一方、ステップS308で、「本文テキスト」のみを「有効」と設定し、「表内テキスト」を「無効」に設定する。ステップS309で、「本文テキスト」の属性を持つ領域の矩形データの出力フラグが「0」、「表内テキスト」の属性を持つ領域の矩形データの出力フラグが「1」に変更される。この場合、ステップS310で、「本文テキスト」の属性を持つ領域のみがディスプレイ108へ出力されることになる。
【0031】
ステップS310で、矩形データの出力フラグが「0」である領域がディスプレイ108へ出力される。
例えば、ステップS305の判定条件である「表内テキスト」の面積が原稿画像に対して占める割合nを「0.5」と設定し、図6の原稿画像に対して処理を実行すると、図6の原稿画像には表の面積は原稿画像の半分以上を占めないため、図9に示されるように「本文テキスト」のみが抽出されていることを示す実線がテキスト領域を囲んでディスプレイ108へ出力される。また、図10は、表の面積が原稿画像の半分以上を占める場合で、「表内テキスト」のみが抽出されていることを示す破線が表領域を囲んでディスプレイ108へ出力される。
【0032】
本実施の形態では、領域出力モードが「自動」である時のディスプレイ108への出力対象を、所定数以上の表が処理対象の原稿画像に存在する場合に、「表内テキスト」をディスプレイ108へ出力するという条件にしていたが、これに限らない。例えば、「表内テキスト」だけでなく「図内テキスト」やそれ以外の非テキスト領域を出力対象とすることも可能である。
【0033】
例えば、領域出力モードが「自動」である時のディスプレイ108への出力対象を「表内テキスト」と「図内テキスト」として設定し、かつ「表内テキスト」の面積が画像原稿に対して占める割合iと「図内テキスト」の面積が画像原稿に対して占める割合jの合計割合(i+j)がk以上の場合に、「表内テキスト」と「図内テキスト」をディスプレイ108へ出力するという条件で実行される処理について、図11を用いて説明する。この場合、処理を始める前の初期状態では、図12に示されるように、プルダウンメニュー602aに表示される「表内テキスト」と「図内テキスト」が「有効」に設定され、「本文テキスト」と「無効」に設定される。
【0034】
図11は本実施の形態の他の構成による処理フローを示すフローチャートである。
尚、図11の説明では、領域出力モードが「自動」に設定されている状態の時の処理についてのみ説明する。また、 領域出力モードが「手動」に設定されている状態の時の処理は、ステップS302、ステップS303で説明した処理と同様なので、その説明は省略する。
【0035】
ステップS1101で、属性が「表内テキスト」である表領域の面積が画像原稿に対して占める割合i(iは正の整数)を算出する。ステップS1102で、属性が「図内テキスト」である図領域の面積が画像原稿に対して占める割合j(jは正の整数)を算出する。ステップS1103で、算出される表領域と図領域の面積が画像原稿に対して占める割合の合計(i+j)がk以上であるか否かを判定する。k以上である場合(ステップS1103でYES)、ステップS1106に進む。k以上でない場合(ステップS1103でNO)、ステップS1104に進む。
【0036】
尚、上述のステップS1103の判定で用いる閾値kは、KB114を介してユーザが所望の閾値を入力する。
ステップS1104で、「表内テキスト」と「図内テキスト」を「有効」と設定し、「本文テキスト」を「無効」に設定する。ステップS1105で、「表内テキスト」と「図内テキスト」の属性を持つ領域の矩形データの出力フラグが「0」、「本文テキスト」の属性を持つ領域の矩形データの出力フラグが「1」に変更される。この場合、ステップS1108で、「表内テキスト」と「図内テキスト」の属性を持つ領域がディスプレイ108へ出力されることになる。
【0037】
一方、ステップS1106で、「本文テキスト」のみを「有効」と設定し、「表内テキスト」と「図内テキスト」を「無効」に設定する。ステップS1107で、「本文テキスト」の属性を持つ領域の矩形データの出力フラグが「0」、「表内テキスト」と「図内テキスト」の属性を持つ領域の矩形データの出力フラグが「1」に変更される。この場合、ステップS1108で、「本文テキスト」の属性を持つ領域のみがディスプレイ108へ出力されることになる。
【0038】
例えば、図12は、ステップS1303の判定条件である「表内テキスト」と「図内テキスト」の面積が画像原稿に対して占める割合の合計割合を「0.5」と設定した上で、領域出力モードが「自動」、「表内テキスト」および「図内テキスト」が「有効」に設定されている状態で、処理が実行された場合の処理結果である。この場合、「表内テキスト」および「図内テキスト」の各領域に破線の枠が表示され、「表内テキスト」および「図内テキスト」の面積が画像原稿に対して占める割合が0.5以上であることを示している。
【0039】
更に、図11で説明された領域出力モードが「自動」の時の出力対象の条件を出力対象となる非テキスト領域ごとに指示することも可能である。
例えば、領域出力モードが「自動」である時のディスプレイ108への出力対象を「表内テキスト」と「図内テキスト」として設定し、かつ「表内テキスト」の面積が画像原稿に対して占める割合iがg以上、「図内テキスト」の面積が画像原稿に対して占める割合jがh以上である場合に、それぞれ「表内テキスト」と「図内テキスト」をディスプレイ108へ出力するという条件で実行される処理について、図13を用いて説明する。
【0040】
図13は本実施の形態の他の構成による処理フローを示すフローチャートである。
ステップS1301で、まず、「本文テキスト」の属性を持つ領域を「有効」として、その領域の矩形データの出力フラグを「0」に初期化する。
ステップS1302で、属性が「表内テキスト」である表領域の面積が画像原稿に対して占める割合iを算出する。ステップS1303で、算出される割合iがg以上(gは正の整数)であるか否かを判定する。g以上である場合(ステップS1303でYES)、ステップS1304に進む。g以上でない場合(ステップS1303でNO)、ステップS1306に進む。
【0041】
尚、上述のステップS1303の判定で用いる閾値gは、KB114を介してユーザが所望の閾値を入力する。
ステップS1304で、「表内テキスト」のみを「有効」と設定し、「本文テキスト」を「無効」に設定する。ステップS1305で、「表内テキスト」の属性を持つ領域の矩形データの出力フラグが「0」、「本文テキスト」の属性を持つ領域の矩形データの出力フラグが「1」に変更される。この場合、ステップS1314で、「表内テキスト」の属性を持つ領域のみがディスプレイ108へ出力されることになる。
【0042】
一方、ステップS1306で、「本文テキスト」のみを「有効」と設定し、「表内テキスト」を「無効」に設定する。ステップS1307で、「本文テキスト」の属性を持つ領域の矩形データの出力フラグが「0」、「表内テキスト」の属性を持つ領域の矩形データの出力フラグが「1」に変更される。この場合、ステップS1314で、「本文テキスト」の属性を持つ領域のみがディスプレイ108へ出力されることになる。
【0043】
ステップS1308で、属性が「図内テキスト」である図領域の面積が画像原稿に対して占める割合jを算出する。ステップS1309で、算出される割合jがh以上(hは正の整数)であるか否かを判定する。h以上である場合(ステップS1309でYES)、ステップS1310に進む。h以上でない場合(ステップS1309でNO)、ステップS1310に進む。
【0044】
尚、上述のステップS1309の判定で用いる閾値hは、KB114を介してユーザが所望の閾値を入力する。
ステップS1310で、「図内テキスト」のみを「有効」と設定し、「本文テキスト」を「無効」に設定する。ステップS1311で、「図内テキスト」の属性を持つ領域の矩形データの出力フラグが「0」、「本文テキスト」の属性を持つ領域の矩形データの出力フラグが「1」に変更される。この場合、ステップS1314で、「図内テキスト」の属性を持つ領域のみがディスプレイ108へ出力されることになる。
【0045】
一方、ステップS1312で、「本文テキスト」のみを「有効」と設定し、「図内テキスト」を「無効」に設定する。ステップS1313で、「本文テキスト」の属性を持つ領域の矩形データの出力フラグが「0」、「図内テキスト」の属性を持つ領域の矩形データの出力フラグが「1」に変更される。この場合、ステップS1314で、「本文テキスト」の属性を持つ領域のみがディスプレイ108へ出力されることになる。
【0046】
ステップS1314で、矩形データの出力フラグが「0」である領域がディスプレイ108へ出力される。
尚、表領域の面積が画像原稿に対して占める割合iがg未満で図領域の面積が画像原稿に対して占める割合jがk以上であれば、「表内テキスト」の属性を持つ領域の矩形データの出力フラグの変更の処理の際、「本文テキスト」の属性を持つ領域の矩形データの出力フラグは変更されない。しかし、「図内テキスト」の属性を持つ領域の矩形データの出力フラグの変更の処理の際、「本文テキスト」の属性を持つ領域の矩形データの出力フラグが無効に設定されるので、「図内テキスト」の属性を持つ領域のみがディスプレイ108へ出力されることになる。
【0047】
同様にして、逆の場合は「表内テキスト」の属性を持つ領域のみがディスプレイ108へ出力されることになる。更に、表領域の面積が画像原稿に対して占める割合iがg未満で図領域の面積が画像原稿に対して占める割合jもh未満であれば、「本文テキスト」の属性を持つ領域の矩形データの出力フラグは初期設定のまま変わらないので、「本文テキスト」の属性を持つ領域のみがディスプレイ108へ出力されることになる。
【0048】
以上、本実施の形態の領域出力モードが「自動」の時の出力対象の条件を、いくつか例を挙げて説明した。以下、本実施の形態で説明される特徴的な処理の概要を、図14に示すフローチャートを用いて説明する。
図14は本実施の形態の処理フローの概要を示すフローチャートである。
ステップS1001で、領域出力モードが「自動」である時のディスプレイ108への出力対象とする領域の出力条件を設定する。
【0049】
ステップS1002で、領域出力モードが「自動」であるか否かを判定する。「自動」でない(つまり「手動」である)場合(ステップS1001でNO)、ステップS1003に進む。「自動」である場合(ステップS1001でYES)、ステップS1005に進む。
ステップS1003で、ディスプレイ108への出力対象を指示する。
【0050】
ステップS1004で、出力対象を指示する際の処理を実行する。
一方、ステップS1005で、予め設定された出力条件に従って出力対象を指示する処理を実行する。
ステップS1006で、矩形データの出力フラグが「0」である領域がディスプレイ108へ出力される。
【0051】
以上説明したように、本実施の形態によれば、領域出力モードを備え、そのモードを「自動」に設定することで、予め設定された条件に基づいて、所望の属性を有する領域を出力することができる。また、モードを「手動」にすることで、ユーザが任意の属性を有する領域を出力することができる。その結果、複数の属性の領域を有する原稿画像の中から、所望の属性を有する領域を出力するための操作が容易になり作業効率が向上する。
【0052】
尚、本発明は、複数の機器(例えば、ホストコンピュータ、インタフェース機器、リーダ、プリンタ等)から構成されるシステムに適用しても、一つの機器からなる装置(例えば、複写機、ファクシミリ装置等)に適用してもよい。
また、本発明の目的は、前述した実施形態の機能を実現するソフトウェアのプログラムコードを記録した記憶媒体を、システムあるいは装置に供給し、そのシステムあるいは装置のコンピュータ(またはCPUやMPU)が記憶媒体に格納されたプログラムコードを読出し実行することによっても、達成されることは言うまでもない。
【0053】
この場合、記憶媒体から読出されたプログラムコード自体が上述した実施の形態の機能を実現することになり、そのプログラムコードを記憶した記憶媒体は本発明を構成することになる。
プログラムコードを供給するための記憶媒体としては、例えば、フロッピディスク、ハードディスク、光ディスク、光磁気ディスク、CD−ROM、CD−R、磁気テープ、不揮発性のメモリカード、ROMなどを用いることができる。
【0054】
また、コンピュータが読出したプログラムコードを実行することにより、前述した実施形態の機能が実現されるだけでなく、そのプログラムコードの指示に基づき、コンピュータ上で稼働しているOS(オペレーティングシステム)などが実際の処理の一部または全部を行い、その処理によって前述した実施の形態の機能が実現される場合も含まれることは言うまでもない。
【0055】
更に、記憶媒体から読出されたプログラムコードが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書込まれた後、そのプログラムコードの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPUなどが実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
【0056】
本発明を上記記憶媒体に適用する場合、その記憶媒体には、先に説明したフローチャートに対応するプログラムコードを格納することになるが、簡単に説明すると、図15のメモリマップ例に示す各モジュールを記憶媒体に格納することになる。
すなわち、少なくとも「分割モジュール」、「算出モジュール」、「第1指定モジュール」および「出力モジュール」の各モジュールのプログラムコードを記憶媒体に格納すればよい。
【0057】
【発明の効果】
以上の説明からも明らかなように、本発明によれば、原稿画像内の所望の属性を有する領域に含まれるテキストを抽出するための操作を容易にし、作業効率を向上する画像処理装置及びその方法を提供できる。
【図面の簡単な説明】
【図1】本実施の形態の画像処理装置の機能構成を示すブロック図である。
【図2】本実施の形態の入力画像の領域分割処理の処理フローを示すフローチャートである。
【図3】本実施の形態の処理フローを示すフローチャートである。
【図4】本実施の形態の出力対象を指示する際の処理フローを示すフローチャートである。
【図5】(a)は、本実施の形態の矩形データの構造を示す図であり、(b)は各属性とその識別番号の関係を示す図である。
【図6】本実施の形態の原稿画像の表示例を示す図である。
【図7】本実施の形態の文字認識対象メニューによる文字認識対象の指示方法を説明するための図である。
【図8】本実施の形態の出力対象を全ての属性の領域とした場合の表示例を示す図である。
【図9】本実施の形態の出力対象を「本文テキスト」の属性を持つ領域とした場合の表示例を示す図である。
【図10】本実施の形態の出力対象を「表内テキスト」の属性を持つ領域とした場合の表示例を示す図である。
【図11】本実施の形態の他の構成による処理フローを示すフローチャートである。
【図12】本実施の形態の出力対象を「表内テキスト」と「図内テキスト」の属性を持つ領域とした場合の表示例を示す図である。
【図13】本実施の形態の他の構成による処理フローを示すフローチャートである。
【図14】本実施の形態の処理フローの概要を示すフローチャートである。
【図15】本発明で実行される処理フローのプログラムを記憶させたFDのメモリマップの構造を示す図である。
【符号の説明】
101 スキャナ
102 スキャナインタフェース
103 マウス
104 マウスインタフェース
105 CPU
106 ROM
107 RAM
108 ディスプレイ
109 ディスプレイインタフェース
110 FDD
111 FDDインタフェース
112 バス

Claims (12)

  1. 原稿画像に含まれる文字を認識してテキストデータを出力する画像処理装置であって、
    前記原稿画像を属性毎の領域に分割する分割手段と、
    前記原稿画像内において、所定の属性を有する領域の面積前記原稿画像の面積に対して占める割合を算出する算出手段と、
    前記算出手段の算出結果と予め定められた条件とを比較した結果に基づいて、各属性に対して文字認識対象にするか否かの設定を自動的に行う第1設定手段と、
    前記文字認識対象にすると設定された属性を有する領域に含まれる文字を文字認識してテキストデータを出力する出力手段と
    を備えることを特徴とする画像処理装置。
  2. 自動モードと手動モードのいずれかに切り替えて設定するモード切替手段と、
    前記モード切替手段で手動モードに設定されている場合は、ユーザの指示に基づき、ユーザ所望の属性を文字認識対象として設定する第2設定手段と、を更に備え、
    前記モード切替手段で自動モードに設定されている場合は、前記第1設定手段において、前記算出手段の算出結果と予め定められた条件とを比較した結果に基づき、各属性に対して文字認識対象にするか否かの設定を自動的に行う
    ことを特徴とする請求項1に記載の画像処理装置。
  3. 前記第1設定手段は、前記算出手段で算出される前記所定の属性を有する領域の面積前記原稿画像の面積に対して占める割合が所定数以上である場合、該所定の属性を文字認識対象として設定する
    ことを特徴とする請求項1に記載の画像処理装置。
  4. 前記第1設定手段は、前記算出手段で算出される割合が前記所定数未満である場合、当該所定の属性を文字認識対象としない
    ことを特徴とする請求項に記載の画像処理装置。
  5. 前記算出手段は、表内テキストの属性を有する表領域の面積が前記原稿画像の面積に対して占める割合を算出し、
    前記第1設定手段は、
    前記算出手段で算出される割合が所定数以上である場合、当該表内テキストの属性を文字認識対象とし且つ本文テキストの属性を文字認識対象としないように設定し、
    一方、前記算出手段で算出される割合が前記所定数未満である場合、当該表内テキストの属性を文字認識対象とせず且つ本文テキストの属性を文字認識対象とするように設定する
    ことを特徴とする請求項1に記載の画像処理装置。
  6. 前記算出手段は、表内テキストの属性を有する領域の面積と図内テキストの属性を有する領域の面積との合計が前記原稿画像の面積に対して占める割合を算出し、
    前記第1設定手段は、
    前記算出手段で算出される割合が所定数以上である場合、当該表内テキストの属性と前記図内テキストの属性とを文字認識対象とし且つ本文テキストの属性を文字認識対象としないように設定し、
    一方、前記算出手段で算出される割合が前記所定数未満である場合、当該表内テキストの属性と前記図内テキストの属性とを文字認識対象とせず且つ本文テキストの属性を文字認識対象として設定する
    ことを特徴とする請求項1に記載の画像処理装置。
  7. 原稿画像に含まれる文字を認識してテキストデータを出力する画像処理方法であって、
    前記原稿画像を属性毎の領域に分割する分割工程と、
    前記原稿画像内において、所定の属性を有する領域の面積前記原稿画像の面積に対 て占める割合を算出する算出工程と、
    前記算出工程の算出結果と予め定められた条件とを比較した結果に基づいて、各属性に対して文字認識対象にするか否かの設定を自動的に行う第1設定工程と、
    前記文字認識対象にすると設定された属性を有する領域に含まれる文字を文字認識してテキストデータを出力する出力工程と
    を備えることを特徴とする画像処理方法。
  8. 自動モードと手動モードのいずれかに切り替えて設定するモード切替工程と、
    前記モード切替工程で手動モードに設定されている場合は、ユーザの指示に基づき、ユーザ所望の属性を文字認識対象として設定する第2設定工程と、を更に備え、
    前記モード切替工程で自動モードに設定されている場合は、前記第1設定工程において、前記算出工程の算出結果と予め定められた条件とを比較した結果に基づき、各属性に対して文字認識対象にするか否かの設定を自動的に行う
    ことを特徴とする請求項7に記載の画像処理方法。
  9. 前記第1設定工程では、前記算出工程で算出される前記所定の属性を有する領域の面積前記原稿画像の面積に対して占める割合が所定数以上である場合、該所定の属性を文字認識対象として設定する
    ことを特徴とする請求項7に記載の画像処理方法。
  10. 前記第1設定工程では、前記算出工程で算出される割合が前記所定数未満である場合、当該所定の属性を文字認識対象としない
    ことを特徴とする請求項に記載の画像処理方法。
  11. 前記算出工程では、表内テキストの属性を有する表領域の面積が前記原稿画像の面積に対して占める割合を算出し、
    前記第1設定工程では、
    前記算出工程で算出される割合が所定数以上である場合、当該表内テキストの属性を文字認識対象とし且つ本文テキストの属性を文字認識対象としないように設定し、
    一方、前記算出工程で算出される割合が所定数未満である場合、当該表内テキストの属性を文字認識対象とせず且つ本文テキストの属性を文字認識対象とするように設定する
    ことを特徴とする請求項7に記載の画像処理方法。
  12. 前記算出工程では、表内テキストの属性を有する領域の面積と図内テキストの属性を有する領域の面積との合計が前記原稿画像の面積に対して占める割合を算出し、
    前記第1設定工程では、
    前記算出工程で算出される割合が所定数以上である場合、当該表内テキストの属性と前記図内テキストの属性とを文字認識対象とし且つ本文テキストの属性を文字認識対象としないように設定し、
    一方、前記算出工程で算出される割合が前記所定数未満である場合、当該表内テキストの属性と前記図内テキストの属性とを文字認識対象とせず且つ本文テキストの属性を文字認識対象として設定する
    ことを特徴とする請求項7に記載の画像処理方法。
JP00195296A 1996-01-10 1996-01-10 画像処理装置及びその方法 Expired - Fee Related JP3744996B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP00195296A JP3744996B2 (ja) 1996-01-10 1996-01-10 画像処理装置及びその方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP00195296A JP3744996B2 (ja) 1996-01-10 1996-01-10 画像処理装置及びその方法

Publications (2)

Publication Number Publication Date
JPH09190490A JPH09190490A (ja) 1997-07-22
JP3744996B2 true JP3744996B2 (ja) 2006-02-15

Family

ID=11515943

Family Applications (1)

Application Number Title Priority Date Filing Date
JP00195296A Expired - Fee Related JP3744996B2 (ja) 1996-01-10 1996-01-10 画像処理装置及びその方法

Country Status (1)

Country Link
JP (1) JP3744996B2 (ja)

Also Published As

Publication number Publication date
JPH09190490A (ja) 1997-07-22

Similar Documents

Publication Publication Date Title
JP4637455B2 (ja) ユーザインタフェースの利用方法並びにコンピュータで使用可能な媒体を含む製品
JP3825820B2 (ja) ページ解析システム
US6683631B2 (en) System and method for selecting and deselecting information in an electronic document
US6411731B1 (en) Template-based image recognition and extraction
US7839541B2 (en) Image editing system and method therefor
CN109739372B (zh) 用于手写输入设备的图形绘制方法及手写阅读设备
US7464336B2 (en) Information processing apparatus, image edit apparatus, and control methods thereof, and computer program and computer-readable storage medium
JP4586241B2 (ja) 画像処理装置
EP3671539B1 (en) Method for image processing, and image-processing system
US7793224B1 (en) Methods and apparatus for formatting identified content
US7032171B1 (en) System and method for selecting and processing information in an electronic document
JP4109920B2 (ja) 画像処理装置、画像処理方法、プログラム、及び記憶媒体
JP4921335B2 (ja) ドキュメント処理装置及び検索方法
JP3740203B2 (ja) 画像処理装置およびその方法
JP3744996B2 (ja) 画像処理装置及びその方法
JP2000322417A (ja) 画像ファイリング装置及び方法及び記憶媒体
JP2014211747A (ja) 画像処理装置、端末装置、情報処理方法及びプログラム
JPH08180068A (ja) 電子ファイリング装置
US8059138B2 (en) Image processing and arranging system, image processing and arranging method, and computer readable medium for image processing and arranging
JP2006072839A (ja) 画像処理方法、画像処理装置、画像処理プログラム及び記録媒体
JP3363119B2 (ja) 手書きデータ入力装置および手書きデータ入力方法、ならびに該方法を記録した記録媒体
EP0991265A2 (en) User interface high-lighter function to provide directed input for image processing
JPH11203402A (ja) 画像処理装置及び画像処理方法
JP2800254B2 (ja) 画像一文字処理装置
JPH096974A (ja) 画像処理方法及び装置

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050708

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050906

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20051031

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20051116

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091202

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091202

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101202

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111202

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121202

Year of fee payment: 7

LAPS Cancellation because of no payment of annual fees