JPH09190502A - 画像処理装置およびその方法 - Google Patents
画像処理装置およびその方法Info
- Publication number
- JPH09190502A JPH09190502A JP8001936A JP193696A JPH09190502A JP H09190502 A JPH09190502 A JP H09190502A JP 8001936 A JP8001936 A JP 8001936A JP 193696 A JP193696 A JP 193696A JP H09190502 A JPH09190502 A JP H09190502A
- Authority
- JP
- Japan
- Prior art keywords
- attribute
- area
- text
- designation
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Landscapes
- Character Input (AREA)
- Character Discrimination (AREA)
- Document Processing Apparatus (AREA)
Abstract
れるテキストを抽出するための操作を容易にし、作業効
率を向上する画像処理装置及びその方法を提供する。 【解決手段】 原稿画像を属性毎の領域に分割し、原稿
画像内に含まれる複数の属性の少なくとも1つを指定す
る。指定された属性を有する領域に含まれる文字を認識
してテキストデータをディスプレイ108へ出力する。
Description
る文字を認識してテキストデータを出力する画像処理装
置及びその方法に関するものである。
ナ等で読み込んだ原稿の読み込み結果としてディスプレ
イ等に表示される原稿画像に対し、その原稿画像に含ま
れるテキスト情報を抽出する場合、原稿画像に含まれる
属性に従ってテキスト領域および非テキスト領域に分割
する処理である領域分割を実行した後、各領域毎に存在
するテキストのテキストの抽出処理を行っていた。ま
た、特に、非テキスト領域である表領域の中に含まれる
テキストに対しては、その表を構成する罫線を抽出した
後に、罫線に囲まれた領域内のテキストを抽出してい
た。
従来の画像処理装置において、領域分割の処理対象であ
る原稿画像にテキスト領域と非テキスト領域が混在する
場合、例えば、非テキスト領域として表が存在する場
合、その表の中のテキストを表内テキストとして抽出を
行っても、原稿画像内のテキスト領域のテキストと表内
のテキストが区別されずに抽出されてしまい、表内のテ
キストあるいはテキスト領域のテキストだけを抽出する
ことができなかった。
合、領域分割処理後、原稿画像内のテキスト領域を削除
するか、あるいは表のみを予め指定する等の操作が必要
であり、原稿画像内の所望のテキストを抽出するための
操作が煩雑になるという問題点があった。また、作業効
率を低下させていた。本発明は上記の問題点に鑑みてな
されたものであり、原稿画像内の所望の属性を有する領
域に含まれるテキストを抽出するための操作を容易に
し、作業効率を向上する画像処理装置及びその方法を提
供することを目的としている。
めの本発明による画像処理装置は以下の構成を備える。
即ち、原稿画像に含まれる文字を認識してテキストデー
タを出力する画像処理装置であって、前記原稿画像を属
性毎の領域に分割する分割手段と、前記原稿画像内に含
まれる複数の属性の少なくとも1つを指定する指定手段
と、前記指定手段で指定された属性を有する領域に含ま
れる文字を認識してテキストデータを出力する出力手段
とを備える。
原稿画像内において、所定の属性を有する領域の個数を
計数する計数手段を備え、前記計数手段の計数結果に基
づいて、前記原稿画像内に含まれる複数の属性の少なく
とも1つを指定する。また、好ましくは、前記指定手段
は、前記原稿画像内に含まれる所望の属性を、ユーザに
よって指定する。ユーザによって指定することでユーザ
の用途に応じた属性の指定をすることができるからであ
る。
原稿画像内において、所定の属性を有する領域の個数を
計数する計数手段と、前記計数手段の計数結果に基づい
て、前記原稿画像内に含まれる複数の属性の少なくとも
1つを指定する第1指定手段と、前記原稿画像内に含ま
れる所望の属性を、ユーザによって指定する第2指定手
段とを備える。
る指定から前記第2指定手段による指定、あるいは前記
第2指定手段による指定から前記第1指定手段による指
定に切り替える切替手段を更に備える。切替手段を設け
ることで、より自由度の高い属性の指定を行うことがで
きるからである。
計数手段で計数される個数が所定数以上である場合、該
所定の属性を指定する。所定数以上である場合に、所定
の属性を指定することで、原稿画像内に該所定の属性を
持つ領域がく含まれることを判定することができるから
である。また、好ましくは、前記指定手段は、前記計数
手段で計数される個数が所定数未満である場合、前記原
稿画像内に含まれるテキスト領域を指定する。
示する指示手段を更に備える。所定数の変更を指示する
ことで、所望の数を指定することができるからである。
上記の目的を達成するための本発明による画像処理方法
は以下の構成を備える。即ち、原稿画像に含まれる文字
を認識してテキストデータを出力する画像処理方法であ
って、前記原稿画像を属性毎の領域に分割する分割工程
と、前記原稿画像内に含まれる複数の属性の少なくとも
1つを指定する指定工程と、前記指定工程で指定された
属性を有する領域に含まれる文字を認識してテキストデ
ータを出力する出力工程とを備える。
原稿画像内において、所定の属性を有する領域の個数を
計数する計数工程を備え、前記計数工程の計数結果に基
づいて、前記原稿画像内に含まれる複数の属性の少なく
とも1つを指定する。また、好ましくは、前記指定工程
は、前記原稿画像内に含まれる所望の属性を、ユーザに
よって指定する。
原稿画像内において、所定の属性を有する領域の個数を
計数する計数工程と、前記計数工程の計数結果に基づい
て、前記原稿画像内に含まれる複数の属性の少なくとも
1つを指定する第1指定工程と、前記原稿画像内に含ま
れる所望の属性を、ユーザによって指定する第2指定工
程とを備える。
る指定から前記第2指定工程による指定、あるいは前記
第2指定手段による指定から前記第1指定手段による指
定に切り替える切替工程を更に備える。また、好ましく
は、前記指定工程は、前記計数工程で計数される個数が
所定数以上である場合、該所定の属性を指定する。
計数工程で計数される個数が所定数未満である場合、前
記原稿画像内に含まれるテキスト領域を指定する。ま
た、好ましくは、前記所定数の変更を指示する指示工程
を更に備える。上記の目的を達成するための本発明によ
るコンピュータ可読メモリは以下の構成を備える。即
ち、画像処理のプログラムコードが格納されたコンピュ
ータ可読メモリであって、前記原稿画像を属性毎の領域
に分割する分割工程のコードと、前記原稿画像内に含ま
れる複数の属性の少なくとも1つを指定する指定工程の
コードと、前記指定工程で指定された属性を有する領域
に含まれる文字を認識してテキストデータを出力する出
力工程のコードとを備える。
適な実施の形態を詳細に説明する。図1は本実施の形態
の画像処理装置の機能構成を示すブロック図である。図
1において、101はスキャナであり、画像原稿に光を
照射し、その反射光を読み取り電気信号に変換する。ま
た、スキャナ101より読み込まれた画像原稿は、イメ
ージデータとしてRAM107のVRAM領域に格納さ
れる。102はスキャナインターフェースであり、スキ
ャナ101で得られた電気信号を2値のデジタル電気信
号に変換し、他の装置構成要素に伝送する。103はポ
インティングデバイスとして機能するマウスであり、マ
ウス103を移動することでディスプレイ108上に表
示されるカーソル100(図6参照)を移動する。ま
た、画面に表示されるメニューにカーソル100を位置
し、そのメニュー上で付帯するボタン(不図示)を用い
てドラッグ操作、クリック操作を行うことで、その内容
を実行することができる。104はマウスインタフェー
スであり、マウス103からの信号を受け、それを他の
装置構成要素に伝送する。114はKB(キーボード)
であり、キーボードを介してデータの入力や命令の実行
を行う。113はKBインターフェースであり、KB1
14からの信号を受け、それを他の装置構成要素に伝送
する。
び文字切り出し処理や認識処理を実行する。106はR
OMであり、CPU105が実行する制御プログラム、
各種処理プログラムやフォントデータ等の各種データを
格納している。107はRAMであり、文字画像の展開
や文字認識処理のための作業領域等として用いる。ま
た、スキャナ101より読み込まれたイメージデータを
格納するための所定の記憶領域としてVRAM領域を持
つ。108はディスプレイであり、RAM107のVR
AM領域に格納されているイメージデータや本実施の形
態で実行された認識結果を表示する。109はディスプ
レイインターフェースである。
イブ)であり、FDを装着しデータの読み書きが可能で
ある。また、装着されたFD(不図示)に後述する処理
フローのプログラムを書き込み、該プログラムを本装置
のRAM107に読み込むことで処理を実行させること
ができる。111はFDDインターフェースである。そ
して、112は各装置構成要素を接続するバスである。
力画像の領域分割処理について説明する。図2は本実施
の形態の入力画像の領域分割処理の処理フローを示すフ
ローチャートである。ステップS201で、認識しよう
とする文書をスキャナ101で読み込み2値画像データ
に変換する。ステップS202で、得られた2値画像デ
ータに対して領域分割を行い、テキスト領域、図形領
域、表領域等の各種領域を抽出する。また、各種領域に
は、それらの位置を示す座標、属性、認識順序等の情報
を格納した矩形データ(図5の(a)を参照)が生成さ
れる。そして、各領域に対して生成された矩形データの
属性に、図5の(b)に示すような各種属性に対応した
識別番号を格納する。
タについて説明する。矩形データは、各領域に有する特
徴をまとめて構成させたものであり、各領域に対応する
RAM106に格納される。図の中の、始点座標と終点
座標は、ディスプレイ108上に位置する領域の始点と
終点の座標を格納する。属性は、各領域の属性に対応す
る図5の(b)に示される識別番号を格納する。認識順
序は、ディスプレイ108上に表示される複数の領域に
含まれる各テキストの認識順序を格納する。出力フラグ
は、その領域の出力の有無を決定するための情報を格納
する。この詳細については、後述する。
れた非テキスト領域については、更に、それらの領域内
のテキスト領域を抽出を行う。抽出された非テキスト領
域内テキストには、その属性として「表内テキスト」や
「図内テキスト」として矩形データに本文のテキスト領
域の属性である「本文テキスト」とは異なる識別番号を
付加する。
各矩形データに対して、その出力フラグを0にして初期
化する。ステップS205で、RAM107上に各領域
の矩形データを保持する。例えば、スキャナ101から
読み込まれた原稿画像として図6に示されるような文書
がディスプレイ108に表示されたとする。図6の上部
には、本実施の形態で説明される処理を実行するための
命令としてメニューが表示されている。各メニューは、
その表示される位置にカーソル100をあわせ、その位
置でドラッグ操作あるいはクリック操作することで、表
示されるメニューの内容を実行することができる。
あり、このメニューの位置でカーソル100をクリック
操作することで領域分割処理が実行される。602は文
字認識対象を選択するためのメニューであり、このメニ
ューの位置でカーソル100を合わせマウス103のボ
タンを押すと、図7に示すようなプルダウンメニューが
表示される。この詳細については、後述する。603は
領域分割された原稿画像のテキスト領域に対して、文字
認識を実行させるためのメニューであり、このメニュー
の位置でカーソル100をクリック操作することで文字
認識処理が実行される。
メニューであり、このメニューの位置でカーソル100
をクリック操作することで、認識させる所望の属性を持
つ領域のディスプレイ108への出力を「自動」あるい
は「手動」に切り替えて設定することができる。「手
動」の場合は、ユーザによって、所望の属性を持つ領域
をディスプレイ108へ出力するための設定を行う。こ
の設定の方法について、図7を用いて説明する。カーソ
ル100を文字認識対象メニュー602にあわせ、マウ
ス103のボタンを1回押すとプルダウンメニュー60
2aが表示される。プルダウンメニュー602aには、
所望の属性の領域のディスプレイ108への出力の設定
を行うために、例えば、「本文テキスト」、「表内テキ
スト」、「図内テキスト」等の領域の属性のメニューが
表示される。各領域の属性のメニューの横には、その属
性を持つ領域をディスプレイ108への出力するか否か
を決定するための切替メニュー「無効」/「有効」が表
示され、カーソル100をその位置に合わせクリック操
作することで「無効」/「有効」が切り替わる。切替メ
ニューに「有効」が表示される場合はその属性を持つ領
域がディスプレイ108への出力対象となり、切替メニ
ューに「無効」が表示される場合はその属性を持つ領域
がディスプレイ108への非出力対象となる。
て、文字認識対象として「本文テキスト」、「表内テキ
スト」を「有効」に設定した場合に、領域分割処理(カ
ーソル100を領域分割メニュー601上でクリック操
作)を実行すると、図8に示されるように、実線の枠で
囲まれたテキスト領域の矩形と、点線の枠で囲まれた非
テキスト領域の矩形が抽出されディスプレイ108へ表
示される。
の領域のディスプレイ108への出力の条件を設定して
おき、その条件に従って処理が実行される。次に、本実
施の形態の領域出力モードメニュー604の操作によっ
て、実行される処理について図3と図4のフローチャー
トを用いて説明する。図3は本実施の形態の処理フロー
を示すフローチャートである。
ニュー604が「自動」の場合、所定数以上の「表内テ
キスト」が処理対象である原稿画像に存在する場合に、
「表内テキスト」をディスプレイ108へ出力するとい
う条件で処理が実行されるものとする。また、説明を簡
略化するために「本文テキスト」と「表内テキスト」を
ディスプレイ108への出力対象として説明する。
「自動」であるか否かを判定する。「自動」でない(つ
まり「手動」である)場合(ステップS301でN
O)、ステップS302に進む。「自動」である場合
(ステップS301でYES)、ステップS304に進
む。ステップS302で、「本文テキスト」や「表内テ
キスト」等のディスプレイ108への出力対象を指示す
る。
際の処理を実行する。この処理を、図4のフローチャー
トを用いて説明する。図4は本実施の形態の出力対象を
指示する際の処理フローを示すフローチャートである。
ステップS401で、「本文テキスト」が「有効」であ
るか否かを判定する。「有効」でない(つまり「無効」
である)場合(ステップS401でNO)、ステップS
403に進む。「有効」である場合(ステップS401
でYES)、ステップS402に進む。
属性を持つ領域である各領域の矩形データの出力フラグ
を「0」に変更する。ステップS403で、「本文テキ
スト」の属性を持つ領域である各領域の矩形データの出
力フラグを「1」に変更する。同様に、ステップS40
4で、「表内テキスト」が「有効」であるか否かを判定
する。「有効」でない(つまり「無効」である)場合
(ステップS404でNO)、ステップS406に進
む。「有効」である場合(ステップS404でYE
S)、ステップS405に進む。
属性を持つ領域である各領域の矩形データの出力フラグ
を「0」に変更する。ステップS406で、「表内テキ
スト」の属性を持つ領域である各領域の矩形データの出
力フラグを「1」に変更する。再び、図3のフローチャ
ートの説明に戻る。
ト」である表領域の個数を算出する。ステップS305
で、算出される個数がn個以上(nは正の整数)である
か否かを判定する。n個以上ある場合(ステップS30
5でYES)、ステップS306に進む。n個以上ない
場合(ステップS305でNO)、ステップS308に
進む。
る閾値nは、KB114を介してユーザが所望の閾値を
入力する。ステップS306で、「表内テキスト」のみ
を「有効」と設定し、「本文テキスト」を「無効」に設
定する。ステップS307で、「表内テキスト」の属性
を持つ領域の矩形データの出力フラグが「0」、「本文
テキスト」の属性を持つ領域の矩形データの出力フラグ
が「1」に変更される。この場合、ステップS310
で、「表内テキスト」の属性を持つ領域のみがディスプ
レイ108へ出力されることになる。
ト」のみを「有効」と設定し、「表内テキスト」を「無
効」に設定する。ステップS309で、「本文テキス
ト」の属性を持つ領域の矩形データの出力フラグが
「0」、「表内テキスト」の属性を持つ領域の矩形デー
タの出力フラグが「1」に変更される。この場合、ステ
ップS310で、「本文テキスト」の属性を持つ領域の
みがディスプレイ108へ出力されることになる。
ラグが「0」である領域がディスプレイ108へ出力さ
れる。例えば、ステップS305の判定条件である「表
内テキスト」の個数nを「3」と設定し、図6の原稿画
像に対して処理を実行すると、図6の原稿画像には表が
1つしかないため、図9に示されるように「本文テキス
ト」のみが抽出されていることを示す実線がテキスト領
域を囲んでディスプレイ108へ出力される。また、図
10は、表の個数が3個以上ある場合で、「表内テキス
ト」のみが抽出されていることを示す破線が表領域を囲
んでディスプレイ108へ出力される。
動」である時のディスプレイ108への出力対象を、所
定数以上の表が処理対象の原稿画像に存在する場合に、
「表内テキスト」をディスプレイ108へ出力するとい
う条件にしていたが、これに限らない。例えば、「表内
テキスト」だけでなく「図内テキスト」やそれ以外の非
テキスト領域を出力対象とすることも可能である。
時のディスプレイ108への出力対象を「表内テキス
ト」と「図内テキスト」として設定し、かつ「表内テキ
スト」が存在する個数iと「図内テキスト」が存在する
個数jの合計個数(i+j)がk個以上の場合に、「表
内テキスト」と「図内テキスト」をディスプレイ108
へ出力するという条件で実行される処理について、図1
1を用いて説明する。この場合、処理を始める前の初期
状態では、図12に示されるように、プルダウンメニュ
ー602aに表示される「表内テキスト」と「図内テキ
スト」が「有効」に設定され、「本文テキスト」と「無
効」に設定される。
理フローを示すフローチャートである。尚、図11の説
明では、領域出力モードが「自動」に設定されている状
態の時の処理についてのみ説明する。また、 領域出力
モードが「手動」に設定されている状態の時の処理は、
ステップS302、ステップS303で説明した処理と
同様なので、その説明は省略する。
スト」である表領域の個数i(iは正の整数)を算出す
る。ステップS1102で、属性が「図内テキスト」で
ある図領域の個数j(jは正の整数)を算出する。ステ
ップS1103で、算出される表領域と図領域の合計の
個数(i+j)がk個以上であるか否かを判定する。k
個以上ある場合(ステップS1103でYES)、ステ
ップS1106に進む。k個以上ない場合(ステップS
1103でNO)、ステップS1104に進む。
いる閾値kは、KB114を介してユーザが所望の閾値
を入力する。ステップS1104で、「表内テキスト」
と「図内テキスト」を「有効」と設定し、「本文テキス
ト」を「無効」に設定する。ステップS1105で、
「表内テキスト」と「図内テキスト」の属性を持つ領域
の矩形データの出力フラグが「0」、「本文テキスト」
の属性を持つ領域の矩形データの出力フラグが「1」に
変更される。この場合、ステップS1108で、「表内
テキスト」と「図内テキスト」の属性を持つ領域がディ
スプレイ108へ出力されることになる。
スト」のみを「有効」と設定し、「表内テキスト」と
「図内テキスト」を「無効」に設定する。ステップS1
107で、「本文テキスト」の属性を持つ領域の矩形デ
ータの出力フラグが「0」、「表内テキスト」と「図内
テキスト」の属性を持つ領域の矩形データの出力フラグ
が「1」に変更される。この場合、ステップS1108
で、「本文テキスト」の属性を持つ領域のみがディスプ
レイ108へ出力されることになる。
判定条件である「表内テキスト」と「図内テキスト」の
合計個数kを「3」と設定した上で、領域出力モードが
「自動」、「表内テキスト」および「図内テキスト」が
「有効」に設定されている状態で、処理が実行された場
合の処理結果である。この場合、「表内テキスト」およ
び「図内テキスト」の各領域に破線の枠が表示され、
「表内テキスト」および「図内テキスト」が3個以上あ
ることを示している。
が「自動」の時の出力対象の条件を出力対象となる非テ
キスト領域ごとに指示することも可能である。例えば、
領域出力モードが「自動」である時のディスプレイ10
8への出力対象を「表内テキスト」と「図内テキスト」
として設定し、かつ「表内テキスト」が存在する個数i
がg個以上、「図内テキスト」が存在する個数jがh個
以上である場合に、それぞれ「表内テキスト」と「図内
テキスト」をディスプレイ108へ出力するという条件
で実行される処理について、図13を用いて説明する。
理フローを示すフローチャートである。ステップS13
01で、まず、「本文テキスト」の属性を持つ領域を
「有効」として、その領域の矩形データの出力フラグを
「0」に初期化する。ステップS1302で、属性が
「表内テキスト」である表領域の個数iを算出する。ス
テップS1303で、算出される個数iがg個以上(g
は正の整数)であるか否かを判定する。g個以上ある場
合(ステップS1303でYES)、ステップS130
4に進む。g個以上ない場合(ステップS1303でN
O)、ステップS1306に進む。
いる閾値gは、KB114を介してユーザが所望の閾値
を入力する。ステップS1304で、「表内テキスト」
のみを「有効」と設定し、「本文テキスト」を「無効」
に設定する。ステップS1305で、「表内テキスト」
の属性を持つ領域の矩形データの出力フラグが「0」、
「本文テキスト」の属性を持つ領域の矩形データの出力
フラグが「1」に変更される。この場合、ステップS1
314で、「表内テキスト」の属性を持つ領域のみがデ
ィスプレイ108へ出力されることになる。
スト」のみを「有効」と設定し、「表内テキスト」を
「無効」に設定する。ステップS1307で、「本文テ
キスト」の属性を持つ領域の矩形データの出力フラグが
「0」、「表内テキスト」の属性を持つ領域の矩形デー
タの出力フラグが「1」に変更される。この場合、ステ
ップS1314で、「本文テキスト」の属性を持つ領域
のみがディスプレイ108へ出力されることになる。
スト」である図領域の個数jを算出する。ステップS1
309で、算出される個数jがh個以上(hは正の整
数)であるか否かを判定する。h個以上ある場合(ステ
ップS1309でYES)、ステップS1310に進
む。h個以上ない場合(ステップS1309でNO)、
ステップS1310に進む。
いる閾値hは、KB114を介してユーザが所望の閾値
を入力する。ステップS1310で、「図内テキスト」
のみを「有効」と設定し、「本文テキスト」を「無効」
に設定する。ステップS1311で、「図内テキスト」
の属性を持つ領域の矩形データの出力フラグが「0」、
「本文テキスト」の属性を持つ領域の矩形データの出力
フラグが「1」に変更される。この場合、ステップS1
314で、「図内テキスト」の属性を持つ領域のみがデ
ィスプレイ108へ出力されることになる。
スト」のみを「有効」と設定し、「図内テキスト」を
「無効」に設定する。ステップS1313で、「本文テ
キスト」の属性を持つ領域の矩形データの出力フラグが
「0」、「図内テキスト」の属性を持つ領域の矩形デー
タの出力フラグが「1」に変更される。この場合、ステ
ップS1314で、「本文テキスト」の属性を持つ領域
のみがディスプレイ108へ出力されることになる。
フラグが「0」である領域がディスプレイ108へ出力
される。尚、表領域の個数iがg個未満で図領域の個数
jがk個以上であれば、「表内テキスト」の属性を持つ
領域の矩形データの出力フラグの変更の処理の際、「本
文テキスト」の属性を持つ領域の矩形データの出力フラ
グは変更されない。しかし、「図内テキスト」の属性を
持つ領域の矩形データの出力フラグの変更の処理の際、
「本文テキスト」の属性を持つ領域の矩形データの出力
フラグが無効に設定されるので、「図内テキスト」の属
性を持つ領域のみがディスプレイ108へ出力されるこ
とになる。
の属性を持つ領域のみがディスプレイ108へ出力され
ることになる。更に、表領域の個数iがg個未満で図領
域の個数jもh個未満であれば、「本文テキスト」の属
性を持つ領域の矩形データの出力フラグは初期設定のま
ま変わらないので、「本文テキスト」の属性を持つ領域
のみがディスプレイ108へ出力されることになる。
「自動」の時の出力対象の条件を、いくつか例を挙げて
説明した。以下、本実施の形態で説明される特徴的な処
理の概要を、図14に示すフローチャートを用いて説明
する。図14は本実施の形態の処理フローの概要を示す
フローチャートである。ステップS1001で、領域出
力モードが「自動」である時のディスプレイ108への
出力対象とする領域の出力条件を設定する。
「自動」であるか否かを判定する。「自動」でない(つ
まり「手動」である)場合(ステップS1001でN
O)、ステップS1003に進む。「自動」である場合
(ステップS1001でYES)、ステップS1005
に進む。ステップS1003で、ディスプレイ108へ
の出力対象を指示する。
る際の処理を実行する。一方、ステップS1005で、
予め設定された出力条件に従って出力対象を指示する処
理を実行する。ステップS1006で、矩形データの出
力フラグが「0」である領域がディスプレイ108へ出
力される。
ば、領域出力モードを備え、そのモードを「自動」に設
定することで、予め設定された条件に基づいて、所望の
属性を有する領域を出力することができる。また、モー
ドを「手動」にすることで、ユーザが任意の属性を有す
る領域を出力することができる。その結果、複数の属性
の領域を有する原稿画像の中から、所望の属性を有する
領域を出力するための操作が容易になり作業効率が向上
する。
トコンピュータ、インタフェース機器、リーダ、プリン
タ等)から構成されるシステムに適用しても、一つの機
器からなる装置(例えば、複写機、ファクシミリ装置
等)に適用してもよい。また、本発明の目的は、前述し
た実施形態の機能を実現するソフトウェアのプログラム
コードを記録した記憶媒体を、システムあるいは装置に
供給し、そのシステムあるいは装置のコンピュータ(ま
たはCPUやMPU)が記憶媒体に格納されたプログラ
ムコードを読出し実行することによっても、達成される
ことは言うまでもない。
ラムコード自体が上述した実施の形態の機能を実現する
ことになり、そのプログラムコードを記憶した記憶媒体
は本発明を構成することになる。プログラムコードを供
給するための記憶媒体としては、例えば、フロッピディ
スク、ハードディスク、光ディスク、光磁気ディスク、
CD−ROM、CD−R、磁気テープ、不揮発性のメモ
リカード、ROMなどを用いることができる。
コードを実行することにより、前述した実施形態の機能
が実現されるだけでなく、そのプログラムコードの指示
に基づき、コンピュータ上で稼働しているOS(オペレ
ーティングシステム)などが実際の処理の一部または全
部を行い、その処理によって前述した実施の形態の機能
が実現される場合も含まれることは言うまでもない。
コードが、コンピュータに挿入された機能拡張ボードや
コンピュータに接続された機能拡張ユニットに備わるメ
モリに書込まれた後、そのプログラムコードの指示に基
づき、その機能拡張ボードや機能拡張ユニットに備わる
CPUなどが実際の処理の一部または全部を行い、その
処理によって前述した実施形態の機能が実現される場合
も含まれることは言うまでもない。
の記憶媒体には、先に説明したフローチャートに対応す
るプログラムコードを格納することになるが、簡単に説
明すると、図15のメモリマップ例に示す各モジュール
を記憶媒体に格納することになる。すなわち、少なくと
も「分割モジュール」、「指定モジュール」および「出
力モジュール」の各モジュールのプログラムコードを記
憶媒体に格納すればよい。
明によれば、原稿画像内の所望の属性を有する領域に含
まれるテキストを抽出するための操作を容易にし、作業
効率を向上する画像処理装置及びその方法を提供でき
る。
ブロック図である。
フローを示すフローチャートである。
トである。
ローを示すフローチャートである。
示す図であり、(b)は各属性とその識別番号の関係を
示す図である。
る。
字認識対象の指示方法を説明するための図である。
した場合の表示例を示す図である。
属性を持つ領域とした場合の表示例を示す図である。
の属性を持つ領域とした場合の表示例を示す図である。
示すフローチャートである。
と「図内テキスト」の属性を持つ領域とした場合の表示
例を示す図である。
示すフローチャートである。
ーチャートである。
を記憶させたFDのメモリマップの構造を示す図であ
る。
Claims (17)
- 【請求項1】 原稿画像に含まれる文字を認識してテキ
ストデータを出力する画像処理装置であって、 前記原稿画像を属性毎の領域に分割する分割手段と、 前記原稿画像内に含まれる複数の属性の少なくとも1つ
を指定する指定手段と、 前記指定手段で指定された属性を有する領域に含まれる
文字を認識してテキストデータを出力する出力手段とを
備えることを特徴とする画像処理装置。 - 【請求項2】 前記指定手段は、前記原稿画像内におい
て、所定の属性を有する領域の個数を計数する計数手段
を備え、 前記計数手段の計数結果に基づいて、前記原稿画像内に
含まれる複数の属性の少なくとも1つを指定することを
特徴とする請求項1に記載の画像処理装置。 - 【請求項3】 前記指定手段は、前記原稿画像内に含ま
れる所望の属性を、ユーザによって指定することを特徴
とする請求項1に記載の画像処理装置。 - 【請求項4】 前記指定手段は、前記原稿画像内におい
て、所定の属性を有する領域の個数を計数する計数手段
と、 前記計数手段の計数結果に基づいて、前記原稿画像内に
含まれる複数の属性の少なくとも1つを指定する第1指
定手段と、 前記原稿画像内に含まれる所望の属性を、ユーザによっ
て指定する第2指定手段とを備えることを特徴とする請
求項1に記載の画像処理装置。 - 【請求項5】 前記第1指定手段による指定から前記第
2指定手段による指定、あるいは前記第2指定手段によ
る指定から前記第1指定手段による指定に切り替える切
替手段を更に備えることを特徴とする請求項4に記載の
画像処理装置。 - 【請求項6】 前記指定手段は、前記計数手段で計数さ
れる個数が所定数以上である場合、該所定の属性を指定
することを特徴とする請求項2に記載の画像処理装置。 - 【請求項7】 前記指定手段は、前記計数手段で計数さ
れる個数が所定数未満である場合、前記原稿画像内に含
まれるテキスト領域を指定することを特徴とする請求項
2に記載の画像処理装置。 - 【請求項8】 前記所定数の変更を指示する指示手段を
更に備えることを特徴とする請求項6または請求項7に
記載の画像処理装置。 - 【請求項9】 原稿画像に含まれる文字を認識してテキ
ストデータを出力する画像処理方法であって、 前記原稿画像を属性毎の領域に分割する分割工程と、 前記原稿画像内に含まれる複数の属性の少なくとも1つ
を指定する指定工程と、 前記指定工程で指定された属性を有する領域に含まれる
文字を認識してテキストデータを出力する出力工程とを
備えることを特徴とする画像処理方法。 - 【請求項10】 前記指定工程は、前記原稿画像内にお
いて、所定の属性を有する領域の個数を計数する計数工
程を備え、 前記計数工程の計数結果に基づいて、前記原稿画像内に
含まれる複数の属性の少なくとも1つを指定することを
特徴とする請求項9に記載の画像処理方法。 - 【請求項11】 前記指定工程は、前記原稿画像内に含
まれる所望の属性を、ユーザによって指定することを特
徴とする請求項9に記載の画像処理方法。 - 【請求項12】 前記指定工程は、前記原稿画像内にお
いて、所定の属性を有する領域の個数を計数する計数工
程と、 前記計数工程の計数結果に基づいて、前記原稿画像内に
含まれる複数の属性の少なくとも1つを指定する第1指
定工程と、 前記原稿画像内に含まれる所望の属性を、ユーザによっ
て指定する第2指定工程とを備えることを特徴とする請
求項9に記載の画像処理方法。 - 【請求項13】 前記第1指定工程による指定から前記
第2指定工程による指定、あるいは前記第2指定手段に
よる指定から前記第1指定手段による指定に切り替える
切替工程を更に備えることを特徴とする請求項12に記
載の画像処理方法。 - 【請求項14】 前記指定工程は、前記計数工程で計数
される個数が所定数以上である場合、該所定の属性を指
定することを特徴とする請求項10に記載の画像処理方
法。 - 【請求項15】 前記指定工程は、前記計数工程で計数
される個数が所定数未満である場合、前記原稿画像内に
含まれるテキスト領域を指定することを特徴とする請求
項10に記載の画像処理方法。 - 【請求項16】 前記所定数の変更を指示する指示工程
を更に備えることを特徴とする請求項14または請求項
15に記載の画像処理方法。 - 【請求項17】 画像処理のプログラムコードが格納さ
れたコンピュータ可読メモリであって、 前記原稿画像を属性毎の領域に分割する分割工程のコー
ドと、 前記原稿画像内に含まれる複数の属性の少なくとも1つ
を指定する指定工程のコードと、 前記指定工程で指定された属性を有する領域に含まれる
文字を認識してテキストデータを出力する出力工程のコ
ードとを備えることを特徴とするコンピュータ可読メモ
リ。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP00193696A JP3740203B2 (ja) | 1996-01-10 | 1996-01-10 | 画像処理装置およびその方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP00193696A JP3740203B2 (ja) | 1996-01-10 | 1996-01-10 | 画像処理装置およびその方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH09190502A true JPH09190502A (ja) | 1997-07-22 |
JP3740203B2 JP3740203B2 (ja) | 2006-02-01 |
Family
ID=11515503
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP00193696A Expired - Fee Related JP3740203B2 (ja) | 1996-01-10 | 1996-01-10 | 画像処理装置およびその方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3740203B2 (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111444922A (zh) * | 2020-03-27 | 2020-07-24 | Oppo广东移动通信有限公司 | 图片处理方法、装置、存储介质及电子设备 |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6808330B2 (ja) * | 2016-02-26 | 2021-01-06 | キヤノン株式会社 | 情報処理装置、情報処理方法、及びプログラム |
-
1996
- 1996-01-10 JP JP00193696A patent/JP3740203B2/ja not_active Expired - Fee Related
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN111444922A (zh) * | 2020-03-27 | 2020-07-24 | Oppo广东移动通信有限公司 | 图片处理方法、装置、存储介质及电子设备 |
WO2021190146A1 (zh) * | 2020-03-27 | 2021-09-30 | Oppo广东移动通信有限公司 | 图片处理方法、装置、存储介质及电子设备 |
Also Published As
Publication number | Publication date |
---|---|
JP3740203B2 (ja) | 2006-02-01 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6411731B1 (en) | Template-based image recognition and extraction | |
JP5274305B2 (ja) | 画像処理装置、画像処理方法、コンピュータプログラム | |
US7853873B2 (en) | Data processing apparatus, data processing method, and computer program for generating electronic data from a paper document | |
EP3671539B1 (en) | Method for image processing, and image-processing system | |
EP1661064B1 (en) | Document scanner | |
JP4586241B2 (ja) | 画像処理装置 | |
JPH11306197A (ja) | 画像処理装置及びその方法、コンピュータ可読メモリ | |
JP4109920B2 (ja) | 画像処理装置、画像処理方法、プログラム、及び記憶媒体 | |
US20010025326A1 (en) | System, device, and method for inputting image, and storage medium therefor | |
US6504540B1 (en) | Method and apparatus for altering one or more attributes of one or more blocks of image data in a document | |
JPH09190502A (ja) | 画像処理装置およびその方法 | |
JP2017102939A (ja) | オーサリング装置、オーサリング方法、およびプログラム | |
JP2000322417A (ja) | 画像ファイリング装置及び方法及び記憶媒体 | |
JP3744996B2 (ja) | 画像処理装置及びその方法 | |
JP2014211747A (ja) | 画像処理装置、端末装置、情報処理方法及びプログラム | |
US8059138B2 (en) | Image processing and arranging system, image processing and arranging method, and computer readable medium for image processing and arranging | |
JP2006072839A (ja) | 画像処理方法、画像処理装置、画像処理プログラム及び記録媒体 | |
JPH096974A (ja) | 画像処理方法及び装置 | |
JPH103516A (ja) | 情報処理方法及び装置 | |
JPH11203402A (ja) | 画像処理装置及び画像処理方法 | |
JPH11187231A (ja) | 画像検索装置及び画像検索方法 | |
JP2800254B2 (ja) | 画像一文字処理装置 | |
JP2016161735A (ja) | オーサリング装置、オーサリング方法、およびプログラム | |
JPH0520493A (ja) | 画像処理装置 | |
JPH0520495A (ja) | 画像処理装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20050610 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20050809 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20051011 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20051107 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20081111 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20091111 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101111 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101111 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111111 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121111 Year of fee payment: 7 |
|
LAPS | Cancellation because of no payment of annual fees |