JP2008225964A - 画像処理装置、読み順設定方法及びプログラム - Google Patents
画像処理装置、読み順設定方法及びプログラム Download PDFInfo
- Publication number
- JP2008225964A JP2008225964A JP2007064710A JP2007064710A JP2008225964A JP 2008225964 A JP2008225964 A JP 2008225964A JP 2007064710 A JP2007064710 A JP 2007064710A JP 2007064710 A JP2007064710 A JP 2007064710A JP 2008225964 A JP2008225964 A JP 2008225964A
- Authority
- JP
- Japan
- Prior art keywords
- area
- image
- reading order
- correction
- image area
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Character Input (AREA)
- Document Processing Apparatus (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
【解決手段】 スキャナ入力された文書画像に対し、例えば、OCRの前処理として、処理対象の領域を所定の識別条件に従い分け、画像領域を設定、各領域に読み順を設定する。ユーザが設定領域の修正を指示すると、装置のソフトウェア処理で領域の修正に伴う読み順の順番を振り直す。領域を統合する修正をする場合、新規作成領域と重なる修正前の複数の領域を探索し(S303,304)、検出される複数の領域の重なり面積の最も大きい領域に付与されていた読み順を新規統合領域の読み順として引き継ぐ。従来読み順の修正に手間の掛かるユーザ操作を必要としてが、本願発明の自動処理により、解消される。
【選択図】 図13
Description
また、文字領域の抽出に関しては、領域内の文字を電子化データへ変換する文字認識(OCR)の前処理として、処理対象の領域を特定するために必要なプロセスとしても用いられる。さらに、OCRによる認識結果は、言語で表現された文書内容を理解するためにも利用される。このような利用性を考慮すると、文書の構成、即ち文章のつながりを把握することも必要になる。
このため、この前処理では、OCRの対象となる文字領域の抽出とともに、抽出した複数の文字領域に読み順を付与して、OCR以降の文書情報の利用性を低下させないようにしている。なお、複数の文字領域に付与した読み順は、OCRへの利用に限られるものではない。
文字領域への読み順の付与に関しては、各領域の勢力範囲という考え方で各領域の親子関係、兄弟関係を定義し、ツリー構造を作って読み順を決定する方法を開示した、下記特許文献2を例示することができる。
こうしたときに、このOCRソフトウェアの例では、全部認識してから認識した文字列を編集し、その結果をもとに、領域を修正するということも可能であるが、こうした修正なしで、抽出した領域そのものをコンテンツとして使用するような場合は、領域の修正を手動で行うのが最も望ましい。
自動で抽出した領域の大きさなどを手動で修正する、といった状況におけるユースケースを考えたときに、GUI(Graphical User Interface)を利用した編集ツールを用いるのが便利であり、既存のOCRソフトウェアでは、こういった機能を持っている。
即ち、望ましくは1領域にすべき領域が、複数に分割されているような場合は、普通、分割された領域をそれぞれ削除し、削除した領域を含む1領域を新たに作成するという手順で修正が行われる。この場合には、もちろん、分割された領域のうち一つを削除してしまい、残っている領域のサイズを変更して、削除した領域を含ませる、という手順でも可能で、およそ、これら2様の方法で行われる。なお、このような修正を「統合」ともいう。
また、望ましくは複数に分割すべき領域が、1領域に含まれている、上記統合と逆の場合は、先ずこの分割すべき領域の設定を削除してから、新たに2つの領域を作成するという方法が1つ。そして、分割すべき領域のサイズを縮めるとともに、縮めることによって設定が解除された領域に新たに付与する領域を作成するという方法のおよそ、2様の方法で行うことが可能である。なお、このような修正を「分割」ともいう。
上記した修正手順で、領域を新たに付加するという操作を行うと、付加された領域に対する読み順は、これまでに付けられた読み順の後の連番が振られる。
また、領域を削除するという操作を行うと、その結果として、領域に付与された読み順のデータも連動して変更される。この読み順の変更は、普通、削除された領域が最初からなかったものとされて読み順は、連番を振りなおす、という方法で行われる。
図15〜18は、分割すべき領域のサイズを縮めるとともに、縮めることによって設定が解除された領域に新たに付加する領域を作成する方法による例を示す。
領域を修正する際、先ず、図15に示すように、GUI画面20に文書画像21が表示される。この文書画像には、入力文書画像に対し領域の抽出処理がソフトウェアの予定する通り行われ、その結果として、領域を示す枠と各領域枠に対応して読み順の番号が付与されている。
ユーザは、この画面で編集ツールを用いることによって、修正を要求する入力操作を行うことができる。
この例では、図16に示すように、文書画像21中の読み順5を付けた領域のサイズを縮める。この後、図17に示すように、読み順5の領域を縮めることによって設定が解除された領域に、新たに付加する領域を作成する。このとき、作成された新規領域には、OCRソフトにより自動で読み順が付与される。この例の場合、これまでに付けられた読み順1〜10までを変更することなく、新規領域には、これまでに付けられた読み順1〜10の後の連番として、11が振られる。
この読み順の変更は、ユーザ操作によって行うので、図18に示すように、読み順の番号(図示の例では、読み順11)の表示箇所に設けたキーを操作することにより、プルダウンで読み順1〜11チェックボックス21cが表示されるので、読み順6へのチェックにて、スイッチすることができる。
この読み順のスイッチは、読み順6が設定されている次の連番とダブルので、降順に次々に読み順のスイッチを行う必要がある。
つまり、新規領域を作成したときに、自動で付けられた読み順を変更すると、変更した読み順以降の連番を付けた読み順を降順に一つずつ変更するスイッチ操作を行わなければならず、変更操作に手間が掛かってしまう。
この領域修正の際、先ず、図19に示すように、GUI画面20に文書画像21が表示される。この文書画像には、入力文書画像に対し領域の抽出処理が予定通り行われ、その結果として、領域を示す枠が付加されている。なお、同図には表示していないが、各領域枠に対応して読み順の番号が付与され、管理されている。
ユーザは、この画面で編集ツールを用いることによって、修正を要求する入力操作を行うことができる。
この例では、領域d(図19)を分割するので、先ずこの領域dを削除する指示を行う。削除した後、図20(A)に示すように、削除された領域に、新たに付加する領域d1,d2を作成する。このとき、作成された新規領域d1,d2には、OCRソフトにより自動で読み順が付与される。この例の場合、これまでに付けられた読み順を変更することなく、新規領域d1,d2には、これまでに付けられた読み順1〜8の後の連番を付ける。図20(A)に示す例では、新規領域d1,d2には、読み順9,10が振られる。
この読み順の変更は変更要求に応じて行うように、ユーザによる変更操作を案内する画面表示に従って行われる(図20(B)の拡大図参照)。図20(B)に示した読取順序変更の画面表示におけるメッセージに示すように、変更操作は、領域を1番から順にクリックする必要がある。
つまり、新規領域を作成したときに、自動で付けられた読み順を変更する場合には、読み順1から順番に領域ごとにクリック操作を全部の領域にわたって行わなければならず、変更操作に手間が掛かってしまう。
本発明は、文書画像の処理に係る従来技術の上記した問題に鑑みてなされたもので、その目的は、画像種類を分けるために文書画像に設定される画像領域を修正する際、修正に伴って行われる読み順の変更作業を簡略化し、画像領域への読み順機能の利用性の向上、延いては処理対象の画像領域の設定機能の有効性を高めることにある。
請求項2の発明は、請求項1に記載された画像処理装置において、前記読み順修正手段は、修正後に削除される画像領域の行方向を認識する行方向認識手段と、前記画像領域間の重なりが、修正後に削除される1画像領域と領域を分け合った複数の新規画像領域との重なりによるものである場合に、前記行方向認識手段により得られた行方向に対する複数の新規画像領域の位置関係に基づいて、削除される画像領域に付与されていた読み順に連なる順番を付与する画像領域を決定する手段を備えたことを特徴とする。
請求項3の発明は、請求項1に記載された画像処理装置において、前記読み順修正手段は、新規に作成される画像領域と修正後に削除される画像領域との間における重なりの大きさを検出する重なり面積検出手段と、前記画像領域間の重なりが、修正後に削除される複数の画像領域と1新規画像領域との重なりによるものである場合に、前記重なり面積検出手段により得られた修正後に削除される複数の画像領域各々の重なり面積に基づいて、新規に作成される1画像領域の読み順を付与する画像領域を決定する手段を備えたことを特徴とする。
請求項4の発明は、請求項1乃至3のいずれかに記載された画像処理装置において、ユーザインターフェースに、前記読み順修正手段による修正結果を反映した画像領域に対応して付与された読み順の表示を行う表示手段と、修正後の画像領域に対する再修正の要求及び修正後の読み順の設定変更を要求するための操作手段を備えたことを特徴とする。
請求項5の発明は、入力画像の中から処理対象の画像領域を分割、抽出する画像領域抽出工程と、前記画像領域抽出工程によって抽出された複数の画像領域の画像を処理する際、入力画像を保存した記憶手段から処理対象画像を読み出す読み順を各画像領域に対し付与する読み順付与工程と、ユーザインターフェースを介して、前記画像領域抽出工程で抽出された画像領域に対する修正要求を受け付ける修正要求受理工程と、前記修正要求受理工程で受け取った修正要求に応じて新規に作成される画像領域と修正によって削除されることになる画像領域との間に重なりがあることを条件に、削除される画像領域に付与されていた読み順に連なる順番を新規画像領域に付与する読み順修正工程と、を有する読み順設定方法である。
請求項6の発明は、請求項5に記載された読み順設定方法において、前記読み順修正工程は、修正後に削除される画像領域の行方向を認識する行方向認識工程と、前記画像領域間の重なりが、修正後に削除される1画像領域と領域を分け合った複数の新規画像領域との重なりによるものである場合に、前記行方向認識工程により得られた行方向に対する複数の新規画像領域の位置関係に基づいて、削除される画像領域に付与されていた読み順に連なる順番を付与する画像領域を決定する工程を有することを特徴とする。
請求項7の発明は、請求項5に記載された読み順設定方法において、前記読み順修正工程は、新規に作成される画像領域と修正後に削除される画像領域との間における重なりの大きさを検出する重なり面積検出工程と、前記画像領域間の重なりが、修正後に削除される複数の画像領域と1新規画像領域との重なりによるものである場合に、前記重なり面積検出工程により得られた修正後に削除される複数の画像領域各々の重なり面積に基づいて、新規に作成される1画像領域の読み順を付与する画像領域を決定する工程を有することを特徴とする。
請求項8の発明は、請求項5乃至7のいずれかに記載された読み順設定方法において、前記読み順修正工程による修正結果を反映した画像領域に対応して付与された読み順の表示を行う表示工程と、修正後の画像領域に対する再修正の要求及び修正後の読み順の設定変更の要求を受け付ける受理工程を行うことにより、ユーザとのインターフェースを図るようにしたことを特徴とする。
請求項9の発明は、請求項5乃至7のいずれかに記載された読み順設定方法における、画像領域抽出工程、読み順付与工程、修正要求受理工程、読み順修正工程の各工程を画像処理装置のコンピュータに実行させるためのプログラムである。
請求項10の発明は、請求項9に記載されたプログラムにおいて、請求項8に記載された表示工程及び受理工程を実行させるためのプログラムを連係させたことを特徴とする。
また、修正時の領域の重なりなどでは自動で読み順を判別できない場合に限り、ユーザ操作による再設定処理を行うための手段を提供することにより、ユーザの負担を減らすことが可能になる。
また、コンピュータを、領域の修正に伴う読み順設定の自動化を実現する手段として機能させるためのプログラムを使用することによって、本発明を容易に実施することが可能になる。
以下に示す実施形態は、文書原稿をスキャナ等で読み取ることにより、文書画像を電子データ化し、入力した後、このデータを様々な形態で利用するために処理する文書画像処理に係る。処理の対象となる文書画像は、文字、図表、写真等の異なる種類の画像が任意にレイアウトされて1画像を構成するものである。
こうした文書画像を処理するに当たって、画像種類によって、文字領域、図表領域、写真領域等の領域を予め識別しておくことによって、それぞれの領域に適した処理法を用いることや、特定の画像領域を検索する、といった利用が開ける。
上記のような意図をもって、入力文書画像の中から処理対象の画像領域を識別、抽出する。なお、画像領域を抽出する方法は、既に実施段階の方法が存在し、ここでは、こうした既存の方法を適用することによって実施することが可能で、例えば、上記『背景技術』の項で述べたように、OCRの前処理で行われている方法を採用することとする。
ただ、既存の領域抽出方法は、文書画像の多様化の進展もあって、完全にユーザの要求を満足するものは得難い。このため、OCRソフトウェアにおける一連の処理プロセスで自動抽出され、得られる画像領域、読み順等の情報に対する修正等を行うことを可能にする機能(以下、この機能を「画像領域管理機能」という)を有する。即ち、抽出された画像領域には、入力文書画像を保存する記憶手段から処理すべき画像データを読み出すときの読み順が各画像領域に付与されているので、画像領域を修正する際に、画像領域の変更に伴って、読み順を付けなおし、これらのデータを変更し、管理可能とするために、画像領域管理機能が必要になる。
本発明の要旨は、この画像領域管理機能に係る。従って、以下の実施形態では、この機能を中心に説明する。
図1の装置構成において、スキャナ101は、文書原稿を読み取ることにより、文書画像を電子データに変換し、入力する装置である。
CPU(Central Processing Unit)102は、文書画像処理装置全体を制御するコントローラとして機能し、制御下に置くスキャナ101,メモリ103,ワークエリアRAM(Random Access Memory)104,プログラム格納用のROM(Read Only Memory)/RAM105,CD(Compact Disc)−ROM/FDドライブ106,ディスプレイ107,ポインティングデバイス108,印字装置109それぞれをバスで接続する。動作の際、プログラム格納用のROM/RAM105から、又はCD−ROM/FDドライブ106により駆動される記憶媒体から、それぞれの記憶部に格納された制御プログラムから処理要求に対応するプログラムを読み出し、ワークエリアRAM104を用いて、該プログラムによる処理を実行する。文書画像データに係る処理は、メモリ103への文書画像の蓄積、印字装置109による出力等のデータ処理、或いはOCR処理のほか、こうした処理の一環として、後記で詳述する画像領域管理機能に係る処理があり、これらの処理をユーザの処理要求に応じ、それぞれのプログラムを動作させることにより実行する。
メモリ103は、入力に伴う処理を行った後の文書画像データを格納し、必要に応じ、ディスプレイ107の表示に用い、又印字装置109で印字用のデータとして用いるために取り出される。また、メモリ103は、文書画像データに付加する情報として、後記で詳述する処理対象の画像領域や読み順のデータを管理情報として保管するために使用される。
プログラム格納ROM/RAM105は、文書画像処理装置を動作させるプログラムや関連データを記憶するメモリで、CPU102はここに記憶されているプログラムを読み込んで、動作を実行する。
CD−ROM/FDドライブ106は、リムーバブルな記憶媒体であるCD,FDを使用するための駆動装置で、更新プログラムを導入する際などに用いられる。
ディスプレイ107は、ポインティングデバイス108と連係してGUIの要素としての表示部を提供する。GUIは、ディスプレイ107の画面を通してユーザの処理要求を受け付け、処理結果を画面に出力する、という動作によりユーザとの間のインターフェースとして機能する。本実施形態では、要求に応じて処理された文書画像データを用いることによって、GUI画面に文書画像を表示することで、処理結果を知ることを可能にするが、そのほかにも、画像領域管理機能による動作時に、後記で詳述する処理対象の画像領域や読み順のデータを表示することで、設定をチェックし、必要に応じ設定された領域や読み順の修正を行うための入力画面を表示する。
ポインティングデバイス108は、マウス、タブレットとペンの組み合わせ等の様々な形態の入力デバイスを使用できる。ディスプレイ107の画面上のポインティング操作により、後記で詳述する画像領域管理機能の動作時に、処理対象の画像領域や読み順の設定データの修正要求に係る情報の入力を行う。
印字装置109は、印字要求に応じて、記録用紙への印字を行う装置で、処理要求が入力文書画像のプリント出力である場合には、記録用紙への印字を行い、これを処理結果として出力する。
OCRソフトウェアによる処理では、入力文書画像に対し、処理プロセスにおける前処理として、入力された文書画像に対し、自動で処理対象の画像領域を識別条件に従って分け、画像領域を抽出し、抽出された領域に各々読み順を付与する。なお、画像領域の識別・抽出方法は、本願発明の要旨とするところではないので、この実施形態では、詳細な説明は省く。また、読み順について、説明を付け加えると、読み順は、処理すべき画像データを記憶手段から読み出すときの順番として、抽出された画像領域にそれぞれ付与されるものであるから、文書内容を理解するために必要な文書の構成、即ち画像領域の配列、文章領域のつながり等によって定められる(上記特許文献2、参照)。ここでは、領域抽出とともに自動で行う読み順の付与は、既存のOCRソフトウェアに採用されている方法を用いることとし、詳細な説明は省略する。
次いで、上記のようにして、抽出された画像領域それぞれには、読み順が既存のソフトウェアを用いて自動で付与する。図2の例では、5つの領域の画像の種類は異ならないので、各領域の位置条件による読み順付与ルールに従い、領域A1〜A5の全画像領域に連続番号で読み順を付与する。
画像領域の抽出と、抽出された領域への読み順付与を行い、得られる情報は、文書画像の管理情報として、例えばテーブル形式で管理される。
図3は、画像領域情報の管理テーブルの1例を示す。同図に示す管理テーブルは、抽出した画像領域A1〜A5のそれぞれに関連付けて、領域の座標として始点の(x,y)座標と終点の(x,y)座標、及び読み順として(1)〜(5)の連続番号を記載する。
画像領域の設定の修正は、OCRの前処理として領域・読み順の設定処理を自動で行った後、GUIを通してその処理結果をユーザに示す画面で、ユーザの入力操作により要求を受け付ける、といった方法により、処理を開始させる。
ユーザが手動で行う修正処理は、GUIを通して編集ツールを用いて行うようにする。即ち、編集ツールによる画像領域の変更、削除及び新規作成の操作を組み合わせた作業手順により、領域の拡張、分割、統合を基本形態とする領域修正を行う。
ここに、修正の形態が領域の統合又は分割である場合には、新規に領域を設定することになるので、当然、読み順に不具合が生じるので、読み順を振りなおす必要がある。このために、従来では、ユーザの入力操作により読み順の設定を変更することを可能にしているが、手間が掛かってしまう。
また、修正の形態が領域の拡張である場合に、その修正が設定された領域の削除を経て行われると、従来の読み順の付与方法では、読み順に不具合が生じ(上記[発明が解決しようとする課題]の記述、参照)、領域の分割又は統合におけると同様に、手間が掛かるという問題が生じる。
そこで、本実施形態では、領域の修正処理によって、設定された領域が削除されても、読み順の不具合ができる限り起きない設定を自動で行えるようにする。
次の「実施形態1」〜「実施形態3」には、領域の拡張、分割、統合にそれぞれ対応して、不具合が起きない読み順の自動設定を可能にする画像領域の修正処理について、実施形態を示す。
この実施形態は、設定された画像領域の修正が領域を拡張させる形態で行われる場合に対応可能とするものである。
図4は、本実施形態に係る画像領域・読み順の設定処理を実行するための処理フローを示す。この処理フローは、当該設定処理において、以下の処理例に示すように、画像領域を拡張させる形態で領域の修正が行われる場合に適用し得る。
図4に示す処理フローに従って行う、画像領域・読み順の設定及び修正の処理手順について、図5〜8の処理例を参照して説明する。
図5は、文書原稿をスキャナ101により読み取られ、電子データとして入力された文書画像10を示す。この文書画像に対しOCRの前処理として、処理対象の画像領域を設定する処理を行う。
まず、文書画像10を識別条件に従って分け、画像領域を抽出(識別)する(ステップS101)。図6は、抽出結果を示し、入力された原稿の文書画像(図5)をもとに抽出した画像領域を枠で囲い、領域A1〜A4として示す。
次いで、抽出された領域A1〜A4に読み順を付与する(ステップS102)。読み順は、画像領域の配列等をもとに定められた所定の規則に従って付与される。図6の例における付与結果は、同図中の各領域に対応して付された読み順(1)〜(4)にて示す。
領域・読み順の設定処理を行った後の結果は、図6の文書画像10として、GUIの画面を通してユーザに示され(ステップS103)、このGUI画面からユーザの操作により領域の修正要求が行われ、この要求に応えて領域修正処理(ステップS104)を開始する。
例えば、図6の文書画像における領域A3を拡張する場合、ユーザによってこの領域A3を削除する操作がなされると、この操作を受ける装置側では、一旦領域A3を囲っていた枠を除いた図7の画面を表示することにより、この操作を受け付けた旨を知らせる。なお領域A3の削除を受け、この領域の設定データを消去するが、後述する読み順の自動変更の処理に必要な情報であるから、一時的に領域A3の位置及び読み順のデータをメモリに保存しておく。また、このとき、領域A3の削除を受け、この領域の読み順(3)も消去するので、読み順(3)以降の読み順が変更される。なお、同図では、変更予定の領域に該当する領域A4へ、一旦、読み順(3’)を付けている。
上記のように、領域A3を削除した後、削除された領域A3を含む形で、領域を設定し直すことによって、図8の領域A3+として、元の領域A3を拡張した領域を指示すると、新たに、同図中の「1.」を領域に加えた枠囲いの領域が確認画面として表示され、実行を指示すると、領域の修正が確定する。
この領域修正に伴い、読み順を改めて定める必要がある。なお、この場合、領域A3+は、削除された領域に新たに作成したので、この領域を読み順(5)とする(図8、参照)。なお、付与された読み順は、次に示す読み順の改定を行うまで、一時的に付与されるものである。
ここに、上記した領域の重なりは、重なりが所定の割合以上あることを条件とし、この条件を満たすか、否かの判断を検出結果として得る検出方法を用いる。この方法で検出した重なり具合により、改定する読み順を決める。つまり、重なりが所定の割合以上ある、ということで、小さなごみ領域による誤検出を回避し、適正な領域のみを対象として検出できる。よって、この検出結果が得られれば、修正前にあった画像領域に付与されていた読み順を新規画像領域に付与する。
この例では、元の領域A3(図6)を拡張した領域A3+(図8)は、新たに「1.」の領域を加えただけであるから、大部分が重なるので、所定の面積以上の重なりがある、との検出結果を得る。従って、修正前にあった領域A3に付与されていた読み順(3)を新規画像領域A3+に付与する(図8中には、変更を読み順(5)→(3)にて示す)。
また、新規画像領域A3+への読み順(3)の付与に伴い、読み順(3)以降の読み順を付与した領域の読み順が変更される。即ち、領域A4に一旦付与した読み順(3’)を変更して、新規画像領域A3+への読み順(3)の連番である読み順(4)を付与する(図8中には、変更を読み順(3’)→(4)にて示す)。
この後、修正結果として、領域と読み順をGUI画面に表示し(ステップS106)、ユーザの確認を経て、この処理フローを終える。
上記のように、単純な領域の拡張、といった領域修正を行う場合にも、領域修正に伴う、読み順の改定を装置側の処理により行うようにしたことで、読み順の修正の手間を掛けずに領域修正を行うことが可能になり、従来法の問題を解消し、画像領域への読み順機能の利用性の向上、延いては処理対象の画像領域の設定機能の有効性を高めることが可能になる。
この実施形態は、設定された画像領域の修正が領域を分割する形態で行われる場合に対応可能とするものである。
図9は、画像領域を分割する形態で領域の修正が行われる場合に適用し得る本実施形態に係る処理フローを示す。なお、ここでは、画像領域を分割する形態で行われる修正処理に絞って説明するので、この処理フローには、修正前に行う画像領域・読み順を設定する処理手順を示していない。画像領域・読み順を設定する処理は、上記の実施形態1に記したと同様に行われる。従って、この処理手順を示した図4のステップS101〜S103に関する記載を参照することとし、この処理手順については、記載を省略する。
図9に示す処理フローに従って行う、画像領域・読み順の修正処理手順について、図10に示す処理例を参照して説明する。
図10(A)は、文書原稿をスキャナ101により読み取られ、電子データとして入力された文書画像10に対しOCRの前処理として、処理対象の画像領域を設定する処理を行った後の文書画像を示す。図10の(A)には、設定処理の結果が、枠囲いした画像領域A1,A2,・・,An,・・として示され、また、各画像領域には、読み順(1),(2),・・,(n),・・が付与されている。
領域の修正要求は、編集ツールによる画像領域の変更、削除及び新規作成の操作を組み合わせた作業手順を伴う。
例えば、図10(A)の文書画像における領域Anを分割する場合、ユーザによってこの領域Anを削除する操作がなされると、この操作を受ける装置側では、領域Anの設定データを消去するが、後述する読み順の自動変更の処理に必要な情報であるから、一時的に領域Anの位置及び読み順のデータをメモリに保存しておく(ステップS201)。
このように、領域Anを削除した後、削除された領域Anを分け合う形で、2領域を設定し直し、図10(B)の領域AX,領域AX+1として、元の領域Anを分割する領域の作成を指示すると、確認画面として、2分割した枠囲いの領域が表示され、ここで実行を指示すると、領域の修正が確定する(ステップS202)。
この領域修正に伴い、読み順を改めて定める必要がある。なお、この場合、領域AX,領域AX+1は、削除された領域に新たに作成したので、次に示す読み順の改定を行うまで、この文書画像10の領域に既に付与されている最終番の後の読み順が一時的に付与される。
ここに、上記した領域の重なりは、重なりが所定の割合以上あることを条件とし、この条件を満たすか、否かの判断を検出結果として得る検出方法を用いる。この方法で検出した重なり具合により、読み順に連なる順番を付与する新規画像領域を特定する。つまり、重なりが所定の割合以上ある、ということで、小さなごみ領域による誤検出を回避し、適正な領域のみを対象として検出できる。この後、特定された領域が複数ある場合に所定の決定方法に従い読み順を決め、修正前にあった画像領域に付与されていた読み順に連なる順番を新規画像領域にそれぞれ付与する。
読み順を決定する方法は、連番を付与する対象として検出された複数の新規画像領域同士の位置関係に基づいて、削除される画像領域に付与されていた読み順に連なる順番を付与する画像領域を定める。ここでは、複数の新規画像領域の行方向をそれぞれ調べ、得られる行方向に対する各領域の位置関係によって先の順番とするか、後の順番とするかの判別、又は判別不能の判断を行い、付与する連番を指定する。
探索の結果、領域AX,領域AX+1それぞれと重なる修正前にあった1画像領域(図10(A)の領域An)を見付け、その領域に付与されていた読み順データ(図10(A)の読み順(n))を取得する(ステップS204)。なお、ステップS203,S204の処理は、領域の修正が、画像領域を分割する形態で行われた場合に、その領域を特定し、修正前の読み順データを得るための処理である。
次に、上記のようにして、画像領域を分割する形態で行われる修正領域を特定し、得られた修正前の読み順をもとに、この読み順に連なる順番の読み順を振る処理を行う。つまり、修正前にあった1画像領域(図10(A)の領域An)を分け合って設定された新規画像領域AX,領域AX+1に修正前の読み順に連なる順番の読み順をどのように振るかを判断する。
領域の位置関係で読み順を振る方法としては、例えば、次に示す (I) 〜 (III) の条件に応じ、読み順を振る方法をとることができる。
画像領域AXと領域AX+1がともに水平行である場合(I)
領域AXが領域AX+1の上側 → 画像領域AXは領域AX+1の1つ前の読み順
領域AXが領域AX+1の下側 → 画像領域AXは領域AX+1の1つ後の読み順
画像領域AXと領域AX+1がともに垂直行である場合(II)
領域AXが領域AX+1の右側 → 画像領域AXは領域AX+1の1つ前の読み順
領域AXが領域AX+1の左側 → 画像領域AXは領域AX+1の1つ後の読み順
画像領域AXと領域AX+1行方向同士が対角(水平と垂直)である場合(III)
読み順の判別が不能
領域と読み順の設定処理が予定通りに行われたときに得られる結果が、例えば、図11に示すレイアウトの領域になるとする。
ところが、何らかの理由で、図12(A)の領域A2に示すように、図11の領域A2と領域A5を合わせた領域として設定処理が行われたとする。この場合、図12(B)→図12(C)に示すように、文書画像10中の読み順(2)を付けた領域のサイズを縮め領域A2−とし、設定が解除された領域に、新たに領域A6を作成するか、或いは、図12(A)の領域A2を削除し、削除した領域に新たに2つの領域(領域A2−,領域A6と同じになる)を作成することにより領域を分割する。
この場合、分割した2つの新規領域の間には、行方向に対する各領域の位置関係において、上記 (I) , (II) において条件とした、上下、左右の違いが生じないので、上記 (I) , (II) の判別ができない。ただ、この様なケースでは、分割された領域の読み順は連続しないことのほうが多いことは、経験上明らかである。よって、このようなケースの分割領域には、連番を付与することを考慮しなくてもよい。即ち、文書画像10中の読み順(2)を付けた領域のサイズを縮め領域A2−とした場合には、図12(C)に示すように、領域A2−には、元の領域A2に付与された読み順(2)をそのまま引継ぎ、新規に作成した領域A6には、最後の順番の読み順(6)を付与する。また、2つの新規領域を作成する場合には、連番を付ける必要がないので、図11に示した領域設定時の付与ルールを適用して、同図の読み順を設定するようにすれば良い。
分割された領域の読み順を付与した後、上記の実施形態1に記したと同様に、修正結果として、領域と読み順をGUI画面に表示し(図4のステップS106、参照)、ユーザの確認を経て、この処理フローを終える。
上記のように、領域の分割、といった領域修正を行う場合にも、領域修正に伴う読み順の改定を装置側の処理により行うようにしたことで、読み順の修正の手間を掛けずに領域修正を行うことが可能になり、従来法の問題を解消し、画像領域への読み順機能の利用性の向上、延いては処理対象の画像領域の設定機能の有効性を高めることが可能になる。
この実施形態は、設定された画像領域の修正が領域を統合する形態で行われる場合に対応可能とするものである。
図13は、画像領域を分割する形態で領域の修正が行われる場合に適用し得る本実施形態に係る処理フローを示す。なお、ここでは、画像領域を統合する形態で行われる修正処理に絞って説明するので、この処理フローには、修正前に行う画像領域・読み順を設定する処理手順を示していない。画像領域・読み順を設定する処理は、上記の実施形態1に記したと同様に行われる。従って、この処理手順を示した図4のステップS101〜S103に関する記載を参照することとし、この処理手順については、記載を省略する。
図13に示す処理フローに従って行う画像領域・読み順の修正処理手順について、図14に示す処理例を参照して説明する。
図14(A)は、文書原稿をスキャナ101により読み取られ、電子データとして入力された文書画像10に対しOCRの前処理として、処理対象の画像領域を設定する処理を行った後の文書画像を示す。図14(A)には、設定処理の結果が、枠囲いした画像領域A1,A2,・・,An,・・,Am,・・として示され、また、各画像領域には、読み順(1),(2),・・,(n),・・(m)・・が付与されている。
領域の修正要求は、編集ツールによる画像領域の変更、削除及び新規作成の操作を組み合わせた作業手順を伴う。
例えば、図14(A)の文書画像における領域Anと領域Amを統合する場合、ユーザによってこれらの領域を削除する操作がなされると、この操作を受ける装置側では、領域Anと領域Amの設定データを消去するが、後述する読み順の自動変更の処理に必要な情報であるから、一時的に領域Anと領域Amの位置及び読み順のデータをメモリに保存しておく(ステップS301)。
このように、領域Anと領域Amを削除した後、削除されたこれらの領域を1つに統合する形で、領域を設定し直し、元の領域(An+Am)に相当する図14(B)の領域AXの作成を指示すると、確認画面として、統合した枠囲いの領域が表示され、ここで実行を指示すると、領域の修正が確定する(ステップS302)。
この領域修正に伴い、読み順を改めて定める必要がある。なお、この場合、領域AXは、削除された領域に新たに作成したので、次に示す読み順の改定を行うまで、この文書画像10の領域に既に付与されている最終版の後の読み順が一時的に付与される。
ここに、上記した領域の重なりは、重なりが所定の割合以上あることと、統合前の複数の領域の中で重なり面積の最も大きい領域を検出結果として得る検出方法を用いる。この方法で検出した統合前の特定の領域に付与されていた読み順を新規の統合画像領域に付与する読み順とする。つまり、重なりが所定の割合以上あるということで、小さなごみ領域による誤検出を回避し、適正な領域のみを対象として検出し、この後、統合前の複数の領域の中で重なり面積の最も大きい領域を定め、その領域に付与されていた読み順を修正後の新規画像領域に付与する。
ここでは、領域を統合したので、領域AXと重なる修正前にあった複数の画像領域(図14(A)では領域An,Am)が探索される。また、領域を統合する際の操作は、画像領域の変更、削除の操作によって行われることから、統合する領域に重なる領域の探索対象として、削除操作で対応した領域(ステップS303)と画像領域のサイズ変更操作で対応した領域(ステップS304)を探索し、重なり領域を見付ける。
探索結果として、統合した1領域に重なる複数の画像領域(図14(A)では領域An,Am)が得られるので、得た複数の領域の中で最も重なりの大きい領域(図14(A)では領域An)を検出する(ステップS305)。
次に、検出した最も重なりの大きい領域に対応する読み順として付与されていた順番を統合した領域に付与する(ステップS306)。図14の例では、修正前にあった領域An(図10(A))の読み順(n)を統合領域Ax(図10(B))の読み順として付与する。
統合された領域の読み順を付与した後、上記実施形態1に記したと同様に、修正結果として、領域と読み順をGUI画面に表示し(図4のステップS106、参照)、ユーザの確認を経て、この処理フローを終える。
上記のように、領域の統合といった領域修正を行う場合にも、領域修正に伴う読み順の改定を装置側の処理により行うようにしたことで、読み順の修正の手間を掛けずに領域修正を行うことが可能になり、従来法の問題を解消し、画像領域への読み順機能の利用性の向上、延いては処理対象の画像領域の設定機能の有効性を高めることが可能になる。
領域修正の要求に応じて、修正した領域への読み順を自動で付与することを可能にするが、付与する読み順の決定には、修正前後の領域の重なり具合を調べ、重なりのある領域同士の位置関係、或いは重なりの大きさの関係を判断して決定する方法をとっており、例えば、上記実施形態2に示したように、領域を分割する修正における読み順の付与を分割領域同士の位置関係で、上記 (I) 〜 (III) の条件に従って行うと、条件 (III) のように、読み順を判別できない場合がある。
そこで、上記実施形態2の条件 (III) のように、読み順を判別できない場合、読み順をマニュアルで設定できるようにする。読み順を判別できない、という結果が得られた場合に、例えば、修正した領域を含むこれまでに設定された領域情報を使用して、読み順設定処理を自動でやり直すか、もしくは手動で全部の読み順設定をやり直すか、あるいはこのままでよいか、という3つ或いは2つの選択肢からユーザに選択をさせるGUI画面を表示する。このGUI画面へのユーザの選択操作が行われれば、この操作に応じて、各々に必要な処理・動作を実行する。
Claims (10)
- 入力画像を保存する記憶手段と、
入力画像の中から処理対象の画像領域を分割、抽出する画像領域抽出手段と、
入力画像を処理する画像処理手段と、
前記画像領域抽出手段により抽出された複数領域の画像を前記画像処理手段で処理する際、前記記憶手段から処理対象画像を読み出す読み順を各画像領域に対し付与する読み順付与手段と、
ユーザインターフェースを介して、前記画像領域抽出手段で抽出された画像領域に対する修正要求を受け付ける修正要求受理手段と、
前記修正要求受理手段で受け取った修正要求に応じて新規に作成される画像領域と修正によって削除されることになる画像領域との間に重なりがあることを条件に、削除される画像領域に付与されていた読み順に連なる順番を新規画像領域に付与する読み順修正手段を有する画像処理装置。 - 請求項1に記載された画像処理装置において、
前記読み順修正手段は、修正後に削除される画像領域の行方向を認識する行方向認識手段と、
前記画像領域間の重なりが、修正後に削除される1画像領域と領域を分け合った複数の新規画像領域との重なりによるものである場合に、前記行方向認識手段により得られた行方向に対する複数の新規画像領域の位置関係に基づいて、削除される画像領域に付与されていた読み順に連なる順番を付与する画像領域を決定する手段を備えたことを特徴とする画像処理装置。 - 請求項1に記載された画像処理装置において、
前記読み順修正手段は、新規に作成される画像領域と修正後に削除される画像領域との間における重なりの大きさを検出する重なり面積検出手段と、
前記画像領域間の重なりが、修正後に削除される複数の画像領域と1新規画像領域との重なりによるものである場合に、前記重なり面積検出手段により得られた修正後に削除される複数の画像領域各々の重なり面積に基づいて、新規に作成される1画像領域の読み順を付与する画像領域を決定する手段を備えたことを特徴とする画像処理装置。 - 請求項1乃至3のいずれかに記載された画像処理装置において、
ユーザインターフェースに、前記読み順修正手段による修正結果を反映した画像領域に対応して付与された読み順の表示を行う表示手段と、修正後の画像領域に対する再修正の要求及び修正後の読み順の設定変更を要求するための操作手段を備えたことを特徴とする画像処理装置。 - 入力画像の中から処理対象の画像領域を分割、抽出する画像領域抽出工程と、
前記画像領域抽出工程によって抽出された複数の画像領域の画像を処理する際、入力画像を保存した記憶手段から処理対象画像を読み出す読み順を各画像領域に対し付与する読み順付与工程と、
ユーザインターフェースを介して、前記画像領域抽出工程で抽出された画像領域に対する修正要求を受け付ける修正要求受理工程と、
前記修正要求受理工程で受け取った修正要求に応じて新規に作成される画像領域と修正によって削除されることになる画像領域との間に重なりがあることを条件に、削除される画像領域に付与されていた読み順に連なる順番を新規画像領域に付与する読み順修正工程と、
を有する読み順設定方法。 - 請求項5に記載された読み順設定方法において、
前記読み順修正工程は、修正後に削除される画像領域の行方向を認識する行方向認識工程と、
前記画像領域間の重なりが、修正後に削除される1画像領域と領域を分け合った複数の新規画像領域との重なりによるものである場合に、前記行方向認識工程により得られた行方向に対する複数の新規画像領域の位置関係に基づいて、削除される画像領域に付与されていた読み順に連なる順番を付与する画像領域を決定する工程を有することを特徴とする読み順設定方法。 - 請求項5に記載された読み順設定方法において、
前記読み順修正工程は、新規に作成される画像領域と修正後に削除される画像領域との間における重なりの大きさを検出する重なり面積検出工程と、
前記画像領域間の重なりが、修正後に削除される複数の画像領域と1新規画像領域との重なりによるものである場合に、前記重なり面積検出工程により得られた修正後に削除される複数の画像領域各々の重なり面積に基づいて、新規に作成される1画像領域の読み順を付与する画像領域を決定する工程を有することを特徴とする読み順設定方法。 - 請求項5乃至7のいずれかに記載された読み順設定方法において、
前記読み順修正工程による修正結果を反映した画像領域に対応して付与された読み順の表示を行う表示工程と、修正後の画像領域に対する再修正の要求及び修正後の読み順の設定変更の要求を受け付ける受理工程を行うことにより、ユーザとのインターフェースを図るようにしたことを特徴とする読み順設定方法。 - 請求項5乃至7のいずれかに記載された読み順設定方法における、画像領域抽出工程、読み順付与工程、修正要求受理工程、読み順修正工程の各工程を画像処理装置のコンピュータに実行させるためのプログラム。
- 請求項9に記載されたプログラムにおいて、
請求項8に記載された表示工程及び受理工程を実行させるためのプログラムを連係させたことを特徴とするプログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007064710A JP4756650B2 (ja) | 2007-03-14 | 2007-03-14 | 画像処理装置、読み順設定方法及びプログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2007064710A JP4756650B2 (ja) | 2007-03-14 | 2007-03-14 | 画像処理装置、読み順設定方法及びプログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2008225964A true JP2008225964A (ja) | 2008-09-25 |
JP4756650B2 JP4756650B2 (ja) | 2011-08-24 |
Family
ID=39844490
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2007064710A Expired - Fee Related JP4756650B2 (ja) | 2007-03-14 | 2007-03-14 | 画像処理装置、読み順設定方法及びプログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4756650B2 (ja) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2015032116A (ja) * | 2013-08-01 | 2015-02-16 | 富士通株式会社 | 読み順確認装置、読み順確認方法及び読み順確認プログラム |
US8989494B2 (en) | 2011-06-08 | 2015-03-24 | International Business Machines Corporation | Reading order determination apparatus, method, and program for determining reading order of characters |
JP2021033433A (ja) * | 2019-08-19 | 2021-03-01 | グローリー株式会社 | 硬貨処理システムおよび硬貨処理装置 |
US11900644B2 (en) | 2019-10-31 | 2024-02-13 | Rakuten Group, Inc. | Document image analysis apparatus, document image analysis method and program thereof |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07192084A (ja) * | 1993-05-12 | 1995-07-28 | Ricoh Co Ltd | 文書画像処理方法 |
JPH08185473A (ja) * | 1994-12-28 | 1996-07-16 | Matsushita Electric Ind Co Ltd | 文字認識装置 |
JPH08237471A (ja) * | 1994-12-21 | 1996-09-13 | Canon Inc | ブロックセレクション処理の検証及び編集システム |
JPH096901A (ja) * | 1995-06-22 | 1997-01-10 | Oki Electric Ind Co Ltd | 文書読取装置 |
-
2007
- 2007-03-14 JP JP2007064710A patent/JP4756650B2/ja not_active Expired - Fee Related
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPH07192084A (ja) * | 1993-05-12 | 1995-07-28 | Ricoh Co Ltd | 文書画像処理方法 |
JPH08237471A (ja) * | 1994-12-21 | 1996-09-13 | Canon Inc | ブロックセレクション処理の検証及び編集システム |
JPH08185473A (ja) * | 1994-12-28 | 1996-07-16 | Matsushita Electric Ind Co Ltd | 文字認識装置 |
JPH096901A (ja) * | 1995-06-22 | 1997-01-10 | Oki Electric Ind Co Ltd | 文書読取装置 |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8989494B2 (en) | 2011-06-08 | 2015-03-24 | International Business Machines Corporation | Reading order determination apparatus, method, and program for determining reading order of characters |
US9014478B2 (en) | 2011-06-08 | 2015-04-21 | International Business Machines Corporation | Reading order determination apparatus, method, and program for determining reading order of characters |
JP2015032116A (ja) * | 2013-08-01 | 2015-02-16 | 富士通株式会社 | 読み順確認装置、読み順確認方法及び読み順確認プログラム |
JP2021033433A (ja) * | 2019-08-19 | 2021-03-01 | グローリー株式会社 | 硬貨処理システムおよび硬貨処理装置 |
JP7250644B2 (ja) | 2019-08-19 | 2023-04-03 | グローリー株式会社 | 硬貨処理システムおよび硬貨処理装置 |
US11900644B2 (en) | 2019-10-31 | 2024-02-13 | Rakuten Group, Inc. | Document image analysis apparatus, document image analysis method and program thereof |
Also Published As
Publication number | Publication date |
---|---|
JP4756650B2 (ja) | 2011-08-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5326859B2 (ja) | 画像処理装置 | |
JP4100746B2 (ja) | 画像処理装置及び方法 | |
JP2010061311A (ja) | 情報処理装置並びにコンピューター・プログラム | |
JP3910196B2 (ja) | シーケンスプログラムの編集装置 | |
JP4756650B2 (ja) | 画像処理装置、読み順設定方法及びプログラム | |
JP4730775B2 (ja) | 画像処理装置 | |
US20050102327A1 (en) | Data file processor, data file processing method and program | |
JP2009169731A (ja) | マニュアル作成支援システム | |
JP2009225231A (ja) | 情報処理装置およびプログラム | |
US9912834B2 (en) | Document camera device and cutout assistance method | |
JP4357226B2 (ja) | 帳票定義装置、帳票定義方法及び帳票定義プログラム | |
JP2001273509A (ja) | 文書画像編集装置及び文書画像編集方法 | |
JP6795770B2 (ja) | 情報処理装置と、その処理方法及びプログラム | |
JP2018085093A (ja) | 情報処理装置、制御方法、プログラム | |
KR102442510B1 (ko) | 문서에 대한 저장 파일 형식을 자동으로 지정하는 문서 편집 장치 및 그 동작 방법 | |
JP2004348428A (ja) | 電子文書における、ヘッダ、フッタの挿入手段 | |
JP2009157470A (ja) | 電子文書処理装置及びプログラム | |
JP4756149B2 (ja) | フォトアルバム作成システム及びフォトアルバム作成コンピュータプログラム | |
JP2008090789A (ja) | 文書管理システム、文書管理方法、文書管理プログラム及びその記憶媒体 | |
JP2006004050A (ja) | 画像処理装置、画像読み取り装置およびプログラム | |
JP2006331400A (ja) | 画像編集方法 | |
JP2007179203A (ja) | 帳票検索装置、帳票検索方法、プログラム及びコンピュータ読み取り可能な記憶媒体 | |
JP2001051771A (ja) | 画像処理システム及び方法 | |
JP2007148585A (ja) | 画像処理装置及びプログラム | |
JP2002245466A (ja) | 画像レイアウト解析システム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20091118 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20110513 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20110527 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20110527 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4756650 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140610 Year of fee payment: 3 |
|
LAPS | Cancellation because of no payment of annual fees |