JP5794154B2 - 画像処理プログラム、画像処理方法、及び画像処理装置 - Google Patents

画像処理プログラム、画像処理方法、及び画像処理装置 Download PDF

Info

Publication number
JP5794154B2
JP5794154B2 JP2012011396A JP2012011396A JP5794154B2 JP 5794154 B2 JP5794154 B2 JP 5794154B2 JP 2012011396 A JP2012011396 A JP 2012011396A JP 2012011396 A JP2012011396 A JP 2012011396A JP 5794154 B2 JP5794154 B2 JP 5794154B2
Authority
JP
Japan
Prior art keywords
block
area
block area
image
image processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2012011396A
Other languages
English (en)
Other versions
JP2013149210A (ja
Inventor
田中 宏
宏 田中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2012011396A priority Critical patent/JP5794154B2/ja
Publication of JP2013149210A publication Critical patent/JP2013149210A/ja
Application granted granted Critical
Publication of JP5794154B2 publication Critical patent/JP5794154B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、所定の画像内の指定した領域に対応する適切な部分画像を取得するための画像処理プログラム、画像処理方法、及び画像処理装置に関する。
従来では、紙文書の一部を切り出して保存したい場合、昔からの新聞切り抜きのように、保存したい部分を切って画像化するという方法が知られている。また、従来では、紙を実際に切らなくても、保存したい領域をマーカーペンの線で囲んで、スキャン画像から囲まれた部分のみ切り出すという方法が知られている(例えば、特許文献1参照)。なお、上述した従来技術は、何れも原本を傷めてしまい、また操作も煩雑であった。
そこで、別の手法としては、文書全体をスキャンして、画面上で領域を指定して部分画像を生成するという方法が考えられる。例えば、従来では、文書の部分領域を切り出した画像を並べて、画面上に設けられた白紙の台紙領域に並べ直す方法が知られている。また、従来では、文書をテキスト・図表・タイトル等の領域に分割するレイアウト解析を行い、領域毎に定めた得点ルール等により各領域の画像を保存すべきか否かを判定する方法が知られている。更に、従来では、上述したレイアウト解析の結果から、ユーザが指定した領域の輪郭を補正する方法が知られている(例えば、特許文献2〜4参照)。
特開2006−340103号公報 特開昭61−15280号公報 特開平09−091450号公報 特開2001−274969号公報
ところで、上述した従来手法では、画像全体から切り出したい部分画像の領域を指定するためにマウス等の座標入力手段が用いられ、その指定された部分領域は矩形(四角形)に限定される。そのため、部分画像が矩形でない場合には、指定領域に含まれる保存対象ではない不要な画像まで含めて保存されていた。
一方、従来手法では、マウス等で部分画像の領域の外枠に沿って曲線を描くような方法もあるが、正確に領域を指定するのが困難であるため、操作が煩雑で、かつ不正確であった。
また、従来のレイアウト解析の結果を用いる方法は、テキストや図表等のレイアウト要素の単位でしか領域が指定できないため、ユーザが希望する領域が適切に選択できなかった。ここで、上述の問題点を具体的に説明する。図1は、従来技術の問題点を説明するための図である。なお、図1(A)〜(C)は、一例として、それぞれが新聞記事等の文書画像を示す。また、「AAA」とは、文字や数字等で構成されるタイトルや本文等の文書データの配置を意味し、文書以外にも図表等が配置される領域も含む(以下の説明についても同様とする)。
従来技術では、例えば図1に示すような文書画像に対して、図1(A)の点線部分に示すように選択したい領域があった場合に、レイアウト解析で、図1(B)に示すような正しいブロック領域が得られたとする。このような場合には、ブロック領域(1)〜(5)を組み合わせることによって所望の領域を得ることができる。一方、レイアウト解析で、図1(C)の示すような誤ったブロック領域が得られた場合には、例えばブロック領域(a)〜(c)を組み合わせても所望の領域には足りず、またブロック領域(a)〜(d)では余分となる。したがって、従来手法では、レイアウト解析が誤ると正しい部分画像は得られない。更に、レイアウト解析により選択された領域は、ユーザにフィードバックされないため、不適切な領域が選ばれても気づかないという問題があった。
開示の技術は、かかる問題を鑑み、所定の画像から指定した領域に対応する適切な部分画像を取得することを目的とする。
開示の一態様における画像処理プログラムは、所定の画像から取得する部分画像の領域を指定し、画像レイアウトを解析する解析パラメータに基づいて、前記所定の画像を1又は複数のブロック領域として認識し、前記認識した1又は複数のブロック領域と、前記指定した領域とを比較して、前記指定した領域に含まれる第1のブロック領域、前記指定した領域に含まれない第2のブロック領域、及び未確定領域である第3のブロック領域のうちの何れかに分類する第1のブロック判定を行い、前記第3のブロック領域と判定されたブロック領域に対して、前記解析パラメータを変更し、前記ブロック領域を再認識した後に、前記第1のブロック領域又は前記第2のブロック領域に分類する第2のブロック判定を行い、前記第1のブロック判定及び前記第2のブロック判定で得られる第1のブロック領域の集合に基づいて部分画像を生成する、処理をコンピュータに実行させる。
開示の技術によれば、所定の画像から指定した領域に対応する適切な部分画像を取得することができる。
従来技術の問題点を説明するための図である。 画像処理装置の概略構成の一例を示す図である。 本実施形態における画像処理装置のハードウェア構成の一例を示す図である。 第1実施例におけるブロック領域判定手段の機能構成を示す図である。 セパレータによるレイアウト解析結果の一例を示す図である。 細密度パラメータの具体例を示す図である。 空白セパレータの抽出の一例を示す図である。 レイアウト解析パラメータによる動作の違いについて説明するための図である。 第1実施例におけるブロック領域分類例を示す図である。 第1実施例における画像処理の一例を示すフローチャートである。 第1実施例におけるグループ統合によるレイアウト解析の一例を示す図である。 ユーザ指定領域の再入力を促す画面の一例を示す図である。 第1実施例により得られる部分画像の具体例を説明するための図である。 第2実施例におけるブロック領域判定手段の機能構成を示す図である。 第2実施例における画像処理の一例を示すフローチャートである。 第3実施例におけるブロック領域判定手段の機能構成を示す図である。 第3実施例における画像処理の一例を示すフローチャートである。
以下、添付図面を参照しながら実施例について詳細に説明する。
<画像処理装置:概略構成例>
本実施形態における画像処理装置の概略構成例について図を用いて説明する。図2は、画像処理装置の概略構成の一例を示す図である。図1に示す画像処理装置10は、画像入力手段11と、領域指定手段12と、ブロック領域判定手段13と、部分画像生成手段14とを有する。
画像入力手段11は、部分画像を取得する対象画像を入力する。具体的には、新聞や雑誌、インターネットのホームページ等の文書データや写真等の画像データを入力する。
領域指定手段12は、画像入力手段11により得られる画像(以下、必要に応じて「全体画像」という)から、ユーザ等により指定された切り出したい部分画像の領域(ユーザ指定領域)の情報を取得する。なお、領域指定は、予め設定されていてもよく、必要に応じてユーザに指定させてもよい。また、領域指定手段12は、1つの画像に対して1又は複数の部分画像の領域を指定することができる。
ブロック領域判定手段13は、画像入力手段11により得られる全体画像を、レイアウト解析により所定の文書等の集合からなる1又は複数のブロック領域として認識する。また、ブロック領域判定手段13は、レイアウト解析により得られたブロック領域毎に、上述したユーザ指定領域と比較を行い、予め設定された閾値に基づいて、例えば第1〜第3のブロック領域に分類する。具体的には、ブロック領域判定手段13は、レイアウト解析により得られたブロック領域毎に、ユーザが指定した領域に含まれる第1のブロック領域と、ユーザが指定した領域に含まれない第2のブロック領域とに分類する。更に、ブロック領域判定手段13は、上述した第1及び第2のブロック領域に分類できない未確定領域を第3のブロック領域として分類する。
また、ブロック領域判定手段13は、画像レイアウトを解析し所定のブロック領域として認識するためのレイアウト解析パラメータを変更して再度レイアウト解析を行い、ブロック領域の再分類を行う。その後、ブロック領域判定手段13は、再分類されたブロック領域毎に、上述した第1〜第3のブロック領域の判定を行う。なお、上述したブロック領域判定手段13の具体的な処理については後述する。
部分画像生成手段14は、ブロック領域判定手段13により、第1のブロック領域に含まれるブロック領域の集合から部分画像を生成し、生成した部分画像を出力する。これにより、本実施形態では、所定の画像から指定した領域に対応する適切な部分画像を取得することができる。
<画像処理装置:ハードウェア構成例>
図3は、本実施形態における画像処理装置のハードウェア構成の一例を示す図である。また、画像処理装置10は、制御部21と、通信部22と、主制御部23と、補助記憶部24と、ドライブ装置25とを有する。また、本実施形態では、制御部21、通信部22、主記憶部23、補助記憶部24、及びドライブ装置25は、共通バスによりデータや信号等の送受信が可能な状態で接続されている。
また、図3の例では、画像処理装置10に接続される外部装置として、画像入力部31と、座標入力部32と、表示部33と、記録媒体34とを有する。
制御部21は、Operating System(OS)等の制御プログラム、及び主記憶部23に格納されている実行プログラムに基づいて、各種演算や各ハードウェア構成部とのデータの入出力等、コンピュータ全体の処理を制御して、本実施形態における各処理を実現することができる。なお、プログラムの実行中に必要な各種情報等は、補助記憶部24から取得することができ、また実行結果等を格納することもできる。
具体的には、制御部21は、画像入力部31からの画像情報の入力や座標入力部32からの座標情報の入力を行い、本実施形態における画像処理を行うために画像処理装置10全体を制御する。また、制御部21は、本実施形態における画像処理を実行するための各種画面を表示部23に表示させるための制御を行う。また、制御部21は、ドライブ装置25を介して記録媒体34から本実施形態に必要な各種情報やプログラムを読み出したり、本実施形態における処理を実行した結果や経過等の情報を記録媒体34に書き込むための制御等を行う。なお、制御部21は、例えばCentral Processing Unit(CPU)等からなる。
通信部22は、インターネットやLocal Area Network(LAN)等に代表される通信ネットワークを用いて、外部装置と接続してデータの送受信等を行う。なお、通信部22は、外部装置と接続し、例えば新聞や雑誌等の文書画像情報等を取得することもできる。
また、通信部22は、通信ネットワークを通じて外部端末から本実施形態における画像処理プログラムや入力情報等を取得したり、画像処理の実行結果や経過等の情報を外部装置に送信することができる。
主記憶部23は、実行プログラム等を格納する。なお、主記憶部23は、例えばRead Only Memory(ROM)やRandom Access Memory(RAM)等のメモリ等からなる。本実施形態では、例えば処理対象の全体画像等が主記憶部23に記憶されて画像処理等が行われる。
補助記憶部24は、例えばハードディスク等のストレージ手段であり、実行プログラムやコンピュータに設けられた制御プログラム等を蓄積し、必要に応じて入出力を行うことができる。また、補助記憶部24は、画像処理を行う前の全体画像や処理結果としての部分画像も記憶することができる。また、補助記憶部24は、全体画像が大きなデータである場合に、主記憶部に23で記憶しきれない画像を部分的に記憶することができる。
ドライブ装置25は、例えば本実施形態における画像処理等の実行プログラムが記録された記録媒体34をセットすることができる。また、ドライブ装置25は、制御部21の制御により、記録媒体34に含まれる実行プログラムを読み出し、補助記憶部24に出力してインストールさせる。また、ドライブ装置25は、制御部21の制御によりドライブ装置25を介して記録媒体34に各種データを書き込むこともできる。
画像入力部31は、スキャナ装置やデジタルカメラ(撮像手段)等である。具体的には、画像入力部31は、部分画像を生成するための全体画像を入力する。つまり、図3の構成は、例えばスキャナ等の画像入力部31によって取得した文書画像等の全体画像を対象として画像処理を行うものであるが、これに限定されるものではなく、例えば記録媒体34等から全体画像等を取得してもよい。
座標入力部32は、全体画像から部分画像を生成するために、ユーザ等により指定されるユーザ指定領域(トリミング領域)の位置を予め設定された画像上の座標値で入力するものである。座標入力部32としては、例えばPersonal Computer(PC)であれば、マウスやペン等からなり、また携帯電話やスマートフォン等の携帯情報端末であれば、ユーザの指により指定されるタッチパネル等からなるがこれに限定されるものではない。
表示部33は、本実施形態における画像処理を実現するための入力画像や、ユーザ指定領域、各種設定情報、実行結果、実行経過等を表示する。これらの表示内容は、制御部21により制御される。表示部33は、例えばディスプレイやモニタ等からなる。本実施形態では、表示部33の表示される文書画像等の全体画像に対してユーザが対象領域を指定することができる。
記録媒体34は、例えば、Universal Serial Bus(USB)メモリやCD−ROM等の可搬型の記録媒体である。記録媒体34には、例えば、画像処理装置10等のコンピュータ本体にインストールされる実行プログラム等の各種情報が記録されている。記録媒体34は、ドライブ装置25にセットされて、予め記録された各種情報を読み出されたり、実行結果や実行経過等が書き込まれる。また、記録媒体34は、画像処理を行う前の全体画像や処理結果としての部分画像も記録することができる。これらの記録は、制御部21の制御によりドライブ装置25を介して行われる。
なお、図3に示す画像入力部31及び座標入力部32は、上述した図2に示す画像入力手段11及び領域指定手段12として画像処理装置10内に有していてもよい。
本実施形態では、上述したようなハードウェア構成により、本実施形態における画像処理を実行することができる。また、プログラムをインストールすることにより、汎用のパーソナルコンピュータ等で画像処理を容易に実現することができる。
<ブロック領域判定手段:第1実施例>
次に、上述したブロック領域判定手段13の第1実施例について図を用いて説明する。図4は、第1実施例におけるブロック領域判定手段の機能構成を示す図である。図4におけるブロック領域判定手段13は、細密度パラメータ設定手段41と、レイアウト解析手段42と、ブロック領域分類手段43と、ブロック領域確定手段44と、繰り返し制御手段45とを有する。
細密度パラメータ設定手段41は、例えば画像入力手段11から得られた全体画像に対して1又は複数のブロック領域として認識するためのレイアウト解析パラメータとして、細密度パラメータを設定する。具体的には、細密度パラメータ設定手段41は、ブロック領域の区切りを予め所定幅及び所定長さの空白部を用いて追跡するため、その条件となる幅及び長さを細密度パラメータとして設定する。なお、細密度パラメータの具体例については、後述する。
レイアウト解析手段42は、処理対象の全体画像に対して細密度パラメータ設定手段41により設定されたパラメータに基づいて、レイアウト解析を行い、その解析結果から全体画像を1又は複数のブロック領域として認識する。なお、レイアウト解析手段42は、画像の全体に対してレイアウト解析を行ってもよく、また上述した領域指定手段12により指定されたユーザ指定領域の座標を基準とし、ユーザ指定領域の外側の所定の範囲を含む領域を対象にレイアウト解析を行ってもよい。これにより、ユーザ指定領域の外側の所定の範囲のみをレイアウト解析する場合には、レイアウト解析を迅速に行うことができる。
ブロック領域分類手段43は、レイアウト解析手段42により得られる解析結果のブロック領域毎に、ユーザ指定領域と比較し、上述した第1〜第3のブロック領域のうち、何れかのブロック領域に分類する(第1のブロック判定)。ここで、ブロック領域とユーザ指定領域との比較については、例えばレイアウト解析時に得られるブロック領域の位置(例えば、座標等)と、領域指定時に設定されるユーザ指定領域の位置(例えば、座標等)とを比較する。また、第1〜第3のブロック領域への分類については、例えば上述した位置から、ブロック領域がどの程度ユーザ指定領域内に含まれているかを判定することで分類を行う。
ブロック領域確定手段44は、ブロック領域分類手段43により確定したブロック領域をそれぞれの分類結果と共に部分画像生成手段14に出力する。
繰り返し制御手段45は、ブロック領域分類手段43による分類結果で第3のブロック領域が存在する場合に、第3のブロック領域に対してのみ、細密度パラメータの値を変更して再度レイアウト解析を行う。更に、繰り返し制御手段45は、再度のレイアウト解析結果により得られるブロック領域に対してブロック領域分類手段43による第1〜第3のブロック領域への再分類(第2のブロック判定)を行わせるための繰り返し制御を行う。
つまり、第1実施例では、レイアウト解析パラメータとしての細密度パラメータの値を変更しながら、第3のブロック領域についての再判定(再分類化)を、例えば所定の終了条件を満たすまで繰り返し行い、第1のブロック領域又は第2のブロック領域に何れかに分類させる。
なお、所定の終了条件とは、例えば所定回数(例えば、上限値)に達するまで、又は第3のブロック領域がなくなるまで等があるが、これに限定されるものではない。また、上述した所定回数に達する場合には、その時点での第1ブロック領域と第2ブロック領域と第3ブロック領域とを出力してもよく、その時点で、第1のブロック領域の集合のみを出力してもよい。また、第3ブロックが存在する場合には、エラーメッセージやユーザ指定領域の最入力を要求するメッセージ等をユーザに通知する処理を行ってもよい。
<細密度パラメータと、細密度パラメータによる領域分類の具体例>
ここで、細密度パラメータと、細密度パラメータによる領域分類の具体例について説明する。図5は、セパレータによるレイアウト解析結果の一例を示す図である。また、図6は、細密度パラメータの具体例を示す図である。また、図7は、空白セパレータの抽出の一例を示す図である。なお、図5(A)〜(C)は、一例として、それぞれが新聞記事等の文書画像を示す。
例えば、上述したレイアウト解析手段42は、図5(A)に示す入力画像に対し、全体画像に含まれる罫線切り出し処理によって画像中から罫線を検出し、更に空白領域検出処理によってブロックを分割する空白領域を検出する。上述した罫線及び空白領域は、領域同士を分けるセパレータとして働き、例えば図5(B)に示すように罫線のセパレータ(黒い矩形)と空白のセパレータ(白い矩形)とを取得することができる。したがって、第1実施例では、これらのセパレータによって画像を分割し、各分割領域で背景以外の画素が存在する領域を囲むことで、図5(C)の太線枠に示すようなブロック領域を認識することができる。
ここで、例えば空白矩形を抽出する処理は、所定幅以上で所定長さ以上の空白部を追跡する。この所定幅や所定長さが、一定値の場合や不適切な値の場合には、レイアウト解析の結果は大きく変わってしまう。そこで、第1実施例では、レイアウト解析パラメータとして、細密度パラメータという値を用い、例えば所定幅等の値を変化させる。なお、第1実施例では、所定幅のみを異なる値に変更し、所定長さは一定値とするが、これに限定されるものではなく、例えば所定幅及び所定長さを異なる値に変更してもよく、所定幅を一定値とし、所定長さのみを異なる値に変更してもよい。
具体的には、図6に示すように、細密度パラメータのレベルを1から5まで増加させると、空白矩形の所定幅は30画素から10画素へと所定画素数単位(例えば、5画素)に減少するというような設定を用いる。なお、レベルの種類については、図6に限定されるものではない。また、所定画素数については、5画素に限定されるものではなく、また所定画素数単位でなくてもよく、任意に所定幅を変更することができる。第1実施例では、上述したように細密度パラメータのレベルに幅を持たせておくことで、適切なブロック領域の分割を行うことができる。
なお、上述したようにセパレータを用いて領域を分割し、分割された領域を各ブロック領域として認識する手法では、どの程度の大きな空白をセパレータとみなすかを決定しなければならない。その場合には、例えば空白のセパレータとして、図7に示すように、複数の空白矩形の集合R(i=1,・・・,n)から極大空白矩形を求めて、空白矩形のサイズが所定の値(パラメータ)に達したところで終了する。これにより、空白のセパレータを、適切に抽出することができる。つまり、上述の手法を用いた場合には、セパレータを抽出する画素サイズのパラメータを小さくすることで、より小さなレイアウト要素が得られるようになる。
図8は、レイアウト解析パラメータによる動作の違いについて説明するための図である。上述したように、画像で空白矩形を抽出してブロック領域を分割する手法において、図8(A)に示すように、細密度パラメータが小さい場合には、タイトル(右側A列)と本文とに分割される。一方、図8(B)に示すように、細密度パラメータが大きい場合には、行間の狭い空白まで抽出されるため、ブロック領域はより細かく分割される。このように、第1実施例では、細密度パラメータを変更することによって大きなブロック領域をより細かく分割することができる。
<ブロック領域分類手段による分類例>
ここで、上述したブロック領域分類手段43による第1〜第3のブロック領域の分類例について図を用いて説明する。図9は、第1実施例におけるブロック領域の分類例を示す図である。
図9に示す例では、全体画像50に対して、ユーザが指定したユーザ指定領域51と、レイアウト解析により得られたブロック領域52との比較により、ブロック領域52がどのように分類されるかについて説明する。図9において、ブロック領域分類手段43は、まずユーザ指定領域51の位置と判定対象のブロック領域52の位置とを用いて重なり面積を求める。また、ブロック領域分類43は、予め2つの閾値を設定しておく。
次に、ブロック領域分類手段43は、求めた重なり面積と第1の閾値とを比較し、ブロック領域全体に対する重なり面積の比率が第1の閾値(例えば、85%)以上の場合に、ブロック領域52を第1のブロック領域と判断する。また、ブロック領域分類43は、ブロック領域全体に対する重なり面積の比率が第2の閾値(例えば、10%)以下の場合に、ブロック領域52を第2のブロック領域に分類する。更に、第1及び第2の閾値により、第1のブロック領域又は第2のブロック領域に属さない場合に、ブロック領域52を未確定領域として第3のブロック領域に分類する。なお、上述した第1の閾値及び第2の閾値は、全体画像の内容やレイアウト解析によるブロックサイズ、ブロック数等に応じて適宜変更することができる。このように、ブロック領域分類手段43は、ユーザ指定領域との重なり度合によってブロック領域を分類することができる。
<第1実施例における画像処理手順>
ここで、上述した第1実施例における画像処理手順について、フローチャートを用いて説明する。なお、以下に示す画像処理は、例えば画像処理プログラム(ソフトウェア)が図3に示すようなハードウェア資源にインストールされることで協働して実行される処理である。
図10は、第1実施例における画像処理の一例を示すフローチャートである。図10に示す例において、画像処理は、部分画像を切り出す対象となる画像を入力し(S01)、S01の処理で入力した画像に対し、ユーザ等により切り出したい部分が指定されたユーザ指定領域を入力する(S02)。
次に、画像処理は、画像全体を処理対象の領域に設定し(S03)、レイアウト解析パラメータを初期値に設定する(S04)。ここで、レイアウト解析パラメータとは、例えば上述した細密度パラメータを意味するが、これに限定されるものではない。また、初期値とは、例えば上述した細密度パラメータのレベルが一番小さい(所定幅(画素数)が一番大きい)ものを意味するが、これに限定されるものではない。
次に、画像処理は、S04の処理で得られたレイアウト解析パラメータに基づいて、レイアウトを解析し(S05)、解析結果として得られる1又は複数のブロック領域を上述した第1〜第3の何れかのブロック領域に分類する(S06)(第1のブロック判定)。なお、S06の処理では、例えば各ブロック領域と、S02の処理で得られたユーザ指定領域との位置情報(例えば、画像上に設定された座標情報等)に基づいて、ユーザ指定領域に含まれる第1のブロック領域と、ユーザ指定領域に含まれない第2のブロック領域と、第1及び第2のブロック領域に属さない第3のブロック領域(未確定領域)とに分類する。また、画像処理は、S06の処理で得られた第1のブロック領域と、第2のブロック領域を確定する(S07)。
次に、画像処理は、第1のブロック領域又は第2のブロック領域に属さない第3のブロック領域(未確定領域)が存在するか否かを判断する(S08)。ここで、画像処理は、第3のブロック領域が存在する場合(S08において、YES)、繰り返し回数が予め設定された上限値に達したか否かを判断する(S09)。また、画像処理は、繰り返し回数が上限値に達していない場合(S09において、NO)、第3のブロック領域を処理対象の領域に設定する(S10)。また、画像処理は、レイアウト解析パラメータを細密度が高い値(すなわち、所定幅(画素数)が小さいパラメータ)に更新して(S11)、S05の処理に戻り、再度レイアウト解析と、ブロック領域の再分類化を行う(第2のブロック判定)。
また、画像処理は、第3のブロック領域が存在しない場合(S08において、NO)、又は繰り返し回数が上限値に達している場合(S09において、YES)、その時点で得られている第1のブロック領域の集合から部分画像を生成し(S12)、生成した部分画像を出力する(S13)。
すなわち、第1実施例では、ユーザが指定した領域と境界線が一致していないブロック領域(つまり、第3のブロック領域)を、細密度パラメータの変更によって、より細かく分割することにより、適切な部分画像を取得することができる。
上述した第1の実施例では、パラメータを再設定することによってレイアウト解析の細分化の程度を制御することができる。そのため、ユーザ指定領域と合致していないレイアウト要素(ブロック領域)については、このパラメータをより細分化する方向に変更してレイアウト解析を再実行することにより、適切な部分画像を取得することができる。
なお、上述の例では、細密度パラメータの使用方法として、所定幅(画素数)を段階的に減少させる例について説明したが、これに限定されるものではない。具体的には、第1実施例では、例えば最初に所定幅(画素数)を小さくし、それを段階的に増加させることで、最初に得られる小さなブロック領域を順に統合することによってレイアウト解析を行うことができる。
図11は、第1実施例におけるグループ統合によるレイアウト解析の一例を示す図である。レイアウト解析手段42は、図11に示すように、例えば文字等の小さな領域を設定し、これらの領域を統合して大きな領域を生成することによってレイアウトを解析することができる。例えば、図11の例では、文字単位に分割し(図11(A))、所定幅(画素数)を段階的に増加させ、所定の距離以内にある隣接文字を行として統合し(図11(B))、更に所定の距離以内にある複数の行についても同様の処理を行って領域を統合する。これにより、第1実施例では、図11(C)に示すようなブロック領域を生成することができる。
なお、図11に示す手法を用いる場合には、例えば隣接する文字や行を統合するか否かを、所定のパラメータ等を用いて判定する。具体的には、例えば「文字間の間隔がそれぞれの文字サイズの平均値の50%よりも小さい場合に統合する」というような基準を設定したとする。この場合には、「それぞれの文字サイズの平均値の50%よりも小さい」というレイアウト解析パラメータに基づいて、レイアウト解析を行う。また、上述の例では、50%という数値を大きくすれば、より大きなレイアウト要素が得られることになる。
また同様に、行と行とを統合する場合には、例えば「行間の間隔が、行の高さの平均値の70%よりも小さい場合に行を統合する」等のように、上述と同様にパラメータを設定することができる。
<ユーザ指定領域の再入力指示の具体例>
また、上述した第1実施例では、レイアウト解析パラメータを異なる値に変更させながら所定回数繰り返しても未確定領域(第3のブロック領域)が存在する場合がある。そのような場合に、第1実施例では、ユーザ指定領域の再入力を要求するメッセージをユーザに通知する処理を行うこともできる。
ここで、図12は、ユーザ指定領域の再入力を促す画面の一例を示す図である。なお、図12(A)は、PC等のディスプレイ(大画面)における表示例を示し、図12(B)は、例えば携帯端末等の小画面における表示例を示している。
例えば、所定回数繰り返しても第3のブロック領域が存在する場合には、ユーザに領域の再入力を要求する画面を表示部33に表示する。
例えば図12(A)に示すPCのディスプレイのような大きな画面60の場合には、第3のブロック領域のみ原画像を残し、それ以外は確定した領域として塗り潰して(図12(A)−(2))、ユーザに再入力を要求する。この場合、ユーザへの要求メッセージ61は、第3のブロック領域が隠れることがないように、例えば画面60中に表示される全体画像62の外側に表示するのが好ましい(図12(A)−(3))が、表示位置や内容についてはこれに限定されるものではない。また、図12(B)に示す携帯電話等の小さな画面63の場合には、座標を詳細に入力できるように、例えば確定したブロック領域は表示せず、領域を再入力するブロック領域64のみを拡大表示することができる。また、ユーザへの要求メッセージ65は、画面63の下部に短い文章で表示するのが好ましい(図12(B)−(3))が、表示位置や内容についてはこれに限定されるものではない。
このように、ユーザ指定領域の再入力をさせることで、未確定となる領域をなくして、より適切な部分画像を生成することができる。なお、上述した要求メッセージ61,65は、音声等により出力されてもよい。
<第1実施例により得られる部分画像の具体例>
ここで、上述した第1実施例により得られる部分画像の具体例について図を用いて説明する。図13は、第1実施例により得られる部分画像の具体例を説明するための図である。
第1実施例では、対象となる全体画像70に対して、例えばユーザが図13(A)のようなユーザ指定領域71を指定する。また、第1実施例では、レイアウト解析によって図13(B)のようなブロック領域72−1〜72−5が得られたとする。次に、第1実施例では、ユーザ指定領域71の内部にあるブロック領域72−1〜72−3(斜線の領域)と、外部にあるブロック領域72−5(白塗りの領域)とを分類する。
この時点で、図13(C)の右下に位置するブロック領域72−4は、ユーザ指定領域の内部か外部かを決めることができず、未確定領域(第3のブロック領域)となっている。そこで、第1実施例では、この未確定領域のみを対象として、再びレイアウト解析を実行する。その場合には、より小さなブロック領域に細分化されるように、レイアウト解析パラメータを変えてレイアウト解析を実行する。
これにより、第1実施例では、図13(D)に示すように、ブロック領域72−4が更に細かく分割され(ブロック領域72−4a,72−4b)、最終的に図13(E)のように全ての領域がユーザ指定領域の内側と外側の何れかに分類される。したがって、第1実施例では、この内側のブロック領域72−1〜72−4a(図13(E)における斜線の領域)の集合を部分画像として生成することで、図13(F)のように、ユーザが指定した所望する部分画像を得ることができる。
<ブロック領域判定手段:第2実施例>
次に、上述したブロック領域判定手段の第2実施例について図を用いて説明する。第2実施例は、予め設定した複数のレイアウト解析パラメータを用いて最初から複数のブロック領域判定処理を行い、最終結果を直接取得するものである。
図14は、第2実施例におけるブロック領域判定手段の機能構成を示す図である。なお、第2実施例におけるブロック領域判定手段を有する画像処理装置の概略構成については、上述した図2と略同様であるため、ここでの説明は省略する。また、以下の説明において、上述した第1実施例と略同様の動作を行う構成については、同一の符号を付するものとし、ここでの具体的な説明は省略する。
図14におけるブロック領域判定手段80は、繰り返し制御手段81−1,81−2と、細密度パラメータ設定手段41と、レイアウト解析手段42と、ブロック領域分類手段43と、ブロック領域確定手段44と、重なりブロック削除手段82とを有する。なお、第2実施例のブロック領域判定手段80は、図2に示す画像処理装置10内のブロック領域判定手段13と置き換わるものである。
第2実施例では、2つの繰り返し制御手段81−1,81−2を有する。繰り返し制御手段81−1は、全体画像に対するレイアウト解析を予め設定された細密度パラメータの全ての条件(レベル)で行うように繰り返し制御を行う。したがって、レイアウト解析手段42により出力されるレイアウト解析結果は、各細密度パラメータを用いて行った複数の解析結果が出力される。
ブロック領域分類手段43は、上述にて出力された複数の解析結果に対してブロック領域分類を行う。また、ブロック領域確定手段44は、上述したブロック領域から第1〜第3の何れかのブロック領域を確定する。
なお、重なりブロック削除手段82は、他の細密度パラメータにより既に第1のブロック領域又は第2のブロック領域であると確定しているブロック領域と重なりがあるブロック領域を削除する。
上述した構成により、第2実施例では、第1実施例と異なり、最初から複数の細密度パラメータ(レイアウト解析パラメータ)(例えば、パラメータID=1〜N)でレイアウト解析を行い、その結果から第1〜3の領域を直接取得する。
したがって、第2実施例では、例えば最初にレベルの小さい(所定幅(画素数)の大きい)細密度パラメータを用いて得られた各ブロック領域に対して、上述した第1〜第3のブロック領域に分類する。その後、第2の実施例では、次のパラメータレベルを用いて得られた各ブロック領域に対して、上述した第1〜第3のブロック領域に分類する。つまり、第2の実施例では、例えばパラメータレベルを段階的に大きく(所定幅(画素数)を段階的に小さく)しながら、全てのパラメータレベルを用いて得られた各ブロック領域に対して、上述した第1〜第3のブロック領域に分類する。
次に、第2実施例では、細密度パラメータ一番小さい(所定幅の一番大きい)レベルで得られた第1のブロック領域及び第2のブロック領域を確定する。また、第2実施例では、次のパラメータレベルで得られたブロック領域に対する分類結果を用いてブロックを確定する。このとき、第2実施例では、次のレベルの分類結果において、既に第1のブロック領域又は第2のブロック領域が確定しているブロック領域と重なるブロック領域については、そのブロック領域を削除する。
つまり、第2実施例では、確定したブロックと重なりがあるものを削除し、この処理をパラメータの数だけ繰り返すことで、第1のブロック領域を高精度に判定し、適切な部分画像を取得することができる。なお、第2実施例では、パラメータの数だけ繰り返した場合でも第3のブロック領域が存在する場合に、例えば上述したようにユーザに領域の再入力を要求してもよい。
<第2実施例における画像処理手順>
ここで、上述した第2実施例における画像処理手順について、フローチャートを用いて説明する。なお、以下に示す画像処理は、例えば画像処理プログラム(ソフトウェア)が図3に示すようなハードウェア資源にインストールされることで協働して実行される処理である。
図15は、第2実施例における画像処理の一例を示すフローチャートである。図15に示す例において、画像処理は、部分画像を切り出す対象となる画像を入力し(S21)、S21の処理で入力した画像に対し、ユーザ等により切り出したい部分が指定されたユーザ指定領域を入力する(S22)。
次に、画像処理は、入力された画像全体を処理対象の領域に設定し(S23)、レイアウト解析パラメータを初期値(ID=1)に設定する(S24)。ここで、第2実施例における初期値とは、例えば上述した細密度パラメータのレベルが一番小さい(所定幅(画素数)が一番大きい)ものをID=1として設定するが、これに限定されるものではない。
次に、画像処理は、S24の処理で得られたレイアウト解析パラメータに基づいて、レイアウトを解析し、その結果をバッファ等へ格納する(S25)。なお、バッファは、レイアウト解析手段42等に設けられていてもよく、バッファ用の記憶手段を有していてもよい。
次に、画像処理は、全パラメータで解析を行ったか否か(ID==N?)を判断し(S26)、全パラメータで解析を行っていない場合(S26において、NO)、次のパラメータ(ID=ID+1)を設定し(S27)S25の処理に戻る。また、画像処理は、全パラメータで解析を行った場合(S26において、YES)、各解析結果から1又は複数のブロック領域に分類する(S28)。なお、S28の処理では、各ブロック領域とS22の処理で得られたユーザ指定領域との位置情報に基づいて、上述した第1のブロック領域と、第2のブロック領域と、第3のブロック領域(未確定領域)とに分類する。
次に、画像処理は、レイアウト解析パラメータを初期値(ID=1)に設定し(S29)、現在のパラメータIDで分類された第1及び第2のブロック領域の分類を確定する(S30)。次に、画像処理は、確定したブロック領域と重なりのあるブロックを削除する(S31)。なお、S31の処理を最初に行う場合は、まだ繰り返して処理を行っていないため、重なりのあるブロックは存在しない。
次に、画像処理は、全パラメータで解析したか否か(ID==N?)を判断し(S32)、全パラメータで解析していない場合(S32において、NO)、次のパラメータ(ID=ID+1)を設定し(S33)、S30の処理に戻る。
また、画像処理は、全パラメータで解析した場合(S32において、YES)、第3のブロック領域が存在するか否かを判断する(S34)。画像処理は、第3のブロックが存在する場合(S34において、YES)、ユーザに領域の再入力を要求するメッセージを出力する(S35)。
また、画像処理は、第3のブロック領域が存在しない場合(S34において、NO)、第1のブロック領域の集合から部分画像を生成し(S36)、生成した部分画像を出力する(S37)。
すなわち、第2の実施例では、ブロック領域の細かさを変動させながら、ブロック領域を適切に分類させることができ、複数の細密度パラメータを用いた解析結果により、適切な部分領域を抽出することができる。なお、上述したS35の処理については、ユーザからユーザ指定領域が再入力されるまで待機し、再入力された後にS23の処理に戻ってもよい。
<ブロック領域判定手段:第3実施例>
次に、上述したブロック領域判定手段の第3実施例について図を用いて説明する。例えば、未確定領域である第3のブロック領域が、例えば図や表、画像等(以下、「図表」と総称する)である場合に、パラメータを変えてもそれ以上細かく分割されることはない。そこで、第3実施例は、第3のブロック領域が図表である場合には、第1のブロック領域又は第2のブロック領域に強制的に分類する。
図16は、第3実施例におけるブロック領域判定手段の機能構成を示す図である。なお、第3実施例におけるブロック領域判定手段を有する画像処理装置の概略構成については、上述した図2と略同様であるため、ここでの説明は省略する。また、以下の説明において、上述した第1実施例と略同様の動作を行う構成については、同一の符号を付するものとし、ここでの具体的な説明は省略する。
図16におけるブロック領域判定手段90は、細密度パラメータ設定手段41と、レイアウト解析手段42と、ブロック領域分類手段43と、ブロック領域確定手段44と、繰り返し制御手段45と、図表ブロック領域分類手段91とを有する。なお、第3実施例のブロック領域判定手段90は、図2に示す画像処理装置10内のブロック領域判定手段13と置き換わるものである。
図表ブロック領域分類手段91は、図表を含むブロック領域に対して、ユーザ指定領域との重なり面積(囲み領域内)が、例えば50%以上であれば第1のブロック領域とする。また、図表ブロック領域分類手段91は、図表を含むブロック領域に対して、ユーザ指定領域との重なり面積が、例えば50%未満であれば第2のブロック領域とする。
つまり、図表ブロック領域分類手段91は、ブロック領域分類手段43において、ブロック領域に図表が含まれていると判断された場合に、そのブロック領域に対して所定の閾値を用いてブロック領域を第1又は第2のブロック領域に強制的に分類する。図表ブロック領域分類手段91は、分類されたブロック領域の情報をブロック領域分類手段43に出力する。これにより、ブロック領域分類手段43は、第3のブロック領域が図表に対応するものであれば、図表ブロック領域分類手段91によって得られる分類結果に基づいて、第1のブロック領域又は第2のブロック領域に強制的に分類することができる。なお、第3のブロック領域が図表であるか否かの判断は、例えば予め画像入力手段11等により入力される画像に図表の位置情報が含まれている場合には、その位置情報に基づいて判断することができるが、これに限定されるものではない。例えば、ブロック領域分類手段43は、入力される画像に対して、予め設定された図表パターンとのパターンマッチングや、人物顔を探す画像解析等を行うことで、ブロック領域内の図表の有無を判断することができる。
つまり、第3実施例では、ブロック領域に図表が含まれている場合に、そのブロック領域がユーザ指定領域に属するか否かの分類を迅速に行うことができる。また、第3実施例においても上述した実施例と同様に、第3のブロック領域が存在する場合には、レイアウト解析パラメータを異なる値に変更してブロック領域の再判定(再分類化)を行うため、適切な部分領域を抽出することができる。
<第3実施例における画像処理手順>
ここで、上述した第3実施例における画像処理手順について、フローチャートを用いて説明する。なお、以下に示す画像処理は、例えば画像処理プログラム(ソフトウェア)が図3に示すようなハードウェア資源にインストールされることで協働して実行される処理である。
図17は、第3実施例における画像処理の一例を示すフローチャートである。図17に示す例において、画像処理は、部分画像を切り出す対象となる画像を入力し(S41)、S41の処理で入力した画像に対し、ユーザ等により切り出したい部分が指定されたユーザ指定領域を入力する(S42)。
次に、画像処理は、画像全体を所定の対象の領域に設定し(S43)、レイアウト解析パラメータを初期値に設定する(S44)。次に、画像処理は、S44の処理で得られたレイアウト解析パラメータに基づいて、レイアウトを解析し(S45)、解析結果として得られる1又は複数のブロック領域を上述した第1〜第3の何れかのブロック領域に分類する(S46)。
ここで、画像処理は、図表を含むブロック領域が第3のブロック領域に分類されていれば、上述した閾値等を用いて、第1のブロック領域又は第2のブロック領域に分類し(S47)、第1のブロック領域と第2のブロック領域を確定する(S48)。
次に、画像処理は、第1のブロック領域又は第2のブロック領域に属さない第3のブロック領域(未確定領域)が存在するか否かを判断する(S49)。画像処理は、第3のブロック領域が存在する場合(S49において、YES)、繰り返し回数が上限値に達したか否かを判断する(S50)。画像処理は、繰り返し回数が上限値に達していない場合(S40において、NO)、第3のブロック領域を処理対象の領域に設定する(S51)。また、画像処理は、レイアウト解析パラメータを細密度が高い値(すなわち、画素数が小さいパラメータ)に更新して(S52)、S45の処理に戻り、再度レイアウト解析と、ブロック領域の再分類化を行う。
また、画像処理は、S50の処理において、繰り返し回数が上限値に達した場合(S50において、YES)、第3のブロックが存在する場合(S34において、YES)、ユーザに領域の再入力を要求するメッセージを出力する(S53)。
また、画像処理は、S49の処理において、第3のブロック領域が存在しない場合(S49において、NO)、その時点での第1のブロック領域の集合から部分画像を生成し(S54)、生成した部分画像を出力する(S55)。
すなわち、第3実施例では、第3のブロック領域に図表が含まれる場合には、迅速に第1のブロック領域か第2のブロック領域に分類することができるため、部分画像を容易に生成することができる。なお、上述したS53の処理については、ユーザからユーザ指定領域が再入力されるまで待機し、再入力された後にS43の処理に戻ってもよい。
ここで、上述した第1〜第3実施例については、組み合わせて適用することもできる。また、上述した各実施例では、1つの画像について1つのユーザ指定領域が設定されていたが、これに限定されるものではなく、1つの画像に複数のユーザ指定領域が設定されていてもよい。その場合には、ユーザ指定領域ごとに、上述した処理が行われ、それぞれの部分画像が出力される。
上述したように、各実施例によれば、所定の画像から指定した領域に対応する適切な部分画像を取得することができる。また、上述した各実施例では、例えばユーザがトリミング(部分切り出し)したい領域を正確に指定しなくても、所望の領域を適切に切り出した部分画像を容易に生成することができる。また、上述した各実施例では、実行するレイアウト解析に誤りがあっても、レイアウト解析パラメータを異なる値に変更してレイアウト解析を再実行することで、より適切な結果を得ることができる。そのため、上述した各実施例は、従来技術と比較して、より適切な領域の部分画像の生成が可能となる。
以上、各実施例について詳述したが、特定の実施例に限定されるものではなく、特許請求の範囲に記載された範囲内において、種々の変形、変更が可能である。
なお、以上の実施例に関し、更に以下の付記を開示する。
(付記1)
所定の画像から取得する部分画像の領域を指定し、
画像レイアウトを解析する解析パラメータに基づいて、前記所定の画像を1又は複数のブロック領域として認識し、前記認識した1又は複数のブロック領域と、前記指定した領域とを比較して、前記指定した領域に含まれる第1のブロック領域、前記指定した領域に含まれない第2のブロック領域、及び未確定領域である第3のブロック領域のうちの何れかに分類する第1のブロック判定を行い、
前記第3のブロック領域と判定されたブロック領域に対して、前記解析パラメータを変更し、前記ブロック領域を再認識した後に、前記第1のブロック領域又は前記第2のブロック領域に分類する第2のブロック判定を行い、
前記第1のブロック判定及び前記第2のブロック判定で得られる第1のブロック領域の集合に基づいて部分画像を生成する、処理をコンピュータに実行させるための画像処理プログラム。
(付記2)
前記第2のブロック判定は、所定の終了条件を満足するまで判定を繰り返すことを特徴とする付記1に記載の画像処理プログラム。
(付記3)
所定の画像から取得する部分画像の領域を指定し、
画像レイアウトを解析する解析パラメータを複数用いて、前記所定の画像を1又は複数のブロック領域として認識し、前記認識した1又は複数のブロック領域と、前記指定した領域とを比較して、前記指定した領域に含まれる第1のブロック領域、前記指定した領域に含まれない第2のブロック領域、及び未確定領域である第3のブロック領域のうちの何れかに分類するブロック判定を解析パラメータ毎に行い、
前記解析パラメータ毎のブロック判定結果を用いて、前記第1のブロック領域、前記第2のブロック領域、及び前記第3のブロック領域を確定する際、既に前記第1のブロック領域又は前記第2のブロック領域に確定したブロック領域と重なるブロック領域を削除する、処理をコンピュータに実行させるための画像処理プログラム。
(付記4)
前記解析パラメータとして前記ブロック領域をどの程度の細かさで認識するかを制御するための細密度パラメータを設定することを特徴とする付記1乃至3の何れか1項に記載の画像処理プログラム。
(付記5)
前記細密度パラメータとして、前記ブロック領域間の空白矩形領域の画素数を設定することを特徴とする付記4に記載の画像処理プログラム。
(付記6)
前記ブロック領域全体に含まれる前記指定した領域の比率と、予め設定された閾値とを比較して、前記第1のブロック領域、前記第2のブロック領域、及び前記第3のブロック領域の何れかに分類することを特徴とする付記1乃至5の何れか1項に記載の画像処理プログラム。
(付記7)
前記第3のブロック領域が図表を含むブロック領域である場合に、前記ブロック領域全体に含まれる前記指定した領域の比率に応じて前記第1のブロック領域又は前記第2のブロック領域に分類することを特徴とする付記1乃至6の何れか1項に記載の画像処理プログラム。
(付記8)
第2のブロック判定後に前記第3のブロック領域が存在する場合に、前記部分画像の領域を再指定させる要求を出力することを特徴とする付記1乃至7の何れか1項に記載の画像処理プログラム。
(付記9)
所定の画像から取得する部分画像の領域を指定し、
画像レイアウトを解析する解析パラメータに基づいて、前記所定の画像を1又は複数のブロック領域として認識し、前記認識した1又は複数のブロック領域と、前記指定した領域とを比較して、前記指定した領域に含まれる第1のブロック領域、前記指定した領域に含まれない第2のブロック領域、及び未確定領域である第3のブロック領域のうちの何れかに分類する第1のブロック判定を行い、
前記第3のブロック領域と判定されたブロック領域に対して、前記解析パラメータを変更し、前記ブロック領域を再認識した後に、前記第1のブロック領域又は前記第2のブロック領域に分類する第2のブロック判定を行い、
前記第1のブロック判定及び前記第2のブロック判定で得られる第1のブロック領域の集合に基づいて部分画像を生成する、処理を有することを特徴とする画像処理方法。
(付記10)
所定の画像から取得する部分画像の領域を指定する領域指定手段と、
画像レイアウトを解析する解析パラメータに基づいて、前記所定の画像を1又は複数のブロック領域として認識し、前記認識した1又は複数のブロック領域と、前記領域指定手段により得られる指定領域とを比較して、前記指定領域に含まれる第1のブロック領域、前記指定領域に含まれない第2のブロック領域、及び未確定領域である第3のブロック領域の何れかに分類するブロック領域判定手段と、
前記ブロック領域判定手段により得られる第1のブロック領域の集合に基づいて部分画像を生成する部分画像生成手段とを有し、
前記ブロック領域判定手段は、前記第3のブロック領域と判定されたブロック領域に対して、前記解析パラメータを変更し、前記ブロック領域を再認識した後に、前記第1のブロック領域又は前記第2のブロック領域に分類することを特徴とする画像処理装置。
10 画像処理装置
11 画像入力手段
12 領域指定手段
13,80,90 ブロック領域判定手段
13 部分画像生成手段
21 制御部
22 通信部
23 主制御部
24 補助記憶部
25 ドライブ装置
31 画像入力部
32 座標入力部
33 表示部
34 記録媒体
41 細密度パラメータ設定手段
42,81 繰り返し制御手段
43 ブロック領域分類手段
44 ブロック領域確定手段
45 繰り返し制御手段
50,62,70 全体画像
51,71 ユーザ指定領域
52,64,72 ブロック領域
60,63 画面
61,65 要求メッセージ
82 重なりブロック削除手段
91 図表ブロック領域分類手段

Claims (8)

  1. 所定の画像から取得する部分画像の領域を指定し、
    画像レイアウトを解析する解析パラメータに基づいて、前記所定の画像を1又は複数のブロック領域として認識し、前記認識した1又は複数のブロック領域と、前記指定した領域とを比較して、前記指定した領域に含まれる第1のブロック領域、前記指定した領域に含まれない第2のブロック領域、及び未確定領域である第3のブロック領域のうちの何れかに分類する第1のブロック判定を行い、
    前記第3のブロック領域と判定されたブロック領域に対して、前記解析パラメータを変更し、前記ブロック領域を再認識した後に、前記第1のブロック領域又は前記第2のブロック領域に分類する第2のブロック判定を行い、
    前記第1のブロック判定及び前記第2のブロック判定で得られる第1のブロック領域の集合に基づいて部分画像を生成する、処理をコンピュータに実行させるための画像処理プログラム。
  2. 前記第2のブロック判定は、所定の終了条件を満足するまで判定を繰り返すことを特徴とする請求項1に記載の画像処理プログラム。
  3. 所定の画像から取得する部分画像の領域を指定し、
    画像レイアウトを解析する解析パラメータを複数用いて、前記所定の画像を1又は複数のブロック領域として認識し、前記認識した1又は複数のブロック領域と、前記指定した領域とを比較して、前記指定した領域に含まれる第1のブロック領域、前記指定した領域に含まれない第2のブロック領域、及び未確定領域である第3のブロック領域のうちの何れかに分類するブロック判定を解析パラメータ毎に行い、
    前記解析パラメータ毎のブロック判定結果を用いて、前記第1のブロック領域、前記第2のブロック領域、及び前記第3のブロック領域を確定する際、既に前記第1のブロック領域又は前記第2のブロック領域に確定したブロック領域と重なるブロック領域を削除する、処理をコンピュータに実行させるための画像処理プログラム。
  4. 前記ブロック領域全体に含まれる前記指定した領域の比率と、予め設定された閾値とを比較して、前記第1のブロック領域、前記第2のブロック領域、及び前記第3のブロック領域の何れかに分類することを特徴とする請求項1乃至3の何れか1項に記載の画像処理プログラム。
  5. 前記第3のブロック領域が図表を含むブロック領域である場合に、前記ブロック領域全体に含まれる前記指定した領域の比率に応じて前記第1のブロック領域又は前記第2のブロック領域に分類することを特徴とする請求項1乃至4の何れか1項に記載の画像処理プログラム。
  6. 第2のブロック判定後に前記第3のブロック領域が存在する場合に、前記部分画像の領域を再指定させる要求を出力することを特徴とする請求項1乃至5の何れか1項に記載の画像処理プログラム。
  7. 所定の画像から取得する部分画像の領域を指定し、
    画像レイアウトを解析する解析パラメータに基づいて、前記所定の画像を1又は複数のブロック領域として認識し、前記認識した1又は複数のブロック領域と、前記指定した領域とを比較して、前記指定した領域に含まれる第1のブロック領域、前記指定した領域に含まれない第2のブロック領域、及び未確定領域である第3のブロック領域のうちの何れかに分類する第1のブロック判定を行い、
    前記第3のブロック領域と判定されたブロック領域に対して、前記解析パラメータを変更し、前記ブロック領域を再認識した後に、前記第1のブロック領域又は前記第2のブロック領域に分類する第2のブロック判定を行い、
    前記第1のブロック判定及び前記第2のブロック判定で得られる第1のブロック領域の集合に基づいて部分画像を生成する、処理を有することを特徴とする画像処理方法。
  8. 所定の画像から取得する部分画像の領域を指定する領域指定手段と、
    画像レイアウトを解析する解析パラメータに基づいて、前記所定の画像を1又は複数のブロック領域として認識し、前記認識した1又は複数のブロック領域と、前記領域指定手段により得られる指定領域とを比較して、前記指定領域に含まれる第1のブロック領域、前記指定領域に含まれない第2のブロック領域、及び未確定領域である第3のブロック領域の何れかに分類するブロック領域判定手段と、
    前記ブロック領域判定手段により得られる第1のブロック領域の集合に基づいて部分画像を生成する部分画像生成手段とを有し、
    前記ブロック領域判定手段は、前記第3のブロック領域と判定されたブロック領域に対して、前記解析パラメータを変更し、前記ブロック領域を再認識した後に、前記第1のブロック領域又は前記第2のブロック領域に分類することを特徴とする画像処理装置。
JP2012011396A 2012-01-23 2012-01-23 画像処理プログラム、画像処理方法、及び画像処理装置 Expired - Fee Related JP5794154B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012011396A JP5794154B2 (ja) 2012-01-23 2012-01-23 画像処理プログラム、画像処理方法、及び画像処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012011396A JP5794154B2 (ja) 2012-01-23 2012-01-23 画像処理プログラム、画像処理方法、及び画像処理装置

Publications (2)

Publication Number Publication Date
JP2013149210A JP2013149210A (ja) 2013-08-01
JP5794154B2 true JP5794154B2 (ja) 2015-10-14

Family

ID=49046622

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012011396A Expired - Fee Related JP5794154B2 (ja) 2012-01-23 2012-01-23 画像処理プログラム、画像処理方法、及び画像処理装置

Country Status (1)

Country Link
JP (1) JP5794154B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7318319B2 (ja) * 2019-05-31 2023-08-01 京セラドキュメントソリューションズ株式会社 情報処理装置及び画像形成装置
CN113538450B (zh) * 2020-04-21 2023-07-21 百度在线网络技术(北京)有限公司 用于生成图像的方法及装置
CN114827590B (zh) * 2022-06-22 2022-09-13 浙江力嘉电子科技有限公司 摄像头位置分布合理性分析方法、装置和电子设备

Also Published As

Publication number Publication date
JP2013149210A (ja) 2013-08-01

Similar Documents

Publication Publication Date Title
US7627176B2 (en) Apparatus, method, and computer program for analyzing document layout
KR101015663B1 (ko) 문자인식장치에서의 문자인식방법 및 그 장치
US9785864B2 (en) Image processing method, image processing apparatus, program, and recording medium
KR102399508B1 (ko) 레이아웃 분석 방법, 판독 보조 장치, 회로, 및 매체
JP5774558B2 (ja) 手書き文書処理装置、方法及びプログラム
CN109697414B (zh) 一种文本定位方法及装置
EP1017011A2 (en) Block selection of table features
US7796817B2 (en) Character recognition method, character recognition device, and computer product
JP6353893B2 (ja) 携帯端末装置のカメラにより撮影される紙面画像から記事をスクラップするための方法、プログラム、及び装置
CN106991422A (zh) 字符切割方法、装置及计算机可读存储介质和电子设备
JP5794154B2 (ja) 画像処理プログラム、画像処理方法、及び画像処理装置
JP4232679B2 (ja) 画像形成装置およびプログラム
US10452943B2 (en) Information processing apparatus, control method of information processing apparatus, and storage medium
JP5049922B2 (ja) 画像処理装置及び画像処理方法
JP5171421B2 (ja) 画像処理装置、画像処理方法、コンピュータプログラム
JP2013171309A (ja) 文字切り出し方法、およびこの方法を用いた文字認識装置およびプログラム
JP5182902B2 (ja) 文書イメージ出力装置
KR101336901B1 (ko) 화상 처리 장치, 화상 처리 방법 및 기록 매체
US9692936B2 (en) Image processing apparatus and image processing method for clipping, from a second image, an area at a position corresponding to designated position in a first image
JP2018055256A (ja) 情報処理装置、情報処理方法及びプログラム
JP2004080341A (ja) 画像処理装置、画像処理方法、プログラム、及び記録媒体
JP6030915B2 (ja) 画像再配置方法、画像再配置システム、および画像再配置プログラム
JP7031465B2 (ja) 情報処理装置及びプログラム
JP5612975B2 (ja) セリフデータ生成装置、セリフデータ生成方法、及びプログラム
JP2006072839A (ja) 画像処理方法、画像処理装置、画像処理プログラム及び記録媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140904

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20150710

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150714

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150727

R150 Certificate of patent or registration of utility model

Ref document number: 5794154

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees