JP6254002B2 - 変換処理装置、それを備えた情報処理装置、プログラム、及び記録媒体 - Google Patents
変換処理装置、それを備えた情報処理装置、プログラム、及び記録媒体 Download PDFInfo
- Publication number
- JP6254002B2 JP6254002B2 JP2014018751A JP2014018751A JP6254002B2 JP 6254002 B2 JP6254002 B2 JP 6254002B2 JP 2014018751 A JP2014018751 A JP 2014018751A JP 2014018751 A JP2014018751 A JP 2014018751A JP 6254002 B2 JP6254002 B2 JP 6254002B2
- Authority
- JP
- Japan
- Prior art keywords
- line
- row
- document
- image
- character string
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Character Input (AREA)
- Processing Or Creating Images (AREA)
- Document Processing Apparatus (AREA)
- Facsimile Image Signal Circuits (AREA)
Description
以下の説明では、本発明に係る変換処理装置が変換処理部として画像処理装置の一部を成し、また、その画像処理装置が画像形成装置の一部を成す形態を例示する。
図1は、実施の形態1に係る画像形成装置(情報処理装置)100の機能的構成を示すブロック図である。画像形成装置100は、コピー機能及びスキャナ機能等を有するデジタル複合機である。画像形成装置100は、画像処理装置1、画像入力装置2、画像出力装置3、及び送信装置4を備えている。
以下では、画像処理装置1の構成について、画像処理装置1における画像処理及びフォーマット変換処理を詳述しながら説明する。
K'=f(min(C,M,Y)) ・・・(1)
C'=C−αK' ・・・(2)
M'=M−αK' ・・・(3)
Y'=Y−αK' ・・・(4)
ここで、UCR率α(0<α<1)とは、CMYが重なっている部分をKに置き換えてCMYをどの程度削減するかを示すものである。式(1)は、CMYの各信号強度の内の最も小さい信号強度に応じてK信号が生成されることを示している。
図2は、変換処理部(変換処理装置)22の構成を示すブロック図である。変換処理部22は、行解析処理部(行解析手段)31と、行ブロック解析処理部(行ブロック解析手段)34と、レイアウト解析処理部(レイアウト解析手段)35と、再配置処理部(参照リスト生成手段)36と、を備える。以下では、文書を構成する個々の文字、図、表等を要素と呼ぶ。
<4−1.行解析処理部の構成>
行解析処理部31は、入力された文書画像データ(入力文書画像)から各要素画像を抽出し、文字(文字画像)から成る行(文字列行)と、図(図画像)又は表(表画像)から成る行(図表行)とに分類する。行解析処理部31は、文字列抽出処理部32及び図表抽出処理部33を備えて構成される。行解析処理部31は、更に、文書の横書き又は縦書きといった記述方向を示す文書第1方向を解析する。
文字列抽出処理部32は、入力画像データから個々の文字を検出し切り出し処理を行うと共に、文字が複数並べられて構成される文字列を抽出する処理を行う。個々の文字の検出手段は多数提案されており、例えば、特許文献2では、文書画像中の文字構成要素の領域、及び文字からなる文字列領域を検出する方法が提案されている。
図表抽出処理部33は、入力画像データから図(図領域)及び表(表領域)を検出し、切り出し処理を行うものである。図領域の検出手段は多数提案されており、例えば、特許文献3で挙げられる方法により図領域を特定することができる。特許文献3に記載の方法では、入力された画像の所定領域毎に画素値の出現頻度(即ち、ヒストグラム)を求めた場合に、図領域の一つである写真領域上の各画素では濃度変化が広範囲に及ぶヒストグラムが得られることを利用して、ヒストグラムのエントロピー(平均情報量)を算出し、エントロピーが高い領域を抽出することで精度よく写真領域を抽出することが可能となる。
行解析処理部31は、さらに、以上のようにして抽出された文字列行、もしくは図表行に対して、その行であることを識別する重複しない番号として行ID(Identification)を設定する。1つの行IDについて、その行IDを有する行が2つ以上存在しなければ、必ずしも文書の順序に従って行IDを割り振る必要は無い。行IDの設定方法として、行IDが「0」の場合を存在しない行であるとして無効行とし、例えば、各ページの文書画像において、読み取った原稿の左上を原点(0,0)とし、原点に対して、右方向をX座標、下方向をY座標となる座標系を採用し、行の範囲を表わす最も左上のY座標が小さい順に行IDを連番で割り振る方法が挙げられる。なお、Y座標が同じ行同士はX座標が小さい方の行を優先する。この方法を用いる場合、段組構成により必ずしも文書の読み順序通りに行IDが割り振られる訳ではないが、横書き文書であれば行が上にあるほど順序が先である可能性が高いため、比較的文書の順序を反映した行IDの割り振り方になると言える。行IDの設定方法はこれに限らず、自由に選択することができる。
行解析処理部31は、1ページの文書画像における全ての行について、文字列行か図表行かの分類が終わると、文字列の方向から、文書全体の方向を示す文書第1方向を決定する。文書第1方向は、横書きのとき水平となり、縦書きのとき垂直となる。文書第1方向は、取得した全ての文字列の持つ方向を分類し、その比率により決定する。文書第1方向を決定するための比率の算出方法の簡単な例として、単純に横書きもしくは縦書きの文字列の数をカウントして、その数の比率を算出する方法が挙げられる。この方法の場合、例えば横書きの行数と縦書きの行数を比較して、多い方の方向を文書第1方向として決定(設定)する。文書第1方向の決定は上記の方法に限らず様々な方法を採用することができる。
なお、個々の文字の切り出しにおいて、以下に示すような記号(約物)の統合処理を追加することができる。記号には、例えば行頭に来ることが禁止とされる(行頭禁則)ものや、行末に来ることが禁止とされる(行末禁則)ものがあり、図3に示すような文字がその一部として挙げられる。切り出した個々の文字を表示した際、行の折り返しによりこれらのルールが守られず可読性が低下する場合がある。そこで、行頭禁則の記号については、1つ前の文字と統合し、行末禁則の記号については、1つ後の文字と統合することで、単独で行頭もしくは行末に来ることがなくなる。
行解析処理部31が実行する処理の具体例として、図5に示す構造の文書画像(1ページ)に対して行解析処理を適用する場合について説明する。行解析処理部31は、図6に示すように、その行の要素を全て含んだ最小サイズの外接矩形の範囲を各行の領域として分離し、それぞれの行に、行IDを、外接矩形の左上の垂直座標(Y座標)位置の順で割り当てる。図6に示す文書画像では、行IDが105の行が図表の行であることを除いては、残りの行はいずれも横書きの文字列の行であり、縦書きの文字列の行は1つも含まれていない。そのため、行解析処理部31は、この文書画像における文書第1方向は水平方向であると決定する。
<5−1.行ブロック解析処理部の処理>
行ブロック解析処理部34は、行解析処理部31で分類された行を、行を少なくとも1つ以上有する行ブロックに統合する処理を行う。行ブロック解析処理部34は、行解析処理部31で分類された文字列行を、少なくとも1つ以上の文字列行から成る文字列の行ブロックに統合し、重複しない行ブロックIDを持つ新規行ブロックとして記憶部5に記憶(登録)する。図表行については、単一行で1つの行ブロックを構成するものとし、それぞれ重複しない行ブロックIDを持つ新規行ブロックとして登録する。
注目行L1とは別に選択された文字列行L2が、注目行L1の連続行の候補であるか否かを判定する方法について説明する。行L2が行L1の連続行の候補である条件として、少なくとも下記2つの条件を満たすものとする。
条件1:一方の行の先頭から末尾までの範囲において、もう一方の行の先頭もしくは末尾のうち少なくとも一方が存在する。
条件2:2つの行の行間変位量linespace(L1,L2)が下記の式(5)を満たす。
TH_MIN_LS≦linespace(L1,L2)≦TH_MAX_LS ・・・(5)
(TH_MIN_LS、TH_MAX_LSは、予め設定される閾値)
なお、条件1は、異なる段に属する行を連続行の候補として判定しないために用いる。条件2は、行間が広過ぎる又は狭過ぎる行を連続行の候補として判定しないために用いる。
また、連続行の候補を判定する条件を強化するために、上記条件1,2に加えて、別の条件を設定してもよい。例えば、次式(6)を満たすことを条件として追加することができる。
indent(L1,L2)≦TH_INDENT ・・・(6)
ここで、indent(L1,L2)は行L1の開始位置の文書第1方向成分と行L2の開始位置の文書第1方向成分の差の大きさであり、すなわちインデントの大きさを意味する。また、閾値TH_INDENTは行の先頭のインデントとして許容される距離を示す所定係数である。閾値TH_INDENTは、例えば行L1の文字サイズに所定係数α(αは正の数とする、例えばα=1.5等)を乗算した値を与え、α文字以内のインデントを許容することができる。閾値TH_INDENTは他の方法により設定してもよく、例えば行L1と行L2の文字サイズの平均値に所定係数αを乗算したものとしてもよい。
連続行の候補を判定する条件を強化する他の条件として、例えば次式(7)を満たすことを条件として追加することで、行の終了位置がある程度近い行同士を連続行の候補とすることができる。
|L1MAX1−L2MAX1|≦TH_DIFF_ENDPOS ・・・(7)
ここで、L1MAX1は行L1の文書第1方向成分の最大値、L2MAX1は行L2の文書第1方向成分の最大値である。例えば、文書第1方向が水平方向(横書き)である場合、L1MAX1及びL2MAX1は、行L1及び行L2の右端のX座標を指す。また、閾値TH_DIFF_ENDPOSは行の終了位置の差として許容される距離を示す所定係数である。例えば行L1の文字サイズの平均値に所定係数β(βは正の数とする、例えばβ=0.5等)を乗算したものを閾値TH_DIFF_ENDPOSとすることで、β文字以内のインデントを許容することになる。
行L1の連続行の候補として抽出された行から、行L1の前方で最も近い位置にある行、及び、後方で最も近い位置にある行を、それぞれ最大1つずつ選択する。なお、文書第1方向が水平方向(横書き)である場合、行L1より上にある行を前方の行、行L1より下にある行を後方の行とし、文書第1方向が垂直方向(縦書き)である場合、行L1より右にある行を前方の行、行L1より左にある行を後方の行とする。また、行の近さを表わす値として、例えば、前述の行間変位量linespace(L1,L2)を使用し、linespace(L1,L2)が小さい程、行が近いとみなすことができる。なお前方、後方とも、連続行は最大で1つずつであり、必ずしも連続行が存在する必要はない。
以上のようにして、全ての文字列行について前方及び後方の連続行を選択すると、行ブロックへの分類、統合を行う。但し、複数の行から連続行として選択されるケースもあり得るため、相互に連続行であるとされていない行のペアについては、その間の連続関係を事前に解消しておく。例えば、文書画像が図9の(a)である場合、前方の連続行として行L3を選択する行は、行L4と行L5との2つ存在するが、行L5は行L3の後方の連続行として選択されていない。そのため、行L3と行L5との間の連続関係は解消される。同様にして行L4と行L6との間の連続関係も解消される。このことにより、図9の(a)に示すような例では、行L3及び行L4において注目行L1からの連続関係が断たれるため、注目行L1と同一の行ブロックとして分類できなくなるケースも起こり得る。しかし、図9の(b)に示すように複数の行ブロックとして分類することができ、後段のレイアウト解析処理部35における段組解析処理部37で、同一の段組、及びその段組を構成する同一の段(カラム)として統合できるため、この時点でブロックが分かれてしまっても、問題とはならない。
なお、文書第1方向の文字列行は文書第1方向の文字列行とのみ、文書第2方向の文字列行は文書第2方向の文字列行とのみ、行ブロックを構成する。すなわち、1つの行ブロックに、文書第1方向の文字列行と文書第2方向の文字列行とが混在することは無い。従って、注目行L1の連続行の候補を探索する際、注目行L1の文字列方向と異なる方向の文字列行は連続行の候補としない。
行ブロック解析処理部34が実行する行ブロック解析処理を、具体例を用いて説明する。既に示した図6のように文書画像から検出された複数の行に対して行ブロック解析処理を適用すると、文書画像は、図10のように行ブロックとして分類される。図10に示す例では、行ブロックB3は、章の見出しの行であり、行ブロックB4に比べて文字が大きい。このように文字のサイズが大きく異なる2つの行同士を連続行の候補として選択しないような、連続行の候補の判定の条件を追加することも有効な手段である。
<6−1.レイアウト解析処理部の構成>
図11は、レイアウト解析処理部35の詳細構成を示すブロック図である。レイアウト解析処理部35は、前段の行ブロック解析処理部34で分類された行ブロック同士の上下左右の位置関係から、行ブロック構成を解析し、文書画像中の文章(本文)の読み順を推定する処理を行うものであり、段組解析処理部37、行順序付け処理部38、段落解析処理部(段落解析手段)39を備えて構成される。
段組解析処理部37は、複数の行ブロックの上下及び左右の位置関係から、段組及び段組を構成する各段(カラム)を分類する段組解析処理を実行する。文書は文書第2方向に段組が配置され、各段組構成内で文書第1方向にカラムが配置されているものとして、ページ内の行ブロックの集合を、適切に境界線を設定して行ブロックをまたぐことなく分割して初期段組とする。そして、同一の初期段組に含まれる行ブロックの集合を、適切に境界線を設定して行ブロックをまたぐことなく分割して、該初期段組を構成する初期カラムとする。
本来は同一段組であるが、偶然、行ブロックを分割することができるために複数の段組に分かれてしまうようなケースもまれに存在する。こうしたケースに対応するため、例えば連続する2つの行ブロック間の距離を算出し、その距離が所定値(例えば行ブロックの平均行間距離の2倍)以下の2つのブロック間には境界線を引くことを禁止する条件を追加することができる。図13は、行ブロックB10,B11,B12を左側のカラム、行ブロックB20,B21を右側のカラムとした2段組構成の例を示す。行ブロックB10と行ブロックB11との間、行ブロックB20と行ブロックB21との間が空いているため、行ブロックB10と行ブロックB20から成る2段組構成、及び、行ブロックB11とB12と行ブロックB21とから成る2段組構成として分割してしまう恐れもある。しかし、行ブロックB20の平均行間距離(20)に対して、行ブロックB20と行ブロックB21とのブロック間距離(30)が所定値(20×2=40)以下であるとして、行ブロックB20と行ブロックB21との間に境界線を引くことを禁止することで、これらの行ブロックが2つの異なる段組に分かれることを防ぐことができる。
また、行ブロックの位置関係に加えて、行ブロックが持つ各種情報を利用して、段組及びカラムの分類(すなわち境界線の設定)を行うことができる。行ブロックが持つ各種情報の例として、行の長さや主要な文字のサイズ等が挙げられる。隣り合う行ブロック同士でこれらの情報が大きく異なる場合は同一の段組に分類することを避けるようにすることができるし、逆に位置が大きく離れた行ブロック同士でも、例えば同じカラム境界線を共有することができ、かつ類似する情報を持つ場合、同一段組として分類してもよい。
なお、段組解析処理部37に入力されたページ画像が、ただ1つの行ブロックを持つ場合、そのページ画像は1段構成の文書であるとして、境界線の設定は行わない。また、該ページ画像が、1つも行ブロックを持たない場合(すなわち白紙ページの場合)も境界線の設定は行わない。
段組解析処理部37が実行する処理の具体例として、例えば既に示した図10に示す文書画像から検出された複数の行ブロックに対して段組解析処理を適用する場合について説明する。段組解析処理部37は、図10に示す文書画像を、図14に示す段組及びカラム(淡いグレー地)に分類する。カラムC1及びカラムC2は、それぞれ1段構成の段組G1及び段組G2を成し、カラムC3及びカラムC4は2段組構成の段組G3における左右のカラムを成している。なお、図14では、行(文字列行及び図表行)を直線、行ブロックを点線、カラムを一点鎖線で囲んでいる。
行順序付け処理部38は、段組、カラム、行ブロック、及び行の位置関係から文書全体における行の順序を解析し、行順序リストを生成する処理を、以下の(1)〜(9)に従って行う。
(1)同じ行ブロックに属する行同士については、横書き文書であれば上から下、縦書き文書であれば右から左の順に優先順位を設定する。ここでは、上記のように既に、行ブロックに分類する際に、その行ブロックに含まれる行についての順序の情報も取得しているため、この情報を利用する。
(2)同じカラムに属する行ブロック同士については、横書き文書であれば上から下、縦書き文書であれば右から左の順に優先順位を設定する。
(3)連続する2つの行ブロック間では、優先順位の高い方の行ブロックの末尾の行の次に、優先順位の低い方の行ブロックの先頭の行が優先されるように設定する。
(4)同じ段組に属するカラム同士については、横書き文書であれば左から右、縦書き文書であれば上から下の順に優先順位を設定する。
(5)連続する2つのカラム間では、優先順位の高い方のカラムの末尾の行ブロックの次に、優先順位の低い方のカラムの先頭の行ブロックが優先されるように設定する。
(6)同じページに属する段組については、横書き文書であれば上から下、縦書き文書であれば右から左の順に優先順位を設定する。
(7)連続する2つの段組間では、優先順位の高い方の段組の末尾のカラムの次に、優先順位の低い方の段組の先頭のカラムが優先されるように設定する。
(8)同じ文書画像ファイルに属するページ同士については、ページ番号の小さい順に優先順位が高くなるよう設定する。
(9)連続する2つのページ間では、優先順位の高いページの末尾の段組の次に、優先順位の低い方のページの先頭の段組が優先されるように設定する。
行順序リストは、下記の規定(a)〜(c)に従う形式であれば特に構造は問わない。
(a)上記順序付けルールに従って決定された順序通りに行を呼び出すことができる。
(b)呼び出した行について、その座標情報や種類(文字列行か図表行か)等の各種情報を参照することができる。
(c)呼び出した行について、段落情報(後述)を格納することができる。
行順序付け処理部38が、上記の規定に従って、図14の構成の文書画像について行順序リストを生成した例を、図15に示す。行順序リストは、決定された順序の先頭から順に、行のIDと、行の情報として、所属する行ブロックID、行の種別(文字列行であるか図表行であるか)、及び行の範囲を示す外接矩形の左上座標及び右下座標、の情報とを格納し、さらに行毎に段落情報を格納している。なお、図15の例では、改行が発生するときに、その行から新たな段落が始まるとして、段落情報を改行の有無を有る(Yes)か無し(No)かの2通りで示しており、事前に「No」で初期化している。図16のように行ブロックの情報やカラムの情報、段組の情報を別途作成し、相互参照により各行及び各行ブロックが所属するカラム、段組、ページを参照できるようにしておくことで、冗長の少ない行順序リストを構成することができる。もちろん、行順序リスト単独で各行に関する情報を全て抽出できるようにしてもよい。
段落解析処理部39は、各行の前後の位置関係等の情報から、その行の位置で改行が発生しているかどうかを判定し、文書画像中の各行を1つ以上の段落に分類する処理を行う。具体的には、行順序リストから複数の行を参照して段落の切れ目、すなわち改行位置を判定し(改行判定処理)、段落毎に行の順序を記述した文書構造ツリーを生成する(文書構造ツリー生成処理)。
図18は、段落解析処理部39における、改行判定処理の概要を示すイメージ図である。改行判定処理は、判定の対象となる注目行と、注目行より前に順序づけられるM個の行と、注目行より後に順序づけられるN個の行と、のM+N+1個の行によって判定される。なお、図18に示す例では、M=N=2としている。なお、改行判定の対象となる行、及びその前後の行は、いずれも文字列行である。本実施の形態では、M+N+1個の行IDバッファL[0],L[1]・・・,L[M+N]を記憶部5に備え、行順序リストで参照されるM+N+1個の行IDをそれぞれ格納することで、注目行と、注目行の前後の行との比較を行う。
(1)行順序リストにおいて、第LNOW番目から順に、文字列行を探索する。
(2)最初に見つかった文字列行の行IDを行IDバッファL[k]に格納し、そのときの行順序リストの位置(リスト番号)に1を加えた番号を新たなリスト参照番号LNOWとして更新する。
(3)文字列行が見つからないまま行順序リストの末尾まで探索が終了した場合、行IDバッファL[k]には無効行(0)を格納する。
段落解析処理部39による文書構造ツリー生成処理は、段落情報を考慮した行順序リストに格納された段落情報に従って実行される。但し、文書構造ツリーは事前に、図21に示すような1つの空の段落(第0段落)を持つ状態に初期化されているものとする。初期段落番号をPNOW=0として、行順序リストの先頭から順に行の情報を参照し、段落情報から該行が段落開始行と判定された場合(段落情報がYES)のみ、PNOW=PNOW+1として段落番号の更新を行い、また文書構造ツリーに空の段落(第PNOW段落)を新たに追加する。そして、該行が文字列行である場合、文書構造ツリーの第PNOW段落が持つ文字列ツリーの末尾に該行の行IDを追加する。一方、該行が図表行である場合、文書構造ツリーの第PNOW段落が持つ図表ツリーの末尾に該行の行IDを追加する。これを行順序リストの各行について反復し、末尾まで探索が終了すると、文書構造ツリーの生成処理を終了する。なお、文字列行の改行位置から次の改行位置までが1つの段落となるので、図表行が段落の分類から漏れるということはない。そのため、ひと固まりの文字列行の後に図表行があり、その後新しい段落が始まる(改行が発生する)場合は、その図表行は1つ前の段落に含まれることになる。
段落解析処理部39が実行する処理の具体例として、図6の構成の文書画像(図15に示す初期の行順序リストを持つ)に段落解析処理部39での処理を適用する場合について説明する。見出しに当たる行ID:101、行ID104、行ID:129の各行は、行の文字サイズや1つ前の行間距離等の条件から、改行位置と判定される。また行ID:106、行ID:112、行ID:119及び行ID:131の各行は、前後の複数の行に比べ、行の開始位置が文書第1方向において正方向にシフトしている、よってインデントが存在するとして、改行位置と判定される。行ID:102の行も、見出し行の行ID:101の次の行であることから、改行位置と判定することができる。従って、行ID:101、102、104、106、112、129、131、119の各行が改行位置として設定され、行順序リストの段落情報は、図22のように更新される。
<7−1.再配置処理部の処理>
再配置処理部36は、レイアウト解析処理部35で定義した順序に従って行を呼び出す。そして、呼び出した行が文字列行である場合は対応する文字列行の先頭から順に文字を呼び出し、呼び出した行が図表行である場合は対応する図又は表を呼び出して、各要素の参照情報(要素を呼び出すための情報)を順に記述する。更に、要素が改行位置が含まれる行の末尾の要素である場合は、改行命令を挿入して参照リストを生成する処理を行う。つまり、参照リストは、文字列行及び図表行の順序付けに従って、文書画像に含まれる各要素の順序が、文字列中の文字においては文書第1方向に沿って、記述されている。
ここで、参照リストは、HTMLに代表されるようなマークアップ言語形式で記述することができる。以下では、HTMLファイルとして記述する場合を例として、再配置処理部36の詳細について説明する。
段落開始宣言命令の例として、例えば、段落タグ<p>を挿入する方法が挙げられる。この場合、段落終了宣言命令は必ず段落タグ</p>を挿入する方法とする。また、別の方法として、段落開始宣言命令は特に何も行わず、段落終了宣言命令として改行タグ<br>を挿入する方法も挙げられる。要素の参照命令は、例えば、出力ファイルに画像表示タグ<img>を挿入して、該要素の切り取り画像ファイルのパスを指定して表示させる方法が挙げられる。また、図表要素の参照命令は文字要素の参照命令と同様としてもよいし、図表要素の場合のみ、改行タグ<br>や表タグ<table>及び</table>等の挿入処理と組み合わせることで、より視認性の高いレイアウトを構成することができる。
上記では、各段落において図表を本文の後に配置する場合の処理手順について説明した。反対に、図表を本文の前に配置したい場合は、図27において、S22とS23とを入れ替えることで容易に実現できる。また、図表を、段落の末尾に配置、段落の先頭に配置、もしくは図表を表示しない(文字列のみ表示する)等の複数のモードから操作パネル6を通じてユーザが指定できるようにしてもよい。
上記命令のほか、スタイルシートを組み込むことで、文書のファイル書式を変更しても構わない。スタイルシートは、HTML言語等で構造化された文書の見栄え、表示形式を効率的に制御する公知の手段である。これらの見栄え等の情報を「スタイル」と呼ぶ。スタイルシートは専用のコンピュータ言語で実現され、その例として、CSS(Cascading Style Sheet)等が挙げられる。また、スタイルシートを定義する場所は大きく分けて3つある。それは、ヘッダ要素内(<head>〜</head>間)にスタイル要素(<style>〜</style>)を追加してスタイルを記述する方法、スタイルを記述した外部ファイルを用意して、参照リストのヘッダ要素内で前記外部ファイルを呼び出す方法、及び本文部分(<body>〜</body>間)における各種タグにおいて、そのタグにのみ有効となるスタイルを記述する方法、である。これらの方法はただ1つに選択されるものではなく、複数の方法を組み合わせてスタイルシートを定義することもできる。本実施の形態では、公知の方法を利用するものとして以下では詳述をせず、簡単な記述例の紹介にとどめる。
また、操作パネルでこれらのスタイルを選択して指定できるようにしてもよい。例えば、文書画像データから決定した文書第1方向とは別に、再配置する際の文書の方向を、操作パネルを通じてユーザが指定できるようにしてもよい。具体的には、HTML言語形式のフォーマットにおいてCSS形式によりhtml{ writing−mode: tb−rl;}とスタイルシートを定義することで、本文全体の文書の行方向を上から下、更に行が右から始まり左に進む、すなわち縦書き表記が可能となる。従って、縦書きでのリフロー表示が選択された場合に、前記のようなスタイルシートの定義を追加するようにすることで、縦書き表示を実現できるようになる。なお、縦書き表記の実現方法は前記の方法以外の方法をとることができる。また、出力時の文書の方向として「自動モード」を準備し、行解析処理部31で得られた文書第1方向と同じ方向で出力するように自動的に選択するようにすることもできる。
本実施の形態の再配置処理部36においては、入力された文書画像からHTMLファイルを出力する場合について述べたが、出力するファイルはHTMLファイルに限らず、リフロー型表示を実現するあらゆるファイル形式(例えば、XMLファイル、XMDFファイル等)として出力することができる。
<8−2.表示装置での参照リストの使用>
前記生成された参照リスト及び切り出した各要素の画像データは、本実施形態の画像形成装置100が備える送信装置4から送信され、受信側の装置である表示装置(例えば、スマートフォンやタブレット等であってもよい)が備える閲覧プログラム(ビューア)を通じて閲覧することができる。参照リストが取るファイル形式によって最適な閲覧プログラムは異なり、例えば、参照リストとしてHTMLファイルの形式をとる場合、Internet Explorer(登録商標)等、良く知られたウェブブラウザを用いて開くことで、容易にリフロー型の表示を実現することが可能となる。
<img class=”fig” src=”〜〜”width=”90%”/> ・・・(8)
もしくはCSS形式でfigクラスのスタイルシートとして下記を追加する。
.fig{width:90%;} ・・・(9)
等の方法がある。上記(8)又は(9)の方法はいずれも、表示幅に対して90%のサイズが図又は表の幅として設定され、表示領域が変更された際には自動で変更後の表示幅の90%を図又は表の幅として再設定する。(8)は、上記のサイズ属性の設定を追加したimgタグのみに適用される、すなわち個別に適用されるのに対し、(9)は、figクラスを割り当てた図表を一括で設定する点で異なる。もちろん、上記以外の公知の方法を利用することも可能である。
上記(7−1)、(7−3)では、段落の最後又は最初に図表を表示する方法を開示したが、それらとは別に、図表を本文と同じファイル上に混在して表示せずに、画像へのリンク一覧(先頭の段落から順に図表を並べる)を別途作成し、そのリンク一覧からユーザが所望したときに選択した画像を個別に表示できるようにしてもよい。
実施の形態1では、本発明に係る変換処理装置を画像形成装置が有する画像処理装置に適用した構成について説明したが、これに限るものではない。そこで、本実施の形態では、本発明に係る変換処理装置を変換処理部として、フラットベッドスキャナ等の画像読取装置が有する画像処理装置に適用した例について説明する。
上記では、本発明に係る変換処理装置を、画像形成装置100あるいは画像読取装置200が有する画像処理装置1、1aに適用する例を示したが、これに限るものではない。本発明に係る変換処理装置を、例えばサーバ装置に適用してもよい。この場合のサーバ装置の構成の一例は、画像形成装置あるいは画像読取装置により画像読取及び各種画像処理が施された文書画像をネットワークを介して受信する受信装置と、実施の形態1にて説明した変換処理部22での処理を実行する変換処理装置と、当該変換処理装置から出力されたファイル(文書画像及び参照リスト)をネットワークを介して送信する送信装置と、を備えたサーバ装置(情報処理装置)である。
上記で説明した画像処理装置1,1a,1b(特に、変換処理部22,22a)やサーバ装置(特に、変換処理装置)は、集積回路(ICチップ)等に形成された論理回路(ハードウェア)によって実現してもよいし、CPU(Central Processing Unit)を用いてソフトウェアによって実現してもよい。
本発明の態様1に係る変換処理装置(変換処理部22)は、文書を画像化した文書画像の再構成を行う変換処理装置において、前記文書画像から文字、図、及び表をそれぞれ抽出し、前記文書画像における各行を文字から成る文字列行と図又は表から成る図表行とに分類し、かつ、前記文書画像における文書の記述方向を決定する行解析手段(行解析処理部31)と、前記文書のレイアウトに基づき、前記文字列行及び図表行の順序付けを行うレイアウト解析手段(レイアウト解析処理部35)と、前記文字列行及び図表行の順序付けと前記記述方向とに従って、前記文書画像に含まれる各文字、図、及び/又は表の順序を記述した参照リストを生成する参照リスト生成手段(再配置処理部36)と、を備える。
4 送信装置
22,22a 変換処理部(変換処理装置)
31 行解析処理部(行解析手段)
32 文字列抽出処理部
33 図表抽出処理部
34 行ブロック解析処理部(行ブロック解析手段)
35 レイアウト解析処理部(レイアウト解析手段)
36 再配置処理部(参照リスト生成手段)
37 段組解析処理部
38 順序付け処理部
39 段落解析処理部(段落解析手段)
100 画像形成装置(情報処理装置)
200 画像読取装置(情報処理装置)
300 画像形成装置(情報処理装置)
Claims (10)
- 文書を画像化した文書画像の再構成を行う変換処理装置において、
前記文書画像から文字、図、及び表をそれぞれ抽出し、前記文書画像における各行を文字から成る文字列行と図又は表から成る図表行とに分類し、かつ、前記文書画像における文書の記述方向を決定する行解析手段と、
前記文書のレイアウトに基づき、前記文字列行及び図表行の順序付けを行うレイアウト解析手段と、
前記文字列行及び図表行の順序付けと前記記述方向とに従って、前記文書画像に含まれる各文字、図、及び/又は表の順序を記述した参照リストを生成する参照リスト生成手段と、を備え、
さらに、前記文字列行について、行の配置に基づいて連続する行同士を統合した行ブロックを生成し、前記図表行について、単一行で構成される行ブロックを生成することで、前記文字列行及び図表行を当該行ブロックに分類する行ブロック解析手段を備え、
前記レイアウト解析手段は、前記行ブロックの配置に基づいて、前記行ブロックを段組及び当該段組を構成するカラムに分類し、前記段組、カラム、行ブロック、文字列行及び図表行の配置を基に、前記文書全体における前記文字列行及び図表行の順序付けを行うと共に、前記文字列行の繋がりに基づいて前記文字列行及び図表行を段落に分類し、段落毎に前記文字列行及び図表行の順序付けを行い、
前記参照リスト生成手段は、前記段落毎の前記文字列行及び図表行の順序付けと前記記述方向とに従って、前記参照リストを生成することを特徴とする変換処理装置。 - 前記レイアウト解析手段は、前記段落毎に、前記文字列行と前記図表行とを分けて順序付けを行うことを特徴とする請求項1に記載の変換処理装置。
- 前記レイアウト解析手段は、前記文字列行より、注目行とその前後に隣接する文字列行である隣接行とを抽出し、前記注目行及び前記隣接行の位置関係に基づいて、前記注目行と当該注目行の前の隣接行との間で改行されているか否かを判定し、改行されている場合には、前記注目行を段落開始行に設定する段落解析手段を備える、ことを特徴とする請求項2に記載の変換処理装置。
- 前記参照リスト生成手段は、前記参照リストとして、前記文書画像をリフロー型表示が可能なファイル形式に変換したものを生成することを特徴とする請求項1から3のいずれか1項に記載の変換処理装置。
- 前記行解析手段は、前記文書画像から個々の文字を抽出する際、行頭に配置されることが禁止された記号を、前記記述方向における1つ前の文字と統合した状態、かつ、行末に配置されることが禁止された記号を、前記記述方向における1つ後の文字に統合した状態で抽出することを特徴とする請求項1から4のいずれか1項に記載の変換処理装置。
- 前記行解析手段は、前記文書画像が複数ページから構成されていると、当該複数ページの文書画像から分類される文字列行の少なくとも一部を用いて前記記述方向を決定し、当該決定した記述方向を前記複数ページに対して設定することを特徴とする請求項1から5のいずれか1項に記載の変換処理装置。
- 前記行ブロック解析手段は、前記文書画像に前記記述方向と直交する方向の文字列行が存在する場合は、当該直交する方向の文字列行の行ブロックを図表行の行ブロックに置き換えることを特徴とする請求項1に記載の変換処理装置。
- 請求項1から7の何れか1項に記載の変換処理装置と、
上記生成された参照リストを送信する送信装置と、を備えることを特徴とする情報処理装置。 - 請求項1から7のいずれか1項に記載の変換処理装置を動作させるためのプログラムであって、コンピュータを上記の各手段として機能させるためのプログラム。
- 請求項9に記載のプログラムを記録したコンピュータ読み取り可能な記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014018751A JP6254002B2 (ja) | 2014-02-03 | 2014-02-03 | 変換処理装置、それを備えた情報処理装置、プログラム、及び記録媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014018751A JP6254002B2 (ja) | 2014-02-03 | 2014-02-03 | 変換処理装置、それを備えた情報処理装置、プログラム、及び記録媒体 |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2015146122A JP2015146122A (ja) | 2015-08-13 |
JP6254002B2 true JP6254002B2 (ja) | 2017-12-27 |
Family
ID=53890319
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014018751A Active JP6254002B2 (ja) | 2014-02-03 | 2014-02-03 | 変換処理装置、それを備えた情報処理装置、プログラム、及び記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP6254002B2 (ja) |
Families Citing this family (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP6598600B2 (ja) * | 2015-09-03 | 2019-10-30 | コニカミノルタ株式会社 | 文書生成システム、文書サーバ、端末装置、文書生成方法、およびコンピュータプログラム |
JP7003457B2 (ja) * | 2017-06-26 | 2022-01-20 | コニカミノルタ株式会社 | 文書再構成装置 |
JP2019016236A (ja) * | 2017-07-07 | 2019-01-31 | インターマン株式会社 | 文字列画像表示方法 |
US10579707B2 (en) * | 2017-12-29 | 2020-03-03 | Konica Minolta Laboratory U.S.A., Inc. | Method for inferring blocks of text in electronic documents |
JP2019128758A (ja) | 2018-01-24 | 2019-08-01 | セイコーエプソン株式会社 | 頭部装着型表示装置、及び頭部装着型表示装置の制御方法 |
CN109934209B (zh) | 2019-05-17 | 2019-07-30 | 上海肇观电子科技有限公司 | 版面分析方法、阅读辅助设备、电路及介质 |
JP7041103B2 (ja) | 2019-08-28 | 2022-03-23 | 西日本電信電話株式会社 | 構造化文書作成装置とその方法 |
CN113836971B (zh) * | 2020-06-23 | 2023-12-29 | 中国人寿资产管理有限公司 | 一种图像型扫描件识别后的视觉信息重现方法、系统及存储介质 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3255675B2 (ja) * | 1991-11-30 | 2002-02-12 | 株式会社リコー | 画像再配置機能付きデジタル複写機 |
JPH06236372A (ja) * | 1993-02-10 | 1994-08-23 | Matsushita Electric Ind Co Ltd | 文字表示装置 |
JP2010072850A (ja) * | 2008-09-17 | 2010-04-02 | Konica Minolta Business Technologies Inc | 画像処理装置 |
JP5298997B2 (ja) * | 2009-03-18 | 2013-09-25 | 株式会社リコー | 文書画像編集装置、文書画像編集方法、文書画像編集プログラム、及びその方法をコンピュータに実行させるプログラムを記憶したコンピュータ読み取り可能な記録媒体 |
JP2012230623A (ja) * | 2011-04-27 | 2012-11-22 | Fujifilm Corp | 文書ファイル表示装置、方法およびプログラム |
-
2014
- 2014-02-03 JP JP2014018751A patent/JP6254002B2/ja active Active
Also Published As
Publication number | Publication date |
---|---|
JP2015146122A (ja) | 2015-08-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6254002B2 (ja) | 変換処理装置、それを備えた情報処理装置、プログラム、及び記録媒体 | |
JP6559415B2 (ja) | 文書画像処理装置、それを備えた情報処理装置、プログラム、及び記録媒体 | |
CN102469234B (zh) | 图像处理装置、图像读取装置、图像形成装置和图像处理方法 | |
JP4772888B2 (ja) | 画像処理装置、画像形成装置、画像処理方法、プログラムおよびその記録媒体 | |
JP4371965B2 (ja) | 画像処理装置、画像処理方法 | |
US7692834B2 (en) | Image processing system, image forming apparatus, control method for the same, and program for implementing the control method | |
US8203748B2 (en) | Image processing apparatus, control method therefor, and program | |
JP5972578B2 (ja) | 画像処理装置、画像形成装置、プログラム、記録媒体 | |
US20110047505A1 (en) | Object based adaptive document resizing | |
US20060215910A1 (en) | Image processing apparatus and method thereof | |
US20120011429A1 (en) | Image processing apparatus and image processing method | |
WO2014045788A1 (ja) | 画像処理装置、画像形成装置、および記録媒体 | |
JP5477320B2 (ja) | 画像処理装置 | |
US20220319215A1 (en) | Image processing method, device, electronic apparatus, and storage medium | |
JP2012118863A (ja) | 画像読取装置、画像形成装置、画像読取方法、プログラムおよびその記録媒体 | |
JP6607490B2 (ja) | 変換処理装置、それを備えた情報処理装置、プログラム、及び記録媒体 | |
JP4213112B2 (ja) | 画像検索装置、画像形成装置、画像検索装置の制御方法、画像検索プログラムおよびコンピュータ読取り可能な記録媒体 | |
US7738737B2 (en) | Image processing apparatus and image processing method | |
US20090154763A1 (en) | Image processing method for generating easily readable image | |
JP6607496B2 (ja) | 変換処理装置、それを備えた情報処理装置、プログラム、及び記録媒体 | |
JP4926589B2 (ja) | 画像合成装置、画像合成方法、およびプログラム | |
JP5132347B2 (ja) | 画像処理システム | |
JP6051675B2 (ja) | 画像処理装置、画像処理方法、プログラムおよび記録媒体 | |
JP4710672B2 (ja) | 文字色判別装置、文字色判別方法、およびコンピュータプログラム | |
US20080043269A1 (en) | Method and apparatus for processing image containing picture and characters |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20160923 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20170731 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20170822 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20171012 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20171107 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20171129 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 6254002 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |