JP2013239187A - 編集装置、編集方法、及びプログラム - Google Patents

編集装置、編集方法、及びプログラム Download PDF

Info

Publication number
JP2013239187A
JP2013239187A JP2013130043A JP2013130043A JP2013239187A JP 2013239187 A JP2013239187 A JP 2013239187A JP 2013130043 A JP2013130043 A JP 2013130043A JP 2013130043 A JP2013130043 A JP 2013130043A JP 2013239187 A JP2013239187 A JP 2013239187A
Authority
JP
Japan
Prior art keywords
document
elements
document element
image
unit
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2013130043A
Other languages
English (en)
Other versions
JP5652509B2 (ja
Inventor
Satoshi Nakamura
聡史 中村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2013130043A priority Critical patent/JP5652509B2/ja
Publication of JP2013239187A publication Critical patent/JP2013239187A/ja
Application granted granted Critical
Publication of JP5652509B2 publication Critical patent/JP5652509B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Processing Or Creating Images (AREA)
  • Document Processing Apparatus (AREA)
  • Editing Of Facsimile Originals (AREA)

Abstract

【課題】文書画像を構造化して文書要素の場所情報を取得し、場所情報を参照して文書要素を配置することで文書画像を表示し、利用者による文書要素の選択指示と削除指示を受け付けた文書画像に対して、その後の文書要素の再配置を行う。
【解決手段】文書画像を、文書を構成する文書要素に分解して構造化データとして構造化する構造化部102と、構造化データを格納する構造化データ格納部103と、文書要素を文書画像と同じレイアウトに配置し、レイアウトされた文書要素をプレビュー表示するプレビュー表示部104と、プレビュー表示された文書要素の中から利用者による文書要素の選択及び、選択された文書要素の利用者による編集を受け付ける編集部105と、文書要素の編集を受け付けた場合に、文書要素を再配置する文書要素再配置部106と、を備える。
【選択図】図1

Description

本発明は、文書画像の内容を編集する文書画像編集装置、文書画像編集方法、文書画像編集プログラム、及びその方法をコンピュータに実行させるプログラムを記憶したコンピュータ読み取り可能な記録媒体に関わる。
従来、電子文書にある文書要素の削除や移動の編集作業を実行すると、アプリケーションが自動的に各文書要素の位置を整形する機能を提供する。これは、電子文書の文書要素の場所情報と、その場所に存在する文書内容と、が分離されて管理されているためである。
しかし、文書画像の場合、電子文書と異なり、文書要素の場所情報と文書内容とに分離されていない。よって、文書要素の削除や移動を行う場合は、画像編集ソフトを使用することにより、利用者による文書要素の領域の削除作業や移動作業を実行することができる。しかし、文書要素の領域を削除すると、削除した領域が空白領域となるため、空白領域に移動可能な文書要素を、他の領域にある文書要素から探索し移動する作業が発生する。また、空白領域に文書要素を移動させることで、更に文書要素の空白が生成されるため、文書要素を空白領域に移動する作業を利用者により繰り返し行わせるため、編集作業の利便性が悪い。文書要素の領域を移動する場合も同様である。
上記の問題を解決するため、例えば、文書要素を配置して文書を作成する際に、空の文書要素が生成された場合、自動的に削除するという技術が知られている(特許文献1参照)。
また、文書要素を配置して文書作成する場合に、利用者による任意の位置への文書要素の移動を受け付け、自動的に各文書要素の位置を整形するという技術が知られている(特許文献2参照)。
しかしながら、特許文献1に開示された発明では、文書要素を自動的に削除することができるのは、構造化文書の作成時に限られるという問題がある。
また、特許文献2に開示された発明では、移動を受け付ける文書要素の単位がページ単位であり、各ページに存在する図や表や文字等の各文書要素の移動処理を行うことができないという問題がある。
本発明は、上記に鑑みてなされたものであって、構造化文書の文書要素の削除や移動による再配置を常時可能として、利用者の利便性を向上させることができる文書画像編集装置、文書画像編集方法、および文書画像編集プログラムを提供することを目的とする。
文書画像を、文書を構成する文書要素に分解して構造化文書として構造化する構造化手段と、前記構造化文書を格納する構造化文書格納手段と、前記文書要素を前記文書画像と同じレイアウトに配置し、レイアウトされた前記文書要素をプレビュー表示するプレビュー表示手段と、プレビュー表示された前記文書要素の中から利用者による前記文書要素の選択及び、選択された前記文書要素の利用者による編集を受け付ける文書編集手段と、前記文書要素の編集を受け付けた場合に、前記文書要素を再配置する文書要素再配置手段と、を備えることを特徴とする。
本発明によれば、文書画像を構造化して構造化文書にすることで、この構造化文書の利用者による文書要素の選択を受け付け、選択した文書要素に対して編集を行うことにより、生成された空白領域に、文書要素の削除や移動による再配置の処理を行うことにより、構造化文書の文書要素の削除や移動による再配置を常時可能として、利用者の利便性を向上させることができるという効果を奏する。
図1は、本発明の第1の実施の形態にかかる文書画像編集装置の構成を示すブロック図である。 図2は、構造化を行う前の文書画像の一例を示す説明図である。 図3は、構造化を行った文書画像の一例を示す説明図である。 図4は、文書要素の属性により文書画像を構造化した一例を示す説明図である。 図5は、各文書要素の構造的な階層関係により、文書画像を構造化した一例を示す説明図である。 図6は、ディスプレイに表示されるプレビュー画像表示の一例を示した図である。 図7は、文書要素を再配置した文書画像の一例を示す説明図である。 図8は、第1の実施の形態にかかる文書画像編集装置100における選択文書の構造化から文書要素の削除と文書要素の再配置までの処理手順を示すフローチャートである。 図9は、構造化部102が行う、選択された文書画像を構造化する処理手順を示すフローチャートである。 図10は、文書要素再配置部106が行う文書要素を再配置する処理手順を示すフローチャートである。 図11は、本発明の第2の実施の形態にかかる文書画像編集装置の構成を示すブロック図である。 図12は、文字要素分割の処理前の一例を示す説明図である。 図13は、文字要素分割の処理後の一例を示す説明図である。 図14は、空白領域の次の読み順に移動不可能な文書要素が存在する場合の、文字要素分割の処理前の一例を示す説明図である。 図15は、文書要素再配置部106が行う文書要素を再配置する処理手順を示すフローチャートである。 図16は、文書要素を移動するために文書要素を再配置した結果の一例を示す説明図である。 図17は、文書要素再配置部106が行う文書要素を再配置する処理手順を示すフローチャートである。 図18は、第1〜第4の実施形態の文書画像編集装置のハードウェア構成を示した図である。 図19は、本発明の第5の実施の形態にかかる文書画像編集装置1900の機能的構成を示すブロック図である。 図20は、スキャンする原稿の一例を示す図である。 図21は、不要な文書要素を削除して印刷枚数を削減した出力紙の一例を示す図である。 図22は、第1の実施の形態の形態にかかる文書画像編集装置1900における選択文書の構造化から文書要素の削除と文書要素の再配置までの処理手順を示すフローチャートである。 図23は、複合機のハードウェア構成を示すブロック図である。
以下に添付図面を参照して、この発明にかかる文書画像編集装置、文書画像編集方法の最良な実施の形態を詳細に説明する。
(第1の実施の形態)
本発明の第1の実施の形態として、本発明の文書画像編集装置をPCアプリケーションとして実装した例について説明する。
図1は、本発明の第1の実施の形態にかかる文書画像編集装置の構成を示すブロック図である。文書画像編集装置100は、文書選択部101と構造化部102と構造化データ格納部103とプレビュー表示部104と編集部105と文書要素再配置部106を備える。
文書選択部101は、利用者による文書画像の表示と選択を受け付ける部分であり、文書画像選択部107と構造化有無検知部108を備える。文書画像選択部107は、表示と編集を行う文書画像を選択する。構造化有無検知部108は、選択した文書画像が構造化されているか否かを判断する。選択した文書画像が構造化されていない場合、文書画像を構造化するために、文書画像が構造化部102に送出される。
構造化部102は、文書選択部101で選択した文書画像を構造化する。つまり、文書画像から構造化データを生成する。ここで、構造化データとは、構造化された文書要素とレイアウト情報とメタ情報と読み順情報を含む。
文書要素とは、文書を構成する要素である。具体的には、文書要素は、図や表や写真などを示す。
レイアウト情報とは、文書要素の領域情報である。具体的には、文書画像にある各文書要素の位置や大きさに関わる情報である。
メタ情報とは、文書要素である情報に付加される情報である。具体的には、文書要素が文字である場合、メタ情報は、章や節や項やタイトルやサブタイトルや本文などの文書構造上の情報である。また、文書要素が文字でない場合、メタ情報は、図や写真や表などの属性の情報である。
読み順情報とは、文書要素が繋がる順序を示す順列情報である。具体的には、文書要素がディスプレイに表示される順番の情報である。
図2は、構造化を行う前の文書画像の一例を示す説明図である。未構造化文書画像200は画像であるため、不要な文書要素が存在する場合、文書要素を削除することは不可能である。
図3は、構造化を行った文書画像の一例を示す説明図である。構造化済文書画像300は、文書要素301〜308を含む。このように、構造化を行うことで文書画像を文書要素に分解することにより、文書要素を個別に扱うことができることが可能となる。
構造化部102は、領域識別部109とレイアウト抽出部110とメタ情報抽出部111と読み順抽出部112と文書要素構造化部113とを備える。
領域識別部109は、文書画像に対して領域識別を行い、それぞれの文書要素に分解する。
レイアウト抽出部110は、領域識別部109により領域識別が実行された文書要素のレイアウト情報を抽出する。
メタ情報抽出部111は、領域識別部109により領域識別が実行された文書要素のメタ情報の抽出が実行される。
読み順抽出部112は、領域識別部109により領域識別が実行された文書要素がディスプレイに表示される順番を、読み順情報として抽出する。
文書要素構造化部113は、各文書要素と、レイアウト抽出部110により抽出されたレイアウト情報と、メタ情報抽出部111により抽出されたメタ情報と、読み順抽出部112により抽出された読み順情報と、を構造化する。
ここで、図4は、文書要素の属性により文書画像を構造化した一例を示す説明図である。文書要素が文字である場合は、文字要素として構造化データにする。つまり、文字要素に対して文字認識の処理を行い、その結果取得されるデータを構造化データとして登録するものとする。
また、文書要素が文字でない場合は、図要素や写真要素として、該当の文書要素を別の画像ファイルとして保存する。また、表要素として、表の構造を解析した結果をテーブル形式のファイルとして保存する。
図4は、文書全体を表すDocumentタグの直下に、文字要素を表すTextタグと、図要素と写真要素を併せたFigureタグと、表要素を表すTableタグを配置し、各属性に分類して配置している。さらに、Textタグの下位に、文字要素を表すTitleタグと、Subtitleタグと、Paragraphタグと、Captionタグを、文書の役割に応じて分類し、文書の先頭から読み順に従って並べている。
また、図5は、各文書要素の構造的な階層関係により、文書画像を構造化した一例を示す説明図である。ここで、文書全体を表すDocumentタグの直下に、標題を表すTitleタグと内容を表すSectionタグが並ぶ。そして、Sectionタグの下位に、各文書要素を文書の役割に応じて分類し、文書の先頭から読み順に従って並べている。ここで、PictureタグやTableタグは、図要素・写真要素と表要素を格納したファイル名と関連するキャプションを示していることからも、構造化の有効性が示されている。
なお、文書要素の属性による構造化の方法や、文書要素の構造的な階層関係による構造化の方法は、構造化の一例を示すものであり、それ以外の構造化の方法により文書画像を構造化しても良い。
また、本実施の形態の構造化部102では、領域識別部109により文書要素の領域識別を行い、レイアウト抽出部110により領域識別された文書要素の領域情報としてレイアウト情報を抽出したが、文書要素の領域識別を行うタイミングでレイアウト情報を抽出してもよい。
構造化データ格納部103は、構造化部102により構造化された構造化データを記憶部に格納する。
プレビュー表示部104は、構造化データ格納部103に格納されている構造化データを読み込み、プレビュー画像を構築してディスプレイに表示する。そして、プレビュー表示部104は、文書要素配置部114とディスプレイ表示部115とを備える。文書要素配置部114は、レイアウト情報を用いて各文書要素を配置し、元の文書画像を再現する。ディスプレイ表示部115は、文書要素配置部114によって配置された各文書要素により、元の文書画像を再現し、プレビュー画像を作成する。そしてディスプレイにプレビュー画像を表示する。
図6は、ディスプレイに表示されるプレビュー画像表示の一例を示した図である。表示画面600は、Openボタン601とDeleteボタン602とプレビュー表示領域603とページ数表示領域604を含む。Openボタン601は、文書を開くためのボタンであり、Deleteボタン602は、文書要素を削除するためのボタンである。プレビュー表示領域603は、プレビュー画像を表示する領域であり、ページ数表示領域604は、文書のページ数を表示する領域である。プレビュー表示領域603は、文字605と文字606と文字607と画像608とキャプション609とキャプション610とテーブル611と文字612を含む。文字605と文字606と文字607と画像608とキャプション609とキャプション610とテーブル611と文字612は文書要素である。
また、プレビュー表示部104は、後述する文書要素際配置部106により文書要素が再配置されたあとで、プレビュー画像を更新する。
編集部105は、利用者による任意の文書要素の選択と削除を受け付けることができる。選択された文書要素は、選択されたことが容易に把握できるように背景色を変えるなどしてディスプレイに表示される。図6では、画像608とキャプション609が選択されている。画像608とキャプション609は、周囲に影をつけて表示されている。例えば文書要素の利用者による選択を受け付け、削除ボタン602の押下を受け付けることで、文書要素は削除される。
文書要素再配置部106は、編集部105により任意の文書要素が削除された文書画像に対して、文書要素を再配置する。
具体的には、文書要素再配置部106は、空白領域のある文書画像に対して、空白領域に移動可能な文書要素を探索して決定する。そして、決定した文書要素を移動するための文書要素移動処理を行う。この文書要素移動処理により、新たに空白領域が生成された場合は、さらに空白領域に移動可能な文書要素を検索する。最終的に、空白領域に移動可能な文書要素が検索されない状態になるまで、文書要素の検索を繰り返すことにより、文書要素再配置部106は文書要素を再配置する。そして、再配置された前記文書要素のレイアウト情報を記憶部に格納する。そして、プレビュー表示部104はレイアウト情報からプレビュー画像を更新する。
文書要素再配置部106は、空白領域検知部116と移動要素決定部117と文書要素移動部118とを備える。
空白領域検知部116は、文書要素の削除により生じる空白を検知する。
移動要素決定部117は、空白領域検知部116により検知された空白領域に移動可能な文書要素を探索して決定する。
なお、空白領域の次の読み順の文書要素が空白領域の縦幅もしくは横幅よりも大きい場合は、等倍の文書要素を空白領域に移動することが不可能である。この場合は、文書要素を予め変倍して縮小させることにより、空白領域に移動できる大きさにすることができる。ただし、極端な変倍は、文書要素の可読性低下を招くため、ある一定以上の変倍率Mを設定する必要がある。そして、変倍率Mで文書要素を変倍させた文書要素が空白領域に移動できない場合は、次の読み順の文書要素が空白領域の移動候補の文書要素となる。なお、この変倍率Mは、実験により求められる値を用いても良い。
文書要素移動部118は、移動要素決定部117により移動する文書要素が決定した場合、その文書要素を空白領域に移動する。なお、その文書要素に変倍が必要な場合、その文書要素を変倍してから、空白領域に移動する。
この文書要素再配置部106により、文書要素を削除したことで空白領域が存在している文書画像に対して、空白領域に移動可能な文書要素を移動し、文書要素を再配置する。また、文書要素を再配置することにより、最終ページが文書要素を含まない空のページになる場合は、空ページを削除することでページ数を減少させることができる。
図7は、文書要素を再配置した文書画像の一例を示す説明図である。再配置済文書画像700は、文書要素701〜709を含む。具体的には、再配置済文書画像700は、図3の文書要素304と文書要素305を削除した結果を表している。つまり、文書要素304と文書要素305を削除することにより生成された空白領域に、文書要素704と文書要素705が移動される。また、文書要素704と文書要素705が移動することにより生成された空白領域に、文書要素706が移動される。
また、文書要素704は表要素を表すが、例えばこの表要素が縦長か横長である場合、空白領域に配置できない可能性がある。この場合は、表要素を分割して配置する方法がある。また、表要素を変倍して配置する方法がある。また、読み順を参照し、表要素の次以降に位置する文書要素の中から、分割および変倍を行わずに配置可能な文書要素を検索し配置する方法がある。上述した方法から最適な方法を決定して、文書要素を再配置することで、文書編集作業の利便性を向上させることができる。
次に、以上のように構成された本実施の形態にかかる文書画像編集装置100における選択文書の構造化を行い文書要素の削除による他の文書要素の再配置の処理について説明する。図8は、第1の実施の形態にかかる文書画像編集装置100における上述した処理の手順を示すフローチャートである。
まず、文書選択部101は、編集を行う文書画像を選択する(ステップS801)。
次に、文書選択部101は、選択された文書画像が構造化されているか否かを判断する(ステップS802)。ここで、文書選択部101が、選択された文書画像が構造化されていないと判断した場合(ステップS802:No)、構造化部102が、選択された文書を構造化する(ステップ803)。選択された文書画像を構造化する処理の詳細は、後述する。
そして、構造化データ格納部103は、構造化部102によって構造化された構造化データを記憶装置に格納する(ステップS804)。
また、文書選択部101が、選択された文書画像が構造化されていると判断した場合も、ステップS804に移る。
次に、プレビュー表示部104は、構造化データ格納部に格納された構造化データを読み込み、プレビュー表示する(ステップS805)。つまり、構造化データ格納部103に格納されているレイアウト情報を取得し、各文書要素を配置して元の文書画像を再現する。そして、プレビュー画像を作成し、ディスプレイにプレビュー画像を表示する。
そして、編集部105は、利用者により選択された文書要素を削除する(ステップS806)。
次に、文書要素再配置部106は、編集部105により編集された文書画像の文書要素を再配置する(ステップS807)。文書要素を再配置する処理の詳細は、後述する。
これにより、選択された文書画像を構造化し、利用者による文書要素の削除を受け付け、文書要素の再配置の処理を行うことにより、文書要素のレイアウトが常に整形された文書を提供できる。
次に、選択された文書画像を構造化する処理の詳細について説明する。図9は、構造化部102が行う、選択された文書画像を構造化する処理手順を示すフローチャートである。
まず、領域識別部109が文書画像の文書要素の領域識別を行う(ステップS901)。
次に、レイアウト抽出部110が、領域識別部109により領域識別された文書要素のレイアウト情報を抽出する(ステップS902)。
そして、メタ情報抽出部111が、領域識別部109により領域識別された文書要素のメタ情報を抽出する(ステップS903)。
次に、読み順情報抽出部112が、領域識別部109により領域識別された文書要素の読み順情報を抽出する(ステップS904)。
そして、文書要素構造化部113が、抽出された情報の構造的な階層関係による構造化を行うことで、文書要素を構造化する(ステップS905)。具体的には、文書要素と、レイアウト抽出部110から抽出された文書要素のレイアウト情報と、メタ情報抽出部111から抽出された文書要素に付加される情報と、読み順抽出部112により抽出された文書要素が繋がる順序を示す順列情報とを、構造的な階層関係に着目し、構造化データを生成する。なお、構造化の方法は、他の例として、文書要素の属性による構造化などの方法もある。
これにより、選択された文書画像の構造化を行うことができるため、文書要素単位での編集を行うことのできる構造化データを取得することができる。
次に、文書要素を再配置する処理の詳細について説明する。図10は、文書要素再配置部106が行う文書要素を再配置する処理手順を示すフローチャートである。
まず、移動要素決定部117が、文書画像の空白領域に移動可能な文書要素の探索を行う(ステップS1001)。
次に、移動要素決定部117が、空白領域に移動可能な文書要素があるか否か判断する(ステップS1002)。ここで、移動要素決定部117が、空白領域に移動可能な文書要素がないと判断した場合(ステップS1002:No)、文書要素再配置部106が行う文書要素を再配置する処理手順を終了する。
また、移動要素決定部117が、空白領域に移動可能な文書要素があると判断した場合(ステップS1002:Yes)、文書要素移動部118が、移動可能な文書要素を空白領域に移動する(ステップS1003)。
そして、空白検知部116が、文書要素移動部118が文書要素を空白領域に移動したことにより、新たに生成される空白領域があるか否かを判断する(ステップS1004)。
ここで、空白検知部116が、新たに生成される空白領域がないと判断した場合(ステップS1004:No)、文書要素再配置部106が行う文書要素を再配置する処理手順を終了する。
また、ここで、空白検知部116が、新たに生成される空白領域があると判断した場合(ステップS1004:Yes)、ステップS1001の処理を行う。この文書要素を再配置する処理は、空白領域検知部116が空白領域を検知しなくなるか、移動要素決定部117が空白領域に移動可能な文書要素を見つけることができなくなる(ステップS1002)まで繰り返される。
このように本実施の形態では、文書画像の文書要素を削除して、文書画像の文書要素を再配置する処理を行うことができるので、構造化文書の文書要素の削除や移動による再配置を常時可能として、利用者の利便性を向上させることができる。
(第2の実施の形態)
本発明の第2の実施の形態においては、上述した第1の実施の形態と同様、本発明の文書画像編集装置をPCアプリケーションとして実装した例について説明する。
上述した第1の実施の形態においては、利用者による文書要素の削除により生成される空白領域に移動可能な文書要素を検知して移動したが、第2の実施の形態においては、空白領域に移動可能な文書要素がない場合、文字要素を分割することで移動可能な文書要素を生成して、分割された文字要素を空白領域に移動することで、文書画像を整形する場合について説明する。
図11は、本発明の第2の実施の形態にかかる文書画像編集装置の構成を示すブロック図である。
図11に示すように、第2の実施の形態にかかる文書画像編集装置1100は、文書選択部101と構造化部102と構造化データ格納部103とプレビュー表示部104と編集部105と文書要素再配置部106とを主に備えている。ここで、文書選択部101と構造化部102と構造化データ格納部103とプレビュー表示部104と編集部105の機能および構成は、第1の実施の形態と同様であるため、説明を省略する。
文書要素再配置部106は、空白領域検知部116と移動要素決定部117と文書要素移動部118と文字要素分割部119を主に備えている。ここで、空白領域検知部116と移動要素決定部117と文書要素移動部118の機能および構成は、第1の実施の形態と同様であるため、説明を省略する。
文字要素分割部119は、文書画像の文書要素である文字要素を分割する。なお、文書要素である図要素や、写真要素や、表要素は、構造化部102で領域識別された単位で図要素、写真要素、表要素の意味をなすものであるので、分割した場合、図や写真や表を認識できない可能性が高い。しかし、文字要素の一部を分割した場合は、文字自体を分割しない限り、分割した文字要素は文字の集合として認識されるため、分割することが可能である。
分割の方法としては、まず、一つの文字要素を複数の画像として行単位で分割する分割処理方法がある。この処理方法は、空白領域の幅が文字要素の領域の幅と一致している場合に有効である。つまり、分割されて移動される文字要素の高さは、最長でも空白領域の高さであり、分割される際に、文字自体を分割しないような高さで分割の境界線が決定される。
また、文字認識により文字要素を文字コードとして分割する分割処理方法がある。この処理方法は、文字が文字コードとして存在するため、空白領域の幅が文字要素の領域の幅と一致していない場合でも、文字要素の移動が可能である。また、移動しない文字要素についても、新たに生成した空白領域への移動が容易に行うことができる。
また、一文字または複数の文字を一つの画像として文字要素を分割する分割処理方法がある。この処理方法は、前述の文字認識により文字と認識された領域に、文字コードの代わりに画像として分割する処理である。つまり、文字認識された領域を文字コードの代わりに画像として扱うことで、文字認識の認識率に関わることなく、確実に文字認識された領域の文字を再現できる。
ここで、図12は、文字要素分割の処理前の一例を示す説明図である。文書画像1200は、文書要素1201〜1206を含む。また、図13は、文字要素分割の処理後の一例を示す説明図である。文書画像1300は、文書要素1301〜1307を含む。具体的には、文書画像1300は文書画像1200の文書要素1204と文書要素1205を削除した結果を表している。
この場合、文書画像1200の文書要素1204と文書要素1205を削除すると、文書要素1204と文書要素1205の領域が空白領域になる。そして、読み順の情報を参照すると、次の文書情報である文書要素1206が移動候補の文書要素であるが、この場合、文書要素1206は空白領域よりも領域が大きいため移動させることは不可能である。
そこで、文書要素移動部118は、文書要素1206を文書要素1304と文書要素1305に分割することで、文書要素1304を空白領域に移動させることを可能とした。
なお、文書要素1304が移動したことによる空白領域に、文書要素1305が移動される。さらに文書要素1305の移動により生成された空白に次ページの文字要素1306と文字要素1307が移動されていることがわかる。
なお、削除された文書要素の次の読み順である文書要素が、図要素や写真要素や表要素であり、かつ図要素や写真要素や表要素が空白領域に移動不可能である場合、更にその次の読み順に文字要素があれば、その文字要素を分割することで、空白領域に文字要素を移動することができる。
しかし、例えば、文字要素であるキャプション要素と表要素等の複数の文書要素が意味的にまとめて扱うことが適切な場合、文字要素のみを移動することは文書画像にとって不適切であるため、適宜、領域識別部109で識別された文字要素を結合させることが必要である。
また、ここで、空白領域と、空白領域に移動する文字要素との距離について説明する。空白領域と、空白領域に移動する文字要素との位置が遠い場合、文書画像の可読性低下を招くため、可読性低下を招かずに文字要素を移動できる最大の距離を距離Dとする。ここで各文字要素間の距離Dは、一例として、各文字要素の領域の重心点から計測された直線距離とする。すると、空白領域から計測される距離Dよりも近い距離にある文字要素のみ、探索の対象とする必要がある。この距離Dは、実験により求められる値を用いても良い。
また、削除された文書要素の次の読み順である文書要素が、図要素や写真要素や表要素であり、かつ次の読み順の文書要素が空白領域に移動不可能である場合について説明する。この場合、更に更に次の読み順に文字要素がある場合、文字要素を分割して空白領域に文字要素を移動することができる。
図14は、空白領域の次の読み順に移動不可能な文書要素が存在する場合の、文字要素分割の処理前の一例を示す説明図である。文書画像1400は、文書要素1401〜1408を含む。例えば、文書要素1404と文書要素1405を削除した場合、文書要素1406は文字要素ではあるが、表である文書要素1407と共に意味を成すものであるため、文書要素1406と文書要素1407を結合して1つの文書要素として扱う。すると、文書要素1404と文書要素1405を削除することで生成される空白領域に、文書要素1406と文書要素1407が移動されることは不可能であるため、この場合は、空白領域に、文字要素である文書要素1408を移動する。
次に、以上のように構成された本実施の形態にかかる文書画像編集装置100における選択文書の構造化を行い文書要素の削除による他の文書要素の再配置の処理について説明する。本実施の形態にかかる文書画像編集装置1100における上述した処理の手順を示すフローチャートは、第1の実施の形態と同様であるため、説明を省略する。
また、文書要素を再配置する処理の詳細について説明する。図15は、文書要素再配置部106が行う文書要素を再配置する処理手順を示すフローチャートである。
まず、第1の実施の形態の図10のステップS1001〜S1002と同様にして、移動要素決定部117が移動可能な文書要素があるか否かを判断するまでの処理を行う(ステップS1501〜S1502)。
ここで、移動要素決定部117が、移動可能な文書要素があると判断した場合(ステップS1502:Yes)、ステップ1003〜S1004と同様にして、移動可能な文書要素を移動し、新たに生成される空白領域があるか否かを判断するまでの処理を行う(ステップS1505〜S1506)。
また、移動要素決定部117が、移動可能な文書要素がないと判断した場合(ステップS1502:No)、文書要素分割部119が、分割して移動可能な文字要素があるか否かを判断する(ステップS1503)。ここで、文書要素分割部119が、分割して移動可能な文字要素がない場合、文書要素再配置部106が行う文書要素を再配置する処理手順を終了する。
また、文書要素分割部119が、分割して移動可能な文字要素がある場合、文書要素分割部119が、文書要素の分割を行う(ステップS1504)。
そして、ステップS1003と同様にして、移動可能な文書要素を移動する処理を行う(ステップS1505)。以降は、第1の実施の形態と同じ処理手順である。
このように本実施の形態によれば、利用者による文書画像の文書要素の削除を受け付けた場合、文書画像の文書要素である文字要素を分割して、文字要素を再配置する処理を行うことができるため、第一の実施の形態における文書画像編集装置に比べて、より空白領域の少ない文書画像を得ることができる。
第2の実施の形態にかかる文書画像編集装置の応用例としては、例えば、利用者による文書要素の指定を受け付け、文書要素を複数の要素に分割し、その分割して生成された要素を削除することが考えられる。具体的には、複数の画像が一つの図要素や写真要素を構成する場合、一枚の画像のみ削除することができる。また、文字要素から一部の文字列を削除することもできる。
(第3の実施の形態)
本発明の第3の実施の形態においては、上述した第2の実施の形態と同様、本発明の文書画像編集装置をPCアプリケーションとして実装した例について説明する。
上述した第1の実施の形態と第2の実施の形態においては、利用者による一つまたは複数の文書要素の削除を受け付けていたが、第3の実施の形態では、任意のページに存在する全ての文書要素の選択と削除を受け付ける場合について説明する。
第3の実施の形態にかかる文書画像編集装置の構成を示すブロック図は、第2の実施の形態と同様に、文書画像編集装置1100は、文書選択部101と構造化部102と構造化データ格納部103とプレビュー表示部104と編集部105と文書要素再配置部106とを主に備えている。ここで、文書選択部101と構造化部102と構造化データ格納部103とプレビュー表示部104の機能および構成は、第2の実施の形態と同様であるため、説明を省略する。
第3の実施の形態にかかる編集部105は、第2の実施の形態と同様の機能を有する他、任意のページを選択し、そのページに存在する文書要素を削除することができる。また、任意ページを選択する代わりに、任意ページに存在する全ての文書要素を選択した状態にしても良い。
第3の実施の形態にかかる文書要素再配置部106は、第2の実施の形態と同様の機能を有する他、編集部105によるページ削除により生成された空白ページに、次ページの文書要素を移動する。
また、第3の実施の形態にかかる文書画像編集装置における上述した処理の手順を示すフローチャートは、第2の実施の形態と同様であるため、説明を省略する。
なお、編集部105が利用者による任意のページの選択を受け付ける際に、選択されたページに配置された文書要素が、前後のページにも存在している場合は、これらの文書要素を削除対象とするか否かを判断させる必要があるため、第2の実施の形態にかかる文書画像編集装置を使用することとする。
なお、編集部105が利用者による任意のページの削除を受け付ける場合に、ページに存在する文書要素を削除するのではなく、ページ自体を削除し、以降のページのページ番号を繰り上げる処理に代えても良い。この場合、文書要素再配置部106における処理は特に行われない。
このように本実施の形態によれば、ページ単位での文書要素の削除を受け付ける場合、ページ内の全ての文書要素を削除する際に文書要素を一つずつ選択する必要がなくなるため、利用者による文書要素の削除処理の手間を省くことができる。
(第4の実施の形態)
本発明の第4の実施の形態においては、上述した第1〜3の実施の形態と同様、本発明の文書画像編集装置をPCアプリケーションとして実装した例について説明する。
上述した第1の実施の形態と、第2の実施の形態においては、利用者による一つまたは複数の文書要素の削除を受け付けていた。第4の実施の形態では、利用者による一つまたは複数の文書要素の移動を受け付ける場合について説明する。
第4の実施の形態にかかる文書画像編集装置の構成を示すブロック図は、第2の実施の形態と同様に、文書選択部101と構造化部102と構造化データ格納部103とプレビュー表示部104と編集部105と文書要素再配置部106とを主に備えている。ここで、文書選択部101と構造化部102と構造化データ格納部103とプレビュー表示部104の機能および構成は、第1の実施の形態と同様であるため、説明を省略する。
編集部105は、利用者による移動する文書要素の選択を受け付け、記憶部に格納し、文書画像から選択された文書要素を削除する。
第4の実施の形態にかかる文書要素再配置部106は、第2の実施の形態と同様の機能を有する他、文書要素を移動するための、文書要素の再配置処理を行う。
具体的に、まず移動される文書要素の領域を確保するために、移動先に空白領域を生成する。次に、空白領域より読み順が後になる文書要素を全て再配置する。そして、空白領域に移動される文書要素を移動する。
ここで、前述した図6の画像608とキャプション609を文書の最後に移動した場合を説明する。画像608とキャプション609の移動領域を確保するために、表611とそのキャプション610と、文字要素612が移動される。図16は、文書要素を移動するために文書要素を再配置した結果の一例を示す説明図である。再配置済文書画像1600は、文書要素1601〜1608を含む。文書要素1607と文書要素1608が利用者による移動を受け付けた文書要素である。
また、第4の実施の形態にかかる文書画像編集装置における上述した処理の手順を示すフローチャートは、第2の実施の形態と同様であるため、説明を省略する。
また、文書要素を再配置する処理の詳細について説明する。図17は、文書要素再配置部106が行う文書要素を再配置する処理手順を示すフローチャートである。
まず、第2の実施の形態の図15のステップS1501〜S1506と同様にして、空白領域に文書要素を移動する処理を行う(ステップ1701〜S1706)。
次に、利用者により指定された文書要素を移動するための空白領域を生成する(ステップS1707)。
そして、生成された空白領域に、利用者により指定された文書要素を移動する(ステップS1708)。
このように本実施の形態によれば、利用者により選択された文書要素の移動を受け付ける場合に、まず文書要素を削除して、その空白領域のある文書画像の文書要素の再配置を行う。そして、その文書画像に、選択された文書領域を移動するための領域を空白領域として確保し、そして空白領域に選択された文書要素を移動させることにより、文書要素の移動をすることができる。このように、選択された文書要素を自由に移動することができるため、使用者による文書要素の移動処理の手間を減らし利便性を向上することができる。
図18は、第1〜第4の実施形態の文書画像編集装置のハードウェア構成を示した図である。第1〜第4の実施形態の文書画像編集装置は、図18に示すように、CPU(Central Processing Unit)1、ROM(Read Only Memory)2、RAM(Random Access Memory)3、上述した構造化データ格納部103としてのHDD(Hard Disk Drive)4と、モニタ等の表示装置5、キーボードやマウス等の入力デバイス6、通信I/F7を備えるとともに、これら各部を接続するバス8を備えており、通常のコンピュータを利用したハードウェア構成となっている。
第1〜第4の実施形態の文書画像編集装置で実行される各種プログラムは、インストール可能な形式又は実行可能な形式のファイルでCD−ROM、フレキシブルディスク(FD)、CD−R、DVD(Digital Versatile Disk)等のコンピュータで読み取り可能な記録媒体に記録されて提供される。
また、第1〜第4の実施形態の各文書画像編集装置で実行されるプログラムを、インターネット等のネットワークに接続されたコンピュータ上に格納し、ネットワーク経由でダウンロードさせることにより提供するように構成しても良い。また、第1〜第4の実施形態の各文書表示装置で実行されるプログラムをインターネット等のネットワーク経由で提供または配布するように構成しても良い。また、第1〜第4の実施形態のプログラムを、ROM等に予め組み込んで提供するように構成してもよい。
第1〜第4の実施形態の各文書画像編集装置で実行されるプログラムは、上述した各部(文書選択部101、構造化部102、構造化データ格納部103、プレビュー表示部104、編集部105、文書要素再配置部106、文書画像選択部107、構造化有無検知部108、領域識別部109、レイアウト抽出部110、メタ情報抽出部111、読み順抽出部112、文書要素構造化部113、文書要素配置部114、ディスプレイ表示部115、空白領域検知部116、移動要素決定部117文書要素移動部118など)を含むモジュール構成となっており、実際のハードウェアとしてはCPU1が上記記憶媒体(ROM2又はHDD4)からプログラムを読み出して実行することにより上記各部が主記憶装置上にロードされ、文書選択部101、構造化部102、構造化データ格納部103、プレビュー表示部104、編集部105、文書要素再配置部106、文書画像選択部107、構造化有無検知部108、領域識別部109、レイアウト抽出部110、メタ情報抽出部111、読み順抽出部112、文書要素構造化部113、文書要素配置部114、ディスプレイ表示部115、空白領域検知部116、移動要素決定部117、文書要素移動部118などが主記憶装置上に生成されるようになっている。
(第5の実施の形態)
本発明の第5の実施の形態においては、本発明を複合機の機能として実現した例について説明する。
図19は、本発明の第5の実施の形態にかかる文書画像編集装置1900の機能的構成を示すブロック図である。
図19に示すように、第5の実施の形態にかかる文書画像編集装置1900は、構造化部102と構造化データ格納部103とプレビュー表示部104と編集部105と文書要素再配置部106とスキャナ1901と操作表示部1902とプリンタエンジン1903を主に備えている。ここで、構造化部102と構造化データ格納部103と編集部105と文書要素再配置部106の機能および構成は、第1の実施の形態と同様であるため、説明を省略する。
スキャナ1901は、原稿などの画像を読み取る装置である。操作表示部1902は、文書要素の配置結果をプレビュー画面にプレビュー表示し、利用者による移動や削除を行う文書要素の選択を受け付けるためのものである。プリンタエンジン1903は、印刷を実行する部分である。
また、図20はスキャンする原稿の一例を示す図である。原稿2001と原稿2002は、共に元原稿の2ページを1枚に集約した原稿である。原稿2001は、文書領域2003と文書領域2004を含む。文書領域2003は、元原稿の1ページ目の文書領域である。文書領域2004は、元原稿の2ページ目の文書領域である。また、原稿2002は、文書要素2005と文書要素2006を含む。文書領域2005は、元原稿の3ページ目の文章領域である。文書領域2006は、元原稿の4ページ目の文章領域である。
原稿2001と原稿2002の2ページの原稿をスキャンして印刷する場合、2枚の出力紙が排紙される。ここで、例えば、元原稿の1ページ目である文書領域2003と、元原稿の4ページ目である文書領域2006とが不要である場合、まず、2ページの原稿をスキャンして、2ページの構造化データを生成する。次に、編集部105が、文書領域2003と文書領域2006に存在する全ての文書要素を削除する。そして、文書要素再配置部106により、1ページの文書画像にすることができる。よって、印刷枚数を減らすことができる。
図21は、不要な文書要素を削除して印刷枚数を削減した出力紙の一例を示す図である。出力紙2101は、文書領域2102と文書領域2103を含む。
なお、上述した例では、文書領域を選択することで文書領域にある全ての文書要素を選択したが、任意の文書要素を選択し削除することも可能である。また、文書領域や文書要素を移動することも、同様に可能である。
第5の実施の形態にかかるプレビュー表示部104は、第3の実施の形態と同様の機能を有する他、ディスプレイ表示領域に合わせて文書画像の拡大縮小処理を行い、プレビュー表示を行う。また、文書画像のページ数が複数である場合、予め定められたページ数を同時に表示する。
また、プレビュー表示部104は複写機からスキャンして生成された文書画像をプレビュー表示する。
次に、以上のように構成された本実施の形態にかかる文書画像編集装置1900におけるスキャンして生成された画像文書の構造化を行い文書要素の削除による他の文書要素の再配置の処理について説明する。図22は、本実施の形態にかかる文書画像編集装置1900における上述した処理の手順を示すフローチャートである。
まず、構造化部102は、スキャンして生成された文書画像を構造化する(ステップS2201)。選択された文書画像を構造化する処理の詳細は、第1の実施の形態の図9と同様のため、省略する。
そして、第1の実施の形態の図8のS804〜S805と同様にして、構造化データ格納部により構造化データを格納し、プレビュー表示104が構造化データを読み込み、プレビュー表示する(ステップS2202〜S2203)。
次に、編集部105は、利用者により選択された文書領域の全ての文書要素を削除する(ステップS2204)。
そして、第1の実施の形態の図8のS807と同様にして、文書要素再配置部が、編集部105により編集された文書画像の文書要素を再配置する(ステップS2205)。
これにより、複写機から文書画像を印刷する場合、印刷不要な文書領域を削除し、必要な文書領域のみを適切なレイアウトに再配置して印刷することにより、利用者による文書要素のレイアウトの作業の手間を軽減することができる。
なお、スキャンされた文書画像は構造化されていないため、構造化部102による構造化が必要となるが、あらかじめ構造化データとIDをデータベースに登録することで、構造化の処理を軽減することもできる。具体的には、スキャンされる原稿にIDを印字し、そのIDを検知して、あらかじめデータベースに登録されているIDと照合する。登録されているIDと一致した場合、そのIDに対応する構造化データを取得することで、構造化の処理が不要となる。
図23は、複合機のハードウェア構成を示すブロック図である。本図に示すように、この複合機は、コントローラ10とエンジン部(Engine)60とをPCI(Peripheral Component Interface)バスで接続した構成となる。コントローラ10は、複合機全体の制御と描画、通信、図示しない操作部からの入力を制御するコントローラである。エンジン部60は、PCIバスに接続可能なプリンタエンジンなどであり、たとえば白黒プロッタ、1ドラムカラープロッタ、4ドラムカラープロッタ、スキャナまたはファックスユニットなどである。なお、このエンジン部60には、プロッタなどのいわゆるエンジン部分に加えて、誤差拡散やガンマ変換などの画像処理部分が含まれる。
コントローラ10は、CPU11と、ノースブリッジ(NB)13と、システムメモリ(MEM−P)12と、サウスブリッジ(SB)14と、ローカルメモリ(MEM−C)17と、ASIC(Application Specific Integrated Circuit)16と、ハードディスクドライブ(HDD)18とを有し、ノースブリッジ(NB)13とASIC16との間をAGP(Accelerated Graphics Port)バス15で接続した構成となる。また、MEM−P12は、ROM(Read Only Memory)12aと、RAM(Random Access Memory)12bと、をさらに有する。
CPU11は、複合機の全体制御をおこなうものであり、NB13、MEM−P12およびSB14からなるチップセットを有し、このチップセットを介して他の機器と接続される。
NB13は、CPU11とMEM−P12、SB14、AGP15とを接続するためのブリッジであり、MEM−P12に対する読み書きなどを制御するメモリコントローラと、PCIマスタおよびAGPターゲットとを有する。
MEM−P12は、プログラムやデータの格納用メモリ、プログラムやデータの展開用メモリ、プリンタの描画用メモリなどとして用いるシステムメモリであり、ROM12aとRAM12bとからなる。ROM12aは、プログラムやデータの格納用メモリとして用いる読み出し専用のメモリであり、RAM12bは、プログラムやデータの展開用メモリ、プリンタの描画用メモリなどとして用いる書き込みおよび読み出し可能なメモリである。
SB14は、NB13とPCIデバイス、周辺デバイスとを接続するためのブリッジである。このSB14は、PCIバスを介してNB13と接続されており、このPCIバスには、ネットワークインターフェース(I/F)部なども接続される。
ASIC16は、画像処理用のハードウェア要素を有する画像処理用途向けのIC(Integrated Circuit)であり、AGP15、PCIバス、HDD18およびMEM−C17をそれぞれ接続するブリッジの役割を有する。このASIC16は、PCIターゲットおよびAGPマスタと、ASIC16の中核をなすアービタ(ARB)と、MEM−C17を制御するメモリコントローラと、ハードウェアロジックなどにより画像データの回転などをおこなう複数のDMAC(Direct Memory Access Controller)と、エンジン部60との間でPCIバスを介したデータ転送をおこなうPCIユニットとからなる。このASIC16には、PCIバスを介してFCU(Facsimile Control Unit)30、USB(Universal Serial Bus)40、IEEE1394(the Institute of Electrical and Electronics Engineers 1394)インターフェース50が接続される。操作表示部20はASIC16に直接接続されている。
MEM−C17は、コピー用画像バッファ、符号バッファとして用いるローカルメモリであり、HDD(Hard Disk Drive)18は、画像データの蓄積、プログラムの蓄積、フォントデータの蓄積、フォームの蓄積を行うためのストレージである。
AGP15は、グラフィック処理を高速化するために提案されたグラフィックスアクセラレーターカード用のバスインターフェースであり、MEM−P12に高スループットで直接アクセスすることにより、グラフィックスアクセラレーターカードを高速にするものである。
さらなる効果や変形例は、当業者によって容易に導き出すことができる。本発明の実施態様は、以上に説明したような特定の実施形態に限定されるものではない。
1 CPU(Central Processing Unit)
2 ROM(Read Only Memory)
3 RAM(Random Access Memory)
4 HDD(Hard Disk Drive)
5 表示装置
6 入力デバイス
7 通信I/F
8 バス
10 コントローラ
11 CPU
12 システムメモリ(MEM−P)
12a ROM(Read Only Memory)
12b RAM(Random Access Memory)
13 ノースブリッジ(NB)
14 サウスブリッジ(SB)
15 AGP(Accelerated Graphics Port)バス
16 ASIC
17 ローカルメモリ(MEM−C)
18 ハードディスクドライブ(HDD)
20 操作表示部
30 FCU(Facsimile Control Unit)
40 USB(Universal Serial Bus)
50 IEEE1394インターフェース
60 エンジン部(Engine)
100 文書画像編集装置
101 文書選択部
102 構造化部
103 構造化データ格納部
104 プレビュー表示部
105 編集部
106 文書要素再配置部
107 文書画像選択部
108 構造化有無検知部
109 領域識別部
110 レイアウト抽出部
111 メタ情報抽出部
112 読み順抽出部
113 文書要素構造化部
114 文書要素配置部
115 ディスプレイ表示部
116 空白領域検知部
117 移動要素決定部
118 文書要素移動部
200 未構造化文書画像
300 構造化済文書画像
301 文書要素
302 文書要素
303 文書要素
304 文書要素
305 文書要素
306 文書要素
307 文書要素
308 文書要素
600 表示画面
601 Openボタン
602 Deleteボタン
603 プレビュー表示領域
604 ページ数表示領域
605 文字
606 画像
607 キャプション
608 キャプション
609 テーブル
610 文字
700 再配置済文書画像
701 文書要素
702 文書要素
703 文書要素
704 文書要素
705 文書要素
706 文書要素
707 文書要素
708 文書要素
709 文書要素
1100 文書画像編集装置
1200 文書画像
1201 文書要素
1202 文書要素
1203 文書要素
1204 文書要素
1205 文書要素
1206 文書要素
1300 文書画像
1301 文書要素
1302 文書要素
1303 文書要素
1304 文書要素
1305 文書要素
1306 文書要素
1307 文書要素
1400 文書画像
1401 文書要素
1402 文書要素
1403 文書要素
1404 文書要素
1405 文書要素
1406 文書要素
1407 文書要素
1408 文書要素
1900 文書画像編集装置
1901 スキャナ
1902 操作表示部
1903 プリンタエンジン
2001 原稿
2002 原稿
2003 文書領域
2004 文書領域
2005 文書要素
2006 文書要素
2101 出力紙
2102 文書領域
2103 文書領域
特開平9−44493号公報 特開平10−289225号公報
文書画像を、文書を構成する1以上の文書要素に分解し、分解された該1以上の文書要素それぞれの領域に関する領域情報と該1以上の文書要素の順序に関する順列情報とを抽出して前記1以上の文書要素と関連付けて記憶部に記憶させる構造化手段と、前記構造化手段で分解された1以上の文書要素を、該1以上の文書要素と関連付けて前記記憶部に記憶された領域情報に基づいて配置して表示手段に表示させる表示制御手段と、前記表示制御手段で表示手段に表示された1以上の文書要素のうち、第1の文書要素の削除を受け付ける受付手段と、前記受付手段で受け付けた第1の文書要素の削除によって生じる空白領域に、前記1以上の文書要素と関連付けて前記記憶部に記憶された順序情報に基づいて特定される該第1の文書要素の次の順序の第2の文書要素が配置できるかを判断する判断手段と、前記判断手段で配置できると判断したとき、前記第2の文書要素を前記空白領域に配置する領域情報を前記記憶部に記憶させる再配置手段と、を有し、前記表示制御手段は、前記再配置手段で記憶部に記憶された領域情報に基づいて、前記表示手段に表示された配置を更新することを特徴とする。

Claims (13)

  1. 文書画像を、文書を構成する文書要素に分解して構造化文書として構造化する構造化手段と、
    前記構造化文書を格納する構造化文書格納手段と、
    前記文書要素を前記文書画像と同じレイアウトに配置し、レイアウトされた前記文書要素をプレビュー表示するプレビュー表示手段と、
    プレビュー表示された前記文書要素の中から利用者による前記文書要素の選択及び、選択された前記文書要素の利用者による編集を受け付ける文書編集手段と、
    前記文書要素の編集を受け付けた場合に、前記文書要素を再配置する文書要素再配置手段と、
    を備えることを特徴とする文書画像編集装置。
  2. 前記構造化手段は、
    前記文書画像を領域識別することにより複数の前記文書要素の領域を識別する領域識別手段と、
    前記文書要素の配置場所の情報であるレイアウト情報を抽出するレイアウト抽出手段と、
    前記文書要素に付加される意味情報であるメタ情報を抽出するメタ情報抽出手段と、
    前記文書要素の読み順の順列情報である読み順情報を抽出する読み順抽出手段と、
    前記文書要素と、前記レイアウト抽出手段により抽出されるレイアウト情報と、前記メタ情報抽出手段により抽出されるメタ情報と、前記読み順抽出手段により抽出される読み順情報とを取得し分類することにより、前記文書画像を構造化する文書要素構造化手段と、
    を備えることを特徴とする請求項1に記載の文書画像編集装置。
  3. 前記文書編集手段は、
    プレビュー表示された前記文書要素の中から利用者による前記文書要素の選択を受け付け、選択された前記文書要素の削除を行うこと、
    を特徴とする請求項1および請求項2に記載の文書画像編集装置。
  4. 前記文書編集手段は、
    プレビュー表示された前記文書要素の中から利用者による前記文書要素の選択を受け付け、選択された前記文書要素の移動を行うこと、
    を特徴とする請求項1および請求項2に記載の文書画像編集装置。
  5. 前記文書要素再配置手段は、
    前記文書編集手段により前記文書画像に生成される空白領域に移動可能な前記文書要素を決定する再配置文書要素決定手段と、
    決定された前記文書要素を移動する再配置文書要素移動手段と、
    を備え、
    前記プレビュー表示手段は、
    前記文書要素再配置手段による前記文書要素の再配置により、プレビュー画像を更新すること
    を特徴とする請求項1ないし請求項4に記載の文書画像編集装置。
  6. 前記再配置文書要素移動手段は、
    移動候補となる前記文書要素の変倍率を算出し、算出された前記変倍率に応じて、移動候補となる前記文書要素を変倍すること、
    を特徴とする請求項5に記載の文書画像編集装置。
  7. 前記文書要素再配置手段は、
    前記文書要素である文字要素を再配置する場合に、一つの前記文字要素を複数の画像として行単位で分割する分割処理、文字認識により前記文字要素を文字コードとして分割する分割処理、一文字または複数の文字を一つの画像として前記文字要素を分割する分割処理、のいずれか少なくとも一つの分割処理により分割された前記文字要素を再配置し、
    前記再配置文書要素移動手段は、分割された前記文字要素を再配置すること
    を特徴とする請求項6に記載の文書画像編集装置。
  8. 前記文書要素再配置手段は、
    再配置された前記文書要素のレイアウト情報を、構造化文書格納手段により格納すること、
    を特徴とする請求項1ないし請求項7に記載の文書画像編集装置。
  9. 前記プレビュー表示手段は、
    ディスプレイ表示領域に合わせて前記文書画像の拡大縮小処理を行いプレビュー表示すること、
    を特徴とする請求項1ないし請求項8に記載の文書画像編集装置。
  10. 前記プレビュー表示手段は、
    前記文書画像のページ数が複数である場合、予め定められたページ数を同時に表示すること、
    を特徴とする請求項1ないし請求項9に記載の文書画像編集装置。
  11. 文書画像を、文書を構成する文書要素に分解して構造化文書として構造化する構造化ステップと、
    前記構造化文書を格納する構造化文書格納ステップと、
    前記文書要素を前記文書画像と同じレイアウトに配置し、レイアウトされた前記文書要素をプレビュー表示するプレビュー表示ステップと、
    プレビュー表示された前記文書要素の中から利用者による前記文書要素の選択及び、選択された前記文書要素の利用者による編集を受け付ける文書編集ステップと、
    前記文書要素の編集を受け付けた場合に、前記文書要素を再配置する文書要素再配置ステップと、
    を備えることを特徴とする文書画像編集方法。
  12. 請求項11の文書画像編集方法をコンピュータに実行させるための文書画像編集プログラム。
  13. 請求項12のプログラムを格納したことを特徴とするコンピュータ読み取り可能な記録媒体。
JP2013130043A 2013-06-20 2013-06-20 編集装置、編集方法、及びプログラム Expired - Fee Related JP5652509B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013130043A JP5652509B2 (ja) 2013-06-20 2013-06-20 編集装置、編集方法、及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013130043A JP5652509B2 (ja) 2013-06-20 2013-06-20 編集装置、編集方法、及びプログラム

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
JP2009067104A Division JP5298997B2 (ja) 2009-03-18 2009-03-18 文書画像編集装置、文書画像編集方法、文書画像編集プログラム、及びその方法をコンピュータに実行させるプログラムを記憶したコンピュータ読み取り可能な記録媒体

Publications (2)

Publication Number Publication Date
JP2013239187A true JP2013239187A (ja) 2013-11-28
JP5652509B2 JP5652509B2 (ja) 2015-01-14

Family

ID=49764102

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013130043A Expired - Fee Related JP5652509B2 (ja) 2013-06-20 2013-06-20 編集装置、編集方法、及びプログラム

Country Status (1)

Country Link
JP (1) JP5652509B2 (ja)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09128557A (ja) * 1995-10-31 1997-05-16 Matsushita Electric Ind Co Ltd 情報処理装置
JP2006048520A (ja) * 2004-08-06 2006-02-16 Canon Inc 画像処理システム及びその制御方法、並びにプログラム
JP2007109254A (ja) * 2006-12-04 2007-04-26 Ricoh Co Ltd 文書処理装置、文書処理方法およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2007110679A (ja) * 2005-09-16 2007-04-26 Ricoh Co Ltd 画像表示装置、画像表示方法、その方法をコンピュータに実行させるプログラム、および画像表示システム
JP2007150858A (ja) * 2005-11-29 2007-06-14 Ricoh Co Ltd 文書編集装置、画像形成装置、文書編集方法、およびその方法をコンピュータに実行させるプログラム
JP2008135061A (ja) * 2005-08-30 2008-06-12 Profield Co Ltd 情報編集装置、情報編集システム、情報編集方法、およびプログラム
JP2008191948A (ja) * 2007-02-05 2008-08-21 Ricoh Co Ltd レイアウト処理装置、レイアウト処理方法、プログラムおよび記録媒体
JP2008282399A (ja) * 1996-09-09 2008-11-20 Microsoft Corp 媒体でデザインするためのコンテンツの自動的なレイアウトおよび書式設定

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09128557A (ja) * 1995-10-31 1997-05-16 Matsushita Electric Ind Co Ltd 情報処理装置
JP2008282399A (ja) * 1996-09-09 2008-11-20 Microsoft Corp 媒体でデザインするためのコンテンツの自動的なレイアウトおよび書式設定
JP2006048520A (ja) * 2004-08-06 2006-02-16 Canon Inc 画像処理システム及びその制御方法、並びにプログラム
JP2008135061A (ja) * 2005-08-30 2008-06-12 Profield Co Ltd 情報編集装置、情報編集システム、情報編集方法、およびプログラム
JP2007110679A (ja) * 2005-09-16 2007-04-26 Ricoh Co Ltd 画像表示装置、画像表示方法、その方法をコンピュータに実行させるプログラム、および画像表示システム
JP2007150858A (ja) * 2005-11-29 2007-06-14 Ricoh Co Ltd 文書編集装置、画像形成装置、文書編集方法、およびその方法をコンピュータに実行させるプログラム
JP2007109254A (ja) * 2006-12-04 2007-04-26 Ricoh Co Ltd 文書処理装置、文書処理方法およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
JP2008191948A (ja) * 2007-02-05 2008-08-21 Ricoh Co Ltd レイアウト処理装置、レイアウト処理方法、プログラムおよび記録媒体

Also Published As

Publication number Publication date
JP5652509B2 (ja) 2015-01-14

Similar Documents

Publication Publication Date Title
JP4405831B2 (ja) 画像処理装置及びその制御方法、プログラム
JP4371965B2 (ja) 画像処理装置、画像処理方法
JP4181892B2 (ja) 画像処理方法
JP4920928B2 (ja) 画像処理装置及びその制御方法、プログラム
CN107979709B (zh) 图像处理装置、系统、控制方法和计算机可读介质
CN101178725B (zh) 用于信息检索的设备和方法
KR20160060499A (ko) 화상독취장치 및 그의 제어 방법
JP2007034847A (ja) 検索装置及び検索方法
JP2004334336A (ja) 画像処理装置
JP4612571B2 (ja) 画像処理装置、画像処理方法及び画像処理プログラム
JP2009169536A (ja) 情報処理装置、画像形成装置、ドキュメント生成方法、ドキュメント生成プログラム
JP4956319B2 (ja) 画像処理装置、その制御方法、ならびにそのプログラムおよび記憶媒体
US20100011287A1 (en) Apparatus and method for editing document layout and storage medium
JP2009164965A (ja) 画像処理装置および方法ならびにそのためのプログラム
JP5298997B2 (ja) 文書画像編集装置、文書画像編集方法、文書画像編集プログラム、及びその方法をコンピュータに実行させるプログラムを記憶したコンピュータ読み取り可能な記録媒体
US11593386B2 (en) Information processing apparatus and non-transitory computer readable medium
JP2006023944A (ja) 画像処理システム及び画像処理方法
JP4811133B2 (ja) 画像形成装置及び画像処理装置
JP2006093917A (ja) 画像読取装置および画像処理装置、画像形成装置
JP2012008644A (ja) 縮小画像生成装置及びプログラム
JP2007082021A (ja) 画像処理装置、プログラムおよび画像データ処理方法
JP2006333248A (ja) 画像処理装置、画像処理方法、プログラム及び記憶媒体
JP5652509B2 (ja) 編集装置、編集方法、及びプログラム
US20220311889A1 (en) Information processing apparatus and information processing method
JP4047222B2 (ja) 画像処理装置及びその制御方法、プログラム

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140620

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140624

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140825

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20141021

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20141103

R151 Written notification of patent or utility model registration

Ref document number: 5652509

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

LAPS Cancellation because of no payment of annual fees