JP2004258724A - Document creation support device and method, program and recording medium - Google Patents
Document creation support device and method, program and recording medium Download PDFInfo
- Publication number
- JP2004258724A JP2004258724A JP2003045704A JP2003045704A JP2004258724A JP 2004258724 A JP2004258724 A JP 2004258724A JP 2003045704 A JP2003045704 A JP 2003045704A JP 2003045704 A JP2003045704 A JP 2003045704A JP 2004258724 A JP2004258724 A JP 2004258724A
- Authority
- JP
- Japan
- Prior art keywords
- area
- layout
- document
- document information
- image
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Abstract
Description
【0001】
【発明の属する技術分野】
本発明は、文書作成支援装置、方法、プログラム、及び記録媒体、より詳細には、コンピュータシステム等に適用して好適なレイアウト認識技術を利用した文書作成支援装置、方法、プログラム、及び記録媒体に関する。
【0002】
【従来の技術】
紙面上の各種文書をイメージデータとして電子化することにより、従来、複数の紙面上の文書を切り貼りして新しい文書を作成していた編集作業を、コンピュータ上で容易に行えるようにするための編集技術が種々開発されている。このような編集作業を容易且つ効率化するための技術として、文書の構成要素毎にレイアウトを認識するものが知られている。
従来のレイアウト認識技術を利用したものに、レイアウト認識技術により得られたレイアウト構成要素に関する情報に基づく文書編集作業のうち、特に表領域の拡大縮小、内容変更、一部選択などの各種編集作業をユーザの操作負担を著しく軽減して容易且つ迅速に行うことができるようにしたものが開示されている(例えば、特許文献1参照)。
【0003】
【特許文献1】
特開2001−274981号公報
【0004】
【発明が解決しようとする課題】
ここで、スキャナ等により取り込んだイメージデータを他のアプリケーションのデータ形式に変換して利用する場合、イメージデータを構成する文字や画像の各要素のレイアウト情報がアプリケーション間で保持されていないために、データ変換した後に、ユーザがマニュアル操作によりレイアウトし直す必要が生じ、文書作成に手間がかかっていた。また、カタログ等を作成する場合に、既存のカタログフォームをそのままイメージデータとして取り込んで、例えば、Microsoft Word(R)や、PowerPoint(R)等の所望のアプリケーション上で編集作業を行うことができれば、カタログやパンフレット等を迅速且つ低コストで作成することが可能となる。
【0005】
本発明は、上述のごとき実情に鑑みてなされたものであり、スキャナ等の読取装置により読み込んだ文書等のレイアウトを認識すると共に、その文書に含まれる文字や画像等の構成要素を識別して取り込み、取り込んだ各構成要素を前記レイアウトを表現するデータ形式に変換し、そのデータ形式に応じたアプリケーション上において各構成要素の再現、編集を可能とする文書作成支援装置、方法、プログラム、及び記録媒体を提供すること、を目的としてなされたものである。
【0006】
【課題を解決するための手段】
請求項1の発明は、文字領域及び/又は画像領域を含む文書情報が記録された紙面上を走査して前記文書情報をイメージデータとして電子的に読み取る読取装置と接続可能であり、該読取装置により読み取った文書情報の入力を受け付ける入力受付手段と、該入力した文書情報を構成する文字領域及び/又は画像領域のレイアウトを認識するレイアウト認識手段と、該認識したレイアウトを表現するデータ形式に前記文書情報を変換するデータ形式変換手段とを有することを特徴としたものである。
【0007】
請求項2の発明は、文字領域及び/又は画像領域を含む文書情報を記憶した記憶手段と、該記憶した文書情報の中から所望の文書情報を選択し、該選択した文書情報を構成する文字領域及び/又は画像領域のレイアウトを認識するレイアウト認識手段と、該認識したレイアウトを表現するデータ形式に前記文書情報を変換するデータ形式変換手段とを有することを特徴としたものである。
【0008】
請求項3の発明は、請求項1又は2に記載の文書作成支援装置において、前記レイアウト認識手段は、画面上に表示させた文書情報に対してレイアウト認識する範囲を指定し、該指定した範囲内に含まれる構成要素に応じた領域を画像又は文字に分類して認識すると共に、前記分類した領域が文字領域の場合、該文字領域の位置,長さ,高さ,方向,傾きのいずれか複数を認識し、前記分類した領域が画像領域の場合、該画像領域の位置,長さ,高さ,傾きのいずれか複数を認識することにより当該画像領域又は文字領域のレイアウト情報を取得することを特徴としたものである。
【0009】
請求項4の発明は、請求項1又は2の発明において、前記レイアウト認識手段は、画面上に表示させた文書情報全体をレイアウト認識する場合、前記文書情報全体に含まれる構成要素に応じた領域を画像又は文字に分類して認識すると共に、該分類した領域が文字領域の場合、該文字領域の位置,長さ,高さ,方向,傾きのいずれか複数を認識し、前記分類した領域が画像領域の場合、該画像領域の位置,長さ,高さ,傾きのいずれか複数を認識することにより当該画像領域又は文字領域のレイアウト情報を取得することを特徴としたものである。
【0010】
請求項5の発明は、請求項1乃至4のいずれか1の発明において、前記レイアウト認識手段は、文書情報全体又は文書情報に指定した範囲内に含まれる画像領域及び/又は文字領域のレイアウトを認識した結果、該認識した画像領域又は文字領域それぞれに応じた領域枠を画面上に表示すると共に、同一画面上に前記領域枠に応じたレイアウト情報を認識結果として表示できるようにしたことを特徴としたものである。
【0011】
請求項6の発明は、請求項5の発明において、前記構成要素として直線を含み、前記画像領域,文字領域,直線領域それぞれに応じて領域表示の色を設定できるようにしたことを特徴としたものである。
【0012】
請求項7の発明は、請求項1乃至6のいずれか1の発明において、前記レイアウト認識手段は、文書情報全体又は文書情報に指定した範囲内に含まれる画像領域及び/又は文字領域のレイアウトを認識する際に、該認識する領域の画素数が所定値以上の場合、該画素数を予め定めた画素数以下に低減してレイアウトを認識することを特徴としたものである。
【0013】
請求項8の発明は、請求項1乃至7のいずれか1の発明において、前記レイアウト認識手段は、文書情報全体又は文書情報に指定した範囲内に含まれる画像領域及び/又は文字領域のレイアウトを認識した結果、該認識結果の画像領域又は文字領域それぞれにおいて前記文書情報の用紙サイズに対する面積比率を算出し、前記データ形式変換手段は、前記レイアウト認識手段により認識した認識結果を所定のアプリケーションのデータ形式に変換する際に、該アプリケーションで使用する用紙サイズ,用紙の向きを少なくとも含む用紙形式を指定し、該指定した用紙形式に対する前記画像領域及び/又は文字領域のサイズを前記算出した面積比率に基づいて調整し、該サイズ調整した画像領域及び/又は文字領域を前記認識結果のレイアウトを表現するデータ形式に変換して表示することを特徴としたものである。
【0014】
請求項9の発明は、請求項8の発明において、前記データ形式変換手段によりデータ形式を変換してレイアウトされた構成要素を他の構成要素に差し替える際に、前記レイアウトされた構成要素の領域に応じて前記他の構成要素の領域サイズを調整して差し替えることができるようにしたことを特徴としたものである。
【0015】
請求項10の発明は、文字領域及び/又は画像領域を含む文書情報が記録された紙面上を走査して前記文書情報をイメージデータとして電子的に読み取る読取装置と接続された文書作成支援装置を用いて文書作成を支援するための文書作成支援方法において、前記読取装置により読み取った文書情報の入力を受け付ける入力受付ステップと、該入力した文書情報を構成する画像領域及び/又は文字領域のレイアウトを認識するレイアウト認識ステップと、該認識したレイアウトを表現するデータ形式に前記文書情報を変換するデータ形式変換ステップとを有することを特徴としたものである。
【0016】
請求項11の発明は、文書作成を支援するための文書作成支援方法において、文字領域及び/又は画像領域を含む文書情報を記憶した記憶手段の中から所望の文書情報を選択し、該選択した文書情報を構成する画像領域及び/又は文字領域のレイアウトを認識するレイアウト認識ステップと、該認識したレイアウトを表現するデータ形式に前記文書情報を変換するデータ形式変換ステップとを有することを特徴としたものである。
【0017】
請求項12の発明は、請求項1乃至9のいずれか1に記載の文書作成支援装置としての機能をコンピュータに実行させるための、あるいは、請求項10又は11に記載の文書作成支援方法をコンピュータに実行させるためのプログラムである。
【0018】
請求項13の発明は、請求項12に記載のプログラムを記録したコンピュータ読み取り可能な記録媒体。
【0019】
【発明の実施の形態】
図1は、本発明の一実施形態である文書作成支援装置の内部接続状態の一例を示すブロック図で、図中、10は文書作成支援装置で、該文書作成支援装置10は、CPU11,メモリ12,バス13,記憶装置14,入力装置15,表示装置16,記録媒体17,記録媒体読取装置18,ネットワーク19,通信インタフェイス(通信I/F)20を有する。図1に示すように、文書作成支援装置10は、例えばPC(パーソナルコンピュータ)などのコンピュータであり、各種演算を行ない文書作成支援装置10の各部を集中的に制御するCPU11と、各種のROMやRAMからなるメモリ12等がバス13で接続されている。
【0020】
バス13には、所定のインタフェイスを介して、ハードディスクなどの記憶装置14と、マウスやキーボードなどで構成される入力装置15と、LCDやCRTなどの表示装置16と、光ディスクなどの記録媒体17を読み取る記録媒体読取装置18とが接続され、また、インターネットなどのネットワーク19と通信を行なう所定の通信I/F20が接続されている。なお、記録媒体17としては、CD(CD−ROM,CD−RW,CD−Rなどを含む)や、DVDなどの光ディスク、光磁気ディスク、フレキシブルディスク、各種メモリカードなどの各種方式のメディアを用いることができる。また、記録媒体読取装置18は、具体的には記録媒体17の種類に応じて光ディスクドライブ、光磁気ディスクドライブ、フレキシブルディスクドライブ、メモリカードドライブなどが用いられる。
【0021】
記憶装置14には、本発明の文書作成支援装置10としての機能を実行するための文書作成支援プログラムが記憶されている。この文書作成支援プログラムは、記録媒体17から記録媒体読取装置18により読み取るか、あるいは、インターネットなどのネットワーク19からダウンロードするなどして、記憶装置14にインストールしたものである。このインストールにより文書作成支援装置10は動作可能な状態となる。なお、この文書作成支援プログラムは、所定のOS上で動作するものであってもよい。また、特定のアプリケーションソフトの一部をなすものであってもよい。このように本発明は、文書作成支援装置10としての機能をコンピュータに実行させるためのプログラムとしての形態や、当該プログラムを記録した記録媒体としての形態をとることができる。
【0022】
上記文書作成支援プログラムは、スキャナ等の読取装置により読み込んだ文書等のレイアウトを認識すると共に、その文書に含まれる文字や画像等の各構成要素を識別して取り込み、取り込んだ各構成要素を前記レイアウトを表現するデータ形式に変換し、変換したデータ形式に応じたアプリケーション上において各構成要素の再現、編集を可能とするものである。すなわち、この文書作成支援プログラムは、例えば、ワープロ、表計算、プレゼンテーション、名刺作成、カタログ作成などの各種アプリケーションにリンクされており、これらのアプリケーション上において、原稿に含まれる画像又は文字等の構成要素を当該原稿のレイアウトそのままに再現し、編集を行うことを可能とするものである。これにより、ユーザは、カタログやパンフレット等の各種書類や、名刺などを迅速且つ低コストで作成することができる。
【0023】
ここで、レイアウト認識とは、文書又は画像データの中から、タイトル部分や、文章の段落、図、表、画像(写真含む)など、まとまった構成要素として見なせる単位で抽出し、その位置やサイズを求めると共に、各構成要素の種類(例えば、文字又は画像など)を認識し、更に関連する情報を抽出するもので、公知の技術により実現することができる。例えば、構成要素が文章部分であれば、文章を構成する各行の位置や長さ(幅)、高さ、方向、傾き、行に含まれる文字単位の位置や、大きさなども含み、構成要素が画像であれば、各画像の位置や長さ(幅)、高さ、傾きなどを含むものとする。
【0024】
図2は、本発明の文書作成支援装置10の構成例について説明するためのブロック図で、文書作成支援装置10は、画像入力手段10a,表示手段10b,操作入力手段10c,レイアウト認識手段10d,補正手段10e,データ形式変換手段10f,記憶部10gを有し、スキャナ等の読取装置21と接続可能とする。読取装置21は、文字又は画像を含む文書情報が記録された原稿22を走査して前記文書情報をイメージデータとして電子的に読み取るものとする。
【0025】
画像入力手段10aは、文書作成支援装置10に接続された読取装置21により読み取った文書情報(但し、文書情報には画像領域及び/又は文字領域を含む)の入力を受け付ける。レイアウト認識手段10dは、画像入力手段10aで受け付けた文書情報を構成する画像領域及び/又は文字領域のレイアウトを認識する。これら各構成要素のレイアウト情報を含む認識結果は記憶部10gに記憶されるものとする。
【0026】
また、補正手段10eは、レイアウト認識手段10dにより認識した結果を補正するもので、誤認識による不要な結果の一部又は全てを削除したり、認識領域の変更、追加する機能を有する。また、読み込んだ画像の向きが正しくない場合には反転や回転を行って画像補正をしたり、画素数を変更する機能を有するものとする。
【0027】
また、データ形式変換手段10fは、レイアウト認識手段10dにより認識したレイアウトを表現するデータ形式に前記文書情報を変換する。これにより、例えば、ワープロ、表計算、プレゼンテーション、名刺作成、カタログ作成などの各種アプリケーション上において、原稿22に含まれる画像領域又は文字領域等の構成要素を、原稿22のレイアウトそのまま又は相似形に再現し、編集を行うことを可能とする。
【0028】
ここで、別の実施形態として、レイアウト認識手段10dは、読取装置21により読み取った画像領域及び/又は文字領域データ以外に、記憶部10gに記憶されている文書データの中から所望の文書データを選択し、選択した文書データを構成する画像領域又は文字領域データのレイアウトを認識するようにしてもよい。また、読み込み対象としては、例えば、カタログやパンフレット等の印刷物や、名刺を読取装置21で読み込むことに加えて、既存のカタログ画像やパンフレット画像等を記憶部10gに記憶しておけば、直接記憶部10gから画像データ等を読み込むことができる。
【0029】
以下、本発明の文書作成支援装置10が有する各手段について詳細に説明する。
まず、レイアウトの認識を行う前に各種設定を行う。レイアウト認識手段10dは、画面上に表示させた文書情報に対してレイアウト認識する範囲を指定する。但し、文書情報全体を認識する場合には範囲指定を行う必要はない。また、この範囲指定は、ユーザにより任意に指定が可能で、マウス等の入力手段により画面上に表示された文書情報の任意の範囲をドラッグすることで指定することができる。この際、指定された範囲は画面上において点線で囲まれる。このように指定した範囲内に含まれる構成要素に応じた領域を画像領域又は文字領域に分類して認識すると共に、その分類した領域が文字領域の場合、文字領域の位置,長さ,高さ,方向,傾きのいずれか複数を認識し、また、分類した領域が画像領域の場合、画像領域の位置,長さ,高さ,傾きのいずれか複数を認識することにより当該画像領域又は文字領域のレイアウト情報を取得する。また、この構成要素には直線を含めるようにしてもよい。
【0030】
ここで、画像領域又は文字領域を認識する際に、例えば画像領域や写真を含む画像領域は画像ファイルとして認識され、文字領域はOCR(Optical Character Reader)認識されたセルデータとして認識され、その認識結果がレイアウト情報と共に画面上に表示される。このようにOCR処理することで、画像領域と文字領域を分類することができる。ここで、認識した画像領域の画像は画像ファイルとしてトリミングして保存することができる。保存方法としては、例えば、認識結果の表示画面上で選択した画像を個別に保存する、認識結果の表示画面上の全ての画像を一括で保存するなどの方法がある。また、文字領域の文字についても同様に保存することができる。
【0031】
レイアウト認識手段10dは、文書情報全体又は文書情報に指定した範囲内に含まれる画像領域及び/又は文字領域のレイアウトを認識した結果、認識した画像領域及び/又は文字領域それぞれに応じた領域枠を画面上に表示すると共に、同一画面上に領域枠に応じたレイアウト情報を認識結果として表示することができる。この場合、画像領域,文字領域,直線領域の各構成要素に応じて領域表示の色、すなわち、前記領域枠の色又は領域枠内の領域の色を設定するようにしてもよく、これにより、画像の色と領域表示の色を区別しやすくなる。
【0032】
また、レイアウト認識手段10dは、文書情報全体又は文書情報に指定した範囲内に含まれる画像領域及び/又は文字領域のレイアウトを認識する際に、認識する領域の画素数が所定値以上の場合、その画素数を予め定めた画素数以下に低減してレイアウトを認識することができ、認識にかかる時間を短縮することができる。もちろん、画素数をそのままにして認識することも可能である。この場合、処理時間はかかるものの、高解像度での領域認識が可能となる。
【0033】
また、レイアウト認識手段10dは、文書情報全体又は文書情報に指定した範囲内に含まれる画像領域及び/又は文字領域のレイアウトを認識した結果、認識結果の画像領域又は文字領域それぞれにおいて上記文書情報の用紙サイズに対する面積比率を算出する。具体的には、例えば用紙サイズがA4の場合、このA4サイズに対する画像領域又は文字領域の面積比率を算出する(例えば、A4サイズに対して10%とする)。この際、画像領域及び/又は文字領域の大きさ(長さ×高さ)はレイアウトを認識したときにわかるので、この認識した領域の大きさに基づいて面積比率を算出することが可能となる。
【0034】
データ形式変換手段10fは、レイアウト認識手段10dにより認識した認識結果を所定のアプリケーションのデータ形式に変換する際に、そのアプリケーションで使用する用紙サイズ,用紙の向きを少なくとも含む用紙形式を指定する。さらに、指定した用紙形式に対する前記画像領域及び/又は文字領域のサイズを前記算出した面積比率に基づいて調整し、サイズ調整した画像領域及び/又は文字領域を、上記認識結果の画像領域及び/又は文字領域のレイアウトを表現するデータ形式に変換して表示する。具体的には、例えば、認識結果の画像領域及び/又は文字領域がA4サイズの10%の面積比率で且つ指定した用紙サイズがB5サイズである場合、このB5サイズに対して10%の大きさに上記画像領域及び/又は文字領域を自動調整する。この際、画像領域及び/又は文字領域の長さ(幅)と高さ(縦と横の長さ)を同じ比率で調整するため、異なる用紙サイズにおいてもレイアウトを相似形に再現することができる。また、レイアウトする位置については、前述したレイアウト情報の位置をA4→B5の変倍率に応じて調整することでデータ変換後にレイアウトする位置を決定することができる。
【0035】
また、上記データ形式変換時のサイズ調整に関して、例えば、A4→B5の変倍率に応じて画像領域及び/又は文字領域の長さ(幅)と高さ(縦と横の長さ)、すなわち面積を変倍率に合わせてそれぞれ調整するようにしてもよい。この場合もレイアウトする位置については、前述したレイアウト情報の位置をA4→B5の変倍率に応じて調整することでデータ変換後にレイアウトする位置を決定することができる。この方法によっても、上記と同様の変換結果が得られることになる。
【0036】
また、本文書作成支援装置10は、データ形式変換手段10fによりデータ形式を変換してレイアウトされた構成要素に対して、その構成要素の領域に応じて他の構成要素の領域サイズを調整し、レイアウトをそのままに差し替えることもできる。ユーザは、各構成要素を任意に差し替えて、編集することができるため、ユーザオリジナルの書類を容易に作成することができ、また、サイズやレイアウトの調整は適宜ユーザにより行うことができる。
【0037】
図3は、本発明が適用される文書作成支援方法の一例を説明するためのフロー図である。本例は、図2に示した装置構成に基づいて説明するものとする。まず、ステップS1において、画像領域及び/又は文字領域からなる文書情報の読み込みを行う処理を選択する(以下、画像領域で代表するものとする)。この際、ユーザは、読み込み先が外部接続の読取装置21なのか、文書作成支援装置10が有する記憶部10gなのかを選択し(ステップS2)、記憶部10gを選択した場合(図中、記憶部の場合)、既に記憶部10gに保存してある画像データから所望の画像データを読み込む(ステップS3)。上記ステップS2において、読取装置21を選択した場合(図中、読取装置の場合)、読取装置21(本例ではスキャナ)を利用して原稿22を読み込む(ステップS4)。
【0038】
上記ステップS3又はステップS4における読み込み処理後、読み込んだ画像データを画面上に表示し(ステップS5)、表示した画像データのレイアウトを認識する(ステップS6)。このレイアウト認識に関しては前述した方法により行うものとする。次に、レイアウトを認識した認識結果を補正し(ステップS7)、その認識結果をもとのレイアウト(原稿22のレイアウト)のまま、指定のアプリケーションのデータ形式に変換する(ステップS8)。次に、ユーザは、データ形式を変換した画像データを、指定したアプリケーション上で表示、保存する(ステップS9)。
【0039】
図4は、本発明が適用される文書作成支援方法の他の例について説明するための図で、図3に示したステップS6の処理について説明したサブフローである。
まず、ステップS11において、画面上に表示された画像データのレイアウトを認識する処理を選択する。この際、認識する範囲が原稿22全体なのか、原稿22の部分なのかを選択し(ステップS12)、原稿22の部分の場合(図中、部分の場合)、画面上で認識したい部分を範囲指定する(ステップS13)。上記ステップS12において原稿22全体の場合(図中、全体の場合)、ステップS14に移行する。次に、ステップS14において、画像データの認識レベルを設定する。この認識レベルとは、例えば、画像データの構成要素を認識する方向(文字の場合)や、2値画像レベルの設定などが含まれる。次に、原稿22に指定した範囲(又は全体)の画像データを認識し、構成要素毎にレイアウト情報を画面上に表示する(ステップS15)。
【0040】
図5は、読取装置21又は記憶部10gから画像データを読み込むステップにおいて表示される画像データの選択画面の一例を示す図である。本例において、記憶部10gに記憶されている画像データがサムネイル表示され、ユーザはこの中から所望の画像データを選択することができる。ここでは画像データ31が選択されているものとする。尚、読取装置21により原稿22をイメージデータとして読み取るようにしてもよい。
【0041】
図6は、読取装置21又は記憶部10gから画像を読み込むステップにおいて選択された画像データの表示画面例を示す図である。本例において、画面左側には選択画像(ここでは画像データ31)が表示され、画面右側にはレイアウト認識を行った結果が認識結果32として表示される。尚、ここではレイアウト認識を行っていないため、空白となっている。
【0042】
図7は、レイアウト認識ステップにおいて表示される画面例を示す図である。図7(A)において、ユーザは、画像データ31に対してレイアウト認識させたい範囲をマウス等でドラッグして指定する(図中、点線部で囲まれた部分が指定範囲である)。この際、画像データ31全体を認識する場合は、範囲指定する必要はない。さらに、範囲指定した後に、レイアウト認識を行った結果を認識結果32に示す。図7(A)に示すように、各構成要素について、属性(画像,文字,直線)、データ(画像データ,文字データ,直線データ)、文字方向(縦書き又は横書き)、用紙左端部からの左位置、用紙上端部からの上位置、幅(長さ)、高さを含むレイアウト情報が表示されている。
【0043】
また、図7(B)に示すように、領域認識した結果、画像データ31には、画像,文字,直線として認識された領域枠31a,31b,31c,・・・が表示され、この領域枠31a,31b,31c,・・・は、画面右側の認識結果32の結果にそれぞれ対応するものとする。
【0044】
図8は、認識結果の補正ステップにおいて表示される画面例を示す図である。
本例は、認識結果の補正ステップにおいて、画面表示の切り替えについて示したもので、表示方法として、例えば、「画像+領域表示」、「画像表示」、「領域表示」などがあり、これらを必要に応じて切り替えることができる。図8(A)は、「画像+領域表示」を選択した場合の画面表示例で、画像31dの上に認識領域(領域枠31b)が重なった状態で表示される。尚、領域枠31a,31cについても同様で文字及び/又は画像の上に重なって表示される。図8(B)は、「画像表示」を選択した場合の画面表示例で、認識領域(領域枠31b)は表示されずに画像31dのみが表示される。尚、領域枠31a,31cについても同様で文字及び/又は画像の上には表示されず、文字及び/又は画像のみが画面表示される。また、図8(C)は、「領域表示」を選択した場合の画面表示例で、画像31dは表示されずに認識領域(領域枠31b)のみが表示される。尚、領域枠31a,31cについても同様で文字及び/又は画像は表示されず、領域枠31a,31cのみが画面表示される。
【0045】
図9は、他のアプリケーションを起動させて画像データ31を表示させた画面例を示す図である。図9(A)に示すように、他のアプリケーションを起動させる際に、ページ設定画面が表示される。ここでは用紙サイズにA4、用紙向きが縦に指定されている。図9(B)に示すように、図9(A)に示すページ設定画面で指定された条件で所望のアプリケーション上において画像データ31が表示される。このように、画像データ31のレイアウトは、図6に示した画像データ31のレイアウトと同じ状態、すなわち、本文書作成支援装置10に画像データ31を取り込んだ状態と同じレイアウトで表示される。
【0046】
以上、本発明の文書作成支援装置における各機能を中心に各実施形態を説明してきたが、本発明は、文書作成支援装置における各ステップを実行する方法としても説明したように文書作成支援方法としての形態もとることができる。また、この各機能を有する文書作成支援装置と同様に、コンピュータに文書作成支援装置として機能させるためのプログラムとしての形態も、また、そのプログラムを記録した記録媒体としての形態も可能である。
【0047】
本発明による文書作成支援の機能を実現するためのプログラムやデータを記憶した記録媒体の実施形態について説明する。記録媒体としては、具体的には、CD−ROM(−R/−RW)、光磁気ディスク、DVD−ROM、FD、フラッシュメモリ、メモリカードや、メモリスティック及びその他各種ROMやRAM等が想定でき、これら記録媒体に上述した本発明の各実施形態の装置の機能をコンピュータに実行させ、文書作成支援の機能を実現するためのプログラムを記録して流通させることにより、当該機能の実現を容易にする。そしてコンピュータ等の情報処理装置に上記のごとくの記録媒体を装着して情報処理装置によりプログラムを読み出すか、若しくは情報処理装置が備えている記憶媒体に当該プログラムを記憶させておき、必要に応じて読み出すことにより、本発明に関わる文書作成支援の機能を実行することができる。
【0048】
【発明の効果】
本発明によると、スキャナ等の読取装置により読み込んだ文書等のレイアウトを認識すると共に、その文書に含まれる文字や画像等の構成要素を識別して取り込み、取り込んだ各構成要素を前記レイアウトを表現するデータ形式に変換し、該変換したデータ形式に応じたアプリケーション上において各構成要素の再現、編集を可能とすることができる。また、これにより、ユーザは容易且つ迅速にカタログやパンフレット等の書類、名刺等を作成することができる。
【図面の簡単な説明】
【図1】本発明の一実施形態である文書作成支援装置の内部接続状態の一例を示すブロック図である。
【図2】本発明の文書作成支援装置の構成例について説明するためのブロック図である。
【図3】本発明が適用される文書作成支援方法の一例を説明するためのフロー図である。
【図4】本発明が適用される文書作成支援方法の他の例について説明するための図で、図3に示したステップS6の処理について説明したサブフローである。
【図5】読取装置又は記憶部から画像データを読み込むステップにおいて表示される画像データの選択画面の一例を示す図である。
【図6】読取装置又は記憶部から画像を読み込むステップにおいて選択された画像データの表示画面例を示す図である。
【図7】レイアウト認識ステップにおいて表示される画面例を示す図である。
【図8】認識結果の補正ステップにおいて表示される画面例を示す図である。
【図9】他のアプリケーションを起動させて画像データを表示させた画面例を示す図である。
【符号の説明】
10…文書作成支援装置、10a…画像入力手段、10b…表示手段、10c…操作入力手段、10d…レイアウト認識手段、10e…補正手段、10f…データ形式変換手段、10g…記憶部、11…CPU、12…メモリ、13…バス、14…記憶装置、15…入力装置、16…表示装置、17…記録媒体、18…記録媒体読取装置、19…ネットワーク、20…通信I/F、21…読取装置、22…原稿、31…画像データ、31a,31b,31c…領域枠、31d…画像、32…認識結果。[0001]
TECHNICAL FIELD OF THE INVENTION
The present invention relates to a document creation support apparatus, a method, a program, and a recording medium, and more particularly, to a document creation support apparatus, a method, a program, and a recording medium that use a layout recognition technique suitable for a computer system or the like. .
[0002]
[Prior art]
By editing various documents on paper as image data, editing to make it easier to edit on a computer can be done conventionally by cutting and pasting multiple documents on paper and creating a new document. Various technologies have been developed. A technique for recognizing a layout for each component of a document is known as a technique for making such editing work easy and efficient.
Document editing work based on information on layout components obtained by the layout recognition technology, in particular various editing work such as enlargement / reduction of table area, content change, partial selection, etc. Japanese Patent Application Laid-Open No. H11-163,087 discloses a device that can be easily and quickly performed by significantly reducing the operation burden on a user.
[0003]
[Patent Document 1]
JP-A-2001-274981
[0004]
[Problems to be solved by the invention]
Here, when converting image data captured by a scanner or the like into a data format of another application and using the data, layout information of each element of characters and images constituting the image data is not held between applications. After the data conversion, the user has to manually re-layout the data, which requires a lot of time for document creation. Also, when creating a catalog or the like, if an existing catalog form can be directly taken in as image data and edited on a desired application such as, for example, Microsoft Word (R) or PowerPoint (R), Catalogs and pamphlets can be created quickly and at low cost.
[0005]
The present invention has been made in view of the above situation, and recognizes a layout of a document or the like read by a reading device such as a scanner, and identifies components such as characters and images included in the document. A document creation support apparatus, method, program, and recording that converts captured components into a data format representing the layout, and enables reproduction and editing of the components on an application corresponding to the data format. It is intended to provide a medium.
[0006]
[Means for Solving the Problems]
The invention according to
[0007]
According to a second aspect of the present invention, there is provided a storage unit storing document information including a character area and / or an image area, and selecting desired document information from the stored document information, and forming a character string constituting the selected document information. It is characterized by having layout recognition means for recognizing the layout of an area and / or image area, and data format conversion means for converting the document information into a data format expressing the recognized layout.
[0008]
According to a third aspect of the present invention, in the document creation support device according to the first or second aspect, the layout recognizing unit specifies a range for recognizing a layout with respect to the document information displayed on the screen. When the classified region is a character region, any one of the position, length, height, direction, and inclination of the character region is recognized. Recognizing a plurality of objects and, when the classified area is an image area, acquiring layout information of the image area or the character area by recognizing any one of a plurality of positions, lengths, heights, and inclinations of the image area. It is characterized by.
[0009]
According to a fourth aspect of the present invention, in the first or second aspect of the present invention, when the layout recognizing means recognizes the layout of the entire document information displayed on the screen, an area corresponding to a component included in the entire document information Is recognized as an image or a character, and when the classified area is a character area, any one of a plurality of positions, lengths, heights, directions, and inclinations of the character area is recognized, and the classified area is In the case of an image region, layout information of the image region or the character region is obtained by recognizing any one of a plurality of positions, lengths, heights, and inclinations of the image region.
[0010]
According to a fifth aspect of the present invention, in any one of the first to fourth aspects, the layout recognizing means determines a layout of an image area and / or a text area included in the entire document information or in a range specified in the document information. As a result of the recognition, an area frame corresponding to each of the recognized image area or the character area is displayed on the screen, and layout information corresponding to the area frame can be displayed on the same screen as the recognition result. It is what it was.
[0011]
According to a sixth aspect of the present invention, in the fifth aspect of the present invention, a line is included as the component, and the color of the area display can be set according to each of the image area, the character area, and the straight area. Things.
[0012]
According to a seventh aspect of the present invention, in any one of the first to sixth aspects of the present invention, the layout recognizing means determines the layout of the image area and / or the character area included in the entire document information or a range specified in the document information. At the time of recognition, when the number of pixels in the region to be recognized is equal to or more than a predetermined value, the number of pixels is reduced to a predetermined number of pixels or less, and the layout is recognized.
[0013]
According to an eighth aspect of the present invention, in the first aspect of the present invention, the layout recognizing means determines a layout of an image area and / or a character area included in the entire document information or a range specified in the document information. As a result of the recognition, an area ratio of the document information to the paper size is calculated in each of the image area and the character area of the recognition result, and the data format conversion unit converts the recognition result recognized by the layout recognition unit into data of a predetermined application. When converting to a format, a paper format including at least a paper size and a paper orientation to be used in the application is specified, and the size of the image area and / or the text area with respect to the specified paper format is set to the calculated area ratio. And adjusting the size-adjusted image area and / or character area based on the layout of the recognition result. It is obtained by and displaying by converting the data format to represent.
[0014]
According to a ninth aspect of the present invention, in the invention of the eighth aspect, when the data format conversion means replaces a data format and lays out a component laid out with another component, an area of the laid out component is stored in the area of the laid out component. It is characterized in that the area size of the other components can be adjusted and replaced accordingly.
[0015]
According to a tenth aspect of the present invention, there is provided a document creation support device connected to a reading device that scans a sheet of paper on which document information including a character area and / or an image area is recorded and electronically reads the document information as image data. In a document creation supporting method for assisting document creation by using an input receiving step of receiving input of document information read by the reading device, a layout of an image area and / or a character area constituting the input document information is set. The method includes a layout recognition step for recognizing, and a data format conversion step for converting the document information into a data format expressing the recognized layout.
[0016]
According to an eleventh aspect of the present invention, in the document creation support method for supporting document creation, desired document information is selected from storage means for storing document information including a character area and / or an image area, and the selected document information is selected. A layout recognition step of recognizing a layout of an image area and / or a text area constituting the document information; and a data format conversion step of converting the document information into a data format expressing the recognized layout. Things.
[0017]
According to a twelfth aspect of the present invention, there is provided a computer-implemented method for causing a computer to execute the function as the document creation support device according to any one of the first to ninth aspects. Is a program to be executed.
[0018]
According to a thirteenth aspect of the present invention, there is provided a computer-readable recording medium storing the program according to the twelfth aspect.
[0019]
BEST MODE FOR CARRYING OUT THE INVENTION
FIG. 1 is a block diagram showing an example of an internal connection state of a document creation support device according to an embodiment of the present invention. In the drawing,
[0020]
The
[0021]
The
[0022]
The document creation support program recognizes the layout of a document or the like read by a reading device such as a scanner, identifies and captures each component such as characters and images included in the document, and stores the captured component in the document. The layout is converted into a data format expressing the layout, and each component can be reproduced and edited on an application corresponding to the converted data format. That is, the document creation support program is linked to various applications such as word processing, spreadsheets, presentations, business card creation, catalog creation, and the like. Is reproduced as it is with the layout of the original, and editing can be performed. Thus, the user can quickly and inexpensively create various documents such as catalogs and pamphlets and business cards.
[0023]
Here, layout recognition refers to extracting a title or a paragraph of a sentence, a figure, a table, an image (including a photograph) from a document or image data in a unit that can be regarded as a unit, and the position and size thereof. , The type of each component (for example, a character or an image) is recognized, and related information is extracted. This can be realized by a known technique. For example, if the constituent element is a sentence portion, the position, length (width), height, direction, inclination, position of each character included in the line, size, etc. of each line constituting the sentence are also included. Is an image, the position, length (width), height, inclination, etc. of each image are included.
[0024]
FIG. 2 is a block diagram for explaining a configuration example of the document
[0025]
The
[0026]
The correcting unit 10e corrects the result recognized by the
[0027]
The data format conversion unit 10f converts the document information into a data format representing the layout recognized by the
[0028]
Here, as another embodiment, the
[0029]
Hereinafter, each means of the document
First, various settings are made before the layout is recognized. The
[0030]
Here, when recognizing an image area or a character area, for example, an image area or an image area including a photograph is recognized as an image file, and a character area is recognized as OCR (Optical Character Reader) recognized cell data. The result is displayed on the screen together with the layout information. By performing the OCR process in this manner, the image region and the character region can be classified. Here, the image in the recognized image area can be trimmed and stored as an image file. As a storage method, for example, there is a method of individually storing images selected on the recognition result display screen, a method of collectively storing all images on the recognition result display screen, and the like. Also, characters in the character area can be stored in the same manner.
[0031]
The
[0032]
When recognizing the layout of the image area and / or the text area included in the entire document information or in the range specified in the document information, the
[0033]
The
[0034]
When converting the recognition result recognized by the
[0035]
Further, regarding the size adjustment at the time of the data format conversion, for example, the length (width) and height (length and width) of the image area and / or the character area, that is, the area, according to the scaling ratio of A4 → B5 May be adjusted according to the magnification. Also in this case, the layout position can be determined after the data conversion by adjusting the position of the layout information described above according to the scaling ratio of A4 → B5. According to this method, the same conversion result as described above can be obtained.
[0036]
Further, the document
[0037]
FIG. 3 is a flowchart for explaining an example of a document creation support method to which the present invention is applied. This example will be described based on the device configuration shown in FIG. First, in step S1, a process of reading document information including an image area and / or a text area is selected (hereinafter, a process is represented by an image area). At this time, the user selects whether the reading destination is the externally
[0038]
After the reading process in step S3 or S4, the read image data is displayed on the screen (step S5), and the layout of the displayed image data is recognized (step S6). This layout recognition is performed by the method described above. Next, the recognition result obtained by recognizing the layout is corrected (step S7), and the recognition result is converted into the data format of the designated application while keeping the original layout (the layout of the document 22) (step S8). Next, the user displays and saves the converted image data on the specified application (step S9).
[0039]
FIG. 4 is a diagram for explaining another example of the document creation support method to which the present invention is applied, and is a sub-flow describing the process of step S6 shown in FIG.
First, in step S11, a process for recognizing the layout of the image data displayed on the screen is selected. At this time, the user selects whether the range to be recognized is the
[0040]
FIG. 5 is a diagram illustrating an example of an image data selection screen displayed in a step of reading image data from the
[0041]
FIG. 6 is a diagram illustrating an example of a display screen of image data selected in the step of reading an image from the
[0042]
FIG. 7 is a diagram illustrating an example of a screen displayed in the layout recognition step. In FIG. 7A, the user specifies a range to be laid out in the
[0043]
Also, as shown in FIG. 7B, as a result of the area recognition, the
[0044]
FIG. 8 is a diagram showing an example of a screen displayed in the step of correcting the recognition result.
This example shows the switching of the screen display in the step of correcting the recognition result. Examples of the display method include “image + area display”, “image display”, and “area display”. Can be switched according to FIG. 8A is a screen display example when “image + area display” is selected, and is displayed in a state where the recognition area (
[0045]
FIG. 9 is a diagram illustrating an example of a screen in which another application is activated and
[0046]
As described above, each embodiment has been mainly described with respect to each function in the document creation support apparatus of the present invention. However, the present invention is applied as a document creation support method as described as a method of executing each step in the document creation support apparatus. The form can be taken. Further, similarly to the document creation support device having these functions, a form for causing a computer to function as the document creation support device may be used, and a form of a recording medium on which the program is recorded may be used.
[0047]
An embodiment of a recording medium storing a program and data for realizing a document creation support function according to the present invention will be described. Specific examples of the recording medium include a CD-ROM (-R / -RW), a magneto-optical disk, a DVD-ROM, an FD, a flash memory, a memory card, a memory stick, and various other ROMs and RAMs. By causing a computer to execute the functions of the above-described apparatuses of the embodiments of the present invention on these recording media and recording and distributing a program for realizing a document creation support function, it is easy to realize the functions. I do. Then, the program is read by the information processing apparatus by mounting the recording medium as described above on an information processing apparatus such as a computer, or the program is stored in a storage medium provided in the information processing apparatus, and if necessary, By reading, the function of document creation support according to the present invention can be executed.
[0048]
【The invention's effect】
According to the present invention, a layout of a document or the like read by a reading device such as a scanner is recognized, and components such as characters and images included in the document are identified and captured, and the layout of each of the captured components is expressed. The data format can be converted into a data format to be reproduced, and each component can be reproduced and edited on an application corresponding to the converted data format. This also allows the user to easily and quickly create documents such as catalogs and pamphlets, business cards, and the like.
[Brief description of the drawings]
FIG. 1 is a block diagram illustrating an example of an internal connection state of a document creation support device according to an embodiment of the present invention.
FIG. 2 is a block diagram illustrating a configuration example of a document creation support device according to the present invention.
FIG. 3 is a flowchart illustrating an example of a document creation support method to which the present invention is applied.
FIG. 4 is a diagram for explaining another example of the document creation support method to which the present invention is applied, and is a sub-flow describing the process of step S6 shown in FIG. 3;
FIG. 5 is a diagram illustrating an example of an image data selection screen displayed in a step of reading image data from a reading device or a storage unit.
FIG. 6 is a diagram illustrating an example of a display screen of image data selected in a step of reading an image from a reading device or a storage unit.
FIG. 7 is a diagram illustrating an example of a screen displayed in a layout recognition step.
FIG. 8 is a diagram showing an example of a screen displayed in a step of correcting a recognition result.
FIG. 9 is a diagram illustrating an example of a screen on which image data is displayed by activating another application.
[Explanation of symbols]
DESCRIPTION OF
Claims (13)
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003045704A JP4043381B2 (en) | 2003-02-24 | 2003-02-24 | Document creation support apparatus, method, program, and recording medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003045704A JP4043381B2 (en) | 2003-02-24 | 2003-02-24 | Document creation support apparatus, method, program, and recording medium |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2004258724A true JP2004258724A (en) | 2004-09-16 |
JP4043381B2 JP4043381B2 (en) | 2008-02-06 |
Family
ID=33112445
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003045704A Expired - Fee Related JP4043381B2 (en) | 2003-02-24 | 2003-02-24 | Document creation support apparatus, method, program, and recording medium |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4043381B2 (en) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008282149A (en) * | 2007-05-09 | 2008-11-20 | Canon Inc | Image processor, image processing method and image processing program |
JP2008305089A (en) * | 2007-06-06 | 2008-12-18 | Konica Minolta Business Technologies Inc | Document processing method, document processing program and document processor |
JP2009159379A (en) * | 2007-12-27 | 2009-07-16 | Nec Corp | Information processor |
CN104113656A (en) * | 2010-10-25 | 2014-10-22 | 柯尼卡美能达商用科技株式会社 | Data Processing Device And Data Processing Metho |
US8934150B2 (en) | 2012-08-24 | 2015-01-13 | Brother Kogyo Kabushiki Kaisha | Image processing system, image processing method, image processing apparatus, and non-transitory computer readable medium storing image processing program |
JP2015158756A (en) * | 2014-02-24 | 2015-09-03 | ブラザー工業株式会社 | Information processing device, information processing system, and program |
KR101948601B1 (en) * | 2017-11-28 | 2019-02-15 | 주식회사 한글과컴퓨터 | Web based document storage server for changing paper size based on request of changing paper size and operating method thereof |
-
2003
- 2003-02-24 JP JP2003045704A patent/JP4043381B2/en not_active Expired - Fee Related
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008282149A (en) * | 2007-05-09 | 2008-11-20 | Canon Inc | Image processor, image processing method and image processing program |
JP2008305089A (en) * | 2007-06-06 | 2008-12-18 | Konica Minolta Business Technologies Inc | Document processing method, document processing program and document processor |
JP2009159379A (en) * | 2007-12-27 | 2009-07-16 | Nec Corp | Information processor |
CN104113656A (en) * | 2010-10-25 | 2014-10-22 | 柯尼卡美能达商用科技株式会社 | Data Processing Device And Data Processing Metho |
US8934150B2 (en) | 2012-08-24 | 2015-01-13 | Brother Kogyo Kabushiki Kaisha | Image processing system, image processing method, image processing apparatus, and non-transitory computer readable medium storing image processing program |
JP2015158756A (en) * | 2014-02-24 | 2015-09-03 | ブラザー工業株式会社 | Information processing device, information processing system, and program |
KR101948601B1 (en) * | 2017-11-28 | 2019-02-15 | 주식회사 한글과컴퓨터 | Web based document storage server for changing paper size based on request of changing paper size and operating method thereof |
Also Published As
Publication number | Publication date |
---|---|
JP4043381B2 (en) | 2008-02-06 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5465015B2 (en) | Apparatus and method for digitizing documents | |
JP4574467B2 (en) | Data processing apparatus, data processing method, and computer program | |
US10387542B2 (en) | Layout editing apparatus layout editing method, and storage medium for book-binding printed sheets | |
CN100355582C (en) | Image processing apparatus and method | |
KR100788444B1 (en) | Log data recording device and log data recording method | |
US8605341B2 (en) | Control device controlling scan operation | |
US20060126120A1 (en) | Image recording apparatus, method of generating print data for the same, and control program for implementing the method | |
JP5789719B2 (en) | Method and apparatus for determining the display mode of an electronic document | |
JP5366699B2 (en) | Image processing apparatus, image processing method, and image processing program | |
JP7094733B2 (en) | Image processing device, program, image processing method | |
JP4043381B2 (en) | Document creation support apparatus, method, program, and recording medium | |
US10609249B2 (en) | Scanner and scanning control program which outputs an original image and an extracted image in a single file | |
JP2006262442A (en) | Image editing apparatus and image editing method | |
JP5111242B2 (en) | Image processing apparatus and method | |
JP2010072887A (en) | Document processor, printing system, document processing method, and program | |
JP2006262444A (en) | Image processing apparatus and method | |
JP2001118077A (en) | Device and method for preparing document | |
US10051150B2 (en) | Image processing apparatus and medium storing program executable by computer | |
JP3604909B2 (en) | Image registration method | |
JP4323902B2 (en) | Image layout device | |
JP2006115348A (en) | Image information device and image printing method | |
JP5867253B2 (en) | Image forming apparatus and program | |
JP2011186835A (en) | Image processing apparatus and image processing program | |
JP2005184581A (en) | Template display scheme | |
JP5222255B2 (en) | Image forming apparatus and image forming system |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20060203 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20070803 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070821 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20071022 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20071113 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20071113 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101122 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111122 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111122 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121122 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131122 Year of fee payment: 6 |
|
LAPS | Cancellation because of no payment of annual fees |