JP2004258724A - Document creation support device and method, program and recording medium - Google Patents

Document creation support device and method, program and recording medium Download PDF

Info

Publication number
JP2004258724A
JP2004258724A JP2003045704A JP2003045704A JP2004258724A JP 2004258724 A JP2004258724 A JP 2004258724A JP 2003045704 A JP2003045704 A JP 2003045704A JP 2003045704 A JP2003045704 A JP 2003045704A JP 2004258724 A JP2004258724 A JP 2004258724A
Authority
JP
Japan
Prior art keywords
area
layout
document
document information
image
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2003045704A
Other languages
Japanese (ja)
Other versions
JP4043381B2 (en
Inventor
Norihiko Sakata
憲彦 坂田
Toshinori Takagi
俊典 高木
Minoru Hasegawa
稔 長谷川
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2003045704A priority Critical patent/JP4043381B2/en
Publication of JP2004258724A publication Critical patent/JP2004258724A/en
Application granted granted Critical
Publication of JP4043381B2 publication Critical patent/JP4043381B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Abstract

<P>PROBLEM TO BE SOLVED: To recognize layouts of a document or the like electronically read in by a reader, identify and capture constituent elements such as characters and images included in the document, and to convert each constituent element into a data format representative of the layouts. <P>SOLUTION: A document creation support device 10 is connectable to a reader 21 for scanning a document 22 with recorded document information including character areas and/or image areas to electronically read the document information as image data, and has an image inputting means 10a, layout recognizing means 10d, and data format converting means 10f. The document creation support device 10, when receiving an input of document information read by the reader 21, recognizes layouts of character areas and/or image areas constituting the input document information and converts the document information into a data format representative of the layouts. <P>COPYRIGHT: (C)2004,JPO&NCIPI

Description

【0001】
【発明の属する技術分野】
本発明は、文書作成支援装置、方法、プログラム、及び記録媒体、より詳細には、コンピュータシステム等に適用して好適なレイアウト認識技術を利用した文書作成支援装置、方法、プログラム、及び記録媒体に関する。
【0002】
【従来の技術】
紙面上の各種文書をイメージデータとして電子化することにより、従来、複数の紙面上の文書を切り貼りして新しい文書を作成していた編集作業を、コンピュータ上で容易に行えるようにするための編集技術が種々開発されている。このような編集作業を容易且つ効率化するための技術として、文書の構成要素毎にレイアウトを認識するものが知られている。
従来のレイアウト認識技術を利用したものに、レイアウト認識技術により得られたレイアウト構成要素に関する情報に基づく文書編集作業のうち、特に表領域の拡大縮小、内容変更、一部選択などの各種編集作業をユーザの操作負担を著しく軽減して容易且つ迅速に行うことができるようにしたものが開示されている(例えば、特許文献1参照)。
【0003】
【特許文献1】
特開2001−274981号公報
【0004】
【発明が解決しようとする課題】
ここで、スキャナ等により取り込んだイメージデータを他のアプリケーションのデータ形式に変換して利用する場合、イメージデータを構成する文字や画像の各要素のレイアウト情報がアプリケーション間で保持されていないために、データ変換した後に、ユーザがマニュアル操作によりレイアウトし直す必要が生じ、文書作成に手間がかかっていた。また、カタログ等を作成する場合に、既存のカタログフォームをそのままイメージデータとして取り込んで、例えば、Microsoft Word(R)や、PowerPoint(R)等の所望のアプリケーション上で編集作業を行うことができれば、カタログやパンフレット等を迅速且つ低コストで作成することが可能となる。
【0005】
本発明は、上述のごとき実情に鑑みてなされたものであり、スキャナ等の読取装置により読み込んだ文書等のレイアウトを認識すると共に、その文書に含まれる文字や画像等の構成要素を識別して取り込み、取り込んだ各構成要素を前記レイアウトを表現するデータ形式に変換し、そのデータ形式に応じたアプリケーション上において各構成要素の再現、編集を可能とする文書作成支援装置、方法、プログラム、及び記録媒体を提供すること、を目的としてなされたものである。
【0006】
【課題を解決するための手段】
請求項1の発明は、文字領域及び/又は画像領域を含む文書情報が記録された紙面上を走査して前記文書情報をイメージデータとして電子的に読み取る読取装置と接続可能であり、該読取装置により読み取った文書情報の入力を受け付ける入力受付手段と、該入力した文書情報を構成する文字領域及び/又は画像領域のレイアウトを認識するレイアウト認識手段と、該認識したレイアウトを表現するデータ形式に前記文書情報を変換するデータ形式変換手段とを有することを特徴としたものである。
【0007】
請求項2の発明は、文字領域及び/又は画像領域を含む文書情報を記憶した記憶手段と、該記憶した文書情報の中から所望の文書情報を選択し、該選択した文書情報を構成する文字領域及び/又は画像領域のレイアウトを認識するレイアウト認識手段と、該認識したレイアウトを表現するデータ形式に前記文書情報を変換するデータ形式変換手段とを有することを特徴としたものである。
【0008】
請求項3の発明は、請求項1又は2に記載の文書作成支援装置において、前記レイアウト認識手段は、画面上に表示させた文書情報に対してレイアウト認識する範囲を指定し、該指定した範囲内に含まれる構成要素に応じた領域を画像又は文字に分類して認識すると共に、前記分類した領域が文字領域の場合、該文字領域の位置,長さ,高さ,方向,傾きのいずれか複数を認識し、前記分類した領域が画像領域の場合、該画像領域の位置,長さ,高さ,傾きのいずれか複数を認識することにより当該画像領域又は文字領域のレイアウト情報を取得することを特徴としたものである。
【0009】
請求項4の発明は、請求項1又は2の発明において、前記レイアウト認識手段は、画面上に表示させた文書情報全体をレイアウト認識する場合、前記文書情報全体に含まれる構成要素に応じた領域を画像又は文字に分類して認識すると共に、該分類した領域が文字領域の場合、該文字領域の位置,長さ,高さ,方向,傾きのいずれか複数を認識し、前記分類した領域が画像領域の場合、該画像領域の位置,長さ,高さ,傾きのいずれか複数を認識することにより当該画像領域又は文字領域のレイアウト情報を取得することを特徴としたものである。
【0010】
請求項5の発明は、請求項1乃至4のいずれか1の発明において、前記レイアウト認識手段は、文書情報全体又は文書情報に指定した範囲内に含まれる画像領域及び/又は文字領域のレイアウトを認識した結果、該認識した画像領域又は文字領域それぞれに応じた領域枠を画面上に表示すると共に、同一画面上に前記領域枠に応じたレイアウト情報を認識結果として表示できるようにしたことを特徴としたものである。
【0011】
請求項6の発明は、請求項5の発明において、前記構成要素として直線を含み、前記画像領域,文字領域,直線領域それぞれに応じて領域表示の色を設定できるようにしたことを特徴としたものである。
【0012】
請求項7の発明は、請求項1乃至6のいずれか1の発明において、前記レイアウト認識手段は、文書情報全体又は文書情報に指定した範囲内に含まれる画像領域及び/又は文字領域のレイアウトを認識する際に、該認識する領域の画素数が所定値以上の場合、該画素数を予め定めた画素数以下に低減してレイアウトを認識することを特徴としたものである。
【0013】
請求項8の発明は、請求項1乃至7のいずれか1の発明において、前記レイアウト認識手段は、文書情報全体又は文書情報に指定した範囲内に含まれる画像領域及び/又は文字領域のレイアウトを認識した結果、該認識結果の画像領域又は文字領域それぞれにおいて前記文書情報の用紙サイズに対する面積比率を算出し、前記データ形式変換手段は、前記レイアウト認識手段により認識した認識結果を所定のアプリケーションのデータ形式に変換する際に、該アプリケーションで使用する用紙サイズ,用紙の向きを少なくとも含む用紙形式を指定し、該指定した用紙形式に対する前記画像領域及び/又は文字領域のサイズを前記算出した面積比率に基づいて調整し、該サイズ調整した画像領域及び/又は文字領域を前記認識結果のレイアウトを表現するデータ形式に変換して表示することを特徴としたものである。
【0014】
請求項9の発明は、請求項8の発明において、前記データ形式変換手段によりデータ形式を変換してレイアウトされた構成要素を他の構成要素に差し替える際に、前記レイアウトされた構成要素の領域に応じて前記他の構成要素の領域サイズを調整して差し替えることができるようにしたことを特徴としたものである。
【0015】
請求項10の発明は、文字領域及び/又は画像領域を含む文書情報が記録された紙面上を走査して前記文書情報をイメージデータとして電子的に読み取る読取装置と接続された文書作成支援装置を用いて文書作成を支援するための文書作成支援方法において、前記読取装置により読み取った文書情報の入力を受け付ける入力受付ステップと、該入力した文書情報を構成する画像領域及び/又は文字領域のレイアウトを認識するレイアウト認識ステップと、該認識したレイアウトを表現するデータ形式に前記文書情報を変換するデータ形式変換ステップとを有することを特徴としたものである。
【0016】
請求項11の発明は、文書作成を支援するための文書作成支援方法において、文字領域及び/又は画像領域を含む文書情報を記憶した記憶手段の中から所望の文書情報を選択し、該選択した文書情報を構成する画像領域及び/又は文字領域のレイアウトを認識するレイアウト認識ステップと、該認識したレイアウトを表現するデータ形式に前記文書情報を変換するデータ形式変換ステップとを有することを特徴としたものである。
【0017】
請求項12の発明は、請求項1乃至9のいずれか1に記載の文書作成支援装置としての機能をコンピュータに実行させるための、あるいは、請求項10又は11に記載の文書作成支援方法をコンピュータに実行させるためのプログラムである。
【0018】
請求項13の発明は、請求項12に記載のプログラムを記録したコンピュータ読み取り可能な記録媒体。
【0019】
【発明の実施の形態】
図1は、本発明の一実施形態である文書作成支援装置の内部接続状態の一例を示すブロック図で、図中、10は文書作成支援装置で、該文書作成支援装置10は、CPU11,メモリ12,バス13,記憶装置14,入力装置15,表示装置16,記録媒体17,記録媒体読取装置18,ネットワーク19,通信インタフェイス(通信I/F)20を有する。図1に示すように、文書作成支援装置10は、例えばPC(パーソナルコンピュータ)などのコンピュータであり、各種演算を行ない文書作成支援装置10の各部を集中的に制御するCPU11と、各種のROMやRAMからなるメモリ12等がバス13で接続されている。
【0020】
バス13には、所定のインタフェイスを介して、ハードディスクなどの記憶装置14と、マウスやキーボードなどで構成される入力装置15と、LCDやCRTなどの表示装置16と、光ディスクなどの記録媒体17を読み取る記録媒体読取装置18とが接続され、また、インターネットなどのネットワーク19と通信を行なう所定の通信I/F20が接続されている。なお、記録媒体17としては、CD(CD−ROM,CD−RW,CD−Rなどを含む)や、DVDなどの光ディスク、光磁気ディスク、フレキシブルディスク、各種メモリカードなどの各種方式のメディアを用いることができる。また、記録媒体読取装置18は、具体的には記録媒体17の種類に応じて光ディスクドライブ、光磁気ディスクドライブ、フレキシブルディスクドライブ、メモリカードドライブなどが用いられる。
【0021】
記憶装置14には、本発明の文書作成支援装置10としての機能を実行するための文書作成支援プログラムが記憶されている。この文書作成支援プログラムは、記録媒体17から記録媒体読取装置18により読み取るか、あるいは、インターネットなどのネットワーク19からダウンロードするなどして、記憶装置14にインストールしたものである。このインストールにより文書作成支援装置10は動作可能な状態となる。なお、この文書作成支援プログラムは、所定のOS上で動作するものであってもよい。また、特定のアプリケーションソフトの一部をなすものであってもよい。このように本発明は、文書作成支援装置10としての機能をコンピュータに実行させるためのプログラムとしての形態や、当該プログラムを記録した記録媒体としての形態をとることができる。
【0022】
上記文書作成支援プログラムは、スキャナ等の読取装置により読み込んだ文書等のレイアウトを認識すると共に、その文書に含まれる文字や画像等の各構成要素を識別して取り込み、取り込んだ各構成要素を前記レイアウトを表現するデータ形式に変換し、変換したデータ形式に応じたアプリケーション上において各構成要素の再現、編集を可能とするものである。すなわち、この文書作成支援プログラムは、例えば、ワープロ、表計算、プレゼンテーション、名刺作成、カタログ作成などの各種アプリケーションにリンクされており、これらのアプリケーション上において、原稿に含まれる画像又は文字等の構成要素を当該原稿のレイアウトそのままに再現し、編集を行うことを可能とするものである。これにより、ユーザは、カタログやパンフレット等の各種書類や、名刺などを迅速且つ低コストで作成することができる。
【0023】
ここで、レイアウト認識とは、文書又は画像データの中から、タイトル部分や、文章の段落、図、表、画像(写真含む)など、まとまった構成要素として見なせる単位で抽出し、その位置やサイズを求めると共に、各構成要素の種類(例えば、文字又は画像など)を認識し、更に関連する情報を抽出するもので、公知の技術により実現することができる。例えば、構成要素が文章部分であれば、文章を構成する各行の位置や長さ(幅)、高さ、方向、傾き、行に含まれる文字単位の位置や、大きさなども含み、構成要素が画像であれば、各画像の位置や長さ(幅)、高さ、傾きなどを含むものとする。
【0024】
図2は、本発明の文書作成支援装置10の構成例について説明するためのブロック図で、文書作成支援装置10は、画像入力手段10a,表示手段10b,操作入力手段10c,レイアウト認識手段10d,補正手段10e,データ形式変換手段10f,記憶部10gを有し、スキャナ等の読取装置21と接続可能とする。読取装置21は、文字又は画像を含む文書情報が記録された原稿22を走査して前記文書情報をイメージデータとして電子的に読み取るものとする。
【0025】
画像入力手段10aは、文書作成支援装置10に接続された読取装置21により読み取った文書情報(但し、文書情報には画像領域及び/又は文字領域を含む)の入力を受け付ける。レイアウト認識手段10dは、画像入力手段10aで受け付けた文書情報を構成する画像領域及び/又は文字領域のレイアウトを認識する。これら各構成要素のレイアウト情報を含む認識結果は記憶部10gに記憶されるものとする。
【0026】
また、補正手段10eは、レイアウト認識手段10dにより認識した結果を補正するもので、誤認識による不要な結果の一部又は全てを削除したり、認識領域の変更、追加する機能を有する。また、読み込んだ画像の向きが正しくない場合には反転や回転を行って画像補正をしたり、画素数を変更する機能を有するものとする。
【0027】
また、データ形式変換手段10fは、レイアウト認識手段10dにより認識したレイアウトを表現するデータ形式に前記文書情報を変換する。これにより、例えば、ワープロ、表計算、プレゼンテーション、名刺作成、カタログ作成などの各種アプリケーション上において、原稿22に含まれる画像領域又は文字領域等の構成要素を、原稿22のレイアウトそのまま又は相似形に再現し、編集を行うことを可能とする。
【0028】
ここで、別の実施形態として、レイアウト認識手段10dは、読取装置21により読み取った画像領域及び/又は文字領域データ以外に、記憶部10gに記憶されている文書データの中から所望の文書データを選択し、選択した文書データを構成する画像領域又は文字領域データのレイアウトを認識するようにしてもよい。また、読み込み対象としては、例えば、カタログやパンフレット等の印刷物や、名刺を読取装置21で読み込むことに加えて、既存のカタログ画像やパンフレット画像等を記憶部10gに記憶しておけば、直接記憶部10gから画像データ等を読み込むことができる。
【0029】
以下、本発明の文書作成支援装置10が有する各手段について詳細に説明する。
まず、レイアウトの認識を行う前に各種設定を行う。レイアウト認識手段10dは、画面上に表示させた文書情報に対してレイアウト認識する範囲を指定する。但し、文書情報全体を認識する場合には範囲指定を行う必要はない。また、この範囲指定は、ユーザにより任意に指定が可能で、マウス等の入力手段により画面上に表示された文書情報の任意の範囲をドラッグすることで指定することができる。この際、指定された範囲は画面上において点線で囲まれる。このように指定した範囲内に含まれる構成要素に応じた領域を画像領域又は文字領域に分類して認識すると共に、その分類した領域が文字領域の場合、文字領域の位置,長さ,高さ,方向,傾きのいずれか複数を認識し、また、分類した領域が画像領域の場合、画像領域の位置,長さ,高さ,傾きのいずれか複数を認識することにより当該画像領域又は文字領域のレイアウト情報を取得する。また、この構成要素には直線を含めるようにしてもよい。
【0030】
ここで、画像領域又は文字領域を認識する際に、例えば画像領域や写真を含む画像領域は画像ファイルとして認識され、文字領域はOCR(Optical Character Reader)認識されたセルデータとして認識され、その認識結果がレイアウト情報と共に画面上に表示される。このようにOCR処理することで、画像領域と文字領域を分類することができる。ここで、認識した画像領域の画像は画像ファイルとしてトリミングして保存することができる。保存方法としては、例えば、認識結果の表示画面上で選択した画像を個別に保存する、認識結果の表示画面上の全ての画像を一括で保存するなどの方法がある。また、文字領域の文字についても同様に保存することができる。
【0031】
レイアウト認識手段10dは、文書情報全体又は文書情報に指定した範囲内に含まれる画像領域及び/又は文字領域のレイアウトを認識した結果、認識した画像領域及び/又は文字領域それぞれに応じた領域枠を画面上に表示すると共に、同一画面上に領域枠に応じたレイアウト情報を認識結果として表示することができる。この場合、画像領域,文字領域,直線領域の各構成要素に応じて領域表示の色、すなわち、前記領域枠の色又は領域枠内の領域の色を設定するようにしてもよく、これにより、画像の色と領域表示の色を区別しやすくなる。
【0032】
また、レイアウト認識手段10dは、文書情報全体又は文書情報に指定した範囲内に含まれる画像領域及び/又は文字領域のレイアウトを認識する際に、認識する領域の画素数が所定値以上の場合、その画素数を予め定めた画素数以下に低減してレイアウトを認識することができ、認識にかかる時間を短縮することができる。もちろん、画素数をそのままにして認識することも可能である。この場合、処理時間はかかるものの、高解像度での領域認識が可能となる。
【0033】
また、レイアウト認識手段10dは、文書情報全体又は文書情報に指定した範囲内に含まれる画像領域及び/又は文字領域のレイアウトを認識した結果、認識結果の画像領域又は文字領域それぞれにおいて上記文書情報の用紙サイズに対する面積比率を算出する。具体的には、例えば用紙サイズがA4の場合、このA4サイズに対する画像領域又は文字領域の面積比率を算出する(例えば、A4サイズに対して10%とする)。この際、画像領域及び/又は文字領域の大きさ(長さ×高さ)はレイアウトを認識したときにわかるので、この認識した領域の大きさに基づいて面積比率を算出することが可能となる。
【0034】
データ形式変換手段10fは、レイアウト認識手段10dにより認識した認識結果を所定のアプリケーションのデータ形式に変換する際に、そのアプリケーションで使用する用紙サイズ,用紙の向きを少なくとも含む用紙形式を指定する。さらに、指定した用紙形式に対する前記画像領域及び/又は文字領域のサイズを前記算出した面積比率に基づいて調整し、サイズ調整した画像領域及び/又は文字領域を、上記認識結果の画像領域及び/又は文字領域のレイアウトを表現するデータ形式に変換して表示する。具体的には、例えば、認識結果の画像領域及び/又は文字領域がA4サイズの10%の面積比率で且つ指定した用紙サイズがB5サイズである場合、このB5サイズに対して10%の大きさに上記画像領域及び/又は文字領域を自動調整する。この際、画像領域及び/又は文字領域の長さ(幅)と高さ(縦と横の長さ)を同じ比率で調整するため、異なる用紙サイズにおいてもレイアウトを相似形に再現することができる。また、レイアウトする位置については、前述したレイアウト情報の位置をA4→B5の変倍率に応じて調整することでデータ変換後にレイアウトする位置を決定することができる。
【0035】
また、上記データ形式変換時のサイズ調整に関して、例えば、A4→B5の変倍率に応じて画像領域及び/又は文字領域の長さ(幅)と高さ(縦と横の長さ)、すなわち面積を変倍率に合わせてそれぞれ調整するようにしてもよい。この場合もレイアウトする位置については、前述したレイアウト情報の位置をA4→B5の変倍率に応じて調整することでデータ変換後にレイアウトする位置を決定することができる。この方法によっても、上記と同様の変換結果が得られることになる。
【0036】
また、本文書作成支援装置10は、データ形式変換手段10fによりデータ形式を変換してレイアウトされた構成要素に対して、その構成要素の領域に応じて他の構成要素の領域サイズを調整し、レイアウトをそのままに差し替えることもできる。ユーザは、各構成要素を任意に差し替えて、編集することができるため、ユーザオリジナルの書類を容易に作成することができ、また、サイズやレイアウトの調整は適宜ユーザにより行うことができる。
【0037】
図3は、本発明が適用される文書作成支援方法の一例を説明するためのフロー図である。本例は、図2に示した装置構成に基づいて説明するものとする。まず、ステップS1において、画像領域及び/又は文字領域からなる文書情報の読み込みを行う処理を選択する(以下、画像領域で代表するものとする)。この際、ユーザは、読み込み先が外部接続の読取装置21なのか、文書作成支援装置10が有する記憶部10gなのかを選択し(ステップS2)、記憶部10gを選択した場合(図中、記憶部の場合)、既に記憶部10gに保存してある画像データから所望の画像データを読み込む(ステップS3)。上記ステップS2において、読取装置21を選択した場合(図中、読取装置の場合)、読取装置21(本例ではスキャナ)を利用して原稿22を読み込む(ステップS4)。
【0038】
上記ステップS3又はステップS4における読み込み処理後、読み込んだ画像データを画面上に表示し(ステップS5)、表示した画像データのレイアウトを認識する(ステップS6)。このレイアウト認識に関しては前述した方法により行うものとする。次に、レイアウトを認識した認識結果を補正し(ステップS7)、その認識結果をもとのレイアウト(原稿22のレイアウト)のまま、指定のアプリケーションのデータ形式に変換する(ステップS8)。次に、ユーザは、データ形式を変換した画像データを、指定したアプリケーション上で表示、保存する(ステップS9)。
【0039】
図4は、本発明が適用される文書作成支援方法の他の例について説明するための図で、図3に示したステップS6の処理について説明したサブフローである。
まず、ステップS11において、画面上に表示された画像データのレイアウトを認識する処理を選択する。この際、認識する範囲が原稿22全体なのか、原稿22の部分なのかを選択し(ステップS12)、原稿22の部分の場合(図中、部分の場合)、画面上で認識したい部分を範囲指定する(ステップS13)。上記ステップS12において原稿22全体の場合(図中、全体の場合)、ステップS14に移行する。次に、ステップS14において、画像データの認識レベルを設定する。この認識レベルとは、例えば、画像データの構成要素を認識する方向(文字の場合)や、2値画像レベルの設定などが含まれる。次に、原稿22に指定した範囲(又は全体)の画像データを認識し、構成要素毎にレイアウト情報を画面上に表示する(ステップS15)。
【0040】
図5は、読取装置21又は記憶部10gから画像データを読み込むステップにおいて表示される画像データの選択画面の一例を示す図である。本例において、記憶部10gに記憶されている画像データがサムネイル表示され、ユーザはこの中から所望の画像データを選択することができる。ここでは画像データ31が選択されているものとする。尚、読取装置21により原稿22をイメージデータとして読み取るようにしてもよい。
【0041】
図6は、読取装置21又は記憶部10gから画像を読み込むステップにおいて選択された画像データの表示画面例を示す図である。本例において、画面左側には選択画像(ここでは画像データ31)が表示され、画面右側にはレイアウト認識を行った結果が認識結果32として表示される。尚、ここではレイアウト認識を行っていないため、空白となっている。
【0042】
図7は、レイアウト認識ステップにおいて表示される画面例を示す図である。図7(A)において、ユーザは、画像データ31に対してレイアウト認識させたい範囲をマウス等でドラッグして指定する(図中、点線部で囲まれた部分が指定範囲である)。この際、画像データ31全体を認識する場合は、範囲指定する必要はない。さらに、範囲指定した後に、レイアウト認識を行った結果を認識結果32に示す。図7(A)に示すように、各構成要素について、属性(画像,文字,直線)、データ(画像データ,文字データ,直線データ)、文字方向(縦書き又は横書き)、用紙左端部からの左位置、用紙上端部からの上位置、幅(長さ)、高さを含むレイアウト情報が表示されている。
【0043】
また、図7(B)に示すように、領域認識した結果、画像データ31には、画像,文字,直線として認識された領域枠31a,31b,31c,・・・が表示され、この領域枠31a,31b,31c,・・・は、画面右側の認識結果32の結果にそれぞれ対応するものとする。
【0044】
図8は、認識結果の補正ステップにおいて表示される画面例を示す図である。
本例は、認識結果の補正ステップにおいて、画面表示の切り替えについて示したもので、表示方法として、例えば、「画像+領域表示」、「画像表示」、「領域表示」などがあり、これらを必要に応じて切り替えることができる。図8(A)は、「画像+領域表示」を選択した場合の画面表示例で、画像31dの上に認識領域(領域枠31b)が重なった状態で表示される。尚、領域枠31a,31cについても同様で文字及び/又は画像の上に重なって表示される。図8(B)は、「画像表示」を選択した場合の画面表示例で、認識領域(領域枠31b)は表示されずに画像31dのみが表示される。尚、領域枠31a,31cについても同様で文字及び/又は画像の上には表示されず、文字及び/又は画像のみが画面表示される。また、図8(C)は、「領域表示」を選択した場合の画面表示例で、画像31dは表示されずに認識領域(領域枠31b)のみが表示される。尚、領域枠31a,31cについても同様で文字及び/又は画像は表示されず、領域枠31a,31cのみが画面表示される。
【0045】
図9は、他のアプリケーションを起動させて画像データ31を表示させた画面例を示す図である。図9(A)に示すように、他のアプリケーションを起動させる際に、ページ設定画面が表示される。ここでは用紙サイズにA4、用紙向きが縦に指定されている。図9(B)に示すように、図9(A)に示すページ設定画面で指定された条件で所望のアプリケーション上において画像データ31が表示される。このように、画像データ31のレイアウトは、図6に示した画像データ31のレイアウトと同じ状態、すなわち、本文書作成支援装置10に画像データ31を取り込んだ状態と同じレイアウトで表示される。
【0046】
以上、本発明の文書作成支援装置における各機能を中心に各実施形態を説明してきたが、本発明は、文書作成支援装置における各ステップを実行する方法としても説明したように文書作成支援方法としての形態もとることができる。また、この各機能を有する文書作成支援装置と同様に、コンピュータに文書作成支援装置として機能させるためのプログラムとしての形態も、また、そのプログラムを記録した記録媒体としての形態も可能である。
【0047】
本発明による文書作成支援の機能を実現するためのプログラムやデータを記憶した記録媒体の実施形態について説明する。記録媒体としては、具体的には、CD−ROM(−R/−RW)、光磁気ディスク、DVD−ROM、FD、フラッシュメモリ、メモリカードや、メモリスティック及びその他各種ROMやRAM等が想定でき、これら記録媒体に上述した本発明の各実施形態の装置の機能をコンピュータに実行させ、文書作成支援の機能を実現するためのプログラムを記録して流通させることにより、当該機能の実現を容易にする。そしてコンピュータ等の情報処理装置に上記のごとくの記録媒体を装着して情報処理装置によりプログラムを読み出すか、若しくは情報処理装置が備えている記憶媒体に当該プログラムを記憶させておき、必要に応じて読み出すことにより、本発明に関わる文書作成支援の機能を実行することができる。
【0048】
【発明の効果】
本発明によると、スキャナ等の読取装置により読み込んだ文書等のレイアウトを認識すると共に、その文書に含まれる文字や画像等の構成要素を識別して取り込み、取り込んだ各構成要素を前記レイアウトを表現するデータ形式に変換し、該変換したデータ形式に応じたアプリケーション上において各構成要素の再現、編集を可能とすることができる。また、これにより、ユーザは容易且つ迅速にカタログやパンフレット等の書類、名刺等を作成することができる。
【図面の簡単な説明】
【図1】本発明の一実施形態である文書作成支援装置の内部接続状態の一例を示すブロック図である。
【図2】本発明の文書作成支援装置の構成例について説明するためのブロック図である。
【図3】本発明が適用される文書作成支援方法の一例を説明するためのフロー図である。
【図4】本発明が適用される文書作成支援方法の他の例について説明するための図で、図3に示したステップS6の処理について説明したサブフローである。
【図5】読取装置又は記憶部から画像データを読み込むステップにおいて表示される画像データの選択画面の一例を示す図である。
【図6】読取装置又は記憶部から画像を読み込むステップにおいて選択された画像データの表示画面例を示す図である。
【図7】レイアウト認識ステップにおいて表示される画面例を示す図である。
【図8】認識結果の補正ステップにおいて表示される画面例を示す図である。
【図9】他のアプリケーションを起動させて画像データを表示させた画面例を示す図である。
【符号の説明】
10…文書作成支援装置、10a…画像入力手段、10b…表示手段、10c…操作入力手段、10d…レイアウト認識手段、10e…補正手段、10f…データ形式変換手段、10g…記憶部、11…CPU、12…メモリ、13…バス、14…記憶装置、15…入力装置、16…表示装置、17…記録媒体、18…記録媒体読取装置、19…ネットワーク、20…通信I/F、21…読取装置、22…原稿、31…画像データ、31a,31b,31c…領域枠、31d…画像、32…認識結果。
[0001]
TECHNICAL FIELD OF THE INVENTION
The present invention relates to a document creation support apparatus, a method, a program, and a recording medium, and more particularly, to a document creation support apparatus, a method, a program, and a recording medium that use a layout recognition technique suitable for a computer system or the like. .
[0002]
[Prior art]
By editing various documents on paper as image data, editing to make it easier to edit on a computer can be done conventionally by cutting and pasting multiple documents on paper and creating a new document. Various technologies have been developed. A technique for recognizing a layout for each component of a document is known as a technique for making such editing work easy and efficient.
Document editing work based on information on layout components obtained by the layout recognition technology, in particular various editing work such as enlargement / reduction of table area, content change, partial selection, etc. Japanese Patent Application Laid-Open No. H11-163,087 discloses a device that can be easily and quickly performed by significantly reducing the operation burden on a user.
[0003]
[Patent Document 1]
JP-A-2001-274981
[0004]
[Problems to be solved by the invention]
Here, when converting image data captured by a scanner or the like into a data format of another application and using the data, layout information of each element of characters and images constituting the image data is not held between applications. After the data conversion, the user has to manually re-layout the data, which requires a lot of time for document creation. Also, when creating a catalog or the like, if an existing catalog form can be directly taken in as image data and edited on a desired application such as, for example, Microsoft Word (R) or PowerPoint (R), Catalogs and pamphlets can be created quickly and at low cost.
[0005]
The present invention has been made in view of the above situation, and recognizes a layout of a document or the like read by a reading device such as a scanner, and identifies components such as characters and images included in the document. A document creation support apparatus, method, program, and recording that converts captured components into a data format representing the layout, and enables reproduction and editing of the components on an application corresponding to the data format. It is intended to provide a medium.
[0006]
[Means for Solving the Problems]
The invention according to claim 1 is connectable to a reading device that scans a sheet of paper on which document information including a character area and / or an image area is recorded and electronically reads the document information as image data. Input receiving means for receiving an input of the document information read by the computer, layout recognizing means for recognizing a layout of a character area and / or an image area constituting the input document information, and a data format expressing the recognized layout. Data format conversion means for converting document information.
[0007]
According to a second aspect of the present invention, there is provided a storage unit storing document information including a character area and / or an image area, and selecting desired document information from the stored document information, and forming a character string constituting the selected document information. It is characterized by having layout recognition means for recognizing the layout of an area and / or image area, and data format conversion means for converting the document information into a data format expressing the recognized layout.
[0008]
According to a third aspect of the present invention, in the document creation support device according to the first or second aspect, the layout recognizing unit specifies a range for recognizing a layout with respect to the document information displayed on the screen. When the classified region is a character region, any one of the position, length, height, direction, and inclination of the character region is recognized. Recognizing a plurality of objects and, when the classified area is an image area, acquiring layout information of the image area or the character area by recognizing any one of a plurality of positions, lengths, heights, and inclinations of the image area. It is characterized by.
[0009]
According to a fourth aspect of the present invention, in the first or second aspect of the present invention, when the layout recognizing means recognizes the layout of the entire document information displayed on the screen, an area corresponding to a component included in the entire document information Is recognized as an image or a character, and when the classified area is a character area, any one of a plurality of positions, lengths, heights, directions, and inclinations of the character area is recognized, and the classified area is In the case of an image region, layout information of the image region or the character region is obtained by recognizing any one of a plurality of positions, lengths, heights, and inclinations of the image region.
[0010]
According to a fifth aspect of the present invention, in any one of the first to fourth aspects, the layout recognizing means determines a layout of an image area and / or a text area included in the entire document information or in a range specified in the document information. As a result of the recognition, an area frame corresponding to each of the recognized image area or the character area is displayed on the screen, and layout information corresponding to the area frame can be displayed on the same screen as the recognition result. It is what it was.
[0011]
According to a sixth aspect of the present invention, in the fifth aspect of the present invention, a line is included as the component, and the color of the area display can be set according to each of the image area, the character area, and the straight area. Things.
[0012]
According to a seventh aspect of the present invention, in any one of the first to sixth aspects of the present invention, the layout recognizing means determines the layout of the image area and / or the character area included in the entire document information or a range specified in the document information. At the time of recognition, when the number of pixels in the region to be recognized is equal to or more than a predetermined value, the number of pixels is reduced to a predetermined number of pixels or less, and the layout is recognized.
[0013]
According to an eighth aspect of the present invention, in the first aspect of the present invention, the layout recognizing means determines a layout of an image area and / or a character area included in the entire document information or a range specified in the document information. As a result of the recognition, an area ratio of the document information to the paper size is calculated in each of the image area and the character area of the recognition result, and the data format conversion unit converts the recognition result recognized by the layout recognition unit into data of a predetermined application. When converting to a format, a paper format including at least a paper size and a paper orientation to be used in the application is specified, and the size of the image area and / or the text area with respect to the specified paper format is set to the calculated area ratio. And adjusting the size-adjusted image area and / or character area based on the layout of the recognition result. It is obtained by and displaying by converting the data format to represent.
[0014]
According to a ninth aspect of the present invention, in the invention of the eighth aspect, when the data format conversion means replaces a data format and lays out a component laid out with another component, an area of the laid out component is stored in the area of the laid out component. It is characterized in that the area size of the other components can be adjusted and replaced accordingly.
[0015]
According to a tenth aspect of the present invention, there is provided a document creation support device connected to a reading device that scans a sheet of paper on which document information including a character area and / or an image area is recorded and electronically reads the document information as image data. In a document creation supporting method for assisting document creation by using an input receiving step of receiving input of document information read by the reading device, a layout of an image area and / or a character area constituting the input document information is set. The method includes a layout recognition step for recognizing, and a data format conversion step for converting the document information into a data format expressing the recognized layout.
[0016]
According to an eleventh aspect of the present invention, in the document creation support method for supporting document creation, desired document information is selected from storage means for storing document information including a character area and / or an image area, and the selected document information is selected. A layout recognition step of recognizing a layout of an image area and / or a text area constituting the document information; and a data format conversion step of converting the document information into a data format expressing the recognized layout. Things.
[0017]
According to a twelfth aspect of the present invention, there is provided a computer-implemented method for causing a computer to execute the function as the document creation support device according to any one of the first to ninth aspects. Is a program to be executed.
[0018]
According to a thirteenth aspect of the present invention, there is provided a computer-readable recording medium storing the program according to the twelfth aspect.
[0019]
BEST MODE FOR CARRYING OUT THE INVENTION
FIG. 1 is a block diagram showing an example of an internal connection state of a document creation support device according to an embodiment of the present invention. In the drawing, reference numeral 10 denotes a document creation support device, and the document creation support device 10 includes a CPU 11 and a memory. 12, a bus 13, a storage device 14, an input device 15, a display device 16, a recording medium 17, a recording medium reading device 18, a network 19, and a communication interface (communication I / F) 20. As shown in FIG. 1, the document creation support device 10 is a computer such as a PC (personal computer), for example, and performs a variety of calculations to centrally control each unit of the document creation support device 10, and various ROMs and A memory 12 composed of a RAM is connected by a bus 13.
[0020]
The bus 13 includes, via a predetermined interface, a storage device 14 such as a hard disk, an input device 15 such as a mouse and a keyboard, a display device 16 such as an LCD and a CRT, and a recording medium 17 such as an optical disk. And a predetermined communication I / F 20 for communicating with a network 19 such as the Internet. As the recording medium 17, various types of media such as an optical disk such as a CD (including a CD-ROM, a CD-RW, and a CD-R) and a DVD, a magneto-optical disk, a flexible disk, and various memory cards are used. be able to. As the recording medium reading device 18, specifically, an optical disk drive, a magneto-optical disk drive, a flexible disk drive, a memory card drive, or the like is used according to the type of the recording medium 17.
[0021]
The storage device 14 stores a document creation support program for executing the function as the document creation support device 10 of the present invention. This document creation support program is installed in the storage device 14 by reading from the recording medium 17 by the recording medium reading device 18 or by downloading from the network 19 such as the Internet. With this installation, the document creation support device 10 becomes operable. Note that this document creation support program may operate on a predetermined OS. Further, it may be a part of specific application software. As described above, the present invention can take the form of a program for causing a computer to execute the function of the document creation support apparatus 10, or the form of a recording medium on which the program is recorded.
[0022]
The document creation support program recognizes the layout of a document or the like read by a reading device such as a scanner, identifies and captures each component such as characters and images included in the document, and stores the captured component in the document. The layout is converted into a data format expressing the layout, and each component can be reproduced and edited on an application corresponding to the converted data format. That is, the document creation support program is linked to various applications such as word processing, spreadsheets, presentations, business card creation, catalog creation, and the like. Is reproduced as it is with the layout of the original, and editing can be performed. Thus, the user can quickly and inexpensively create various documents such as catalogs and pamphlets and business cards.
[0023]
Here, layout recognition refers to extracting a title or a paragraph of a sentence, a figure, a table, an image (including a photograph) from a document or image data in a unit that can be regarded as a unit, and the position and size thereof. , The type of each component (for example, a character or an image) is recognized, and related information is extracted. This can be realized by a known technique. For example, if the constituent element is a sentence portion, the position, length (width), height, direction, inclination, position of each character included in the line, size, etc. of each line constituting the sentence are also included. Is an image, the position, length (width), height, inclination, etc. of each image are included.
[0024]
FIG. 2 is a block diagram for explaining a configuration example of the document creation support device 10 of the present invention. The document creation support device 10 includes an image input unit 10a, a display unit 10b, an operation input unit 10c, a layout recognition unit 10d, It has a correction unit 10e, a data format conversion unit 10f, and a storage unit 10g, and can be connected to a reading device 21 such as a scanner. The reading device 21 scans a document 22 on which document information including characters or images is recorded, and electronically reads the document information as image data.
[0025]
The image input unit 10a receives an input of document information (the document information includes an image region and / or a character region) read by the reading device 21 connected to the document creation support device 10. The layout recognizing unit 10d recognizes a layout of an image region and / or a character region constituting the document information received by the image input unit 10a. The recognition result including the layout information of each of these components is stored in the storage unit 10g.
[0026]
The correcting unit 10e corrects the result recognized by the layout recognizing unit 10d, and has a function of deleting some or all unnecessary results due to erroneous recognition, and changing or adding a recognition area. If the orientation of the read image is incorrect, the image has a function of inverting or rotating the image to correct the image or changing the number of pixels.
[0027]
The data format conversion unit 10f converts the document information into a data format representing the layout recognized by the layout recognition unit 10d. Thereby, for example, on various applications such as word processing, spreadsheet, presentation, business card creation, catalog creation, etc., the components such as the image area or the text area included in the document 22 are reproduced as the layout of the document 22 or similar. And edit it.
[0028]
Here, as another embodiment, the layout recognizing unit 10d outputs desired document data from the document data stored in the storage unit 10g in addition to the image area and / or character area data read by the reading device 21. The layout of the image area or character area data constituting the selected document data may be recognized. As a reading target, for example, in addition to reading a printed material such as a catalog or a pamphlet or a business card by the reading device 21, if an existing catalog image or a pamphlet image is stored in the storage unit 10g, it is directly stored. Image data and the like can be read from the unit 10g.
[0029]
Hereinafter, each means of the document creation support device 10 of the present invention will be described in detail.
First, various settings are made before the layout is recognized. The layout recognizing unit 10d specifies a range for recognizing the layout of the document information displayed on the screen. However, it is not necessary to specify the range when recognizing the entire document information. The range can be arbitrarily specified by the user, and can be specified by dragging an arbitrary range of the document information displayed on the screen with an input unit such as a mouse. At this time, the designated range is surrounded by a dotted line on the screen. In this manner, the area corresponding to the component included in the specified range is classified and recognized as an image area or a character area. When the classified area is a character area, the position, length, and height of the character area are determined. , Direction, or inclination, and when the classified area is an image area, the image area or character area is recognized by recognizing any one or more of the position, length, height, and inclination of the image area. Get layout information of Also, this component may include a straight line.
[0030]
Here, when recognizing an image area or a character area, for example, an image area or an image area including a photograph is recognized as an image file, and a character area is recognized as OCR (Optical Character Reader) recognized cell data. The result is displayed on the screen together with the layout information. By performing the OCR process in this manner, the image region and the character region can be classified. Here, the image in the recognized image area can be trimmed and stored as an image file. As a storage method, for example, there is a method of individually storing images selected on the recognition result display screen, a method of collectively storing all images on the recognition result display screen, and the like. Also, characters in the character area can be stored in the same manner.
[0031]
The layout recognizing unit 10d recognizes the layout of the image area and / or the character area included in the entire document information or the range specified in the document information, and forms an area frame corresponding to the recognized image area and / or character area. In addition to displaying on the screen, layout information corresponding to the area frame can be displayed on the same screen as a recognition result. In this case, the color of the area display, that is, the color of the area frame or the color of the area in the area frame may be set according to each of the components of the image area, the character area, and the straight line area. It becomes easy to distinguish the color of the image from the color of the area display.
[0032]
When recognizing the layout of the image area and / or the text area included in the entire document information or in the range specified in the document information, the layout recognizing unit 10d determines whether the number of pixels in the recognized area is equal to or larger than a predetermined value. The layout can be recognized by reducing the number of pixels to a predetermined number of pixels or less, and the time required for recognition can be reduced. Of course, it is also possible to recognize the number of pixels as it is. In this case, although processing time is required, high-resolution area recognition is possible.
[0033]
The layout recognizing unit 10d recognizes the layout of the image area and / or the character area included in the entire document information or the range specified in the document information. Calculate the area ratio to the paper size. Specifically, for example, when the paper size is A4, the area ratio of the image area or the character area to the A4 size is calculated (for example, 10% with respect to the A4 size). At this time, since the size (length × height) of the image region and / or the character region is known when the layout is recognized, the area ratio can be calculated based on the size of the recognized region. .
[0034]
When converting the recognition result recognized by the layout recognizing unit 10d into a data format of a predetermined application, the data format conversion unit 10f specifies a paper format including at least a paper size and a paper orientation used by the application. Further, the size of the image region and / or the character region with respect to the specified paper format is adjusted based on the calculated area ratio, and the size-adjusted image region and / or the character region are converted to the image region and / or the recognition result. Convert to a data format that represents the layout of the character area and display it. Specifically, for example, when the image area and / or character area of the recognition result has an area ratio of 10% of the A4 size and the specified paper size is the B5 size, the size of the B5 size is 10%. First, the image area and / or the character area are automatically adjusted. At this time, since the length (width) and the height (length and width) of the image area and / or the character area are adjusted at the same ratio, the layout can be reproduced in a similar form even in different paper sizes. . As for the layout position, the layout position after the data conversion can be determined by adjusting the position of the above-described layout information according to the scaling ratio of A4 → B5.
[0035]
Further, regarding the size adjustment at the time of the data format conversion, for example, the length (width) and height (length and width) of the image area and / or the character area, that is, the area, according to the scaling ratio of A4 → B5 May be adjusted according to the magnification. Also in this case, the layout position can be determined after the data conversion by adjusting the position of the layout information described above according to the scaling ratio of A4 → B5. According to this method, the same conversion result as described above can be obtained.
[0036]
Further, the document creation support device 10 adjusts the area size of another component according to the area of the component with respect to the component laid out by converting the data format by the data format conversion unit 10f, The layout can be replaced as it is. Since the user can arbitrarily replace and edit each component, a user original document can be easily created, and the size and layout can be appropriately adjusted by the user.
[0037]
FIG. 3 is a flowchart for explaining an example of a document creation support method to which the present invention is applied. This example will be described based on the device configuration shown in FIG. First, in step S1, a process of reading document information including an image area and / or a text area is selected (hereinafter, a process is represented by an image area). At this time, the user selects whether the reading destination is the externally connected reading device 21 or the storage unit 10g of the document creation support device 10 (step S2), and selects the storage unit 10g (the storage in the figure). ), Desired image data is read from the image data already stored in the storage unit 10g (step S3). When the reading device 21 is selected in step S2 (in the case of the reading device in the figure), the document 22 is read using the reading device 21 (in this example, a scanner) (step S4).
[0038]
After the reading process in step S3 or S4, the read image data is displayed on the screen (step S5), and the layout of the displayed image data is recognized (step S6). This layout recognition is performed by the method described above. Next, the recognition result obtained by recognizing the layout is corrected (step S7), and the recognition result is converted into the data format of the designated application while keeping the original layout (the layout of the document 22) (step S8). Next, the user displays and saves the converted image data on the specified application (step S9).
[0039]
FIG. 4 is a diagram for explaining another example of the document creation support method to which the present invention is applied, and is a sub-flow describing the process of step S6 shown in FIG.
First, in step S11, a process for recognizing the layout of the image data displayed on the screen is selected. At this time, the user selects whether the range to be recognized is the entire document 22 or the portion of the document 22 (step S12). If the portion to be recognized is the portion of the document 22 (in the case of the portion in the drawing), the portion to be recognized on the screen is set to the range. Specify (step S13). If it is determined in step S12 that the document 22 is the entire document (in the figure, the entire document), the process proceeds to step S14. Next, in step S14, the recognition level of the image data is set. The recognition level includes, for example, a direction (in the case of a character) for recognizing a component of image data, a setting of a binary image level, and the like. Next, the image data in the range (or the whole) specified in the document 22 is recognized, and the layout information is displayed on the screen for each component (step S15).
[0040]
FIG. 5 is a diagram illustrating an example of an image data selection screen displayed in a step of reading image data from the reading device 21 or the storage unit 10g. In this example, the image data stored in the storage unit 10g is displayed as thumbnails, and the user can select desired image data from the thumbnails. Here, it is assumed that the image data 31 has been selected. The document 22 may be read by the reading device 21 as image data.
[0041]
FIG. 6 is a diagram illustrating an example of a display screen of image data selected in the step of reading an image from the reading device 21 or the storage unit 10g. In this example, the selected image (here, the image data 31) is displayed on the left side of the screen, and the result of layout recognition is displayed as the recognition result 32 on the right side of the screen. Here, since the layout recognition is not performed, it is blank.
[0042]
FIG. 7 is a diagram illustrating an example of a screen displayed in the layout recognition step. In FIG. 7A, the user specifies a range to be laid out in the image data 31 by dragging with a mouse or the like (in FIG. 7A, a portion surrounded by a dotted line is a specified range). At this time, when recognizing the entire image data 31, it is not necessary to specify the range. Further, the result of layout recognition after the range is specified is shown as a recognition result 32. As shown in FIG. 7A, attributes (image, character, straight line), data (image data, character data, straight line data), character direction (vertical writing or horizontal writing), and Layout information including a left position, an upper position from the top edge of the sheet, a width (length), and a height is displayed.
[0043]
Also, as shown in FIG. 7B, as a result of the area recognition, the image data 31 displays the area frames 31a, 31b, 31c,... 31a, 31b, 31c,... Correspond to the results of the recognition result 32 on the right side of the screen, respectively.
[0044]
FIG. 8 is a diagram showing an example of a screen displayed in the step of correcting the recognition result.
This example shows the switching of the screen display in the step of correcting the recognition result. Examples of the display method include “image + area display”, “image display”, and “area display”. Can be switched according to FIG. 8A is a screen display example when “image + area display” is selected, and is displayed in a state where the recognition area (area frame 31b) overlaps the image 31d. The same applies to the area frames 31a and 31c, which are displayed overlapping the characters and / or images. FIG. 8B is a screen display example when “image display” is selected, in which only the image 31d is displayed without displaying the recognition area (area frame 31b). Note that the same applies to the region frames 31a and 31c, which are not displayed on the characters and / or images, and only the characters and / or images are displayed on the screen. FIG. 8C is a screen display example when “region display” is selected, in which only the recognition region (region frame 31b) is displayed without displaying the image 31d. Note that the same applies to the region frames 31a and 31c, in which characters and / or images are not displayed, and only the region frames 31a and 31c are displayed on the screen.
[0045]
FIG. 9 is a diagram illustrating an example of a screen in which another application is activated and image data 31 is displayed. As shown in FIG. 9A, a page setting screen is displayed when another application is activated. Here, A4 is specified for the paper size, and the paper orientation is set to portrait. As shown in FIG. 9B, the image data 31 is displayed on a desired application under the conditions specified on the page setting screen shown in FIG. 9A. As described above, the layout of the image data 31 is displayed in the same state as the layout of the image data 31 shown in FIG. 6, that is, the same layout as the state in which the image data 31 is loaded into the document creation support device 10.
[0046]
As described above, each embodiment has been mainly described with respect to each function in the document creation support apparatus of the present invention. However, the present invention is applied as a document creation support method as described as a method of executing each step in the document creation support apparatus. The form can be taken. Further, similarly to the document creation support device having these functions, a form for causing a computer to function as the document creation support device may be used, and a form of a recording medium on which the program is recorded may be used.
[0047]
An embodiment of a recording medium storing a program and data for realizing a document creation support function according to the present invention will be described. Specific examples of the recording medium include a CD-ROM (-R / -RW), a magneto-optical disk, a DVD-ROM, an FD, a flash memory, a memory card, a memory stick, and various other ROMs and RAMs. By causing a computer to execute the functions of the above-described apparatuses of the embodiments of the present invention on these recording media and recording and distributing a program for realizing a document creation support function, it is easy to realize the functions. I do. Then, the program is read by the information processing apparatus by mounting the recording medium as described above on an information processing apparatus such as a computer, or the program is stored in a storage medium provided in the information processing apparatus, and if necessary, By reading, the function of document creation support according to the present invention can be executed.
[0048]
【The invention's effect】
According to the present invention, a layout of a document or the like read by a reading device such as a scanner is recognized, and components such as characters and images included in the document are identified and captured, and the layout of each of the captured components is expressed. The data format can be converted into a data format to be reproduced, and each component can be reproduced and edited on an application corresponding to the converted data format. This also allows the user to easily and quickly create documents such as catalogs and pamphlets, business cards, and the like.
[Brief description of the drawings]
FIG. 1 is a block diagram illustrating an example of an internal connection state of a document creation support device according to an embodiment of the present invention.
FIG. 2 is a block diagram illustrating a configuration example of a document creation support device according to the present invention.
FIG. 3 is a flowchart illustrating an example of a document creation support method to which the present invention is applied.
FIG. 4 is a diagram for explaining another example of the document creation support method to which the present invention is applied, and is a sub-flow describing the process of step S6 shown in FIG. 3;
FIG. 5 is a diagram illustrating an example of an image data selection screen displayed in a step of reading image data from a reading device or a storage unit.
FIG. 6 is a diagram illustrating an example of a display screen of image data selected in a step of reading an image from a reading device or a storage unit.
FIG. 7 is a diagram illustrating an example of a screen displayed in a layout recognition step.
FIG. 8 is a diagram showing an example of a screen displayed in a step of correcting a recognition result.
FIG. 9 is a diagram illustrating an example of a screen on which image data is displayed by activating another application.
[Explanation of symbols]
DESCRIPTION OF SYMBOLS 10 ... Document creation support apparatus, 10a ... Image input means, 10b ... Display means, 10c ... Operation input means, 10d ... Layout recognition means, 10e ... Correction means, 10f ... Data format conversion means, 10g ... Storage part, 11 ... CPU , 12 memory, 13 bus, 14 storage device, 15 input device, 16 display device, 17 recording medium, 18 recording medium reading device, 19 network, 20 communication I / F, 21 reading Apparatus, 22 original, 31 image data, 31a, 31b, 31c area frame, 31d image, 32 recognition result.

Claims (13)

文字領域及び/又は画像領域を含む文書情報が記録された紙面上を走査して前記文書情報をイメージデータとして電子的に読み取る読取装置と接続可能であり、該読取装置により読み取った文書情報の入力を受け付ける入力受付手段と、該入力した文書情報を構成する文字領域及び/又は画像領域のレイアウトを認識するレイアウト認識手段と、該認識したレイアウトを表現するデータ形式に前記文書情報を変換するデータ形式変換手段とを有することを特徴とする文書作成支援装置。It can be connected to a reading device that scans a sheet of paper on which document information including a character area and / or an image area is recorded and electronically reads the document information as image data, and inputs the document information read by the reading device. Input receiving means for receiving the input document information, layout recognizing means for recognizing a layout of a character area and / or an image area constituting the input document information, and a data format for converting the document information into a data format expressing the recognized layout A document creation support device comprising a conversion unit. 文字領域及び/又は画像領域を含む文書情報を記憶した記憶手段と、該記憶した文書情報の中から所望の文書情報を選択し、該選択した文書情報を構成する文字領域及び/又は画像領域のレイアウトを認識するレイアウト認識手段と、該認識したレイアウトを表現するデータ形式に前記文書情報を変換するデータ形式変換手段とを有することを特徴とする文書作成支援装置。A storage unit for storing document information including a character area and / or an image area; and selecting desired document information from the stored document information, and selecting a character area and / or an image area constituting the selected document information. A document creation support device comprising: a layout recognizing means for recognizing a layout; and a data format converting means for converting the document information into a data format expressing the recognized layout. 請求項1又は2に記載の文書作成支援装置において、前記レイアウト認識手段は、画面上に表示させた文書情報に対してレイアウト認識する範囲を指定し、該指定した範囲内に含まれる構成要素に応じた領域を画像又は文字に分類して認識すると共に、前記分類した領域が文字領域の場合、該文字領域の位置,長さ,高さ,方向,傾きのいずれか複数を認識し、前記分類した領域が画像領域の場合、該画像領域の位置,長さ,高さ,傾きのいずれか複数を認識することにより当該画像領域又は文字領域のレイアウト情報を取得することを特徴とする文書作成支援装置。3. The document creation support device according to claim 1, wherein the layout recognizing means specifies a range for recognizing a layout with respect to the document information displayed on the screen, and designates a component included in the specified range. The corresponding area is classified into an image or a character and recognized. If the classified area is a character area, any one of a plurality of positions, lengths, heights, directions, and inclinations of the character area is recognized, and the classification is performed. Document creation support, characterized in that when the extracted area is an image area, layout information of the image area or character area is acquired by recognizing any one of a plurality of positions, lengths, heights, and inclinations of the image area. apparatus. 請求項1又は2に記載の文書作成支援装置において、前記レイアウト認識手段は、画面上に表示させた文書情報全体をレイアウト認識する場合、前記文書情報全体に含まれる構成要素に応じた領域を画像又は文字に分類して認識すると共に、該分類した領域が文字領域の場合、該文字領域の位置,長さ,高さ,方向,傾きのいずれか複数を認識し、前記分類した領域が画像領域の場合、該画像領域の位置,長さ,高さ,傾きのいずれか複数を認識することにより当該画像領域又は文字領域のレイアウト情報を取得することを特徴とする文書作成支援装置。3. The document creation support device according to claim 1, wherein when the layout recognition unit performs layout recognition of the entire document information displayed on the screen, an area corresponding to a component included in the entire document information is imaged. 4. Or, if the classified area is a character area, and if the classified area is a character area, any of a plurality of positions, lengths, heights, directions, and inclinations of the character area is recognized, and the classified area is an image area. In the case of (1), a document creation support device that acquires layout information of the image region or the character region by recognizing any one of a plurality of positions, lengths, heights, and inclinations of the image region. 請求項1乃至4のいずれか1に記載の文書作成支援装置において、前記レイアウト認識手段は、文書情報全体又は文書情報に指定した範囲内に含まれる画像領域及び/又は文字領域のレイアウトを認識した結果、該認識した画像領域又は文字領域それぞれに応じた領域枠を画面上に表示すると共に、同一画面上に前記領域枠に応じたレイアウト情報を認識結果として表示できるようにしたことを特徴とする文書作成支援装置。5. The document creation support device according to claim 1, wherein the layout recognition unit recognizes a layout of an image area and / or a text area included in the entire document information or a range specified in the document information. As a result, an area frame corresponding to each of the recognized image area or character area is displayed on a screen, and layout information corresponding to the area frame can be displayed on the same screen as a recognition result. Document creation support device. 請求項5に記載の文書作成支援装置において、前記構成要素として直線を含み、前記画像領域,文字領域,直線領域それぞれに応じて領域表示の色を設定できるようにしたことを特徴とする文書作成支援装置。6. The document creation support device according to claim 5, wherein a straight line is included as the constituent element, and a color of an area display can be set according to each of the image area, the character area, and the straight line area. Support equipment. 請求項1乃至6のいずれか1に記載の文書作成支援装置において、前記レイアウト認識手段は、文書情報全体又は文書情報に指定した範囲内に含まれる画像領域及び/又は文字領域のレイアウトを認識する際に、該認識する領域の画素数が所定値以上の場合、該画素数を予め定めた画素数以下に低減してレイアウトを認識することを特徴とする文書作成支援装置。7. The document creation support device according to claim 1, wherein the layout recognizing unit recognizes a layout of an image area and / or a character area included in the entire document information or a range specified in the document information. In this case, when the number of pixels in the region to be recognized is equal to or more than a predetermined value, the layout is recognized by reducing the number of pixels to a predetermined number of pixels or less. 請求項1乃至7のいずれか1に記載の文書作成支援装置において、前記レイアウト認識手段は、文書情報全体又は文書情報に指定した範囲内に含まれる画像領域及び/又は文字領域のレイアウトを認識した結果、該認識結果の画像領域又は文字領域それぞれにおいて前記文書情報の用紙サイズに対する面積比率を算出し、前記データ形式変換手段は、前記レイアウト認識手段により認識した認識結果を所定のアプリケーションのデータ形式に変換する際に、該アプリケーションで使用する用紙サイズ,用紙の向きを少なくとも含む用紙形式を指定し、該指定した用紙形式に対する前記画像領域及び/又は文字領域のサイズを前記算出した面積比率に基づいて調整し、該サイズ調整した画像領域及び/又は文字領域を前記認識結果のレイアウトを表現するデータ形式に変換して表示することを特徴とする文書作成支援装置。8. The document creation support device according to claim 1, wherein the layout recognition unit recognizes a layout of an image area and / or a text area included in the entire document information or a range specified in the document information. As a result, the area ratio of the document information to the paper size is calculated in each of the image area and the character area of the recognition result, and the data format conversion unit converts the recognition result recognized by the layout recognition unit into a data format of a predetermined application. At the time of conversion, a paper format including at least a paper size and a paper orientation to be used in the application is designated, and the size of the image area and / or the text area with respect to the designated paper format is determined based on the calculated area ratio. And adjusting the size-adjusted image area and / or character area to a layout of the recognition result. Document creation support apparatus and displaying by converting the data format to represent. 請求項8に記載の文書作成支援装置において、前記データ形式変換手段によりデータ形式を変換してレイアウトされた構成要素を他の構成要素に差し替える際に、前記レイアウトされた構成要素の領域に応じて前記他の構成要素の領域サイズを調整して差し替えることができるようにしたことを特徴とする文書作成支援装置。9. The document creation support device according to claim 8, wherein when the data format conversion unit converts a data format and replaces a component laid out with another component, the component is laid out according to an area of the laid out component. A document creation support device wherein the area size of the other component can be adjusted and replaced. 文字領域及び/又は画像領域を含む文書情報が記録された紙面上を走査して前記文書情報をイメージデータとして電子的に読み取る読取装置と接続された文書作成支援装置を用いて文書作成を支援するための文書作成支援方法において、前記読取装置により読み取った文書情報の入力を受け付ける入力受付ステップと、該入力した文書情報を構成する画像領域及び/又は文字領域のレイアウトを認識するレイアウト認識ステップと、該認識したレイアウトを表現するデータ形式に前記文書情報を変換するデータ形式変換ステップとを有することを特徴とする文書作成支援方法。Document creation is supported using a document creation support device connected to a reading device that scans a sheet of paper on which document information including a character area and / or an image area is recorded and electronically reads the document information as image data. An input receiving step of receiving input of document information read by the reading device, a layout recognizing step of recognizing a layout of an image area and / or a character area constituting the input document information, A data format conversion step of converting the document information into a data format expressing the recognized layout. 文書作成を支援するための文書作成支援方法において、文字領域及び/又は画像領域を含む文書情報を記憶した記憶手段の中から所望の文書情報を選択し、該選択した文書情報を構成する画像領域及び/又は文字領域のレイアウトを認識するレイアウト認識ステップと、該認識したレイアウトを表現するデータ形式に前記文書情報を変換するデータ形式変換ステップとを有することを特徴とする文書作成支援方法。In a document creation supporting method for supporting document creation, desired document information is selected from storage means storing document information including a character area and / or an image area, and an image area constituting the selected document information is selected. And / or a data format conversion step of converting the document information into a data format expressing the recognized layout. 請求項1乃至9のいずれか1に記載の文書作成支援装置としての機能をコンピュータに実行させるための、あるいは、請求項10又は11に記載の文書作成支援方法をコンピュータに実行させるためのプログラム。A program for causing a computer to execute the function as the document creation support device according to any one of claims 1 to 9, or for causing a computer to execute the document creation support method according to claim 10 or 11. 請求項12に記載のプログラムを記録したコンピュータ読み取り可能な記録媒体。A computer-readable recording medium on which the program according to claim 12 is recorded.
JP2003045704A 2003-02-24 2003-02-24 Document creation support apparatus, method, program, and recording medium Expired - Fee Related JP4043381B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003045704A JP4043381B2 (en) 2003-02-24 2003-02-24 Document creation support apparatus, method, program, and recording medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003045704A JP4043381B2 (en) 2003-02-24 2003-02-24 Document creation support apparatus, method, program, and recording medium

Publications (2)

Publication Number Publication Date
JP2004258724A true JP2004258724A (en) 2004-09-16
JP4043381B2 JP4043381B2 (en) 2008-02-06

Family

ID=33112445

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003045704A Expired - Fee Related JP4043381B2 (en) 2003-02-24 2003-02-24 Document creation support apparatus, method, program, and recording medium

Country Status (1)

Country Link
JP (1) JP4043381B2 (en)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008282149A (en) * 2007-05-09 2008-11-20 Canon Inc Image processor, image processing method and image processing program
JP2008305089A (en) * 2007-06-06 2008-12-18 Konica Minolta Business Technologies Inc Document processing method, document processing program and document processor
JP2009159379A (en) * 2007-12-27 2009-07-16 Nec Corp Information processor
CN104113656A (en) * 2010-10-25 2014-10-22 柯尼卡美能达商用科技株式会社 Data Processing Device And Data Processing Metho
US8934150B2 (en) 2012-08-24 2015-01-13 Brother Kogyo Kabushiki Kaisha Image processing system, image processing method, image processing apparatus, and non-transitory computer readable medium storing image processing program
JP2015158756A (en) * 2014-02-24 2015-09-03 ブラザー工業株式会社 Information processing device, information processing system, and program
KR101948601B1 (en) * 2017-11-28 2019-02-15 주식회사 한글과컴퓨터 Web based document storage server for changing paper size based on request of changing paper size and operating method thereof

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008282149A (en) * 2007-05-09 2008-11-20 Canon Inc Image processor, image processing method and image processing program
JP2008305089A (en) * 2007-06-06 2008-12-18 Konica Minolta Business Technologies Inc Document processing method, document processing program and document processor
JP2009159379A (en) * 2007-12-27 2009-07-16 Nec Corp Information processor
CN104113656A (en) * 2010-10-25 2014-10-22 柯尼卡美能达商用科技株式会社 Data Processing Device And Data Processing Metho
US8934150B2 (en) 2012-08-24 2015-01-13 Brother Kogyo Kabushiki Kaisha Image processing system, image processing method, image processing apparatus, and non-transitory computer readable medium storing image processing program
JP2015158756A (en) * 2014-02-24 2015-09-03 ブラザー工業株式会社 Information processing device, information processing system, and program
KR101948601B1 (en) * 2017-11-28 2019-02-15 주식회사 한글과컴퓨터 Web based document storage server for changing paper size based on request of changing paper size and operating method thereof

Also Published As

Publication number Publication date
JP4043381B2 (en) 2008-02-06

Similar Documents

Publication Publication Date Title
JP5465015B2 (en) Apparatus and method for digitizing documents
JP4574467B2 (en) Data processing apparatus, data processing method, and computer program
US10387542B2 (en) Layout editing apparatus layout editing method, and storage medium for book-binding printed sheets
CN100355582C (en) Image processing apparatus and method
KR100788444B1 (en) Log data recording device and log data recording method
US8605341B2 (en) Control device controlling scan operation
US20060126120A1 (en) Image recording apparatus, method of generating print data for the same, and control program for implementing the method
JP5789719B2 (en) Method and apparatus for determining the display mode of an electronic document
JP5366699B2 (en) Image processing apparatus, image processing method, and image processing program
JP7094733B2 (en) Image processing device, program, image processing method
JP4043381B2 (en) Document creation support apparatus, method, program, and recording medium
US10609249B2 (en) Scanner and scanning control program which outputs an original image and an extracted image in a single file
JP2006262442A (en) Image editing apparatus and image editing method
JP5111242B2 (en) Image processing apparatus and method
JP2010072887A (en) Document processor, printing system, document processing method, and program
JP2006262444A (en) Image processing apparatus and method
JP2001118077A (en) Device and method for preparing document
US10051150B2 (en) Image processing apparatus and medium storing program executable by computer
JP3604909B2 (en) Image registration method
JP4323902B2 (en) Image layout device
JP2006115348A (en) Image information device and image printing method
JP5867253B2 (en) Image forming apparatus and program
JP2011186835A (en) Image processing apparatus and image processing program
JP2005184581A (en) Template display scheme
JP5222255B2 (en) Image forming apparatus and image forming system

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060203

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20070803

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20070821

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20071022

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20071113

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20071113

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101122

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111122

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111122

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121122

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131122

Year of fee payment: 6

LAPS Cancellation because of no payment of annual fees