JP4480109B2 - 画像管理装置および画像管理方法 - Google Patents
画像管理装置および画像管理方法 Download PDFInfo
- Publication number
- JP4480109B2 JP4480109B2 JP2000174017A JP2000174017A JP4480109B2 JP 4480109 B2 JP4480109 B2 JP 4480109B2 JP 2000174017 A JP2000174017 A JP 2000174017A JP 2000174017 A JP2000174017 A JP 2000174017A JP 4480109 B2 JP4480109 B2 JP 4480109B2
- Authority
- JP
- Japan
- Prior art keywords
- data
- image
- area
- classification
- identified
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Images
Description
【発明の属する技術分野】
本発明は、文書等を示す画像の管理に関する。
【0002】
【従来の技術】
従来、紙文書を電子化して、文書画像データとして保存する場合は、ドキュメントスキャナ等でスキャンして画像データを作成して保存する方法が採用されている。この場合、文書画像データはデータ容量が大きい場合が多いため、必要に応じて圧縮処理を施して保存することも行われている。
【0003】
ここで、ドキュメントスキャナの1度のスキャンで作成される文書画像データを1ファイルとしたときに、1つの紙文書から作成されるファイルは、通常、複数にわたり、データベース管理されるのが一般的であった。いわゆる文書データベースである。
【0004】
データベースを用いると文書画像データのファイル1つ1つにキーワードを付加することができ、検索に利用することができる。しかしながら、画像を丸ごと保管し、キーワードを付加する作業は、かなり面倒な作業であった。そこで、文書画像データを文字認識処理し、全文検索可能な形式にし、これと文書画像データを共に管理保管する方法も提案されている。
【0005】
図2は、文書画像データをデータベースに登録保存する従来の処理の流れを示した図である。
【0006】
図2(a)は、文書画像データに、キーワードを付加してデータベースに登録する手法を採用した従来の処理の流れを示した図である。紙文書201は、202で、スキャナによって文書画像データ化される。文書画像データ化されたファイルは、203でキーワードが付加され、204で、データベースに登録および保管される。データベース205の中には、キーワードを保存するインデックス(206)と文書画像データの実体(207)とが保管される。
【0007】
一方、上述した処理では、キーワード入力(203)の作業が面倒なため、図2(b)に示すような文字認識を利用したデータベースへの登録も提案されている。この文字認識を利用する方法では、文字コードがそのままキーワードと同じような役割を果たし、全文検索による検索も可能となる。
【0008】
図2(b)の210および211は、図2(a)の201および202に示すものと同様である。212では、文字認識処理が行われ、文書画像データ中のテキスト(TEXT)コードが抽出され、文字コードインデックス(216)が作成される。その後、213で、文字コードインデックス(216)および文書画像データ(217)が、データベースに登録・保管される。
【0009】
キーワードインデックス215を利用する場合と同様に、データベース214中に保存された文字コードインデックス216を利用することにより、文書画像データ217を特定することが可能であるため、利用者は、キーワードインデックス215の入力なしでも、文字コードインデックス216により検索が可能となった。
【0010】
また、図2(a)または(b)に示す方法によらず、通常のファイル保管方法でフォルダに保存する場合は、キーワードや文字コードのインデックスを付したファイルの保管とはならないことから、保管するファイルについてTEXT形式のものも作成し、双方のファイルに実質的に同じ名前のファイル名を付し、同じ場所に保存するなどの方法も提案されている。
【0011】
このように、従来の文書画像の管理手法では、画像データのみならず、その検索等のために利用する種々の情報を画像データと共に管理されている。
【0012】
【発明が解決しようとする課題】
しかしながら、従来の文書画像データをデータベースに保存する方法では、登録の際に、わざわざキーワードや文字認識によるコード情報を付加しても、所望の実体の検索や取出後に、これらの付加情報を文書画像データの実体に添付することができないという問題があった。そのため、付加情報を別ファイル中に取り込み、文書画像データにその付加情報を含む別ファイルを添付して渡す方法がとられ、管理が煩雑になっていた。
【0013】
また、単にフォルダに保存した場合も、文書の実体と付加情報が別々に管埋され、検索や所望の実体の取出後に、文書画像データが引き渡されるのみで、せっかく付加した情報は捨てられてしまうという問題があった。
【0014】
要するに、従来の手法では、画像データの管理のために作成された種々の情報を有効活用できないという問題があった。
【0015】
従って、本発明の目的は、管理される画像に関連する種々の情報を有効に活用し得る画像管理装置、画像管理方法及び記録媒体を提供することである。
【0016】
【課題を解決するための手段】
本発明によれば、画像を管理するための画像管理装置であって、所定の分類毎に前記画像に含まれる各領域を識別し、前記画像中における当該識別された各領域の配置を示す配置データを生成する第1生成手段と、前記識別された各領域に対して、文字認識処理と表解析処理とベクトル変換処理との中から当該各領域の分類に応じて選択される処理を実行することにより、前記各領域の領域データを生成する第2生成手段と、前記識別された全ての領域について、当該領域それぞれの画像を示す部分画像データを生成する第3生成手段と、生成された前記部分画像データと前記領域データと前記配置データとを関連付けて保存する保存手段と、選択指示された出力形式に必要なデータを前記保存手段が保存した各領域の前記部分画像データと前記領域データとの中から前記識別された各領域の分類に応じて抽出し、当該抽出したデータを用いて当該選択指示された出力形式のデータに変換する形式変換手段と、を備えたことを特徴とする画像管理装置が提供される。
【0017】
また、本発明によれば、画像を管理するための画像管理方法であって、第1生成手段が、所定の分類毎に前記画像に含まれる各領域を識別し、前記画像中における当該識別された各領域の配置を示す配置データを生成する第1生成工程と、第2生成手段が、前記識別された各領域に対して、文字認識処理と表解析処理とベクトル変換処理との中から当該各領域の分類に応じて選択される処理を実行することにより、前記各領域の領域データを生成する第2生成工程と、第3生成手段が、前記識別された全ての領域について、当該領域それぞれの画像を示す部分画像データを生成する第3生成工程と、保存手段が、生成された前記部分画像データと前記領域データと前記配置データとを関連付けて保存する保存工程と、形式変換手段が、選択指示された出力形式に必要なデータを前記保存工程で保存した各領域の前記部分画像データと前記領域データとの中から前記識別された各領域の分類に応じて抽出し、当該抽出したデータを用いて当該選択指示された出力形式のデータに変換する形式変換工程と、を含むことを特徴とする画像管理方法が提供される。
【0018】
また、本発明によれば、コンピュータを、所定の分類毎に画像に含まれる各領域を識別し、前記画像中における当該識別された各領域の配置を示す配置データを生成する第1生成手段、前記識別された各領域に対して、文字認識処理と表解析処理とベクトル変換処理との中から当該各領域の分類に応じて選択される処理を実行することにより、前記各領域の領域データを生成する第2生成手段、前記識別された全ての領域について、当該領域それぞれの画像を示す部分画像データを生成する第3生成手段、生成された前記部分画像データと前記領域データと前記配置データとを関連付けて保存する保存手段、選択指示された出力形式に必要なデータを前記保存手段が保存した各領域の前記部分画像データと前記領域データとの中から前記識別された各領域の分類に応じて抽出し、当該抽出したデータを用いて当該選択指示された出力形式のデータに変換する形式変換手段、として機能させるプログラムを記録した記録媒体が提供される。
【0019】
【発明の実施の形態】
以下、本発明の好適な実施の形態について、添付図面を参照して説明する。
【0020】
図1は、本発明の一実施形態に係るドキュメント管理装置の一部を示すブロック図である。この装置において、保存管理の対象である文書画像データは、画像解析がなされ、解析で得られた情報がレイヤ形式の管理情報として付加される。以下、更に詳細に説明する。
【0021】
101は、紙文書等を読取り文書画像データを作成するスキャナである。この文書画像データは、読み取られ紙文書の1または複数ページからなるデータを含むことができる。
【0022】
文書画像データは、圧縮処理部104において、画像圧縮される。画像圧縮の方法には、例えば、多値画像の場合は、JPEG圧縮を用いることができ、また、2値画像の場合は、MMR圧縮を用いることができるが、他の方法でも問題はない。圧縮された文書画像データは、メモリ110に保存される。
【0023】
ここで、本実施の形態においては、画像データ及びこれに関連するデータを特定の形式(以下、PAF(Page Analysis Format)ともいう。)で保存する。そして、全体を示す文書画像データは、メモリ110上に構成された全体画像保存レイヤに保存される。
【0024】
なお、本実施形態においては、文書画像データを圧縮部104において圧縮して保存することとしたが、圧縮せずに原画像データのままで保存してもよい。この際、データ量が多い場合は、実体データを別のメモリに保存し、メモリ110には、その実体データの場所を特定するリンク情報のみを保存するようにしてもよい。
【0025】
2値化処理部102では、文書画像のデータが多値画像データの場合に2値化処理を行う。これは、引きつづき処理されるレイアウト解析、文字認識処理のために行われるものである。この2値化処理の目的は、画質を向上させることを直接の目的とするのではなく、文書画像に含まれるテキスト部分やピクチャ部分を際立たせることである。2値化の処理として、例えば、多値画像の濃度の平均値を算出し、最適なレベルで2値化を行う方式を用いる。
【0026】
レイアウト解析部103では、2値化処理部102から出力された文書画像データを解析し、所定の分類毎に文書画像に含まれる各領域を識別し、各領域の画像データについての情報を作成する。本実施形態では、例えば、テキスト領域、表領域、ピクチャー(絵、図形、写真等を含む)領域、及び、枠(フレーム)領域を識別し、各領域の画像データについての情報を作成する。領域の分類の識別はこれに限られず、例えば、文書画像中のタイトルが表示された領域を、タイトル領域として識別することもできる。
【0027】
また、このレイアウト解析により得られた情報(各領域の配置情報を含む。以下、レイアウト解析情報という。)を作成し、これを、メモリ110のレイアウト情報レイヤに格納する。レイアウト解析部103での処理には、公知の輪郭線追跡手法などによる処理が適用でき、分類・領域識別が可能である。
【0028】
文字認識処理部105では、テキスト領域と識別された領域の画像に含まれる文字を認識するための文字認識処理を行う。認識されたテキストデータは、メモリ110のテキスト&ベクトル保存レイヤに保存される。
【0029】
表解析処理部106では、表領域と判別された領域に対して表解析を行う。表解析処理とは、表領域と識別された領域の画像に含まれる表を解析する処理であって、例えば、(1)表構造の解析(例えば、行数X、列数Yからなる表の構成)(2)表の枠線の認識、(3)表内セルの解析などの処理を行い、表解析情報を出力する処理である。この表解析情報のうち、表の構造に関する情報は、メモリ110のレイアウト情報レイヤに、表中の文字に関する情報はメモリ110のテキスト&ベクトル保存レイヤに保存される。ここで、レイアウト情報レイヤとテキスト&ベクトルレイヤは、別のレイヤではあるが、リンクで密接に結びつけられ、関連付けられている。
【0030】
線画像ベクトル変換部107では、レイアウト解析部103で、フレームと呼ばれる大きな枠を含む領域が認識された場合、その枠を表わすデータを所定の形式のベクトルデータ化する処理(ベクトル変換ともいう。)を行う。
【0031】
例えば、枠が四角形の場合は、四角形の4隅の位置座標を4つのベクトルに変換する処理を行う。ただし、角が丸みをおびているなどの所定の場合には、4つ以上のベクトル情報に変換することもある。この点を図4を用いて説明する。
【0032】
図4の402は、直線の枠で囲まれた線画である。この枠をベクトル変換すると404に示したように4辺で囲まれた枠は、4つのベクトルの情報に変換される。また、403に示すような4隅が内側に曲がっている枠の場合は、405に示すように8つのベクトル情報に変換される。この処理(上述の8つのベクトル情報に変換する処理)は、実際には、画像の枠領域に対して輪郭線追跡処理を行い、その情報に基づき、4隅のベクトルを追加して持つか否かを判断し、追加するとした場合にこの処理が行われる。その他、線画像ベクトル変換部は、文書画像データ中の一般の線画もベクトル変換される場合、これら線画像のベクトル情報も、フレームの情報同様に、領域の配置に関する情報はレイアウト情報レイヤ、ベクトル情報はテキスト&ベクトル保存レイヤに保存される。
【0033】
部分画像切り出し部108では、レイアウト解析処理部103での処理において認識された各領域について文書画像データの切り出しが行われ、その領域の分類にマッチした画像圧縮がなされる。
【0034】
例えば、ピクチャ領域の画像データであって、オリジナルの画像データ101が多値の場合、多値画像圧縮であるJPEGが選択され、テキスト領域の場合、多値よりも2値の画像データとして保持した方が好都合の場合が多く、2値画像データとし、MMR圧縮を行い、保存することができる。このように各分類別に適応的に圧縮を行う。最も圧縮の方法は限定されない。
【0035】
圧縮の結果得たデータは、メモリ110の部分画像保存レイヤに保持する。
【0036】
上述の各部での処理により、メモリ110上にレイヤ構成をもつ文書画像データに関する情報が一つのファイルとして保存される。
【0037】
この情報の作成において、所定の場合には、特定のレイヤについての情報を削除することができる。例えば、全体画像のデータと部分画像のデータとは、実質的に同じ情報を重複して持つこととなるため、文書画像がテキストや表を含むものではなく、複数のピクチャから構成される場合は、全体画像を削除して、部分画像のみを保存するのでも良い。一方、全体画像が複数のテキスト領域から構成される場合は、テキストデータも保存するため、情報の形態が異なり、重複して持っても左程無駄ではない。
【0038】
以上述べた本実施の形態に係るレイヤ構成をとることにより、所定のレイヤ毎に必要な情報を保持することが可能となった。これは、本レイヤ構造をとる場合の特徴である。図1の111は、そのレイヤ構成が視覚的に分かるように、レイヤ構成を模式的に示した図である。
【0039】
次に、図5を用いて、保存される情報について、さらに詳細に説明する。
【0040】
文書画像データ501の全体に対してレイアウト解析を行うと、タイトル(TITLE)、テキスト(TEXT)、ピクチャ(PICTURE)という分類毎の領域を識別する。それぞれの領域のデータは、502に示された木構造でデータ保存される。各領域のデータは、リージョン(REGION)と呼ばれる矩形情報を持ち、その矩形の配置情報(不図示)も保持する。
【0041】
図5の501では3つのリージョン(REGION)が保持され、タイトル(TITLE)、テキスト(TEXT)、ピクチャ(PICTURE)等の分類の情報が保存されている。
【0042】
タイトルリージョンに関しては、その位置関係、文字の大きさ等の情報に基づき、テキスト分類のサブ分類としてTitleという情報を付加している。
【0043】
502のテキストリージョンの木構造は、イメージリンク(image_link)、イメージインフォ(image_info)、コード(code)といった子の木を有する構造である。これには、テキスト領域の部分画像と、その配置情報、及び、文字認識処理により得られるテキストデータが付加される。実際どのようにリンクされるかは、後述する。
【0044】
同様に、ピクチャリージョンについては、イメージリンク(image_link)、イメージインフォ(image_info)が付加される。こちらには、コード(code)という子はない。
【0045】
図6に、図5で説明した形態の情報保存を、実際の文書画像データに当てはめた例を示す。図7には、さらに詳細な記述方法を示した。本実施の形態における情報の作成は、XML(eXtensible Markup Language)を用いて行われる。図7の701に、処理対象の文書画像データを示す。
【0046】
本文書画像データは、レイアウト解析処理部での処理の結果、タイトル(TITLE)、テキスト(TEXT)、ピクチャ(PICTURE)の領域に認識される。各分類の領域のデータは、さらに必要な情報処理が施され、情報が付加され、その結果、702に示すタグ付きの文書フォーマットの画像情報が生成される。
【0047】
各タグには、それぞれ意味付けがされている。ここで意味付けとは、木構成において、ある特定のタグには、決められた意味内容を有するタグが配置されるということである。
【0048】
例えば、<PAF_REG>のタグは、終了タグ</PAF_REG>の間に、テキストを保持する<TXT>タグや画像を保持する<PICTURE>タグを配置することができる。
【0049】
例えば、
のようにである。すなわち、<PAF_REG>タグは、子の木として、<TXT>と<PICTURE>が配置可能という事になる。また、<TXT>には、<BLK_IMG>タグと<BLK_OCR>タグを保持することが可能である。
【0050】
例えば、
である。
【0051】
以上では、保存管理の対象である文書画像データをそのまま保存するのではなく、文書画像データについての所定の解析情報も付加して保存することが可能な構成について説明してきた。
【0052】
次に図3を用いて、作成・保存した情報のうち、所定の情報を取出す方法について説明する。
【0053】
図3のメモリ301は、図1に示すメモリ110と同じであり、上述した手法で各情報が保存されている。
【0054】
抽出処理部302は、出力形式選択指示303に従って、所望のレイヤから必要な情報を抽出する。この抽出は、従来1ページ単位でしか扱えなかったのに対して、文書画像データの中の表のみを取出すといった文書内コンテンツレベルでの抽出も可能である。これは、先に説明したように、本実施形態では、文書内のコンテンツにそれぞれタグを設定しているため、そのタグを頼りに抽出することが可能となったことによる。例えば、図6で示した文書画像データの”TITLE”の部分画像を抽出したいと指示すれば、その部分のみ持ってくることができる。この文書内コンテンツは、1ページのコンテンツのみならず複数ページに渡るコンテンツを持ってくることも可能である。
【0055】
出力形式変換部304は、文書全体あるいは、文書内コンテンツを抽出したものに対して、所望のアプリケーションで読み込める形式に変換する処理部である。これは、引き続き次の処理部とともに説明を行う。
【0056】
図3の305は、出力形式変換部304で変換された、テキスト(Text)中心文書である。これは、ワープロ文書のように文章主体の書類の中にピクチャが存在するような書類である。このような出力形式は、ワープロソフト等のアプリケーションソフトのために設けられる。例えば、マイクロソフト社のワード(商標)のなどのソフトウエア向けの形式である。テキスト(Text)中心文書305を、GUIを用いて表示したときの例を309に示した。この場合、テキスト領域の画像データとしてはテキストデータとして保存されているデータを用い、ピクチャ(PICTURE)領域についてはそのまま部分画像のデータを用いる。表領域については、その表構造を表解析情報に基づき作成し、その表内セルのデータを文字情報に基づき作成する。
【0057】
画像中心文書306は、305と同様に、マイクロソフト社のパワーポイント(PowerPoint(商標))のようなソフトウエア向けの出力形式である。1つ1つの文書内コンテンツの表示には、基本的に部分画像を用いる。部分画像の集まりにより、文書を構成する。しかしながら、利用者の指示により、ある部分はテキストデータを渡してもよい。画像中心文書306を、GUIを用いて表示したときの例を310に示した。
【0058】
表中心文書307は、305等と同様にマイクロソフト社のエクセル(商標)のようなソフトウエア向けの出力形式である。表ソフトへ挿入するデータは、上述の表解析処理結果が表形式情報に変換されてから渡される。表中心文書307を、GUIを用いて表示したときの例を311に示した。
【0059】
また、要約文書308は、管理情報付き画像データ301のテキスト&ベクトル保存レイヤから抽出されたテキスト情報に対し、要約処理がなされた結果得られる、簡略化した文書をいう。要約処理には、文章についてなされる形態素解析などの公知の手法が適用でき、文章相互のつながりや段落の切れなどの情報に基づいて行う、いくつかの手法が知られている。そのような処理を行う、要約処理エンジンにより、要約が作成される。312に、要約文章に画像のサムネール画像を付加して作成されたレポート文書を示す。
【0060】
以上説明したように、本実施形態では、利用者が望む所定の文書内コンテンツを抽出することが可能となると共に、画像と文字コードが混在する場合でも表示することが可能である。さらに、文書画像データを通常のファイル管理におけるファイルの状態で保存し、電子文書について用いるのと同様な全文検索ツールにより検索が可能となる。
【0061】
次に、図8は、文書画像データを上述した手順で複数ページ保存し、その文書画像データと同列で電子文書も統合管理する電子バインダを表す図である。
【0062】
紙文書801は、スキャナ等を用いて読み取られて文書画像データが得られる。その際、上述の処理により、メモリ110のレイヤ構成のフォーマットで、各レイヤ別、矩形領域の情報が保存される。
【0063】
電子文書802は、ワープロ等により電子情報として保持されていた文書である。この電子情報は、本ドキュメント管理に適したフォーマットに変換され、Clear File803が得られる。この処理は、XML保存形式で保存することにより実現される。
【0064】
一般に、電子文書には、文字情報、ベクトル情報、PICTURE、表といった属性別に情報が保存されている。しかしながら、電子文書の形式は、作成されたアプリケーションに依存するため、他のアプリケーションによって作成された電子文書の保存形式は不明であった。そのため、他のアプリケーションによって作成された電子文書の情報を取出すことは困難であった。しかしながら、XML形式は、公開性やドキュメントを人間が読むことを保証する可読性のあり、独自性を排除することになった。また前記属性は、共通化された表現で記述されつつある。803をClear Fileと名称付けたのは、文書画像データや独自形式電子文書が共通の土台で扱えるようになる意味合いで付けたものであり、Clear File803は、複数ページのドキュメントフォーマットで作成される。
【0065】
804に、これらを束ねた電子バインダを示した。従来、電子文書802は、形式が異なるため同列で扱うことはできなかった。しかしながら、両者とも、文書を管理する前記タグを用いることにより公開性があることおよびXML記述という同一の表現を用いていることから、統合が可能でとなった。
【0066】
図9に、電子バインダの木構造の例を示した。901内のSHEETとは、1ページの文書画像データである。この中に解析情報であるレイアウト記述、及び文字認識結果が格納される。
【0067】
次に、下のDocumentというタグは、電子文書からの情報の保存形式である。この電子文書には、レイアウト記述とその中身である各要素別情報が保管されている。例えば、表について、枠線はVector記述で保持され、表の中の文字はCode情報で保持されている。木の構造は異なるが、文書内の要素別に記述されているため、文書内コンテンツ管理が可能となる。
【0068】
図8において、電子バインダを開いて表示した例を805に示した。805の右側に各保存されている文書のサムネール画像を示し、左側にバインダ内から所望のコンテンツを抽出して表示した例を示す。ここで、文書内の各コンテンツの各属性が管理されているため、例えば、表だけを抽出したりすることも可能となる。
【0069】
なお、本発明は、複数の機器(例えば、ホストコンピュータ、インタフェース機器、リーダ、プリンタなど)から構成されるシステムに適用しても、一つの機器からなる装置(例えば、複写機、ファクシミリ装置など)に適用してもよい。
【0070】
また、本発明の目的は、前述した実施形態の機能を実現するソフトウエアのプログラムコードを記録した記憶媒体(または記録媒体)を、システムあるいは装置に供給し、そのシステムあるいは装置のコンピュータ(またはCPUやMPU)が記憶媒体に格納されたプログラムコードを読み出し実行することによっても、達成されることは言うまでもない。この場合、記憶媒体から読み出されたプログラムコード自体が前述した実施形態の機能を実現することになり、そのプログラムコードを記憶した記憶媒体は本発明を構成することになる。また、コンピュータが読み出したプログラムコードを実行することにより、前述した実施形態の機能が実現されるだけでなく、そのプログラムコードの指示に基づき、コンピュータ上で稼働しているオペレーティングシステム(OS)などが実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
【0071】
さらに、記憶媒体から読み出されたプログラムコードが、コンピュータに挿入された機能拡張カードやコンピュータに接続された機能拡張ユニットに備わるメモリに書き込まれた後、そのプログラムコードの指示に基づき、その機能拡張カードや機能拡張ユニットに備わるCPUなどが実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
【0072】
本発明を上述記憶媒体に適用する場合、その記憶媒体には、先に説明したフローチャートに対応するプログラムコードが格納されることになる。
【0073】
【発明の効果】
以上説明したように、本発明によれば、管理される画像に関連する種々の情報を有効に活用することができる。
【図面の簡単な説明】
【図1】本発明の一実施形態に係るドキュメント管理装置の一部を示すブロック図である。
【図2】(a)及び(b)は、文書画像データをデータベースに登録する従来の処理の流れを示した図である。
【図3】本発明の一実施形態に係るドキュメント管理装置の一部を示すブロック図である。
【図4】線画像ベクトル変換部107で、フレームをベクトル変換する方法についての例を示す図である。
【図5】文書画像データの中の各分類別に情報を保存する際の保存形態についての例を示す図である。
【図6】実際の文書画像と文書画像データの保存形態を照らし合わせた例を示す図である。
【図7】実際のドキュメントフォーマットの例を示す図である。
【図8】電子バインダの例を示す図である。
【図9】電子バインダの木構成例を示す図である。
Claims (17)
- 画像を管理するための画像管理装置であって、
所定の分類毎に前記画像に含まれる各領域を識別し、前記画像中における当該識別された各領域の配置を示す配置データを生成する第1生成手段と、
前記識別された各領域に対して、文字認識処理と表解析処理とベクトル変換処理との中から当該各領域の分類に応じて選択される処理を実行することにより、前記各領域の領域データを生成する第2生成手段と、
前記識別された全ての領域について、当該領域それぞれの画像を示す部分画像データを生成する第3生成手段と、
生成された前記部分画像データと前記領域データと前記配置データとを関連付けて保存する保存手段と、
選択指示された出力形式に必要なデータを前記保存手段が保存した各領域の前記部分画像データと前記領域データとの中から前記識別された各領域の分類に応じて抽出し、当該抽出したデータを用いて当該選択指示された出力形式のデータに変換する形式変換手段と、
を備えたことを特徴とする画像管理装置。 - 前記保存手段は、
更に、前記画像の全体を示す全体画像データを、前記部分画像データと前記領域データと前記配置データとに関連付けて保存することを特徴とする請求項1に記載の画像管理装置。 - 前記全体画像データを圧縮する手段を備え、
前記保存手段は、圧縮された前記全体画像データを保存することを特徴とする請求項2に記載の画像管理装置。 - 前記保存手段は、前記部分画像データを、前記識別された各領域の分類にしたがって適応的に圧縮を行って保存することを特徴とする請求項1に記載の画像管理装置。
- 前記保存手段は、前記識別された領域の分類が多値のピクチャ領域の場合は多値画像用圧縮を行った部分画像データを保存し、前記識別された領域の分類がテキスト領域の場合は2値画像にして2値画像用圧縮を行った部分画像データを保存することを特徴とする請求項4に記載の画像管理装置。
- 前記分類には、テキスト、表、枠、線画、若しくは、ピクチャが含まれることを特徴とする請求項1に記載の画像管理装置。
- 前記第2生成手段は、前記識別された領域の分類がテキストである場合、当該領域の画像に含まれる文字に対して前記文字認識処理を実行し、当該文字認識処理で得られるテキストデータを前記領域データとして生成することを特徴とする請求項1乃至6のいずれか1項に記載の画像管理装置。
- 前記第2生成手段は、前記識別された領域の分類が表である場合、当該領域の画像に前記表解析処理を実行し、当該表解析処理で得られる表の構造に関する情報及び当該表に含まれる文字を示すテキストデータを、前記領域データとして生成することを特徴とする請求項1乃至7のいずれか1項に記載の画像管理装置。
- 前記第2生成手段は、前記識別された領域の分類が枠である場合、当該領域の画像に前記ベクトル変換処理を実行し、当該ベクトル変換処理で得られる枠線のベクトルデータを前記領域データとして生成することを特徴とする請求項1乃至8のいずれか1項に記載の画像管理装置。
- 前記第2生成手段は、前記識別された領域の分類が線画である場合、当該領域の画像に前記ベクトル変換処理を実行し、当該ベクトル変換処理で得られる線画のベクトルデータを前記領域データとして生成することを特徴とする請求項1乃至9のいずれか1項に記載の画像管理装置。
- 前記保存された領域データから、指示された分類の領域データを読み出す手段を更に備えたことを特徴とする請求項1に記載の画像管理装置。
- 前記形式変換手段は、前記選択指示された出力形式がテキスト中心の出力形式であった場合、前記識別された分類がテキストである領域については、当該領域の前記領域データとして前記保存手段が保存した、前記文字認識処理で得られたテキストデータを抽出し、前記識別された分類がピクチャである領域については、前記保存手段が保存した前記部分画像データを抽出し、前記識別された分類が表である領域については、当該領域の領域データとして前記保存手段が保存した、前記表解析処理で得られる表の構造に関する情報と当該表に含まれる文字のテキストデータとを抽出し、当該抽出したデータを用いて当該選択指示されたテキスト中心の出力形式のデータに変換することを特徴とする請求項1乃至11のいずれか1項に記載の画像管理装置。
- 前記形式変換手段は、前記選択指示された出力形式が画像中心の出力形式であった場合、前記保存手段が保存した前記各領域の前記部分画像データを抽出し、当該抽出したデータを用いて当該選択指示された画像中心の出力形式のデータに変換することを特徴とする請求項1乃至12のいずれか1項に記載の画像管理装置。
- 前記形式変換手段は、前記選択指示された出力形式が表中心の出力形式であった場合、前記保存手段が前記領域データとして保存した、前記表解析処理で得られる表の構造に関する情報と当該表に含まれる文字のテキストデータとを抽出し、当該抽出したデータを用いて当該選択指示された表中心の出力形式のデータに変換することを特徴とする請求項1乃至13のいずれか1項に記載の画像管理装置。
- 前記形式変換手段は、前記選択指示された出力形式が要約の出力形式であった場合、前記保存手段が保存した、前記文字認識処理で得られたテキストデータを抽出し、当該抽出したテキストデータの要約処理を行うことにより要約文章を作成し、当該作成された要約文章に前記画像のサムネール画像を付加したレポート文書に変換することを特徴とする請求項1乃至14のいずれか1項に記載の画像管理装置。
- 画像を管理するための画像管理方法であって、
第1生成手段が、所定の分類毎に前記画像に含まれる各領域を識別し、前記画像中における当該識別された各領域の配置を示す配置データを生成する第1生成工程と、
第2生成手段が、前記識別された各領域に対して、文字認識処理と表解析処理とベクトル変換処理との中から当該各領域の分類に応じて選択される処理を実行することにより、前記各領域の領域データを生成する第2生成工程と、
第3生成手段が、前記識別された全ての領域について、当該領域それぞれの画像を示す部分画像データを生成する第3生成工程と、
保存手段が、生成された前記部分画像データと前記領域データと前記配置データとを関連付けて保存する保存工程と、
形式変換手段が、選択指示された出力形式に必要なデータを前記保存工程で保存した各領域の前記部分画像データと前記領域データとの中から前記識別された各領域の分類に応じて抽出し、当該抽出したデータを用いて当該選択指示された出力形式のデータに変換する形式変換工程と、
を含むことを特徴とする画像管理方法。 - コンピュータを、
所定の分類毎に画像に含まれる各領域を識別し、前記画像中における当該識別された各領域の配置を示す配置データを生成する第1生成手段、
前記識別された各領域に対して、文字認識処理と表解析処理とベクトル変換処理との中から当該各領域の分類に応じて選択される処理を実行することにより、前記各領域の領域データを生成する第2生成手段、
前記識別された全ての領域について、当該領域それぞれの画像を示す部分画像データを生成する第3生成手段、
生成された前記部分画像データと前記領域データと前記配置データとを関連付けて保存する保存手段、
選択指示された出力形式に必要なデータを前記保存手段が保存した各領域の前記部分画像データと前記領域データとの中から前記識別された各領域の分類に応じて抽出し、当該抽出したデータを用いて当該選択指示された出力形式のデータに変換する形式変換手段、
として機能させるプログラムを記録した記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000174017A JP4480109B2 (ja) | 2000-06-09 | 2000-06-09 | 画像管理装置および画像管理方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000174017A JP4480109B2 (ja) | 2000-06-09 | 2000-06-09 | 画像管理装置および画像管理方法 |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2001351089A JP2001351089A (ja) | 2001-12-21 |
JP2001351089A5 JP2001351089A5 (ja) | 2007-08-02 |
JP4480109B2 true JP4480109B2 (ja) | 2010-06-16 |
Family
ID=18676141
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000174017A Expired - Lifetime JP4480109B2 (ja) | 2000-06-09 | 2000-06-09 | 画像管理装置および画像管理方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4480109B2 (ja) |
Families Citing this family (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4510535B2 (ja) * | 2004-06-24 | 2010-07-28 | キヤノン株式会社 | 画像処理装置及びその制御方法、プログラム |
JP4572640B2 (ja) * | 2004-09-22 | 2010-11-04 | 富士ゼロックス株式会社 | 文書表示装置、文書表示装置の制御方法及びプログラム |
JP5233213B2 (ja) * | 2007-09-11 | 2013-07-10 | コニカミノルタビジネステクノロジーズ株式会社 | 画像処理装置、画像処理方法および画像処理プログラム |
JP6109625B2 (ja) * | 2013-04-04 | 2017-04-05 | 株式会社東芝 | 電子機器およびデータ処理方法 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS60140471A (ja) * | 1983-12-28 | 1985-07-25 | Hitachi Ltd | 画像入力装置 |
JPH10320412A (ja) * | 1997-05-22 | 1998-12-04 | Tec Corp | 文書作成装置 |
JPH11120185A (ja) * | 1997-10-09 | 1999-04-30 | Canon Inc | 情報処理装置及びその方法 |
-
2000
- 2000-06-09 JP JP2000174017A patent/JP4480109B2/ja not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
JP2001351089A (ja) | 2001-12-21 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3289968B2 (ja) | 電子的文書処理のための装置および方法 | |
US6353840B2 (en) | User-defined search template for extracting information from documents | |
US7593961B2 (en) | Information processing apparatus for retrieving image data similar to an entered image | |
CA2136902C (en) | Method and system for utilizing file storage sheets | |
Déjean et al. | A system for converting PDF documents into structured XML format | |
TW464811B (en) | Storage management system for document image database | |
US20130054595A1 (en) | Automated File Name Generation | |
US9286392B2 (en) | Enhanced search engine | |
US20020102022A1 (en) | Detecting and utilizing add-on information from a scanned document image | |
US20140122479A1 (en) | Automated file name generation | |
JP2006085733A (ja) | ファイリング・検索装置およびファイリング・検索方法 | |
JPH03161873A (ja) | データベース構築機能を有する電子フアイリング装置 | |
JPH05282423A (ja) | 文書画像を復号することなく文書内の単語の出現頻度を調べるための方法 | |
CN108197119A (zh) | 基于知识图谱的纸质档案数字化方法 | |
JP3683925B2 (ja) | 電子ファイリング装置 | |
US20060167899A1 (en) | Meta-data generating apparatus | |
US20060210171A1 (en) | Image processing apparatus | |
EP1304625B1 (en) | Method and apparatus for forward annotating documents and for generating a summary from a document image | |
JP4480109B2 (ja) | 画像管理装置および画像管理方法 | |
JPH08180068A (ja) | 電子ファイリング装置 | |
JP2008158777A (ja) | 画像処理装置及び方法、コンピュータプログラム及び記憶媒体 | |
JPH0934903A (ja) | ファイル検索装置 | |
JP2000020549A (ja) | 文書データベースシステムへの入力支援装置 | |
JP2001256256A (ja) | 電子文書検索装置および電子文書検索方法 | |
Youssef et al. | The Million Book Project at Bibliotheca Alexandrina |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070611 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070611 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20070611 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20080818 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20090820 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090824 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20091019 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20091023 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20091105 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20091218 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20091224 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100312 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20100315 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130326 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140326 Year of fee payment: 4 |