JP2005208977A - 文書ファイリング装置および文書ファイリング方法 - Google Patents

文書ファイリング装置および文書ファイリング方法 Download PDF

Info

Publication number
JP2005208977A
JP2005208977A JP2004015507A JP2004015507A JP2005208977A JP 2005208977 A JP2005208977 A JP 2005208977A JP 2004015507 A JP2004015507 A JP 2004015507A JP 2004015507 A JP2004015507 A JP 2004015507A JP 2005208977 A JP2005208977 A JP 2005208977A
Authority
JP
Japan
Prior art keywords
document data
document
input
similarity
attribute information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2004015507A
Other languages
English (en)
Inventor
Hitoshi Okamoto
仁 岡本
Kagenori Nagao
景則 長尾
Shinichi Yada
伸一 矢田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd filed Critical Fuji Xerox Co Ltd
Priority to JP2004015507A priority Critical patent/JP2005208977A/ja
Publication of JP2005208977A publication Critical patent/JP2005208977A/ja
Withdrawn legal-status Critical Current

Links

Images

Landscapes

  • Processing Or Creating Images (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Image Analysis (AREA)

Abstract

【課題】文書画像に対してレイアウト解析を行い、OCRを用いて文字情報を抽出し、属性情報を自動的に付与する手法では、レイアウト解析、OCRの精度およびそれらの情報に基づいた分類の精度は完璧とは言えない。
【解決手段】文書入力部11により入力される文書データについて、特徴量抽出部13により抽出される特徴量と、文書蓄積部15に文書データと関連付けられて蓄積されている特徴量との類似度を類似度評価部14で評価し、その評価結果が所定のしきい値以上の類似度を持つ文書データが存在するときは、当該文書データに関連付けられて文書蓄積部15に蓄積されている属性情報の少なくとも一部を、文書入力部11により入力される文書データに対して属性付与部16によって付与して文書蓄積部15に蓄積する。
【選択図】図1

Description

本発明は、文書ファイリング装置および文書ファイリング方法に関し、特に文書データを蓄積装置に蓄積し、この蓄積した文書データを再利用する文書ファイリング装置および文書ファイリング方法に関する。
近年、紙に印刷された文書(以下、紙文書と記す)をスキャナ装置で読み取ることによって文書データに電子化し、この文書データを蓄積装置に蓄積して管理する、所謂紙文書の電子化が本格化してきている。また、デジタルカメラ等の普及により、個人でも大量の画像データを管理する要求が出てきている。
ところで、紙文書をスキャナ装置で取り込んで蓄積装置に蓄積するのは非常に簡単である。しかし、蓄積装置に蓄積した文書データを再利用するに当たっては、蓄積装置に蓄積した文書データを一意に特定するための目安、即ちインデックスが無いと再利用は困難である。インデックスを作成するには、文書データについての属性情報が必要である。属性情報としては、例えば、文書データの名称、サイズ、作成の日付、作成者、データフォーマットの種類、文書の用途、キーワード等が挙げられる。
これらの属性情報については手作業で付与することができる。具体的には、画像毎ではなく、アルバム(1つあるいは複数のページにより構成され、当該ページ毎に複数の画像が属する)のページ単位に属性情報を付与することにより、属性情報の付与の効率化を図っていた(例えば、特許文献1参照)。また、文字領域と絵柄領域との相対関係から文書データを分類した上で属性情報を付与することにより、検索の効率化を図っていた(例えば、特許文献2参照)。
しかしながら、特許文献1,2に係る従来技術では、属性情報を手作業で付与するようにしていたため、文書画像の数が多いと作業量が爆発的に増加してしまう。特に、紙文書を電子化するのが簡単になってきていることからすれば、文書画像の数が爆発的に増えるのは明白である。したがって、手作業で属性情報を付与する手法は現実的ではない。
このため、近年、属性情報を手作業で付与する従来の手法に代えて、文書画像に対してレイアウト解析を行い、OCR(Optical Character Reader;光学式文字読み取り装置)を用いて文字情報を抽出し、属性情報を自動的に付与する手法が採られている(例えば、特許文献3参照)。
特開平5−12392号公報 特開平6−44234号公報 特開2001−283220号公報
しかしながら、特許文献3に係る従来技術では、レイアウト解析、OCRの精度およびそれらの情報に基づいた分類の精度は完璧とは言えない。
本発明は、上記課題に鑑みてなされたものであって、その目的とするところは、属性情報を付与するに当たっての作業量を低減し、ユーザにとって使い勝手の良い文書ファイリング装置および文書ファイリング方法を提供することにある。
上記目的を達成するために、本発明では、入力される文書データに付与するための属性情報を入力し、前記入力される文書データを前記属性情報と関連付けて蓄積装置に蓄積しておく。そして、あらかじめ蓄積装置に蓄積されている文書データの中から、前記入力される文書データと類似する文書データを検索し、所定のしきい値以上の類似度を持つ文書データが存在するときは、当該文書データに関連付けられて前記蓄積装置に蓄積されている属性情報の少なくとも一部を前記入力される文書データに付与して前記蓄積装置に蓄積する。
文書データを蓄積装置に蓄積し、この蓄積した文書データを再利用する文書ファイリング装置において、あらかじめ蓄積装置に蓄積されている文書データの中に、入力される文書データと類似度が大なる文書データが存在するときは、当該文書データの属性情報の少なくとも一部を、入力される文書データに付与することで、ユーザは新たに蓄積装置に蓄積する文書データに対してその都度属性情報を入力する必要がなくなる。文書データの分類はユーザによって異なるが、属性情報の付与によって分類する手法を採ることで、ユーザに合わせて最適な分類に、その都度変更することが容易に可能とある。
本発明によれば、新たに蓄積装置に蓄積する文書データに対してその都度属性情報を入力する必要がないため、ユーザによる属性情報を付与するための作業量を低減できる。また、ユーザに合わせて最適な分類に変更することが容易に可能であるため、ユーザにとって使い勝手が良いものとなる。
以下、本発明の実施の形態について図面を参照して詳細に説明する。
図1は、本発明の一実施形態に係る文書ファイリング装置の構成例を示すブロック図である。図1から明らかなように、本実施形態に係る文書ファイリング装置は、文書入力部11、属性入力部12、特徴量抽出部13、類似度評価部14、文書蓄積部15、属性付与部16および文書出力部17を備え、これらの構成要素がバスライン18を介して相互に接続された構成となっている。
文書入力部11は、入力文書から文書データを取得して、これを本文書ファイリング装置に登録すべき文書データとして入力する。ここで、入力される文書データとしては、例えば、印刷物からスキャンされて取得された画像データ、デジタルカメラで撮影した画像データ、あるいはアプリケーションソフトウェアで作成したファイル等が挙げられる。これに対応して、文書入力部11としては、例えば、スキャナ装置とその制御手段、磁気ディスクやメモリカード等のリード/ライト装置とその制御手段、ネットワーク等を介してデータの授受を行うデータ転送装置、あるいはアプリケーションソフトウェアで作成したファイルをビットマップ画像にラスタライズする手段が用いられる。
属性入力部12は、文書データに関する属性情報を入力するためのものである。この属性入力部12では、ユーザによって属性情報の入力が行われる。ここで、属性情報としては、例えば、文書データの名称、サイズ、作成の日付、作成者、データフォーマットの種類、文書の用途、キーワード等についての情報が挙げられる。属性入力部12は、新規の属性情報を付与するためのユーザインターフェイスであり、属性項目や入力エリアを表示するための表示手段と、属性情報をユーザが入力するための入力手段からなる。表示手段は、例えば、CRT(Cathode Ray Tube)とその制御手段からなり、入力手段は、例えば、キーボードおよびマウスとその制御手段からなる。
特徴量抽出部13は、文書間の類似度を評価するために文書データから当該文書データ固有の特徴を示す量(以下、「特徴量」と記す)を取り出すものであり、例えば、画像特徴量抽出手段とフォーマット特徴量抽出手段とを備えている。画像特徴量抽出手段は、入力された文書データあるいは文書データをラスタライズして得られた画像データから、例えば、画像全体の色調、縦横比、輝度や色の分布状態、エッジの分布状態、平坦なエリアの分布状態など、その文書データの特徴量を抽出するものである。
本例に係る画像特徴量抽出手段は、一つの画像データにつき、Ij次元ベクトル(j=1,2,…,n、但し、1≦Ij、1≦n、nは整数)で表現されるn種類の特徴量を抽出するように構成されている。具体的には、例えば図2に示すように、文書データを輝度・色差系の色空間L*** に変換した後、各々の色平面の文書データを縦x横y画素に縮小して得られた画素値を(x×y×3)次元ベクトルとして表現したものを特徴量として抽出する。フォーマット特徴量抽出手段の詳細については後述する。
文書蓄積部15は、入力された文書データを特徴量抽出部13によって抽出されたn種類の特徴量および属性情報と関連付けて記憶蓄積するものであり、ハードディスクドライブやDVD(Digital Versatile Disc)−RAM/±RW/±Rドライブ等の大容量記憶装置によって実現される。
類似度評価部14は、特徴量抽出部13によって抽出され、文書データと関連付けられて文書蓄積部15に蓄積されている特徴量について、複数の特徴量が蓄積されていれば、複数の特徴量をそれぞれ比較して相互間の類似度を求める。ここでいう類似度とは、例えば、特徴量がベクトル表現のもの(以下、この特徴量を「特徴ベクトル」と記す)であれば、各々の文書データに関連付けられた特徴ベクトル間のユークリッド距離に基づいて評価される度合いである。具体的には、図3(A)に示すように、特徴ベクトル間のユークリッド距離が近い場合を類似度大として評価し、図3(B)に示すように、特徴ベクトル間のユークリッド距離が離れている場合を類似度小として評価する。ただし、特徴ベクトル間の距離の定義についてはユークリッド距離に限られるものではない。
属性付与部16は、文書蓄積部15に蓄積されている属性情報の付与されている文書データの中から、類似度評価部14での類似度の評価結果に基づいて文書蓄積部15に蓄積しようとしている文書データと類似した文書データを特定する。そして、属性付与部16は、文書蓄積部15に蓄積されている文書データの中に所定のしきい値以上の類似度を持つ文書データが存在すれば、当該文書データに関連付けて文書蓄積部15に蓄積されている属性情報の少なくとも一部を、入力された文書データ若しくは文書蓄積部15に蓄積しようとしている文書データに付与し、所定のしきい値以上の類似度を持つ文書データが存在しなければ、属性入力部12からユーザによって入力された属性情報を入力された文書データ若しくは文書蓄積部15に蓄積しようとしている文書データに付与する。
文書出力部17は、出力が指示された文書データを所定の形式で出力するものであり、例えば、CRT(Cathode Ray Tube)とその制御手段、プリンタ装置とその制御手段、磁気ディスクやメモリカード等のリード/ライト装置とその制御手段、あるいはネットワーク等を介してデータの授受を行うデータ転送装置によって実現される。すなわち、文書出力部17からは、例えば、紙に印刷された文書、CRTに出力された画像データ、あるいはHTML(Hyper Text Markup Language)等により整形されたファイルが、出力結果として出力される。
ここで、先述した画像特徴量抽出手段と共に、特徴量抽出部13を構成するフォーマット特徴量抽出手段について説明する。このフォーマット特徴量抽出手段では、2つの文書画像に関して、画像そのものではなく、文字の高さ、字間、行間、縦書き・横書きなど、所謂文書フォーマットの特徴の類似性について比較する。このような比較方法は、ある2ページ分の文書画像が同一文書に属するのか、別々の異なる文書に属するのかを判定するのに有効である。
何故なら、1つの文書ではその体裁を統一するのが一般であるから、上述したような文書フォーマットの特徴が等しいページ画像群は同一の文書に属すると考えることができるからである。反対に、異なる文書に属するページ画像間では、意図的に同一の文書フォーマットで作成された文書でない限り、上述したような文書フォーマットの特徴が等しくなることは極めて稀である。
スキャナ装置などにより入力された文書画像から、文字の高さ、字間、行間などの文書フォーマットの特徴を求める手法は周知である。一般的には、同一文書に属するページであっても、タイトル行、要約部、本文など、文書を構成する部位によってフォントの大きさや行間隔などは異なる。したがって、上述した文書フォーマットの特徴を抽出しても、文書を構成する部位によってその値は異なり、一貫しないのが普通である。フォーマット特徴の値が一貫しないと、2ページ分の文書画像が同一文書に属するのか、別々の異なる文書に属するのかを、文書フォーマットの特徴を比較することによって判定するのが困難になる。
そこで、図4に示すように、ページ画像を複数の領域、例えばタイトル部、要約部、本文部に分割し、さらに本文部についても複数の領域に分割する。次に、分割した領域のそれぞれについて文字の高さ、字間、行間、縦書き・横書きなどの文書フォーマットの特徴量を求める。そして、それぞれの特徴量に関して、最も頻繁に出現する値を多数決原理に基づいて求め、これをそのページの特徴量とする。一般に、タイトル部や要約部がページ全体に占める面積は小さいので、最頻出の特徴量を用いるようにすることにより、タイトル部や要約部が特徴量に与える影響を排除することができるため、一貫した特徴量を得ることができる。
このようにすることにより、1つのページ画像から1つの文書フォーマットの特徴ベクトルを求めることができる。この文書フォーマットの特徴ベクトルVは、一例として、
V=(文字の高さ、字間、行間、{縦書き:0,横書き:1})
で表される。2つのページ画像A,Bを文書フォーマットの特徴に基づいて比較する場合は、上記のようにして求められたページ画像A,Bの特徴ベクトルをそれぞれVA,VBとし、2つの特徴ベクトルVA,VB間の距離Dを求める。
D=‖VA−VB‖
ただし、‖V‖はベクトルVのノルムを表す。上式において、距離Dが小さいほど2つのページ画像は類似していると判断する。
次に、上記構成の本実施形態に係る文書ファイリング装置における文書データの分類処理の手順について、図5のフローチャートにしたがって説明する。
文書入力部11より、印刷物からスキャンされて取得された画像データ、デジタルカメラで撮影した画像データ、あるいはアプリケーションソフトウェアで作成したファイルから生成された画像データ等の文書データが入力されると(ステップS11)、入力された文書データが既に特徴量を抽出され、特徴量および属性情報と関連付けられて文書蓄積部15に蓄積されている文書データであるか否かを判断する(ステップS12)。
入力された文書データが未だ特徴量を抽出されていない文書データであれば、入力された文書データから特徴量を特徴量抽出部12によって抽出し(ステップS13)、しかる後ステップS14の処理に移行する。入力された文書データが既に特徴量を抽出された文書データであれば、直接ステップS14の処理に移行する。すなわち、入力された文書データが既に特徴量を抽出され、特徴量および属性情報と関連付けられて文書蓄積部15に蓄積されている文書データについては改めて特徴量を抽出する処理は行わない。
ただし、複数ページの連続した文書データが入力された場合は、各々のページから特徴量を抽出して各ページの文書データと関連付けるようにしても良いし、複数ページの連続した文書データで1ページ分の特徴量と文書データとを関連付けるようにしても良い。その場合には、例えば、それら特徴量の重心を複数文書データの特徴量の代表として、特徴量の評価対象にすれば良い。複数文書データの特徴量の代表としては、特徴量の重心に限られるものではない。
なお、文書蓄積部15に蓄積されている文書データには全て属性情報が付与されて蓄積されているものとする。また、文書蓄積部15に蓄積されている文書データの数が所定数以下である場合には文書分類のための属性情報の情報量も少ないため、蓄積されている文書データが少ない旨のアラートをユーザに提示し、入力された文書データの属性情報を属性入力部12から入力するようにユーザに対して指示を与えるようにすれば良い。
続いて、入力された文書データについて、当該文書データから抽出した特徴量と文書蓄積部15に既に蓄積されている文書データに関連付けられた特徴量との類似度を、類似度評価部14によって文書蓄積部15に蓄積されている文書データの全てについて評価する(ステップ14)。ただし、同一の属性情報を有する文書データが複数存在する場合には、例えば図6に示すように、複数文書データの特徴量の重心を複数文書データの特徴量の代表として特徴量の評価対象にすれば良い。なお、複数文書データの特徴量の代表としては、特徴量の重心に限られるものではない。また、複数文書データの特徴量の代表については定期的に更新するようにしても良い。
次に、特徴量の評価結果を判断する(ステップS15)。そして、入力された文書データの特徴量と類似度が所定のしきい値以上の特徴量を持つ文書データ、即ち類似度が大きい特徴量を持つ文書データが存在すれば、この類似度の大なる特徴量を持つ文書データに付与されている属性情報の少なくとも一部(当該属性情報の一部若しくは全部)を、入力された文書データに対して属性付与部16によって付与し、当該文書データを文書蓄積部15に格納する(ステップS16)。
ここで、文書データに属性情報を付与する際に、属性情報の全てを付与しても良いが、文書データを分類するに当たって効果的な属性情報のみを付与するようにすれば、文書蓄積部15に蓄積する情報量を少なく抑えることができるため有利である。属性情報としては、先述したように、文書データの名称、サイズ、作成の日付、作成者、データフォーマットの種類、文書の用途、キーワード等についての情報が挙げられるが、これらの情報のうち、例えば文書の用途、キーワード等が、文書データを分類するに当たって効果的な属性情報と言える。
一方、入力された文書データの特徴量と類似度の大きい特徴量を持つ文書データが存在しない場合、換言すれば、入力された文書データの特徴量に対する類似度が、文書蓄積部15に蓄積されている文書データの全ての特徴量について、所定のしきい値よりも小さい場合には、例えば、ユーザに対して蓄積されている文書データには類似したものが存在しない旨のアラートを出す(ステップS17)。そして、入力された文書データの属性情報がユーザによって属性入力部12から入力されたら、この入力された属性情報を入力された文書データに対して属性付与部16によって付与し、当該文書データを文書蓄積部15に格納する(ステップS18)。
なお、入力された文書データの特徴量と所定のしきい値以上の類似度をもつ文書データが複数存在する場合には、例えば、それら複数の文書データに付与されている属性情報の一部若しくは全部を、入力された文書データに対して属性付与部16によって付与し、文書データを文書蓄積部15に格納するようにする。
上記実施形態では、文書蓄積部15に蓄積されている文書データの中から、文書入力部11により入力される文書データと類似する文書データを検索するに当たって、入力される文書データからその特徴量を抽出し、当該特徴量の類似度を評価してその類似度に基づいて、入力される文書データと類似する文書データを検索する場合を例に挙げて説明したが、この検索方法に限られるものではない。他の検索方法としては、一例として、OCRによって文書画像を取り込んで、文書の内容の類似度を評価してその類似度に基づいて、入力される文書データと類似する文書データ検索する方法が挙げられる。
本発明の一実施形態に係る文書ファイリング装置の構成例を示すブロック図である。 特徴量抽出の概念図である。 類似度評価の概念図である。 文書フォーマットの特徴量を抽出する際にページ画像を複数の領域に分割した状態を示す図である。 文書データの分類処理の手順を示すフローチャートである。 同一の属性情報を有する文書データが複数ある場合の類似度評価の概念図である。
符号の説明
11…文書入力部、12…属性入力部、13…特徴量抽出部、14…類似度評価部、15…文書蓄積部、16…属性付与部、17…文書出力部

Claims (10)

  1. 文書データを入力する文書入力手段と、
    前記文書入力手段により入力される文書データに付与するための属性情報を入力する属性入力手段と、
    前記文書入力手段により入力される文書データを、前記属性入力手段により入力される属性情報と関連付けて蓄積する蓄積手段と、
    前記蓄積手段に蓄積されている文書データの中から、前記文書入力手段により入力される文書データと類似する文書データを検索する検索手段と、
    前記検索手段によって所定のしきい値以上の類似度を持つ文書データが検索されたときに、当該文書データに関連付けられて前記蓄積手段に蓄積されている属性情報の少なくとも一部を前記文書入力手段により入力される文書データに付与して前記蓄積手段に蓄積する属性付与手段と
    を備えることを特徴とする文書ファイリング装置。
  2. 前記検索手段は、前記類似度を持つ文書データを検索する際、検索を行う上での基準となる特徴を、文書データの少なくとも一部を画像として取り込んだデータから抽出する
    ことを特徴とする請求項1記載の文書ファイリング装置。
  3. 文書データを入力する文書入力手段と、
    前記文書入力手段により入力される文書データに付与するための属性情報を入力する属性入力手段と、
    前記文書入力手段により入力される文書データから当該文書データ固有の特徴量を抽出する特徴量抽出手段と、
    前記文書入力手段により入力される文書データを、前記属性入力手段により入力される属性情報および前記特徴量抽出手段により抽出される特徴量と関連付けて蓄積する蓄積手段と、
    前記文書入力手段により入力される文書データについて、前記特徴量抽出手段により抽出される特徴量と前記蓄積手段に文書データと関連付けられて蓄積されている特徴量との類似度を評価する類似度評価手段と、
    前記類似度評価手段の評価結果が所定のしきい値以上の類似度を持つ文書データが存在するときに、当該文書データに関連付けられて前記蓄積手段に蓄積されている属性情報の少なくとも一部を前記文書入力手段により入力される文書データに付与して前記蓄積手段に蓄積する属性付与手段と
    を備えることを特徴とする文書ファイリング装置。
  4. 前記属性付与手段は、前記類似度評価手段の評価結果が所定のしきい値以上の類似度を持つ文書データが存在しないときは、前記属性入力手段により入力される属性情報を前記文書入力手段により入力される文書データに付与して前記蓄積手段に蓄積する
    ことを特徴とする請求項3記載の文書ファイリング装置。
  5. 前記類似度評価手段は、前記蓄積手段に同一の属性情報を有する文書データが複数存在する場合には、複数文書データの特徴量の重心を当該複数文書データの特徴量についての評価対象にする
    ことを特徴とする請求項3記載の文書ファイリング装置。
  6. 前記類似度評価手段は、文書データ間の前記類似度を評価する際、評価を行う上での基準となる特徴を、文書データの少なくとも一部を画像として取り込んだデータから抽出する
    ことを特徴とする請求項3記載の文書ファイリング装置。
  7. 入力される文書データに付与するための属性情報を入力する第1ステップと、
    前記入力される文書データを、前記第1ステップで入力される属性情報と関連付けて蓄積装置に蓄積する第2ステップと、
    前記蓄積手段に蓄積されている文書データの中から、前記入力される文書データと類似する文書データを検索する第3ステップと、
    前記第3ステップでの検索により所定のしきい値以上の類似度を持つ文書データが検索されたときに、当該文書データに関連付けられて前記蓄積装置に蓄積されている属性情報の少なくとも一部を前記入力される文書データに付与して前記蓄積装置に蓄積する第4ステップと
    を有することを特徴とする文書ファイリング方法。
  8. 前記文書データを検索する第3ステップでは、前記類似度を持つ文書データを検索する際、検索を行う上での基準となる特徴を、文書データの少なくとも一部を画像として取り込んだデータから抽出する
    ことを特徴とする請求項7記載の文書ファイリング方法。
  9. 入力される文書データに付与するための属性情報を入力する第1ステップと、
    前記入力される文書データから当該文書データ固有の特徴量を抽出する第2ステップと、
    前記入力される文書データを、前記第1ステップで入力される属性情報および前記第2ステップで抽出される特徴量と関連付けて蓄積装置に蓄積する第3ステップと、
    前記入力される文書データについて、前記第2ステップで抽出される特徴量と前記蓄積装置に文書データと関連付けられて蓄積されている特徴量との類似度を評価する第4ステップと、
    前記第4ステップでの評価結果が所定のしきい値以上の類似度を持つ文書データが存在するときに、当該文書データに関連付けられて前記蓄積装置に蓄積されている属性情報の少なくとも一部を前記入力される文書データに付与して前記蓄積装置に蓄積する第5ステップと
    を有することを特徴とする文書ファイリング方法。
  10. 前記類似度を評価する第4ステップでは、文書データ間の前記類似度を評価する際、評価を行う上での基準となる特徴を、文書データの少なくとも一部を画像として取り込んだデータから抽出する
    ことを特徴とする請求項9記載の文書ファイリング方法。
JP2004015507A 2004-01-23 2004-01-23 文書ファイリング装置および文書ファイリング方法 Withdrawn JP2005208977A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004015507A JP2005208977A (ja) 2004-01-23 2004-01-23 文書ファイリング装置および文書ファイリング方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004015507A JP2005208977A (ja) 2004-01-23 2004-01-23 文書ファイリング装置および文書ファイリング方法

Publications (1)

Publication Number Publication Date
JP2005208977A true JP2005208977A (ja) 2005-08-04

Family

ID=34900957

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004015507A Withdrawn JP2005208977A (ja) 2004-01-23 2004-01-23 文書ファイリング装置および文書ファイリング方法

Country Status (1)

Country Link
JP (1) JP2005208977A (ja)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007306405A (ja) * 2006-05-12 2007-11-22 Ricoh Co Ltd 画像形成システム、グループウェアサーバ、画像形成方法、データベース管理プログラム及び記憶媒体
JP2008027238A (ja) * 2006-07-21 2008-02-07 Hitachi Ltd 文書属性値付与装置及びその文書属性値付与方法
JP2008206037A (ja) * 2007-02-22 2008-09-04 Fuji Xerox Co Ltd 画像処理装置及び画像処理プログラム
US8010583B2 (en) 2007-08-27 2011-08-30 Fuji Xerox Co., Ltd. Computer readable medium, document processing apparatus, and document processing system with selective storage
US8144994B2 (en) 2006-11-13 2012-03-27 Sharp Kabushiki Kaisha Image processing method, image processing apparatus, image reading apparatus, image forming apparatus, and recording medium
US8488146B2 (en) 2006-05-12 2013-07-16 Ricoh Company, Ltd. Image forming system, groupware server, image forming apparatus and computer-readable storage medium
US8531697B2 (en) 2006-10-18 2013-09-10 Ricoh Company, Ltd. Image forming system, groupware server, image forming apparatus, image forming method, and image forming program
JP2015026355A (ja) * 2013-06-17 2015-02-05 富士ゼロックス株式会社 情報処理プログラム及び情報処理装置

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007306405A (ja) * 2006-05-12 2007-11-22 Ricoh Co Ltd 画像形成システム、グループウェアサーバ、画像形成方法、データベース管理プログラム及び記憶媒体
US8488146B2 (en) 2006-05-12 2013-07-16 Ricoh Company, Ltd. Image forming system, groupware server, image forming apparatus and computer-readable storage medium
JP2008027238A (ja) * 2006-07-21 2008-02-07 Hitachi Ltd 文書属性値付与装置及びその文書属性値付与方法
US8531697B2 (en) 2006-10-18 2013-09-10 Ricoh Company, Ltd. Image forming system, groupware server, image forming apparatus, image forming method, and image forming program
US8144994B2 (en) 2006-11-13 2012-03-27 Sharp Kabushiki Kaisha Image processing method, image processing apparatus, image reading apparatus, image forming apparatus, and recording medium
JP2008206037A (ja) * 2007-02-22 2008-09-04 Fuji Xerox Co Ltd 画像処理装置及び画像処理プログラム
US8010583B2 (en) 2007-08-27 2011-08-30 Fuji Xerox Co., Ltd. Computer readable medium, document processing apparatus, and document processing system with selective storage
JP2015026355A (ja) * 2013-06-17 2015-02-05 富士ゼロックス株式会社 情報処理プログラム及び情報処理装置

Similar Documents

Publication Publication Date Title
EP1473642A2 (en) Information processing apparatus, method, storage medium and program
US7272269B2 (en) Image processing apparatus and method therefor
JP5613073B2 (ja) 微細固有特徴生成方法およびドキュメント画像処理システム
JP4859025B2 (ja) 類似画像検索装置、類似画像検索処理方法、プログラム及び情報記録媒体
CN100414550C (zh) 用于图像检索的图像处理设备及其控制方法
JP4920928B2 (ja) 画像処理装置及びその制御方法、プログラム
US20090106699A1 (en) Image processing device and image processing method
JP2007286767A (ja) 画像検索システム、及び、画像検索サーバ及びその制御方法、並びに、コンピュータプログラム及びコンピュータ可読記憶媒体
JP2004234656A (ja) 文書分析情報を使用して文書を再フォーマット化する方法及び製造物
US20080244384A1 (en) Image retrieval apparatus, method for retrieving image, and control program for image retrieval apparatus
JP2006025129A (ja) 画像処理システム及び画像処理方法
JP2005208977A (ja) 文書ファイリング装置および文書ファイリング方法
US20130097491A1 (en) Information processing apparatus, information processing method, and computer readable medium
JP2006023944A (ja) 画像処理システム及び画像処理方法
JP4518212B2 (ja) 画像処理装置及びプログラム
JP2001319232A (ja) 類似画像検索装置および類似画像検索方法
JP3529036B2 (ja) 文書付き画像の分類方法
JP4517822B2 (ja) 画像処理装置及びプログラム
JP7312646B2 (ja) 情報処理装置、文書識別方法、及び情報処理システム
JP2007066286A (ja) 画像検索装置、画像処理装置、及びそれらの方法
JP2007066286A6 (ja) 画像検索装置、画像処理装置、及びそれらの方法
Hong et al. Information Extraction and Analysis on Certificates and Medical Receipts
JP2019153230A (ja) 情報処理装置及び情報処理プログラム
JP2002236921A (ja) 文書画像認識方法、文書画像認識装置及び記録媒体
JP5511554B2 (ja) 画像処理方法、画像処理装置、およびプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20061220

A761 Written withdrawal of application

Free format text: JAPANESE INTERMEDIATE CODE: A761

Effective date: 20081016