JP5440043B2 - 画像処理装置及び画像処理プログラム - Google Patents

画像処理装置及び画像処理プログラム Download PDF

Info

Publication number
JP5440043B2
JP5440043B2 JP2009207080A JP2009207080A JP5440043B2 JP 5440043 B2 JP5440043 B2 JP 5440043B2 JP 2009207080 A JP2009207080 A JP 2009207080A JP 2009207080 A JP2009207080 A JP 2009207080A JP 5440043 B2 JP5440043 B2 JP 5440043B2
Authority
JP
Japan
Prior art keywords
document
version
group
document group
received
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2009207080A
Other languages
English (en)
Other versions
JP2011059864A (ja
Inventor
俊哉 小山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Fujifilm Business Innovation Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd, Fujifilm Business Innovation Corp filed Critical Fuji Xerox Co Ltd
Priority to JP2009207080A priority Critical patent/JP5440043B2/ja
Publication of JP2011059864A publication Critical patent/JP2011059864A/ja
Application granted granted Critical
Publication of JP5440043B2 publication Critical patent/JP5440043B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Processing Or Creating Images (AREA)

Description

本発明は、画像処理装置及び画像処理プログラムに関する。
特許文献1には、電子文書と加筆重畳画像とからの加筆抽出の際に、加筆情報が存在しない領域での引き残しの発生を抑制でき、かつ、より精度の高い加筆抽出を行うことができる加筆抽出装置及び加筆抽出方法を提供することを課題とし、加筆抽出装置は、電子文書の原稿画像と電子文書を紙へ出力した後に手書きの加筆が重畳した状態でスキャナ等の画像読取装置で再び電子化された画像とから、文字認識を用いて所望の領域を小領域に分割して小領域毎に加筆抽出操作の必要性の有無を判定する領域分割部と、これによって分割され差分計算が必要と判定された小領域に対して差分計算を行う画像差分部と、これによって差分処理された画像に対して補間処理を行う画像補間部とを有し、これにより、加筆抽出の精度が向上することが開示されている。
特開2004−213230号公報
本発明は、受け付けた文書を文書群内の版文書とすることができないという問題を解決するようにした画像処理装置及び画像処理プログラムを提供することを目的としている。
かかる目的を達成するための本発明の要旨とするところは、次の各項の発明に存する。
請求項1の発明は、原文書と該原文書を基にして作成された版文書によって構成されている文書群を記憶する文書群記憶手段と、受け付けた文書に対応する文書群を前記文書群記憶手段から検索する文書群検索手段と、前記文書群検索手段によって検索された文書群における前記受け付けた文書の版を判定する版判定手段と、前記版判定手段によって判定された文書の版に基づいて、該文書を含めた前記文書群記憶手段内の前記文書群を更新する文書群更新手段を具備し、前記文書群は、前記原文書を根とし、前記版文書を子とした木構造であり、前記文書群検索手段は、前記受け付けた文書と前記文書群内の予め定められた位置にある文書との類似度を算出し、類似する文書群を検索結果とし、前記版判定手段は、前記検索結果の文書群の木構造を根から葉までの1次元の連とし、該連内での文書と前記受け付けた文書とを比較することによって、該連内での位置を決定し、該位置によって文書の版を判定することを特徴とする画像処理装置である。
請求項2の発明は、前記文書群更新手段は、文書群内の文書に対して新規又は改変された領域を前記受け付けた文書から抽出し、該抽出した領域を前記受け付けた文書として前記文書群記憶手段に記憶させることを特徴とする請求項1に記載の画像処理装置である。
請求項3の発明は、前記版判定手段は、前記文書群記憶手段に記憶されている領域を合成した文書と前記受け付けた文書を比較することによって、該受け付けた文書の版を判定することを特徴とする請求項2に記載の画像処理装置である。
請求項4の発明は、前記版判定手段は、前記文書群記憶手段に記憶されている領域と前記受け付けた文書内の対応する領域を比較することによって、該受け付けた文書の版を判定することを特徴とする請求項2に記載の画像処理装置である。
請求項5の発明は、コンピュータを、原文書と該原文書を基にして作成された版文書によって構成されている文書群を記憶する文書群記憶手段と、受け付けた文書に対応する文書群を前記文書群記憶手段から検索する文書群検索手段と、前記文書群検索手段によって検索された文書群における前記受け付けた文書の版を判定する版判定手段と、前記版判定手段によって判定された文書の版に基づいて、該文書を含めた前記文書群記憶手段内の前記文書群を更新する文書群更新手段として機能させ、前記文書群は、前記原文書を根とし、前記版文書を子とした木構造であり、前記文書群検索手段は、前記受け付けた文書と前記文書群内の予め定められた位置にある文書との類似度を算出し、類似する文書群を検索結果とし、前記版判定手段は、前記検索結果の文書群の木構造を根から葉までの1次元の連とし、該連内での文書と前記受け付けた文書とを比較することによって、該連内での位置を決定し、該位置によって文書の版を判定することを特徴とする画像処理プログラムである。
請求項1の画像処理装置によれば、受け付けた文書を文書群内の版文書とすることができる。
請求項2の画像処理装置によれば、受け付けた文書を全て記憶する場合に比較して、文書群記憶手段に記憶させる容量を減少させることができる。
請求項3の画像処理装置によれば、文書群記憶手段に記憶されている領域を用いた文書の比較ができる。
請求項4の画像処理装置によれば、文書全体を比較する場合に比較して、版判定に要する比較処理を減少させることができる。
請求項5の画像処理プログラムによれば、受け付けた文書を文書群内の版文書とすることができる。
本実施の形態の構成例についての概念的なモジュール構成図である。 本実施の形態が取り扱う文書群の木構造の例を示す説明図である。 類似する文書群の判定処理例を示すフローチャートである。 特徴テーブルのデータ構造例を示す説明図である。 履歴判定処理例を示すフローチャートである。 文書群Aの根から葉までの一連の文書群の例を示す説明図である。 文書群Bの根から葉までの一連の文書群の例を示す説明図である。 履歴更新処理例を示すフローチャートである。 文書テーブルのデータ構造例を示す説明図である。 本実施の形態を実現するコンピュータのハードウェア構成例を示すブロック図である。
以下、図面に基づき本発明を実現するにあたっての好適な一実施の形態の例を説明する。
図1は、本実施の形態の構成例についての概念的なモジュール構成図を示している。
なお、モジュールとは、一般的に論理的に分離可能なソフトウェア(コンピュータ・プログラム)、ハードウェア等の部品を指す。したがって、本実施の形態におけるモジュールはコンピュータ・プログラムにおけるモジュールのことだけでなく、ハードウェア構成におけるモジュールも指す。それゆえ、本実施の形態は、コンピュータ・プログラム、システム及び方法の説明をも兼ねている。ただし、説明の都合上、「記憶する」、「記憶させる」、これらと同等の文言を用いるが、これらの文言は、実施の形態がコンピュータ・プログラムの場合は、記憶装置に記憶させる、又は記憶装置に記憶させるように制御するの意である。また、モジュールは機能に一対一に対応していてもよいが、実装においては、1モジュールを1プログラムで構成してもよいし、複数モジュールを1プログラムで構成してもよく、逆に1モジュールを複数プログラムで構成してもよい。また、複数モジュールは1コンピュータによって実行されてもよいし、分散又は並列環境におけるコンピュータによって1モジュールが複数コンピュータで実行されてもよい。なお、1つのモジュールに他のモジュールが含まれていてもよい。また、以下、「接続」とは物理的な接続の他、論理的な接続(データの授受、指示、データ間の参照関係等)の場合にも用いる。
また、システム又は装置とは、複数のコンピュータ、ハードウェア、装置等がネットワーク(一対一対応の通信接続を含む)等の通信手段で接続されて構成されるほか、1つのコンピュータ、ハードウェア、装置等によって実現される場合も含まれる。「装置」と「システム」とは、互いに同義の用語として用いる。「予め定められた」とは、対象としている処理の前に定まっていることをいい、本実施の形態による処理が始まる前はもちろんのこと、本実施の形態による処理が始まった後であっても、対象としている処理の前であれば、そのときの状況・状態に応じて、又はそれまでの状況・状態に応じて定まることの意を含めて用いる。また、管理という用語を用いるが、これは文脈に応じて、制御する、マネジメントする、制御又はマネジメントするためのデータを記憶するの意で用い、その役割又は動作をさす。
なお、文書とは、テキストデータ、場合によっては画像、動画、音声等の電子データ、又はこれらの組み合わせであり、記憶、編集及び検索等の対象となり、システム又は利用者間で個別の単位として交換できるものをいい、これらに類似するものを含む。特に、文書としての画像には、紙文書をスキャナで読み取った画像が含まれる。以下、文書として、画像を主に例示して説明する。
本実施の形態である画像処理装置は、図1に示すように、文書受付モジュール110、文書検索モジュール120、文書ファイル記憶モジュール130、履歴判定モジュール140、履歴更新モジュール150を有している。
文書受付モジュール110は、文書検索モジュール120と接続されており、文書100を受け付けて、その文書100を文書検索モジュール120へ渡す。画像を受け付けるとは、例えば、スキャナ、カメラ等で画像を読み込むこと、ファックス等で通信回線を介して外部機器から画像を受信することハードディスク(コンピュータに内蔵されているものの他に、ネットワークを介して接続されているもの等を含む)等に記憶されている画像を読み出すこと等が含まれる。画像は、2値画像、多値画像(カラー画像を含む)であってもよい。受け付ける画像は、1枚であってもよいし、複数枚であってもよい。また、画像の内容として、限定することはないが、例えば、ビジネスに用いられる文書の他、広告宣伝用のパンフレット等であってもよい。
また、文書には、原文書(改定が施されていない初版(新規)の文書)の他に、手書きでの加筆など、順次改定された文書が含まれる。ただし、文書受付モジュール110が受け付ける文書の順番は、改定された文書の順番又は時系列に沿うとは限られず、途中で複数の版が生成される場合(いわゆる枝分かれ)もある。また、原文書であるか否かの指定、一連の版文書であるか否かの指定等もない。
文書ファイル記憶モジュール130は、文書検索モジュール120、履歴判定モジュール140、履歴更新モジュール150と接続されている。文書ファイル記憶モジュール130は、原文書とその原文書を基にして作成された版文書によって構成されている文書群を記憶する。いわゆる版管理された文書群を記憶する。なお、1つの文書群という場合は、1つの原文書から派生した版文書(原文書を含む)の集合である。
文書群には、ある版の文書を基にしてさらに生成された文書(いわゆる3版以降)を含んでいてもよいし、ある版の文書を基にして生成された2つ以上の文書を含んでいてもよい。例えば、具体的には、この文書群が木構造である場合、原文書が木構造における根の位置にあり、ある版の文書を基にして2つ以上の版が生成された場合とは、枝別れする場合であり、木構造における葉の位置にある文書は2つ以上となる。
図2は、本実施の形態の文書ファイル記憶モジュール130が取り扱う文書群の木構造の例を示す説明図である。図2(A)は、文書A(A−1)を原文書として2つに枝分かれし、最終的には葉として4つの版文書(A−111、A−121、A−1221、A−123)ができている状態を示している。例えば、文書A−121は文書A−12を基にして作成されたものであり、さらに文書A−12は文書A−1を基にして作成されたものであることが表現されている。同様に、図2(B)は、文書B(B−1)を原文書として3つに枝分かれし、最終的には葉として5つの版文書(B−1111、B−121、B−1221、B−1311、B−1312)ができている状態を示している。
なお、文書ファイル記憶モジュール130は文書そのもののデータの他に、後述する履歴更新モジュール150によって抽出された文書内の領域、特徴テーブル400、文書テーブル900等を記憶している。
文書検索モジュール120は、文書受付モジュール110、文書ファイル記憶モジュール130、履歴判定モジュール140と接続されている。文書検索モジュール120は、文書100に対応する文書群を文書ファイル記憶モジュール130から検索する。そして、検索した文書群を履歴判定モジュール140へ渡す。
例えば、具体的には、文書100に類似する文書を文書ファイル記憶モジュール130から検索する。検索対象とする文書として、文書ファイル記憶モジュール130内の文書群内の全ての文書であってもよいが、文書群内の予め定められた文書(1つであってもよいし、複数であってもよい)、例えば、原文書、その木構造における葉の位置にある文書、最新の文書等としてもよい。
類似するか否かは、例えば、文書内の構造を解析し、その構造の類否によって判断するようにしてもよい。より具体的には、その文書内のタイトル、段落、図等の位置、大きさを構造解析によって抽出し、それらを比較する。また、文字領域については文字認識を行い、その結果を用いるようにしてもよい。
履歴判定モジュール140は、文書検索モジュール120、文書ファイル記憶モジュール130、履歴更新モジュール150と接続されている。履歴判定モジュール140は、文書検索モジュール120によって検索された文書群における文書100の版を判定する。文書100の版とは、その文書群における改変の履歴でもある。そして、判定した版を履歴更新モジュール150へ渡す。また、履歴判定モジュール140は、文書ファイル記憶モジュール130に記憶されている領域を合成した文書と文書100を比較することによって、文書100の版を判定するようにしてもよい。また、履歴判定モジュール140は、文書ファイル記憶モジュール130に記憶されている領域と文書100内の対応する領域を比較することによって、文書100の版を判定するようにしてもよい。
履歴更新モジュール150は、文書ファイル記憶モジュール130、履歴判定モジュール140と接続されている。履歴更新モジュール150は、履歴判定モジュール140によって判定された文書の版に基づいて、その文書を含めた文書ファイル記憶モジュール130内の文書群を更新する。また、履歴更新モジュール150は、文書群内の文書に対して新規又は改変された領域を文書100から抽出し、その抽出した領域を文書100として文書ファイル記憶モジュール130に記憶させるようにしてもよい。
図3は、類似する文書群の判定処理例を示すフローチャートである。
ステップS302では、文書受付モジュール110が、文書画像(文書100)を受け付ける。
ステップS304では、文書検索モジュール120が、文書100の構造を解析する。
ステップS306では、文書検索モジュール120が、版内の予め定められた対象文書を選択する。文書群内の代表的な文書として、前述のように、原文書、その木構造における葉の位置にある文書、最新の文書等を選択する。
ステップS308では、文書検索モジュール120が、文書100とステップS306で選択した対象文書との類似度を算出する。
文書検索モジュール120は、文書ファイル記憶モジュール130が記憶している特徴テーブル400を用いて類似度の算出を行う。つまり、ステップS304での構造解析結果と特徴テーブル400内のデータとによって類似度を算出する。例えば、類似度としては、領域の数、ブロック位置、画素数、文字認識結果のそれぞれの差分、種別は同じか否か等を用いる。
図4は、特徴テーブル400のデータ構造例を示す説明図である。特徴テーブル400は、文書ID欄410、版欄420、ブロックID欄430、ブロック位置欄440、画素数欄450、種別欄460、文字認識結果欄470、新規欄480、改変有無欄490を有している。また、ブロック位置欄440は、X欄441、Y欄442、W欄443、H欄444を有している。
文書ID欄410は、その文書を一意に識別する文書符号を記憶する。
版欄420は、文書群におけるその文書の版を記憶する。原文書の場合は版1となる。
ブロックID欄430は、その文書内に含まれている領域を一意に識別するブロック符号を記憶する。ブロックID欄430から文字認識結果欄470は、過去に文書検索モジュール120によって解析された構造解析の結果である。
ブロック位置欄440は、その領域の位置(X、Y座標)、大きさ(幅、高さ)を記憶する。
画素数欄450は、その領域内に含まれている黒画素数を記憶する。多値画像の場合は、予め定められた値の画素数であってもよい。
種別欄460は、その領域の種別(文字領域、図形領域(さらに、図形の認識結果(例えば、直線、矩形等)を含めてもよい)、写真領域等)を記憶する。なお、文字領域であるか否か等は、既存の手法を用いる。例えば、その領域内の特徴を抽出して、予め定められた特徴辞書との距離を計算して判定する。
文字認識結果欄470は、その領域が文字領域である場合は、文書検索モジュール120が文字認識を行い、その結果を記憶する。
新規欄480は、その領域はその文書の基の文書(版が1つ前の文書)と比べて、新しく追加された領域であるか否かを示す符号を記憶する。なお、新規欄480、改変有無欄490は、履歴更新モジュール150による処理結果である。
改変有無欄490は、その領域はその文書の基の文書と比べて、改変(基の文書にもあるが内容が異なっている等)された領域であるか否かを示す符号を記憶する。
ステップS310では、文書検索モジュール120が、類似するものがあるか否かを判断する。ある場合はステップS312へ進み、それ以外の場合はステップS314へ進む。
ステップS312では、履歴判定モジュール140が、文書100の版の判定処理を行う。つまり、文書100を類似している文書が含まれている文書群の中に入れるために、その入れるべき位置である版を判定する。図5に例示するフローチャートを用いて後述する。
ステップS314では、履歴更新モジュール150が、文書100を初版として文書ファイル記憶モジュール130に登録する。つまり、新たな文書群が生成される。
図5は、履歴判定モジュール140が行う履歴判定処理例を示すフローチャートである。ここで、文書群の木構造は、枝分かれする場合もあるので、木構造を1次元の連として表現する。図6は、図2(A)に例示した文書群Aの根から葉までの一連の文書群の例を示す説明図である。つまり、文書群Aは、葉が4つあるので4つの連がある。例えば、図6(A)に示す連は、根の位置にある文書A−1から葉の位置にあるA−111まで辿った場合の3つの文書からなるものであり、同様に、図6(B)、(C)、(D)に示すような3つの連がある。また、同様に、図7は、図2(A)に例示した文書群Bの根から葉までの一連の文書群の例を示す説明図である。つまり、文書群Bは、葉が5つあるので5つの連がある。例えば、図7(A)に示す連は、根の位置にある文書B−1から葉の位置にあるB−1111まで辿った場合の4つの文書からなるものであり、同様に、図7(B)、(C)、(D)、(E)に示すような4つの連がある。
履歴判定モジュール140が行う履歴判定処理とは、このような連の中で文書100は、どの位置にあるかを判定するものである。対象とする連を選び、連の中を根から順番付けする。根の順番をmとし、葉の順番をnとする。図6(A)に例示した連では、文書A−1は順番1であり、文書A−111は順番3であるので、m=1、n=3となる。また、版を求めるべき文書(文書100)をXとし、連内の文書をVkとし、添え字kを連内の順番とする。
ステップS502では、変数fにmを代入し、変数rにnを代入する。
ステップS504では、変数kに「(f+r)/2」の計算結果を代入する。小数点以下は切り下げ、切り上げ、四捨五入のいずれでもよい。
ステップS506では、kが変化したか否かを判断する。つまり、前回のステップS504で算出されたkと今回のkとを比較する。変化した場合はステップS508へ進み、それ以外の場合はステップS518へ進む。
ステップS508では、文書X(文書100)と文書Vk(連内のk番目の文書)を比較する。この比較において、文書Vkは文書ファイル記憶モジュール130に記憶されている領域を合成して生成してもよい。また、文書ファイル記憶モジュール130に記憶されている領域と文書X内の対応する領域を比較するようにしてもよい。例えば、領域の数を比較し、文書Xの領域数が多い場合は文書Xが新しいと判断する。また、領域の数は同じであるが、文書Xの領域内の黒画素が予め定められた閾値よりも多い場合は文書Xが新しいと判断する。また、文書Xの領域内の文字認識結果の文字数が多い場合は文書Xが新しいと判断する。この判断に、文書100の解析結果と特徴テーブル400を用いるようにしてもよい。
ステップS510では、Xが新しいか否かを判断する。新しい場合はステップS512へ進み、同じ場合はステップS514へ進み、それ以外の場合はステップS516へ進む。
ステップS512では、変数fに変数kを代入する。つまり、対象としている連の中で後半の文書を対象とするものである。
ステップS514では、履歴更新モジュール150での更新処理を不要とする。つまり、文書Xと文書Vkとは同じであるので、受け付けた文書100(文書X)は既に文書ファイル記憶モジュール130内に版管理されていることとなるので、以下の処理を行う必要はない。
ステップS516では、変数rに変数kを代入する。つまり、対象としている連の中で前半の文書を対象とするものである。
ステップS518では、変数fと変数rを履歴更新モジュール150へ渡す。つまり、文書Vfと文書Vrの間に文書Xを入れるための処理を履歴更新モジュール150が行う。
図8は、履歴更新モジュール150が行う履歴更新処理例を示すフローチャートである。
ステップS802では、履歴判定モジュール140からfとrを受け取る。ステップS518に対応する処理である。
ステップS804では、文書群の中でr以下の版を更新する。つまり、r以下の文書の版を1ずつ増やす。例えば、特徴テーブル400の版欄420内の版番号を修正する。
ステップS806では、受付文書(文書受付モジュール110、図5に例示したフローチャートでは文書X)の版をrとする。
ステップS808では、文書群内の文書に対して新規又は改変された領域を受付文書から抽出し、その抽出した領域を受付文書として文書ファイル記憶モジュール130内の文書テーブル900に記憶させる。
図9は、文書テーブル900のデータ構造例を示す説明図である。文書テーブル900は、文書ID欄910、文書群ID欄920、ブロックID欄930、元版文書ID欄940、文書記憶アドレス欄950を有している。
文書ID欄910は、その文書の文書符号を記憶する。
文書群ID欄920は、その文書が含まれている文書群を一意に識別する文書群符号を記憶する。
ブロックID欄930は、その文書内に含まれており、新規又は改変された領域のブロック符号(該当の領域が複数ある場合は複数個)を記憶する。
元版文書ID欄940は、その文書よりも前の版の文書の文書符号を記憶する。
文書記憶アドレス欄950は、その文書を記憶している文書ファイル記憶モジュール130内のアドレス(例えば、URL(Uniform Resource Locator)等)を記憶する。2版以降の場合は、新規又は改変された領域を記憶しているアドレスである。
文書テーブル900を用いて文書を再生する。つまり、元版文書ID欄940によって前の文書を抽出し、それに対してブロックID欄930の領域を追加又は置換することによってその文書を再生する。なお、文書記憶アドレス欄950内のアドレスが原文書に辿り着くまで再帰的に行う。
図10を参照して、本実施の形態の画像処理装置のハードウェア構成例について説明する。図10に示す構成は、例えばパーソナルコンピュータ(PC)などによって構成されるものであり、スキャナ等のデータ読み取り部1017と、プリンタなどのデータ出力部1018を備えたハードウェア構成例を示している。
CPU(Central Processing Unit)1001は、前述の実施の形態において説明した各種のモジュール、すなわち、文書検索モジュール120、履歴判定モジュール140、履歴更新モジュール150等の各モジュールの実行シーケンスを記述したコンピュータ・プログラムにしたがった処理を実行する制御部である。
ROM(Read Only Memory)1002は、CPU1001が使用するプログラムや演算パラメータ等を格納する。RAM(Random Access Memory)1003は、CPU1001の実行において使用するプログラムや、その実行において適宜変化するパラメータ等を格納する。これらはCPUバスなどから構成されるホストバス1004により相互に接続されている。
ホストバス1004は、ブリッジ1005を介して、PCI(Peripheral Component Interconnect/Interface)バスなどの外部バス1006に接続されている。
キーボード1008、マウス等のポインティングデバイス1009は、操作者により操作される入力デバイスである。ディスプレイ1010は、液晶表示装置又はCRT(Cathode Ray Tube)などがあり、各種情報をテキストやイメージ情報として表示する。
HDD(Hard Disk Drive)1011は、ハードディスクを内蔵し、ハードディスクを駆動し、CPU1001によって実行するプログラムや情報を記録又は再生させる。ハードディスクには、受け付けた文書や文書群などが格納される。さらに、その他の各種のデータ処理プログラム等、各種コンピュータ・プログラムが格納される。
ドライブ1012は、装着されている磁気ディスク、光ディスク、光磁気ディスク、又は半導体メモリ等のリムーバブル記録媒体1013に記録されているデータ又はプログラムを読み出して、そのデータ又はプログラムを、インタフェース1007、外部バス1006、ブリッジ1005、及びホストバス1004を介して接続されているRAM1003に供給する。リムーバブル記録媒体1013も、ハードディスクと同様のデータ記録領域として利用可能である。
接続ポート1014は、外部接続機器1015を接続するポートであり、USB、IEEE1394等の接続部を持つ。接続ポート1014は、インタフェース1007、及び外部バス1006、ブリッジ1005、ホストバス1004等を介してCPU1001等に接続されている。通信部1016は、ネットワークに接続され、外部とのデータ通信処理を実行する。データ読み取り部1017は、例えばスキャナであり、ドキュメントの読み取り処理を実行する。データ出力部1018は、例えばプリンタであり、ドキュメントデータの出力処理を実行する。
なお、図10に示す画像処理装置のハードウェア構成は、1つの構成例を示すものであり、本実施の形態は、図10に示す構成に限らず、本実施の形態において説明したモジュールを実行可能な構成であればよい。例えば、一部のモジュールを専用のハードウェア(例えば特定用途向け集積回路(Application Specific Integrated Circuit:ASIC)等)で構成してもよく、一部のモジュールは外部のシステム内にあり通信回線で接続しているような形態でもよく、さらに図10に示すシステムが複数互いに通信回線によって接続されていて互いに協調動作するようにしてもよい。また、複写機、ファックス、スキャナ、プリンタ、複合機(スキャナ、プリンタ、複写機、ファックス等のいずれか2つ以上の機能を有している画像処理装置)などに組み込まれていてもよい。
前述の実施の形態においては、文書として画像を例示したが、文書として、文書生成装置(例えば、ワープロ等)によって生成されたテキストデータを主とする文書であってもよい。その場合、履歴判定モジュール140による版の判定方法は、前述の方法に加えて、文書の作成日時等に基づいて行うようにしてもよい。
前記実施の形態においては、図2、図4、図9で示したデータ構造は、これらのデータ構造に限られず、他のデータ構造であってもよい。例えば、テーブル構造のものはリンク構造等であってもよい。また、データ項目は、これらに図示したものに限られず、他のデータ項目を有していてもよい。
また、前記実施の形態の説明において、予め定められた値との比較において、「以上」、「以下」、「より多い」、「より少ない(未満)」としたものは、その組み合わせに矛盾が生じない限り、それぞれ「より多い」、「より少ない(未満)」、「以上」、「以下」としてもよい。
なお、説明したプログラムについては、記録媒体に格納して提供してもよく、また、そのプログラムを通信手段によって提供してもよい。その場合、例えば、前記説明したプログラムについて、「プログラムを記録したコンピュータ読み取り可能な記録媒体」の発明として捉えてもよい。
「プログラムを記録したコンピュータ読み取り可能な記録媒体」とは、プログラムのインストール、実行、プログラムの流通などのために用いられる、プログラムが記録されたコンピュータで読み取り可能な記録媒体をいう。
なお、記録媒体としては、例えば、デジタル・バーサタイル・ディスク(DVD)であって、DVDフォーラムで策定された規格である「DVD−R、DVD−RW、DVD−RAM等」、DVD+RWで策定された規格である「DVD+R、DVD+RW等」、コンパクトディスク(CD)であって、読出し専用メモリ(CD−ROM)、CDレコーダブル(CD−R)、CDリライタブル(CD−RW)等、ブルーレイ・ディスク(Blu−ray Disc(登録商標))、光磁気ディスク(MO)、フレキシブルディスク(FD)、磁気テープ、ハードディスク、読出し専用メモリ(ROM)、電気的消去及び書換可能な読出し専用メモリ(EEPROM)、フラッシュ・メモリ、ランダム・アクセス・メモリ(RAM)等が含まれる。
そして、前記のプログラム又はその一部は、前記記録媒体に記録して保存や流通等させてもよい。また、通信によって、例えば、ローカル・エリア・ネットワーク(LAN)、メトロポリタン・エリア・ネットワーク(MAN)、ワイド・エリア・ネットワーク(WAN)、インターネット、イントラネット、エクストラネット等に用いられる有線ネットワーク、あるいは無線通信ネットワーク、さらにこれらの組み合わせ等の伝送媒体を用いて伝送させてもよく、また、搬送波に乗せて搬送させてもよい。
さらに、前記のプログラムは、他のプログラムの一部分であってもよく、あるいは別個のプログラムと共に記録媒体に記録されていてもよい。また、複数の記録媒体に分割して
記録されていてもよい。また、圧縮や暗号化など、復元可能であればどのような態様で記録されていてもよい。
100…文書
110…文書受付モジュール
120…文書検索モジュール
130…文書ファイル記憶モジュール
140…履歴判定モジュール
150…履歴更新モジュール

Claims (5)

  1. 原文書と該原文書を基にして作成された版文書によって構成されている文書群を記憶する文書群記憶手段と、
    受け付けた文書に対応する文書群を前記文書群記憶手段から検索する文書群検索手段と、
    前記文書群検索手段によって検索された文書群における前記受け付けた文書の版を判定する版判定手段と、
    前記版判定手段によって判定された文書の版に基づいて、該文書を含めた前記文書群記憶手段内の前記文書群を更新する文書群更新手段
    を具備し、
    前記文書群は、前記原文書を根とし、前記版文書を子とした木構造であり、
    前記文書群検索手段は、前記受け付けた文書と前記文書群内の予め定められた位置にある文書との類似度を算出し、類似する文書群を検索結果とし、
    前記版判定手段は、前記検索結果の文書群の木構造を根から葉までの1次元の連とし、該連内での文書と前記受け付けた文書とを比較することによって、該連内での位置を決定し、該位置によって文書の版を判定する
    ことを特徴とする画像処理装置。
  2. 前記文書群更新手段は、文書群内の文書に対して新規又は改変された領域を前記受け付けた文書から抽出し、該抽出した領域を前記受け付けた文書として前記文書群記憶手段に記憶させる
    ことを特徴とする請求項1に記載の画像処理装置。
  3. 前記版判定手段は、前記文書群記憶手段に記憶されている領域を合成した文書と前記受け付けた文書を比較することによって、該受け付けた文書の版を判定する
    ことを特徴とする請求項2に記載の画像処理装置。
  4. 前記版判定手段は、前記文書群記憶手段に記憶されている領域と前記受け付けた文書内の対応する領域を比較することによって、該受け付けた文書の版を判定する
    ことを特徴とする請求項2に記載の画像処理装置。
  5. コンピュータを、
    原文書と該原文書を基にして作成された版文書によって構成されている文書群を記憶する文書群記憶手段と、
    受け付けた文書に対応する文書群を前記文書群記憶手段から検索する文書群検索手段と、
    前記文書群検索手段によって検索された文書群における前記受け付けた文書の版を判定する版判定手段と、
    前記版判定手段によって判定された文書の版に基づいて、該文書を含めた前記文書群記憶手段内の前記文書群を更新する文書群更新手段
    として機能させ
    前記文書群は、前記原文書を根とし、前記版文書を子とした木構造であり、
    前記文書群検索手段は、前記受け付けた文書と前記文書群内の予め定められた位置にある文書との類似度を算出し、類似する文書群を検索結果とし、
    前記版判定手段は、前記検索結果の文書群の木構造を根から葉までの1次元の連とし、該連内での文書と前記受け付けた文書とを比較することによって、該連内での位置を決定し、該位置によって文書の版を判定する
    ことを特徴とする画像処理プログラム。
JP2009207080A 2009-09-08 2009-09-08 画像処理装置及び画像処理プログラム Expired - Fee Related JP5440043B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2009207080A JP5440043B2 (ja) 2009-09-08 2009-09-08 画像処理装置及び画像処理プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2009207080A JP5440043B2 (ja) 2009-09-08 2009-09-08 画像処理装置及び画像処理プログラム

Publications (2)

Publication Number Publication Date
JP2011059864A JP2011059864A (ja) 2011-03-24
JP5440043B2 true JP5440043B2 (ja) 2014-03-12

Family

ID=43947435

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2009207080A Expired - Fee Related JP5440043B2 (ja) 2009-09-08 2009-09-08 画像処理装置及び画像処理プログラム

Country Status (1)

Country Link
JP (1) JP5440043B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2013069199A (ja) * 2011-09-26 2013-04-18 Nec Corp コンテンツ管理装置
JP5267711B1 (ja) * 2012-08-30 2013-08-21 富士ゼロックス株式会社 文書管理装置及びプログラム
JP6404735B2 (ja) * 2015-02-04 2018-10-17 シャープ株式会社 画像処理装置

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5893908A (en) * 1996-11-21 1999-04-13 Ricoh Company Limited Document management system
JP2006134042A (ja) * 2004-11-05 2006-05-25 Canon Inc 画像処理システム
JP2008146104A (ja) * 2006-12-05 2008-06-26 Canon Inc 画像文書管理装置及び画像文書管理方法

Also Published As

Publication number Publication date
JP2011059864A (ja) 2011-03-24

Similar Documents

Publication Publication Date Title
JP4623169B2 (ja) 画像処理装置及び画像処理プログラム
US11670067B2 (en) Information processing apparatus and non-transitory computer readable medium
US20150213332A1 (en) Image processing apparatus, non-transitory computer readable medium, and image processing method
JP5440043B2 (ja) 画像処理装置及び画像処理プログラム
JP2009251872A (ja) 情報処理装置及び情報処理プログラム
JP2008054147A (ja) 画像処理装置および画像処理プログラム
JP2009223477A (ja) 情報処理装置及び情報処理プログラム
JP4780184B2 (ja) 画像処理装置及び画像処理プログラム
JP7007551B2 (ja) 画像類否判断プログラム、画像類否判断装置および画像類否判断方法
RU2571379C2 (ru) Интеллектуальная обработка электронного документа
JP5481965B2 (ja) 情報処理装置及び情報処理プログラム
JP6421568B2 (ja) 情報処理装置及び情報処理プログラム
JP2008052439A (ja) 画像処理システムおよび画像処理プログラム
JP4793429B2 (ja) 画像処理装置及び画像処理プログラム
US20150043832A1 (en) Information processing apparatus, information processing method, and computer readable medium
JP6682827B2 (ja) 情報処理装置及び情報処理プログラム
JP6241311B2 (ja) 画像処理装置及び画像処理プログラム
JP7388176B2 (ja) 情報処理装置及び情報処理プログラム
JP5842437B2 (ja) 情報処理装置及び情報処理プログラム
JP6303531B2 (ja) 画像処理装置及び画像処理プログラム
JP5062076B2 (ja) 情報処理装置及び情報処理プログラム
JP5928714B2 (ja) 情報処理装置及び情報処理プログラム
JP7342518B2 (ja) 画像処理装置及び画像処理プログラム
JP5949248B2 (ja) 情報処理装置及び情報処理プログラム
JP2010039810A (ja) 画像処理装置及び画像処理プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20120817

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130830

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130910

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20131029

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20131119

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20131202

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees