JP5440043B2 - 画像処理装置及び画像処理プログラム - Google Patents
画像処理装置及び画像処理プログラム Download PDFInfo
- Publication number
- JP5440043B2 JP5440043B2 JP2009207080A JP2009207080A JP5440043B2 JP 5440043 B2 JP5440043 B2 JP 5440043B2 JP 2009207080 A JP2009207080 A JP 2009207080A JP 2009207080 A JP2009207080 A JP 2009207080A JP 5440043 B2 JP5440043 B2 JP 5440043B2
- Authority
- JP
- Japan
- Prior art keywords
- document
- version
- group
- document group
- received
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Processing Or Creating Images (AREA)
Description
請求項1の発明は、原文書と該原文書を基にして作成された版文書によって構成されている文書群を記憶する文書群記憶手段と、受け付けた文書に対応する文書群を前記文書群記憶手段から検索する文書群検索手段と、前記文書群検索手段によって検索された文書群における前記受け付けた文書の版を判定する版判定手段と、前記版判定手段によって判定された文書の版に基づいて、該文書を含めた前記文書群記憶手段内の前記文書群を更新する文書群更新手段を具備し、前記文書群は、前記原文書を根とし、前記版文書を子とした木構造であり、前記文書群検索手段は、前記受け付けた文書と前記文書群内の予め定められた位置にある文書との類似度を算出し、類似する文書群を検索結果とし、前記版判定手段は、前記検索結果の文書群の木構造を根から葉までの1次元の連とし、該連内での文書と前記受け付けた文書とを比較することによって、該連内での位置を決定し、該位置によって文書の版を判定することを特徴とする画像処理装置である。
図1は、本実施の形態の構成例についての概念的なモジュール構成図を示している。
なお、モジュールとは、一般的に論理的に分離可能なソフトウェア(コンピュータ・プログラム)、ハードウェア等の部品を指す。したがって、本実施の形態におけるモジュールはコンピュータ・プログラムにおけるモジュールのことだけでなく、ハードウェア構成におけるモジュールも指す。それゆえ、本実施の形態は、コンピュータ・プログラム、システム及び方法の説明をも兼ねている。ただし、説明の都合上、「記憶する」、「記憶させる」、これらと同等の文言を用いるが、これらの文言は、実施の形態がコンピュータ・プログラムの場合は、記憶装置に記憶させる、又は記憶装置に記憶させるように制御するの意である。また、モジュールは機能に一対一に対応していてもよいが、実装においては、1モジュールを1プログラムで構成してもよいし、複数モジュールを1プログラムで構成してもよく、逆に1モジュールを複数プログラムで構成してもよい。また、複数モジュールは1コンピュータによって実行されてもよいし、分散又は並列環境におけるコンピュータによって1モジュールが複数コンピュータで実行されてもよい。なお、1つのモジュールに他のモジュールが含まれていてもよい。また、以下、「接続」とは物理的な接続の他、論理的な接続(データの授受、指示、データ間の参照関係等)の場合にも用いる。
また、システム又は装置とは、複数のコンピュータ、ハードウェア、装置等がネットワーク(一対一対応の通信接続を含む)等の通信手段で接続されて構成されるほか、1つのコンピュータ、ハードウェア、装置等によって実現される場合も含まれる。「装置」と「システム」とは、互いに同義の用語として用いる。「予め定められた」とは、対象としている処理の前に定まっていることをいい、本実施の形態による処理が始まる前はもちろんのこと、本実施の形態による処理が始まった後であっても、対象としている処理の前であれば、そのときの状況・状態に応じて、又はそれまでの状況・状態に応じて定まることの意を含めて用いる。また、管理という用語を用いるが、これは文脈に応じて、制御する、マネジメントする、制御又はマネジメントするためのデータを記憶するの意で用い、その役割又は動作をさす。
また、文書には、原文書(改定が施されていない初版(新規)の文書)の他に、手書きでの加筆など、順次改定された文書が含まれる。ただし、文書受付モジュール110が受け付ける文書の順番は、改定された文書の順番又は時系列に沿うとは限られず、途中で複数の版が生成される場合(いわゆる枝分かれ)もある。また、原文書であるか否かの指定、一連の版文書であるか否かの指定等もない。
文書群には、ある版の文書を基にしてさらに生成された文書(いわゆる3版以降)を含んでいてもよいし、ある版の文書を基にして生成された2つ以上の文書を含んでいてもよい。例えば、具体的には、この文書群が木構造である場合、原文書が木構造における根の位置にあり、ある版の文書を基にして2つ以上の版が生成された場合とは、枝別れする場合であり、木構造における葉の位置にある文書は2つ以上となる。
なお、文書ファイル記憶モジュール130は文書そのもののデータの他に、後述する履歴更新モジュール150によって抽出された文書内の領域、特徴テーブル400、文書テーブル900等を記憶している。
例えば、具体的には、文書100に類似する文書を文書ファイル記憶モジュール130から検索する。検索対象とする文書として、文書ファイル記憶モジュール130内の文書群内の全ての文書であってもよいが、文書群内の予め定められた文書(1つであってもよいし、複数であってもよい)、例えば、原文書、その木構造における葉の位置にある文書、最新の文書等としてもよい。
類似するか否かは、例えば、文書内の構造を解析し、その構造の類否によって判断するようにしてもよい。より具体的には、その文書内のタイトル、段落、図等の位置、大きさを構造解析によって抽出し、それらを比較する。また、文字領域については文字認識を行い、その結果を用いるようにしてもよい。
ステップS302では、文書受付モジュール110が、文書画像(文書100)を受け付ける。
ステップS304では、文書検索モジュール120が、文書100の構造を解析する。
ステップS306では、文書検索モジュール120が、版内の予め定められた対象文書を選択する。文書群内の代表的な文書として、前述のように、原文書、その木構造における葉の位置にある文書、最新の文書等を選択する。
文書検索モジュール120は、文書ファイル記憶モジュール130が記憶している特徴テーブル400を用いて類似度の算出を行う。つまり、ステップS304での構造解析結果と特徴テーブル400内のデータとによって類似度を算出する。例えば、類似度としては、領域の数、ブロック位置、画素数、文字認識結果のそれぞれの差分、種別は同じか否か等を用いる。
版欄420は、文書群におけるその文書の版を記憶する。原文書の場合は版1となる。
ブロックID欄430は、その文書内に含まれている領域を一意に識別するブロック符号を記憶する。ブロックID欄430から文字認識結果欄470は、過去に文書検索モジュール120によって解析された構造解析の結果である。
ブロック位置欄440は、その領域の位置(X、Y座標)、大きさ(幅、高さ)を記憶する。
画素数欄450は、その領域内に含まれている黒画素数を記憶する。多値画像の場合は、予め定められた値の画素数であってもよい。
文字認識結果欄470は、その領域が文字領域である場合は、文書検索モジュール120が文字認識を行い、その結果を記憶する。
新規欄480は、その領域はその文書の基の文書(版が1つ前の文書)と比べて、新しく追加された領域であるか否かを示す符号を記憶する。なお、新規欄480、改変有無欄490は、履歴更新モジュール150による処理結果である。
改変有無欄490は、その領域はその文書の基の文書と比べて、改変(基の文書にもあるが内容が異なっている等)された領域であるか否かを示す符号を記憶する。
ステップS312では、履歴判定モジュール140が、文書100の版の判定処理を行う。つまり、文書100を類似している文書が含まれている文書群の中に入れるために、その入れるべき位置である版を判定する。図5に例示するフローチャートを用いて後述する。
ステップS314では、履歴更新モジュール150が、文書100を初版として文書ファイル記憶モジュール130に登録する。つまり、新たな文書群が生成される。
ステップS504では、変数kに「(f+r)/2」の計算結果を代入する。小数点以下は切り下げ、切り上げ、四捨五入のいずれでもよい。
ステップS506では、kが変化したか否かを判断する。つまり、前回のステップS504で算出されたkと今回のkとを比較する。変化した場合はステップS508へ進み、それ以外の場合はステップS518へ進む。
ステップS512では、変数fに変数kを代入する。つまり、対象としている連の中で後半の文書を対象とするものである。
ステップS514では、履歴更新モジュール150での更新処理を不要とする。つまり、文書Xと文書Vkとは同じであるので、受け付けた文書100(文書X)は既に文書ファイル記憶モジュール130内に版管理されていることとなるので、以下の処理を行う必要はない。
ステップS516では、変数rに変数kを代入する。つまり、対象としている連の中で前半の文書を対象とするものである。
ステップS518では、変数fと変数rを履歴更新モジュール150へ渡す。つまり、文書Vfと文書Vrの間に文書Xを入れるための処理を履歴更新モジュール150が行う。
ステップS802では、履歴判定モジュール140からfとrを受け取る。ステップS518に対応する処理である。
ステップS804では、文書群の中でr以下の版を更新する。つまり、r以下の文書の版を1ずつ増やす。例えば、特徴テーブル400の版欄420内の版番号を修正する。
ステップS806では、受付文書(文書受付モジュール110、図5に例示したフローチャートでは文書X)の版をrとする。
ステップS808では、文書群内の文書に対して新規又は改変された領域を受付文書から抽出し、その抽出した領域を受付文書として文書ファイル記憶モジュール130内の文書テーブル900に記憶させる。
文書ID欄910は、その文書の文書符号を記憶する。
文書群ID欄920は、その文書が含まれている文書群を一意に識別する文書群符号を記憶する。
ブロックID欄930は、その文書内に含まれており、新規又は改変された領域のブロック符号(該当の領域が複数ある場合は複数個)を記憶する。
文書記憶アドレス欄950は、その文書を記憶している文書ファイル記憶モジュール130内のアドレス(例えば、URL(Uniform Resource Locator)等)を記憶する。2版以降の場合は、新規又は改変された領域を記憶しているアドレスである。
文書テーブル900を用いて文書を再生する。つまり、元版文書ID欄940によって前の文書を抽出し、それに対してブロックID欄930の領域を追加又は置換することによってその文書を再生する。なお、文書記憶アドレス欄950内のアドレスが原文書に辿り着くまで再帰的に行う。
前記実施の形態においては、図2、図4、図9で示したデータ構造は、これらのデータ構造に限られず、他のデータ構造であってもよい。例えば、テーブル構造のものはリンク構造等であってもよい。また、データ項目は、これらに図示したものに限られず、他のデータ項目を有していてもよい。
また、前記実施の形態の説明において、予め定められた値との比較において、「以上」、「以下」、「より多い」、「より少ない(未満)」としたものは、その組み合わせに矛盾が生じない限り、それぞれ「より多い」、「より少ない(未満)」、「以上」、「以下」としてもよい。
「プログラムを記録したコンピュータ読み取り可能な記録媒体」とは、プログラムのインストール、実行、プログラムの流通などのために用いられる、プログラムが記録されたコンピュータで読み取り可能な記録媒体をいう。
なお、記録媒体としては、例えば、デジタル・バーサタイル・ディスク(DVD)であって、DVDフォーラムで策定された規格である「DVD−R、DVD−RW、DVD−RAM等」、DVD+RWで策定された規格である「DVD+R、DVD+RW等」、コンパクトディスク(CD)であって、読出し専用メモリ(CD−ROM)、CDレコーダブル(CD−R)、CDリライタブル(CD−RW)等、ブルーレイ・ディスク(Blu−ray Disc(登録商標))、光磁気ディスク(MO)、フレキシブルディスク(FD)、磁気テープ、ハードディスク、読出し専用メモリ(ROM)、電気的消去及び書換可能な読出し専用メモリ(EEPROM)、フラッシュ・メモリ、ランダム・アクセス・メモリ(RAM)等が含まれる。
そして、前記のプログラム又はその一部は、前記記録媒体に記録して保存や流通等させてもよい。また、通信によって、例えば、ローカル・エリア・ネットワーク(LAN)、メトロポリタン・エリア・ネットワーク(MAN)、ワイド・エリア・ネットワーク(WAN)、インターネット、イントラネット、エクストラネット等に用いられる有線ネットワーク、あるいは無線通信ネットワーク、さらにこれらの組み合わせ等の伝送媒体を用いて伝送させてもよく、また、搬送波に乗せて搬送させてもよい。
さらに、前記のプログラムは、他のプログラムの一部分であってもよく、あるいは別個のプログラムと共に記録媒体に記録されていてもよい。また、複数の記録媒体に分割して
記録されていてもよい。また、圧縮や暗号化など、復元可能であればどのような態様で記録されていてもよい。
110…文書受付モジュール
120…文書検索モジュール
130…文書ファイル記憶モジュール
140…履歴判定モジュール
150…履歴更新モジュール
Claims (5)
- 原文書と該原文書を基にして作成された版文書によって構成されている文書群を記憶する文書群記憶手段と、
受け付けた文書に対応する文書群を前記文書群記憶手段から検索する文書群検索手段と、
前記文書群検索手段によって検索された文書群における前記受け付けた文書の版を判定する版判定手段と、
前記版判定手段によって判定された文書の版に基づいて、該文書を含めた前記文書群記憶手段内の前記文書群を更新する文書群更新手段
を具備し、
前記文書群は、前記原文書を根とし、前記版文書を子とした木構造であり、
前記文書群検索手段は、前記受け付けた文書と前記文書群内の予め定められた位置にある文書との類似度を算出し、類似する文書群を検索結果とし、
前記版判定手段は、前記検索結果の文書群の木構造を根から葉までの1次元の連とし、該連内での文書と前記受け付けた文書とを比較することによって、該連内での位置を決定し、該位置によって文書の版を判定する
ことを特徴とする画像処理装置。 - 前記文書群更新手段は、文書群内の文書に対して新規又は改変された領域を前記受け付けた文書から抽出し、該抽出した領域を前記受け付けた文書として前記文書群記憶手段に記憶させる
ことを特徴とする請求項1に記載の画像処理装置。 - 前記版判定手段は、前記文書群記憶手段に記憶されている領域を合成した文書と前記受け付けた文書を比較することによって、該受け付けた文書の版を判定する
ことを特徴とする請求項2に記載の画像処理装置。 - 前記版判定手段は、前記文書群記憶手段に記憶されている領域と前記受け付けた文書内の対応する領域を比較することによって、該受け付けた文書の版を判定する
ことを特徴とする請求項2に記載の画像処理装置。 - コンピュータを、
原文書と該原文書を基にして作成された版文書によって構成されている文書群を記憶する文書群記憶手段と、
受け付けた文書に対応する文書群を前記文書群記憶手段から検索する文書群検索手段と、
前記文書群検索手段によって検索された文書群における前記受け付けた文書の版を判定する版判定手段と、
前記版判定手段によって判定された文書の版に基づいて、該文書を含めた前記文書群記憶手段内の前記文書群を更新する文書群更新手段
として機能させ、
前記文書群は、前記原文書を根とし、前記版文書を子とした木構造であり、
前記文書群検索手段は、前記受け付けた文書と前記文書群内の予め定められた位置にある文書との類似度を算出し、類似する文書群を検索結果とし、
前記版判定手段は、前記検索結果の文書群の木構造を根から葉までの1次元の連とし、該連内での文書と前記受け付けた文書とを比較することによって、該連内での位置を決定し、該位置によって文書の版を判定する
ことを特徴とする画像処理プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009207080A JP5440043B2 (ja) | 2009-09-08 | 2009-09-08 | 画像処理装置及び画像処理プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009207080A JP5440043B2 (ja) | 2009-09-08 | 2009-09-08 | 画像処理装置及び画像処理プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2011059864A JP2011059864A (ja) | 2011-03-24 |
JP5440043B2 true JP5440043B2 (ja) | 2014-03-12 |
Family
ID=43947435
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009207080A Expired - Fee Related JP5440043B2 (ja) | 2009-09-08 | 2009-09-08 | 画像処理装置及び画像処理プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP5440043B2 (ja) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2013069199A (ja) * | 2011-09-26 | 2013-04-18 | Nec Corp | コンテンツ管理装置 |
JP5267711B1 (ja) * | 2012-08-30 | 2013-08-21 | 富士ゼロックス株式会社 | 文書管理装置及びプログラム |
JP6404735B2 (ja) * | 2015-02-04 | 2018-10-17 | シャープ株式会社 | 画像処理装置 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5893908A (en) * | 1996-11-21 | 1999-04-13 | Ricoh Company Limited | Document management system |
JP2006134042A (ja) * | 2004-11-05 | 2006-05-25 | Canon Inc | 画像処理システム |
JP2008146104A (ja) * | 2006-12-05 | 2008-06-26 | Canon Inc | 画像文書管理装置及び画像文書管理方法 |
-
2009
- 2009-09-08 JP JP2009207080A patent/JP5440043B2/ja not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2011059864A (ja) | 2011-03-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4623169B2 (ja) | 画像処理装置及び画像処理プログラム | |
US11670067B2 (en) | Information processing apparatus and non-transitory computer readable medium | |
US20150213332A1 (en) | Image processing apparatus, non-transitory computer readable medium, and image processing method | |
JP5440043B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP2009251872A (ja) | 情報処理装置及び情報処理プログラム | |
JP2008054147A (ja) | 画像処理装置および画像処理プログラム | |
JP2009223477A (ja) | 情報処理装置及び情報処理プログラム | |
JP4780184B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP7007551B2 (ja) | 画像類否判断プログラム、画像類否判断装置および画像類否判断方法 | |
RU2571379C2 (ru) | Интеллектуальная обработка электронного документа | |
JP5481965B2 (ja) | 情報処理装置及び情報処理プログラム | |
JP6421568B2 (ja) | 情報処理装置及び情報処理プログラム | |
JP2008052439A (ja) | 画像処理システムおよび画像処理プログラム | |
JP4793429B2 (ja) | 画像処理装置及び画像処理プログラム | |
US20150043832A1 (en) | Information processing apparatus, information processing method, and computer readable medium | |
JP6682827B2 (ja) | 情報処理装置及び情報処理プログラム | |
JP6241311B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP7388176B2 (ja) | 情報処理装置及び情報処理プログラム | |
JP5842437B2 (ja) | 情報処理装置及び情報処理プログラム | |
JP6303531B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP5062076B2 (ja) | 情報処理装置及び情報処理プログラム | |
JP5928714B2 (ja) | 情報処理装置及び情報処理プログラム | |
JP7342518B2 (ja) | 画像処理装置及び画像処理プログラム | |
JP5949248B2 (ja) | 情報処理装置及び情報処理プログラム | |
JP2010039810A (ja) | 画像処理装置及び画像処理プログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20120817 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20130830 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20130910 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20131029 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20131119 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20131202 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
LAPS | Cancellation because of no payment of annual fees |