JP4765636B2 - 文書管理プログラムおよび文書管理装置および方法 - Google Patents

文書管理プログラムおよび文書管理装置および方法 Download PDF

Info

Publication number
JP4765636B2
JP4765636B2 JP2006015180A JP2006015180A JP4765636B2 JP 4765636 B2 JP4765636 B2 JP 4765636B2 JP 2006015180 A JP2006015180 A JP 2006015180A JP 2006015180 A JP2006015180 A JP 2006015180A JP 4765636 B2 JP4765636 B2 JP 4765636B2
Authority
JP
Japan
Prior art keywords
folder
attribute
document
classification
classified
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2006015180A
Other languages
English (en)
Other versions
JP2007199843A (ja
Inventor
康行 樋口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Fujifilm Business Innovation Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co Ltd, Fujifilm Business Innovation Corp filed Critical Fuji Xerox Co Ltd
Priority to JP2006015180A priority Critical patent/JP4765636B2/ja
Publication of JP2007199843A publication Critical patent/JP2007199843A/ja
Application granted granted Critical
Publication of JP4765636B2 publication Critical patent/JP4765636B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、文書を階層的に分類して管理する文書管理プログラムおよび文書管理装置および方法に関し、特に、文書に関連付けられた属性情報を意識することなく効率的に分類して管理する文書管理プログラムおよび文書管理装置および方法に関する。
作成した電子文書(単に「文書」ともいう)を管理する場合、その電子文書の作成日時や日付または文書名などを名称としたフォルダを作成して管理する。作成された複数のフォルダは、階層構造を形成することで、機能的に文書を保存できるとともに保存した文書を特定することが容易になり管理性能が向上する。
所定のプロジェクトなどに参加する複数のユーザによって作成されたさまざまな文書は、統一的に管理され、必要なときに必要な文書を取り出すことができるようにするとともにその文書の完全性を保持し、最新の正しい情報を提供することが必要であることから、DBMS(DataBase Management System)やファイルシステムなどを用いて管理されることが多い。
これらのシステムを用いて文書を管理する場合、または、自ら階層構造を形成してフォルダに文書を登録することで管理する場合には、予め指定された規則に基づいて登録する必要があるため、文書の登録に時間がかかることがあった。
このような問題に対して、従来、登録する文書に付与された属性情報やヘッダー情報、または文書中に記載された特定のキーワードを元に自動的に振り分けて登録できるようにした技術がある。この技術では、予め指定された情報、例えば、文書名や作成者などの情報を参照して合致するフォルダまたは類似するフォルダに登録(更新)するようにしている。
そして、これらの技術を用いて登録した文書を検索する際に、効率的な検索を行うことによって簡単に文書を特定できるようにした従来技術として、特許文献1または特許文献2に開示されたものがある。
この特許文献1に開示された従来技術では、任意の分類または文書を選択したときにユーザが設定した管理情報とその管理情報に関連する分類や文書とが同一画面上に表示されるため、必要とする分類や文書の探索を容易にした文書管理を可能にしている。
また、特許文献2に開示された従来技術では、文書の分類区分が多岐にわたる場合、文書の検索を行うにあたって、まず、分類の検索を行う必要があり、分類による文書検索の操作が煩雑になるという点に対して、文書属性での文書検索を行えるようにするために設定された検索文書の属性をより見やすく表示することができるようにしている。
特開平8−44765 特開2002−99554
しかしながら、特許文献1に示された従来技術においては、分類ごとに分類情報または文書情報を設定しておき、分類の階層構造を手操って選択された分類に設定された分類または文書を合わせて表示することで所定の文書を特定できるようにしているが、分類ごとに分類情報や文書情報を設定することが前提となっており、この技術を用いて文書を特定するまでに多くの作業が必要になる。
また、特許文献2に示された従来技術では、予め分類される属性情報の一覧を作成しておくとともに文書に対して検索対象となる属性を指定しておき、表示された属性情報の一覧から分類する属性情報を指定することで、その属性情報に関連付けられた文書を検索して表示させ、文書を特定できるようにしているが、属性情報の一覧を作成するために文書に関連付けられた属性情報の種類、設定値を予め知っておく必要があり、膨大な数量の文書に対して処理を行う際には、多くの時間や手間を要することになるという問題がある。
以上に示すような従来技術では、それぞれの検索方法で検索を行うために登録した文書が持つまたは付与した属性情報を参照することで実現している。いずれの場合であっても文書に属性情報が関連付けられている必要があり、しかも検索時にその属性情報の項目に対する値を検索者が知っている必要がある。また、知らない場合であってもどのような方法かで得る必要がある。そして、これらの値を検索条件に設定することで所望する情報を取得している。
その検索条件に最適な値を設定しない限りは所望する情報を取得することができない。すなわち、文書の登録時に最適な属性情報を関連付けて登録する必要があり効率良く登録するには多くの時間と最適な属性情報の設定が不可欠であるという問題があった。
そこで、本発明は、文書に関連付けられた属性情報の値を意識することなく、効率的で利便性に富んだ分類を自動的に行うことができるようにした文書管理プログラムおよび文書管理装置および方法を提供することを目的とする。
上記目的を達成するため、請求項1の発明は、文書に付与された属性情報に基づいて文書を管理する文書管理処理をコンピュータにより実行させる文書管理装置に実装され、前記コンピュータを、前記属性情報によって文書を分類する分類条件を指定する指定手段、分類対象の複数の文書からそれぞれ抽出した属性情報の種別と属性値を前記指定手段より指定された前記分類条件に従って集計するとともに、該集計後に前記分類条件を満足するように並び替えられた属性情報の属性種別と属性値のうちの先頭の属性情報の属性種別と属性値との組み合わせによりそれぞれ識別されるフォルダを同一階層上に構築する構築手段、前記構築手段により構築された前記フォルダに、該フォルダを識別する属性種別と属性値を有する文書を分類する分類手段、前記構築手段により構築済みの前記フォルダ中、分類された文書が1つしかないフォルダを除くフォルダに分類された各文書を対象に属性情報の種別と属性値を抽出して前記指定手段より指定された前記分類条件に従って集計するとともに、該集計後に前記分類条件を満足するように並び替えられた属性情報の属性種別と属性値のうちの先頭にある属性情報の属性種別と属性値との組み合わせによりそれぞれ識別される新たなフォルダを前記構築済みの前記フォルダの下位階層に構築し、該新たに構築された階層の前記フォルダに該フォルダを識別する属性種別と属性値を有する文書を分類する処理を、前記構築済みの前記フォルダの階層が予め設定された分類階層に一致するまで繰り返し実施することにより前記フォルダを前記属性情報に基づき階層化する階層化手段、前記階層化手段により階層化した前記フォルダの属性情報に対して管理対象となる全ての文書が分類されているか判断する判断手段、前記判断手段により全ての文書がいずれかのフォルダに分類されていると判断された場合、前記階層化手段により階層化されたフォルダ構成で文書を管理する文書管理手段として機能させる。
また、請求項2の発明は、請求項1の発明において、前記階層化手段を、前記指定手段により指定された前記分類条件を満たさず、前記判断手段により全ての文書が階層化したいずれかのフォルダに分類されていないと判断された場合、当該分類されていない文書を分類するフォルダを、前記分類条件を満たし、前記判断手段により全ての文書が階層化したいずれかのフォルダに分類されていると判断された文書を分類するフォルダと同じ階層に作成する手段として更に機能させる。
また、請求項3の発明は、請求項1または2の発明において、前記指定手段を、前記文書の分類条件をフォルダの最大分類階層数と指定する手段として機能させ、前記階層化手段を、前記構築済みの前記フォルダの階層数が前記最大分類階層数に達するまで前記フォルダの階層化処理を実行させる手段として機能させる。
また、請求項4の発明は、請求項3の発明において、前記階層化手段を、前記判断手段により全ての文書が分類されていないと判断された場合、前記階層化したフォルダと同じ階層に仮のフォルダを作成し、当該分類されていない文書を該仮のフォルダに一時的に分類する一時的分類手段として機能させ、前記文書管理手段を、前記指定手段によりフォルダの最大分類階層数が指定され、前記一時的分類手段により文書を分類された前記仮のフォルダが該指定された最大分類階層数を満たす場合には、当該仮のフォルダで文書を管理する仮フォルダ文書管理手段として機能させる。
また、請求項5の発明は、請求項4の発明において、前記仮フォルダ文書管理手段を、前記仮のフォルダの名称をその他フォルダに変更する手段として機能させる。
また、請求項6の発明は、請求項1の発明において、前記構築手段を、前記指示手段により、前記分類条件として、前記文書に最も多く含まれている属性情報であって、かつ、当該属性情報の値の種類が少ない属性情報に基づいて文書を分類すると指定した場合、複数の文書に共通する属性情報に基づくフォルダを作成する手段として機能させる。
また、請求項7の発明は、文書に付与された属性情報に基づいて文書を分類する分類条件を指定する指定手段と、分類対象の複数の文書からそれぞれ抽出した属性情報の種別と属性値を前記指定手段より指定された前記分類条件に従って集計するとともに、該集計後に前記分類条件を満足するように並び替えられた属性情報の属性種別と属性値のうちの先頭の属性情報の属性種別と属性値との組み合わせによりそれぞれ識別されるフォルダを同一階層上に構築する構築手段と、前記構築手段により構築された前記フォルダに、該フォルダを識別する属性種別と属性値を有する文書を分類する分類手段と、前記構築手段により構築済みの前記フォルダ中、分類された文書が1つしかないフォルダを除くフォルダに分類された各文書を対象に属性情報の種別と属性値を抽出して前記指定手段より指定された前記分類条件に従って集計するとともに、該集計後に前記分類条件を満足するように並び替えられた属性情報の属性種別と属性値のうちの先頭にある属性情報の属性種別と属性値との組み合わせによりそれぞれ識別される新たなフォルダを前記構築済みの前記フォルダの下位階層に構築し、該新たに構築された階層の前記フォルダに該フォルダを識別する属性種別と属性値を有する文書を分類する処理を、前記構築済みの前記フォルダの階層が予め設定された分類階層に一致するまで繰り返すことにより前記フォルダを前記属性情報に基づき階層化する階層化手段と、前記階層化手段により階層化した前記フォルダの属性情報に対して管理対象となる全ての文書が分類されているか判断する判断手段と、前記判断手段により全ての文書がいずれかのフォルダに分類されていると判断された場合、前記階層化手段により階層化されたフォルダ構成で文書を管理する文書管理手段とを具備する。
また、請求項8の発明は、文書に付与された属性情報に基づいて文書を管理する文書管理方法において、前記属性情報によって文書を分類する分類条件を指定手段により指定し、分類対象の複数の文書からそれぞれ抽出した属性情報の種別と属性値を前記指定手段より指定された前記分類条件に従って集計するとともに、該集計後に前記分類条件を満足するように並び替えられた属性情報の属性種別と属性値のうちの先頭の属性情報の属性種別と属性値との組み合わせによりそれぞれ識別されるフォルダを同一階層上に構築手段により構築し、前記構築手段により構築された前記フォルダに、該フォルダを識別する属性種別と属性値を有する文書を分類手段により分類し、前記構築手段により構築済みの前記フォルダ中、分類された文書が1つしかないフォルダを除くフォルダに分類された各文書を対象に属性情報の種別と属性値を抽出して前記指定手段より指定された前記分類条件に従って集計するとともに、該集計後に前記分類条件を満足するように並び替えられた属性情報の属性種別と属性値のうちの先頭にある属性情報の属性種別と属性値との組み合わせによりそれぞれ識別される新たなフォルダを前記構築済みの前記フォルダの下位階層に構築し、該新たに構築された階層の前記フォルダに該フォルダを識別する属性種別と属性値を有する文書を分類する処理を、前記構築済みの前記フォルダの階層が予め設定された分類階層に一致するまで繰り返し実施することにより前記フォルダを前記属性情報に基づき階層化手段により階層化し、前記階層化手段により階層化した前記フォルダの属性情報に対して管理対象となる全ての文書が分類されているか判断手段により判断し、前記判断手段により全ての文書がいずれかのフォルダに分類されていると判断された場合、前記階層化手段により階層化されたフォルダ構成で文書を文書管理手段により管理する。
本発明によれば、分類対象として指定した文書に付与された属性を自動的に抽出し、抽出した属性に対して設定された値(属性値)を集計後、所定の条件に従って属性をソートし、各属性に設定された値が閾値を満たす値である場合にその属性値に対するフォルダを作成して分類するように構成したので、ユーザが分類対象の文書に付与された属性がどのような内容であるか、また、その属性に設定された値の内容を意識することなく文書を効率良く分類することが可能となる。
また、作成されたフォルダの構成から属性やその値を容易に知ることができるため、新たな分類の条件を作成することができるようになり、所望する分類が簡単に行うことが可能となる効果を奏する。
以下、本発明に係わる文書管理プログラムおよび文書管理装置および方法の一実施例を添付図面を参照して詳細に説明する。
図1は、本発明に係わる文書管理プログラムおよび文書管理装置および方法を適用して構成した文書管理装置の構成ブロック図である。
図1において、この文書管理装置100は、所定の領域に格納された状態にある文書に付与された属性とその値(「属性値」ともいう)をまとめた属性情報に基づいて分類階層を新たに構築することで文書の管理を行う。
文書管理装置100は、分類条件指定部10、分類階層保持部11、文書格納部12、属性解析部13、分類階層生成部14、閾値格納部15を具備して構成される。その構築した分類階層をたどることにより所望するフォルダを特定し、そのフォルダを参照することで階層構造を形成するフォルダに設定された属性とその属性値に合致する文書が検索され、表示される。
分類条件指定部10は、文書格納部12に格納された文書を分類するための分類条件を指定する。このときの分類条件は、属性解析部13で属性の解析を行う際に用いられ、文書に付与された属性情報に基づく分類を可能とする。
例えば、文書の分類に際して、最も多くの文書に含まれる属性に基づいて分類階層を構築する場合には、次のような分類条件を指定する。
(条件1) 最も多くの文書に含まれている属性を優先して分類する
(条件2) (条件1)に加えて属性の値の種類が少ない属性を優先して分類する
この(条件1)では、分類対象に指定された文書に最も多く含まれる属性を元にして分類が行われる。一般的に、文書名や文書作成者名などの属性は多くの文書に含まれることから、その文書名や文書作成者名などの属性を元にして優先的に分類される。
また、(条件2)では、(条件1)によって分類された最も多くの文書に含まれる属性を有する文書に対して、その属性の値(属性値)の種類が少ない属性から分類を行う。
この(条件1)と(条件2)を分類条件とすることにより、最も多くの文書に含まれる属性であって、さらにその属性の値の種類が少ない属性から順に分類される。
分類階層保持部11は、分類階層生成部14で生成した階層構造を分類条件指定部10で指定した分類条件とともに保持する。分類階層は、フォルダを階層化することによって構成した階層構造の情報であって、フォルダの名称を辿ることによって分類した文書を特定することができる。
また、保持した分類階層には、分類条件指定部10で指定した分類条件が指定されており、分類条件を指定することで生成した分類階層を特定でき、また反対に、分類階層を指定することでその分類条件を特定することができる。
文書格納部12は、HDD(Hard Disk Drive:ハードディスク)などによって構成され、属性情報が付与された文書を格納する。ユーザが設定したディレクトリ構造で格納されており、文書を参照するにはそのディレクトリ構造を辿ることによって参照できる。属性は、作成日付や作成者名、最終更新者名、文書名、書き換えの可否、圧縮状態などさまざまな情報が含まれる。
なお、文書格納部12は、必ずしも文書管理装置上に設置されている必要なく、CD(Compact Disk)や不揮発性メモリなどの記憶媒体や、DBMS(DataBase Management System:データベース)などで管理して文書管理装置と接続するような構成であってもよい。
属性解析部13は、文書格納部12で格納された文書のうち分類対象と指定された文書に付与されている属性情報を抽出し、抽出した属性情報から属性ごとに設定された値(属性値)を集計する。属性には、さまざまな属性値が設定されることもあれば、ON/OFFといった二択のうちいずれかの属性値が設定されることもある。
集計された属性ごとの集計データは、「属性が属する文書数」、「属性値」、「属性値の数」などの項目ごとにまとめられる。集計した集計データを元に、分類条件指定部10で指定した分類条件((条件1)と(条件2))を考慮して属性のソート処理が行われる。このソート処理によって分類条件に最も合致する属性から順に降順で整列される。この整列における状態遷移を図4または図6に示す。
そして、この整列状態を示したデータを分類階層生成部14に転送することで分類階層生成部14が階層化された分類階層を生成する。
分類階層生成部14は、フォルダ作成部(14−A)、閾値判断部(14−B)を具備して構成され、属性解析部13から受信した整列状態を示すデータに基づいて分類階層を生成する。この分類階層は、フォルダの階層化構造によって構成されるため、属性解析部13から受信した整列状態を示すデータを元にフォルダを作成して階層化する。
例えば、分類条件指定部10で指定された(条件1)、(条件2)によって構成した分類階層の例を図5または図7に示す。
属性解析部13から受信した整列状態を示すデータの先頭に整列された属性に対して、フォルダ作成部(14−A)でその属性の値を名称とするフォルダを作成する。例えば、属性が「A」であってその値(属性値)が「1」である場合には「A1フォルダ」というフォルダが作成される。作成された分類階層から「A1フォルダ」を特定して、参照することで分類条件(属性が「A」であってその値(属性値)が「1」という条件)に当てはまる文書が表示される。
これは、文書格納部12に格納された文書の格納位置を変更することなく、分類階層のフォルダを参照することによってそのフォルダの分類条件に当てはまる文書を表示することができることを示す。
そして、作成されたフォルダの分類条件に当てはまらないその他の文書を分類する一時的なフォルダとして、フォルダ作成部(14−A)で「未設定フォルダ」を作成する。
これによって、分類対象と指定された全ての文書がいずれかのフォルダに一時的であってもいずれかのフォルダに分類されたことになる。
また、閾値格納部15で格納された閾値を取得し、取得した閾値を超えたか閾値判断部(14−B)で判断する。閾値格納部15で格納された閾値が、分類階層の最大階層数を示している場合、フォルダ作成部(14−A)で作成したフォルダの階層数が閾値を超えていないか判断する。
その閾値を超えていない場合には、作成されたフォルダの下位階層における分類階層を構築する処理がフォルダごとに行われる。例えば、「A1フォルダ」と「未設定フォルダ」が同一階層に作成されている場合、「A1フォルダ」と「未設定フォルダ」が並行して分類階層を構築する処理が行われる。
なお、「未設定フォルダ」に対して分類階層を構築する処理が行われた場合には、その「未設定フォルダ」と同一階層でフォルダが作成される。上記例の場合、「A1フォルダ」と同一階層でフォルダが作成されることになる。
また、閾値を超えたか閾値判断部(14−B)で判断した結果、あらかじめ設定された閾値と等しい場合または超過した場合であって、作成したフォルダの構成を確定する処理を行うために一時的な「未設定フォルダ」が作成されている場合には、そのフォルダを正式なフォルダとして設定するために名称を「その他フォルダ」に変更する処理を行う。そして、分類階層の確定処理を行う。もちろん、変更することなく未設定フォルダのままでもよい。
この確定処理では、分類階層を作成するために用いた分類条件を紐付けして分類階層保持部11で記憶する。
閾値格納部15は、分類階層生成部14で分類階層を作成する際に参照する閾値を格納する。このときの閾値は、さまざまな情報を設定することができ、例えば、作成する分類階層の最大階層数とすることができる。
このような構成により、文書に付与された属性情報をユーザが意識することなく、属性情報に基づく文書の分類が行える。
図2は、図1に示す文書格納部で格納された状態にある分類階層図である。
図2では、ルートフォルダを頂点として階層化されたフォルダ構成が示され、ユーザが作成したフォルダに各文書が格納された状態を示している。[A]フォルダには文書1が格納され、[B]フォルダには文書3と文書5が格納され、[C]フォルダには文書2と文書4が格納されている。
これらの文書を分類対象の範囲として設定した状態を示している。
図3は、本願発明の文書管理装置における処理の流れを示すフローチャートである。
図3は、上記する(条件1)と(条件2)を用いて文書を分類する場合のフローチャートを示しており、たとえば、図2に示すように分類対象範囲を指定することで分類する文書が決定する。
これにより、処理が開始され、分類対象範囲にある文書に付与された属性情報を各文書から抽出する(301)。続いて、抽出した属性情報から属性ごとに設定された属性値やその属性値の数などを集計する(302)。このとき、集計される属性情報として、図4(b)に示すような「属性が属する文書数」、「属性値」、「属性値の数」がある。
そして、集計した属性ごとの集計データに対して、指定された(条件1)で属性の並び替えを行う(303)。この(条件1)では、「最も多くの文書に含まれている属性から順に並び替え」を行うことが示されているので、集計した属性情報の「属性が属する文書数」を元に降順で並び替えを行う。続いて、(条件1)で並び替えが行われた状態の属性に対して、(条件2)を適用することにより再度、属性の並び替えを行う(304)。
この(条件2)では、「属性の値の種類が少ない順に並び替え」を行うことが示されているので、(条件1)で並び替え条件として使用した「属性が属する文書数」の値が等しい属性同士間で「属性値の数」を元に属性の並び替えを行う。そして、(条件2)を適用することで並び替えられた属性の先頭に整列された属性の値のフォルダを作成する(305)。すなわち、先頭に整列された属性は、(条件1)と(条件2)を最も満足する属性である。
そして、作成されたフォルダの分類条件に分類対象の全ての文書が当てはまり、全ての文書が分類された状態にあるか判断する(306)。全ての文書が作成したフォルダに分類されている場合(306でYES)には、文書の分類処理を終了する。それに対して、全ての文書が作成したフォルダに分類されていない場合(306でNO)には、分類されていない文書を一時的に分類する未設定フォルダを作成する(307)。
これによって、先頭に整列された属性の値に対して作成されたフォルダまたは未設定フォルダのいずれのフォルダに全ての文書が分類された状態となり、この状態で、続いて、予め設定された閾値を取得する(308)。閾値が最大階層数を示し、その最大階層数に「2」が設定されているとした場合に、フォルダを作成した階層が2階層目であるか判断する(309)。
2階層目の分類処理である場合(309でYES)、すなわち、最大階層数でフォルダを作成した場合には、続いて、作成されたフォルダの中に「未設定フォルダ」が含まれているか判断する(310)。それに対して、1階層目である場合(309でNO)、すなわち、最大階層数に満たない場合には、さらに深く階層化することができるので、再度、属性情報の抽出処理(301)から処理を繰り返す。このときの属性情報の抽出処理(301)以降の処理では、作成されたフォルダごとに並行して処理が行われ、2階層目のフォルダが作成されることになる。
そして、閾値が予め設定した最大階層数の閾値と等しい場合であって、作成されたフォルダ内に「未設定フォルダ」が含まれているかの判断処理(310)で「未設定フォルダ」が含まれていると判断された場合(310でYES)には、その「未設定フォルダ」を「その他フォルダ」へと名称を変更する(311)。
「未設定フォルダ」が含まれていない場合(310でNO)や「その他フォルダ」に変更された場合には、作成したフォルダの階層分類を設定する(312)。
このような処理の流れによって、文書に付与された属性情報に基づいて自動的に文書を分類することができる。
図4、図6は、図3に示すフローチャートを実行した場合に行われる分類処理の例を示す図である。
図4、図6では、図2で示す分類対象範囲にある5つの文書(文書1〜文書5)に対して、図3のフローチャートを適用した場合の例を示している。
また、図4、図6で用いる閾値は、文書を格納するフォルダの最大階層数を示しており、図4ではその閾値に「1」が設定された場合の例を示し、図6ではその閾値に「2」が設定された場合の例を示す。すなわち、図6では、図4で作成された階層分類に対して再度、フォルダごとに文書を分類する処理を行って構成した例を示している。
まず、図3のフローチャートに示す文書に付与された属性情報を抽出する処理(301)を実行することによって、「属性A」、「属性B」、「属性C」、「属性D」、「属性E」、「属性F」、「属性G」、「属性H」、「属性I」の9つの属性が抽出できた状態(400)を図4(a)に示す。
次に、その抽出した属性ごとに設定された属性値を集計する処理(302)を行い、その集計した集計データに基づいて上記例に示す(条件1)「最も多くの文書に含まれている属性から順に並び替え」を適用する処理(303)を行って並び替えた状態(410)を図4(b)に示す。
このときの属性値を集計する処理(302)では、抽出した属性ごとに「属性が属する文書数」(411)、「属性値」(412)、「属性値の数」(413)が集計され、(条件1)が示す最も多くの文書に含まれている属性の並び替え処理では、集計した「属性が属する文書数」(411)を元に抽出した属性が降順にソートされる。
これによって、抽出処理(301)によって抽出した属性は、「属性A→属性C→属性E→属性G→属性B→属性D→属性F→属性H→属性I」の順に並び替えられる。
さらに、(条件1)を適用して並び替えを行った図4(b)に示す状態から図3に示すフローチャートの(条件2)「属性の値の種類が少ない順に並び替え」を適用する処理(304)によって、並び替えを行った状態を図4(c)に示す。この図4(c)は、(条件1)を適用後、(条件2)を適用した状態である。
この(条件2)では、属性値の種類が少ない順で並び替えを行うことから、集計した「属性値の数」(413)を元にして、同じ「属性が属する文書数」(411)を持つ属性同士で並び替えを行う。図4(b)に示す例では、「属性C」、「属性E」、「属性G」の3つの属性が同じ「属性が属する文書数」(411)を持つことを示しているので、これら3つの属性同士間で並び替えを行う。
これら3つの属性の「属性値の数」(413)を考慮すると、「属性C」は2個であり、「属性E」は1個であり、「属性G」は2個であることから(条件2)を適用することで「属性D→属性C→属性G」の降順に並び替えられる。この処理を同一の「属性が属する文書数」(411)を持つ属性のグループごとに行うことで図4(c)に示すような順序となる。
図4(c)では、「属性A」を先頭として以降、降順に「属性E→属性C→属性G→属性B→属性D→属性F→属性H→属性I」と整列される。
そして、図3のフローチャートの処理で、並び替えられた属性のうち先頭の属性に設定された属性値のフォルダを作成する処理を行う(305)。図4(c)に示す例の場合、先頭の属性が「属性A」であることから「属性A」に設定された属性値「1」と「2」のフォルダ「A2フォルダ」、「A1フォルダ」を作成して同じ階層に並べて階層分類を形成する。
このときの階層は、1回目の分類処理であるため、最上位の1階層目のフォルダとして構成される。
さらに、図3のフローチャートが示すフォルダを作成する処理(305)で作成されたフォルダに「属性A」が付与された文書を分類する。このとき、作成した「A2フォルダ」に対して文書2と文書3が分類され、「A1フォルダ」に対して文書1が分類される。
そして、分類対象に指定された文書全てが作成されたフォルダに分類されているか判断する処理(306)で全ての文書が作成した「A2フォルダ」または「A1フォルダ」のいずれかに分類されている場合には、文書の分類が終了したことを示す。また、全ての文書が分類されていない場合には、作成した「A2フォルダ」、「A1フォルダ」のいずれにも分類できない文書があることを示しているので、「未設定フォルダ」を作成して残りの文書を一時的に分類する。
図2に示す分類対象範囲の5つの文書では、文書4と文書5が「A2フォルダ」、「A1フォルダ」のいずれにも分類されないため、これらの文書を「未設定フォルダ」に一時的に分類されることになる。このときの例を図5(a)に示す。
ここで、設定されている閾値の取得処理(308)を行う。この処理では閾値として階層数が示されているので、取得した閾値が「1」の場合には、デフォルトの閾値と等しいのでフォルダへの分類処理を終了する。ただし、分類処理が終了した時点で「未設定フォルダ」があるかの判断処理(310)が行われ、「未設定フォルダ」がある場合にはその名称を「その他フォルダ」に変更する処理(311)を行った後にフォルダの階層構造を確定する処理を行う(312)。
図5(a)の例では、「未設定フォルダ」が存在するため「その他フォルダ」に変更してフォルダの階層分類を確定する。確定後の階層分類を図5(b)に示す。
すなわち、図5(a)に示すように、作成された3つのフォルダ「A2フォルダ」、「A1フォルダ」、「未設定フォルダ」は、第1の同一階層に配置されることになる。「A2フォルダ」には、付与された属性が「属性A」であってその属性値が「2」である文書「文書2」と「文書3」が分類された状態となり、「A1フォルダ」には、付与された属性が「属性A」であってその属性値が「1」である文書「文書1」が分類された状態となる。
また、図5(b)に示すように「未設定フォルダ」の名称を「その他フォルダ」変更し、「属性A」が付与されていない文書である「文書4」と「文書5」が分類された状態となる。これは、全ての文書が同一階層のフォルダに分類された状態を示している。
それに対して、設定されている閾値の取得処理(308)で取得した閾値が「1」でなく、「2」の場合には、デフォルトの閾値「1」とは異なるので、以上に示すような文書の分類処理が繰り返し行われる。このときの文書の分類処理は、第2の階層におけるフォルダの作成処理となり、第1の階層として作成されたフォルダごとに行われる。ただし、分類された文書が1つしかないフォルダに対しては、新たな階層のフォルダ作成処理は行われない。
図5(a)を例にすると、「A1フォルダ」には、文書1の1つの文書しか分類されていないため、閾値が「2」である場合であっても以降のフォルダ作成処理は行われない。すなわち、閾値が「2」である場合には、文書2と文書3とが分類された「A2フォルダ」、文書4と文書5とが分類された「未設定フォルダ」の2つのフォルダそれぞれに対して並行して分類処理が行われる。
なお、一時的に作成された「未設定フォルダ」が「その他フォルダ」に変更されずにその「未設定フォルダ」に分類された文書の分類処理が行われる場合には、「未設定フォルダ」が作成されている階層に新たなフォルダを作成する。
ここで、まず、「A2フォルダ」に対する処理を図3のフローチャートに示す流れに基づき、図6を用いて説明する。
「A2フォルダ」に分類された文書2と文書3に付与された属性情報の抽出処理が行われる(301)。このとき図6(a)に示すように「属性A」、「属性C」、「属性D」、「属性E」の4つの属性が抽出されるが、「属性A」については既にフォルダが作成された属性であるため並び替えの対象となる属性から外す。
抽出した各属性に対して設定された属性値を集計する処理(302)を行い、その集計した集計データに基づいて上記例に示す(条件1)「最も多くの文書に含まれている属性から順に並び替え」を適用する処理(303)を行って並び替えを行う。上記処理同様、属性ごとに「属性が属する文書数」、「属性値」、「属性値の数」が集計され、(条件1)から「属性が属する文書数」を元に抽出した「属性C」、「属性D」、「属性E」の各属性を降順に並び替える。これによって、「属性C→属性D→属性E」の順に並び替えられる。
そして、(条件2)「属性値の種類が少ない順に並び替え」を適用する処理(304)によって、(条件1)を適用して並び替えた「属性が属する文書数」の等しい属性同士で「属性値の数」を元に並び替えを行う。すなわち、属性Dと属性Eが等しい「属性が属する文書数」であるため、これら2つの属性に対して、「属性値の数」を元に並び替えを行うと、属性Dは1個であって属性Eも1個であるため順序をそのままとして並び替えを行う。
すなわち、(条件2)を適用して並び替えを行うことにより「属性C→属性D→属性E」となる。
次に、「未設定フォルダ」に対する処理を図3のフローチャートに示す流れに基づき、図6を用いて説明する。
「未設定フォルダ」に分類された文書1に付与された属性情報の抽出処理が行われる(301)。このとき図6(b)に示すように「属性E」、「属性F」、「属性G」、「属性H」、「属性I」の5つの属性が抽出される。これらの属性に対して、図6(a)と同様の並び替え処理を行うことで抽出した5つの属性は「属性G→属性E→属性F→属性H→属性I」と並び替えられる。
以上のように、フォルダごとに分類された文書の属性の並び替え処理を行った後に、先頭に整列された属性に対するフォルダを作成する処理(305)を行う。図6(a)に示す先頭属性である「属性C」と、図6(b)に示す先頭属性である「属性G」の属性値に対するフォルダがそれぞれ作成される。すなわち、「属性C」の属性値として「5」と「6」が設定されているので、「C5フォルダ」、「C6フォルダ」が作成される。また、「属性G」の属性値として「10」と「11」が設定されているので、「G10フォルダ」、「G11フォルダ」が作成される。
続いて、属性情報に対するフォルダの作成処理(305)で、作成した「C5フォルダ」に属性Cの属性値が「5」である文書2が分類され、「C6フォルダ」に属性Cの属性が「6」である文書3が分類される。また、作成した「G10フォルダ」に属性Gの属性値が「10」である文書4が分類され、「G11フォルダ」に属性Gの属性値が「11」である文書5が分類される。
そして、全ての文書が作成されたフォルダに分類されているかの判断処理(307)で全ての文書が分類されていると判断できるので、続いて、予め設定された閾値を取得する処理(310)を行い、設定された閾値以上であるかを判断する処理(311)を行う。予め設定された閾値が「2」であってその閾値が2階層目の「2」であることから閾値以上であると判断する。続いて、「未設定フォルダ」が作成されているかの判断処理(312)で「未設定フォルダ」が設定されていないと判断できるため、作成したフォルダの階層分類を確定する処理(314)を行う。
以上のことから、「A2フォルダ」の下位階層に「C5フォルダ」と「C6フォルダ」とが配置され、「未設定フォルダ」として一時的に作成されたフォルダの代わりに「G10フォルダ」と「G11フォルダ」とを配置する。これにより、「G10フォルダ」と「G11フォルダ」は、「A2フォルダ」と同一階層に配置されることになる。このときの階層分類を図7に示す。
この図7の階層分類では、1回目の分類処理によって作成された「A2フォルダ」、「A1フォルダ」と同じ階層に、2回目の分類処理によって作成された「G10フォルダ」、「G11フォルダ」が配置されている。また、「A2フォルダ」の下位階層には、「C5フォルダ」、「C6フォルダ」が配置されている。すなわち、2回目の分類処理であっても「未設定フォルダ」に分類された文書の分類を行う場合には、その「未設定フォルダ」が作成された階層において新たなフォルダが作成されることになる。
なお、図2に示す分類対象範囲にある文書の分類を行うにあたり、閾値を「2」以上の場合であっても図7に示すような結果となる。これは、作成されたフォルダに1つの文書が分類されているので、これ以上分類することに意味をなさなくなるためである。
以上の処理によって、本発明の文書管理装置では、文書に付与された属性とその値に基づいて自動的に文書を階層的に分類することができる。
これによって、文書に付与された属性を意識することなく、効率的な階層分類を作成することが可能となる。
従って、本発明を適用することにより、文書の格納位置を変更することなく分類階層によって必要とする文書を効率良く検索できるようになるという効果を期待できる。
また、階層化された分類を参照することで、登録された文書の傾向を知ることができ、新たな分類条件(本実施例では、(条件1)、(条件2)に該当)を作成することが可能となる。
本発明は、上記し、且つ図面に示す実施例に限定することなく、その要旨を変更しない範囲内で適宜変形して実施できるものである。
本発明は、付与された属性情報に基づいて文書の分類を行う文書管理プログラムおよびシステムおよび自動分類方法に適用可能であり、特に、既に登録された状態にある文書の属性を意識することなく効率的に分類するのに有用である。
本発明に係わる文書管理プログラムおよび文書管理装置および方法を適用して構成した文書管理装置の構成ブロック図。 図1に示す文書格納部で格納された状態にある分類階層図。 本願発明の文書管理装置における処理の流れを示すフローチャート。 一回目の属性のソート状態を示す状態遷移図。 一回目の分類処理後の階層図。 二回目の属性のソート状態を示す状態遷移図。 二回目の分類処理後の階層図。
符号の説明
10 分類条件指定部
11 分類階層保持部
12 文書格納部
13 属性解析部
14 分類階層生成部
14−A フォルダ作成部
14−B 属性判断部
15 閾値格納部

Claims (8)

  1. 文書に付与された属性情報に基づいて文書を管理する文書管理処理をコンピュータにより実行させる文書管理装置に実装され、
    前記コンピュータを、
    前記属性情報によって文書を分類する分類条件を指定する指定手段、
    分類対象の複数の文書からそれぞれ抽出した属性情報の種別と属性値を前記指定手段より指定された前記分類条件に従って集計するとともに、該集計後に前記分類条件を満足するように並び替えられた属性情報の属性種別と属性値のうちの先頭の属性情報の属性種別と属性値との組み合わせによりそれぞれ識別されるフォルダを同一階層上に構築する構築手段、
    前記構築手段により構築された前記フォルダに、該フォルダを識別する属性種別と属性値を有する文書を分類する分類手段、
    前記構築手段により構築済みの前記フォルダ中、分類された文書が1つしかないフォルダを除くフォルダに分類された各文書を対象に属性情報の種別と属性値を抽出して前記指定手段より指定された前記分類条件に従って集計するとともに、該集計後に前記分類条件を満足するように並び替えられた属性情報の属性種別と属性値のうちの先頭にある属性情報の属性種別と属性値との組み合わせによりそれぞれ識別される新たなフォルダを前記構築済みの前記フォルダの下位階層に構築し、該新たに構築された階層の前記フォルダに該フォルダを識別する属性種別と属性値を有する文書を分類する処理を、前記構築済みの前記フォルダの階層が予め設定された分類階層に一致するまで繰り返し実施することにより前記フォルダを前記属性情報に基づき階層化する階層化手段、
    前記階層化手段により階層化した前記フォルダの属性情報に対して管理対象となる全ての文書が分類されているか判断する判断手段、
    前記判断手段により全ての文書がいずれかのフォルダに分類されていると判断された場合、前記階層化手段により階層化されたフォルダ構成で文書を管理する文書管理手段
    として機能させる文書管理プログラム。
  2. 前記階層化手段を、
    前記指定手段により指定された前記分類条件を満たさず、前記判断手段により全ての文書が階層化したいずれかのフォルダに分類されていないと判断された場合、当該分類されていない文書を分類するフォルダを、前記分類条件を満たし、前記判断手段により全ての文書が階層化したいずれかのフォルダに分類されていると判断された文書を分類するフォルダと同じ階層に作成する手段
    として更に機能させる請求項1記載の文書管理プログラム。
  3. 前記指定手段を、
    前記文書の分類条件をフォルダの最大分類階層数と指定する手段
    として機能させ、
    前記階層化手段を、
    前記構築済みの前記フォルダの階層数が前記最大分類階層数に達するまで前記フォルダの階層化処理を実行させる手段
    として機能させる請求項1または2記載の文書管理プログラム。
  4. 前記階層化手段を、
    前記判断手段により全ての文書が分類されていないと判断された場合、前記階層化したフォルダと同じ階層に仮のフォルダを作成し、当該分類されていない文書を該仮のフォルダに一時的に分類する一時的分類手段
    として機能させ、
    前記文書管理手段を、
    前記指定手段によりフォルダの最大分類階層数が指定され、前記一時的分類手段により文書を分類された前記仮のフォルダが該指定された最大分類階層数を満たす場合には、当該仮のフォルダで文書を管理する仮フォルダ文書管理手段
    として機能させる請求項3記載の文書管理プログラム。
  5. 前記仮フォルダ文書管理手段を、
    前記仮のフォルダの名称をその他フォルダに変更する手段
    として機能させる請求項4記載の文書管理プログラム。
  6. 前記構築手段を、
    前記指示手段により、前記分類条件として、前記文書に最も多く含まれている属性情報であって、かつ、当該属性情報の値の種類が少ない属性情報に基づいて文書を分類すると指定した場合、複数の文書に共通する属性情報に基づくフォルダを作成する手段
    として機能させる請求項1記載の文書管理プログラム。
  7. 文書に付与された属性情報に基づいて文書を分類する分類条件を指定する指定手段と、
    分類対象の複数の文書からそれぞれ抽出した属性情報の種別と属性値を前記指定手段より指定された前記分類条件に従って集計するとともに、該集計後に前記分類条件を満足するように並び替えられた属性情報の属性種別と属性値のうちの先頭の属性情報の属性種別と属性値との組み合わせによりそれぞれ識別されるフォルダを同一階層上に構築する構築手段と、
    前記構築手段により構築された前記フォルダに、該フォルダを識別する属性種別と属性値を有する文書を分類する分類手段と、
    前記構築手段により構築済みの前記フォルダ中、分類された文書が1つしかないフォルダを除くフォルダに分類された各文書を対象に属性情報の種別と属性値を抽出して前記指定手段より指定された前記分類条件に従って集計するとともに、該集計後に前記分類条件を満足するように並び替えられた属性情報の属性種別と属性値のうちの先頭にある属性情報の属性種別と属性値との組み合わせによりそれぞれ識別される新たなフォルダを前記構築済みの前記フォルダの下位階層に構築し、該新たに構築された階層の前記フォルダに該フォルダを識別する属性種別と属性値を有する文書を分類する処理を、前記構築済みの前記フォルダの階層が予め設定された分類階層に一致するまで繰り返すことにより前記フォルダを前記属性情報に基づき階層化する階層化手段と、
    前記階層化手段により階層化した前記フォルダの属性情報に対して管理対象となる全ての文書が分類されているか判断する判断手段と、
    前記判断手段により全ての文書がいずれかのフォルダに分類されていると判断された場合、前記階層化手段により階層化されたフォルダ構成で文書を管理する文書管理手段と
    を具備する文書管理装置。
  8. 文書に付与された属性情報に基づいて文書を管理する文書管理方法において、
    前記属性情報によって文書を分類する分類条件を指定手段により指定し、
    分類対象の複数の文書からそれぞれ抽出した属性情報の種別と属性値を前記指定手段より指定された前記分類条件に従って集計するとともに、該集計後に前記分類条件を満足するように並び替えられた属性情報の属性種別と属性値のうちの先頭の属性情報の属性種別と属性値との組み合わせによりそれぞれ識別されるフォルダを同一階層上に構築手段により構築し、
    前記構築手段により構築された前記フォルダに、該フォルダを識別する属性種別と属性値を有する文書を分類手段により分類し、
    前記構築手段により構築済みの前記フォルダ中、分類された文書が1つしかないフォルダを除くフォルダに分類された各文書を対象に属性情報の種別と属性値を抽出して前記指定手段より指定された前記分類条件に従って集計するとともに、該集計後に前記分類条件を満足するように並び替えられた属性情報の属性種別と属性値のうちの先頭にある属性情報の属性種別と属性値との組み合わせによりそれぞれ識別される新たなフォルダを前記構築済みの前記フォルダの下位階層に構築し、該新たに構築された階層の前記フォルダに該フォルダを識別する属性種別と属性値を有する文書を分類する処理を、前記構築済みの前記フォルダの階層が予め設定された分類階層に一致するまで繰り返し実施することにより前記フォルダを前記属性情報に基づき階層化手段により階層化し、
    前記階層化手段により階層化した前記フォルダの属性情報に対して管理対象となる全ての文書が分類されているか判断手段により判断し、
    前記判断手段により全ての文書がいずれかのフォルダに分類されていると判断された場合、前記階層化手段により階層化されたフォルダ構成で文書を文書管理手段により管理する
    文書管理方法。
JP2006015180A 2006-01-24 2006-01-24 文書管理プログラムおよび文書管理装置および方法 Expired - Fee Related JP4765636B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2006015180A JP4765636B2 (ja) 2006-01-24 2006-01-24 文書管理プログラムおよび文書管理装置および方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2006015180A JP4765636B2 (ja) 2006-01-24 2006-01-24 文書管理プログラムおよび文書管理装置および方法

Publications (2)

Publication Number Publication Date
JP2007199843A JP2007199843A (ja) 2007-08-09
JP4765636B2 true JP4765636B2 (ja) 2011-09-07

Family

ID=38454430

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2006015180A Expired - Fee Related JP4765636B2 (ja) 2006-01-24 2006-01-24 文書管理プログラムおよび文書管理装置および方法

Country Status (1)

Country Link
JP (1) JP4765636B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5302529B2 (ja) * 2007-11-16 2013-10-02 キヤノン株式会社 情報処理装置及び情報処理方法、プログラム、記録媒体

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS63124147A (ja) * 1986-11-14 1988-05-27 Nec Corp フアイルシステムのデイレクトリ管理方式
JPH10154091A (ja) * 1996-11-26 1998-06-09 Fujitsu Ltd ファイルシステムの作成方法
JP2000090105A (ja) * 1998-09-10 2000-03-31 Toshiba Corp 文書管理方法、文書管理・検索システム
JP4794709B2 (ja) * 1999-03-01 2011-10-19 新日鉄ソリューションズ株式会社 データ管理システム及びコンピュータ読み取り可能な記録媒体

Also Published As

Publication number Publication date
JP2007199843A (ja) 2007-08-09

Similar Documents

Publication Publication Date Title
US8078627B2 (en) File management apparatus, method for controlling file management apparatus, computer program, and storage medium
JP5492187B2 (ja) 編集距離および文書情報を使用する検索結果順位付け
CN110268394A (zh) Kvs树
CN110291518A (zh) 合并树无用单元指标
CN110383261A (zh) 用于多流存储装置的流选择
CN110268399A (zh) 用于维护操作的合并树修改
JP5759915B2 (ja) ファイルリスト生成方法及びシステム並びにプログラム、ファイルリスト生成装置
JP6598996B2 (ja) データ準備のためのシグニチャベースのキャッシュ最適化
US20080115083A1 (en) Data object linking and browsing tool
JP2005519370A (ja) スレッド化されたディスカッション・アプリケーションにおけるインデントされたスレッドの効果的保管
CN106970958B (zh) 一种流文件的查询与存储方法和装置
US9305076B1 (en) Flattening a cluster hierarchy tree to filter documents
JP2000067065A (ja) 文書画像識別方法および記録媒体
KR101744892B1 (ko) 시계열 계층 인덱싱을 이용한 데이터 검색 시스템 및 데이터 검색 방법
US8145580B2 (en) Data management apparatus and method for managing data elements using a plurality of metadata elements
JP5595548B2 (ja) コンテンツ管理装置、コンテンツ管理装置の制御方法、プログラム、及びプログラムを記録した記録媒体
CN103473324A (zh) 基于非结构化数据存储的多维业务属性检索装置及方法
JP6598997B2 (ja) データ準備のためのキャッシュ最適化
JP2009517760A (ja) コンテンツをユーザに提示するシステム及び方法
JP6043899B2 (ja) 情報管理装置並びに情報検索方法
WO2024078122A1 (zh) 数据库表扫描的方法、装置以及设备
JP4765636B2 (ja) 文書管理プログラムおよび文書管理装置および方法
JP5614356B2 (ja) 検索結果出力装置および検索結果出力制御プログラムと検索結果出力方法
JP2012208565A (ja) ログ管理方法、ログ管理装置、及びプログラム
WO2017043664A1 (ja) 情報管理装置並びにファイル管理方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20081225

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110106

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110118

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110318

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110517

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110530

R150 Certificate of patent or registration of utility model

Ref document number: 4765636

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140624

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees