JP2006344067A

JP2006344067A - 情報処理装置、情報処理方法ならびにプログラム、記憶媒体

Info

Publication number: JP2006344067A
Application number: JP2005170040A
Authority: JP
Inventors: Fumiko Yoshida; 史子吉田
Original assignee: Canon Inc
Current assignee: Canon Inc
Priority date: 2005-06-09
Filing date: 2005-06-09
Publication date: 2006-12-21

Abstract

【課題】文書管理システムにおいて、複数の文書ファイルまたは複数のフォルダを統合し１つのファイルを生成するにあたり、ユーザにとって文書管理が容易なファイルを生成する。
【解決手段】データベースと通信可能に接続される情報処理装置であって、前記データベースに格納された複数の文書ファイルを構造化文書化する手段と、前記各文書ファイルに予め付加されたＩｎｄｅｘ情報および該文書ファイルが格納されていたフォルダに予め付加されたＩｎｄｅｘ情報に基づいて、前記構造化文書化された複数の文書ファイルを章立てして統一構造化文書生成用ファイルに付加する手段と、前記構造化文書化された文書ファイルに基づいて目次を生成し、前記統一構造化文書生成ファイルに付加する手段とを備える。
【選択図】図５

Description

本発明は、文書ファイルを管理する文書管理システムにおける情報処理技術に関するものである。

従来より、文書ファイルを管理する「文書管理システム」が一般的に知られている。図２１は従来の文書管理システムにおいて管理された文書ファイルを閲覧するためのユーザインタフェース（２１０１）の一例を示す図である。

図２１において、２１０２、２１０４、２１１０はフォルダを、２１０３、２１０５、２１０６、２１０７、２１０８、２１０９、２１１１、２１１２は文書ファイルをそれぞれ示している。

同図に示すように、一般に文書管理システムでは各フォルダ、各文書ファイルはツリー構造で管理され、ユーザ指示のもと、各文書ファイルが所定のフォルダ内に格納される。

図２１の例では、各文書ファイル（２１０３、２１０５、２１０６、２１０７、２１０８、２１０９、２１１１、２１１２）は全て「２００４年春プロジェクト」に関するもので、フォルダ２１０２の下位層に格納されている。なお、図２１の例では、フォルダ２１０２の下位層では、さらに属性（“テキスト”であるか“画像”であるか）によって２つのフォルダに分けて格納されている。そして、当該文書管理システムにおいて、それぞれのフォルダまたは文書ファイルは個別に管理されている。

一方で、互いに関連のある複数のフォルダまたは複数の文書ファイルについてはひとまとまりにして管理した方が、文書管理システムを利用するうえで利便性がよい場合がある。図２２は、文書管理システムにおいて管理されている関連のある文書ファイルをひとまとめに統合し、該統合後の文書ファイルをユーザインタフェース（２１０１）を介して閲覧した様子を示す図である。当該ユーザインタフェース２１０１に示されたファイル２２０１はアーカイブファイルであり、図２１に示す各フォルダ、各文書ファイルをＺＩＰ圧縮しアーカイブすることにより生成されている。
特開２００４−２５８８６１号公報

しかしながら、上記ファイル２２０１は、複数のフォルダおよび文書ファイルを単純にひとまとめにしたにすぎず、該ファイル２２０１に含まれるフォルダや文書ファイルの内容をユーザが簡単に把握できないという問題がある。無論、該ファイル２２０１を展開することで、２２０２に示すように、各フォルダ（２２０４、２２１０）および各文書ファイル（２２０３、２２０５、２２０６、２２０７、２２０８、２２０９、２２１１、２２１２）を把握することができるが、展開後は各文書ファイル及び各フォルダは個別に管理されることとなる。

つまり、文書ファイルの内容を確認したい場合には、一旦ファイル２２０１を展開しなければならない。このため、関連する複数のファイルを統合し、１つのファイルとして管理でき、かつ統合されたファイルの内容が一目で視認できることが文書管理上望ましい。

本発明は上記課題に鑑みてなされたものであり、文書管理システムにおいて、複数の文書ファイルまたは複数のフォルダを統合し１つのファイルを生成するにあたり、ユーザにとって文書管理が容易なファイルを生成することを目的とする。

上記の目的を達成するために本発明に係る情報処理装置は以下のような構成を備える。すなわち、
複数の文書ファイルが格納された格納装置と通信可能に接続される情報処理装置であって、
前記複数の文書ファイルを構造化文書に変換する変換手段と、
前記複数の文書ファイルに予め付加された付加情報と該文書ファイルが格納されていたフォルダに予め付加された付加情報とに基づいて決定された配置により、前記変換手段により変換された文書ファイルを所定のファイル上に付加する文書ファイル付加手段と、
前記変換手段により変換された複数の文書ファイルに基づいて、該各文書ファイルごとの見出しを抽出する見出し抽出手段と、
前記見出し抽出手段により抽出された複数の見出しより構成される目次を、前記所定のファイルに付加する目次付加手段とを備える。

本発明によれば、文書管理システムにおいて、複数の文書ファイルまたは複数のフォルダを統合し１つのファイルを生成するにあたり、ユーザにとって文書管理が容易なファイルを生成することが可能となる。

以下、必要に応じて添付図面を参照しながら本発明の各実施形態を詳細に説明する。なお、以下の各実施形態の説明において用いられる各用語は、次のように定義するものとする。

「構造化文書」とは、ＸＭＬ、ＳＧＭＬ等のマークアップ言語により作成された文書をいい、文書中にタグによる印を付けることで、論理構造を定義することを特徴としている。このため、複雑な論理構造をもつ文書の作成に際して専用のワープロソフトを使う必要がなく、単なるテキストエディタを使うだけでよい。換言すると、単なるテキストデータでありながら、複雑な文書構造を持ちつつ、ＯＳやソフトウェアの制約を受けることなく、利用することができる（汎用度が高い）という利点を有している。

「構造化文書化」とは、所定のアプリケーションソフトで生成された文書ファイルを、構造化文書に変換することをいう。また、「統一構造化文書」とは、統一構造化文書生成用ファイルに、構造化文書化された複数の文書ファイルを章立てして配し、さらに目次（および索引）を付加することにより得られたファイルのことをいう。

また、「統一構造化文書生成用ファイル」とは、統一構造化文書の生成に際して、構造化文書化された複数の文書ファイルや目次等を付加するための空ファイルのことをいう。

さらに、「統一構造化文書生成プログラム」とは、複数の文書ファイルに基づいて、統一構造化文書を生成するためのプログラムのことをいう。

［第１の実施形態］
＜文書管理システムの構成＞
図１は本発明の第１の実施形態にかかる情報処理装置（１０１、１０２）を備える文書管理システムの構成を示す図である。同図において、１０１、１０２は情報処理装置（ここではパーソナルコンピュータ（ＰＣ）を用いることとする）である。また、１０３はデータベースであり、サーバ１０４にて管理される文書ファイルは当該データベースに格納される。１０４はサーバであり、データベース１０３に格納された文書ファイルの読み出しや、データベース１０３への文書ファイルの格納を行う。１０５はＬＡＮであり、ＰＣ１０１、１０２、データベース１０３、サーバ１０４を通信可能に接続する。

かかる文書管理システムのもと、ユーザはＰＣ１０１（または１０２）のユーザインタフェースより、データベース１０３に格納されている文書ファイルを閲覧したり、当該文書ファイルを読み出したりすることができる。

＜情報処理装置の構成＞
次に本発明の第１の実施形態にかかる情報処理装置（１０１、１０２）のハードウェア構成を図２を用いて説明する。

図２において、２０１は制御メモリ（ＲＯＭ）、２０２は中央演算処理装置、２０３はメモリ（ＲＡＭ）、２０４はハードディスク、リムーバブルディスク等の外部記憶装置、２０５はキーボード、マウス等の入力装置、２０６はＣＲＴ等の表示装置、２０７はＬＡＮ１０５と接続し、他の機器と通信を行なうためのＩ／Ｆ装置、２０８はバスである。

本実施形態にかかる情報処理機能を実現するための制御プログラム（統一構造化文書生成プログラム２０９）やその制御プログラムで用いるデータは、外部記憶装置２０４に記憶される。これらの制御プログラムやデータは、中央演算処理装置２０２の制御のもと、バス２０８を通じて適宜メモリ２０３に取り込まれ、中央演算処理装置２０２によって実行される。

＜統一構造化文書生成処理の概要＞
次に上記文書管理システムのもとで実行される統一構造化文書生成処理の概要について図３〜図５を用いて説明する。図３は統一構造化文書生成プログラム２０９の機能ブロック図であり、図４は当該統一構造化文書生成プログラム２０９を構成する構造化文書生成部の詳細機能ブロック図である。また、図５は統一構造化文書生成プログラム２０９のもとで統一構造化文書を生成する場合の処理の概要を説明するための図である。

図３において、３０１はユーザインタフェース部であり構造化文書生成プログラム２０９起動の際には、表示装置２０６上に所定のウィンドウを表示する。ユーザからの各種指示は当該ウィンドウを介して入力される。３０２は文書ファイル閲覧部である。ユーザは当該文書ファイル閲覧部３０２を実行することで、データベース１０３内の任意のフォルダを閲覧することができる（フォルダの内容がウィンドウ上に表示される）。

図５の５００はユーザが文書ファイル閲覧部３０２を実行させることでデータベース１０３内のフォルダ（「２００４春プロジェクト」フォルダ５０１）を閲覧した様子を示したものである。図５の５００において、５０１、５０３、５０９はフォルダを、５０２、５０５、５０６、５０７、５０８、５１０、５１１は文書ファイルをそれぞれ示している。

ここで、各フォルダ（５０３、５０９）ならびに各文書ファイル（５０２、５０４、５０５、５０６、５０７、５０８、５１０、５１１）には、既にユーザによりＩｎｄｅｘ情報（付加情報）が付加されているものとする（Ｉｎｄｅｘ情報付加部３０３を実行させることでＩｎｄｅｘ情報を付加することができる。詳細は後述）。なお、Ｉｎｄｅｘ情報とは、複数の文書ファイルをひとまとめに統合し統一構造化文書を生成する際に、各文書ファイルの章立てに用いられる情報である。

ここで本実施形態にかかる情報処理装置（１０１、１０２）において、フォルダ５０１内の文書ファイルを統合し統一構造化文書を生成すべく、ユーザが統一構造化文書生成指示を入力すると、統一構造化文書生成部３０５は以下のように動作する。

はじめに、統一構造化文書生成用ファイル取得部４０１が動作し、統一構造化文書生成用ファイル５３０を取得する。なお、本実施形態においては、統一構造化文書生成用ファイル５３０はサーバ１０４に格納されているものとする。

次に図４に示す未処理情報判断部４０２が動作し、フォルダ５０１内のフォルダ、文書ファイルのうち未処理のフォルダならびに文書ファイル（構造化文書化されていないフォルダ、文書ファイル）の有無を判断する。

未処理情報判断部４０２において未処理と判断されたフォルダならびに文書ファイルは、章立て処理部４０３において処理される。具体的には、未処理の文書ファイルを構造化文書化するとともに、未処理のフォルダならびに文書ファイルに付加されているＩｎｄｅｘ情報を取得する。さらに、当該取得したＩｎｄｅｘ情報に従って、上記構造化文書化された文書ファイルに章立てを付ける。図５の５２２は構造化文書化した文書ファイルに章立てを付けて上記統一構造化文書生成用ファイル５３３に配した様子を示している。

次に、目次作成部４０４では、構造化文書化された文書ファイル５２２に基づいて目次を作成し、上記統一構造化文書生成用ファイル５３０に付加する。図５の５２１は統一構造化文書生成用ファイル５３０に目次が付加された様子を示している。

さらに、目次用リンク作成部４０４では、目次作成部４０４において作成された目次について構造化文書化された文書ファイル５２２との間にリンクを作成する。

次に、索引作成部４０６では、構造化文書化された文書ファイルより索引を抽出し、上記統一構造化文書生成用ファイル５３０に付加する。図５の５２３は統一構造化文書生成用ファイル５３０に索引が付加された様子を示している。

さらに、索引用リンク作成部４０７では、索引作成部４０６において作成された索引について構造化文書化された文書ファイル５２２との間にリンクを作成する。

以上の処理により、統一構造化文書５２０が生成される。なお、上記説明では、処理対象となる全てのフォルダならびに文書ファイルにＩｎｄｅｘ情報が付加されていることを前提として説明したが、本発明は特にこれに限定されるものではない。処理対象となるフォルダならびに文書ファイルの中に、Ｉｎｄｅｘ情報が付加されていないフォルダならびに文書ファイルが含まれていた場合、章立て処理部４０３では、「文書ファイル・フォルダ名の名前順」＋「ツリーの階層順」で章立てを付けるものとする。

＜情報処理装置における処理の流れ＞
以上の説明を踏まえて、統一構造化文書生成時の情報処理装置（１０１、１０２）における処理の流れについて説明する。図６は、本発明の第１の実施形態にかかる情報処理装置（１０１、１０２）における処理の流れを示す図である。

ステップＳ６０１では、統一構造化文書生成用ファイル取得部４０１が動作し、サーバ１０４より統一構造化文書生成用ファイル５３０を取得する。ステップＳ６０２では、未処理情報判断４０２が動作し、処理対象となるフォルダまたは文書ファイルのうち、未処理の文書フォルダまたはファイルの有無を判断する。

ステップＳ６０２において未処理のフォルダまたは文書ファイルがあると判断された場合には、ステップＳ６０３に進む。一方、未処理のフォルダまたは文書ファイルがないと判断された場合には統一構造化文書生成処理を終了する。ステップＳ６０３では、章立て処理部４０３が動作し、当該フォルダまたは文書ファイルに付加されたＩｎｄｅｘ情報に基づいて章立て順序を取得する。

ステップＳ６０４では、取得された章立て順序に基づいて文書ファイル内部の章立てのカスタマイズを実行する。さらに、当該文書ファイルを構造化文書化する。

ステップＳ６０５では、目次作成部４０４が動作し、構造化文書化された文書ファイルより見出しを抽出し、目次を作成する。

ステップＳ６０６では、ステップＳ６０４にて構造化文書化された文書ファイルと、ステップＳ６０５にて作成された目次とを構造化文書生成用ファイル５３０に付加する。さらに、目次リンク作成部４０５が動作し、ステップＳ６０５にて付加された目次から構造化文書化された文書ファイルへのリンクを作成する。

ステップＳ６０７では、索引作成部４０６が動作し、構造化文書化された文書ファイルから索引を抽出し、索引を作成する。

ステップＳ６０８では、ステップＳ６０７にて作成された索引を構造か文書生成用ファイル５３０に付加する。さらに、索引用リンク作成部４０６が動作し、ステップＳ６０７にて付加された索引から構造化文書化された文書ファイルへのリンクを作成する。

ステップＳ６０８における処理が終了した後はステップＳ６０２に戻り、未処理のフォルダまたは文書ファイルがなくなるまで上記処理を繰り返す。

なお、上記説明においては、ステップＳ６０７において構造化文書化された文書ファイルから索引を抽出・作成し、ステップＳ６０８において当該抽出された索引を用いて構造化文書化された文書ファイルへのリンクを作成することとしたが、当該処理（索引の抽出・作成、リンク作成処理）は行わなくともよい。

つまり、「索引作成部４０６が動作することにより、構造化文書化された文書ファイルから索引を抽出し、作成された索引を構造化文書に生成用ファイル５３０に付加する」処理を行わず、目次だけ作成し付加させるよう構成しても良い。

また、上記説明においては、構造化文書化された文書ファイルから見出し抽出・目次作成をし、これらを統一構造化文書生成用ファイルに付加した後に、索引を抽出・作成し、統一構造化文書生成用ファイルに付加することとしたが、処理の順序は特にこれに限定されるものではない。例えば、構造化文書化された文書ファイルから見出し抽出・目次作成した後に、索引を抽出・作成した上で、これらを統一構造化文書生成用ファイルに付加するようにしてもよい（具体的な処理の流れを図７に示す）。

また、上記説明においては、ステップＳ６０２において読み込まれた全てのフォルダまたは文書ファイルについて、Ｉｎｄｅｘ情報が付加されているものとしたが、Ｉｎｄｅｘ情報が付加されていないこともあり得る。

このようにＩｎｄｅｘ情報が付加されていないフォルダまたは文書ファイルが読み込まれた場合の情報処理装置１０１における処理は、図８または図９のようになる。つまり、ステップＳ６０１にて統一構造化文書生成用ファイルを取得する前または取得した後に、図８または図９に示すようにリスト作成処理を行う。なお、リスト作成処理では、「文書・フォルダ名の名前順」＋「ツリー階層順」で章立てを行う。

また、上記説明においては、データサーバ１０３に格納された電子データである文書ファイルを直接構造化文書化して統一構造化文書生成用ファイルに付加することとしたが、特にこれに限定されるものではない。例えば、印刷された文書ファイル（原稿）をＯＣＲにかけた後に構造化文書化し、統一構造化文書生成用ファイルに付加するようにしてもよい。

あるいは、文書ファイルを構造化文書化したものを印刷し、当該印刷された文書ファイル（構造化文書化されれたもの）をＯＣＲにかけた後に、統一構造化文書生成用ファイルに付加するようにしてもよい。なお、いずれの場合も、構造化文書化された後に目次の作成ならびに索引の作成を実行する。

＜情報処理装置におけるユーザインタフェース＞
本実施形態にかかる情報処理装置１０１、１０２におけるユーザインタフェースについて説明する。図１０は情報処理装置１０１、１０２の表示装置２０６に表示されるユーザインタフェース（１００１）の一例を示す図である。

図１０（Ａ）において、５０２、５０４、５１０はフォルダを、５０３、５０５、５０６、５０７、５０８、５０９、５１０、５１２は文書ファイルをそれぞれ示している。

付加情報としてＩｎｄｅｘ情報を付ける場合には、Ｉｎｄｅｘ情報を付加したい文書ファイルまたはフォルダを左クリックすることにより選択した後、右クリックする。これによりダイアログ１００２が表示されるため、「ｉｎｄｅｘをつける」を選択することで、所望の文書ファイルまたはフォルダにＩｎｄｅｘ情報を付加することができる（図１０（８Ａ）では、文書ファイル５０５を選択した場合について示している）。なお、ダイアログ１００２に代えてアイコンを表示するようにしてもよいし、リストを表示するようにしてもよい。

ダイアログ１００２にて「ｉｎｄｅｘをつける」を選択した後、所定の付加情報を入力する。図１０（Ｂ）は、Ｉｎｄｅｘ情報として、「第２節」と入力した場合について示している。なお、Ｉｎｄｅｘ情報の入力は、キーボードを介して直接入力できるようにしてもよいし、所定のリストから選択するようにしてもよい。あるいは選択肢が表示され、その中から選択するようにしてもよい。

次に、複数の文書ファイルおよびフォルダに対する付加情報の付加が終了したら、ルートフォルダ５０１を選択し、右クリックでダイアログ１１０１を表示させる。図１１（Ａ）はルートフォルダ５０１を選択し、右クリックでダイアログ１１０１を表示させた状態を示す図である。ここで、「ファイルを統合してｅｘｐｏｒｔ（目次付）」を選択することにより、ルートフォルダ５０１以下のフォルダならびに文書ファイルを対象として、統一構造化文書が生成されることとなる。なお、ダイアログ１１０１において、「文書ファイルを統合してｅｘｐｏｒｔ（目次付）」を選択した場合には、（索引が付加されない）統一構造化文書が生成される。また、ダイアログ１１０１において、「文書ファイルを統合してｅｘｐｏｒｔ（目次索引付）」を選択した場合には、目次と索引の両方が付加された統一構造化文書が生成されることとなる。

なお、ダイアログ１１０１に代わってリストを表示するようにしてもよいし、選択肢を表示し選択するようにしてもよい。また、ｅｘｐｏｒｔの形式は目次のみ付加するようにしてもよいし、目次・索引を付加するようにしてもよい。生成された統一構造化文書は、情報処理装置１０１の画面の指定された場所に格納される。図１１（Ｂ）は生成された統一構造化文書がデスクトップ１１０２上に表示された様子を示している。ただし、出力先は文書管理システム内でもよいし、文書管理システム外であってもよい。

以上の説明から明らかなように、本実施形態では、文書管理システムにおいて管理された複数の文書ファイルまたは複数のフォルダを統合し１つのファイルを生成するにあたり、文書ファイルを構造化文書化したうえで統合し、さらに、構造化文書化された文書ファイルに基づいて作成された目次（および索引）を付加する構成とした。

この結果、当該生成されたファイル（統一構造化文書）を閲覧する際に、当該ファイルの内容を容易に把握することが可能となり、文書管理が容易になるという効果がある。つまり、従来のように、複数のファイルを開き、ほしい情報についていちいち検索をかけなくても、すぐに目的の文書ファイルへたどり着くことができるようになる。

［第２の実施形態］
上記第１の実施形態では、ユーザが指定したフォルダに含まれる複数の文書ファイルのみを統合し統一構造化文書を生成することとしたが、本発明は特にこれに限られず、並行して当該指定されたフォルダよりも古いバージョンのフォルダに含まれる複数の文書ファイルについて統一構造化文書を生成するようにしてもよい。さらに、ユーザが指定したフォルダに含まれる複数の文書ファイルに基づいて生成された統一構造化文書と、当該指定されたフォルダよりも古いバージョンのフォルダに含まれる複数の文書ファイルに基づいて生成された統一構造化文書との差分を明示するよう構成するようにしてもよい。以下に詳細を説明する。

＜情報処理装置の構成＞
図１２は、本実施形態にかかる情報処理装置のハードウェア構成を示す図である。上記第１の実施形態と同様であるため、説明は省略する（図２と同様の機器については同一の参照番号を付している）。なお、外部記憶装置２０４には、バージョンの異なる文書ファイルについても統一構造化文書を生成することが可能な統一構造化文書生成プログラム１２０１が格納されている。

＜統一構造化文書生成の概要＞
図１３は本実施形態にかかる統一構造化文書生成プログラム１２０１の機能ブロック図であり、図１４は当該統一構造化文書生成プログラム１２０１を構成する構造化文書生成部の詳細機能ブロック図である。また、図１５は統一構造化文書生成プログラム１２０１のもとで統一構造化文書を生成する場合の処理の概要を説明するための図である。

図１４に示す機能ブロック図と図４との相違は、旧バージョン取得部１３０１と差分抽出部１３０２とが付加されている点である。旧バージョン取得部１３０１は、ユーザが選択したフォルダに含まれるフォルダならびに文書ファイルに基づいて統一構造化文書を生成するに際して、当該選択したフォルダよりも古いバージョンのフォルダに含まれる複数のフォルダならびに文書ファイルをデータベース１０３より取得する。

差分抽出部１２０２は、ユーザが選択したフォルダに含まれるフォルダならびに文書ファイルに基づいて生成された統一構造化文書と、当該選択したフォルダよりも古いバージョンのフォルダに含まれる複数のフォルダならびに文書ファイルに基づいて生成された統一構造化文書との差分を抽出する。

図１５の１５００はユーザが文書ファイル閲覧部３０２を実行させることでデータベース１０３内のフォルダ（「２００４春プロジェクト」フォルダ５０１）を閲覧した様子を示したものである。図１５の１５００において、５０１、５０３、５０９はフォルダを、５０２、５０５、５０６、５０７、５０８、５１０、５１１は文書ファイルをそれぞれ示している。

ここで、各フォルダ（５０３、５０９）ならびに各文書ファイル（５０２、５０４、５０５、５０６、５０７、５０８、５１０、５１１）には、既にユーザによりＩｎｄｅｘ情報（不図示）が付加されているものとする。

また、各文書ファイル（５０２、５０４、５０５、５０６、５０７、５０８、５１０、５１１）ならびにフォルダ５０１ごとに記載された「（Ｖ○○）」とは、文書管理システムにおける付加された文書ファイル（またはフォルダ）のバージョン情報である。

例えば、「２００４春プロジェクト」フォルダ５０１はバージョン３であり、「概要」文書ファイル５０２はバージョン２であることを示す。

一方、図１５の１５０１は「２００４年春プロジェクト」フォルダ５０１について統一構造化文書を生成するにあたり、旧バージョン取得部１３０１に取得された旧バージョンのフォルダを図示したものである。

図１５の１５０１において、５１２、５１４、５２０はフォルダを、５１３、５１５、５１６、５１７、５１８、５１９、５２１、５２２は文書ファイルをそれぞれ示している。

また、各文書ファイル（５１３、５１５、５１６、５１７、５１８、５１９、５２１、５２２）ならびにフォルダ（５１４、５２０）には、既にユーザによりＩｎｄｅｘ情報（不図示）が付加されているものとする。

また、各文書ファイル（５１３、５１５、５１６、５１７、５１８、５１９、５２１、５２２）ならびにフォルダ５１２に表示された「（Ｖ○○）」とは、文書管理システムにおける文書ファイル（またはフォルダ）のバージョン情報である。

１５００と１５０１とを対比すると、フォルダ５０１はＶ３であるのに対して、フォルダ５１２はＶ２であり、フォルダ５１２はフォルダ５０１よりも旧バージョンのフォルダであることがわかる。

さらに旧バージョンのフォルダ５１２に含まれる各文書ファイルについて対比すると、「概要」文書ファイル５０２と５１３、「メンバー表」文書ファイル５０４と５１５、「プロジェクト詳細」文書ファイル５０５と５１６とは、それぞれ同一バージョンの文書ファイルであることがわかる。

一方、「打ち合わせメモ」文書ファイル５０７と５１８、「プレゼン資料」文書ファイル５０８と５１９、「配置図」文書ファイル５１０と５２１、「ロゴマーク」文書ファイル５１１と５２２とは、それぞれ異なるバージョンの文書ファイルである。

ここで本実施形態にかかる情報処理装置（１０１、１０２）において、「２００４春プロジェクト」の最新版のフォルダ５０１内の文書ファイルを統合し、統一構造化文書を生成すべく、ユーザが統一構造化文書生成指示を入力すると、統一構造化文書生成部３０５は上記第１の実施形態と同様に動作する。

このとき、あわせて「２００４春プロジェクト」の旧バージョンのフォルダ５１２内の文書ファイルについても統一構造化文書が生成される（図１５の１５０２、１５０３）。さらに、最新版のフォルダ５０１についての統一構造化文書と、旧バージョンのフォルダ５１２についての統一構造化文書とはそれぞれ表示装置２０６に表示される。

図１５の１５０４は、上下にならべて表示された最新版の統一構造化文書（１５０２）と旧バージョンの統一構造化文書（１５０３）とを示す図である。なお、差分抽出部１３０２では、最新版のフォルダ５０１に含まれる複数のフォルダならびに文書ファイルに基づいて生成された統一構造化文書と、旧バージョンのフォルダ５１２に含まれる複数のフォルダならびに文書ファイルに基づいて生成された統一構造化文書との差分を抽出しており、当該抽出された差分は統一構造化文書の右端に赤字枠で表示される（１５０５）。ただし、差分の表示方法については、特にこれに限られず、上端、下端または左端に表示させてもよいし、またアイコンで隠すようにしてもよい。

＜情報処理装置における処理の流れ＞
次に本実施形態にかかる情報処理装置（１０１、１０２）の統一構造化文書生成時の処理の流れについて説明する。図１６は、本発明の第２の実施形態にかかる情報処理装置（１０１、１０２）における処理の流れを示す図である。

ステップＳ１６０１では、旧バージョン取得部１３０１が動作し、ユーザが統一構造化文書の生成を指示したフォルダよりも古いバージョンのフォルダに含まれる複数のフォルダならびに文書ファイルをデータベース１０３より取得する。

上記ステップＳ６０２からＳ６０８までの処理は、最新版のフォルダ５０１と旧バージョンのフォルダ５１２に対して実行される。そして、ステップＳ１６０２では、最新版のフォルダ５０１に含まれる文書ファイルを用いて生成された統一構造化文書と、旧バージョンのフォルダ５１２に含まれる文書ファイルを用いて生成された統一構造化文書との差分を抽出し、統一構造化文書生成用ファイル５３０に付加する。

以上の説明から明らかなように、本実施形態では、ユーザが選択した最新版のフォルダについての統一構造化文書のみならず、対応する旧バージョンのフォルダについての統一構造化文書についても生成するよう構成することで、ユーザは両者の差分をみることが可能となり、ユーザにとっては文書管理が一層容易になる。

なお、上記説明においては、構造化文書化された文書ファイルから見出し抽出・目次作成し、これらを統一構造化文書生成用ファイルに付加した後に、索引を抽出・作成し、統一構造化文書生成用ファイルに付加することとしたが、処理の順序は特にこれに限定されるものではない。例えば、構造化文書化された文書ファイルから見出し抽出・目次作成した後に、索引を抽出・作成した上で、これらを統一構造化文書生成用ファイルに付加するようにしてもよい（具体的な処理の流れを図１７に示す）。

また、上記説明においては、構造化文書化された文書ファイルならびに目次、索引を統一構造化文書生成ファイルに付加した後に、新旧文書ファイルの差分を抽出し、統一構造化文書生成ファイルに付加することとしたが、処理の順序は特にこれに限定されるものではない。例えば、新旧の文書ファイルを構造化文書化した後に差分を抽出し統一構造化文書生成ファイルに付加したうえで、目次、索引の作成、付加を行うようにしてもよい（具体的な処理の流れを図１８に示す）。

［第３の実施形態］
上記第１の実施形態では、図５の５００に示す構成を備えるフォルダ５０１について統一構造化文書を生成することとしたが、本発明の処理対象は特にこれに限定されるものではなく、図５の５００とは異なる構成を備えるフォルダに対しても同様に統一構造化文書を生成することが可能である。以下に詳細を説明する。

＜情報処理装置におけるユーザインタフェース＞
図１９は本実施形態にかかる情報処理装置（１０１、１０２）の表示装置２０６に表示されるユーザインタフェース（１００１）の一例を示す図である。

図１０のウィンドウ１００１に表示されたフォルダ及び文書ファイルの場合、フォルダ５０１（ルートフォルダ）の下位側に文書ファイル５０２とフォルダ５０３、５０９が配されていた。これに対して、図１９のウィンドウ１００１に表示されたフォルダ及び文書ファイルの場合、フォルダ１９０１（ルートフォルダ）の下位側に直接文書ファイルが配されておらず、フォルダ１９０２、１９０３、１９０９が配されている。

さらに、図１０のウィンドウ１００１では、フォルダ５０３、５０９の下位側には、複数種類の文書ファイルが混在して配されていたのに対して、図１９のフォルダ１９０３の下位側には、複数のフォルダ１９０４〜１９０８が配され、各フォルダ１９０４〜１９０８内には、同一種類の文書ファイルのみが格納されている。同様に、フォルダ１９０９０の下位側には、複数のフォルダ１９１０、１９１１が配され、各フォルダ１９１０、１９１１内には、同一種類の文書ファイルのみが格納されている。

かかる構成のもとでは、各フォルダはテンプレートフォルダとして機能し、テンプレートフォルダに付加されたＩｎｄｅｘ情報に基づいて章立てが実施されることとなる。つまり、ユーザはテンプレートフォルダにＩｎｄｅｘ情報を付加しさえすれば、該テンプレートフォルダの下位側に格納された文書ファイルそれぞれにＩｎｄｅｘ情報を付加しなくとも、上記第１の実施形態と同様の統一構造化文書を生成することが可能となる。

図１９はテンプレートフォルダとして機能させようとするフォルダにＩｎｄｅｘ情報を付加する様子を示している。同図に示すように、Ｉｎｄｅｘ情報を付加するにあたっては、まず、所望のフォルダを左クリックすることで該フォルダを選択したのち、右クリックする。これによりダイアログ１９２０が表示されるため、当該ダイアログ１９２０より、「ｉｎｄｅｘをつける」を選択することでＩｎｄｅｘ情報を付加することができる。

また、統一構造化文書を生成するにあたっては、ルートフォルダ（１８０１）を左クリックすることで該ルートフォルダを選択したのち、右クリックすることで、ダイアログ２００１を表示させる（図２０）。このとき、「ファイルを結合してｅｘｐｏｒｔ（目次付）」を選択すると、ルートフォルダ１９０１に含まれる文書ファイルについての統一構造化文書の生成が開始される。２００３は生成された統一構造化文書がデスクトップ２００２上に表示された様子を示している。

以上の説明から明らかなように、本実施形態によれば、フォルダに付加されたＩｎｄｅｘ情報のみに基づいて章立てを実施し、統一構造化文書を生成する構成としたことにより、各フォルダに格納された文書ファイルに対してＩｎｄｅｘ情報を付加する必要がなくなり、統一構造化文書を生成するうえでのユーザの操作性が向上する。

［他の実施形態］
なお、本発明は、複数の機器（例えばホストコンピュータ、インタフェイス機器、リーダ、プリンタなど）から構成されるシステムに適用しても、一つの機器からなる装置（例えば、複写機、ファクシミリ装置など）に適用してもよい。

また、本発明の目的は、前述した実施形態の機能を実現するソフトウェアのプログラムコードを記録した記憶媒体を、システムあるいは装置に供給し、そのシステムあるいは装置のコンピュータ（またはＣＰＵやＭＰＵ）が記憶媒体に格納されたプログラムコードを読出し実行することによっても、達成されることは言うまでもない。

この場合、記憶媒体から読出されたプログラムコード自体が前述した実施形態の機能を実現することになり、そのプログラムコードを記憶した記憶媒体は本発明を構成することになる。

プログラムコードを供給するための記憶媒体としては、例えば、フロッピ（登録商標）ディスク、ハードディスク、光ディスク、光磁気ディスク、ＣＤ−ＲＯＭ、ＣＤ−Ｒ、磁気テープ、不揮発性のメモリカード、ＲＯＭなどを用いることができる。

また、コンピュータが読出したプログラムコードを実行することにより、前述した実施形態の機能が実現されるだけでなく、そのプログラムコードの指示に基づき、コンピュータ上で稼働しているＯＳ（オペレーティングシステム）などが実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。

さらに、記憶媒体から読出されたプログラムコードが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書込まれた後、そのプログラムコードの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるＣＰＵなどが実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。

本発明の第１の実施形態にかかる情報処理装置（１０１、１０２）を備える文書管理システムの構成を示す図である。本発明の第１の実施形態にかかる情報処理装置（１０１、１０２）のハードウェア構成を示す図である。統一構造化文書生成プログラム２０９の機能ブロック図である。統一構造化文書生成プログラム２０９に含まれる構造化文書生成部の詳細機能ブロック図である。統一構造化文書生成プログラム２０９のもとで統一構造化文書を生成する場合の処理の概要を説明するための図である。本発明の第１の実施形態にかかる情報処理装置（１０１、１０２）における処理の流れを示す図である。本発明の第１の実施形態にかかる情報処理装置（１０１、１０２）における処理の流れを示す図である。本発明の第１の実施形態にかかる情報処理装置（１０１、１０２）における処理の流れを示す図である。本発明の第１の実施形態にかかる情報処理装置（１０１、１０２）における処理の流れを示す図である。本発明の第１の実施形態にかかる情報処理装置（１０１、１０２）の表示装置２０６に表示されるユーザインタフェース（１００１）の一例を示す図である。本発明の第１の実施形態にかかる情報処理装置（１０１、１０２）の表示装置２０６に表示されるユーザインタフェース（１００１）の一例を示す図である。本発明の第２の実施形態にかかる情報処理装置のハードウェア構成を示す図である。統一構造化文書生成プログラム１２０１の機能ブロック図である。統一構造化文書生成プログラム１２０１を構成する構造化文書生成部の詳細機能ブロック図である。統一構造化文書生成プログラム１２０１のもとで統一構造化文書を生成する場合の処理の概要を説明するための図である。本発明の第２の実施形態にかかる情報処理装置（１０１、１０２）における処理の流れを示す図である。本発明の第２の実施形態にかかる情報処理装置（１０１、１０２）における処理の流れを示す図である。本発明の第２の実施形態にかかる情報処理装置（１０１、１０２）における処理の流れを示す図である。本発明の第３の実施形態にかかる情報処理装置（１０１、１０２）の表示装置２０６に表示されるユーザインタフェース（１００１）の一例を示す図である。本発明の第３の実施形態にかかる情報処理装置（１０１、１０２）の表示装置２０６に表示されるユーザインタフェース（１００１）の一例を示す図である。従来の文書管理システムにおいて管理された文書ファイルを閲覧するためのユーザインタフェース（２１０１）の一例を示す図である。文書管理システムにおいて管理されている関連のある文書ファイルをひとまとめに統合し、該統合後の文書ファイルをユーザインタフェース（２１０１）を介して閲覧した様子を示す図である。

Claims

複数の文書ファイルが格納された格納装置と通信可能に接続される情報処理装置であって、
前記複数の文書ファイルを構造化文書に変換する変換手段と、
前記複数の文書ファイルに予め付加された付加情報と該文書ファイルが格納されていたフォルダに予め付加された付加情報とに基づいて決定された配置により、前記変換手段により変換された文書ファイルを所定のファイル上に付加する文書ファイル付加手段と、
前記変換手段により変換された複数の文書ファイルに基づいて、該各文書ファイルごとの見出しを抽出する見出し抽出手段と、
前記見出し抽出手段により抽出された複数の見出しより構成される目次を、前記所定のファイルに付加する目次付加手段と
を備えることを特徴とする情報処理装置。
前記文書ファイル付加手段は、前記付加情報を見出しとして、前記変換手段により変換された文書ファイルを前記所定のファイル上に付加することと特徴とする請求項１に記載の情報処理装置。
前記変換手段により変換された複数の文書ファイルに基づいて生成された索引を、前記所定のファイル上に付加する索引付加手段を更に備えることを特徴とする請求項１に記載の情報処理装置。
前記格納装置に格納された前記複数の文書ファイルの格納状態を閲覧する閲覧手段と、
前記閲覧手段により閲覧された文書ファイルならびに該文書ファイルが格納されているフォルダに対して、前記付加情報を入力する付加情報入力手段と
を備えることを特徴とする請求項１に記載の情報処理装置。
前記変換手段により変換された複数の文書ファイルと、前記目次付加手段により付加された目次との間にリンクを生成する第１のリンク生成手段を更に備えることを特徴とする請求項１に記載の情報処理装置。
前記変換手段により変換された複数の文書ファイルと、前記索引付加手段により付加された索引との間にリンクを生成する第２のリンク生成手段を更に備えることを特徴とする請求項３に記載の情報処理装置。
複数の文書ファイルが格納された格納装置と通信可能に接続される情報処理装置における情報処理方法であって、
前記複数の文書ファイルを構造化文書に変換する変換工程と、
前記複数の文書ファイルに予め付加された付加情報と該文書ファイルが格納されていたフォルダに予め付加された付加情報とに基づいて決定された配置により、前記変換工程により変換された文書ファイルを所定のファイル上に付加する文書ファイル付加工程と、
前記変換工程により変換された複数の文書ファイルに基づいて、該各文書ファイルごとの見出しを抽出する見出し抽出工程と、
前記見出し抽出工程により抽出された複数の見出しより構成される目次を、前記所定のファイルに付加する目次付加工程と
を備えることを特徴とする情報処理方法。
請求項７に記載の情報処理方法をコンピュータによって実現させるための制御プログラムを格納した記憶媒体。
請求項７に記載の情報処理方法をコンピュータによって実現させるための制御プログラム。