JP2006344067A - 情報処理装置、情報処理方法ならびにプログラム、記憶媒体 - Google Patents

情報処理装置、情報処理方法ならびにプログラム、記憶媒体 Download PDF

Info

Publication number
JP2006344067A
JP2006344067A JP2005170040A JP2005170040A JP2006344067A JP 2006344067 A JP2006344067 A JP 2006344067A JP 2005170040 A JP2005170040 A JP 2005170040A JP 2005170040 A JP2005170040 A JP 2005170040A JP 2006344067 A JP2006344067 A JP 2006344067A
Authority
JP
Japan
Prior art keywords
document
file
folder
information processing
files
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2005170040A
Other languages
English (en)
Inventor
Fumiko Yoshida
史子 吉田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2005170040A priority Critical patent/JP2006344067A/ja
Publication of JP2006344067A publication Critical patent/JP2006344067A/ja
Withdrawn legal-status Critical Current

Links

Images

Abstract

【課題】 文書管理システムにおいて、複数の文書ファイルまたは複数のフォルダを統合し1つのファイルを生成するにあたり、ユーザにとって文書管理が容易なファイルを生成する。
【解決手段】 データベースと通信可能に接続される情報処理装置であって、前記データベースに格納された複数の文書ファイルを構造化文書化する手段と、前記各文書ファイルに予め付加されたIndex情報および該文書ファイルが格納されていたフォルダに予め付加されたIndex情報に基づいて、前記構造化文書化された複数の文書ファイルを章立てして統一構造化文書生成用ファイルに付加する手段と、前記構造化文書化された文書ファイルに基づいて目次を生成し、前記統一構造化文書生成ファイルに付加する手段とを備える。
【選択図】 図5

Description

本発明は、文書ファイルを管理する文書管理システムにおける情報処理技術に関するものである。
従来より、文書ファイルを管理する「文書管理システム」が一般的に知られている。図21は従来の文書管理システムにおいて管理された文書ファイルを閲覧するためのユーザインタフェース(2101)の一例を示す図である。
図21において、2102、2104、2110はフォルダを、2103、2105、2106、2107、2108、2109、2111、2112は文書ファイルをそれぞれ示している。
同図に示すように、一般に文書管理システムでは各フォルダ、各文書ファイルはツリー構造で管理され、ユーザ指示のもと、各文書ファイルが所定のフォルダ内に格納される。
図21の例では、各文書ファイル(2103、2105、2106、2107、2108、2109、2111、2112)は全て「2004年春プロジェクト」に関するもので、フォルダ2102の下位層に格納されている。なお、図21の例では、フォルダ2102の下位層では、さらに属性(“テキスト”であるか“画像”であるか)によって2つのフォルダに分けて格納されている。そして、当該文書管理システムにおいて、それぞれのフォルダまたは文書ファイルは個別に管理されている。
一方で、互いに関連のある複数のフォルダまたは複数の文書ファイルについてはひとまとまりにして管理した方が、文書管理システムを利用するうえで利便性がよい場合がある。図22は、文書管理システムにおいて管理されている関連のある文書ファイルをひとまとめに統合し、該統合後の文書ファイルをユーザインタフェース(2101)を介して閲覧した様子を示す図である。当該ユーザインタフェース2101に示されたファイル2201はアーカイブファイルであり、図21に示す各フォルダ、各文書ファイルをZIP圧縮しアーカイブすることにより生成されている。
特開2004−258861号公報
しかしながら、上記ファイル2201は、複数のフォルダおよび文書ファイルを単純にひとまとめにしたにすぎず、該ファイル2201に含まれるフォルダや文書ファイルの内容をユーザが簡単に把握できないという問題がある。無論、該ファイル2201を展開することで、2202に示すように、各フォルダ(2204、2210)および各文書ファイル(2203、2205、2206、2207、2208、2209、2211、2212)を把握することができるが、展開後は各文書ファイル及び各フォルダは個別に管理されることとなる。
つまり、文書ファイルの内容を確認したい場合には、一旦ファイル2201を展開しなければならない。このため、関連する複数のファイルを統合し、1つのファイルとして管理でき、かつ統合されたファイルの内容が一目で視認できることが文書管理上望ましい。
本発明は上記課題に鑑みてなされたものであり、文書管理システムにおいて、複数の文書ファイルまたは複数のフォルダを統合し1つのファイルを生成するにあたり、ユーザにとって文書管理が容易なファイルを生成することを目的とする。
上記の目的を達成するために本発明に係る情報処理装置は以下のような構成を備える。すなわち、
複数の文書ファイルが格納された格納装置と通信可能に接続される情報処理装置であって、
前記複数の文書ファイルを構造化文書に変換する変換手段と、
前記複数の文書ファイルに予め付加された付加情報と該文書ファイルが格納されていたフォルダに予め付加された付加情報とに基づいて決定された配置により、前記変換手段により変換された文書ファイルを所定のファイル上に付加する文書ファイル付加手段と、
前記変換手段により変換された複数の文書ファイルに基づいて、該各文書ファイルごとの見出しを抽出する見出し抽出手段と、
前記見出し抽出手段により抽出された複数の見出しより構成される目次を、前記所定のファイルに付加する目次付加手段とを備える。
本発明によれば、文書管理システムにおいて、複数の文書ファイルまたは複数のフォルダを統合し1つのファイルを生成するにあたり、ユーザにとって文書管理が容易なファイルを生成することが可能となる。
以下、必要に応じて添付図面を参照しながら本発明の各実施形態を詳細に説明する。なお、以下の各実施形態の説明において用いられる各用語は、次のように定義するものとする。
「構造化文書」とは、XML、SGML等のマークアップ言語により作成された文書をいい、文書中にタグによる印を付けることで、論理構造を定義することを特徴としている。このため、複雑な論理構造をもつ文書の作成に際して専用のワープロソフトを使う必要がなく、単なるテキストエディタを使うだけでよい。換言すると、単なるテキストデータでありながら、複雑な文書構造を持ちつつ、OSやソフトウェアの制約を受けることなく、利用することができる(汎用度が高い)という利点を有している。
「構造化文書化」とは、所定のアプリケーションソフトで生成された文書ファイルを、構造化文書に変換することをいう。また、「統一構造化文書」とは、統一構造化文書生成用ファイルに、構造化文書化された複数の文書ファイルを章立てして配し、さらに目次(および索引)を付加することにより得られたファイルのことをいう。
また、「統一構造化文書生成用ファイル」とは、統一構造化文書の生成に際して、構造化文書化された複数の文書ファイルや目次等を付加するための空ファイルのことをいう。
さらに、「統一構造化文書生成プログラム」とは、複数の文書ファイルに基づいて、統一構造化文書を生成するためのプログラムのことをいう。
[第1の実施形態]
<文書管理システムの構成>
図1は本発明の第1の実施形態にかかる情報処理装置(101、102)を備える文書管理システムの構成を示す図である。同図において、101、102は情報処理装置(ここではパーソナルコンピュータ(PC)を用いることとする)である。また、103はデータベースであり、サーバ104にて管理される文書ファイルは当該データベースに格納される。104はサーバであり、データベース103に格納された文書ファイルの読み出しや、データベース103への文書ファイルの格納を行う。105はLANであり、PC101、102、データベース103、サーバ104を通信可能に接続する。
かかる文書管理システムのもと、ユーザはPC101(または102)のユーザインタフェースより、データベース103に格納されている文書ファイルを閲覧したり、当該文書ファイルを読み出したりすることができる。
<情報処理装置の構成>
次に本発明の第1の実施形態にかかる情報処理装置(101、102)のハードウェア構成を図2を用いて説明する。
図2において、201は制御メモリ(ROM)、202は中央演算処理装置、203はメモリ(RAM)、204はハードディスク、リムーバブルディスク等の外部記憶装置、205はキーボード、マウス等の入力装置、206はCRT等の表示装置、207はLAN105と接続し、他の機器と通信を行なうためのI/F装置、208はバスである。
本実施形態にかかる情報処理機能を実現するための制御プログラム(統一構造化文書生成プログラム209)やその制御プログラムで用いるデータは、外部記憶装置204に記憶される。これらの制御プログラムやデータは、中央演算処理装置202の制御のもと、バス208を通じて適宜メモリ203に取り込まれ、中央演算処理装置202によって実行される。
<統一構造化文書生成処理の概要>
次に上記文書管理システムのもとで実行される統一構造化文書生成処理の概要について図3〜図5を用いて説明する。図3は統一構造化文書生成プログラム209の機能ブロック図であり、図4は当該統一構造化文書生成プログラム209を構成する構造化文書生成部の詳細機能ブロック図である。また、図5は統一構造化文書生成プログラム209のもとで統一構造化文書を生成する場合の処理の概要を説明するための図である。
図3において、301はユーザインタフェース部であり構造化文書生成プログラム209起動の際には、表示装置206上に所定のウィンドウを表示する。ユーザからの各種指示は当該ウィンドウを介して入力される。302は文書ファイル閲覧部である。ユーザは当該文書ファイル閲覧部302を実行することで、データベース103内の任意のフォルダを閲覧することができる(フォルダの内容がウィンドウ上に表示される)。
図5の500はユーザが文書ファイル閲覧部302を実行させることでデータベース103内のフォルダ(「2004春プロジェクト」フォルダ501)を閲覧した様子を示したものである。図5の500において、501、503、509はフォルダを、502、505、506、507、508、510、511は文書ファイルをそれぞれ示している。
ここで、各フォルダ(503、509)ならびに各文書ファイル(502、504、505、506、507、508、510、511)には、既にユーザによりIndex情報(付加情報)が付加されているものとする(Index情報付加部303を実行させることでIndex情報を付加することができる。詳細は後述)。なお、Index情報とは、複数の文書ファイルをひとまとめに統合し統一構造化文書を生成する際に、各文書ファイルの章立てに用いられる情報である。
ここで本実施形態にかかる情報処理装置(101、102)において、フォルダ501内の文書ファイルを統合し統一構造化文書を生成すべく、ユーザが統一構造化文書生成指示を入力すると、統一構造化文書生成部305は以下のように動作する。
はじめに、統一構造化文書生成用ファイル取得部401が動作し、統一構造化文書生成用ファイル530を取得する。なお、本実施形態においては、統一構造化文書生成用ファイル530はサーバ104に格納されているものとする。
次に図4に示す未処理情報判断部402が動作し、フォルダ501内のフォルダ、文書ファイルのうち未処理のフォルダならびに文書ファイル(構造化文書化されていないフォルダ、文書ファイル)の有無を判断する。
未処理情報判断部402において未処理と判断されたフォルダならびに文書ファイルは、章立て処理部403において処理される。具体的には、未処理の文書ファイルを構造化文書化するとともに、未処理のフォルダならびに文書ファイルに付加されているIndex情報を取得する。さらに、当該取得したIndex情報に従って、上記構造化文書化された文書ファイルに章立てを付ける。図5の522は構造化文書化した文書ファイルに章立てを付けて上記統一構造化文書生成用ファイル533に配した様子を示している。
次に、目次作成部404では、構造化文書化された文書ファイル522に基づいて目次を作成し、上記統一構造化文書生成用ファイル530に付加する。図5の521は統一構造化文書生成用ファイル530に目次が付加された様子を示している。
さらに、目次用リンク作成部404では、目次作成部404において作成された目次について構造化文書化された文書ファイル522との間にリンクを作成する。
次に、索引作成部406では、構造化文書化された文書ファイルより索引を抽出し、上記統一構造化文書生成用ファイル530に付加する。図5の523は統一構造化文書生成用ファイル530に索引が付加された様子を示している。
さらに、索引用リンク作成部407では、索引作成部406において作成された索引について構造化文書化された文書ファイル522との間にリンクを作成する。
以上の処理により、統一構造化文書520が生成される。なお、上記説明では、処理対象となる全てのフォルダならびに文書ファイルにIndex情報が付加されていることを前提として説明したが、本発明は特にこれに限定されるものではない。処理対象となるフォルダならびに文書ファイルの中に、Index情報が付加されていないフォルダならびに文書ファイルが含まれていた場合、章立て処理部403では、「文書ファイル・フォルダ名の名前順」+「ツリーの階層順」で章立てを付けるものとする。
<情報処理装置における処理の流れ>
以上の説明を踏まえて、統一構造化文書生成時の情報処理装置(101、102)における処理の流れについて説明する。図6は、本発明の第1の実施形態にかかる情報処理装置(101、102)における処理の流れを示す図である。
ステップS601では、統一構造化文書生成用ファイル取得部401が動作し、サーバ104より統一構造化文書生成用ファイル530を取得する。ステップS602では、未処理情報判断402が動作し、処理対象となるフォルダまたは文書ファイルのうち、未処理の文書フォルダまたはファイルの有無を判断する。
ステップS602において未処理のフォルダまたは文書ファイルがあると判断された場合には、ステップS603に進む。一方、未処理のフォルダまたは文書ファイルがないと判断された場合には統一構造化文書生成処理を終了する。ステップS603では、章立て処理部403が動作し、当該フォルダまたは文書ファイルに付加されたIndex情報に基づいて章立て順序を取得する。
ステップS604では、取得された章立て順序に基づいて文書ファイル内部の章立てのカスタマイズを実行する。さらに、当該文書ファイルを構造化文書化する。
ステップS605では、目次作成部404が動作し、構造化文書化された文書ファイルより見出しを抽出し、目次を作成する。
ステップS606では、ステップS604にて構造化文書化された文書ファイルと、ステップS605にて作成された目次とを構造化文書生成用ファイル530に付加する。さらに、目次リンク作成部405が動作し、ステップS605にて付加された目次から構造化文書化された文書ファイルへのリンクを作成する。
ステップS607では、索引作成部406が動作し、構造化文書化された文書ファイルから索引を抽出し、索引を作成する。
ステップS608では、ステップS607にて作成された索引を構造か文書生成用ファイル530に付加する。さらに、索引用リンク作成部406が動作し、ステップS607にて付加された索引から構造化文書化された文書ファイルへのリンクを作成する。
ステップS608における処理が終了した後はステップS602に戻り、未処理のフォルダまたは文書ファイルがなくなるまで上記処理を繰り返す。
なお、上記説明においては、ステップS607において構造化文書化された文書ファイルから索引を抽出・作成し、ステップS608において当該抽出された索引を用いて構造化文書化された文書ファイルへのリンクを作成することとしたが、当該処理(索引の抽出・作成、リンク作成処理)は行わなくともよい。
つまり、「索引作成部406が動作することにより、構造化文書化された文書ファイルから索引を抽出し、作成された索引を構造化文書に生成用ファイル530に付加する」処理を行わず、目次だけ作成し付加させるよう構成しても良い。
また、上記説明においては、構造化文書化された文書ファイルから見出し抽出・目次作成をし、これらを統一構造化文書生成用ファイルに付加した後に、索引を抽出・作成し、統一構造化文書生成用ファイルに付加することとしたが、処理の順序は特にこれに限定されるものではない。例えば、構造化文書化された文書ファイルから見出し抽出・目次作成した後に、索引を抽出・作成した上で、これらを統一構造化文書生成用ファイルに付加するようにしてもよい(具体的な処理の流れを図7に示す)。
また、上記説明においては、ステップS602において読み込まれた全てのフォルダまたは文書ファイルについて、Index情報が付加されているものとしたが、Index情報が付加されていないこともあり得る。
このようにIndex情報が付加されていないフォルダまたは文書ファイルが読み込まれた場合の情報処理装置101における処理は、図8または図9のようになる。つまり、ステップS601にて統一構造化文書生成用ファイルを取得する前または取得した後に、図8または図9に示すようにリスト作成処理を行う。なお、リスト作成処理では、「文書・フォルダ名の名前順」+「ツリー階層順」で章立てを行う。
また、上記説明においては、データサーバ103に格納された電子データである文書ファイルを直接構造化文書化して統一構造化文書生成用ファイルに付加することとしたが、特にこれに限定されるものではない。例えば、印刷された文書ファイル(原稿)をOCRにかけた後に構造化文書化し、統一構造化文書生成用ファイルに付加するようにしてもよい。
あるいは、文書ファイルを構造化文書化したものを印刷し、当該印刷された文書ファイル(構造化文書化されれたもの)をOCRにかけた後に、統一構造化文書生成用ファイルに付加するようにしてもよい。なお、いずれの場合も、構造化文書化された後に目次の作成ならびに索引の作成を実行する。
<情報処理装置におけるユーザインタフェース>
本実施形態にかかる情報処理装置101、102におけるユーザインタフェースについて説明する。図10は情報処理装置101、102の表示装置206に表示されるユーザインタフェース(1001)の一例を示す図である。
図10(A)において、502、504、510はフォルダを、503、505、506、507、508、509、510、512は文書ファイルをそれぞれ示している。
付加情報としてIndex情報を付ける場合には、Index情報を付加したい文書ファイルまたはフォルダを左クリックすることにより選択した後、右クリックする。これによりダイアログ1002が表示されるため、「indexをつける」を選択することで、所望の文書ファイルまたはフォルダにIndex情報を付加することができる(図10(8A)では、文書ファイル505を選択した場合について示している)。なお、ダイアログ1002に代えてアイコンを表示するようにしてもよいし、リストを表示するようにしてもよい。
ダイアログ1002にて「indexをつける」を選択した後、所定の付加情報を入力する。図10(B)は、Index情報として、「第2節」と入力した場合について示している。なお、Index情報の入力は、キーボードを介して直接入力できるようにしてもよいし、所定のリストから選択するようにしてもよい。あるいは選択肢が表示され、その中から選択するようにしてもよい。
次に、複数の文書ファイルおよびフォルダに対する付加情報の付加が終了したら、ルートフォルダ501を選択し、右クリックでダイアログ1101を表示させる。図11(A)はルートフォルダ501を選択し、右クリックでダイアログ1101を表示させた状態を示す図である。ここで、「ファイルを統合してexport(目次付)」を選択することにより、ルートフォルダ501以下のフォルダならびに文書ファイルを対象として、統一構造化文書が生成されることとなる。なお、ダイアログ1101において、「文書ファイルを統合してexport(目次付)」を選択した場合には、(索引が付加されない)統一構造化文書が生成される。また、ダイアログ1101において、「文書ファイルを統合してexport(目次索引付)」を選択した場合には、目次と索引の両方が付加された統一構造化文書が生成されることとなる。
なお、ダイアログ1101に代わってリストを表示するようにしてもよいし、選択肢を表示し選択するようにしてもよい。また、exportの形式は目次のみ付加するようにしてもよいし、目次・索引を付加するようにしてもよい。生成された統一構造化文書は、情報処理装置101の画面の指定された場所に格納される。図11(B)は生成された統一構造化文書がデスクトップ1102上に表示された様子を示している。ただし、出力先は文書管理システム内でもよいし、文書管理システム外であってもよい。
以上の説明から明らかなように、本実施形態では、文書管理システムにおいて管理された複数の文書ファイルまたは複数のフォルダを統合し1つのファイルを生成するにあたり、文書ファイルを構造化文書化したうえで統合し、さらに、構造化文書化された文書ファイルに基づいて作成された目次(および索引)を付加する構成とした。
この結果、当該生成されたファイル(統一構造化文書)を閲覧する際に、当該ファイルの内容を容易に把握することが可能となり、文書管理が容易になるという効果がある。つまり、従来のように、複数のファイルを開き、ほしい情報についていちいち検索をかけなくても、すぐに目的の文書ファイルへたどり着くことができるようになる。
[第2の実施形態]
上記第1の実施形態では、ユーザが指定したフォルダに含まれる複数の文書ファイルのみを統合し統一構造化文書を生成することとしたが、本発明は特にこれに限られず、並行して当該指定されたフォルダよりも古いバージョンのフォルダに含まれる複数の文書ファイルについて統一構造化文書を生成するようにしてもよい。さらに、ユーザが指定したフォルダに含まれる複数の文書ファイルに基づいて生成された統一構造化文書と、当該指定されたフォルダよりも古いバージョンのフォルダに含まれる複数の文書ファイルに基づいて生成された統一構造化文書との差分を明示するよう構成するようにしてもよい。以下に詳細を説明する。
<情報処理装置の構成>
図12は、本実施形態にかかる情報処理装置のハードウェア構成を示す図である。上記第1の実施形態と同様であるため、説明は省略する(図2と同様の機器については同一の参照番号を付している)。なお、外部記憶装置204には、バージョンの異なる文書ファイルについても統一構造化文書を生成することが可能な統一構造化文書生成プログラム1201が格納されている。
<統一構造化文書生成の概要>
図13は本実施形態にかかる統一構造化文書生成プログラム1201の機能ブロック図であり、図14は当該統一構造化文書生成プログラム1201を構成する構造化文書生成部の詳細機能ブロック図である。また、図15は統一構造化文書生成プログラム1201のもとで統一構造化文書を生成する場合の処理の概要を説明するための図である。
図14に示す機能ブロック図と図4との相違は、旧バージョン取得部1301と差分抽出部1302とが付加されている点である。旧バージョン取得部1301は、ユーザが選択したフォルダに含まれるフォルダならびに文書ファイルに基づいて統一構造化文書を生成するに際して、当該選択したフォルダよりも古いバージョンのフォルダに含まれる複数のフォルダならびに文書ファイルをデータベース103より取得する。
差分抽出部1202は、ユーザが選択したフォルダに含まれるフォルダならびに文書ファイルに基づいて生成された統一構造化文書と、当該選択したフォルダよりも古いバージョンのフォルダに含まれる複数のフォルダならびに文書ファイルに基づいて生成された統一構造化文書との差分を抽出する。
図15の1500はユーザが文書ファイル閲覧部302を実行させることでデータベース103内のフォルダ(「2004春プロジェクト」フォルダ501)を閲覧した様子を示したものである。図15の1500において、501、503、509はフォルダを、502、505、506、507、508、510、511は文書ファイルをそれぞれ示している。
ここで、各フォルダ(503、509)ならびに各文書ファイル(502、504、505、506、507、508、510、511)には、既にユーザによりIndex情報(不図示)が付加されているものとする。
また、各文書ファイル(502、504、505、506、507、508、510、511)ならびにフォルダ501ごとに記載された「(V○○)」とは、文書管理システムにおける付加された文書ファイル(またはフォルダ)のバージョン情報である。
例えば、「2004春プロジェクト」フォルダ501はバージョン3であり、「概要」文書ファイル502はバージョン2であることを示す。
一方、図15の1501は「2004年春プロジェクト」フォルダ501について統一構造化文書を生成するにあたり、旧バージョン取得部1301に取得された旧バージョンのフォルダを図示したものである。
図15の1501において、512、514、520はフォルダを、513、515、516、517、518、519、521、522は文書ファイルをそれぞれ示している。
また、各文書ファイル(513、515、516、517、518、519、521、522)ならびにフォルダ(514、520)には、既にユーザによりIndex情報(不図示)が付加されているものとする。
また、各文書ファイル(513、515、516、517、518、519、521、522)ならびにフォルダ512に表示された「(V○○)」とは、文書管理システムにおける文書ファイル(またはフォルダ)のバージョン情報である。
1500と1501とを対比すると、フォルダ501はV3であるのに対して、フォルダ512はV2であり、フォルダ512はフォルダ501よりも旧バージョンのフォルダであることがわかる。
さらに旧バージョンのフォルダ512に含まれる各文書ファイルについて対比すると、「概要」文書ファイル502と513、「メンバー表」文書ファイル504と515、「プロジェクト詳細」文書ファイル505と516とは、それぞれ同一バージョンの文書ファイルであることがわかる。
一方、「打ち合わせメモ」文書ファイル507と518、「プレゼン資料」文書ファイル508と519、「配置図」文書ファイル510と521、「ロゴマーク」文書ファイル511と522とは、それぞれ異なるバージョンの文書ファイルである。
ここで本実施形態にかかる情報処理装置(101、102)において、「2004春プロジェクト」の最新版のフォルダ501内の文書ファイルを統合し、統一構造化文書を生成すべく、ユーザが統一構造化文書生成指示を入力すると、統一構造化文書生成部305は上記第1の実施形態と同様に動作する。
このとき、あわせて「2004春プロジェクト」の旧バージョンのフォルダ512内の文書ファイルについても統一構造化文書が生成される(図15の1502、1503)。さらに、最新版のフォルダ501についての統一構造化文書と、旧バージョンのフォルダ512についての統一構造化文書とはそれぞれ表示装置206に表示される。
図15の1504は、上下にならべて表示された最新版の統一構造化文書(1502)と旧バージョンの統一構造化文書(1503)とを示す図である。なお、差分抽出部1302では、最新版のフォルダ501に含まれる複数のフォルダならびに文書ファイルに基づいて生成された統一構造化文書と、旧バージョンのフォルダ512に含まれる複数のフォルダならびに文書ファイルに基づいて生成された統一構造化文書との差分を抽出しており、当該抽出された差分は統一構造化文書の右端に赤字枠で表示される(1505)。ただし、差分の表示方法については、特にこれに限られず、上端、下端または左端に表示させてもよいし、またアイコンで隠すようにしてもよい。
<情報処理装置における処理の流れ>
次に本実施形態にかかる情報処理装置(101、102)の統一構造化文書生成時の処理の流れについて説明する。図16は、本発明の第2の実施形態にかかる情報処理装置(101、102)における処理の流れを示す図である。
ステップS1601では、旧バージョン取得部1301が動作し、ユーザが統一構造化文書の生成を指示したフォルダよりも古いバージョンのフォルダに含まれる複数のフォルダならびに文書ファイルをデータベース103より取得する。
ステップS601では、統一構造化文書生成用ファイル取得部401が動作し、サーバ104より統一構造化文書生成用ファイル530を取得する。ステップS602では、未処理情報判断402が動作し、処理対象となるフォルダまたは文書ファイルのうち、未処理の文書フォルダまたはファイルの有無を判断する。
ステップS602において未処理のフォルダまたは文書ファイルがあると判断された場合には、ステップS603に進む。一方、未処理のフォルダまたは文書ファイルがないと判断された場合には統一構造化文書生成処理を終了する。ステップS603では、章立て処理部403が動作し、当該フォルダまたは文書ファイルに付加されたIndex情報に基づいて章立て順序を取得する。
ステップS604では、取得された章立て順序に基づいて文書ファイル内部の章立てのカスタマイズを実行する。さらに、当該文書ファイルを構造化文書化する。
ステップS605では、目次作成部404が動作し、構造化文書化された文書ファイルより見出しを抽出し、目次を作成する。
ステップS606では、ステップS604にて構造化文書化された文書ファイルと、ステップS605にて作成された目次とを構造化文書生成用ファイル530に付加する。さらに、目次リンク作成部405が動作し、ステップS605にて付加された目次から構造化文書化された文書ファイルへのリンクを作成する。
ステップS607では、索引作成部406が動作し、構造化文書化された文書ファイルから索引を抽出し、索引を作成する。
ステップS608では、ステップS607にて作成された索引を構造か文書生成用ファイル530に付加する。さらに、索引用リンク作成部406が動作し、ステップS607にて付加された索引から構造化文書化された文書ファイルへのリンクを作成する。
ステップS608における処理が終了した後はステップS602に戻り、未処理のフォルダまたは文書ファイルがなくなるまで上記処理を繰り返す。
上記ステップS602からS608までの処理は、最新版のフォルダ501と旧バージョンのフォルダ512に対して実行される。そして、ステップS1602では、最新版のフォルダ501に含まれる文書ファイルを用いて生成された統一構造化文書と、旧バージョンのフォルダ512に含まれる文書ファイルを用いて生成された統一構造化文書との差分を抽出し、統一構造化文書生成用ファイル530に付加する。
以上の説明から明らかなように、本実施形態では、ユーザが選択した最新版のフォルダについての統一構造化文書のみならず、対応する旧バージョンのフォルダについての統一構造化文書についても生成するよう構成することで、ユーザは両者の差分をみることが可能となり、ユーザにとっては文書管理が一層容易になる。
なお、上記説明においては、構造化文書化された文書ファイルから見出し抽出・目次作成し、これらを統一構造化文書生成用ファイルに付加した後に、索引を抽出・作成し、統一構造化文書生成用ファイルに付加することとしたが、処理の順序は特にこれに限定されるものではない。例えば、構造化文書化された文書ファイルから見出し抽出・目次作成した後に、索引を抽出・作成した上で、これらを統一構造化文書生成用ファイルに付加するようにしてもよい(具体的な処理の流れを図17に示す)。
また、上記説明においては、構造化文書化された文書ファイルならびに目次、索引を統一構造化文書生成ファイルに付加した後に、新旧文書ファイルの差分を抽出し、統一構造化文書生成ファイルに付加することとしたが、処理の順序は特にこれに限定されるものではない。例えば、新旧の文書ファイルを構造化文書化した後に差分を抽出し統一構造化文書生成ファイルに付加したうえで、目次、索引の作成、付加を行うようにしてもよい(具体的な処理の流れを図18に示す)。
[第3の実施形態]
上記第1の実施形態では、図5の500に示す構成を備えるフォルダ501について統一構造化文書を生成することとしたが、本発明の処理対象は特にこれに限定されるものではなく、図5の500とは異なる構成を備えるフォルダに対しても同様に統一構造化文書を生成することが可能である。以下に詳細を説明する。
<情報処理装置におけるユーザインタフェース>
図19は本実施形態にかかる情報処理装置(101、102)の表示装置206に表示されるユーザインタフェース(1001)の一例を示す図である。
図10のウィンドウ1001に表示されたフォルダ及び文書ファイルの場合、フォルダ501(ルートフォルダ)の下位側に文書ファイル502とフォルダ503、509が配されていた。これに対して、図19のウィンドウ1001に表示されたフォルダ及び文書ファイルの場合、フォルダ1901(ルートフォルダ)の下位側に直接文書ファイルが配されておらず、フォルダ1902、1903、1909が配されている。
さらに、図10のウィンドウ1001では、フォルダ503、509の下位側には、複数種類の文書ファイルが混在して配されていたのに対して、図19のフォルダ1903の下位側には、複数のフォルダ1904〜1908が配され、各フォルダ1904〜1908内には、同一種類の文書ファイルのみが格納されている。同様に、フォルダ19090の下位側には、複数のフォルダ1910、1911が配され、各フォルダ1910、1911内には、同一種類の文書ファイルのみが格納されている。
かかる構成のもとでは、各フォルダはテンプレートフォルダとして機能し、テンプレートフォルダに付加されたIndex情報に基づいて章立てが実施されることとなる。つまり、ユーザはテンプレートフォルダにIndex情報を付加しさえすれば、該テンプレートフォルダの下位側に格納された文書ファイルそれぞれにIndex情報を付加しなくとも、上記第1の実施形態と同様の統一構造化文書を生成することが可能となる。
図19はテンプレートフォルダとして機能させようとするフォルダにIndex情報を付加する様子を示している。同図に示すように、Index情報を付加するにあたっては、まず、所望のフォルダを左クリックすることで該フォルダを選択したのち、右クリックする。これによりダイアログ1920が表示されるため、当該ダイアログ1920より、「indexをつける」を選択することでIndex情報を付加することができる。
また、統一構造化文書を生成するにあたっては、ルートフォルダ(1801)を左クリックすることで該ルートフォルダを選択したのち、右クリックすることで、ダイアログ2001を表示させる(図20)。このとき、「ファイルを結合してexport(目次付)」を選択すると、ルートフォルダ1901に含まれる文書ファイルについての統一構造化文書の生成が開始される。2003は生成された統一構造化文書がデスクトップ2002上に表示された様子を示している。
以上の説明から明らかなように、本実施形態によれば、フォルダに付加されたIndex情報のみに基づいて章立てを実施し、統一構造化文書を生成する構成としたことにより、各フォルダに格納された文書ファイルに対してIndex情報を付加する必要がなくなり、統一構造化文書を生成するうえでのユーザの操作性が向上する。
[他の実施形態]
なお、本発明は、複数の機器(例えばホストコンピュータ、インタフェイス機器、リーダ、プリンタなど)から構成されるシステムに適用しても、一つの機器からなる装置(例えば、複写機、ファクシミリ装置など)に適用してもよい。
また、本発明の目的は、前述した実施形態の機能を実現するソフトウェアのプログラムコードを記録した記憶媒体を、システムあるいは装置に供給し、そのシステムあるいは装置のコンピュータ(またはCPUやMPU)が記憶媒体に格納されたプログラムコードを読出し実行することによっても、達成されることは言うまでもない。
この場合、記憶媒体から読出されたプログラムコード自体が前述した実施形態の機能を実現することになり、そのプログラムコードを記憶した記憶媒体は本発明を構成することになる。
プログラムコードを供給するための記憶媒体としては、例えば、フロッピ(登録商標)ディスク、ハードディスク、光ディスク、光磁気ディスク、CD−ROM、CD−R、磁気テープ、不揮発性のメモリカード、ROMなどを用いることができる。
また、コンピュータが読出したプログラムコードを実行することにより、前述した実施形態の機能が実現されるだけでなく、そのプログラムコードの指示に基づき、コンピュータ上で稼働しているOS(オペレーティングシステム)などが実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
さらに、記憶媒体から読出されたプログラムコードが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書込まれた後、そのプログラムコードの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPUなどが実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれることは言うまでもない。
本発明の第1の実施形態にかかる情報処理装置(101、102)を備える文書管理システムの構成を示す図である。 本発明の第1の実施形態にかかる情報処理装置(101、102)のハードウェア構成を示す図である。 統一構造化文書生成プログラム209の機能ブロック図である。 統一構造化文書生成プログラム209に含まれる構造化文書生成部の詳細機能ブロック図である。 統一構造化文書生成プログラム209のもとで統一構造化文書を生成する場合の処理の概要を説明するための図である。 本発明の第1の実施形態にかかる情報処理装置(101、102)における処理の流れを示す図である。 本発明の第1の実施形態にかかる情報処理装置(101、102)における処理の流れを示す図である。 本発明の第1の実施形態にかかる情報処理装置(101、102)における処理の流れを示す図である。 本発明の第1の実施形態にかかる情報処理装置(101、102)における処理の流れを示す図である。 本発明の第1の実施形態にかかる情報処理装置(101、102)の表示装置206に表示されるユーザインタフェース(1001)の一例を示す図である。 本発明の第1の実施形態にかかる情報処理装置(101、102)の表示装置206に表示されるユーザインタフェース(1001)の一例を示す図である。 本発明の第2の実施形態にかかる情報処理装置のハードウェア構成を示す図である。 統一構造化文書生成プログラム1201の機能ブロック図である。 統一構造化文書生成プログラム1201を構成する構造化文書生成部の詳細機能ブロック図である。 統一構造化文書生成プログラム1201のもとで統一構造化文書を生成する場合の処理の概要を説明するための図である。 本発明の第2の実施形態にかかる情報処理装置(101、102)における処理の流れを示す図である。 本発明の第2の実施形態にかかる情報処理装置(101、102)における処理の流れを示す図である。 本発明の第2の実施形態にかかる情報処理装置(101、102)における処理の流れを示す図である。 本発明の第3の実施形態にかかる情報処理装置(101、102)の表示装置206に表示されるユーザインタフェース(1001)の一例を示す図である。 本発明の第3の実施形態にかかる情報処理装置(101、102)の表示装置206に表示されるユーザインタフェース(1001)の一例を示す図である。 従来の文書管理システムにおいて管理された文書ファイルを閲覧するためのユーザインタフェース(2101)の一例を示す図である。 文書管理システムにおいて管理されている関連のある文書ファイルをひとまとめに統合し、該統合後の文書ファイルをユーザインタフェース(2101)を介して閲覧した様子を示す図である。

Claims (9)

  1. 複数の文書ファイルが格納された格納装置と通信可能に接続される情報処理装置であって、
    前記複数の文書ファイルを構造化文書に変換する変換手段と、
    前記複数の文書ファイルに予め付加された付加情報と該文書ファイルが格納されていたフォルダに予め付加された付加情報とに基づいて決定された配置により、前記変換手段により変換された文書ファイルを所定のファイル上に付加する文書ファイル付加手段と、
    前記変換手段により変換された複数の文書ファイルに基づいて、該各文書ファイルごとの見出しを抽出する見出し抽出手段と、
    前記見出し抽出手段により抽出された複数の見出しより構成される目次を、前記所定のファイルに付加する目次付加手段と
    を備えることを特徴とする情報処理装置。
  2. 前記文書ファイル付加手段は、前記付加情報を見出しとして、前記変換手段により変換された文書ファイルを前記所定のファイル上に付加することと特徴とする請求項1に記載の情報処理装置。
  3. 前記変換手段により変換された複数の文書ファイルに基づいて生成された索引を、前記所定のファイル上に付加する索引付加手段を更に備えることを特徴とする請求項1に記載の情報処理装置。
  4. 前記格納装置に格納された前記複数の文書ファイルの格納状態を閲覧する閲覧手段と、
    前記閲覧手段により閲覧された文書ファイルならびに該文書ファイルが格納されているフォルダに対して、前記付加情報を入力する付加情報入力手段と
    を備えることを特徴とする請求項1に記載の情報処理装置。
  5. 前記変換手段により変換された複数の文書ファイルと、前記目次付加手段により付加された目次との間にリンクを生成する第1のリンク生成手段を更に備えることを特徴とする請求項1に記載の情報処理装置。
  6. 前記変換手段により変換された複数の文書ファイルと、前記索引付加手段により付加された索引との間にリンクを生成する第2のリンク生成手段を更に備えることを特徴とする請求項3に記載の情報処理装置。
  7. 複数の文書ファイルが格納された格納装置と通信可能に接続される情報処理装置における情報処理方法であって、
    前記複数の文書ファイルを構造化文書に変換する変換工程と、
    前記複数の文書ファイルに予め付加された付加情報と該文書ファイルが格納されていたフォルダに予め付加された付加情報とに基づいて決定された配置により、前記変換工程により変換された文書ファイルを所定のファイル上に付加する文書ファイル付加工程と、
    前記変換工程により変換された複数の文書ファイルに基づいて、該各文書ファイルごとの見出しを抽出する見出し抽出工程と、
    前記見出し抽出工程により抽出された複数の見出しより構成される目次を、前記所定のファイルに付加する目次付加工程と
    を備えることを特徴とする情報処理方法。
  8. 請求項7に記載の情報処理方法をコンピュータによって実現させるための制御プログラムを格納した記憶媒体。
  9. 請求項7に記載の情報処理方法をコンピュータによって実現させるための制御プログラム。
JP2005170040A 2005-06-09 2005-06-09 情報処理装置、情報処理方法ならびにプログラム、記憶媒体 Withdrawn JP2006344067A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2005170040A JP2006344067A (ja) 2005-06-09 2005-06-09 情報処理装置、情報処理方法ならびにプログラム、記憶媒体

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005170040A JP2006344067A (ja) 2005-06-09 2005-06-09 情報処理装置、情報処理方法ならびにプログラム、記憶媒体

Publications (1)

Publication Number Publication Date
JP2006344067A true JP2006344067A (ja) 2006-12-21

Family

ID=37640982

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005170040A Withdrawn JP2006344067A (ja) 2005-06-09 2005-06-09 情報処理装置、情報処理方法ならびにプログラム、記憶媒体

Country Status (1)

Country Link
JP (1) JP2006344067A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015508212A (ja) * 2012-02-20 2015-03-16 マイクロソフト コーポレーション 効率的なアトミックアクセスのために最適化されたxmlファイル形式

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2015508212A (ja) * 2012-02-20 2015-03-16 マイクロソフト コーポレーション 効率的なアトミックアクセスのために最適化されたxmlファイル形式

Similar Documents

Publication Publication Date Title
JP5193042B2 (ja) データベースアプリケーションで選択可能な機能制御を表示するためのコマンドユーザインターフェース
US8762834B2 (en) User interface for defining a text file transformation
US20070250762A1 (en) Context-aware content conversion and interpretation-specific views
WO2011052431A1 (ja) 電子文書を編集するためのシステム、方法、およびプログラム
US10976899B2 (en) Method for automatically applying page labels using extracted label contents from selected pages
JP2004139466A (ja) 電子ドキュメント印刷プログラムおよび電子ドキュメント印刷システム
AU2015211152B2 (en) Batch generation of links to documents based on document name and page content matching
JP2006244467A (ja) 文書処理装置及び方法と文書処理システム
JPWO2007081017A1 (ja) 文書処理装置
JP4666996B2 (ja) 電子ファイリングシステム、電子ファイリング方法
JP2015197826A (ja) 情報処理装置、情報処理方法及びプログラム
JP2006344067A (ja) 情報処理装置、情報処理方法ならびにプログラム、記憶媒体
JP4717592B2 (ja) 文書管理システム、その文書管理クライアントの制御方法及びプログラム
JP2018181073A (ja) 情報処理装置と、その処理方法及びプログラム
JP2004326626A (ja) 構造化文書ファイル管理装置および構造化文書ファイル管理方法
WO2017090054A1 (en) Editfile
JP2004145736A (ja) 文字認識装置および文字認識データ出力方法およびプログラムおよび記録媒体
JP2003316773A (ja) 文書管理システム、方法、プログラム及び記憶媒体
JP2008033647A (ja) ドキュメントセット作成装置及びドキュメントセット作成方法
JP4293970B2 (ja) 特徴データ生成システムおよびその方法
Godfrey Putting it all together—A blind person’s perspective on developing a toolbox for document preparation
JP2005182519A (ja) 文書管理装置、出力方法、及びプログラム
JP2006018449A (ja) 構造化データ変換装置及び方法
WO2002001402A1 (fr) Dispositif de classement integre et procede de classement integre
JP2018181078A (ja) 情報処理装置と、その処理方法及びプログラム

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20080902