WO2012169380A1

WO2012169380A1 - 文書共有システム

Info

Publication number: WO2012169380A1
Application number: PCT/JP2012/063597
Authority: WO
Inventors: 達也進藤
Original assignee: Shindo Tatsuya
Priority date: 2011-06-09
Filing date: 2012-05-28
Publication date: 2012-12-13
Also published as: JP5993849B2; JPWO2012169380A1

Abstract

【課題】元文書を分割して頁の文書を登録する際に、目次情報に含まれる見出しを自動的にタグに用いることにより、広範囲に漏れなく標準的なタグを付与し、ドリルダウン検索の効率を高めることを課題とする。【解決手段】ＰＤＦなどの電子ドキュメントに含まれる目次情報を活用して、頁に分割された頁文書のドリルダウン検索に用いるメニューのメニュー項目として章や節などの区分に係る見出しのタグを用いる。章節番号は、見出しコードのタグをメニュー項目に用い、章節標題は、見出しタイトルのタグをメニュー項目に用いている。検索結果リストでは、頁文書のタイトルとともに、元文書中の表記頁も表示する。

Description

文書共有システム

　本発明は、複数の利用者が共有する元文書を頁文書に分割し、目次情報に基づいて頁文書のドリルダウン検索に用いるタグ付けを行う技術に関する。

　特許文献１には、タグクラウド（ｔａｇｃｌｏｕｄ）を用いたコンテンツ推薦装置及び方法が開示されている。

　この例で、ネットワークを通じてコンテンツ推薦サービスを提供するコンテンツ推薦サーバは、各コンテンツに付与されたタグを分析することにより、タグクラウドを構築している。ここで用いられるタグは、使用者がコンテンツに対して直接付与することを前提としている。

　このように、コンテンツの検索などに使われるタグは、利用者が意識的に設定することが一般的である。

　しかし、利用者がタグを自身で判断して設定することに対して煩雑であると感じている場合も多く、多くの利用者が共有する文書に対して遍くタグ付けを行うことは、必ずしも容易ではない。

　また、利用者毎にタグの適性に対する判断が異なるため、標準的なタグに統一することは困難であり、構造的な検索において安定的な運用が図られにくい。

特開２００９－１２９４５８号公報

　元文書を分割して頁の文書を登録する際に、目次情報に含まれる見出しを自動的にタグに用いることにより、広範囲に漏れなく標準的なタグを付与し、ドリルダウン検索の効率を高めることを課題とする。

　本願発明に係る文書共有システムは、
　元文書を分割した頁文書を登録する利用者の利用者端末と接続可能な文書共有システムであって、以下の要素を有することを特徴とする
（１）前記頁文書を登録する利用者端末から、元文書の区分の見出しと、当該区分の頁範囲を含む目次情報を有する元文書ファイルを受信する元文書受信部
（２）受信した元文書ファイルから、目次情報を取得する目次取得部
（３）元文書に含まれる頁毎に、目次情報に基づいて当該頁が属する区分の見出しを判定し、当該見出しをタグとして含める頁文書情報を生成する頁文書生成部
（４）頁文書情報を記憶する文書情報データベース
（５）頁文書情報毎に、頁文書情報に含まれるタグを文書のドリルダウン検索に用いるメニュー項目として含むインデクスを生成するインデクス用テーブル生成部。

　また、
　文書共有システムは、頁文書を閲覧する利用者の利用者端末と接続可能であって、更に（６）頁文書毎のインデクスを記憶するインデクスデータベースと、
（７）インデクスのメニュー項目群を表示し、メニュー項目の選択を促し、選択されたメニュー項目を検索条件として返信するように構成されたドリルダウン検索領域を含む検索画面を生成する検索画面生成部と、
（８）生成した検索画面を、前記頁文書を閲覧する利用者の利用者端末に送信する検索画面配信部を有することを特徴とする。

　また、
　前記検索画面生成部は、返信された検索条件のメニュー項目をインデクスに含む文書をインデクスデータベースから検索し、検索した文書一覧である検索結果リストを検索画面に含めることを特徴とする。

　また、
　文書共有システムは、更に、
（９）受信した元文書ファイルを格納するロケーションを決定し、決定した元文書ロケーションに受信した元文書ファイルを格納する元文書格納部を有し、
　前記頁文書生成部は、元文書ロケーションを各頁文書情報に含め、
　前記インデクス用テーブル生成部は、頁文書情報毎に、当該頁を表示する頁指定を付加した元文書ロケーションをインデクスに含め、
　前記検索画面生成部は、検索結果リスト中の文書が選択された場合に、頁指定を付加した元文書ロケーションをリンク先としてアクセスするように検索画面を構成することを特徴とする。

　また、
　前記インデクス用テーブル生成部は、目次情報の区分の頁範囲に含まれる当該頁の記述頁番号を、文書構成上の頁番号に変換し、変換した構成頁番号を頁指定として付加することを特徴とする。

　また、
　前記インデクス用テーブル生成部は、記述頁番号に構成頁と記述頁の差分頁数を加えて、構成頁番号を算出することを特徴とする。

　また、
　文書共有システムは、更に、
（１０）表記上の１頁目に相当する構成上の頁番号である表記頁開始位置を受信する記入データ受付部を有し、
　前記インデクス用テーブル生成部は、表記頁開始位置から１を引いて差分頁数を求めることを特徴とする。

　また、
　文書共有システムは、更に、
（１１）差分頁数を受信する記入データ受付部を有し、
　前記インデクス用テーブル生成部は、受信した差分頁数を用いることを特徴とする。

　また、
　前記頁文書生成部は、元文書に含まれる頁毎に、元文書ファイルから当該頁を文書ファイルとして分割した頁文書ファイルを生成し、
　前記検索画面生成部は、頁文書ファイルから本文テキストを取得し、取得した本文テキストを文書一覧に設定することを特徴とする。

　また、
　前記頁文書生成部は、見出しタイトルをタグとすることを特徴とする。

　また、
　前記頁文書生成部は、見出し番号をタグとすることを特徴とする。

　本願発明に係るプログラムは、
　元文書を分割した頁文書を登録する利用者の利用者端末と接続可能な文書共有システムとなるコンピュータに、以下の手順を実行させることを特徴とする
（１）前記頁文書を登録する利用者端末から、元文書の区分の見出しと、当該区分の頁範囲を含む目次情報を有する元文書ファイルを受信する元文書受信手順
（２）受信した元文書ファイルから、目次情報を取得する目次取得手順
（３）元文書に含まれる頁毎に、目次情報に基づいて当該頁が属する区分の見出しを判定し、当該見出しをタグとして含める頁文書情報を生成する頁文書生成手順
（４）頁文書情報を記憶する文書情報記憶手順
（５）頁文書情報毎に、頁文書情報に含まれるタグを文書のドリルダウン検索に用いるメニュー項目として含むインデクスを生成するインデクス用テーブル生成手順。

　本願発明では、ＰＤＦなどの電子ドキュメントに含まれる目次情報を活用して、頁に分割された頁文書のドリルダウン検索に用いるメニューのメニュー項目として章や節などの区分に係る見出しのタグを用いるので、新規文書に対するタグ付けを自動化し、構造的な検索に活用することができる。これにより、タグ付けの労力が軽減されるとともに、文書作成者や文書閲覧者の主観に依存しない、客観的かつ統一的なタグ付けが実現される。

　特に、見出しタグで検索された頁文書をまとめて閲覧できるので、所望のテーマに関して、複数の文書を横断的に閲覧できるという利点を有する。

本願発明に係るネットワーク構成（その１）を示す図である。本願発明に係るネットワーク構成（その２）を示す図である。文書登録に係るデータフローを示す図である。文書登録開始に係る文書管理サーバの構成を示す図である。文書種別選択画面配信処理フローを示す図である。頁文書入力フォーム画面配信処理フローを示す図である。マニュアル頁の頁文書入力フォーム画面を示す図である。文書種別管理テーブルを示す図である。タグテーブルを示す図である。頁文書登録処理に係る文書管理サーバの構成を示す図である。頁文書登録処理フローを示す図である。元文書格納処理フローを示す図である。目次取得処理フローを示す図である。元文書の目次情報の例（ＸＰサービスマニュアル）を示す図である。頁文書生成処理フローを示す図である。マニュアル頁の文書データ構造を示す図である。マニュアル頁の文書情報の例（１ページ目）を示す図である。マニュアル頁の文書情報の例（３ページ目）を示す図である。共通項目設定処理フローを示す図である。頁別項目設定処理フローを示す図である。インデクス登録に係る文書管理サーバの構成を示す図である。インデクス用テーブルを示す図である。インデクス登録処理フローを示す図である。レコード生成処理フローを示す図である。メニュータグ対応表を示す図である。検索画面配信に係る検索サーバの構成を示す図である。検索画面配信処理フローを示す図である。検索画面を示す図である。元文書の目次情報の例（ＸＰ正常テスト集）を示す図である。検索画面生成処理フローを示す図である。ドリルダウン検索領域生成処理フローを示す図である。検索結果リスト生成処理フローを示す図である。

　図１は、本願発明に係るネットワーク構成（その１）を示す図である。企業（文書を共有する組織の例）外に、文書共有システムを設ける例（Ｓａａｓ形態）を示している。本願発明に係る文書共有システムは、文書管理サーバ１０１と検索サーバ１０２と共有ファイルサーバ１０３から構成されている。文書管理サーバ１０１は、文書の作成、閲覧、検索サーバ１０２へのインデクステーブルの登録などを行なう。検索サーバ１０２は、インデクステーブルを用いて、高速の検索を行い、所望の文書情報へ利用者を導く役割を担っている。共有ファイルサーバ１０３は、共有文書ファイルを記憶するサーバである。文書管理サーバ１０１と検索サーバ１０２と共有ファイルサーバ１０３は、文書共有システム内のシステムネットワーク（例えば、ＬＡＮ）により接続されている。また、文書管理サーバ１０１と検索サーバ１０２と共有ファイルサーバ１０３は、システムネットワークを介してインターネットに接続している。利用者端末１０４は、共有文書を登録し、閲覧する利用者が使用する端末であり、企業ネットワーク（例えば、ＬＡＮ）を介してインターネットワークに接続している。これにより、利用者端末１０４は、文書管理サーバ１０１と検索サーバ１０２と共有ファイルサーバ１０３にアクセスすることができるように構成されている。利用者端末１０４は、ブラウザを有しており、ブラウザを介して文書管理サーバ１０１と検索サーバ１０２と共有ファイルサーバ１０３通信とを行うことができる。セキュリティの観点からは、インターネットを介する通信データは、送信側で暗号化され、受信側で復号して用いることが望ましい。利用者端末１０４は、文書を登録する利用者として使用する場合と、文書を閲覧する利用者として使用する場合がある。

　Ｓａａｓ（サース）の形態以外に、企業内に文書共有システムを設けることもできる。図２は、本願発明に係るネットワーク構成（その２）を示す図である。文書管理サーバ１０１、検索サーバ１０２、共有ファイルサーバ１０３、及び利用者端末１０４は、企業ネットワーク（例えば、ＬＡＮ）に接続されている。この例では、イントラネットを前提とし、利用者端末１０４は、Ｓａａｓ形態と同様にブラウザを介して文書管理サーバ１０１と検索サーバ１０２と共有ファイルサーバ１０３と通信を行うことができる。文書管理サーバ１０１と検索サーバ１０２と共有ファイルサーバ１０３の間の連携も企業ネットワークを介して行われる。

　いずれのネットワーク構成でも、文書管理サーバ１０１又は検索サーバ１０２が、共有ファイルを記憶する場合には、共有ファイルサーバ１０３を省略することができる。

　まず、利用者端末１０４から文書管理サーバ１０１に頁文書を登録する動作について説明する。分割対象となる元文書ファイルを転送し、文書管理サーバ１０１で元文書ファイルに含まれる目次情報に基づいて、元文書を各頁に分割した頁文書を共有情報として登録する。元文書ファイルは、目次情報を含む電子ドキュメントである。例えば、ＰＤＦ：ポータブル・ドキュメント・フォーマットの文書ファイルが用いられる。

　図３は、文書登録に係るデータフローを示す図である。文書管理サーバ１０１、は利用者端末１０４から文書作成開始を受信すると、文書種別選択画面を返信する。文書種別選択画面は、マニュアル頁、テスト仕様頁などの文書種別を選択するように構成されている。マニュアル頁は、マニュアルの頁からなる文書であり、テスト仕様頁は、テスト仕様の頁からなる文書である。利用者端末１０４から文書種別指定（文書種別ＩＤを含む）を送信し、文書管理サーバ１０１は、文書種別に応じた頁文書入力フォーム画面を返信する。頁文書入力フォーム画面は、項目毎に記入データの入力を促し、更に元文書ファイルの入力を促し、返信するように構成されている。その際、文書種別ＩＤも返信する。

　図４は、文書登録開始に係る文書管理サーバの構成を示す図である。文書管理サーバ１０１は、文書種別選択画面配信部４０１、文書種別選択画面記憶部４０２、頁文書入力フォーム画面配信部４０３、頁文書入力フォーム画面記憶部４０４、及びタグテーブル４０５を有している。続いて、これらのモジュールによる処理を説明する。

　図５は、文書種別選択画面配信処理フローを示す図である。文書種別選択画面配信部４０１は、文書作成開始の受信を待つ状態で（Ｓ５０１）、利用者端末１０４から文書作成開始を受信すると、文書種別選択画面記憶部４０２に記憶している文書種別選択画面を読み出して、送信してきた利用者端末１０４に返信する（Ｓ５０２）。文書種別選択画面は、文書種別のリストを表示し、文書種別の選択を促し、クリックなどにより選択された文書種別のＩＤを含む文書種別指定を文書管理サーバ１０１に返信するように構成されている。この画面を受信した利用者端末１０４は、ブラウザ上にこの画面を表示して、利用者が作成する文書種別の選択を受け付ける。例えば、文書作成開始と文書種別指定は、それぞれ所定のＵＲＬであり、文書種別ＩＤは、パラメータとしてそのＵＲＬに付加さている。

　図６は、頁文書入力フォーム画面配信処理を示す図である。頁文書入力フォーム画面配信部４０３は、文書種別指定の受信を待つ状態で（Ｓ６０１）、利用者端末１０４から文書種別指定を受信すると、文書種別指定に含まれる文書種別ＩＤに対応する頁文書入力フォーム画面を頁文書入力フォーム画面記憶部４０４から読み出して、送信してきた利用者端末１０４に返信する（Ｓ６０２）。頁文書入力フォーム画面は、文書種別毎にその文書データ構造に従って、記入する項目の文字コード入力欄、あるいはタグ選択手段を設けている。また、利用者端末１０４で読込み可能なファイルを元文書として指定するファイル指定手段を有している。ファイル指定手段で指定されたファイルが元文書ファイルとして読み込まれ、文書管理サーバ１０１に転送されるように構成されている。

　図７は、マニュアル頁の頁文書入力フォーム画面を示す図である。マニュアル頁の例では、作成者の他に、文書タイトル、テーマ、元文書ファイル、及び表記頁開始位置の記入項目を設けている。作成者は、ログイン時の利用者ＩＤから特定して、予め設定しているが、利用者側で、コード入力あるいはタグ選択するようにしてもよい。文書タイトルは、自由に文字コードを入力することができる。テーマは、予め設定されているタグ名を選択するように構成されている。タグ名群はプルダウンで表示される。タグを選択した場合には、タグＩＤを返信するように構成されている。文書管理サーバ１０１で、タグ名からタグＩＤを特定する場合には、タグ名を返信するようにしてもよい。元文書ファイルは、利用者端末１０４内のドライブ内のディレクトリや、企業内ネットワークに接続されているサーバ内のディレクトリなどから指定する。

　表記頁開始位置は、表記頁が始まる構成頁のことである。表記頁は、文書で表記されている頁、つまり目次で案内している利用者認識のための頁である。構成頁は、電子ドキュメントとして管理している頁、つまり表示や印刷可能な現実の頁である。表記頁開始位置は、表記頁の１頁目が、構成頁の何頁に対応するかを意味する。例えば、表紙が１頁、前書きが１頁、目次が１頁、本文が１０頁の場合には、表記頁数は、全部で１０頁であり、構成頁数は、全部で１３ページとなる。表記頁開始位置は、４頁である。本文前の頁数に１を加えた値となる。この例によらず、本文前の頁数を入力させて、１を加えて表記頁開始位置を求めても良い。本文前頁がなく、表記頁が構成頁と一致する場合には、省略しても構わない。また、元文書の管理情報から表記頁と構成頁の対応が算出できる場合も、省略できる。

　送信アイコンをクリックなどで指示することにより、これらの記入データを送信する。併せて、指定された元文書ファイルと文書種別ＩＤも送信する。文書管理サーバ１０１側で文書種別ＩＤを特定できる場合には、文書種別ＩＤは省くこともできる。

　文書種別については、文書種別管理テーブルを設けることにより、管理が容易になる。図８は、文書種別管理テーブルを示す図である。文書種別毎に、文書種別ＩＤ８０１と、文書種別名８０２と、頁文書入力フォーム画面８０３のフィールドを対応付けるレコードを設けている。

　作成者は、人名タグとして予め登録されている。また、テーマもテーマタグとして予め設定されている。図９は、タグテーブルを示す図である。タグ毎に、タグＩＤ９０１と、タグタイプ９０２と、タグ名９０３のフィールドを対応付けるレコードを設けている。タグＩＤ９０１は、タグタイプ９０２とタグ名９０３の組合せに対して唯一である。頁文書入力フォーム画面記憶部４０４の頁文書入力フォームは、タグテーブル４０５の情報と一致するように設定されている。あるいは、頁文書入力フォーム画面配信部４０３で一致するように設定する。後述する見出しコードと見出しタイトルも、見出しコードタグと見出しタイトルタグとして登録される。

　図１０は、頁文書登録処理に係る文書管理サーバの構成を示す図である。文書管理サーバ１０１は、タグテーブル４０５の他、記入データ受付部１００１、元文書受信部１００２、元文書格納部１００３、目次取得部１００５、目次記憶部１００６、頁文書生成部１００７、頁文書記憶部１００８、文書データ構造記憶部１００９、及び文書管理サーバ１０１０を有している。元文書記憶部１００４は、共有ファイルサーバ１０３に設けることを想定しているが、文書管理サーバ１０１内に設けることも可能である。

　引き続き、文書登録の処理について説明する。図１１は、頁文書登録処理フローを示す図である。記入データ受付部１００１は、記入データと文書種別ＩＤの受信を待つ状態で（Ｓ１１０１）、利用者端末１０４から記入データと文書種別ＩＤを受信する（Ｓ１１０１）。

　続いて、元文書受信部１００２の元文書受信処理で（Ｓ１１０２）、元文書ファイルを受信する。元文書格納部１００３は、元文書格納処理（Ｓ１１０３）で、受信した元文書ファイルを元文書記憶部１００４の所定の位置（サーバー、ドライブ、ディレクトリ）に所定のファイル名で記憶させる。図１２は、元文書格納処理フローを示す図である。元文書記憶部１００４内の元文書ロケーションを決定し（Ｓ１２０１）、元文書ファイルを元文書ロケーションに格納する（Ｓ１２０２）。通常は、元文書ファイル名を管理用のファイル名に改めるが、重複しなければ元文書ファイル名のままでもよい。

　目次取得部１００５は、目次取得処理で（Ｓ１１０４）、元文書ファイルから目次情報を取得する。図１３は、目次取得処理フローを示す図である。元文書ロケーションから元文書ファイルを読み込み（Ｓ１３０１）、元文書ファイルから目次情報を特定する（Ｓ１３０２）。目次情報は、文書情報の一部（例えば、所定の構成頁）である方式の他、管理情報として保持している方式もある。目次情報の取得手順は、電子ファイルの構成や、文書の編集ルールなどの格納方法に依存する。そして、見出し毎に、見出し番号と、見出しタイトルと、記述頁の範囲を対応付けて、目次記憶部１００６に記憶する（Ｓ１３０３）。

　図１４は、元文書の目次情報の例（ＸＰサービスマニュアル）を示す図である。見出し番号は、構成部位（文書の区分）を利用者が識別する文字コードであり、一般には章、節、項、目などで表記される。見出しタイトルは、その構成部位の内容や趣旨を示す文字コードである。記述頁の範囲は、その構成部位にふくまれる範囲の開始頁と終了頁である。

　頁文書生成部１００７は、頁文書生成処理で（Ｓ１１０５）、元文書を分割して頁文書ファイルを生成するとともに、管理用の文書情報を登録する。尚、頁文書ファイルは、利用者が閲覧するための情報ではなく、検索サーバ１０２でインデクスを生成するための情報である。利用者は元文書記憶部１００４の元文書ファイルの各頁を閲覧するように構成される。

　図１５は、頁文書生成処理フローを示す図である。目次情報から記述頁を特定して、記述頁毎に、以下の処理を繰り返す（Ｓ１５０１）。新規の登録文書ＩＤを割り当て、文書情報に設定する（Ｓ１５０２）。続いて、共通項目設定処理（Ｓ１５０３）と頁別項目設定処理（Ｓ１５０４）を行い、すべての記述頁について処理した時点で終了する（Ｓ１５０５）。

　共通項目と頁別項目は、文書データ構造に定義されている。図１６は、マニュアル頁の文書データ構造を示す図である。文書種別ＩＤに対して、複数の文書項目の情報を有している。各項目は、文書項目ＩＤと、文書項目名と、文書項目型と、本文テキストフラグを対応付けている。文書項目ＩＤは、文書内の項目について唯一であり、文書項目名は、項目の内容を識別するとともに画面の表示などに用いられる。文書項目型は、データ形式を定めている。人名タグやテーマタグは、タグであることと、タグの種類を定めている。本文テキストフラグは、検索結果リストで表示する本文テキストとなる項目をＯＮとして区別するように設定されている。文書項目の情報は、各頁で共通の項目と、頁毎に異なる項目に分かれている。

　生成される文書情報の例を示す。図１７は、マニュアル頁の文書情報の例（１ページ目）を示す図である。図１８は、マニュアル頁の文書情報の例（３ページ目）を示す図である。これらは、共通の元文書ファイルから生成された頁文書である。ヘッダには、登録文書ＩＤと文書種別ＩＤの他、プロパティとして作成日時や更新日時が記憶されている。また、各文書項目ＩＤに対して、文書項目データを記憶している。タグの項目では、受信したタグＩＤを記憶している。記入データとしてタグ名を受信する場合には、文書生成部１００７でタグテーブル４０５に基づいてタグ名に対応するタグＩＤを特定する。文字列は、受信した文字コードが格納される。元文書ロケーションには、元文書ファイルの格納位置（元文書記憶部１００４）が記憶され、頁文書ロケーションには、頁文書ファイルの格納位置（頁文書記憶部１００８）が記憶される。

　共通項目設定処理（Ｓ１５０３）について詳述する。図１９は、共通項目設定処理フローを示す図である。文書種別ＩＤを特定して、文書情報に設定し（Ｓ１９０１）、プロパティを取得して、文書情報に設定する（Ｓ１９０２）。作成者の項目に対応する記入データを特定する（Ｓ１９０３）。そして、記入データを文書情報のこの作成者項目に書き込む（Ｓ１９０４）。このとき、記入データは人名のタグＩＤである。次に、文書タイトルの項目に対応する記入データを特定する（Ｓ１９０５）。記入データを文書情報の文書タイトルの項目に書き込む（Ｓ１９０６）。記入データは、文字コードである。元文書格納部１００３から元文書ロケーションを取得し（Ｓ１９０７）、元文書ロケーションを文書情報の当該項目に書き込む（Ｓ１９０８）。文書種別ＩＤに対応する文書データ構造に含まれるその他の項目に対応する記入データを特定する（Ｓ１９０９）。ＩＴ０４以降の項目である。記入データを文書情報の文書タイトルの当該項目に書き込む（Ｓ１９１０）

　頁別項目設定処理（Ｓ１５０４）について詳述する。図２０は、頁別項目設定処理フローを示す図である。表記頁開始位置から１引いて、差分頁数を求める。差分頁数は本文前の頁数に相当する。記述頁番号に差分頁数を加えて、対応する構成頁番号を特定する（Ｓ２００１）。また、頁文書ロケーションを決定する（Ｓ２００２）。この例では、ファイル名の末尾に、構成頁を加えている。元文書ファイルの構成頁をコピーして頁文書ロケーションに頁文書ファイルを生成する（Ｓ２００３）。このとき、先に決定したファイル名が用いられる。そして、文書情報の記述頁、構成頁、頁文書ロケーションを各項目に書き込む（Ｓ２００４）。更に、文書種別ＩＤに対応する文書データ構造に含まれる見出し番号の項目に対応する記入データを特定する（Ｓ２００５）。この例では、ＩＴ１４である。当該頁の見出し番号を目次情報から取得し、文書情報の見出し番号の項目に書き込む（Ｓ２００６）。このとき、タグテーブル４０５から見出し番号と一致するタグ名を検索し、対応するタグＩＤを特定し、タグＩＤを書き込む。また、文書種別ＩＤに対応する文書データ構造に含まれる見出しタイトルの項目に対応する記入データを特定する（Ｓ２００７）。この例では、ＩＴ１５である。記入データを文書情報の見出しタイトルの項目に書き込む（Ｓ２００８）。このとき、タグテーブル４０５から見出しタイトルと一致するタグ名を検索し、対応するタグＩＤを特定し、タグＩＤを書き込む。

　このようにして文書登録が完了する。続いて、このようにして登録された文書を検索対象とするためのインデクス登録の操作について説明する。

　図２１は、インデクス登録に係る文書管理サーバの構成を示す図である。文書管理サーバ１０１は、タグテーブル４０５、文書データ構造記憶部１００９、文書管理サーバ１０１０の他に、インデクス用テーブル生成部２１０１、メニュータグ対応表２１０２、インデクス用テーブル記憶部２１０３、及びインデクス生成コマンド起動部２１０４を有している。インデクス用テーブル生成部２１０１は、登録された文書についてインデクス用テーブルを生成する。インデクス用テーブル生成部２１０１は、文書登録に連動して起動されるように構成してもよいし、バッチ処理で一群の文書を処理するように構成してもよい。

　図２２は、インデクス用テーブルを示す図である。インデクス対象文書毎に、文書タイトル２２０１、作成者２２０２、作成日時２０３、本文テキストソース２２０４、第一メニュー項目（分野）２２０６、第二メニュー項目（章節番号）２２０７、第三メニュー項目（章節標題）２２０８、第四メニュー項目（人員）２２０９、ロケーション２２１０、構成頁２２１１、記述頁２２１２のフィールドを対応付けるレコードを設けている。文書タイトル１７０１と本文テキスト１７０４は、キーワード検索の探索領域となるとともに、検索結果一覧のリストとして表示される。メニュー項目は、メニュー（分野、章節番号、章節標題、人員など）に属する選択候補である。ここでは、文字コード列で設定される。ロケーションは、文書表示の際にアクセスする位置情報を示している。ファイル名の後ろに構成頁の指定を加えている。つまり、元文書内の構成頁の位置を指定している。これにより、直接当該頁がブラウザに表示される。この例では省いているが、更新日時を含めることも有効である。

　インデクス用テーブル生成部２１０１とインデクス生成コマンド起動部２１０４による文書管理サーバ１０１側のインデクス登録動作について説明する。図２３は、インデクス登録処理フローを示す図である。インデクス用テーブル生成部２１０１は、文書管理サーバ１０１０から未登録の文書情報を特定して、未登録の文書情報毎に以下の処理を繰り返す（Ｓ１８０１）。未登録は、前回のインデクス登録処理以降の作成日時又は更新日時を有する文書を判定する方法や、作成・更新の際に作成・更新フラグでＯＮにすることにより判定する方法などが考えられる。未登録の文書のみならず、全文書を対象としてもよい。

　インデクス用テーブル生成部２１０１は、インデクス用テーブル記憶部２１０３に追加レコードを生成する処理（Ｓ２３０２）を、すべての文書情報について処理する（Ｓ２３０３）。そして、インデクス生成コマンド起動部２１０４は、インデクス生成コマンド起動処理により、インデクス用テーブル記憶部２１０３のインデクス用テーブルを検索サーバ１０２にインデクス生成コマンドと共に転送する（Ｓ２３０４）。

　図２４は、レコード生成処理フローを示す図である。文書管理サーバ１０１０の文書情報から文書タイトルを読み取り、作成者を読み取り、作成日時を読み取り、それぞれインデクスレコードに書き込む（Ｓ２４０１～Ｓ２４０３）。作成者については、タグテーブル４０５を用いて、文書項目データのタグＩＤをタグ名に変換する。また、文書情報の本文テキストフラグＯＮの項目を特定し（Ｓ２４０４）、当該項目のデータを本文テキストに書き込む（Ｓ２４０５）。更に、メニュー毎に（Ｓ２４０６）、当該メニューに対応するタグタイプを特定して（Ｓ２４０７）、文書項目型が当該タグタイプである文書項目を特定し（Ｓ２４０８）、当該文書項目のデータを、メニュー項目に書き込む（Ｓ２４０９）。

　タグタイプは、メニュータグ対応表２１０２を用いて特定する（Ｓ２４０７）。図２５は、メニュータグ対応表を示す図である。ドリルダウン項目毎に、タグタイプ２５０１とドリルダウン項目ＩＤ２５０２を対応付けている。

　文書項目の特定は、文書データ構造記憶部１００９（図１４）に基づいて行う（Ｓ２４０８）。例えば、当該文書種別ＩＤに対応する文書データ構造で、文書項目型がテーマタグである項目、文書項目型が見出しコードタグである項目、文書項目型が見出しタイトルタグである項目、文書項目型が人名タグである項目を判定する。

　また、書き込む際には、タグテーブル４０５を用いてタグＩＤをタグ名に変換する（Ｓ２４０９）。タグが複数ある場合には、区切りのコード（例えば、空白コード）を挿入する。

　すべてのメニューについて処理すると（Ｓ２４１０）、元文書ロケーションに、構成頁を表示する指示を付加してロケーションを生成し、書き込む（Ｓ２４１１）。最後に、構成頁と記述頁を書き込む（Ｓ２４１２）

　続いて、検索サーバ側の動作について説明する。図２６は、検索画面配信に係る検索サーバの構成を示す図である。検索サーバ１０２は、インデクス生成部２６０１、インデクスデータベース２６０２、検索画面配信部２６０３、及び検索画面生成部２６０４を有している。

　インデクス生成部２６０１は、文書管理サーバ１０１からインデクス生成コマンドを受信すると、共に受信したインデクス用テーブルを読み取り、インデクスデータベース２６０２に追加登録する。重複する既存文書は削除する。インデクスデータベース２６０２は、インデクス用テーブルのフィールド間の対応付けを維持したまま、文書毎にインデクスの情報を保持するように構成されている。このとき、インデクスの文書テキストソースに設定されている頁文書ロケーションにアクセスし、頁文書ファイルを取得し、頁文書ファイルから本文テキストを抽出する。そして、抽出した本文テキストをインデクスとして保持する。

　この状態で、検索要求に応じて検索画面を配信する動作について説明する。図２７は、検索画面配信処理フローを示す図である。検索画面配信部２６０３は、検索要求待ちの状態で（Ｓ２７０１）、文書を閲覧する利用者の利用者端末１０４から検索要求（検索サーバ１０２を指す検索ＵＲＬ）を受信すると、検索画面生成部２６０４で検索画面を生成して（Ｓ２７０２）、検索要求を発信した利用者端末１０４に検索画面を返信する（Ｓ２７０３）。

　図２８は、検索画面を示す図である。左側が、ドリルダウン検索領域である。右上が、キーワード検索領域である。右下が、検索結果リスト表示領域である。ドリルダウン検索領域は、メニュー毎に、そのメニューに含まれるメニュー項目を指示操作（クリック）可能な状態で表示している。メニュー項目には、そのメニュー項目に対応する文書数が付加されている。検索結果リスト表示領域は、検索された文書の文書タイトルを指示操作（クリック）可能な状態で表示するとともに、本文テキストの先頭部位（所定文字数範囲）を表示している。

　図２８中のＸＰ正常テスト集は、データ登録の章が９ページから開始している。図２９は、元文書の目次情報の例（ＸＰ正常テスト集）を示す図である。

　検索画面生成部２６０４による検索画面成処理では、初期状態の検索画面に対して、ドリルダウン検索領域と検索結果リストを生成する。図２９は、検索画面成処理フローを示す図である。ドリルダウン検索領域生成処理（Ｓ２９０１）と検索結果リスト生成処理（Ｓ２９０２）を行う。

　図３１は、ドリルダウン検索領域生成処理フローを示す図である。メニュー毎に以下の処理を繰り返す（Ｓ３１０１）。メニューに含まれるメニュー項目を特定する（Ｓ３１０２）。メニュータグ対応表２１０２内のインデクス群のメニュー項目を読込み、重複なく、漏れなく、メニュー項目を順次特定していく。そして、メニュー項目毎に、当該メニュー項目を含む文書数をカウントする（Ｓ３１０３）。すべてのメニューについて処理すると（Ｓ３１０４）、再びメニュー毎に（Ｓ３１０５）、まず、メニュー名を配置する（Ｓ３１０６）。続いて、メニュー項目を文書数の降順にソートして（Ｓ３１０７）、その順に従って、メニュー項目毎にメニュー項目名と文書数を配置する（Ｓ３１０８）。また、メニュー項目がブラウザ上で指示操作（クリック）された場合にアクセスするリンク先として、検索サーバ１０２を指す検索要求ＵＲＬを設定する。検索要求ＵＲＬには、パラメータとしてメニュー項目（メニュー項目名、あるいはメニュー項目番号などメニュー項目を識別できる情報）を付加する（Ｓ３１０９）。すべてのメニューについて処理した時点で終了する（Ｓ３１１０）。

　図３２は、検索結果リスト生成処理フローを示す図である。アクセスの際の検索要求ＵＲＬにメニュー項目のパラメータがある場合に以下の処理を行なう（Ｓ３２０１）。尚、キーワードのパラメータがある場合には、キーワード検索を行ない、パラメータがない場合には、検索を行なわない。

　インデクスデータベース２６０２からメニュー項目を含む文書を検索し（Ｓ３２０２）、検索された文書毎に以下の処理を繰り返す（Ｓ３２０３）。文書タイトルと記述頁を配置し（Ｓ３２０４）、文書タイトルがブラウザ上で指示操作（クリック）された場合にアクセスするリンク先として、インデクスに含まれるロケーションを設定する（Ｓ３２０５）。更に、本文テキストを所定範囲内に配置する（Ｓ３２０６）。表示文書数の制限に達するまで繰り返す（Ｓ３２０７）。制限は、表示領域や表示文書数で定められている。

　利用者端末１０４のブラウザ上で、検索結果リストの文書が選択指示されると、元文書記憶部１００４を指すロケーションにアクセスすることになる。この例では、共有ファイルサーバ１０３を想定している。共有ファイルサーバ１０３は、このアクセスによる文書表示要求に応じて文書の頁を表示した画面を利用者端末１０４に配信する。

　文書管理サーバ１０１と検索サーバ１０２と共有ファイルサーバ１０３と利用者端末１０４は、コンピュータであり、各要素はプログラムにより処理を実行することができる。また、プログラムを記憶媒体に記憶させ、記憶媒体からコンピュータに読み取られるようにすることができる。

　１０１　　文書管理サーバ
　１０２　　検索サーバ
　１０３　　共有ファイルサーバ
　１０４　　利用者端末
　４０１　　文書種別選択画面配信部
　４０２　　文書種別選択画面記憶部
　４０３　　頁文書入力フォーム画面配信部
　４０４　　頁文書入力フォーム画面記憶部
　４０５　　タグテーブル
　１００１　　記入データ受付部
　１００２　　元文書受信部
　１００３　　元文書格納部
　１００４　　元文書記憶部
　１００５　　目次取得部
　１００６　　目次記憶部
　１００７　　頁文書生成部
　１００８　　頁文書記憶部
　１００９　　文書データ構造記憶部
　１０１０　　文書管理サーバ
　２１０１　　インデクス用テーブル生成部
　２１０２　　メニュータグ対応表
　２１０３　　インデクス用テーブル記憶部
　２１０４　　インデクス生成コマンド起動部
　２６０１　　インデクス生成部
　２６０２　　インデクスデータベース
　２６０３　　検索画面配信部
　２６０４　　検索画面生成部

Claims

　元文書を分割した頁文書を登録する利用者の利用者端末と接続可能な文書共有システムであって、以下の要素を有することを特徴とする文書共有システム
（１）前記頁文書を登録する利用者端末から、元文書の区分の見出しと、当該区分の頁範囲を含む目次情報を有する元文書ファイルを受信する元文書受信部
（２）受信した元文書ファイルから、目次情報を取得する目次取得部
（３）元文書に含まれる頁毎に、目次情報に基づいて当該頁が属する区分の見出しを判定し、当該見出しをタグとして含める頁文書情報を生成する頁文書生成部
（４）頁文書情報を記憶する文書情報データベース
（５）頁文書情報毎に、頁文書情報に含まれるタグを文書のドリルダウン検索に用いるメニュー項目として含むインデクスを生成するインデクス用テーブル生成部。
　文書共有システムは、頁文書を閲覧する利用者の利用者端末と接続可能であって、更に（６）頁文書毎のインデクスを記憶するインデクスデータベースと、
（７）インデクスのメニュー項目群を表示し、メニュー項目の選択を促し、選択されたメニュー項目を検索条件として返信するように構成されたドリルダウン検索領域を含む検索画面を生成する検索画面生成部と、
（８）生成した検索画面を、前記頁文書を閲覧する利用者の利用者端末に送信する検索画面配信部を有することを特徴とする請求項１記載の文書共有システム。
　前記検索画面生成部は、返信された検索条件のメニュー項目をインデクスに含む文書をインデクスデータベースから検索し、検索した文書一覧である検索結果リストを検索画面に含めることを特徴とする請求項２記載の文書共有システム。
　文書共有システムは、更に、
（９）受信した元文書ファイルを格納するロケーションを決定し、決定した元文書ロケーションに受信した元文書ファイルを格納する元文書格納部を有し、
　前記頁文書生成部は、元文書ロケーションを各頁文書情報に含め、
　前記インデクス用テーブル生成部は、頁文書情報毎に、当該頁を表示する頁指定を付加した元文書ロケーションをインデクスに含め、
　前記検索画面生成部は、検索結果リスト中の文書が選択された場合に、頁指定を付加した元文書ロケーションをリンク先としてアクセスするように検索画面を構成することを特徴とする請求項３記載の文書共有システム。
　前記インデクス用テーブル生成部は、目次情報の区分の頁範囲に含まれる当該頁の記述頁番号を、文書構成上の頁番号に変換し、変換した構成頁番号を頁指定として付加することを特徴とする請求項４記載の文書共有システム。
　前記インデクス用テーブル生成部は、記述頁番号に構成頁と記述頁の差分頁数を加えて、構成頁番号を算出することを特徴とする請求項５記載の文書共有システム。
　文書共有システムは、更に、
（１０）表記上の１頁目に相当する構成上の頁番号である表記頁開始位置を受信する記入データ受付部を有し、
　前記インデクス用テーブル生成部は、表記頁開始位置から１を引いて差分頁数を求めることを特徴とする請求項６記載の文書共有システム。
　文書共有システムは、更に、
（１１）差分頁数を受信する記入データ受付部を有し、
　前記インデクス用テーブル生成部は、受信した差分頁数を用いることを特徴とする請求項６記載の文書共有システム。
　前記頁文書生成部は、元文書に含まれる頁毎に、元文書ファイルから当該頁を文書ファイルとして分割した頁文書ファイルを生成し、
　前記検索画面生成部は、頁文書ファイルから本文テキストを取得し、取得した本文テキストを文書一覧に設定することを特徴とする請求項５記載の文書共有システム。
　前記頁文書生成部は、見出しタイトルをタグとすることを特徴とする請求項１から９のいずれかに記載の文書共有システム。
　前記頁文書生成部は、見出し番号をタグとすることを特徴とする請求項１から９のいずれかに記載の文書共有システム。
　元文書を分割した頁文書を登録する利用者の利用者端末と接続可能な文書共有システムとなるコンピュータに、以下の手順を実行させるためのプログラム
（１）前記頁文書を登録する利用者端末から、元文書の区分の見出しと、当該区分の頁範囲を含む目次情報を有する元文書ファイルを受信する元文書受信手順
（２）受信した元文書ファイルから、目次情報を取得する目次取得手順
（３）元文書に含まれる頁毎に、目次情報に基づいて当該頁が属する区分の見出しを判定し、当該見出しをタグとして含める頁文書情報を生成する頁文書生成手順
（４）頁文書情報を記憶する文書情報記憶手順
（５）頁文書情報毎に、頁文書情報に含まれるタグを文書のドリルダウン検索に用いるメニュー項目として含むインデクスを生成するインデクス用テーブル生成手順。