JP2010272082A - 情報共有システム、情報共有方法、および情報共有プログラム - Google Patents
情報共有システム、情報共有方法、および情報共有プログラム Download PDFInfo
- Publication number
- JP2010272082A JP2010272082A JP2009125736A JP2009125736A JP2010272082A JP 2010272082 A JP2010272082 A JP 2010272082A JP 2009125736 A JP2009125736 A JP 2009125736A JP 2009125736 A JP2009125736 A JP 2009125736A JP 2010272082 A JP2010272082 A JP 2010272082A
- Authority
- JP
- Japan
- Prior art keywords
- feature information
- document
- search
- information
- storage device
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Abstract
【課題】きめ細かい機密保持制御とユーザビリティに優れた情報共有制御とをバランス良く両立させる。
【解決手段】記憶装置が格納している各文書データから所定属性を持つ文字列ないし記号を特徴情報として抽出し文書データ毎に記憶するクローラー部111と、情報検索要求が示す検索条件に基づいて記憶装置が格納している各文書データでの全文検索を実施する検索エンジン部112と、全文検索により特定した文書の特徴情報を記憶装置のテーブルから抽出し、該当特徴情報に関するアクセス権のデータを記憶装置から読み取り、アクセス権のデータがアクセス可を示す特徴情報を開示可特徴情報として特定するセキュリティモジュール部113と、全文検索の結果と全文検索結果に含まれる文書の特徴情報のうち開示可特徴情報とを併せて検索結果としてクライアントコンピュータに送信る検索サービス部110とから情報共有システムを構成する。
【選択図】図1
【解決手段】記憶装置が格納している各文書データから所定属性を持つ文字列ないし記号を特徴情報として抽出し文書データ毎に記憶するクローラー部111と、情報検索要求が示す検索条件に基づいて記憶装置が格納している各文書データでの全文検索を実施する検索エンジン部112と、全文検索により特定した文書の特徴情報を記憶装置のテーブルから抽出し、該当特徴情報に関するアクセス権のデータを記憶装置から読み取り、アクセス権のデータがアクセス可を示す特徴情報を開示可特徴情報として特定するセキュリティモジュール部113と、全文検索の結果と全文検索結果に含まれる文書の特徴情報のうち開示可特徴情報とを併せて検索結果としてクライアントコンピュータに送信る検索サービス部110とから情報共有システムを構成する。
【選択図】図1
Description
本発明は、情報共有システム、情報共有方法、および情報共有プログラムに関するものであって,具体的には、きめ細かい機密保持制御とユーザビリティに優れた情報共有制御とをバランス良く両立させる技術に関するものである。
近年、企業や組織における情報の共有・活用を目的として、情報検索機能を備えた情報共有システムの導入が一般的になりつつある。しかし、企業や組織内で取り扱う情報の中には機密性の高いものが多く、適切な権限を持つ利用者にのみ情報を開示するなどのアクセス制御が必要である。現在市場に流通する製品・サービスにおいては、このような需要に応えるために、文書単位あるいは文書の集合単位でアクセス制御が広く行われている。 例えば、検索システムが、ファイルに付与されたアクセス権を用いてアクセス制御を行う技術が開示されている(特許文献1参照)。また既存製品・サービスにおいて、ファイルあるいはファイルの集合に対し、利用者の権限に応じて検索の可否や検索結果の表示可否の制御が行われている(非特許文献1〜4参照)。或いは、文書内の一部を非開示とするような、より細かい粒度でアクセス制御を実施する技術も存在する。例えば、文書を表示する際に文書の特定の箇所を非開示とする技術が開示されている(特許文献2参照)。 一方、利用者が企業や組織内の膨大な情報の中から目的とする情報に辿り着くために、キーワード検索結果を絞り込むための検索支援技術の採用が広がりつつある。このような検索支援技術の一つの例としてファセットナビゲーションが挙げられる。ファセットナビゲーションとは、検索対象である文書のメタデータを抽出し、利用者が検索を実施する際に、検索結果の文書に含まれるメタデータを分類・集計して利用者に提示することで、利用者が目的とする情報に辿り着くことを支援する仕組みである。こうした技術として例えば、ファセットナビゲーションを用いた検索結果の絞り込み技術(特許文献3参照、非特許文献5参照)などが開示されている。
このようなファセットナビゲーションは、現在インターネット上のショッピングサイトなどにおいて、ユーザの検索結果を商品の価格やジャンル毎に分類・集計するといった形態で広く利用されており、このようなファセットナビゲーションは企業内の情報検索においても検索支援のために今後利用が進むことが期待されている。
また、検索支援技術のもう一つの例として近傍表示が挙げられる。この近傍表示とは、検索により特定した文章の中から、検索キーワードに合致する箇所とその周辺文章を抽出し検索結果として表示する技術である。これによれば、利用者が検索結果の文書一覧から目的の文書を一目で探しやすいという利点がある。このような近傍表示の技術は、インターネット上の検索だけでなく、企業内の情報検索においても使われつつある。
www.autonomy.com
www.fastsearch.com
www.ibm.com/software/data/enterprise-search/omnifind-enterprise/
www.google.com/enterprise/gsa/
lucene.apache.org/solr/
前述のファセットナビゲーションのような検索支援技術において、文書のメタデータとして文書の属性情報だけを用いるのではなく、より高度な検索支援実現のために文書内の単語や文字列を抽出してメタデータとして用いる場合があり得る。しかし、企業や組織内で取り扱う文書には、先に示すように機密情報を含むものが多い。こうした文書から抽出された情報が検索支援のために検索結果に表示される場合、たとえ文書そのものに対して公知技術を用いてアクセス制御を適用していたとしても、文書から抽出されて検索結果画面に表示される情報によって文書の内容が推測されるおそれがある。この場合、結果として、高度な検索支援が機密情報の漏洩を招来することにつながりかねない。このようなリスクに対し、現状の文書単位や文書の集合単位でのアクセス制御では対処することができない。
また、上述の検索支援技術における文書中からの情報抽出は、サーバなどの検索装置が文書を収集する際に実行される。そのため、利用者が検索要求を行って文書を閲覧する時点で、画面表示される文書の一部を前述の公知技術等を用いて非開示にしたとしても、前記情報抽出がなされている情報については検索結果画面に事前に表示されてしまうという課題があった。
さらに、上記近傍表示の技術においては、検索キーワードとの合致箇所の周辺文章に機密情報が含まれているかどうかに関わらず、管理者による事前設定等にしたがって前記周辺文章の表示/非表示の制御が行われている。そのため、機密情報を含む範囲を避けて近傍表示するといったきめ細かい制御が出来ない。仮にそのような制御を行おうとしても、文書毎に全ての機密情報のリストアップを実施して事前に定義することは運用上困難である。 結果として、機密保持と情報共有をバランス良く両立させることができないという課題が存在する。
そこで本発明は上記課題を鑑みてなされたものであり、きめ細かい機密保持制御とユーザビリティに優れた情報共有制御とをバランス良く両立させる技術の提供を主たる目的とする。
上記課題を解決する本発明の情報共有システムは、例えば、企業などにおいて扱っている情報の検索・共有のサービスを利用者に提供するコンピュータシステムであり、以下のものを備えている。すなわち、前記情報共有システムは、文書データと、当該文書データから特徴情報として抽出すべき文字列ないし記号の所定属性のデータと、特徴情報別のアクセス権のデータとを格納した記憶装置を備えている。
また、前記情報共有システムは、前記記憶装置が格納している各文書データから、前記所定属性を持つ文字列ないし記号を特徴情報として抽出し、文書データ毎の前記特徴情報を記憶装置のテーブルに記憶するクローラー部を備える。
また、前記情報共有システムは、クライアントコンピュータからの情報検索要求を通信装置を介して受信し、前記情報検索要求が示す検索条件に基づいて、前記記憶装置が格納している各文書データでの全文検索を実施する検索エンジン部を備える。
また、前記情報共有システムは、前記全文検索により特定した文書の特徴情報を前記記憶装置のテーブルから抽出し、該当特徴情報に関するアクセス権のデータを前記記憶装置から読み取り、前記アクセス権のデータがアクセス可を示す特徴情報を開示可特徴情報として特定するセキュリティモジュール部を備える。
また、前記情報共有システムは、前記全文検索の結果と全文検索結果に含まれる文書の特徴情報のうち前記開示可特徴情報とを併せて検索結果として通信装置を介し前記クライアントコンピュータに送信する、検索サービス部を備える。
なお、前記セキュリティモジュール部は、前記全文検索により特定した文書の特徴情報を前記記憶装置のテーブルから抽出し、該当特徴情報に関するアクセス権のデータを前記記憶装置から読み取り、前記アクセス権のデータがアクセス不可を示す特徴情報を開示不可特徴情報として特定するとしてもよい。
この場合、前記検索サービス部は、前記全文検索結果に含まれる文書毎に、前記情報検索要求が示す検索キーワードに該当する文字列を含む所定範囲の文章であり、前記開示不可特徴情報を含まないものを近傍データとして抽出し、前記全文検索の結果と全文検索結果に含まれる文書の近傍データとを併せて検索結果として通信装置を介し前記クライアントコンピュータに送信する、とすれば好適である。
また、前記情報共有システムが、管理者の端末から、特徴情報の指定と該当特徴情報に関するアクセス権の設定指示とを受け付けて、前記記憶装置における前記特徴情報別のアクセス権を設定する運用管理部を備えるとしてもよい。
また、前記情報共有システムにおいて、前記記憶装置は、文書データと、当該文書データから特徴情報として抽出すべき文字列ないし記号の所定属性のデータと、文書データ別のアクセス権のデータと、特徴情報別のアクセス権のデータとを格納しているとしてもよい。
この場合、前記セキュリティモジュール部は、前記全文検索により特定した文書について前記記憶装置においてアクセス権のデータを読み取り、前記アクセス権のデータがアクセス可を示す文書を開示可文書として特定し、ここで特定した開示可文書の特徴情報を前記記憶装置のテーブルから抽出し、該当特徴情報に関するアクセス権のデータを前記記憶装置から読み取り、前記アクセス権のデータがアクセス可を示す特徴情報を開示可特徴情報として特定するとすれば好適である。また、前記検索サービス部は、前記全文検索の結果と全文検索結果に含まれる前記開示可文書の特徴情報のうち前記開示可特徴情報とを併せて検索結果として通信装置を介し前記クライアントコンピュータに送信する、とすれば好適である。
また、本発明の情報共有方法は、文書データと、当該文書データから特徴情報として抽出すべき文字列ないし記号の所定属性のデータと、特徴情報別のアクセス権のデータとを格納した記憶装置を備えるコンピュータが、以下の処理を実行するものである。
すなわち、コンピュータが、前記記憶装置が格納している各文書データから、前記所定属性を持つ文字列ないし記号を特徴情報として抽出し、文書データ毎の前記特徴情報を記憶装置のテーブルに記憶する処理と、クライアントコンピュータからの情報検索要求を通信装置を介して受信し、前記情報検索要求が示す検索条件に基づいて、前記記憶装置が格納している各文書データでの全文検索を実施する処理と、前記全文検索により特定した文書の特徴情報を前記記憶装置のテーブルから抽出し、該当特徴情報に関するアクセス権のデータを前記記憶装置から読み取り、前記アクセス権のデータがアクセス可を示す特徴情報を開示可特徴情報として特定する処理と、前記全文検索の結果と全文検索結果に含まれる文書の特徴情報のうち前記開示可特徴情報とを併せて検索結果として通信装置を介し前記クライアントコンピュータに送信する処理と、を実行する。
また、本発明の情報共有プログラムは、文書データと、当該文書データから特徴情報として抽出すべき文字列ないし記号の所定属性のデータと、特徴情報別のアクセス権のデータとを格納した記憶装置を備えるコンピュータに、以下の処理を実行させるものである。
すなわち、前記情報共有プログラムは、コンピュータに、前記記憶装置が格納している各文書データから、前記所定属性を持つ文字列ないし記号を特徴情報として抽出し、文書データ毎の前記特徴情報を記憶装置のテーブルに記憶する処理と、クライアントコンピュータからの情報検索要求を通信装置を介して受信し、前記情報検索要求が示す検索条件に基づいて、前記記憶装置が格納している各文書データでの全文検索を実施する処理と、前記全文検索により特定した文書の特徴情報を前記記憶装置のテーブルから抽出し、該当特徴情報に関するアクセス権のデータを前記記憶装置から読み取り、前記アクセス権のデータがアクセス可を示す特徴情報を開示可特徴情報として特定する処理と、前記全文検索の結果と全文検索結果に含まれる文書の特徴情報のうち前記開示可特徴情報とを併せて検索結果として通信装置を介し前記クライアントコンピュータに送信する処理と、を実行させる。
その他、本願が開示する課題、及びその解決方法は、発明の実施の形態の欄、及び図面により明らかにされる。
本発明によれば、きめ細かい機密保持制御とユーザビリティに優れた情報共有制御とをバランス良く両立させることができる。
−−−システム構成−−−
以下に本発明の実施形態について図面を用いて詳細に説明する。図1は、本実施形態の情報共有システム10におけるソフトウェアの構成例を示す図であり、図2は、情報共有システム10における各機器のハードウェア構成例を示す図である。本実施形態における情報共有システム10は、検索サーバ1、クライアントコンピュータ2、文書共有コンピュータ3、運用管理コンピュータ4の各機器と通信ネットワーク50とから構成されている。また前記各機器は、前記通信ネットワーク50を介して接続される。
以下に本発明の実施形態について図面を用いて詳細に説明する。図1は、本実施形態の情報共有システム10におけるソフトウェアの構成例を示す図であり、図2は、情報共有システム10における各機器のハードウェア構成例を示す図である。本実施形態における情報共有システム10は、検索サーバ1、クライアントコンピュータ2、文書共有コンピュータ3、運用管理コンピュータ4の各機器と通信ネットワーク50とから構成されている。また前記各機器は、前記通信ネットワーク50を介して接続される。
図2に示すように、前記各機器1〜4は、計算機901と周辺機器908によって構成できる。前記計算機901は、CPU902、半導体メモリ(RAM)等の揮発性記憶装置903、ハードディスクやSSD等の読み書き可能な不揮発性記憶装置904、光磁気メディア等の読み出し専用不揮発性記憶装置906、他機器との通信用の通信インタフェース905(通信装置)、これらを接続するデータバス907等の内部通信路によって構成できる。また前記機器1〜4においては、キーボードやマウス等の入力装置909、CRTディスプレイや液晶ディスプレイ、プリンタ等の出力装置910、外部接続記憶装置911などといった周辺機器908がデータバス907に接続され得る。
こうした前記機器1〜4が接続される通信ネットワーク50は、公衆網、インターネット、ISDN、専用線、LAN等の有線網や、移動通信用基地局や通信用人工衛星等を利用した無線網等によって実現できる。前記通信ネットワーク50において各機器1〜4は、個々の機器に予め付与された識別情報(例:IPアドレスやMACアドレスなど)によって識別され、これによって各機器は他の機器に接続して通信を行う。
前記情報共有システム10を構成する前記機器1〜4は、本発明を実現する機能を備えるべく前記不揮発性記憶装置904等に格納されたプログラムを前記揮発性記憶装置903に読み出し、演算装置たる前記CPU902により実行する。前記CPU902が実行するプログラムや、プログラムが使用するデータについては、前記揮発性記憶装置903や不揮発性記憶装置904、読み出し専用記憶装置906、外部接続記憶装置911に格納されていても良いし、前記通信ネットワーク50や通信ネットワーク50上を伝播する搬送波やデジタル信号を介して他の機器から導入されても良い。
続いて、前記情報共有システム10を構成する各機器1〜4が備えるプログラムにつき説明する。前記クライアントコンピュータ2は、情報共有システム10の利用者が利用する端末であり、検索クライアントプログラム210を備えている。この検索クライアントプログラム210は、前記情報共有システム10の利用者に対し、情報検索を行うためのユーザーインタフェースを提供するプログラムであり、例えばウェブブラウザや検索専用アプリケーション等の形態をとることができる。この検索クライアントプログラム210は、前記利用者がクライアントコンピュータ2の入力装置で入力した検索キーワードを含む情報検索要求を検索サーバ1に送信する。一方でこの検索クライアントプログラム210は、前記情報検索要求に応じた検索結果を検索サーバ1から受け取って出力装置に表示して利用者に提示する。
また、前記文書共有コンピュータ3は、利用者に提示する文書データを管理するコンピュータであり、文書共有サービスプログラム310を備える。この文書共有サービスプログラム310は、前記情報共有システム10の利用者に対して、電子化された文書を格納して他の利用者と共有するためのインタフェースを提供するプログラムである。前記文書共有サービスプログラム310は、例えばNFS(Network File System)やCIFS(Common Internet File System)等を用いたファイル共有サービスプログラム、あるいはプロプライエタリな文書管理サービスプログラム、あるいは構造化されたデータを格納するデータベースプログラム等の形態をとることが可能である。
また、前記運用管理コンピュータ4は、前記検索サーバ1や文書共有コンピュータ3、あるいはクライアントコンピュータ2の運用管理インタフェースを提供するコンピュータであり、運用管理プログラム410を備える。この運用管理プログラム410は、情報共有システム10の運用管理者に対して、前記検索サーバ1や文書共有コンピュータ3、あるいはクライアントコンピュータ2の運用管理インタフェースを提供するためのプログラムである。本実施例において、運用管理者は前記運用管理コンピュータ4の前記運用管理プログラム410を用いて、前記検索サーバ1上の文書単位アクセス制御情報テーブル114や特徴情報テーブル115、特徴情報アクセス制御テーブル116を編集することとなる(これら各テーブルについては後述する)。
一方、本実施形態の情報共有システム10で主たる役割を果たすのが前記検索サーバ1である。この検索サーバ1は、検索サービスプログラム110(検索サービス部)、クローラープログラム111(クローラー部)、検索エンジンプログラム112(検索エンジン部)、セキュリティモジュールプログラム113(セキュリティモジュール部)の各プログラムを備えている。
このうち前記検索サービスプログラム110は、情報共有システム10の利用者に対して、情報の検索を行うためのインタフェースを、前記クライアントコンピュータ2の検索クライアントプログラム210を通して提供するプログラムである。この検索サービスプログラム110は、利用者がクライアントコンピュータ2の入力装置で入力した検索キーワードを含んだ情報検索要求を検索クライアントプログラム210経由で受け取り、前記検索キーワードを基に検索クエリを生成して検索エンジンプログラム112に発行する。 また検索サービスプログラム110は、前記検索クエリに対応する全文検索結果を検索エンジンプログラム112より受け取り、前記クライアントコンピュータ2の検索クライアントプログラム210に返すための最終的な検索結果を生成する。この最終的な検索結果の生成においては、文書単位でのアクセス制御を実施し、利用者が適切な権限を持つ文書のリストを全文検索結果から抽出する。さらに検索サービスプログラム110は、当該リストの文書に含まれる特徴情報を検索支援のために分類・集計する。また、当該文書リストの文書毎に、利用者が入力した検索キーワードに該当する文書内の文字列周辺の文章を、近傍データとして抽出する。検索サービスプログラム110は、これら特徴情報と近傍データを、検索結果として文書リストと共に検索クライアントプログラム210に返す。 本実施例においては、検索サービスプログラム110はさらに、セキュリティモジュールプログラム113を用いて、特徴情報や近傍データに対するアクセス制御を実施して、最終的な検索結果を生成する。つまり、前記検索サービスプログラム110は、全文検索の結果と全文検索結果に含まれる文書の特徴情報のうち「開示可」の特徴情報とを併せて検索結果として通信装置を介し前記クライアントコンピュータに送信する。また、前記検索サービスプログラム110は、全文検索結果に含まれる文書毎に、情報検索要求が示す検索キーワードに該当する文字列を含む所定範囲の文章であり、「開示不可」の特徴情報を含まないものを近傍データとして抽出し、全文検索の結果と全文検索結果に含まれる文書の近傍データとを併せて検索結果として通信装置を介しクライアントコンピュータに送信する。また、前記検索サービスプログラム110は、全文検索の結果と全文検索結果に含まれる「開示可」の文書が含んでいる特徴情報のうち「開示可」の特徴情報とを併せて検索結果として通信装置を介しクライアントコンピュータに送信する。
また、前記クローラープログラム111は、前記文書共有コンピュータ3に格納された文書及びその付随情報を収集して、前記検索サーバ1が文書の全文検索及び検索支援において必要とする情報を生成するためのプログラムである。このクローラープログラム111は、例えば定期的に文書共有コンピュータ3にアクセスし、文書共有サービスプログラム310を介して文書共有コンピュータ3上の文書データを取得する。
前記クローラープログラム111は、また、前記検索サーバ1の検索エンジンプログラム112が文書データに対して全文検索を実施するために、収集された文書データの検索インデックスを作成する。検索インデックスとは、一般的に、文書に含まれる単語や文字、文字列の出現箇所を目録として表現したものを指す。特に検索分野においては、検索性能の向上のために、単語や文字、文字列毎に、それが出現する文書と文書内の位置を表現する転置インデックスが用いられる。文書内の単語や文字、文字列の解析においては、例えば形態素解析やN−gram等が用いられる。本実施例において、前記検索インデックスの定義については一般的な公知のものに従う。
また、クローラープログラム111は、文書共有コンピュータ3上で文書データに付与されているアクセス権等のセキュリティ属性情報を文書データと共に収集し、検索サービスプログラム110や検索エンジンプログラム112が文書単位でのアクセス制御を実施する上で利用可能な状態で検索サーバ1内に保存する。さらにクローラープログラム111は、例えば事前に管理者によって定義された分類(例:特徴情報たる文字列ないし記号に関する所定属性)に従って、収集した文書から特徴情報を抽出する。特徴情報の抽出については、例えば辞書を用いた形態素解析や機械学習による固有表現抽出等の公知技術を用いることが可能である。
また、前記検索エンジンプログラム112は、利用者がクライアントコンピュータ2で入力した検索キーワードを用いて文書の全文検索を行うためのプログラムである。この検索エンジンプログラム112は、前記クローラープログラム111が作成した検索インデックスを使用して、利用者が入力した検索キーワードに合致する文書を見つけ出す。検索エンジンプログラム112は、前記検索サービスプログラム110から検索キーワードに基づいた検索クエリを受け取り、全文検索を実施した後、全文検索結果を前記検索サービスプログラム110に返す。
また、前記セキュリティモジュールプログラム113は、前記検索サービスプログラム110が、前記クライアントコンピュータ2の検索クライアントプログラム210に返す検索結果画面において、文書の特徴情報や近傍データの表示可否を判定するためのプログラムである。このセキュリティモジュールプログラム113は、前記検索サービスプログラム110が文書単位でのアクセス制御を実施した後の文書リストに含まれる各文書に対し、利用者が適切な権限を持つ特徴情報を判別・分類・集計し、判別された特徴情報に沿って適切な近傍データを判別し、検索結果画面に表示可能な特徴情報と近傍データを前記検索サービスプログラム110に返す。
すなわち、前記セキュリティモジュールプログラム113は、前記全文検索により特定した文書が含んでいる特徴情報を記憶装置(の特徴情報テーブル115)から抽出し、該当特徴情報に関するアクセス権のデータを記憶装置(の特徴情報アクセス権テーブル116)から読み取り、前記アクセス権のデータがアクセス可を示す特徴情報を開示可特徴情報として特定する。また、前記セキュリティモジュールプログラム113は、前記全文検索により特定した文書の特徴情報を記憶装置(の特徴情報テーブル115)から抽出し、該当特徴情報に関するアクセス権のデータを記憶装置(の特徴情報アクセス権テーブル116)から読み取り、前記アクセス権のデータがアクセス不可を示す特徴情報を開示不可特徴情報として特定する。
また、前記セキュリティモジュールプログラム113は、前記全文検索により特定した文書について記憶装置(の文書単位アクセス制御テーブル114)においてアクセス権のデータを読み取り、前記アクセス権のデータがアクセス可を示す文書を開示可文書として特定し、ここで特定した開示可文書の特徴情報を記憶装置(の特徴情報テーブル115)から抽出し、該当特徴情報に関するアクセス権のデータを記憶装置(の特徴情報アクセス権テーブル116)から読み取り、前記アクセス権のデータがアクセス可を示す特徴情報を開示可特徴情報として特定する。
なお、これまで示した前記情報共有システム10における各プログラム110〜113、210、310、410らは、同様の機能を備えたハードウェア(例:集積回路などの各種電子回路)として実現するとしてもよい。
−−−テーブル構成例−−−
続いて、前記情報共有システム10が利用するテーブルの構造例について説明する。図3は、文書単位アクセス制御テーブル114の一例を示す図である。前記文書単位アクセス制御テーブル114には、文書や文書グループ単位でのアクセス権情報が含まれ、前記検索サービスプログラム110や検索エンジンプログラム112、セキュリティモジュールプログラム113から参照される。本テーブルに含まれるアクセス権情報については、例えば前記クローラープログラム111が、文書あるいは文書グループのアクセス権情報を、前記文書共有コンピュータ3から取得して登録する。また、運用管理者が運用管理コンピュータ4の運用管理プログラム410を利用して本テーブルを登録・修正することも可能である。この場合、運用管理者はさらに、文書をグループに分類し、グループ毎にアクセス権情報を登録することも可能である。本実施例の以降の記載においては、クローラープログラム111が本テーブルにアクセス権情報を登録した例を示す。
続いて、前記情報共有システム10が利用するテーブルの構造例について説明する。図3は、文書単位アクセス制御テーブル114の一例を示す図である。前記文書単位アクセス制御テーブル114には、文書や文書グループ単位でのアクセス権情報が含まれ、前記検索サービスプログラム110や検索エンジンプログラム112、セキュリティモジュールプログラム113から参照される。本テーブルに含まれるアクセス権情報については、例えば前記クローラープログラム111が、文書あるいは文書グループのアクセス権情報を、前記文書共有コンピュータ3から取得して登録する。また、運用管理者が運用管理コンピュータ4の運用管理プログラム410を利用して本テーブルを登録・修正することも可能である。この場合、運用管理者はさらに、文書をグループに分類し、グループ毎にアクセス権情報を登録することも可能である。本実施例の以降の記載においては、クローラープログラム111が本テーブルにアクセス権情報を登録した例を示す。
図3(a)に示す文書単位アクセス制御テーブル114は、文書毎にセキュリティ属性=アクセス権が設定されている例であり、図3(c)に示す文書単位アクセス制御テーブル114は、図3(b)で定義された文書グループ203毎にセキュリティ属性202=アクセス権が設定されている例である。なお、図3(b)に示すように、この文書単位アクセス制御テーブル114には、文書グループ203と各文書グループに含まれる文書のID一覧204との対応表が含まれるとしてよい。さらに図3(d)に示す文書単位アクセス制御テーブル114は、文書グループ203に対して利用者のグループ205毎にセキュリティ属性=アクセス権が設定されている例である。
なお、前記文書単位アクセス制御テーブル114において、文書ID201は、情報共有システム10において文書データを一意に識別するための識別情報である。また、文書セキュリティ属性202は、文書データに付与されたセキュリティ属性情報であり、本実施例においては「開示」、「問合せ要」、「非開示」といったアクセス権を示す。また、文書グループ203は、文書データが所属するグループの識別情報を指す。また、文書ID一覧204は、前記文書グループ203に所属する文書IDを列挙したものである。また、利用者グループ205は、利用者が所属するグループ(企業内での所属部署や職位など)の識別情報を指す。以降、本実施形態における文書単位アクセス制御テーブル114は、図3(a)に示すように文書毎にセキュリティ属性が付与されている例を想定しておく。
図4は、特徴情報テーブル115の一例を示す図である。前記特徴情報テーブル115には、文書データから抽出された当該文章の特徴情報が分類された上で格納される。この特徴情報テーブル115における文書ID301は、情報共有システム10において文書データを一意に識別する識別子である。また、特徴情報302は、文書データから抽出された特徴情報である。また、特徴種別303は、前記特徴情報を分類する指標である。こうした特徴情報テーブル115は、前記検索サービスプログラム110や検索エンジンプログラム112、セキュリティモジュールプログラム113から参照される。本テーブル115に含まれる特徴情報については、前記クローラープログラム111が、文書共有コンピュータ3から文書データを収集して内容を解析し、特徴情報を抽出して登録する。文書データから特徴情報を抽出するための所定属性の情報は、例えば、図8に示す辞書テーブル120を想定できる。この辞書テーブル120は、例えば、運用管理コンピュータ4で運用管理者からの指定を受けた属性を格納したテーブルであり、形態素解析に用いる辞書データを想定できる。この辞書テーブル120は、例えば、特徴情報として抽出すべき地名、人名、組織名、書類名などの単語集を含んでいる。またこの辞書テーブル120は、例えば運用管理者が設定及び編集する形態だけでなく、機械学習によって構築する形態でもよい。また、単語集という形態だけでなく、単語の並びや出現確率を統計的に学習した学習データの形態をとってもよい。
図5は、特徴情報アクセス権テーブル116の一例を示す図である。前記特徴情報アクセス権テーブル116には、文書のセキュリティ属性や、文書あるいは文書グループ、または利用者グループ単位などで、文書データが含む特徴情報に対するアクセス権が定義されたテーブルであり、前記セキュリティモジュールプログラム113から参照される。前記特徴情報はいくつかのグループに分類されてアクセス権が付与されることとなる。このアクセス権の付与に当たっては、例えば、運用管理者が前記運用管理プログラム410を介して本テーブルの定義や修正を行う。
図5(a)に示す特徴情報アクセス権テーブル116は、前記文書セキュリティ属性情報に対して特徴情報のアクセス権が関連付けて設定されている例である。図5(b)に示す特徴情報アクセス権テーブル116は、各文書に対して特徴情報のアクセス権が関連付けて設定されている例である。図5(c)に示す特徴情報アクセス権テーブル116は、文書のグループに対して特徴情報のアクセス権が関連付けて設定されている例である。図5(d)に示す特徴情報アクセス権テーブル116は、文書のグループ毎に、利用者グループに対して特徴情報のアクセス権が関連付けて設定されている例である。
前記特徴情報アクセス権テーブル116において、文書セキュリティ属性401は、文書データに付与されているセキュリティ属性情報を示す。また、特徴情報402は、文書データから抽出した特徴情報のアクセス権を特徴種別403毎に示す。また特徴種別403は、特徴情報402を分類する指標である。また、近傍表示404は、近傍データの表示可否を示す。また、文書ID405は、情報共有システム10において文書データを一意に識別するための識別情報である。、また文書グループ406は、文書データが所属するグループを示す。また、利用者グループ407は、利用者が所属するグループを示す。本実施形態の以降の記載においては、図5(a)に示す特徴情報アクセス権テーブル116のように文書セキュリティ属性401に対して、特徴情報402のアクセス権が関連付けされている例を想定している。
図6は、特徴情報集計テーブル117の一例を示す図である。前記特徴情報集計テーブル117には、クライアントコンピュータ2の出力装置において表示される検索結果画面に表示可能、と判定された特徴情報を特徴情報別に集計しリストアップしたテーブルであり、前記検索サービスプログラム110によって検索結果を生成する際に参照される。検索結果画面に表示可能な特徴情報の判定及び集計については、前記セキュリティモジュールプログラム113が実施する。こうした特徴情報集計テーブル117において、特徴種別501は、特徴情報を分類するグループ(例:人名、組織名、地域名)を示す。また、特徴情報502は、前記特徴種別501に沿って分類・集計された特徴情報(例:人名a、人名b、人名c、会社A、組織D、東京、神奈川、埼玉)を示す。また、カウント503は、特徴情報毎の数を示す。また、文書ID504は、特徴情報毎に、その特徴情報が含まれる文書の識別情報を示す。
図7(a)は、表示不可特徴情報テーブル118の一例を示す図である。前記表示不可特徴情報テーブル118は、前記検索結果画面に表示不可と判定された特徴情報が列挙され、前記セキュリティモジュールプログラム113によって登録・参照されるテーブルである。本実施形態における本テーブルの利用目的においては、本テーブルの内容は利用者による情報検索要求毎に独立である。そのため、利用者による一回の情報検索要求毎に、前記セキュリティモジュールプログラム113が本テーブルの内容は書き換えられるか、本テーブルを情報検索要求毎に複数用意するか、あるいは両者の組み合わせのいずれかの処理を採用する。こうした表示不可特徴情報テーブル118において、文書ID601は、情報共有システム10において文書を一意に識別するための識別情報を示す。また、表示不可特徴情報602は、前記文書ID601で表される文書データに含まれる、検索結果として表示できない特徴情報を示す。
図7(b)は、近傍表示データテーブル119の一例を示す図である。前記近傍表示データテーブル119は、前記検索結果画面に表示可能と判定された近傍データが含まれ、前記検索サービスプログラム110によって検索結果を生成する際に参照される。本テーブルに含まれる近傍データについては、前記セキュリティモジュールプログラム113がデータ登録する。本実施形態における本テーブルの利用目的においては、本テーブルの内容は利用者による情報検索要求毎に独立である。そのため、利用者による一回の情報検索要求毎に前記セキュリティモジュールプログラム113が本テーブルの内容を書き換えるか、本テーブルを検索毎に複数用意するか、あるいは両者の組み合わせのいずれかの処理を採用する。こうした近傍表示データテーブル119において、文書ID701は、情報共有システム10において文書を一意に識別するための識別情報を示す。また、近傍表示データ702は、前記文書ID701で表される文書に含まれる、検索結果に近傍データとして表示可能な文章を示す。
−−−処理フロー例1−−−
以下、本実施形態における情報共有方法の実際手順について、図に基づき説明する。なお、以下で説明する情報共有方法に対応する各種動作は、例えば、前記情報共有システム10を構成する各装置のRAMに読み出して実行するプログラムによって実現される。そして、このプログラムは、以下に説明される各種の動作を行うためのコードから構成されている。
以下、本実施形態における情報共有方法の実際手順について、図に基づき説明する。なお、以下で説明する情報共有方法に対応する各種動作は、例えば、前記情報共有システム10を構成する各装置のRAMに読み出して実行するプログラムによって実現される。そして、このプログラムは、以下に説明される各種の動作を行うためのコードから構成されている。
図9は本実施形態における情報共有方法の処理フロー例1を示す図である。このフロー例は、前記検索サーバ1のクローラープログラム111による文書データの収集、属性情報及び特徴情報の抽出処理手順の一例を示すフローチャートである。ここで前記検索サーバ1のクローラープログラム111は定期的に本処理手順を実施する。実施間隔については、例えば運用管理者が運用管理コンピュータ4を介して検索サーバ1に対し指定する。
当該フローにおいて、前記検索サーバ1のクローラープログラム111は、前記通信インターフェース12を介し、前記文書共有コンピュータ3上の文書共有サービスプログラム310にアクセスする(ステップ1001)。そして、前記クローラープログラム111は、前記文書共有コンピュータ3の記憶装置に格納された文書データを取得する(ステップ1002)。勿論、文書データが文書共有コンピュータ3ではなく、全て検索サーバ1に予め備わっていて、前記クローラープログラム111が検索サーバ1の記憶装置から文書データを取得するとしてもよい。さらに、文書データが文書共有コンピュータ3だけでなく、クライアントコンピュータ2の中にも備わっていて、クローラープログラム111がクライアントコンピュータ2の記憶装置から文書データを取得してもよい。
また前記クローラープログラム111は、前記ステップ1002で取得した文書データを解析し、検索インデックスを作成する(ステップ1003)。前記検索インデックスとは、一般的に、文書に含まれる単語や文字、文字列の出現箇所を目録として表現したものを指す。特に検索分野においては、検索性能の向上のために、単語や文字、文字列毎に、それが出現する文書と文書内の位置を表現する転置インデックスが用いられる。こうした文書内の単語や文字、文字列の解析においては、例えば形態素解析やN−gram等が用いられる。本実施例において、前記検索インデックスの定義については一般的な公知のものに従い、したがって検索インデックスの作成手法も既存のものを採用すればよい。
続いて前記クローラープログラム111は、文書共有コンピュータ3の記憶装置において、各文書データに付与されている文書セキュリティ属性の情報(図3の例では、“開示”、“問い合わせ要”など)を取得し、前記文書単位アクセス制御テーブル114において、該当文書IDないし文書グループに対応付けて登録する(ステップ1004)。
また前記クローラープログラム111は、前記ステップ1002で取得した文書データを解析して特徴情報を抽出し、前記特徴情報テーブル115に格納する(ステップ1005)。この特徴情報の抽出に当たっては、例えば辞書を用いた形態素解析や機械学習等の公知技術によって、人名や地名等のジャンル毎に特徴情報(=文字列や記号等)を分類して抽出する。
−−−処理フロー例2−−−
図10は、本実施形態における情報共有方法の処理フロー例2を示す図である。このフロー例は、本実施形態における、前記検索サービスプログラム110、検索エンジンプログラム112、及びセキュリティモジュールプログラム113による、文書の検索、検索結果生成処理手順の一例を示すフローチャートである。
図10は、本実施形態における情報共有方法の処理フロー例2を示す図である。このフロー例は、本実施形態における、前記検索サービスプログラム110、検索エンジンプログラム112、及びセキュリティモジュールプログラム113による、文書の検索、検索結果生成処理手順の一例を示すフローチャートである。
この場合、前記検索サーバ1の検索サービスプログラム110は、利用者がクライアントコンピュータ2の入力装置で入力した検索キーワードを含む情報検索要求を、前記クライアントコンピュータ2の検索クライアントプログラム210から受け取った際に、本処理手順を実施する。
前記検索サーバ1の検索サービスプログラム110は、前記クライアントコンピュータ2の検索クライアントプログラム210より、検索キーワードを含む情報検索要求を受け取る(ステップ1101)。続いて前記検索サービスプログラム110は、前記ステップ1101において取得した検索キーワードを基に検索クエリを作成し、前記検索エンジンプログラム112に発行する(ステップ1102)。一方、前記検索エンジンプログラム112は、前記検索サービスプログラム110より受け取った検索クエリを基に、前記検索インデックス(図9のステップ1003で作成している)を用いて全文検索を実施する。
また、前記検索サービスプログラム110は、前記検索エンジンプログラム112より全文検索結果を受け取る(ステップ1103)。この全文検索結果は、例えば前記検索キーワードに合致する文字列等を含む文書データのリストを含む。
前記検索サービスプログラム110は、前記ステップ1103で得た全文検索結果たる前記リストのうち最初(リストにおける登録順、文書ID順など)の文書データについて、ステップ1104からステップ1106を実施する。前記検索サービスプログラム110は、前記文書単位アクセス制御テーブル114を参照し、前記最初の文書データを最終的な検索結果に含めるべきかどうかを判断する(ステップ1104)。前記文書単位アクセス制御テーブル114において該当文書データについて、例えば、“開示不可”などと設定されていたならば、前記検索サービスプログラム110は、前記最初の文書データを最終的な検索結果には含めないと判断する。他方、前記文書単位アクセス制御テーブル114において該当文書データについて、例えば、“開示可”ないし“問い合わせ要”などと設定されていたならば、前記検索サービスプログラム110は、前記最初の文書データを最終的な検索結果に含めると判断する。
続いて前記検索サーバ1の検索サービスプログラム110は、前記セキュリティモジュールプログラム113を呼び出す(ステップ1105)。前記セキュリティモジュールプログラム113は、特徴情報処理を実施する。特徴情報処理フローについては、後述する図11において説明する。
また、前記セキュリティモジュールプログラム113は、近傍表示処理を実施する(ステップ1106)。この近傍表示処理については、後述する図12において説明する。
前記検索サービスプログラム110は、前記リスト中に他の文書データの存在を確認することで、前記最初の文書データが全文検索結果に含まれる最後の文書データであるか判定する(ステップ1107)。ここで、前記最初の文書データが全文検索結果に含まれる最後の文書データであった場合(ステップ1107:Yes)、前記検索サービスプログラム110は、クライアントコンピュータ2に返信する最終的な検索結果の生成処理を実施する(ステップ1108)。
一方、前記ステップ1107において、全文検索結果たる前記リストにまだ他の文書データが含まれていると判断した場合(ステップ1107:No)、前記検索サービスプログラム110は、前記リスト中の次の文書データに対して前記ステップ1104からステップ1106を実施する。こうして前記検索サービスプログラム110は、前記リストに含まれる全ての文書データについて前記ステップ1104〜1106を実行する。
前記検索サービスプログラム110は、前記ステップ1104からステップ1107において最終的な検索結果に含めてよいと判定した文書データのリスト、前記特徴情報集計テーブル117、及び近傍表示データテーブル119を基に、図13のような検索結果(画面データ)を生成し、クライアントコンピュータ2の検索クライアントプログラム210に返し(ステップ1108)、処理を終了する。
図13は、本実施例における、前記検索サーバ1の検索サービスプログラム110からクライアントコンピュータ2の検索クライアントプログラム210に返される検索結果画面の一例を示す図である。この検索結果画面801は、前記クライアントコンピュータ2の検索クライアントプログラム210が前記検索サービスプログラム110から得た検索結果たる画面データを出力装置に表示し、利用者に提示する画面となる。この検索結果画面801において、検索結果部位802は、利用者が入力した検索キーワードに対する全文検索結果のうち、文書単位でのアクセス制御によって当該利用者が適切な権限を持つ文書(文書単位アクセス制御テーブル114で文書セキュリティ属性が“開示”、“問い合わせ要”であったもの)のみが列挙されている箇所を示す。また、検索支援部位803は、前記検索結果部位802に表示されている文書に含まれる特徴情報のうち、当該利用者が適切な権限を持つ特徴情報(特徴情報アクセス権テーブル116で開示が“可”であったもの)のみが集計され、前記特徴種別403に従って分類表示されている箇所を示す。
なお、図13(a)に示す検索結果画面801は、前記検索結果部位802が検索結果画面801の上部に、前記検索支援部位803が検索結果画面801の下部に配置される例である。図13(b)に示す検索結果画面801は、前記検索結果部位802と前記検索支援部位803が検索結果画面801の中で横に並んで配置される例である。
−−−処理フロー例3−−−
図11は、本実施形態における情報共有方法の処理手順例3を示す図である。このフローは、前記検索サーバ1のセキュリティモジュールプログラム113による文書データに対する特徴情報処理手順の一例を示すフローチャートである。この場合、前記セキュリティモジュールプログラム113は、前記検索サービスプログラム110によって呼び出され(図10の前記ステップ1105)、本処理手順を実施する。前記セキュリティモジュールプログラム113は、前記文書単位アクセス制御テーブル114を参照し、当該文書データの文書セキュリティ属性の情報として、“開示”、“問い合わせ要”、“開示不可”などの情報を取得する(ステップ1201)。
図11は、本実施形態における情報共有方法の処理手順例3を示す図である。このフローは、前記検索サーバ1のセキュリティモジュールプログラム113による文書データに対する特徴情報処理手順の一例を示すフローチャートである。この場合、前記セキュリティモジュールプログラム113は、前記検索サービスプログラム110によって呼び出され(図10の前記ステップ1105)、本処理手順を実施する。前記セキュリティモジュールプログラム113は、前記文書単位アクセス制御テーブル114を参照し、当該文書データの文書セキュリティ属性の情報として、“開示”、“問い合わせ要”、“開示不可”などの情報を取得する(ステップ1201)。
また、前記セキュリティモジュールプログラム113は、前記特徴情報アクセス権テーブル116を参照して、当該文書データの文書セキュリティ属性(前記ステップ1201で得たもの)に対応する各特徴種別のアクセス権(“可”ないし“不可”)を取得する(ステップ1202)。ここで前記セキュリティモジュールプログラム113は先ず、前記特徴情報テーブル115において当該文書データについて特徴情報が格納されている特徴種別を参照し、ステップ1203からステップ1205を実施する。
ステップ1203において、前記セキュリティモジュールプログラム113は、当該文書データが含む或る特徴種別について、前記ステップ1202で得た特徴種別のアクセス権が“可”である=アクセス可能であるか判定する。この判定処理にて、当該文書データが含む或る特徴種別について、前記ステップ1202で得た特徴種別のアクセス権が“可”である=アクセス可能であると判断した場合(ステップ1203:Yes)、前記セキュリティモジュールプログラム113は、ステップ1204を実施する。一方、当該特徴種別のアクセス権が“不可”=アクセス不可と判断した場合(ステップ1203:No)、前記セキュリティモジュールプログラム113は、ステップ1205を実施する。
ステップ1204において、前記セキュリティモジュールプログラム113は、当該文書データに含まれる前記特徴種別の特徴情報を特徴情報テーブル115から取得し、特徴情報集計テーブル117に登録する。既に当該特徴情報がテーブル115に含まれている場合には、当該特徴情報のカウント503を一つ増加させる。一方、ステップ1205において、前記セキュリティモジュールプログラム113は、当該文書データに含まれる前記特徴種別の特徴情報を特徴情報テーブル115から取得し、前記表示不可特徴情報テーブル118に登録する。
前記セキュリティモジュールプログラム113は、前記ステップ1204ないし1205の実行後、前記特徴情報アクセス権テーブル116を参照し、次の特徴種別の存在を確認し、次の特徴種別が存在しなかった場合(ステップ1206:Yes)、本処理フローを終了する。他方、次の特徴種別が存在する場合(ステップ1206:No)、前記セキュリティモジュールプログラム113は、前記特徴種別についてステップ1203からステップ1205を実施する。
−−−処理フロー例4−−−
図12は、本実施形態における情報共有方法の処理手順例4を示す図である。このフローは、本実施例における、前記セキュリティモジュールプログラム113による近傍表示処理手順の一例を示すフローチャートである。この場合、前記セキュリティモジュールプログラム113は、前記検索サービスプログラム110によって呼び出され(図10の前記ステップ1106)、本処理手順を実施する。
図12は、本実施形態における情報共有方法の処理手順例4を示す図である。このフローは、本実施例における、前記セキュリティモジュールプログラム113による近傍表示処理手順の一例を示すフローチャートである。この場合、前記セキュリティモジュールプログラム113は、前記検索サービスプログラム110によって呼び出され(図10の前記ステップ1106)、本処理手順を実施する。
前記検索サーバ1のセキュリティモジュールプログラム113は、当該文書データの中の前記検索キーワードに合致する文字列ないし記号の周辺文章(例:検索キーワードを含む前後所定文字数の文章)のデータを、前記検索エンジンプログラム112より取得する(ステップ1301)。
続いて前記セキュリティモジュールプログラム113は、前記表示不可特徴情報テーブル118を参照して、該当文書データに関する表示不可特徴情報=表示できない文字列や記号などを取得し、前記周辺文章(前記ステップ1301で取得)の中に当該表示不可特徴情報が含まれるかどうかを検索する(ステップ1302)。
前記ステップ1302の結果として前記表示不可特徴情報が前記周辺文章に含まれると判断された場合(ステップ1303:Yes)、前記セキュリティモジュールプログラム113はステップ1304を実施する。他方、前記表示不可特徴情報が前記周辺文章に含まれないと判断された場合(ステップ1303:No)、前記セキュリティモジュールプログラムはステップ1305を実施する。
前記ステップ1304において、前記セキュリティモジュールプログラム113は、次の周辺文章を前記検索エンジンプログラム112に要求する。検索エンジンプログラム112では、例えば、同一文書内に該検索キーワードに合致する単語が複数ある場合、最初の単語を含む前後10文字の周辺文章、次の単語を含む前後10文字の周辺文章、といった具合に、次々と周辺文書を取得するものとする。
他方、次の周辺文章が無い場合(ステップ1304:Yes)、前記セキュリティモジュールプログラム113はステップ1305を実施する。次の周辺文章がある場合(ステップ1304:No)、前記セキュリティモジュールプログラム113は、次の周辺文章について前記ステップ1301からステップ1303を実施する。
前記ステップ1305において、前記セキュリティモジュールプログラム113は、ステップ1303で、表示不可特徴情報が含まれないと判定した周辺文章を、当該文章データの近傍データとして前記近傍表示データテーブル119に登録する。なお、前記ステップ1301〜1304において、近傍データとして表示可能な周辺文章が見つからなかった場合、前記セキュリティモジュールプログラム113は、近傍データが得られなかった旨を前記近傍表示データテーブル119に登録する。
以上の実施形態によれば、文書データから抽出される特徴情報に対するアクセス権を文書自体のアクセス権に関連付けて制御し、検索サーバ1が特徴情報に対するアクセス権を用いて特徴情報を分類・集計することで、ファセットナビゲーションにおける機密情報漏洩を防止することが可能となる。さらに、特徴情報に対するアクセス権に沿って、特徴情報が近傍表示内容に含まれるかどうかを検索結果生成時に判定することで、近傍の表示/非表示を適切に実施することが可能となる。
−−−他の実施例−−−
以下、情報共有システム10に関する他の実施例について説明する。以下、特に説明の無い箇所は上述の実施例と同じものとする。本実施例は、図5(c)に示した、特徴情報のアクセス権が文書グループ毎に関連付け定義されている特徴情報アクセス権テーブル116を利用する点で上述の実施例とは異なる。またこの場合、情報共有システム10が利用する文書単位アクセス制御テーブル114は、図3(b)及び図3(c)のように、文書グループ毎にセキュリティ属性が付与されている。同様に、特徴情報アクセス権テーブル116も、図5(c)のように、文書グループに対して文書の特徴情報のアクセス権が関連付けされている。
以下、情報共有システム10に関する他の実施例について説明する。以下、特に説明の無い箇所は上述の実施例と同じものとする。本実施例は、図5(c)に示した、特徴情報のアクセス権が文書グループ毎に関連付け定義されている特徴情報アクセス権テーブル116を利用する点で上述の実施例とは異なる。またこの場合、情報共有システム10が利用する文書単位アクセス制御テーブル114は、図3(b)及び図3(c)のように、文書グループ毎にセキュリティ属性が付与されている。同様に、特徴情報アクセス権テーブル116も、図5(c)のように、文書グループに対して文書の特徴情報のアクセス権が関連付けされている。
図14は、他の実施形態における情報共有方法の処理手順例を示す図である。このフローは、本実施例における、セキュリティモジュールプログラム113による文書の特徴情報処理手順の一例を示すフローチャートである。この場合、前記セキュリティモジュールプログラム113は、前記検索サービスプログラム110によって呼び出され、本処理手順を実施する。ステップ2001において、前記セキュリティモジュールプログラム113は、前記文書単位アクセス制御テーブル114を参照し、当該文書データの文書グループを取得する。またステップ2002において、前記セキュリティモジュールプログラム113は、前記特徴情報アクセス権テーブル116を参照して、当該文書データの文書グループに対応する特徴情報アクセス権を取得する。ステップ2003以降の処理手順は上述の実施例における図11のフロー(ステップ1203〜1206に対応)と同じである。
以上、本発明の第二の実施形態によると、文書データから抽出される特徴情報に対するアクセス権を文書のグループに関連付けて制御し、検索サーバ1が特徴情報に対するアクセス権を用いて特徴情報を分類・集計することで、ファセットナビゲーションにおける機密情報漏洩を防止することが可能となる。
本実施形態によれば、きめ細かい機密保持制御とユーザビリティに優れた情報共有制御とをバランス良く両立させることができる。
以上、本発明の実施の形態について、その実施の形態に基づき具体的に説明したが、これに限定されるものではなく、その要旨を逸脱しない範囲で種々変更可能である。
1 検索サーバ
2 クライアントコンピュータ
3 文書共有コンピュータ
4 運用管理コンピュータ
10 情報共有システム
50 通信ネットワーク
110 検索サービスプログラム(検索サービス部)
111 クローラープログラム(クローラー部)
112 検索エンジンプログラム(検索エンジン部)
113 セキュリティモジュールプログラム(セキュリティモジュール部)
114 文書単位アクセス制御テーブル
115 特徴情報テーブル
116 特徴情報アクセス権テーブル
117 特徴情報集計テーブル
118 表示不可特徴情報テーブル
119 近傍表示データテーブル
2 クライアントコンピュータ
3 文書共有コンピュータ
4 運用管理コンピュータ
10 情報共有システム
50 通信ネットワーク
110 検索サービスプログラム(検索サービス部)
111 クローラープログラム(クローラー部)
112 検索エンジンプログラム(検索エンジン部)
113 セキュリティモジュールプログラム(セキュリティモジュール部)
114 文書単位アクセス制御テーブル
115 特徴情報テーブル
116 特徴情報アクセス権テーブル
117 特徴情報集計テーブル
118 表示不可特徴情報テーブル
119 近傍表示データテーブル
Claims (6)
- 文書データと、当該文書データから特徴情報として抽出すべき文字列ないし記号の所定属性のデータと、特徴情報別のアクセス権のデータとを格納した記憶装置と、
前記記憶装置が格納している各文書データから、前記所定属性を持つ文字列ないし記号を特徴情報として抽出し、文書データ毎の前記特徴情報を記憶装置のテーブルに記憶するクローラー部と、
クライアントコンピュータからの情報検索要求を通信装置を介して受信し、前記情報検索要求が示す検索条件に基づいて、前記記憶装置が格納している各文書データでの全文検索を実施する検索エンジン部と、
前記全文検索により特定した文書の特徴情報を前記記憶装置のテーブルから抽出し、該当特徴情報に関するアクセス権のデータを前記記憶装置から読み取り、前記アクセス権のデータがアクセス可を示す特徴情報を開示可特徴情報として特定するセキュリティモジュール部と、
前記全文検索の結果と全文検索結果に含まれる文書の特徴情報のうち前記開示可特徴情報とを併せて検索結果として通信装置を介し前記クライアントコンピュータに送信する、検索サービス部と、
を備える情報共有システム。 - 前記セキュリティモジュール部は、
前記全文検索により特定した文書の特徴情報を前記記憶装置のテーブルから抽出し、該当特徴情報に関するアクセス権のデータを前記記憶装置から読み取り、前記アクセス権のデータがアクセス不可を示す特徴情報を開示不可特徴情報として特定し、
前記検索サービス部は、
前記全文検索結果に含まれる文書毎に、前記情報検索要求が示す検索キーワードに該当する文字列を含む所定範囲の文章であり、前記開示不可特徴情報を含まないものを近傍データとして抽出し、前記全文検索の結果と全文検索結果に含まれる文書の近傍データとを併せて検索結果として通信装置を介し前記クライアントコンピュータに送信する、
ことを特徴とする請求項1に記載の情報共有システム。 - 管理者の端末から、特徴情報の指定と該当特徴情報に関するアクセス権の設定指示とを受け付けて、前記記憶装置における前記特徴情報別のアクセス権を設定する運用管理部を備えることを特徴とする請求項1に記載の情報共有システム。
- 前記記憶装置は、文書データと、当該文書データから特徴情報として抽出すべき文字列ないし記号の所定属性のデータと、文書データ別のアクセス権のデータと、特徴情報別のアクセス権のデータとを格納し、
前記セキュリティモジュール部は、前記全文検索により特定した文書について前記記憶装置においてアクセス権のデータを読み取り、前記アクセス権のデータがアクセス可を示す文書を開示可文書として特定し、ここで特定した開示可文書の特徴情報を前記記憶装置のテーブルから抽出し、該当特徴情報に関するアクセス権のデータを前記記憶装置から読み取り、前記アクセス権のデータがアクセス可を示す特徴情報を開示可特徴情報として特定し、
前記検索サービス部は、前記全文検索の結果と全文検索結果に含まれる前記開示可文書の特徴情報のうち前記開示可特徴情報とを併せて検索結果として通信装置を介し前記クライアントコンピュータに送信する、
ことを特徴とする請求項1に記載の情報共有システム。 - 文書データと、当該文書データから特徴情報として抽出すべき文字列ないし記号の所定属性のデータと、特徴情報別のアクセス権のデータとを格納した記憶装置を備えるコンピュータが、
前記記憶装置が格納している各文書データから、前記所定属性を持つ文字列ないし記号を特徴情報として抽出し、文書データ毎の前記特徴情報を記憶装置のテーブルに記憶する処理と、
クライアントコンピュータからの情報検索要求を通信装置を介して受信し、前記情報検索要求が示す検索条件に基づいて、前記記憶装置が格納している各文書データでの全文検索を実施する処理と、
前記全文検索により特定した文書の特徴情報を前記記憶装置のテーブルから抽出し、該当特徴情報に関するアクセス権のデータを前記記憶装置から読み取り、前記アクセス権のデータがアクセス可を示す特徴情報を開示可特徴情報として特定する処理と、
前記全文検索の結果と全文検索結果に含まれる文書の特徴情報のうち前記開示可特徴情報とを併せて検索結果として通信装置を介し前記クライアントコンピュータに送信する処理と、
を実行する情報共有方法。 - 文書データと、当該文書データから特徴情報として抽出すべき文字列ないし記号の所定属性のデータと、特徴情報別のアクセス権のデータとを格納した記憶装置を備えるコンピュータに、
前記記憶装置が格納している各文書データから、前記所定属性を持つ文字列ないし記号を特徴情報として抽出し、文書データ毎の前記特徴情報を記憶装置のテーブルに記憶する処理と、
クライアントコンピュータからの情報検索要求を通信装置を介して受信し、前記情報検索要求が示す検索条件に基づいて、前記記憶装置が格納している各文書データでの全文検索を実施する処理と、
前記全文検索により特定した文書の特徴情報を前記記憶装置のテーブルから抽出し、該当特徴情報に関するアクセス権のデータを前記記憶装置から読み取り、前記アクセス権のデータがアクセス可を示す特徴情報を開示可特徴情報として特定する処理と、
前記全文検索の結果と全文検索結果に含まれる文書の特徴情報のうち前記開示可特徴情報とを併せて検索結果として通信装置を介し前記クライアントコンピュータに送信する処理と、
を実行させる情報共有プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009125736A JP2010272082A (ja) | 2009-05-25 | 2009-05-25 | 情報共有システム、情報共有方法、および情報共有プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2009125736A JP2010272082A (ja) | 2009-05-25 | 2009-05-25 | 情報共有システム、情報共有方法、および情報共有プログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2010272082A true JP2010272082A (ja) | 2010-12-02 |
Family
ID=43420025
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2009125736A Pending JP2010272082A (ja) | 2009-05-25 | 2009-05-25 | 情報共有システム、情報共有方法、および情報共有プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2010272082A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020262312A1 (ja) * | 2019-06-25 | 2020-12-30 | 株式会社Stroly | 地図表現データ処理装置、対応情報の生産方法、およびプログラム |
-
2009
- 2009-05-25 JP JP2009125736A patent/JP2010272082A/ja active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2020262312A1 (ja) * | 2019-06-25 | 2020-12-30 | 株式会社Stroly | 地図表現データ処理装置、対応情報の生産方法、およびプログラム |
US11928835B2 (en) | 2019-06-25 | 2024-03-12 | Stroly Inc. | Map representation data processing device, information processing method, and program |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11372935B2 (en) | Automatically generating a website specific to an industry | |
US9576005B2 (en) | Search system | |
JP5255055B2 (ja) | クエリ統計プロバイダ | |
US9275024B2 (en) | Identifiers for web font templates | |
KR100525072B1 (ko) | 온톨로지 시스템 | |
Beel et al. | The architecture and datasets of Docear's Research paper recommender system | |
CN106605221A (zh) | 具有用于即时索引的方法的多用户搜索系统 | |
JP2000348041A (ja) | 文書検索方法及びその装置並びにプログラムを記録した機械読み取り可能な記録媒体 | |
US20170109442A1 (en) | Customizing a website string content specific to an industry | |
US11755662B1 (en) | Creating entries in at least one of a personal cache and a personal index | |
US9043328B2 (en) | Configurable catalog builder system | |
US20120046937A1 (en) | Semantic classification of variable data campaign information | |
US8799314B2 (en) | System and method for managing information map | |
CN108470289B (zh) | 基于电商购物平台的虚拟物品发放方法及设备 | |
CN111190965A (zh) | 基于文本数据的即席关系分析系统及方法 | |
WO2019080412A1 (zh) | 数据服务方法、电子装置及存储介质 | |
JP7278100B2 (ja) | 投稿評価システム及び方法 | |
TWI547888B (zh) | A method of recording user information and a search method and a server | |
KR101647596B1 (ko) | 콘텐츠 서비스를 제공하는 방법 및 서버 | |
JP2010272082A (ja) | 情報共有システム、情報共有方法、および情報共有プログラム | |
KR20050109106A (ko) | 통합 검색 결과를 효율적으로 제공하는 검색 서비스 제공방법 및 시스템 | |
JP2013206387A (ja) | データ検索システム及びデータ検索方法 | |
JP2011086156A (ja) | 漏洩情報追跡システムおよび漏洩情報追跡プログラム | |
JP2005208901A (ja) | 情報検索システム、およびプログラム | |
JP2002063170A (ja) | Web検索の規制方法 |