JP3651768B2 - 文書ファイル検索システム - Google Patents

文書ファイル検索システム Download PDF

Info

Publication number
JP3651768B2
JP3651768B2 JP2000146357A JP2000146357A JP3651768B2 JP 3651768 B2 JP3651768 B2 JP 3651768B2 JP 2000146357 A JP2000146357 A JP 2000146357A JP 2000146357 A JP2000146357 A JP 2000146357A JP 3651768 B2 JP3651768 B2 JP 3651768B2
Authority
JP
Japan
Prior art keywords
search
document file
file
document
server
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2000146357A
Other languages
English (en)
Other versions
JP2001325290A (ja
Inventor
憲司 有田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2000146357A priority Critical patent/JP3651768B2/ja
Publication of JP2001325290A publication Critical patent/JP2001325290A/ja
Application granted granted Critical
Publication of JP3651768B2 publication Critical patent/JP3651768B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Medical Treatment And Welfare Office Work (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、ファイルサーバ等に格納されて閲覧対象となる複数の文書ファイルについて、クライアント側から所定の条件に合う文書ファイルを高速に検索して検索結果を取得できる文書ファイル検索システムに関する。
【0002】
【従来の技術】
近年、コンピュータを利用する事業所におけるコンピュータの使用形態としては、複数のコンピュータに特定の役割分担を与えてネットワーク接続するサーバ・クライアント形式のネットワークが一般化している。例えば、各部門にそれぞれ設置したコンピュータをクライアントとしてネットワーク接続すると共に、同じネットワークに接続したファイルサーバに読出しのみ、又は読書き可能な文書ファイルを格納して、各クライアントで共有するといった利用方法が挙げられる。
【0003】
こうした中、特に病院においては、カルテを文書ファイル化してファイルサーバ等の記憶手段に格納し、必要に応じて各部門のクライアントから前記記憶手段に格納されたカルテのファイルを検索して抽出し、クライアントでファイル内容を閲覧可能とする、いわゆる電子カルテ化の動きがある。
こうした電子カルテの場合、検索対象となる文書ファイルは膨大な数(大学病院規模であれば五年間で一千万件超)になると予想されており、実用的な速度で検索するための効率的な検索方法が必要となっている。加えて、病院内ネットワークのクライアント又はインターネット等を介した外部のクライアントでは、検索の結果として抽出した文書ファイルを記憶手段から取得して容易に表示、閲覧できることが求められている。
【0004】
このような病院での電子カルテの事例等をはじめとして、膨大に蓄積された文書ファイルの中から所望の内容を含む文書ファイルを検索する場合、従来は、全文検索システムや、リレーショナルデータベース(以下、RDBと略称)といったファイル検索システムを用いるのが一般的であった。
【0005】
【発明が解決しようとする課題】
従来のファイル検索システムは以上のようなものがあり、このうち、従来前者の全文検索システムは、単純に文書内に該当する文字があるかないかで判断している。この全文検索用のインデックスは、文書構造やタグを意識していないため、文書内容に新たな事項やタグが加わっても設計変更が不要であるという特長を有する。しかし、一般に全文検索では、検索の適合度を判断する場合に字句の登場回数や登場した位置等を使用しているに過ぎない上に、あらかじめ検索対象を絞った検索ができないことで、無駄な処理が多いことに加え、検索精度には限界があり、目的の文書ファイルにたどり着くためには何度も絞り込みを繰返す必要があるなど、検索に時間がかかるという課題を有していた。
【0006】
一方、従来後者のRDBを用いた検索システムは、設計の自由度が高く、あらかじめ特定のデータパターンに適合した検索用インデックスを作成することができる上、検索範囲の制限ができ、高速な検索が期待できるが、スキーマ(データベース仕様)が固定されてしまうために、文書ファイルにデータベース設計時想定したパターン以外のデータを格納することや、こうしたデータ部分を対象として検索することはできず、拡張性に問題があると共に、設計変更も難しいという課題を有していた。
【0007】
また、こうした従来の検索システムにおける問題点の他、膨大に蓄積された文書ファイルの検索においては、膨大な数の検索対象の中から検索の度に文書ファイルの実体を検索していたのでは満足できる高速性は期待できないため、実用的な速度で検索するための効率的な検索用インデックスを設定することが必要となっている。そして、特に電子カルテにおいて、医療技術の進歩や規約の追加・変更による内容追加に伴い、カルテとしての文書ファイルに随時新たな項目の発生する可能性が非常に高い。このため、検索システムとしては、新たな項目が追加されてもプログラムの修正やデータベースの再構築が不要となる柔軟性を有することが求められる。
【0008】
本発明は前記課題を解消するためになされたもので、文書をXMLで記述した拡張性の高い文書ファイルとして格納した上で、LDAPに基づくディレクトリサービスに文書ファイルの内容を検索用のインデックス情報として適切に登録し、クライアント側からLDAPに基づく検索を検索用サーバに実行させて、必要な文書ファイルを効率よく高速に検索できる文書ファイル検索システムを提供することを目的とする。
【0009】
【課題を解決するための手段】
本発明に係る文書ファイル検索システムは、LDAPに基づく所定の検索用ディレクトリサーバと、XMLで記述され、所定のファイルサーバ又は記憶手段に格納されている複数の文書ファイルをそれぞれ読出し、前記検索用ディレクトリサーバに対し、LDAPに基づいてディレクトリにおけるエントリを前記各文書ファイル毎にそれぞれ設定し、且つ、各文書ファイル内に含まれるタグをそれぞれ対応する前記エントリの属性として登録し、さらに前記タグ内の文字列を前記属性の値として登録するLDAP登録手段と、前記検索用ディレクトリサーバにネットワーク接続され、前記検索用ディレクトリサーバにエントリが設定された前記文書ファイルを対象とするLDAPによるファイル検索要求を、利用者の指示に基づいて検索用ディレクトリサーバに与えると共に、検索用ディレクトリサーバで得られた検索結果を受取って利用者に示す検索用クライアントとを備え、前記LDAP登録手段が、前記ファイルサーバ又は記憶手段から読出した前記各文書ファイルにおける所定の複数の文書ファイル間で共通となる所定のタグ及びタグ内の文字列をそれぞれ参照し、前記検索用ディレクトリサーバに対して、前記共通となるタグ及び文字列の差異に応じて前記各文書ファイル毎のエントリを下位エントリとして複数の組に分類する上位のエントリを一又は複数階層設定し、且つ、前記共通となるタグをそれぞれ対応する各上位のエントリの属性として登録し、さらに前記共通となるタグ内の文字列を前記属性の値として登録するものである。
【0010】
このように本発明においては、LDAPを利用する検索用ディレクトリサーバ、この検索用ディレクトリサーバのディレクトリにおけるエントリを前記各文書ファイル毎にそれぞれ設定するLDAP登録手段、並びに、利用者の指示に基づいてファイル検索要求を検索用ディレクトリサーバに与えると共に検索結果を受取って利用者に示す検索用クライアントをそれぞれ配設し、XMLで記述した文書ファイルのタグ及びタグ内の文字列を文書ファイルに対応するエントリにおける属性及び属性の値として登録した上で汎用的なLDAP検索フィルタを用いて検索を行うことにより、それぞれ意味を持つタグ及びタグ内の文字列からなるエントリの属性やその値を検索条件として対象を絞り込んだ検索が容易且つ効率的に行え、検索におけるヒット率を著しく向上させて検索能率を高められ、膨大な文書ファイルの中から目的の内容を含む文書ファイルを高速に検索できる。また、文書ファイルがXMLで記述されていることから、文書ファイルに新たな項目が追加されても、追加部分をLDAP登録手段でそのままタグ及び文字列として認識してエントリにおける属性及び属性の値を単純に追加するのみで済むこととなり、プログラムの修正等を不要にしつつ新規追加項目にも柔軟に対応でき、拡張性に優れる。さらに、LDAP登録手段で各文書ファイル間に共通となる所定のタグ及びタグ内の文字列をそれぞれ参照し、各文書ファイル毎のエントリを下位エントリとして、共通となるタグ及び文字列の差異に応じた複数の組に分ける上位のエントリを設定し、検索用ディレクトリサーバのディレクトリで文書ファイル毎のエントリを文書ファイルの特徴に応じた階層構造にまとめることにより、検索の際の条件に応じた絞り込みが、同じ特徴を有する文書ファイルのエントリを下位に有する上位エントリの属性及びその値を参照することで速やかに行え、検索をさらに効率よく進められ、検索時間をより一層短縮できる。
【0012】
また、本発明に係る文書ファイル検索システムは必要に応じて、前記検索用クライアントが、前記ファイルサーバ又は記憶手段とネットワーク接続され、前記検索結果として取得される文書ファイル名を確認した利用者の指示に基づいて、前記ファイルサーバ又は記憶手段から文書ファイルを転送させて取得すると共に、前記文書ファイルに対応させて設定された所定のスタイルシートを合わせて取得し、XMLブラウザとして前記スタイルシートに基づく表示形式で文書ファイルの内容表示を行うものである。このように本発明においては、検索用クライアントとファイルサーバ又は記憶手段とがネットワーク接続され、利用者の指示で検索用クライアントが先に検索結果として示した文書ファイルをファイルサーバ又は記憶手段からスタイルシートと共に取得し、且つスタイルシートに基づいて文書ファイルの内容を表示して、利用者が文書ファイル内容を閲覧できるようにすることにより、利用者が検索結果として示された文書ファイル名について所定の操作指示を行うと文書ファイルの内容を確認できることとなり、検索から内容閲覧へ進む中で利用者が検索用クライアントに対し対話的に操作指示を行え、使い勝手に優れる。さらに、XMLで記述された文書ファイルをスタイルシートに基づいてどのような環境でも適切に表示することができ、文書ファイルの内容を利用者に容易に理解させられる。
【0013】
また、本発明に係る文書ファイル検索システムは必要に応じて、前記検索用クライアントが、前記ファイルサーバ又は記憶手段とネットワーク接続され、利用者による使用開始時に所定の利用者識別情報の入力を利用者に要求し、前記検索結果として取得される文書ファイル名を確認した利用者の指示に基づいて、前記ファイルサーバ又は記憶手段から文書ファイルを転送させて取得すると共に、前記文書ファイルに対応させて設定された複数のスタイルシートの中から前記利用者識別情報に対応する所定のスタイルシートを選択して前記ファイルサーバ又は記憶手段から転送させて取得し、XMLブラウザとして、取得した前記スタイルシートに基づく表示形式で文書ファイルの内容表示を行うものである。このように本発明においては、検索用クライアントで利用者毎の利用者識別情報を取得し、文書ファイルの内容表示をこの利用者識別情報に対応する所定のスタイルシートに基づいて行い、文書ファイルの内容表示形態を利用者毎に一部又は全て異ならせることにより、利用者の種別によって文書ファイル内容を異なる表示イメージで且つ表示項目も意識的に異ならせて表示できることとなり、様々な利用者に対して同一の文書ファイルで対応しつつ、利用者に応じて閲覧内容を制限可能となり、異なる種類の利用者に対し文書ファイルを複数用意する必要がなく、ファイル管理が著しく容易になる。
【0014】
また、本発明に係る文書ファイル検索システムは必要に応じて、前記文書ファイルにあらかじめ所定の文書種別情報が付加され、前記検索用クライアントが、取得した文書ファイルの前記文書種別情報を参照し、当該文書種別情報に対応する所定のスタイルシートを複数のスタイルシートの中から選択して前記ファイルサーバ又は記憶手段から転送させ、取得した前記スタイルシートに基づいて文書ファイルの内容表示を行うものである。このように本発明においては、検索用クライアントで文書ファイルにおける文書種別情報を取得し、文書ファイルの内容表示をこの文書種別情報に対応する所定のスタイルシートに基づいて行い、文書ファイルの内容表示形態を文書ファイルの種類毎に一部又は全て異ならせることにより、文書ファイルの種別によって文書ファイル内容を異なる表示イメージで且つ表示項目も意識的に異ならせて表示できることとなり、様々な種類の文書ファイルを同一のフォーマットで取扱え、異なる種類の文書ファイルに対しフォーマットを複数用意する必要がなく、文書ファイルの作成・管理が著しく容易になる。
【0015】
【本発明の実施の形態】
以下、本発明の一実施の形態を図1ないし図5に基づいて説明する。本実施の形態はカルテを文書ファイルとしてサーバに格納して利用するいわゆる電子カルテに適用する場合の例を示す。この図1は本実施形態に係る文書ファイル検索システムのブロック図、図2は本実施形態に係る文書ファイル検索システムにおけるエントリ登録状態説明図、図3は本実施形態に係る文書ファイル検索システムのディレクトリ登録処理の前半フローチャート、図4は本実施形態に係る文書ファイル検索システムのディレクトリ登録処理の後半フローチャート、図5は本実施形態に係る文書ファイル検索システムのファイル内容表示処理フローチャートである。
【0016】
前記各図において本実施の形態に係る文書ファイル検索システム1は、XML(EXtensible Markup Language)で記述された複数の文書ファイルを格納・管理するファイルサーバ2と、LDAP(Lightweight Directory Access Protocol)に基づくディレクトリサービスを行う所定の検索用ディレクトリサーバ3と、ファイルサーバ2から文書ファイルを読出し、検索用ディレクトリサーバ3に対しLDAPに基づいてディレクトリにおけるエントリ20を各文書ファイル毎にそれぞれ設定し、且つ、各文書ファイルに応じて前記エントリ20の属性及びこの属性の値を登録するLDAP登録手段4と、ファイルサーバ2及び検索用ディレクトリサーバ3にネットワーク接続され、利用者の指示に基づいてファイル検索要求を検索用ディレクトリサーバ3に与えると共に、検索用ディレクトリサーバ3で得られた検索結果を確認した利用者の指示に基づいて、ファイルサーバ2から文書ファイルを取得し、所定の表示形式で内容表示を行う検索用クライアント5とを備える構成である。
【0017】
前記ファイルサーバ2は、ネットワーク接続された検索用クライアント5とはHTTPに基づいてファイル等の情報の送受信を行う仕組みである。このファイルサーバ2に格納される文書ファイルには、文書内容の種類(カルテ、一般事務文書など)を表す所定のタグ及びこのタグ内の文字列が文書種別情報としてあらかじめ付加されている。また、ファイルサーバ2には、XMLで記述される文書ファイルが実際に表示される際のイメージに含まれる画像や図表等、文書ファイルとは別ファイルとなっている付属情報ファイルも文書ファイルと共に格納しており、文書ファイルを検索用クライアント5に転送する際に一緒に転送する。
【0018】
前記検索用ディレクトリサーバ3は、ネットワーク接続された各クライアントに対し、LDAPに基づいてディレクトリサービスを行う公知のディレクトリサーバであり、検索用クライアント5とはLDAPに基づいて検索指示や検索結果等の情報の送受信を行い、検索用クライアント5に検索機能を提供する一方、LDAP登録手段4からはディレクトリ情報の作成、追加等の操作を受ける仕組みとなっている。
【0019】
前記LDAP登録手段4は、あらかじめファイルサーバ2に格納されている文書ファイルをそれぞれ読出し、検索用ディレクトリサーバ3に対し、LDAPに基づいてディレクトリにおけるエントリ20を前記各文書ファイル毎にそれぞれ設定し、且つ、各文書ファイル内に含まれるタグをそれぞれ対応する前記エントリ20の属性として、また、前記タグ内の文字列を前記属性の値としてそれぞれ登録するものである(図2参照)。このLDAP登録手段4で検索用ディレクトリサーバ3に登録された文書ファイルの各情報が、検索におけるインデックスとなる。
【0020】
前記検索用クライアント5は、利用者の指示に基づいて、検索用ディレクトリサーバ3にエントリ20が設定された前記文書ファイルを対象とするLDAPによるファイル検索要求を検索用ディレクトリサーバ3に与えると共に、検索用ディレクトリサーバ3で得られた検索結果を受取って利用者に示し、さらに文書ファイル名を確認した利用者の指示に基づいて、ファイルサーバ2から文書ファイルを取得すると共に、ファイルサーバ2で文書ファイルに対応させて設定されたスタイルシートを合わせて取得し、このスタイルシートに基づく表示形式で文書ファイルの内容表示を行うものである。
【0021】
この検索用クライアント5は、利用者による使用開始時に所定の利用者識別情報(IDコード等)の入力を利用者に要求し、利用者の入力を経てこの利用者識別情報を取得すると共に、ファイルサーバ2から転送された文書ファイルの文書種別情報としてのタグ及び文字列を参照し、前記利用者識別情報とタグ及び文字列に対応する所定のスタイルシートをファイルサーバ2に用意された複数のスタイルシートの中から選択してファイルサーバ2から検索用クライアント5へ転送させる仕組みとなっている。
【0022】
また、検索用クライアント5で、検索用ディレクトリサーバ3にファイル検索指示を行う前段階としての、利用者による検索条件設定の際のAPIはLDAPの標準機能をそのまま利用している。そして、この検索用クライアント5は、ファイルサーバ2及び検索用ディレクトリサーバ3と直接ネットワーク接続される他に、必要に応じた所定のアクセス制限を伴いつつ、インターネット等の外部のネットワークを介して接続される場合もあり得る。
【0023】
次に、前記構成に基づく文書ファイル検索システムにおけるファイル検索・閲覧処理について説明する。初めに、検索の前段階としてのディレクトリ登録処理を図3及び図4に示すフローチャートに基づいて説明する。前提として、このディレクトリ登録処理に先立ち、検索、閲覧の対象となる全ての文書ファイルが、XMLで記述されるファイル形式とされてファイルサーバ2に格納されているものとする。
【0024】
ディレクトリ登録処理としては、まず、LDAP登録手段4がファイルサーバ2に格納されている文書ファイルの中に、検索用ディレクトリサーバ3にエントリ登録されていないものがあるか否かを判定し(ステップ101)、未登録の文書ファイルがある場合、そのうちの一つをファイルサーバ2から読込む(ステップ102)。
【0025】
この読出した文書ファイルについて、LDAP登録手段4は文書ファイル中のタグを参照してこのタグが以前に一度も参照されておらず、今回が最初の参照であるか否かを判定し(ステップ103)、最初の参照である場合、この参照したタグを取得して所定の記憶手段6に格納する(ステップ104)。さらに、LDAP登録手段4は先に取得したタグに対応する文字列を参照してこの文字列が以前に一度も参照されておらず、今回が最初の参照であるか否かを判定し(ステップ105)、最初の参照である場合、この参照した文字列を取得して前記記憶手段6に格納する(ステップ106)。このステップ106の後、前記ステップ105に戻り、処理を繰返す。前記ステップ105で一つのタグに対応する文字列が全て既に一度は参照・取得されている場合には、前記ステップ103に戻り、以降の処理を繰返す。
【0026】
前記ステップ103で、読出した文書ファイル中のタグが全て参照・取得されている場合、LDAP登録手段4は検索用ディレクトリサーバ3に登録する場合に必須の属性となるタグが記憶手段6に全て格納されていてエントリ登録可能か否かを判定し(ステップ107)、登録可能である場合には、LDAP登録手段4はLDAPに基づいて検索用ディレクトリサーバ3のディレクトリに読出した文書ファイルのエントリ20を登録する(ステップ108)。前記ステップ107で登録可能ではない場合、前記ステップ101に戻り、以降の処理を繰返す。
【0027】
続いて、LDAP登録手段4は、記憶手段6に格納されたタグでこの登録された文書ファイルのエントリ20にまだエントリの属性として登録されていない未登録のタグがあるか否かを判定し(ステップ109)、未登録のタグがある場合、この未登録のタグを属性としてエントリ20に追加する(ステップ110)と共に、記憶手段に格納されている前記タグに対応する文字列をこの属性の値として追加する(ステップ111)。このステップ111の後、前記ステップ109に戻り、処理を繰返す。前記ステップ109で記憶手段6に格納されたタグが全てエントリ20の属性として登録されており未登録のタグが存在しない場合には、前記ステップ101に戻り、以降の処理を繰返す。
【0028】
そして、前記ステップ101で、検索用ディレクトリサーバ3に登録されていない文書ファイルがファイルサーバ2に存在しない場合は、一連の処理を終了する。
こうしてファイルサーバ2に格納されている全ての文書ファイルが検索用ディレクトリサーバ3に検索用インデックス情報としてエントリ20、エントリ20の属性及びその値を登録されている状態で、検索及び文書内容表示処理が行われる。検索処理は、検索用クライアント5からLDAP検索フィルタを発行し、検索用ディレクトリサーバ3が検索結果を導くという公知のLDAPに基づくものであり、簡略な説明にとどめる。
【0029】
この検索においては、利用者が検索用クライアント5に入力手段5aを通じてタグや文字列を組合わせた検索条件を入力し、検索開始を指示すると、検索用クライアント5から検索条件が検索用ディレクトリサーバ3に送られる。この検索用クライアント5からの検索条件に基づいて、検索用ディレクトリサーバ3が、前記LDAP登録手段4により登録された各文書ファイルの検索インデックス情報を参照し、要求された文書ファイル名を抽出して、検索結果を要求する各検索用クライアント5に検索結果としてそれぞれ転送する。なお、検索のために利用者が検索用クライアント5を利用するにあたり、所定の利用者識別情報(IDコード等)を入力して検索用クライアント5にログインする操作が要求される。この時入力された利用者識別情報は検索用クライアント5に一時的に格納される。
【0030】
さらに、文書閲覧のためのファイル内容表示処理を図5に示すフローチャートに基づいて説明する。あらかじめ、検索用クライアント5は検索用ディレクトリサーバ3から転送された検索結果を受取ってこれを所定の表示手段5b上に表示しており、この内容に基づいて利用者により閲覧したい一又は複数の文書ファイルの指示操作が行われる。
【0031】
利用者の操作に基づいて、検索用クライアント5はファイルサーバ2に検索結果として抽出された一又は複数の文書ファイルの転送要求を行い、ファイルサーバ2から転送される文書ファイルを読込む(ステップ201)。読込んだ文書ファイルについて、検索用クライアント5はファイル内に文書種別情報としての文書種別を示すタグがあるか否かを判定し(ステップ202)、タグがある場合には、文書ファイル内の該当するタグ部分の文字列を文書種別の設定値として取得する(ステップ203)。
【0032】
さらに、検索用クライアント5では、取得した文書種別設定値と、先に格納した利用者識別情報とから、この文書ファイルの表示状態を規定するスタイルシートの設定情報を導く(ステップ204)。この設定情報において、文書ファイルに対し特定のスタイルシートの対応付けが設定されているか否かを判定し(ステップ205)、ファイルサーバ2に用意されているいずれかのスタイルシートが対応付けられている場合には、該当するスタイルシートを文書ファイルに対して適用するスタイルシートとして設定し、ファイルサーバ2にこのスタイルシートの転送要求を行う(ステップ206)。
【0033】
前記ステップ202において文書種別を示すタグがない場合、及び、前記ステップ205で特定のスタイルシートが対応付けされていない場合には、デフォルトのスタイルシートを適用するスタイルシートとして設定し、ファイルサーバ2にこのスタイルシートの転送要求を行う(ステップ207)。
前記ステップ206及び207の後、ファイルサーバ2から転送されたスタイルシートを検索用クライアント5が読込み(ステップ208)、検索用クライアント5はスタイルシートに基づいて表示手段5b上に文書ファイルの内容を表示し(ステップ209)、一連の処理を終了する。
【0034】
検索用クライアント5では、ファイルサーバ2から転送されたスタイルシートに基づいて文書ファイルの内容を表示手段5bに表示し、利用者は文書ファイル内容を表示手段5bを通じて閲覧できることから、XMLで記述された文書ファイルをスタイルシートに基づいてどのような環境でも適切に表示することができ、文書ファイルの内容を利用者に容易に理解させられる。加えて、文書ファイルの内容表示を利用者識別情報及び文書種別を示すタグに同時に対応するスタイルシートに基づいて行い、文書ファイルの表示イメージを利用者毎や文書ファイルの種類毎に一部又は全て異ならせて表示できることで、様々な利用者に対して同一の文書ファイルで対応できると共に、様々な種類の文書ファイルを同一のフォーマットで取扱え、文書ファイル内容や文書フォーマットを複数用意する必要がなく、文書ファイルの作成・管理が著しく容易になる。
【0035】
このように、本実施の形態に係る文書ファイル検索システムにおいては、文書ファイルを格納したファイルサーバ2、LDAPを利用する検索用ディレクトリサーバ3、この検索用ディレクトリサーバ3のディレクトリにおけるエントリ20を前記各文書ファイル毎にそれぞれ設定するLDAP登録手段4、並びに、利用者の指示に基づいてファイル検索要求を検索用ディレクトリサーバ3に与えると共に検索結果を受取って利用者に示す検索用クライアント5をそれぞれ配設し、XMLで記述した文書ファイルのタグ及びタグ内の文字列を文書ファイルに対応するエントリ20における属性及び属性の値として登録した上で、汎用的なLDAP検索フィルタを用いて検索を行うことから、タグ及びタグ内の文字列からなるエントリ20の属性やその値を検索条件として対象を絞り込んだ検索が容易且つ効率的に行え、検索におけるヒット率を著しく向上させて検索能率を高められ、膨大な文書ファイルの中から目的の内容を含む文書ファイルを高速に検索できる。また、文書ファイルがXMLで記述されていることから、文書ファイルに新たな項目が追加されても、LDAP登録手段4でそのまま追加部分のタグ及び文字列を認識し、エントリ20における属性及び属性の値として単純に追加するのみで済むこととなり、新規追加項目にも柔軟に対応でき、拡張性に優れる。特に、カルテをXML文書ファイルとすることで、医療技術の進歩や規約の追加・変更による内容追加に伴って随時発生する新たなタグにも対応できる柔軟性を有することとなり、カルテとしての利用に制限等がなく、紙のカルテの代用に留まらず業務の大幅な効率化を実現できる。
【0036】
なお、前記実施の形態に係る文書ファイル検索システムにおいては、カルテを文書ファイルとして検索の対象とする構成としているが、これに限らず、XMLで記述した文書ファイルであれば、カルテ以外の内容でもよく、前記同様検索を行って文書ファイルをファイルサーバ2から検索用クライアント5に転送させ、検索用クライアント5で内容を閲覧できる。また、文書ファイルはファイルサーバ2に全て格納される構成としているが、これに限らず、複数のサーバや記憶手段に分散配置されていてもかまわない。
【0037】
また、前記実施の形態に係る文書ファイル検索システムにおいて、LDAP登録手段4は検索用ディレクトリサーバ3のディレクトリにおけるエントリ20を各文書ファイルにそれぞれ一対一に対応させて設定する構成としているが、これに限らず、図6に示すように、LDAP登録手段4で各文書ファイル間に共通となる所定のタグ(例えば、患者名、書類種別など)及びタグ内の文字列をそれぞれ参照して、各文書ファイル毎のエントリ20を下位エントリとして、共通となるタグ及び文字列の差異に応じた複数の組に分ける上位のエントリ30、40、50を別途設定し、検索用ディレクトリサーバ3のディレクトリで文書ファイル毎のエントリ20を文書ファイルの特徴に応じた階層構造にまとめる構成とすることもでき、検索の際の条件に応じた絞り込みが、同じ特徴を有する文書ファイルのエントリ20を下位に有する上位エントリ30、40、50の属性及びその値を参照することで速やかに行え、検索をさらに効率よく進められ、検索時間をより一層短縮できることとなる。
【0038】
また、前記各実施の形態に係る文書ファイル検索システムにおいては、検索用クライアント5とファイルサーバ2間の文書ファイルの閲覧のための転送をHTTPに基づいて行い、病院等の施設の内、外を意識することなく情報を入手できる構成としているが、これに限らず、病院内など、内部に閉じられたネットワーク内に検索用クライアント5とファイルサーバ2がある場合に、別の通信プロトコルに基づいて文書ファイル等の転送を行う構成とすることもでき、秘匿性などセキュリティ面をより一層強化できる。
【0039】
また、前記実施の形態に係る文書ファイル検索システムにおいては、ファイルサーバ2と検索用ディレクトリサーバ3をそれぞれ個別のサーバとし、各サービスを分散処理させる構成としているが、これに限らず、ファイルサーバ2と検索用ディレクトリサーバ3を統合し、一つのサーバでファイルサービス、検索用ディレクトリサービスの各機能をそれぞれ実施する構成とすることもできる。さらに、LDAP登録手段4についても、ファイルサーバ2又は検索用ディレクトリサーバ3、もしくはこれらを一つに統合したサーバのいずれかにおける一機能として統合する構成とすることもでき、適用するネットワークが各種サービスの分散処理を必要としない小規模の場合にイニシャルコストをより一層低減できる。
【0040】
また、前記実施の形態に係る文書ファイル検索システムにおいては、当初からXMLで記述された文書ファイルをあらかじめファイルサーバ2に格納する構成としているが、これに限らず、図7に示すように、XML形式ではない所定ファイル形式の文書ファイルを格納・管理するメインサーバ7と、このメインサーバ7を所定時間毎に参照して文書ファイルが新たに追加されたか否かを判断するファイル監視手段8と、前記ファイル監視手段8で追加されたと判断された文書ファイルをXML形式に変換するファイル変換手段9とを別途備える構成とし、ファイル検索処理に先立つ準備処理として、あらかじめファイル監視手段8がメインサーバ7に格納されている所定ファイル形式の文書ファイルの作成日時を所定時間毎に参照して、作成日時と参照日時の前後関係によりいずれかの文書ファイルが所定時間前から参照時点までに追加されたか否かを判断し、追加されている場合には、ファイル監視手段8で追加されたと判断された文書ファイルをファイル変換手段9がXMLで記述されたファイル形式に変換し、変換後のXML文書ファイルをファイルサーバ2に新たに格納する仕組みとすることもでき、文書作成者の作成しやすいファイル形式など幅広いファイル形式の文書ファイルに対応できると共に、別のファイル管理システムに文書ファイルの検索・閲覧機能を付加する場合への応用も可能となり、既存システムの検索・閲覧機能強化にも利用できる。
【0041】
【発明の効果】
以上のように本発明によれば、LDAPを利用する検索用ディレクトリサーバ、この検索用ディレクトリサーバのディレクトリにおけるエントリを前記各文書ファイル毎にそれぞれ設定するLDAP登録手段、並びに、利用者の指示に基づいてファイル検索要求を検索用ディレクトリサーバに与えると共に検索結果を受取って利用者に示す検索用クライアントをそれぞれ配設し、XMLで記述した文書ファイルのタグ及びタグ内の文字列を文書ファイルに対応するエントリにおける属性及び属性の値として登録した上で汎用的なLDAP検索フィルタを用いて検索を行うことにより、それぞれ意味を持つタグ及びタグ内の文字列からなるエントリの属性やその値を検索条件として対象を絞り込んだ検索が容易且つ効率的に行え、検索におけるヒット率を著しく向上させて検索能率を高められ、膨大な文書ファイルの中から目的の内容を含む文書ファイルを高速に検索できるという効果を奏する。また、文書ファイルがXMLで記述されていることから、文書ファイルに新たな項目が追加されても、追加部分をLDAP登録手段でそのままタグ及び文字列として認識してエントリにおける属性及び属性の値を単純に追加するのみで済むこととなり、プログラムの修正等を不要にしつつ新規追加項目にも柔軟に対応でき、拡張性に優れるという効果を有する。さらに、LDAP登録手段で各文書ファイル間に共通となる所定のタグ及びタグ内の文字列をそれぞれ参照し、各文書ファイル毎のエントリを下位エントリとして、共通となるタグ及び文字列の差異に応じた複数の組に分ける上位のエントリを設定し、検索用ディレクトリサーバのディレクトリで文書ファイル毎のエントリを文書ファイルの特徴に応じた階層構造にまとめることにより、検索の際の条件に応じた絞り込みが、同じ特徴を有する文書ファイルのエントリを下位に有する上位エントリの属性及びその値を参照することで速やかに行え、検索をさらに効率よく進められ、検索時間をより一層短縮できるという効果を有する。
【0043】
また、本発明によれば、検索用クライアントとファイルサーバ又は記憶手段とがネットワーク接続され、利用者の指示で検索用クライアントが先に検索結果として示した文書ファイルをファイルサーバ又は記憶手段からスタイルシートと共に取得し、且つスタイルシートに基づいて文書ファイルの内容を表示して、利用者が文書ファイル内容を閲覧できるようにすることにより、利用者が検索結果として示された文書ファイル名について所定の操作指示を行うと文書ファイルの内容を確認できることとなり、検索から内容閲覧へ進む中で利用者が検索用クライアントに対し対話的に操作指示を行え、使い勝手に優れるという効果を有する。さらに、XMLで記述された文書ファイルをスタイルシートに基づいてどのような環境でも適切に表示することができ、文書ファイルの内容を利用者に容易に理解させられるという効果を有する。
【0044】
また、本発明によれば、検索用クライアントで利用者毎の利用者識別情報を取得し、文書ファイルの内容表示をこの利用者識別情報に対応する所定のスタイルシートに基づいて行い、文書ファイルの内容表示形態を利用者毎に一部又は全て異ならせることにより、利用者の種別によって文書ファイル内容を異なる表示イメージで且つ表示項目も意識的に異ならせて表示できることとなり、様々な利用者に対して同一の文書ファイルで対応しつつ、利用者に応じて閲覧内容を制限可能となり、異なる種類の利用者に対し文書ファイルを複数用意する必要がなく、ファイル管理が著しく容易になるという効果を有する。
【0045】
また、本発明によれば、検索用クライアントで文書ファイルにおける文書種別情報を取得し、文書ファイルの内容表示をこの文書種別情報に対応する所定のスタイルシートに基づいて行い、文書ファイルの内容表示形態を文書ファイルの種類毎に一部又は全て異ならせることにより、文書ファイルの種別によって文書ファイル内容を異なる表示イメージで且つ表示項目も意識的に異ならせて表示できることとなり、様々な種類の文書ファイルを同一のフォーマットで取扱え、異なる種類の文書ファイルに対しフォーマットを複数用意する必要がなく、文書ファイルの作成・管理が著しく容易になるという効果を有する。
【図面の簡単な説明】
【図1】本発明の一実施形態に係る文書ファイル検索システムのブロック図である。
【図2】本発明の一実施形態に係る文書ファイル検索システムにおけるエントリ登録状態説明図である。
【図3】本発明の一実施形態に係る文書ファイル検索システムのディレクトリ登録処理の前半フローチャートである。
【図4】本発明の一実施形態に係る文書ファイル検索システムのディレクトリ登録処理の後半フローチャートである。
【図5】本発明の一実施形態に係る文書ファイル検索システムのファイル内容表示処理フローチャートである。
【図6】本発明の一実施形態に係る文書ファイル検索システムにおける他のエントリ登録状態説明図である。
【図7】本発明の他の実施形態に係る文書ファイル検索システムのブロック図である。
【符号の説明】
1 文書ファイル検索システム
2 ファイルサーバ
3 検索用ディレクトリサーバ
4 LDAP登録手段
5 検索用クライアント
5a 入力手段
5b 表示手段
6 記憶手段
7 メインサーバ
8 ファイル監視手段
9 ファイル変換手段
20、30、40、50 エントリ

Claims (4)

  1. LDAPに基づく所定の検索用ディレクトリサーバと、
    XMLで記述され、所定のファイルサーバ又は記憶手段に格納されている複数の文書ファイルをそれぞれ読出し、前記検索用ディレクトリサーバに対し、LDAPに基づいてディレクトリにおけるエントリを前記各文書ファイル毎にそれぞれ設定し、且つ、各文書ファイル内に含まれるタグをそれぞれ対応する前記エントリの属性として登録し、さらに前記タグ内の文字列を前記属性の値として登録するLDAP登録手段と、
    前記検索用ディレクトリサーバにネットワーク接続され、前記検索用ディレクトリサーバにエントリが設定された前記文書ファイルを対象とするLDAPによるファイル検索要求を、利用者の指示に基づいて検索用ディレクトリサーバに与えると共に、検索用ディレクトリサーバで得られた検索結果を受取って利用者に示す検索用クライアントとを備え、
    前記LDAP登録手段が、前記ファイルサーバ又は記憶手段から読出した前記各文書ファイルにおける所定の複数の文書ファイル間で共通となる所定のタグ及びタグ内の文字列をそれぞれ参照し、前記検索用ディレクトリサーバに対して、前記共通となるタグ及び文字列の差異に応じて前記各文書ファイル毎のエントリを下位エントリとして複数の組に分類する上位のエントリを一又は複数階層設定し、且つ、前記共通となるタグをそれぞれ対応する各上位のエントリの属性として登録し、さらに前記共通となるタグ内の文字列を前記属性の値として登録することを特徴とする文書ファイル検索システム。
  2. 前記請求項1に記載の文書ファイル検索システムにおいて、
    前記検索用クライアントが、前記ファイルサーバ又は記憶手段とネットワーク接続され、前記検索結果として取得される文書ファイル名を確認した利用者の指示に基づいて、前記ファイルサーバ又は記憶手段から文書ファイルを転送させて取得すると共に、前記文書ファイルに対応させて設定された所定のスタイルシートを合わせて取得し、XMLブラウザとして前記スタイルシートに基づく表示形式で文書ファイルの内容表示を行うことを特徴とする文書ファイル検索システム。
  3. 前記請求項に記載の文書ファイル検索システムにおいて、
    前記検索用クライアントが、前記ファイルサーバ又は記憶手段とネットワーク接続され、利用者による使用開始時に所定の利用者識別情報の入力を利用者に要求し、前記検索結果として取得される文書ファイル名を確認した利用者の指示に基づいて、前記ファイルサーバ又は記憶手段から文書ファイルを転送させて取得すると共に、前記文書ファイルに対応させて設定された複数のスタイルシートの中から前記利用者識別情報に対応する所定のスタイルシートを選択して前記ファイルサーバ又は記憶手段から転送させて取得し、XMLブラウザとして、取得した前記スタイルシートに基づく表示形式で文書ファイルの内容表示を行うことを特徴とする文書ファイル検索システム。
  4. 前記請求項2又は3に記載の文書ファイル検索システムにおいて、
    前記文書ファイルにあらかじめ所定の文書種別情報が付加され、
    前記検索用クライアントが、取得した文書ファイルの前記文書種別情報を参照し、当該文書種別情報に対応する所定のスタイルシートを複数のスタイルシートの中から選択して前記ファイルサーバ又は記憶手段から転送させ、取得した前記スタイルシートに基づいて文書ファイルの内容表示を行うことを特徴とする文書ファイル検索システム。
JP2000146357A 2000-05-18 2000-05-18 文書ファイル検索システム Expired - Fee Related JP3651768B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000146357A JP3651768B2 (ja) 2000-05-18 2000-05-18 文書ファイル検索システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000146357A JP3651768B2 (ja) 2000-05-18 2000-05-18 文書ファイル検索システム

Publications (2)

Publication Number Publication Date
JP2001325290A JP2001325290A (ja) 2001-11-22
JP3651768B2 true JP3651768B2 (ja) 2005-05-25

Family

ID=18652731

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000146357A Expired - Fee Related JP3651768B2 (ja) 2000-05-18 2000-05-18 文書ファイル検索システム

Country Status (1)

Country Link
JP (1) JP3651768B2 (ja)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100484138B1 (ko) * 2002-05-08 2005-04-18 삼성전자주식회사 관계형 데이터베이스에서 정규 경로식 질의를 처리하는xml 인덱싱 방법과 자료구조
JP4365162B2 (ja) 2003-08-20 2009-11-18 富士通株式会社 構造化文書のデータを検索する装置および方法
JP4952119B2 (ja) * 2006-08-02 2012-06-13 日本電気株式会社 ファイルサーバを用いたコンテンツ管理システムと方法およびプログラム
US10614915B2 (en) 2010-09-01 2020-04-07 Apixio, Inc. Systems and methods for determination of patient true state for risk management
US20130262144A1 (en) 2010-09-01 2013-10-03 Imran N. Chaudhri Systems and Methods for Patient Retention in Network Through Referral Analytics
US11538561B2 (en) 2010-09-01 2022-12-27 Apixio, Inc. Systems and methods for medical information data warehouse management
US11955238B2 (en) 2010-09-01 2024-04-09 Apixio, Llc Systems and methods for determination of patient true state for personalized medicine
US10629303B2 (en) 2010-09-01 2020-04-21 Apixio, Inc. Systems and methods for determination of patient true state for personalized medicine
US11694239B2 (en) 2010-09-01 2023-07-04 Apixio, Inc. Method of optimizing patient-related outcomes
US10580520B2 (en) 2010-09-01 2020-03-03 Apixio, Inc. Systems and methods for customized annotation of medical information
US11481411B2 (en) 2010-09-01 2022-10-25 Apixio, Inc. Systems and methods for automated generation classifiers
US11544652B2 (en) 2010-09-01 2023-01-03 Apixio, Inc. Systems and methods for enhancing workflow efficiency in a healthcare management system
US11971911B2 (en) 2010-09-01 2024-04-30 Apixio, Llc Systems and methods for customized annotation of medical information
US12009093B2 (en) 2010-09-01 2024-06-11 Apixio, Llc Systems and methods for determination of patient true state for risk management
JP2013537326A (ja) * 2011-08-31 2013-09-30 アピシオ,インク. 医療情報ナビゲーションエンジン(mine)システム
CN111125016A (zh) * 2019-12-24 2020-05-08 普世(南京)智能科技有限公司 一种基于标签组织的磁光混合文件存储方法及系统

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0744447A (ja) * 1993-07-28 1995-02-14 Fujitsu Ltd ハイパーテキストシステム
JP4042830B2 (ja) * 1998-05-12 2008-02-06 日本電信電話株式会社 コンテンツ属性情報正規化方法、情報収集・サービス提供システム、並びにプログラム格納記録媒体

Also Published As

Publication number Publication date
JP2001325290A (ja) 2001-11-22

Similar Documents

Publication Publication Date Title
JP3651768B2 (ja) 文書ファイル検索システム
Arms et al. An architecture for information in digital libraries
CA2636429C (en) Presenting digitized content on a network
CA2410747C (en) System and method for saving browsed data
US8200704B2 (en) Searching structured data
CN106605221A (zh) 具有用于即时索引的方法的多用户搜索系统
JP2001056810A (ja) データベースアクセスシステム
JP2009020901A (ja) データベースシステム、データベース検索方法及び記録媒体
JP2010134963A (ja) 文書に付与されたプロパティを用いたサ―ビスの起動方法
JP2000194612A (ja) 電子デ―タの内容を無線装置用に変換する方法およびシステム
JPH11213014A (ja) データベースシステム、データベース検索方法及び記録媒体
WO2008041367A1 (fr) Dispositif de recherche de document, procédé de recherche de document et programme de recherche de document
JP4333184B2 (ja) 電子データ管理システム
JP3998794B2 (ja) ブラウジングクライアントサーバーシステム
JP2004206492A (ja) ドキュメント表示方法およびそれを用いたリンク先選択機能付ゲートウェイ装置
JP3786233B2 (ja) 情報検索方法および情報検索システム
US7953761B2 (en) System, method, and apparatus for retrieving structured document and apparatus for managing structured document
WO2007046446A1 (ja) データ管理装置及び端末装置
JP2000172680A (ja) 文書登録システム、文書登録方法、その方法を実行させるための記録媒体、文書閲覧システム、文書閲覧方法、その方法を実行させるための記録媒体および文書取出しシステム
JP2004139210A (ja) 画像検索装置
JPH07219835A (ja) 分散ハイパーテキスト装置
US20080270409A1 (en) Data, Structure, Structured Data Management System, Structured Data Management Method and Structured Data Management Program
JP4623446B2 (ja) データ管理プログラムおよびデータ管理システム
JP2001084169A (ja) 文書データベースアクセス装置
JP2005011175A (ja) リンク情報配送システムおよびリンク情報配送方法

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040714

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040908

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20041027

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20041222

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20050217

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20050217

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080304

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090304

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100304

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100304

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110304

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110304

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120304

Year of fee payment: 7

LAPS Cancellation because of no payment of annual fees