JP2017062618A

JP2017062618A - プログラム、情報処理装置及び情報処理方法

Info

Publication number: JP2017062618A
Application number: JP2015187293A
Authority: JP
Inventors: 江朗勝田; Tadaaki Katsuta
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 2015-09-24
Filing date: 2015-09-24
Publication date: 2017-03-30
Anticipated expiration: 2035-09-24
Also published as: JP6631122B2

Abstract

【課題】容易に検索を実行することが可能となるプログラム等を提供する。【解決手段】コンピュータに、文書ファイルに含まれるテキスト情報の形態素解析を行い、前記テキスト情報に含まれる単語間の係受け構造を複数抽出し、複数抽出した前記係受け構造の内の所定の頻度条件を満たす係受け構造を特定し、特定した係受け構造と前記文書ファイルとを関連付けて記憶部に記憶する処理を実行させる。コンピュータに、所定の係受け構造の指定を受け付け、記憶部を参照して、受け付けた前記所定の係受け構造に合致する文書ファイルを抽出する処理を実行させる。【選択図】図２

Description

本発明は、プログラム、情報処理装置及び情報処理方法に関する。

従来、複数種類の医療データがそれぞれ蓄積された複数のデータベースを備える医療情報システムに対する検索技術が知られている（例えば特許文献１〜３参照）。

特開２０１１−１２３７９４号公報特開２０１４−２４１１７３号公報特開２０１１−１４７５９３号公報

しかしながら、従来の技術ではデータベースの構築負担が大きいという問題がある。

一つの側面では、容易に検索を実行することが可能となるプログラム等を提供することを目的とする。

一つの案では、コンピュータに、文書ファイルに含まれるテキスト情報の形態素解析を行い、前記テキスト情報に含まれる単語間の係受け構造を複数抽出し、複数抽出した前記係受け構造の内の所定の頻度条件を満たす係受け構造を特定し、特定した係受け構造と前記文書ファイルとを関連付けて記憶部に記憶する処理を実行させる。

一つの側面では、容易に検索を実行することが可能となる。

情報処理システムの概要を示す説明図である。処理概要を示す説明図である。コンピュータのハードウェア群を示すブロック図である。サーバコンピュータのハードウェア群を示すブロック図である。カルテＤＢのレコードレイアウトを示す説明図である。評価ＤＢのレコードレイアウトを示す説明図である。ＲＤＦグラフを示す説明図である。対応ＤＢのレコードレイアウトを示す説明図である。係受け構造を示すＲＤＦグラフである。対応関係の生成処理手順を示すフローチャートである。係受け構造の入力イメージを示す説明図である。検索イメージを示す説明図である。カルテの抽出処理手順を示すフローチャートである。対応ＤＢのレコードレイアウトを示す説明図である。対応関係の生成処理手順を示すフローチャートである。カルテのソート手順を示すフローチャートである。カルテのソート手順を示すフローチャートである。検索結果のイメージを示す説明図である。上述した形態のサーバコンピュータの動作を示す機能ブロック図である。実施の形態４に係るサーバコンピュータのハードウェア群を示すブロック図である。

実施の形態１
以下実施の形態を、図面を参照して説明する。図１は情報処理システムの概要を示す説明図である。情報処理システムは情報処理装置１、及び、端末装置２等を含む。情報処理装置１は、サーバコンピュータ、パーソナルコンピュータ、ＰＤＡ（Personal Digital Assistant）、またはスマートフォン等である。以下、情報処理装置１をサーバコンピュータ１という。端末装置２は、パーソナルコンピュータ、ＰＤＡ、またはスマートフォン等である。以下では端末装置２をコンピュータ２という。サーバコンピュータ１及びコンピュータ２はインターネット、公衆電話網、ＬＡＮ(Local Area Network)等の通信網Ｎを介して相互に接続されている。

コンピュータ２において、ユーザはテキスト情報が含まれる文書ファイルを生成する。生成された文書ファイルはサーバコンピュータ１へ送信される。複数の文書ファイルはサーバに記憶される。ユーザはコンピュータ２を用いて蓄積された文書ファイルの検索を行う。検索要求はコンピュータ２からサーバコンピュータ１へ送信される。サーバコンピュータ１は後述する処理により文書ファイルを分析し、検索結果をコンピュータ２へ送信する。以下詳細を説明する。

図２は処理概要を示す説明図である。以下では文書ファイルを医療用のカルテであるものとして説明する。なお、カルテは一例でありこれに限るものではない。例えば、カルテに代えてブログ、マニュアル、人事評価、学生の評価、クレーム対応を行うオペレータのメモ、自動車または電機製品の修理履歴メモなどであっても良い。また以下では、カルテをテキストファイルであるものとして説明するが、図面、写真または動画等のテキスト以外のデータを含んでも良い。コンピュータ２はＮ人分のカルテをサーバコンピュータ１へ送信する。

図３はコンピュータ２のハードウェア群を示すブロック図である。図４はサーバコンピュータ１のハードウェア群を示すブロック図である。コンピュータ２は制御部としてのＣＰＵ（Central Processing Unit）２１、ＲＡＭ（Random Access Memory）２２、入力部２３、表示部２４、記憶部２５及び通信部２６等を含む。ＣＰＵ２１は、バス２７を介してハードウェア各部と接続されている。ＣＰＵ２１は記憶部２５に記憶された制御プログラム２５Ｐに従いハードウェア各部を制御する。ＲＡＭ２２は例えばＳＲＡＭ（Static RAM）、ＤＲＡＭ(Dynamic RAM)、フラッシュメモリ等である。ＲＡＭ２２は、記憶部としても機能し、ＣＰＵ２１による各種プログラムの実行時に発生する種々のデータを一時的に記憶する。

入力部２３はマウスまたはキーボード、マウスまたはタッチパネル等の入力デバイスであり、受け付けた操作情報をＣＰＵ２１へ出力する。表示部２４は液晶ディスプレイまたは有機ＥＬ（electroluminescence）ディスプレイ等であり、ＣＰＵ２１の指示に従い各種情報を表示する。通信部２６は通信モジュールであり、サーバコンピュータ１等と情報の送受信を行う。

サーバコンピュータ１は制御部としてのＣＰＵ１１、ＲＡＭ１２、入力部１３、表示部１４、記憶部１５及び通信部１６等を含む。ＣＰＵ１１は、バス１７を介してハードウェア各部と接続されている。ＣＰＵ１１は記憶部１５に記憶された制御プログラム１５Ｐに従いハードウェア各部を制御する。ＲＡＭ１２は例えばＳＲＡＭ、ＤＲＡＭ、フラッシュメモリ等である。ＲＡＭ１２は、記憶部としても機能し、ＣＰＵ１１による各種プログラムの実行時に発生する種々のデータを一時的に記憶する。

入力部１３はマウスまたはキーボード、マウスまたはタッチパネル等の入力デバイスであり、受け付けた操作情報をＣＰＵ１１へ出力する。表示部１４は液晶ディスプレイまたは有機ＥＬディスプレイ等であり、ＣＰＵ１１の指示に従い各種情報を表示する。通信部１６は通信モジュールであり、コンピュータ２等と情報の送受信を行う。

記憶部１５はハードディスクまたは大容量メモリであり、制御プログラム１５Ｐ、カルテデータベース（以下、ＤＢという）１５１、評価ＤＢ１５２、及び、対応ＤＢ１５３等を含む。実施形態ではカルテＤＢ１５１等を記憶部１５に記憶する例を挙げたが、これに限るものではない。ＲＡＭ１２に記憶するほか、図示しない他のＤＢサーバ内に記憶するようにしても良い。

図２に戻り処理概要を説明する。サーバコンピュータ１のＣＰＵ１１は、カルテ内のテキストに対し形態素解析を行い、複数の単語を抽出する。例えば、腫瘍部、胃内視鏡検査、生検等の単語が抽出される。形態素解析には、医療用の辞書であるComejisyo及び形態素解析エンジンであるMecab等を用いればよい。続いてＣＰＵ１１は、形態素解析結果に基づき、単語間の係受け構造の抽出を行う。図２の例では、係受け構造として、係受け元の単語Ａ、係受け先の単語Ｂ、及び、係受けの方向（ＡからＢへの方向）が示されている。例えばＡは胃内視鏡検査であり、Ｂは生検である。係受け構造の抽出は、係受け解析エンジンであるcabocha等を用いればよい。

続いてＣＰＵ１１は、抽出した複数の係受け構造に対し、統計的評価を行う。具体的には同一種の係受け構造の数をそれぞれ計数し、所定の頻度条件を満たす係受け構造を特定する。頻度条件は計数値が所定の閾値を超えること、または、所定の割合を超えることを条件とすればよい。本実施形態では一例として係受け構造の計数した値が閾値を超える係受け構造を特定するものとして説明する。

ＣＰＵ１１は、特定した係受け構造に対し、係受け構造を示す識別情報（以下、対応ＩＤという）を付与する。具体的には、係受け構造に対し、Apache Jena等を用いて、ＲＤＦ（Resource Description Framework）により記述する。図２の例では単語Ａから単語Ｂへの方向を示す係受け構造の対応ＩＤは、Ｐ：００１である。また単語Ｂから単語Ｈへの方向を示す係受け構造の対応ＩＤは、Ｐ：００２である。また単語Ａ、単語Ｂ、単語Ｈ、単語Ｉ及び単語Ｊの係受け構造は図２に示すように、ＲＤＦグラフで表すことができる。

ＣＰＵ１１は、特定した係受け構造と、対応ＩＤとの組み合わせを、カルテＩＤに対応付けて記憶する。その後、ＣＰＵ１１は、次のカルテに対し同様の処理を行う。図５はカルテＤＢ１５１のレコードレイアウトを示す説明図である。カルテＤＢ１５１は、カルテＩＤフィールド、患者名フィールド、及びテキスト文フィールドを含む。カルテＩＤフィールドにはカルテＩＤが記憶されている。なお、カルテＩＤにかえて患者を特定する患者ＩＤを記憶してもよい。患者名フィールドには、カルテの記載対象となった患者の患者名が記憶されている。テキスト文フィールドには、カルテＩＤに対応付けてテキスト文が記憶されている。

コンピュータ２のＣＰＵ２１は、医師等が入力したテキスト文を入力部２３から受け付ける。ＣＰＵ２１は、テキスト文を含むカルテ、カルテＩＤ及び患者名をサーバコンピュータ１へ送信する。サーバコンピュータ１のＣＰＵ１１は、受信したカルテＩＤ、患者名及びテキスト文をカルテＤＢ１５１に記憶する。ＣＰＵ１１は、上述した方法により、形態素解析及び係受け構造の分析を行う。

図６は評価ＤＢ１５２のレコードレイアウトを示す説明図である。評価ＤＢ１５２は、対応ＩＤフィールド、第１キーワードフィールド、第１キーワードＩＤフィールド、第２キーワードフィールド、第２キーワードＩＤフィールド及び出現頻度フィールド等を含む。対応ＩＤフィールドには、係受け構造を特定するための固有の対応ＩＤが記憶されている。第１キーワードフィールドには、対応ＩＤに対応付けて係受け元の第１キーワードが記憶されている。また第１キーワードＩＤフィールドには、第１キーワードを特定するための識別情報（以下、第１キーワードＩＤ）が、第１キーワードに対応付けて記憶されている。

第２キーワードフィールドには、対応ＩＤに対応付けて係受け先の第２キーワードが記憶されている。また第２キーワードＩＤフィールドには、第２キーワードを特定するための識別情報（以下、第２キーワードＩＤ）が、第２キーワードに対応付けて記憶されている。図６の例では、対応ＩＤ「Ｃ０００２１」に対応付けて、第１キーワードＩＤ（Ｋ００００８）、第１キーワード「腫瘍部」、第２キーワードＩＤ（Ｋ００００２）、第２キーワード「生検」が記憶されている。出現頻度フィールドには、対応ＩＤに対応付けて、同一係受け構造がテキスト文中に存在した頻度を記憶している。

ＣＰＵ１１は、同一構造を持つ係受け構造を計数し、計数した値を出現頻度フィールドに記憶する。ＣＰＵ１１は、記憶部１５に記憶した閾値を読み出す。ＣＰＵ１１は、閾値以上の出現頻度を有する係受け構造を、評価ＤＢ１５２に記憶する。図６の例では、カルテＩＤ００１について、出現頻度が２以上の係受け構造のみを評価ＤＢ１５２に記憶している。ＣＰＵ１１は、同様の処理を他のカルテＩＤに係るカルテに対し実行し、評価ＤＢ１５２に記憶する。なお、閾値は入力部１３からオペレータが適宜の値を設定することができる。

ＣＰＵ１１は、評価ＩＤ１５２の記憶内容をＲＤＦにて記述し、記述した内容を記憶部１５に記憶する。図７は、ＲＤＦグラフを示す説明図である。図７の例では、第１キーワード「５−ＦＵ」が第２キーワード「回復不良」、第２キーワード「回復良好」、及び、第２キーワード「投薬後」に係受けしていることが理解できる。

図８は対応ＤＢ１５３のレコードレイアウトを示す説明図である。対応ＤＢ１５３はカルテＩＤと対応ＩＤとの組み合わせが存在するか否かの情報を記憶している。図８の例では、「１」が、組み合わせが存在することを示し、「０」が、組み合わせが存在しないことを示す。例えば、カルテＩＤ「００１」と対応ＩＤ「Ｐ：００１」とは組み合わせが存在する。一方、カルテＩＤ「００１」と対応ＩＤ「Ｐ：００２」とは組み合わせが存在しない。ＣＰＵ１１は、評価ＤＢ１５２を参照し、係受け構造の対応ＩＤを抽出する。ＣＰＵ１１は、抽出した対応ＩＤと、カルテＩＤとを対応付けて対応ＤＢ１５３に記憶する。

ＣＰＵ１１は、以上の処理を他のカルテＩＤに対しても同様に行う。図８の例では、カルテＩＤ「００２」、「００３」等についても同様の処理が行われていることが理解できる。図９は、係受け構造を示すＲＤＦグラフである。ＣＰＵ１１は、全てのカルテに対する評価ＤＢ１５２を参照し、ＲＤＦにて記述する。これにより、係受け元を「びまん腫瘍型」、係受け先を「スキルス胃癌」とする係受け構造を検索した場合、対応ＩＤは「Ｐ：００１」となる。ＣＰＵ１１は、対応ＤＢ１５３を参照し、対応ＩＤは「Ｐ：００１」が記憶されているカルテＩＤ「００１」、「００３」、「００４」、「００５」を抽出する。またＣＰＵ１１は、カルテＤＢ１５１を参照し、抽出したカルテＩＤに対応する患者名を出力する。以上のハードウェア群において、各ソフトウェア処理を、フローチャートを用いて説明する。

図１０は対応関係の生成処理手順を示すフローチャートである。ＣＰＵ１１は、カルテ及びカルテＩＤをカルテＤＢ１５１から抽出する（ステップＳ１０１）。ＣＰＵ１１は、形態素解析により単語を抽出する（ステップＳ１０２）。ＣＰＵ１１は、係受け構造解析により、抽出した単語の係受け構造を特定する（ステップＳ１０３）。ＣＰＵ１１は、各係受け構造の出現頻度を計数する（ステップＳ１０４）。

ＣＰＵ１１は、記憶部１５から閾値を読み出す（ステップＳ１０５）。ＣＰＵ１１は、閾値以上の出現頻度を有する係受け構造、対応ＩＤ及び出現頻度を、カルテＩＤに対応付けて評価ＤＢ１５２に記憶する（ステップＳ１０６）。ＣＰＵ１１は、評価ＤＢ１５２をＲＤＦで記述し、記述した内容を記憶部１５に記憶する（ステップＳ１０７）。ＣＰＵ１１は、対応ＩＤとカルテＩＤとを対応付けて対応ＤＢ１５３に記憶する（ステップＳ１０８）。

ＣＰＵ１１は、全てのカルテに対し処理を終了したか否かを判断する（ステップＳ１０９）。ＣＰＵ１１は、処理を終了していないと判断した場合（ステップＳ１０９でＮＯ）、処理をステップＳ１０１０へ移行させる。ＣＰＵ１１は、未処理のカルテ及びカルテＩＤを、カルテＤＢ１５１から抽出する（ステップＳ１０１０）。ＣＰＵ１１は、処理をステップＳ１０２に戻す。以上の処理を繰り返すことにより、各カルテの係受け構造が特定される。ＣＰＵ１１は、全てのカルテに対し処理を終了したと判断した場合（ステップＳ１０９でＹＥＳ）、一連の処理を終了する。これにより、テキスト構造を維持したまま容易に検索を実行することが可能となる。また、出現頻度を考慮しているため、カルテ内のノイズを排除することが可能となる。

実施の形態２
実施の形態２は、検索を実行する形態に関する。図１１は係受け構造の入力イメージを示す説明図である。コンピュータ２はサーバコンピュータ１へアクセスし、図１１に示す入力画面をダウンロードする。コンピュータ２のＣＰＵ２１は、通信部２６で受信した入力画面を、ブラウザ等により、表示部２４に表示する。ＣＰＵ２１は、表示部２４に、係受け元の単語を入力するための第１ボックス２４１、係受け先の単語を入力するための第２ボックス２４２、及び検索ボタン２４３等を表示する。

ユーザは入力部２３から第１ボックス２４１に係受け元の単語を入力し、第２ボックス２４２に係受け先の単語を入力する。ＣＰＵ２１は、検索ボタン２４３が入力部２３を介して入力された場合、第１ボックス２４１に入力された係受け元の単語と、第２ボックス２４２に入力された係受け先の単語とを、サーバコンピュータ１へ送信する。サーバコンピュータ１は、係受け元の単語及び係受け先の単語を受け付ける。

ＣＰＵ１１は、記憶部１５に記憶したＲＤＦで記述されたデータを、コンピュータ言語であるSPARQL等を用いて、受け付けた係受け元の単語及び係受け先の単語に対応する対応ＩＤを抽出する。

図１２は検索イメージを示す説明図である。ＣＰＵ１１は、対応ＤＢ１５３を参照し、対応ＩＤを有するカルテＩＤを抽出する。例えば、係受け元の単語が「びまん腫瘍型」、係受け先の単語が「回復良好」の場合、対応ＩＤは順に「Ｐ：００１」、「Ｐ：００５」、「Ｐ：００３」となる。ＣＰＵ１１は、対応ＤＢ１５３を参照し、対応ＩＤを全て有するカルテＩＤを抽出する。図１２の例では、カルテＩＤ「００１」、「００４」及び「００５」が抽出される。なお、本実施形態ではコンピュータ２の入力部１３を用いて検索を行う例を示すが、これに限るものではない。コンピュータ２を用いることなく、サーバコンピュータ１の入力部１３を通じて検索を行っても良い。

図１３はカルテの抽出処理手順を示すフローチャートである。ＣＰＵ２１は、第１ボックス２４１に入力された係受け元の単語を受け付ける（ステップＳ１３１）。ＣＰＵ２１は、第２ボックス２４２に入力された係受け先の単語を受け付ける（ステップＳ１３２）。ＣＰＵ２１は、受け付けた係受け元の単語及び係受け先の単語を、通信部２６を介してサーバコンピュータ１へ送信する（ステップＳ１３３）。サーバコンピュータ１のＣＰＵ１１は、係受け元の単語及び係受け先の単語を、通信部１６を介して受信する（ステップＳ１３４）。

ＣＰＵ１１は、ＲＤＦで記述された記憶部１５に記憶されたデータを参照し、係受け元の単語及び係受け先の単語に合致する対応ＩＤを抽出する（ステップＳ１３５）。ＣＰＵ１１は、対応ＤＢ１５３を参照し、抽出した対応ＩＤを全て有するカルテＩＤを抽出する（ステップＳ１３６）。ＣＰＵ１１は、カルテＤＢ１５１を参照し、カルテＩＤに対応する患者名を抽出する（ステップＳ１３７）。ＣＰＵ１１は、カルテＩＤ及び患者名を、コンピュータ２へ送信する（ステップＳ１３８）。

ＣＰＵ２１は、カルテＩＤ及び患者名を受信する（ステップＳ１３９）。ＣＰＵ２１は、カルテＩＤ及び患者名を、検索結果として表示部２４に表示する（ステップＳ１３１０）。これにより、精度良く、関連性のあるカルテ及び患者名を抽出することが可能となる。

本実施の形態２は以上の如きであり、その他は実施の形態１と同様であるので、対応する部分には同一の参照番号を付してその詳細な説明を省略する。

実施の形態３
実施の形態３は対象となった係受け構造の頻度に応じて検索結果の表示を変化させる形態に関する。図１４は対応ＤＢ１５３のレコードレイアウトを示す説明図である。ＣＰＵ１１は、対応ＩＤ及びカルテＩＤを対応ＤＢ１５３に記憶する場合、評価ＤＢ１５２に記憶した頻度の情報をも併せて記憶する。本実施形態では５回以上の頻度を有する対応ＩＤを高、３回または４回の頻度を有する対応ＩＤを中、２回の頻度を有する対応ＩＤを低としている。図１４の例では、カルテＩＤ「００１」について、対応ＩＤ「Ｐ：００１」は高、「Ｐ：００３」は中、「Ｐ：００５」は高と記憶されている。

なお、頻度が反映されていれば良く、出現した回数そのものを記憶するほか、回数ではなく割合に応じた値を記憶しても良い。ＣＰＵ１１は、実施の形態２で述べた検索結果を抽出した後、カルテＩＤを頻度に応じてソートする。具体的には、ポイントが付与された高、中、低に応じて各カルテＩＤのポイントを算出する。本実施形態では高のポイントが３、中が２、低が１とする。カルテＩＤ００１は、対応ＩＤ「Ｐ：００１」は高で３、「Ｐ：００３」は中で２、「Ｐ：００５」は高で３、合計は８となる。カルテＩＤ００４は、対応ＩＤ「Ｐ：００１」は中で２、「Ｐ：００３」は中で２、「Ｐ：００５」は中で２、合計は６となる。

カルテＩＤ００５は、対応ＩＤ「Ｐ：００１」は中で２、「Ｐ：００３」は中で２、「Ｐ：００５」は高で３、合計は７となる。ＣＰＵ１１は、ポイントの大小に応じてソートする。この場合、ＣＰＵ１１は、カルテＩＤ「００１」、「００５」、「００４」の順に出力する。

図１５は対応関係の生成処理手順を示すフローチャートである。ＣＰＵ１１は、カルテ及びカルテＩＤをカルテＤＢ１５１から抽出する（ステップＳ１５１）。ＣＰＵ１１は、形態素解析により単語を抽出する（ステップＳ１５２）。ＣＰＵ１１は、係受け構造解析により、抽出した単語の係受け構造を特定する（ステップＳ１５３）。ＣＰＵ１１は、各係受け構造の出現頻度を計数する（ステップＳ１５４）。

ＣＰＵ１１は、記憶部１５から閾値を読み出す（ステップＳ１５５）。ＣＰＵ１１は、閾値以上の出現頻度を有する係受け構造、対応ＩＤ及び出現頻度を、カルテＩＤに対応付けて評価ＤＢ１５２に記憶する（ステップＳ１５６）。ＣＰＵ１１は、評価ＤＢ１５２をＲＤＦで記述し、記述した内容を記憶部１５に記憶する（ステップＳ１５７）。ＣＰＵ１１は、評価ＤＢ１５２を参照し、対応ＩＤの出現頻度に応じたレベルを付与する（ステップＳ１５８）。ＣＰＵ１１は、対応ＩＤのレベルとカルテＩＤとを対応付けて対応ＤＢ１５３に記憶する（ステップＳ１５９）。

ＣＰＵ１１は、全てのカルテに対し処理を終了したか否かを判断する（ステップＳ１５１０）。ＣＰＵ１１は、処理を終了していないと判断した場合（ステップＳ１５１０でＮＯ）、処理をステップＳ１５１１へ移行させる。ＣＰＵ１１は、未処理のカルテ及びカルテＩＤを、カルテＤＢ１５１から抽出する（ステップＳ１５１１）。ＣＰＵ１１は、処理をステップＳ１５２に戻す。以上の処理を繰り返すことにより、各カルテの係受け構造が特定される。ＣＰＵ１１は、全てのカルテに対し処理を終了したと判断した場合（ステップＳ１５１１でＹＥＳ）、一連の処理を終了する。

図１６及び図１７は、カルテのソート手順を示すフローチャートである。ＣＰＵ２１は、第１ボックス２４１に入力された係受け元の単語を受け付ける（ステップＳ１６１）。ＣＰＵ２１は、第２ボックス２４２に入力された係受け先の単語を受け付ける（ステップＳ１６２）。ＣＰＵ２１は、受け付けた係受け元の単語及び係受け先の単語を、通信部２６を介してサーバコンピュータ１へ送信する（ステップＳ１６３）。サーバコンピュータ１のＣＰＵ１１は、係受け元の単語及び係受け先の単語を、通信部１６を介して受信する（ステップＳ１６４）。

ＣＰＵ１１は、ＲＤＦで記述された記憶部１５に記憶されたデータを参照し、係受け元の単語及び係受け先の単語に合致する対応ＩＤを抽出する（ステップＳ１６５）。ＣＰＵ１１は、対応ＤＢ１５３を参照し、抽出した対応ＩＤを全て有するカルテＩＤを抽出する（ステップＳ１６６）。ＣＰＵ１１は、抽出した各カルテＩＤの抽出した対応ＩＤのレベルに応じたポイントを算出する（ステップＳ１６７）。

ＣＰＵ１１は、算出したポイントの大小に応じてカルテＩＤをソートする（ステップＳ１６８）。ＣＰＵ１１は、カルテＤＢ１５１を参照し、カルテＩＤに対応する患者名を抽出する（ステップＳ１６９）。ＣＰＵ１１は、カルテＩＤ及び患者名をソート順に、コンピュータ２へ送信する（ステップＳ１７０）。

ＣＰＵ２１は、カルテＩＤ及び患者名を受信する（ステップＳ１７１）。ＣＰＵ２１は、カルテＩＤ及び患者名をソート順に、検索結果として表示部２４に表示する（ステップＳ１７２）。図１８は検索結果のイメージを示す説明図である。本実施形態ではポイントの大きい順に、上からカルテＩＤ「００１」の患者、カルテＩＤ「００５」の患者、カルテＩＤ「００４」の患者が表示部２４に表示される。これにより、より関連性の強いカルテ及び患者を抽出することが可能となる。

本実施の形態３は以上の如きであり、その他は実施の形態１及び２と同様であるので、対応する部分には同一の参照番号を付してその詳細な説明を省略する。

実施の形態４
図１９は上述した形態のサーバコンピュータ１の動作を示す機能ブロック図である。ＣＰＵ１１が制御プログラム１５Ｐを実行することにより、サーバコンピュータ１は以下のように動作する。抽出部１９１は、文書ファイルに含まれるテキスト情報の形態素解析を行い、前記テキスト情報に含まれる単語間の係受け構造を複数抽出する。特定部１９２は、複数抽出した前記係受け構造の内の所定の頻度条件を満たす係受け構造を特定する。記憶処理部１９３は、特定した係受け構造と前記文書ファイルとを関連付けて記憶部１５に記憶する。受付部１９４は、所定の係受け構造の指定を受け付ける。抽出部１９５は、文書ファイルに含まれるテキスト情報の形態素解析を実行し、前記テキスト情報に含まれる単語間の係受け構造を複数抽出し、複数抽出した前記係受け構造の内の所定の頻度条件を満たす係受け構造を特定することで得られた、前記係受け構造と前記文書ファイルとの関連付け情報を複数の文書ファイルのそれぞれについて記憶する記憶部１５を参照して、受け付けた前記所定の係受け構造に合致する文書ファイルを抽出する。

図２０は実施の形態４に係るサーバコンピュータ１のハードウェア群を示すブロック図である。サーバコンピュータ１を動作させるためのプログラムは、ディスクドライブ等の読み取り部１０ＡにCD-ROM、DVD（Digital Versatile Disc）ディスク、メモリーカード、またはUSB(Universal Serial Bus)メモリ等の可搬型記録媒体１Ａを読み取らせて記憶部１５に記憶しても良い。また当該プログラムを記憶したフラッシュメモリ等の半導体メモリ１Ｂをサーバコンピュータ１内に実装しても良い。さらに、当該プログラムは、インターネット等の通信網Ｎを介して接続される他のサーバコンピュータ（図示せず）からダウンロードすることも可能である。以下に、その内容を説明する。

図２０に示すサーバコンピュータ１は、上述した各種ソフトウェア処理を実行するプログラムを、可搬型記録媒体１Ａまたは半導体メモリ１Ｂから読み取り、或いは、通信網Ｎを介して他のサーバコンピュータ（図示せず）からダウンロードする。当該プログラムは、制御プログラム１５Ｐとしてインストールされ、ＲＡＭ１２にロードして実行される。これにより、上述したサーバコンピュータ１として機能する。

本実施の形態４は以上の如きであり、その他は実施の形態１から３と同様であるので、対応する部分には同一の参照番号を付してその詳細な説明を省略する。

以上の実施の形態１から４を含む実施形態に関し、さらに以下の付記を開示する。

（付記１）
コンピュータに、
文書ファイルに含まれるテキスト情報の形態素解析を行い、前記テキスト情報に含まれる単語間の係受け構造を複数抽出し、
複数抽出した前記係受け構造の内の所定の頻度条件を満たす係受け構造を特定し、
特定した係受け構造と前記文書ファイルとを関連付けて記憶部に記憶する
処理を実行させるプログラム。
（付記２）
係受け元の単語と、係受け先の単語と、前記係受け元の単語及び係受け先の単語を特定する識別情報とを対応付けて記憶し、
前記識別情報に対応付けて前記係受け元の単語及び係受け先の単語を抽出した頻度を記憶し、
所定の閾値を超える識別情報を特定する
処理を実行させる付記１に記載のプログラム。
（付記３）
前記記憶部には、複数の文書ファイルそれぞれについて特定した係受け構造が記憶されている
付記１または２に記載のプログラム。
（付記４）
所定の係受け構造の指定を受け付け、
前記記憶部を参照して、複数の文書ファイルから受け付けた前記所定の係受け構造に合致する文書ファイルを抽出する
処理を実行させる付記３に記載のプログラム。
（付記５）
係受け元の単語と係受け先の単語とを受け付け、
前記記憶部を参照して、複数の文書ファイルから受け付けた係受け元の単語と係受け先の単語に対応する識別情報に合致する文書ファイルを抽出する
処理を実行させる付記４に記載のプログラム。
（付記６）
記憶部に、ＲＤＦにより記述された前記特定した係受け構造と前記文書ファイルと関連付けて記憶する
処理を実行させる付記１から５のいずれか一つに記載のプログラム。
（付記７）
文書ファイルに対応付けて該文書ファイルに含まれるテキスト情報の記載対象となった対象人物を前記記憶部に記憶し、
前記記憶部を参照し抽出した文書ファイルに対応する対象人物を出力する
付記４から６のいずれか一つに記載のプログラム。
（付記８）
特定した係受け構造、該係受け構造の頻度及び前記文書ファイルを関連付けて記憶部に記憶し、
前記所定の係受け構造に合致する文書ファイルを抽出した後、各文書ファイルの前記所定の係受け構造の頻度に基づき、各文書ファイルをソートする
付記３から７のいずれか一つに記載のプログラム。
（付記９）
コンピュータに、
所定の係受け構造の指定を受け付け、
文書ファイルに含まれるテキスト情報の形態素解析を実行し、前記テキスト情報に含まれる単語間の係受け構造を複数抽出し、複数抽出した前記係受け構造の内の所定の頻度条件を満たす係受け構造を特定することで得られた、前記係受け構造と前記文書ファイルとの関連付け情報を複数の文書ファイルのそれぞれについて記憶する記憶部を参照して、受け付けた前記所定の係受け構造に合致する文書ファイルを抽出する
処理を実行させるプログラム。
（付記１０）
文書ファイルに含まれるテキスト情報の形態素解析を行い、前記テキスト情報に含まれる単語間の係受け構造を複数抽出する抽出部と、
複数抽出した前記係受け構造の内の所定の頻度条件を満たす係受け構造を特定する特定部と、
特定した係受け構造と前記文書ファイルとを関連付けて記憶部に記憶する記憶処理部と
を備える情報処理装置。
（付記１１）
所定の係受け構造の指定を受け付ける受付部と、
文書ファイルに含まれるテキスト情報の形態素解析を実行し、前記テキスト情報に含まれる単語間の係受け構造を複数抽出し、複数抽出した前記係受け構造の内の所定の頻度条件を満たす係受け構造を特定することで得られた、前記係受け構造と前記文書ファイルとの関連付け情報を複数の文書ファイルのそれぞれについて記憶する記憶部を参照して、受け付けた前記所定の係受け構造に合致する文書ファイルを抽出する抽出部と
を備える情報処理装置。
（付記１２）
コンピュータに、
文書ファイルに含まれるテキスト情報の形態素解析を行い、前記テキスト情報に含まれる単語間の係受け構造を複数抽出し、
複数抽出した前記係受け構造の内の所定の頻度条件を満たす係受け構造を特定し、
特定した係受け構造と前記文書ファイルとを関連付けて記憶部に記憶する
処理を実行させる情報処理方法。
（付記１３）
コンピュータに、
所定の係受け構造の指定を受け付け、
文書ファイルに含まれるテキスト情報の形態素解析を実行し、前記テキスト情報に含まれる単語間の係受け構造を複数抽出し、複数抽出した前記係受け構造の内の所定の頻度条件を満たす係受け構造を特定することで得られた、前記係受け構造と前記文書ファイルとの関連付け情報を複数の文書ファイルのそれぞれについて記憶する記憶部を参照して、受け付けた前記所定の係受け構造に合致する文書ファイルを抽出する
処理を実行させる情報処理方法。

１サーバコンピュータ
１Ａ可搬型記録媒体
１Ｂ半導体メモリ
２コンピュータ
１０Ａ読み取り部
１１ＣＰＵ
１２ＲＡＭ
１３入力部
１４表示部
１５記憶部
１５Ｐ制御プログラム
１６通信部
２１ＣＰＵ
２２ＲＡＭ
２３入力部
２４表示部
２５記憶部
２５Ｐ制御プログラム
２６通信部
１５１カルテＤＢ
１５２評価ＤＢ
１５３対応ＤＢ
１９１、１９５抽出部
１９２特定部
１９３記憶処理部
１９４受付部
２４１第１ボックス
２４２第２ボックス
２４３検索ボタン
Ｎ通信網

Claims

コンピュータに、
文書ファイルに含まれるテキスト情報の形態素解析を行い、前記テキスト情報に含まれる単語間の係受け構造を複数抽出し、
複数抽出した前記係受け構造の内の所定の頻度条件を満たす係受け構造を特定し、
特定した係受け構造と前記文書ファイルとを関連付けて記憶部に記憶する
処理を実行させるプログラム。
係受け元の単語と、係受け先の単語と、前記係受け元の単語及び係受け先の単語を特定する識別情報とを対応付けて記憶し、
前記識別情報に対応付けて前記係受け元の単語及び係受け先の単語を抽出した頻度を記憶し、
所定の閾値を超える識別情報を特定する
処理を実行させる請求項１に記載のプログラム。
前記記憶部には、複数の文書ファイルそれぞれについて特定した係受け構造が記憶されている
請求項１または２に記載のプログラム。
コンピュータに、
所定の係受け構造の指定を受け付け、
文書ファイルに含まれるテキスト情報の形態素解析を実行し、前記テキスト情報に含まれる単語間の係受け構造を複数抽出し、複数抽出した前記係受け構造の内の所定の頻度条件を満たす係受け構造を特定することで得られた、前記係受け構造と前記文書ファイルとの関連付け情報を複数の文書ファイルのそれぞれについて記憶する記憶部を参照して、受け付けた前記所定の係受け構造に合致する文書ファイルを抽出する
処理を実行させるプログラム。
文書ファイルに含まれるテキスト情報の形態素解析を行い、前記テキスト情報に含まれる単語間の係受け構造を複数抽出する抽出部と、
複数抽出した前記係受け構造の内の所定の頻度条件を満たす係受け構造を特定する特定部と、
特定した係受け構造と前記文書ファイルとを関連付けて記憶部に記憶する記憶処理部と
を備える情報処理装置。
所定の係受け構造の指定を受け付ける受付部と、
文書ファイルに含まれるテキスト情報の形態素解析を実行し、前記テキスト情報に含まれる単語間の係受け構造を複数抽出し、複数抽出した前記係受け構造の内の所定の頻度条件を満たす係受け構造を特定することで得られた、前記係受け構造と前記文書ファイルとの関連付け情報を複数の文書ファイルのそれぞれについて記憶する記憶部を参照して、受け付けた前記所定の係受け構造に合致する文書ファイルを抽出する抽出部と
を備える情報処理装置。
コンピュータに、
文書ファイルに含まれるテキスト情報の形態素解析を行い、前記テキスト情報に含まれる単語間の係受け構造を複数抽出し、
複数抽出した前記係受け構造の内の所定の頻度条件を満たす係受け構造を特定し、
特定した係受け構造と前記文書ファイルとを関連付けて記憶部に記憶する
処理を実行させる情報処理方法。
コンピュータに、
所定の係受け構造の指定を受け付け、
文書ファイルに含まれるテキスト情報の形態素解析を実行し、前記テキスト情報に含まれる単語間の係受け構造を複数抽出し、複数抽出した前記係受け構造の内の所定の頻度条件を満たす係受け構造を特定することで得られた、前記係受け構造と前記文書ファイルとの関連付け情報を複数の文書ファイルのそれぞれについて記憶する記憶部を参照して、受け付けた前記所定の係受け構造に合致する文書ファイルを抽出する
処理を実行させる情報処理方法。