WO2014076777A1

WO2014076777A1 - 医療情報解析プログラム、医療情報解析装置、および医療情報解析方法

Info

Publication number: WO2014076777A1
Application number: PCT/JP2012/079498
Authority: WO
Inventors: 龍雄早川
Original assignee: 富士通株式会社
Priority date: 2012-11-14
Filing date: 2012-11-14
Publication date: 2014-05-22
Also published as: US20150227714A1; JP6187474B2; JPWO2014076777A1; EP2922018A1; EP2922018A4

Abstract

　ある患者の診療の参考となる情報を診療録から抽出できるようにする。　医療情報解析装置（Ｓ）は、特定手段（２）と抽出手段（４）とを有する。特定手段（２）は、複数の患者の診療録を参照し、診療録が第１の患者と類似する第２の患者を特定する。抽出手段（４）は、第２の患者の診療録から情報を抽出する。

Description

医療情報解析プログラム、医療情報解析装置、および医療情報解析方法

　本発明は、医療情報を解析する医療情報解析プログラム、医療情報解析装置、および医療情報解析方法に関する。

　情報技術の発達に伴い、コンピュータの利用範囲が拡大している。その結果、コンピュータには、膨大な量の電子データが蓄積されている。電子データの中には、文字情報を含むものが多数ある。そこで、電子データに含まれる文字情報を有効に利用するための技術が考えられている。例えば、インターネット上のＱＡサービスにおいて、ユーザが興味を明示したり回答したりしなくても、ユーザが一度でも質問もしくは回答したことのあるユーザであれば、ユーザの知識および興味に応じて回答を促すための質問を推薦する技術がある。また、手書きの注釈により入力された個人情報を収集し、管理し、探索し、共有する方法も考えられている。

　コンピュータによるデータの管理は、医療の世界にも浸透してきている。例えば、医療の世界では、大規模病院を中心に電子カルテが進み、診断結果などの記事が患者ごとに管理されている。そこで医療の分野においても、多数の患者に関する蓄積されたデータを、診察に有効利用することが考えられている。例えば、画像に付与された文を元に類似画像を検索するシステムにおいて、所望の画像を早く容易に検索できるシステムがある。これにより、画像について検索者が見落としていた、あるいは意識していなかったキーワードや特徴量についても自動で抽出され、医師の見落としていた関連症例についても検索可能となる。また、読影医による観察箇所の見落としを防止し、質の高い読影レポートを作成できるようにする医用診断レポートシステムがある。この医用診断レポートシステムでは、医用診断レポートの所見から読影箇所を特定する単語を読影チェック項目として抽出し、医用診断レポートの所見から抽出した読影チェック項目が含まれる文章を取得して、読影チェック項目ごとに文章を表示する。

特開２０１１－１８６８５４号公報特開２００５－８５２８５号公報特開２００４－１５７６２３号公報特開２０１１－１００２５４号公報

　医療に関する情報の様々な利用方法が提案されているものの、従来の技術では、診療に関する大量のデータの活用が十分とはいえない。例えば診療対象の患者と同様の病状の他の患者の診療録（カルテ）は、診療対象患者の診療の参考になるものと考えられる。しかし、現状では、ある患者の診療の参考となる情報が、大量に存在する診療録のうちのどの診療録に含まれるのかを適切に判断することができない。その結果、大量に蓄積された診療録の中から、ある患者の参考となる情報を抽出することができない。

　１つの側面では、本発明は、ある患者の診療の参考となる情報を診療録から抽出できる医療情報解析プログラム、医療情報解析装置、および医療情報解析方法を提供することを目的とする。

　１つの案では、コンピュータに、複数の患者の診療録を参照し、診療録が第１の患者と類似する第２の患者を特定し、第２の患者の診療録から情報を抽出する、処理をコンピュータに実行させる医療情報解析プログラムが提供される。

　１態様によれば、ある患者の診療の参考となる情報を診療録から抽出できるようになる。
　本発明の上記および他の目的、特徴および利点は本発明の例として好ましい実施の形態を表す添付の図面と関連した以下の説明により明らかになるであろう。

第１の実施の形態に係る医療情報解析装置の機能構成例を示す図である。第２の実施の形態のシステム構成例を示す図である。本実施の形態に用いるサーバのハードウェアの一構成例を示す図である。サーバのレコメンデーション機能を示すブロック図である。電子カルテ記憶部のデータ構造の一例を示す図である。登録排除辞書記憶部のデータ構造の一例を示す図である。レコメンデーション処理の手順の一例を示すフローチャートである。対象患者記録解析処理の手順の一例を示すフローチャートである。対象患者記録内単語記憶部のデータ構造の一例を示す図である。他の患者の記録解析処理の手順の一例を示すフローチャートである。類似記録内単語記憶部のデータ構造の一例を示す図である。記録情報間の類似関係を示す図である。類似患者判定処理の手順を示すフローチャートである。類似患者情報記憶部のデータ構造の一例を示す図である。類似患者記録内単語記憶部のデータ構造の一例を示す図である。参考単語抽出処理の手順を示すフローチャートである。レコメンデーションの一例を示す図である。

　以下、本実施の形態について図面を参照して説明する。なお各実施の形態は、矛盾のない範囲で複数の実施の形態を組み合わせて実施することができる。
　〔第１の実施の形態〕
　図１は、第１の実施の形態に係る医療情報解析装置の機能構成例を示す図である。医療情報解析装置Ｓは、記憶手段１、特定手段２、および抽出手段４を有する。例えば医療情報解析装置Ｓは、医療情報解析プログラムを実行することで医療情報を解析するコンピュータである。

　記憶手段１は、複数の患者の診療録（カルテ）１ａ，１ｂ，１ｃ，・・・を記憶する。診療録１ａ，１ｂ，１ｃ，・・・は、患者ごとに作成されている。診療録１ａ，１ｂ，１ｃ，・・・には、各患者の診療や看護の内容を示す記録情報が含まれている。

　特定手段２は、複数の患者の診療録を参照し、診療録が第１の患者と類似する第２の患者を特定する。例えば特定手段２は、第１の患者の診療録１ａに含まれる複数の記録情報１ａ－１，１ａ－２，１ａ－３，・・・それぞれと、他の患者の診療録１ｂ，１ｃ，・・・に含まれる複数の記録情報１ｂ－１，１ｂ－２，１ｂ－３，・・・それぞれとの類似度を計算する。そして特定手段２は、他の患者ごとに記録情報間の類似度を合計する。合計された類似度が、第１の患者に対する他の患者の類似の度合いを表すこととなる。また特定手段２は、第１の患者の診療録１ａに含まれる複数の記録情報１ａ－１，１ａ－２，１ａ－３，・・・それぞれに対し、類似度が高い方から上位所定数の他の患者の記録情報を抽出し、他の患者ごとに、抽出された記録情報の類似度を合計してもよい。

　抽出手段４は、第２の患者の診療録１ｂから情報を抽出する。例えば抽出手段４は、第２の患者の診療録１ｂに出現する単語のうち、第１の患者の診療録１ａに出現しない単語を抽出する。

　このような医療情報解析装置Ｓでは、例えばユーザから、第１の患者を指定した解析指示に応じて、医療情報の解析が開始される。医療情報の解析では、まず特定手段２により、第１の患者の診療録１ａと、他の患者の診療録１ｂ，１ｃ，・・・との類似度が計算される。例えば第１の患者の診療録１ａに含まれる１ａ－１，１ａ－２，１ａ－３，・・・それぞれと、他の患者の診療録１ｂ，１ｃ，・・・に含まれる複数の記録情報１ｂ－１，１ｂ－２，１ｂ－３，・・・それぞれとの類似度が計算される。さらに、他の患者ごとに記録情報間の類似度が合計される。そして類似度の合計値が大きい方から１以上の他の患者が、第２の患者として特定される。第２の患者が特定されると、例えば特定した患者を示す情報（類似患者情報３）が、特定手段２から抽出手段４に送信される。図１の例では、患者「Ｂ」が第２の患者として特定されている。

　次に抽出手段４により、第２の患者の診療録１ｂから、第１の患者の診療の参考となる単語が抽出される。例えば、第２の患者の診療録１ｂに出現する単語（単語配列６）のうち、第１の患者の診療録１ａに出現しない単語（単語配列５）が抽出される。抽出された単語は、例えば、第１の患者の診療の参考になる単語（参考単語７）として、抽出手段４から出力される。

　このようにして、第１の患者と診療記録が類似する第２の患者の診療録から、第１の患者の診療の参考となる情報を抽出することができ、医療情報の有効活用が促進される。その結果、診療品質を向上させることができる。

　なお特定手段２が特定する第２の患者は、一人の患者には限定されない。例えば特定手段２は、第１の患者の診療録と他の患者の診療録との間の類似度を計算し、類似度が高い方から所定数の他の患者を、第２の患者とすることができる。

　さらに特定手段２は、記録情報間の類似度の計算の際に、記録情報の種類に応じて重み付けを行うこともできる。例えば特定手段２は、類似度計算対象の２つの記録情報の内容に基づく類似度の計算結果に、２つの記録情報それぞれの重みを乗算し、乗算結果を該２つの記録情報間の類似度とする。これにより、記録情報に対して、種類に応じた軽重を付け、適切な単語が抽出されるようにすることができる。例えば、医師が記録した診療記録の重みを、看護師が記録した診療記録より重くすることで、看護内容よりも診療内容が類似する他の患者を、優先して第２の患者とすることができる。

　また、患者の診療録には、患者の身体的特徴を示す身体情報を含めることもできる。身体情報を用いて診療録の類似性を判断することにより、第１の患者と身体情報が似た他の患者を、第２の患者とすることができる。その結果、患者の身体情報の違いにより、診療方法などが大きく異なるような病気の診療に有用な単語を抽出することができる。

　なお、特定手段２と抽出手段４とは、例えば医療情報解析装置Ｓが有するプロセッサにより実現することができる。また、記憶手段１は、例えば医療情報解析装置Ｓが有するＲＡＭ（Random Access Memory）により実現することができる。

　〔第２の実施の形態〕
　次に第２の実施の形態につて説明する。第２の実施の形態は、病院内のネットワークを介して、電子カルテに蓄積された知識を複数の医者が共有できるようにした電子カルテ管理システムである。

　図２は、第２の実施の形態のシステム構成例を示す図である。電子カルテ管理システムでは、ネットワーク１０を介して、サーバ１００と複数の端末装置２１～２３とが接続されている。端末装置２１～２３は、医師３１，３２や看護師３３が、患者の診療に関する情報の入力に使用する。端末装置２１～２３に入力された情報は、ネットワーク１０を介してサーバ１００に送信され、サーバ１００で記録される。患者ごとの記録情報の集合が、患者の電子カルテとなる。記録情報は、治療や看護などの行為が行われるごとに記録される情報である。

　サーバ１００は、電子カルテを管理するコンピュータである。そしてサーバ１００は、端末装置２１～２３からのレコメンデーション要求に応じて、蓄積された電子カルテを解析し、レコメンデーション結果を出力することができる。レコメンデーション要求には、レコメンデーションの対象となる患者（対象患者）が指定されている。例えば、サーバ１００は、対象患者の電子カルテには記載されていないが、対象患者と似た病状や治療履歴の他の患者（類似患者）の電子カルテに記載されているキーワードを検出し、そのキーワードをレコメンデーション結果として出力する。

　図３は、本実施の形態に用いるサーバのハードウェアの一構成例を示す図である。サーバ１００は、プロセッサ１０１によって装置全体が制御されている。プロセッサ１０１には、バス１０９を介してＲＡＭ１０２と複数の周辺機器が接続されている。プロセッサ１０１は、マルチプロセッサであってもよい。プロセッサ１０１は、例えばＣＰＵ（Central Processing Unit）、ＭＰＵ（Micro Processing Unit）、またはＤＳＰ（Digital Signal Processor）である。プロセッサ１０１の機能の少なくとも一部を、ＡＳＩＣ（Application Specific Integrated Circuit）、またはＰＬＤ（Programmable Logic Device）などの電子回路で実現してもよい。

　ＲＡＭ１０２は、サーバ１００の主記憶装置として使用される。ＲＡＭ１０２には、プロセッサ１０１に実行させるＯＳ（Operating System）のプログラムやアプリケーションプログラムの少なくとも一部が一時的に格納される。また、ＲＡＭ１０２には、プロセッサ１０１による処理に必要な各種データが格納される。

　バス１０９に接続されている周辺機器としては、ＨＤＤ（Hard Disk Drive）１０３、グラフィック処理装置１０４、入力インタフェース１０５、光学ドライブ装置１０６、機器接続インタフェース１０７およびネットワークインタフェース１０８がある。

　ＨＤＤ１０３は、内蔵したディスクに対して、磁気的にデータの書き込みおよび読み出しを行う。ＨＤＤ１０３は、サーバ１００の補助記憶装置として使用される。ＨＤＤ１０３には、ＯＳのプログラム、アプリケーションプログラム、および各種データが格納される。なお、補助記憶装置としては、フラッシュメモリなどの半導体記憶装置を使用することもできる。

　グラフィック処理装置１０４には、モニタ１１が接続されている。グラフィック処理装置１０４は、プロセッサ１０１からの命令に従って、画像をモニタ１１の画面に表示させる。モニタ１１としては、ＣＲＴ（Cathode Ray Tube）を用いた表示装置や液晶表示装置などがある。

　入力インタフェース１０５には、キーボード１２とマウス１３とが接続されている。入力インタフェース１０５は、キーボード１２やマウス１３から送られてくる信号をプロセッサ１０１に送信する。なお、マウス１３は、ポインティングデバイスの一例であり、他のポインティングデバイスを使用することもできる。他のポインティングデバイスとしては、タッチパネル、タブレット、タッチパッド、トラックボールなどがある。

　光学ドライブ装置１０６は、レーザ光などを利用して、光ディスク１４に記録されたデータの読み取りを行う。光ディスク１４は、光の反射によって読み取り可能なようにデータが記録された可搬型の記録媒体である。光ディスク１４には、ＤＶＤ（Digital Versatile Disc）、ＤＶＤ－ＲＡＭ、ＣＤ－ＲＯＭ（Compact Disc Read Only Memory）、ＣＤ－Ｒ（Recordable）／ＲＷ（ReWritable）などがある。

　機器接続インタフェース１０７は、サーバ１００に周辺機器を接続するための通信インタフェースである。例えば機器接続インタフェース１０７には、メモリ装置１５やメモリリーダライタ１６を接続することができる。メモリ装置１５は、機器接続インタフェース１０７との通信機能を搭載した記録媒体である。メモリリーダライタ１６は、メモリカード１７へのデータの書き込み、またはメモリカード１７からのデータの読み出しを行う装置である。メモリカード１７は、カード型の記録媒体である。

　ネットワークインタフェース１０８は、ネットワーク１０に接続されている。ネットワークインタフェース１０８は、ネットワーク１０を介して、他のコンピュータまたは通信機器との間でデータの送受信を行う。

　以上のようなハードウェア構成によって、第２の実施の形態の処理機能を実現することができる。なお、第１の実施の形態に示した医療情報解析装置も、図３に示したサーバ１００と同様のハードウェアにより実現することができる。

　サーバ１００は、例えばコンピュータ読み取り可能な記録媒体に記録されたプログラムを実行することにより、第２の実施の形態の処理機能を実現する。サーバ１００に実行させる処理内容を記述したプログラムは、様々な記録媒体に記録しておくことができる。例えば、サーバ１００に実行させるプログラムをＨＤＤ１０３に格納しておくことができる。プロセッサ１０１は、ＨＤＤ１０３内のプログラムの少なくとも一部をＲＡＭ１０２にロードし、プログラムを実行する。またサーバ１００に実行させるプログラムを、光ディスク１４、メモリ装置１５、メモリカード１７などの可搬型記録媒体に記録しておくこともできる。可搬型記録媒体に格納されたプログラムは、例えばプロセッサ１０１からの制御により、ＨＤＤ１０３にインストールされた後、実行可能となる。またプロセッサ１０１が、可搬型記録媒体から直接プログラムを読み出して実行することもできる。

　図４は、サーバのレコメンデーション機能を示すブロック図である。サーバ１００は、データ記憶部として、電子カルテ記憶部１１０、登録排除辞書記憶部１２０、対象患者記録内単語記憶部１３０、類似記録内単語記憶部１４０、類似患者情報記憶部１５０、および類似患者記録内単語記憶部１６０を有している。例えば、サーバ１００のＲＡＭ１０２やＨＤＤ１０３の記憶領域の一部が、各データ記憶部として使用される。またサーバ１００は、データの演算部として、単語抽出部１７１、類似患者判定部１７２、および参考単語抽出部１７３を有する。これらの演算部は、例えばサーバ１００のプロセッサ１０１がＲＡＭ１０２またはＨＤＤ１０３に格納されたプログラムを実行することで実現される。

　電子カルテ記憶部１１０は、医師３１，３２や看護師３３などが入力した記録情報を、記憶する。登録排除辞書記憶部１２０には、電子カルテからの単語抽出処理において、抽出対象から解除する語句を記憶する。対象患者記録内単語記憶部１３０は、レコメンデーションの対象となる患者（対象患者）の記録情報から抽出された単語を記憶する。類似記録内単語記憶部１４０は、対象患者の記録情報に類似する記録情報から抽出された単語を記憶する。類似患者情報記憶部１５０は、対象患者との間で電子カルテの内容が類似する他の患者（類似患者）の情報を記憶する。類似患者記録内単語記憶部１６０は、類似患者の記録情報内の単語を記憶する。

　単語抽出部１７１は、対象患者を指定したレコメンデーション要求を受け取ると、電子カルテ記憶部１１０から、対象患者の電子カルテに含まれる記録情報を取得する。そして単語抽出部１７１は、取得した記録情報から、単語を抽出する。例えば単語抽出部１７１は、形態素解析を行い、記録情報を複数の単語に分割する。次に単語抽出部１７１は、登録排除辞書記憶部１２０を参照し、形態素解析で得られた単語のうち、登録排除辞書に含まれる単語を削除する。なお、単語抽出部１７１は、例えば医学用語辞典を参照し、医学用語辞典に掲載されていない単語を削除するようにしてもよい。単語抽出部１７１は、単語の削除処理を行った後に残された単語を、対象患者記録内単語記憶部１３０に格納する。

　また単語抽出部１７１は、対象患者以外の患者の記録情報のうち、対象患者の記録情報のいずれかに類似する記録情報から単語を抽出する。例えば単語抽出部１７１は、他の患者の記録情報を形態素解析し、複数の単語に分割する。次に単語抽出部１７１は、登録排除辞書記憶部１２０を参照し、形態素解析で得られた単語のうち、登録排除辞書に含まれる単語を削除する。そして、単語抽出部１７１は、単語の削除処理を行った後に残された単語を、類似記録内単語記憶部１４０に格納する。

　類似患者判定部１７２は、対象患者と他の患者との記録情報間の類似度に基づいて、他の患者の順位付けを行う。類似患者判定部１７２は、順位が上位となった所定数の患者（類似患者）の情報を、類似患者情報記憶部１５０に格納する。また類似患者判定部１７２は、類似患者の記録情報から抽出された単語を、類似患者記録内単語記憶部１６０に格納する。

　参考単語抽出部１７３は、類似患者の記録情報から抽出された単語のうち、対象患者の記録情報に含まれない単語を、対象患者の診療の参考になる単語として抽出する。そして参考単語抽出部１７３は、抽出した単語を、レコメンデーション結果として、レコメンデーション要求を出力した端末装置に送信する。端末装置では、レコメンデーション結果が表示される。

　図４に示した各要素間を接続する線は通信経路の一部を示すものであり、図示した通信経路以外の通信経路も設定可能である。また類似患者判定部１７２は、図１に示す第１の実施の形態の特定手段２の一例である。さらに参考単語抽出部１７３は、図１に示す第１の実施の形態の抽出手段４の一例である。

　サーバ１００内の各データ記憶部のうち、レコメンデーション処理を実行する前に、管理者によってデータが登録されているのは、電子カルテ記憶部１１０と登録排除辞書記憶部１２０である。

　図５は、電子カルテ記憶部のデータ構造の一例を示す図である。電子カルテ記憶部１１０には、患者ごとの電子カルテ１１１，１１２，１１３，・・・が格納されている。電子カルテ１１１には、記録情報１１１ａ，１１１ｂ，１１１ｃ，１１１ｄ，・・・が含まれている。他の電子カルテ１１２，１１３，・・・にも、電子カルテ１１１と同様に記録情報が含まれる。

　記録情報１１１ａ，１１１ｂ，１１１ｃ，１１１ｄ，・・・それぞれには、患者ＩＤ、記録番号、種類、記録日、および記録内容が含まれている。患者ＩＤは、患者を一意に示す識別子である。記録番号は、サーバ１００内で記録情報を一意に識別する識別子である。種類は、記録情報の種類を示している。種類には、例えば「身体記録」、「医師記録」、「看護記録」などがある。なお記録情報は、種類ごとに重みを設定することができる。例えば、医師記録の重みは、看護記録の重みよりも高く設定される。重みの値は、例えば記録情報間の類似度の計算結果に乗算される。これにより、看護記録間の類似性よりも、医師記録間の類似性を高く評価することができる。記録日は、記録情報を登録した日付である。

　なお種類ごとの重みは、例えばシステム管理者が、あらかじめ設定しておくことができる。またレコメンデーション要求において種別ごとの重みを指定することで、ユーザが任意に重みを指定することもできる。

　種類「身体記録」の記録情報１１１ａは、患者の名前や身体情報である。身体情報には、性別、年齢、体重、身長など、身体的特徴を表す情報が含まれる。なお年齢、体重、身長のように、年月の経過によって変化する可能性のある情報には、最新の情報が設定される。

　種類「医師記録」の記録情報１１１ｂは、医師の診療内容を記録したものである。例えば記録情報１１１ｂの記録内容には、患者の症状や投薬した薬の名前などが記入される。
　なお図５には、種類「看護記録」の記録情報は例示していないが、種類「看護記録」の記録情報の記録内容には、例えば看護過程での患者の様子が記入される。

　記録情報の別の種類としては、例えば臨床検査の結果を示す臨床記録や、リハビリの状況を示すリハビリ記録などがある。
　図６は、登録排除辞書記憶部のデータ構造の一例を示す図である。登録排除辞書記憶部１２０には、登録排除辞書１２１が格納されている。登録排除辞書１２１には、記録情報からの抽出対象外とする語句が登録されている。例えば登録排除辞書１２１には、「です」、「ます」といった語句が登録されている。

　サーバ１００では、図５・図６に示した電子カルテ１１１，１１２，１１３，・・・と登録排除辞書１２１とを用いて、レコメンデーション処理が実行される。
　図７は、レコメンデーション処理の手順の一例を示すフローチャートである。なお、レコメンデーション処理は、いずれかの端末装置から、対象患者を指定したレコメンデーション要求が入力されたときに実行される。

　［ステップＳ１０１］単語抽出部１７１は、対象患者の記録解析処理を行う。この処理により、対象患者記録内単語記憶部１３０に、対象患者の電子カルテに含まれる記録情報から抽出された単語が格納される。対象患者の記録解析処理の詳細は後述する（図８参照）。

　［ステップＳ１０２］単語抽出部１７１は、対象患者以外の患者（他の患者）の記録解析処理を行う。この処理により、類似記録内単語記憶部１４０に、他の患者の電子カルテに含まれる記録情報のうち、対象患者の電子カルテ内の記録情報に類似する内容の記録情報から抽出された単語が格納される。他の患者の記録解析処理の詳細は後述する（図１０参照）。

　［ステップＳ１０３］類似患者判定部１７２は、対象患者に対して類似する他の患者（類似患者）の判定処理を行う。この処理により、類似患者情報記憶部１５０には、類似度の高い所定数の患者の患者ＩＤが格納される。また類似患者記録内単語記憶部１６０には、類似患者の電子カルテ内の記録情報から抽出された単語が格納される。類似患者判定処理の詳細は後述する（図１３参照）。

　［ステップＳ１０４］参考単語抽出部１７３は、対象患者の診療の参考になる単語（参考単語）の抽出処理を行う。抽出された参考単語は、レコメンデーション要求を出力した端末装置に送信される。すると端末装置のモニタに、参考単語が表示される。参考単語抽出処理の詳細は後述する（図１５参照）。

　このような手順でレコメンデーションが行われる。以下、図７に示した各ステップの詳細について説明する。
　図８は、対象患者記録解析処理の手順の一例を示すフローチャートである。対象患者記録解析処理は、レコメンデーション要求が入力されたときに実行される。

　［ステップＳ１１１］単語抽出部１７１は、電子カルテ記憶部１１０から、対象患者の電子カルテにおける未選択の記録情報を１つ取得する。なお、単語抽出部１７１は、あらかじめ対象患者の電子カルテ内の記録情報をＳＱＬ（Structured Query Language）によって絞り込んでおいてもよい。その場合、単語抽出部１７１は、あらかじめ絞り込まれた記録情報を順番に取得する。

　［ステップＳ１１２］単語抽出部１７１は、ステップＳ１１１において、記録情報が取得できたか否かを判断する。対象患者の電子カルテ内に未取得の記録情報があれば、ステップＳ１１１において記録情報を取得できる。他方、対象患者の電子カルテ内のすべての記録情報が取得済みであれば、ステップＳ１１１において記録情報を取得できない。記録情報が取得できた場合、処理がステップＳ１１３に進められる。記録情報が取得できなかった場合、対象患者記録解析処理が終了する。

　［ステップＳ１１３］単語抽出部１７１は、取得した記録情報を先頭から形態素解析する。例えば単語抽出部１７１は、記録情報内の詳細内容を示す文字列の形態素解析を行い、その文字列の先頭から順に単語を切り出し、その単語を取得する。なお単語抽出部１７１は、形態素解析を実施する前に、記録情報内の全角と半角との両方で表せる文字を、一方の文字に統一してもよい。例えば単語抽出部１７１は、形態素解析に先立って、半角カタカナの全角カタカナへの変換、全角アルファベットの半角アルファベットへの変換を行う。

　また単語抽出部１７１は、記録情報から全角数字、半角数字、および記号を削除してもよい。これは、数字や記号は、類似度計算時の誤差原因になりやすい為である。ただし、種類が「身体記録」の記録情報については、数字や記号に大きな意味がある情報が多数含まれる。そこで単語抽出部１７１は、例えば「身体記録」の記録情報については、数字や記号を削除しないようにする。

　［ステップＳ１１４］単語抽出部１７１は、形態素解析により、新たな単語が取得できたか否かを判断する。例えば、記録情報の最後まで形態素解析が終了し、すべての単語の品詞チェックなどの処理が終了している場合、新たな単語は取得できない。また品詞チェックなどの処理が行われていない単語があれば、その単語が取得できる。単語が取得できた場合、処理がステップＳ１１５に進められる。単語が取得できなければ、処理がステップＳ１２０に進められる。

　［ステップＳ１１５］単語抽出部１７１は、単語が取得できた場合、取得した単語の品詞をチェックする。
　［ステップＳ１１６］単語抽出部１７１は、取得した単語の品詞が、登録対象の品詞か否かを判断する。例えば単語抽出部１７１には、あらかじめ登録対象の品詞が設定されている。登録対象の品詞は、例えば「名詞」、「動詞」、「形容詞」、「形容動詞」である。「助詞」や「副詞」は、類似度計算の誤差原因となりやすいため、登録対象から除外される。取得した単語の品詞が登録対象の品詞であれば、処理がステップＳ１１７に進められる。また取得した品詞が登録対象の品詞でなければ、処理がステップＳ１１３に進められる。

　［ステップＳ１１７］単語抽出部１７１は、取得した単語が、登録排除辞書記憶部１２０に格納されている登録排除辞書１２１に含まれているか否かをチェックする。なお単語抽出部１７１は、例えば、名詞の後ろに名詞が連続する場合、それらの名詞を結合した後を、別の１つの単語と認識してもよい。例えば「外」の後に「減圧」と続く場合、「外」、「減圧」、「外減圧」の３つの単語が、チェックの対象となる。さらに単語抽出部１７１は、単語の文字数が４文字以上であり、単語の最後に「ー」（長音符）が存在した場合、「ー」を削除してもよい。例えば「サーバー」は「サーバ」となり、「ユーザー」は「ユーザ」となる。

　［ステップＳ１１８］単語抽出部１７１は、取得した単語が登録排除対象か否かを判断する。例えば単語抽出部１７１は、取得した単語が登録排除辞書１２１に含まれていれば、その単語が登録排除対象であると認識する。登録排除対象であれば、処理がステップＳ１１３に進められる。登録排除対象でなければ、処理がステップＳ１１９に進められる。

　［ステップＳ１１９］単語抽出部１７１は、ステップＳ１１１で取得した記録情報の単語配列に、ステップＳ１１３で取得した単語を追加する。その後、処理がステップＳ１１３に進められる。

　［ステップＳ１２０］単語抽出部１７１は、ステップＳ１１３で単語が取得できなかった場合、取得した記録情報の解析が完了したと判断し、ステップＳ１１１で取得した記録情報の単語配列を、記録情報に対応付けて対象患者記録内単語記憶部１３０に格納する。その後、処理がステップＳ１１１に進められる。

　このようにして、対象患者の電子カルテに含まれる各記録情報に対応する単語配列が、対象患者記録内単語記憶部１３０に格納される。
　図９は、対象患者記録内単語記憶部のデータ構造の一例を示す図である。対象患者記録内単語記憶部１３０には、単語配列テーブル１３１が格納されている。単語配列テーブル１３１は、対象患者の記録情報から抽出した単語が、記録情報ごとに登録されたデータテーブルである。単語配列テーブル１３１には、患者ＩＤ、記録番号、種類、および単語配列の欄が設けられている。患者ＩＤの欄には、対象患者の患者ＩＤが設定される。記録番号の欄には、対象患者の電子カルテに含まれる記録情報の記録番号が設定される。種類の欄には、対応する記録情報の種類が設定される。単語配列の欄には、対応する記録情報から抽出された単語が列挙される。

　次に、他の患者の記録解析処理について説明する。
　図１０は、他の患者の記録解析処理の手順の一例を示すフローチャートである。他の患者の記録解析処理は、対象患者記録解析処理が終了した後に実行される。

　［ステップＳ１３１］単語抽出部１７１は、電子カルテ記憶部１１０から、対象患者以外の患者（他の患者）の電子カルテにおける未選択の記録情報を１つ取得する。なお、単語抽出部１７１は、あらかじめ他の患者の電子カルテ内の記録情報をＳＱＬによって絞り込んでおいてもよい。

　［ステップＳ１３２］単語抽出部１７１は、ステップＳ１３１において、記録情報が取得できたか否かを判断する。少なくとも一人の他の患者の電子カルテ内に未取得の記録情報があれば、ステップＳ１３１において記録情報を取得できる。他方、すべての他の患者の電子カルテ内のすべての記録情報が取得済みであれば、ステップＳ１３１において記録情報を取得できない。記録情報が取得できた場合、処理がステップＳ１３３に進められる。記録情報が取得できなかった場合、他の患者の記録解析処理が終了する。

　［ステップＳ１３３］単語抽出部１７１は、取得した記録情報を先頭から形態素解析し、先頭から順に単語を取得する。この処理の詳細は、図８のステップＳ１１３と同様である。

　［ステップＳ１３４］単語抽出部１７１は、形態素解析により、新たな単語が取得できたか否かを判断する。単語が取得できた場合、処理がステップＳ１３５に進められる。単語が取得できなければ、処理がステップＳ１４０に進められる。

　［ステップＳ１３５］単語抽出部１７１は、単語が取得できた場合、取得した単語の品詞をチェックする。
　［ステップＳ１３６］単語抽出部１７１は、取得した単語の品詞が、登録対象の品詞か否かを判断する。取得した単語の品詞が登録対象の品詞であれば、処理がステップＳ１３７に進められる。また取得した品詞が登録対象の品詞でなければ、処理がステップＳ１３３に進められる。

　［ステップＳ１３７］単語抽出部１７１は、取得した単語が、登録排除辞書記憶部１２０に格納されている登録排除辞書１２１に含まれているか否かをチェックする。この処理の詳細は、図８のステップＳ１１７の処理と同様である。

　［ステップＳ１３８］単語抽出部１７１は、取得した単語が登録排除対象か否かを判断する。登録排除対象であれば、処理がステップＳ１３３に進められる。登録排除対象でなければ、処理がステップＳ１３９に進められる。

　［ステップＳ１３９］単語抽出部１７１は、ステップＳ１３１で取得した記録情報の単語配列に、ステップＳ１３３で取得した単語を追加する。その後、処理がステップＳ１３３に進められる。

　［ステップＳ１４０］単語抽出部１７１は、ステップＳ１３３で単語が取得できなかった場合、取得した記録情報の解析が完了したと判断し、取得した記録情報と、対象患者の複数の記録情報それぞれとの類似度（０以上、１以下の値）を計算する。類似度の計算には、各記録情報から抽出された単語配列が用いられる。例えば単語抽出部１７１は、ステップＳ１３９で生成した単語配列を、対象患者記録内単語記憶部１３０に格納された、記憶情報の単語配列それぞれと比較し、ＴＦ（Term Frequency）－ＩＤＦ（Inverse Document Frequency）により類似度を計算する。ＴＦ－ＩＤＦは、単語の出現頻度（ＴＦ）と逆文書頻度（ＩＤＦ）とに基づいて、文書中の単語の重要度を計算する手法である。ＩＤ－ＩＤＦを用いると、多くの記録情報に含まれる単語の重要度が下がり、特定の記録情報にしか出現しない単語の重要度が上がる。

　単語抽出部１７１は、例えば、記録情報から抽出した単語の重要度を用いて、ベクトル空間法により、対象患者の記録情報と、取得した他の患者の記録情報との類似度を計算する。ベクトル空間法では、比較対象の２つの記録情報それぞれに含まれる文字の重要度を用いてベクトルを生成し、２つのベクトルの成す角θの余弦（ｃｏｓθ）が類似度となる。

　また単語抽出部１７１は、電子カルテの記録情報の種類別に重み付けを設定しておくことができる。その場合、重要な記録には高い重み付けが設定される。例えば、医師記録の重みを「１．２」、看護記録の重みを「１．１」、その他の記録の重みを「０．９」とする。また身体情報の重みを、他の記録情報よりも大きくすることもできる。身体情報の重みを大きくすることで、対象患者と身体的特徴が似た他の患者の記録情報の類似度を上げることができる。単語抽出部１７１は、比較された各記録情報の種類に応じた重みの値を、ベクトル空間法により計算された類似度に積算する。そして単語抽出部１７１は、重みを積算した結果を、最終的な類似度とする。

　［ステップＳ１４１］単語抽出部１７１は、取得した記録情報との間の類似度が高い、対象患者の記録情報があるか否かを判断する。例えば単語抽出部１７１は、対象患者の各記録情報について、その記録情報との間の類似度に基づいて他の患者の記録情報を並べたとき、取得した記録情報が上位２０位以内に入る場合、類似度が高いと判断する。類似度が高い対象患者の記録情報がある場合、処理がステップＳ１４２に進められる。類似度の高い対象患者の記録情報がない場合、処理がステップＳ１３１に進められる。

　なお、対象患者の１つの記録情報に対して、他の一人の患者の複数の記録情報が、類似度のランキングの上位所定数内に入る場合も考えられる。この場合、単語抽出部１７１は、例えば、同じ患者の複数の記録情報のうちの最上位以外の記録情報については、類似度は高くないものとして取り扱う。

　［ステップＳ１４２］単語抽出部１７１は、取得した記録情報から抽出した単語配列を、その記録情報との間の類似度が高い、対象患者の１または複数の記録情報に関連付けて、類似記録内単語記憶部１４０に格納する。なお新たな記録情報の格納により、対象患者の記録情報に関連付けられた他の患者の記録情報の数が所定数（例えば２０）を超える場合がある。この場合、単語抽出部１７１は、対象患者の記録情報に関連付けられた他の患者の記録情報のうち、類似度が最も低い記録情報の単語配列を、類似記録内単語記憶部１４０から削除する。その後、処理がステップＳ１３１に進められる。

　このようにして、対象患者の記録情報それぞれに類似する他の患者の記録情報から抽出した単語配列が、類似記録内単語記憶部１４０に格納される。
　図１１は、類似記録内単語記憶部のデータ構造の一例を示す図である。類似記録内単語記憶部１４０には、対象患者の記録情報ごとの単語配列テーブル１４１，１４２，１４３，・・・が格納されている。単語配列テーブル１４１，１４２，１４３，・・・それぞれには、対象患者の記録情報の記録番号が付与されている。また単語配列テーブル１４１，１４２，１４３，・・・には、患者ＩＤ、記録番号、種類、単語配列、および類似度の欄が設けられている。

　患者ＩＤの欄には、他の患者の患者ＩＤが設定される。記録番号の欄には、対象患者の記録情報に類似する内容の、他の患者の記録情報の記録番号が設定される。種類の欄には、記録情報の種類が設定される。単語配列の欄には、記録情報から抽出された単語配列が設定される。類似度の欄には、対象患者の記録情報との間の類似度が設定される。

　このように、単語配列テーブル１４１，１４２，１４３，・・・には、対象患者の記録情報に対応付けて、その記録情報に類似する他の患者の記録情報の単語配列が登録される。なお他の患者の複数の記録情報の単語配列が、１つの単語配列テーブルに登録されることはない。すなわち、１つの単語配列テーブルには、一人の患者につき１つの記録情報の単語配列のみが登録される。他方、他の患者の１つの記録情報の単語配列が、複数の単語配列テーブルに登録されることはある。

　類似記録内単語記憶部１４０内の単語配列テーブル１４１，１４２，１４３，・・・によって、対象患者の複数の記録情報と、その記録情報に類似する他の患者の記録情報とが関連付けられる。

　図１２は、記録情報間の類似関係を示す図である。対象患者の記録情報４１，４２，４３，４４，４５，・・・それぞれに対して、類似度のランキングが上位となる所定数の他の患者の記録情報が関連付けられる。例えば対象患者の記録情報４１には、その記録情報に類似する他の患者の所定数の記録情報５１，５２，５３，５４，・・・が関連付けられている。また対象患者の記録情報４５には、その記録情報に類似する他の患者の所定数の記録情報６１，６２，６３，６４，・・・が関連付けられている。ここで対象患者の記録情報が１０００件あり、類似度のランキングで上位２０位以内の他の患者の記録情報を関連付けた場合、２００００件の他の患者の記録情報から、単語配列が抽出されることとなる。

　対象患者の複数の記録情報それぞれに関連付けられた、他の患者の記録情報に基づいて、対象患者に類似する治療履歴の患者（類似患者）を判定することができる。
　図１３は、類似患者判定処理の手順を示すフローチャートである。この処理は、他の患者の記録解析処理の終了後に実行される。

　［ステップＳ１５１］類似患者判定部１７２は、対象患者の記録情報のいずれかに類似する他の患者の記録情報の類似度を、他の患者の患者ＩＤごとに合計する。例えば類似患者判定部１７２は、類似記録内単語記憶部１４０から、他の患者の患者ＩＤごとに、その患者ＩＤが設定されたレコードの類似度を取得する。そして類似患者判定部１７２は、患者ＩＤごとに取得した類似度を合計する。

　［ステップＳ１５２］類似患者判定部１７２は、類似度の合計を比較し、上位所定数（例えば２０人）の患者を、対象患者に対する類似患者とする。例えば類似患者判定部１７２は、他の患者の患者ＩＤを、類似度の合計によって、合計値が高い順にソートする。類似患者判定部１７２は、ソートした結果の上位所定数の患者ＩＤを抽出する。そして類似患者判定部１７２は、抽出した患者ＩＤを、類似患者情報記憶部１５０に格納する。

　［ステップＳ１５３］類似患者判定部１７２は、類似患者の記録情報の単語配列を取得する。例えば類似患者判定部１７２は、類似記録内単語記憶部１４０から、類似患者の患者ＩＤを含むレコードを抽出し、その他を排除する。そして類似患者判定部１７２は、抽出したレコードを、類似患者記録内単語記憶部１６０に格納する。

　このようにして、類似患者が特定される。この処理により、例えば「対象患者の電子カルテの記録情報に類似する記録情報の上位に出現する頻度が高い患者」が類似患者として特定される。また「対象患者の電子カルテの記録情報に類似する記録情報に出現する頻度がそれほど高くなくても、類似する１つ１つの記録情報の類似度が高い患者」が、類似患者と特定される場合もある。

　特定された類似患者のリストは、類似患者情報記憶部１５０に格納される。
　図１４は、類似患者情報記憶部のデータ構造の一例を示す図である。類似患者情報記憶部１５０には、類似患者リスト１５１が格納されている。類似患者リスト１５１は、類似度のランキングが上位の患者のリストである。図１４の例では、類似患者リスト１５１には、患者のランキングの順位、患者ＩＤ、および類似度が設定されている。

　類似患者リスト１５１に登録された患者については、その患者の記録情報から抽出された単語配列が、類似患者記録内単語記憶部１６０に格納される。
　図１５は、類似患者記録内単語記憶部のデータ構造の一例を示す図である。類似患者記録内単語記憶部１６０には、対象患者の記録情報ごとの単語配列テーブル１６１，１６２，１６３，・・・が格納されている。単語配列テーブル１６１，１６２，１６３，・・・のデータ構造は、図１１に示した類似記録内単語記憶部１４０内の単語配列テーブル１４１，１４２，１４３，・・・と同様である。ただし、類似患者記録内単語記憶部１６０内の単語配列テーブル１６１，１６２，１６３，・・・には、類似患者の患者ＩＤが設定されたレコ－ドのみが登録されている。例えば図１１に示した類似記録内単語記憶部１４０内の単語配列テーブル１４１には、患者ＩＤ「Ｚ」の患者のレコードが含まれている。ここで、患者ＩＤ「Ｚ」の患者は、類似患者ではないものとする。そのため、図１５に示す類似患者記録内単語記憶部１６０内の単語配列テーブル１６１では、患者ＩＤ「Ｚ」のレコードは除外されている。

　このような類似患者記録内単語記憶部１６０に格納された単語から、対象患者の診療の参考となる単語が抽出される。
　図１６は、参考単語抽出処理の手順を示すフローチャートである。この処理は、類似患者判定処理の終了後に実行される。

　［ステップＳ１６１］参考単語抽出部１７３は、対象患者の記録情報から抽出した単語と、類似患者の記録情報から抽出した単語とを統合（マージ）する。
　［ステップＳ１６２］参考単語抽出部１７３は、マージした後の各単語に、一意の番号（単語ＩＤ）を付与する。例えば参考単語抽出部１７３は、マージした後の単語配列における単語の出現順位を、その単語の単語ＩＤとする。なお、この時点で、単語と記録情報との関連付けはなくなり、患者ごとの出現単語一覧が生成される。

　［ステップＳ１６３］参考単語抽出部１７３は、患者ごとの出現単語一覧の中から、参考単語を抽出する。例えば参考単語抽出部１７３は、協調フィルタリング（ＣＦ：Collaborative Filtering）技術を応用して、参考単語を選択する。協調フィルタリングでは、例えばユーザの行動を記録し、特定のユーザの行動と類似した行動の他のユーザが、嗜好が近いユーザとされる。そして、特定のユーザが、嗜好が近い他のユーザの行動と同様な行動を好むものと推定され、特定のユーザの行動にはないが、嗜好の近いユーザにはある行動が、特定のユーザに薦められる。協調フィルタリングにおける「行動」として記録情報から抽出した「単語」を用いることで、対象患者の診療内容と似た診療内容の他のユーザにおける記録情報の中から、対象患者がまだ行っていないが、今後の診療に役立つと思われる単語が抽出できる。

　そこで参考単語抽出部１７３は、協調フィルタリングによって嗜好が近いと判断された他の患者の出現単語一覧のうち、対象患者の出現単語一覧に含まれない単語（複数）を、参考単語として抽出する。

　［ステップＳ１６４］参考単語抽出部１７３は、抽出した参考単語を、レコメンデーション結果として出力する。例えば参考単語抽出部１７３は、参考単語のリストを、レコメンデーション要求の送信元の端末装置に対して送信する。

　このようにして、対象患者の診療に有用な単語を、診療内容が類似した他の患者の記録情報内の単語から導き出すことができる。
　図１７は、レコメンデーションの一例を示す図である。図１７の例では、患者ＩＤ「Ａ」の患者を対象患者としている。この場合、患者ＩＤ「Ａ」の患者と他の患者との記録情報内の単語の比較により類似患者が判定される。図１７の例では、患者ＩＤ「Ｂ」、「Ｃ」、「Ｄ」、「Ｅ」の各患者が、類似患者と判定されている。

　ここで、対象患者（患者ＩＤ「Ａ」）の記録情報内の単語と、類似患者（患者ＩＤ「Ｂ」、「Ｃ」、「Ｄ」、「Ｅ」）の記録情報内の単語とが比較され、参考単語が抽出される。例えば、患者ＩＤ「Ａ」の患者と類似度が高い患者の傾向として、甲状腺炎に関する単語が多く出現している。そして薬剤として「レボチロキシンナトリウム水和物（Levothyroxine sodium hydrate）」の出現回数が多い傾向にある。患者ＩＤ「Ａ」の患者の傾向としては、「重症筋無力症」や「機能低下症」の単語が出現されていない。そこで「重症筋無力症」や「機能低下症」の単語が、参考単語として抽出され、レコメンデーション結果として送信される。

　このようにして、対象患者と似た内容の電子カルテに対応する類似患者を検出し、その患者の電子カルテから、対象患者の診療に役に立つ単語（キーワード）を抽出し、例えば対象患者の担当医に提示することができる。その結果、診療方針の決定に際して、患者の症状に応じた重要な検討事項の検討漏れを抑止し、対象患者の診療方針を的確に判断することができ、診療品質を向上させることができる。また、診療方針の決定に際して、医師個人の能力に依存する度合いを低下させ、高いレベルで均質な医療を提供することができる。

　しかも、対象患者の診療録に含まれる複数の記録情報それぞれと、他の患者の診療録に含まれる複数の記録情報それぞれとの類似度を計算し、他の患者ごとに記録情報の類似度を合計し、類似度の合計値が高い方から所定数の患者を類似患者としている。これにより、対象患者の担当医は、多数の類似患者に対する診療内容を参考にして、適切な診療方針を判断することができる。とくに大規模の病院では大量の電子カルテの蓄積があるため、過去の様々な患者の診療記録を参考に対象患者の診療方針を決定できることで、より適切な診療が可能となる。

　さらに、類似患者の検出において、対象患者の診療録に含まれる複数の記録情報それぞれに対し、類似度が高い方から上位所定数の他の患者の記録情報を抽出し、他の患者ごとに、抽出された記録情報の類似度を合計している。これにより、参考にならない記録情報については、記録情報を抽出段階で排除される。その結果、対象患者に類似する病状の患者が、他の治療を受けていることによって、その患者の電子カルテに、対象患者の参考とはならない記録情報が大量に含まれていても、病状の類似する患者を適切に見つけ出すことができる。例えば、対象患者が、糖尿病の治療を受けている場合を考える。その場合、他の糖尿病患者が類似患者として抽出されることが期待される。ここで、ある糖尿病患者が、糖尿病とは関係なく、皮膚科の治療を長期に渡って受けていたものとする。このような場合において、もし電子カルテ全体で比較を行うと、その糖尿病患者の糖尿病に関連する単語の出現割合が低下し、その糖尿病患者が類似患者と判定されない可能性がある。他方、第２の実施の形態に示すように、個々の記録情報間で類似関係の比較を行い、類似度の低い記録情報を除外することで、糖尿病以外の診療に関する記録情報は除外され、糖尿病患者が正しく類似患者と判定される。すなわち、類似患者判定の精度が向上する。

　また、記録情報間の類似度の計算では、記録情報の種類に応じた重み付けを行うことができる。例えば、類似度計算対象の２つの記録情報の内容に基づく類似度の計算結果に、２つの記録情報それぞれの重みを乗算し、乗算結果を該２つの記録情報間の類似度とすることができる。例えば医師による診療の記録情報の重みを、看護師による看護の記録情報より高く設定できる。これにより、医師が方針の決定に際し、他の医師の診療内容を参考にすることができる。看護師が、患者の症状に応じた適切な看護手法のレコメンデーションを要求する場合、看護師による診療の記録情報の重みを、医師師による看護の記録情報より高く設定することで、適切なレコメンデーション結果を受け取ることができる。

　また記録情報に身体情報を含めることで、患者の年齢、性別、体重、身長などが類似し、且つ患者の診察内容が類似する他の患者に対して行われて、対象患者に対して行われていない治療を示す単語を、レコメンデーション結果として出力することができる。

　さらに身体情報を含む記録情報の重みを、例えば他の種類の記録情報よりも高く設定することもできる。身体情報の重みを最も高く設定することで、対象患者と身体的特徴が近い他の患者を優先的に類似患者とすることができる。このような重み付けによりレコメンデーションを行えば、例えば性別や年齢によって病状や治療内容が異なるような病気に関する診療方針の決定に有用な単語を、レコメンデーション結果として取得できる。

　さらに、類似患者の診療録に含まれる複数の記録情報に出現する単語のうち、前記対象患者の診療録に出現しない単語を抽出することで、参考にならない単語が抽出されることを抑止できる。その結果、レコメンデーション結果を取得した医師は、無駄な単語に惑わされることなく、レコメンデーション結果に基づく診療方針の決定を迅速に行うことができる。

　上記については単に本発明の原理を示すものである。さらに、多数の変形、変更が当業者にとって可能であり、本発明は上記に示し、説明した正確な構成および応用例に限定されるものではなく、対応するすべての変形例および均等物は、添付の請求項およびその均等物による本発明の範囲とみなされる。

　１　記憶手段
　１ａ，１ｂ，１ｃ，・・・　診療録
　１ａ－１，１ａ－２，１ａ－３，１ｂ－１，１ｂ－２，１ｂ－３，・・・　記録情報
　２　特定手段
　３　類似患者情報
　４　抽出手段
　５，６　単語配列
　７　参考単語
　Ｓ　医療情報解析装置

Claims

　コンピュータに、
　複数の患者の診療録を参照し、診療録が第１の患者と類似する第２の患者を特定し、
　前記第２の患者の診療録から情報を抽出する、
　処理をコンピュータに実行させる医療情報解析プログラム。
　前記第２の患者の特定では、前記第１の患者の診療録に含まれる複数の記録情報それぞれと、他の患者の診療録に含まれる複数の記録情報それぞれとの類似度を計算し、他の患者ごとに記録情報間の類似度を合計することを特徴とする請求の範囲第１項記載の医療情報解析プログラム。
　前記第２の患者の特定では、前記第１の患者の診療録に含まれる複数の記録情報それぞれに対し、類似度が高い方から上位所定数の他の患者の記録情報を抽出し、他の患者ごとに、抽出された記録情報の類似度を合計することを特徴とする請求の範囲第２項記載の医療情報解析プログラム。
　記録情報間の類似度の計算では、記録情報の種類に応じて重み付けを行い、類似度計算対象の２つの記録情報の内容に基づく類似度の計算結果に、該２つの記録情報それぞれの重みを乗算し、乗算結果を該２つの記録情報間の類似度とすることを特徴とする請求の範囲第２項または第３項記載の医療情報解析プログラム。
　前記複数の患者の診療録は、患者の身体的特徴を示す身体情報を含むことを特徴とする請求の範囲第１項乃至第４項のいずれかに記載の医療情報解析プログラム。
　前記第２の患者の特定では、前記第１の患者の診療録と他の患者の診療録との間の類似度を計算し、類似度が高い方から所定数の他の患者を、前記第２の患者とすることを特徴とする請求の範囲第１項乃至第５項のいずれかに記載の医療情報解析プログラム。
　単語の抽出では、前記第２の患者の診療録に出現する単語のうち、前記第１の患者の診療録に出現しない単語を抽出することを特徴とする請求の範囲第１項乃至第６項記載の医療情報解析プログラム。
　複数の患者の診療録を参照し、診療録が第１の患者と類似する第２の患者を特定する特定手段と、
　前記第２の患者の診療録から情報を抽出する抽出手段と、
　を有する医療情報解析装置。
　コンピュータが、
　複数の患者の診療録を参照し、診療録が第１の患者と類似する第２の患者を特定し、
　前記第２の患者の診療録から情報を抽出する、
　医療情報解析方法。