JP6652986B2

JP6652986B2 - 危険行動予測装置、予測モデル生成装置および危険行動予測用プログラム

Info

Publication number: JP6652986B2
Application number: JP2018088828A
Authority: JP
Inventors: 博義豊柴; 秀文内山
Original assignee: Fronteo Inc
Current assignee: Fronteo Inc
Priority date: 2018-05-02
Filing date: 2018-05-02
Publication date: 2020-02-26
Anticipated expiration: 2038-05-02
Also published as: WO2019212005A1; JP2019194807A; KR20200128752A; US20210090748A1; EP3779727A4; CN112074825A; KR102280664B1; EP3779727A1

Description

本発明は、危険行動予測装置、予測モデル生成装置および危険行動予測用プログラムに関し、特に、患者が転倒または転落などの危険行動を起こす可能性を予測する技術および、この予測に用いる予測モデルを生成する技術に関するものである。

近年、インシデントを予防することが様々な産業分野において重要視されている。医療分野でも、医療事故を防ぐために様々な方策が検討されている。例えば、インシデントレポートを記録し、医療事故に繋がり得る危険な行為をインシデントレポートに基づいて管理することにより、医療事故を未然に防止するためのシステムが提供されている。

ところで、医療事故には、医師や看護師等の医療行為に起因する事故の他に、患者側の事情に起因する事故、例えば、患者の転倒が存在する。医師や看護師等による医療行為の質を向上させることによって、前者の事故を極力防ぐようにすることはできるが、患者側の要因が大きい後者の事故を防ぐことはそもそも難しい。したがって、従来の対策では、患者の行動を一律に規制するなど、大まかな対応しか講じ得なかったのが実情であった。

なお、特許文献１には、患者の危険行動（転倒または落下など）を予測する装置が開示されている。特許文献１に記載の行動予測装置では、患者の危険行動に関するインシデントレポートと紐付けられることによって危険行動が特定されたカルテ情報である既判断カルテ情報からあらかじめ抽出された、当該危険行動に関連する医療情報を記憶部に格納する。関係性評価部は、インシデントレポートが紐付けられていない未判断カルテ情報を取得して、記憶部に格納された危険行動に関連する医療情報をもとに、未判断カルテ情報と当該未判断カルテ情報に対応する患者が取り得る危険行動との関係性を評価する。予測部は、関係性評価部の評価結果に応じて、未判断カルテ情報に対応する患者の危険行動を予測する。

具体的には、特許文献１に記載の行動予測装置は、カルテ情報に含まれるデータ要素（患者の感情表現を含むデータ要素、例えば、「楽になった」、「痛い」、「苦しい」などの形態素）に対する感情評価を対応付けて記憶部に記憶する。また、行動予測装置は、カルテ情報に含まれるテキストについて、あらかじめ定められたキーワード（感情に関する文言）が当該テキストに含まれるか否かを探索する。そして、含まれていた場合に、所定の基準に従って算出した感情スコアを当該キーワードに対応付けて記憶部に記憶しておく。

一方、行動予測装置は、未判断カルテ情報から、あらかじめ定められた感情に係るキーワードを抽出し、抽出したキーワードに対応付けられている感情スコアを記憶部から取得して、キーワード各々の感情スコアを統合することにより、当該未判断カルテ情報の感情スコアとする。例えば、未判断カルテ情報のテキスト中に「最近、足が痛い。立ち上がるときにフラフラする。」という文章が含まれていたとする。そして、キーワードとして「痛い」、「フラフラ」が記憶部にあらかじめ格納され、それぞれ「＋１．４」、「＋０．９」という感情スコアが対応付けられているとする。この場合、行動予測装置は、両者を加算して「＋２．３」という感情スコアを算出する。そして、行動予測装置は、当該感情スコアに基づいて患者の危険行動（転倒）を予測する。

特許第５９７７８９８号公報

上記特許文献１のような機械学習によって転倒の予測を行う場合に、予測の精度を上げるためには、学習によって生成する予測モデルの精度を上げることが欠かせない。しかしながら、上記特許文献１に記載の行動予測装置では、予測に使用するスコアを、ただ単に、あらかじめ定められた感情に係るキーワードがカルテ情報の中にどの程度含まれているかによって計算しているだけであり、これによって生成される予測モデルは、算出されたスコアをキーワードに対応付けて記憶しただけの極めて単純なものである。このため、予測の精度を十分に上げることが難しいという問題があった。

本発明は、このような問題を解決するために成されたものであり、電子カルテなどの医療情報に含まれる文章を対象とした解析により、転倒や転落など人に起因する危険行動の発生を精度よく予測することができるようにすることを目的とする。

上記した課題を解決するために、本発明の危険行動予測装置では、危険行動を起こしたか否かについて既知である患者に関する医療情報に含まれるｍ個の文章を学習用データとして入力し、当該入力されたｍ個の文章を解析して当該ｍ個の文章からｎ個の単語を抽出し、ｍ個の文章をそれぞれ所定のルールに従ってｑ次元にベクトル化することにより、ｑ個の軸成分から成るｍ個の文章ベクトルを算出するとともに、ｎ個の単語をそれぞれ所定のルールに従ってｑ次元にベクトル化することにより、ｑ個の軸成分から成るｎ個の単語ベクトルを算出し、さらに、ｍ個の文章ベクトルとｎ個の単語ベクトルとの内積をそれぞれとることにより、ｍ個の文章およびｎ個の単語間の関係性を反映したｍ×ｎ個の類似性指標値を算出する。そして、１つの文章についてｎ個の類似性指標値から成る文章指標値群をもとに、危険行動が発生する可能性の高さについてｍ個の文章を分類するための分類モデルを生成するようにしている。予測対象とする患者について危険行動を起こす可能性を予測する際には、予測対象とする患者に関する医療情報に含まれるｍ’個の文章を予測用データとして入力し、当該入力した予測用データに対して単語抽出、文章ベクトル算出、単語ベクトル算出および指標値算出の各処理を実行することによって得られる類似性指標値を分類モデルに適用することにより、予測対象とする患者が危険行動を起こす可能性を予測するようにしている。

上記のように構成した本発明によれば、患者の医療情報に含まれる文章から算出された文章ベクトルと、文章内に含まれる単語から算出された単語ベクトルとの内積を計算することによって、文章および単語間の関係性を反映した類似性指標値が算出されるので、どの単語がどの文章に対してどの程度寄与しているのか、あるいは、どの文章がどの単語に対してどの程度寄与しているのかを内積の値として得ることができる。そして、このような性質を有する類似性指標値を用いて分類モデルが生成されるので、ｍ個の文章とｎ個の単語との寄与度を加味した上で、危険行動が発生する可能性の高さについて、各患者に対応する文章を適切に分類することができるようになる。よって、本発明によれば、患者が危険行動を起こす可能性の予測を行う装置において、学習によって生成する分類モデルの精度を上げて、危険行動の発生を精度よく予測することができるようになる。

本実施形態による危険行動予測装置の機能構成例を示すブロック図である。本実施形態による危険行動予測装置の動作例を示すフローチャートである。本実施形態による危険行動予測装置の他の機能構成例を示すブロック図である。

以下、本発明の一実施形態を図面に基づいて説明する。図１は、本実施形態による危険行動予測装置の機能構成例を示すブロック図である。本実施形態の危険行動予測装置は、その機能構成として、学習用データ入力部１０、単語抽出部１１、ベクトル算出部１２、指標値算出部１３、分類モデル生成部１４、予測用データ入力部２０および危険行動予測部２１を備えて構成されている。ベクトル算出部１２は、より具体的な機能構成として、文章ベクトル算出部１２Ａおよび単語ベクトル算出部１２Ｂを備えている。また、本実施形態の危険行動予測装置は、記憶媒体として、分類モデル記憶部３０を備えている。

なお、以下の説明の便宜上、単語抽出部１１、ベクトル算出部１２および指標値算出部１３で構成される部分を類似性指標値算出部１００と称する。類似性指標値算出部１００は、文章に関する文章データを入力し、文章とその中に含まれる単語との関係性を反映した類似性指標値を算出して出力するものである。また、本実施形態の危険行動予測装置は、患者の電子カルテ（特許請求の範囲の医療情報に相当）に含まれる文章を類似性指標値算出部１００が解析することによって算出される類似性指標値を利用して、電子カルテに含まれる文章の内容から、患者が危険行動（例えば、歩行中や入浴中の転倒、またはベッドや便座等からの転落など。以下、単に転倒転落という）を起こす可能性を予測するものである。なお、学習用データ入力部１０、類似性指標値算出部１００および分類モデル生成部１４により、本発明の予測モデル生成装置が構成される。

上記各機能ブロック１０〜１４，２０〜２１は、ハードウェア、ＤＳＰ（Digital Signal Processor）、ソフトウェアの何れによっても構成することが可能である。例えばソフトウェアによって構成する場合、上記各機能ブロック１０〜１４，２０〜２１は、実際にはコンピュータのＣＰＵ、ＲＡＭ、ＲＯＭなどを備えて構成され、ＲＡＭやＲＯＭ、ハードディスクまたは半導体メモリ等の記録媒体に記憶されたプログラムが動作することによって実現される。

学習用データ入力部１０は、転倒転落の危険行動を起こしたか否かについて既知である患者に関する電子カルテに含まれるｍ個（ｍは２以上の任意の整数）の文章を学習用データとして入力する。例えば、学習用データ入力部１０は、入院中における転倒転落の発生の有無が電子カルテあるいは他の報告書の記述により報告されている過去の入院患者の電子カルテを入力し、当該電子カルテに含まれている診療記録テキストから成る文章を学習用データとして入力する。

電子カルテには、患者の氏名、生年月日、血液型、性別などの個人情報のほかに、診療科、診察日、診療記録テキストなどが含まれている。学習用データ入力部１０は、電子カルテの中の診療記録テキストの部分を学習用データとして使用することを設定した状態で、電子カルテを入力する（厳密に言うと、電子カルテを入力して、その電子カルテの中の診療記録テキストの文章を学習用データとして使用する）。なお、学習用データ入力部１０により入力する診療記録テキストの文章、つまり、後述の解析対象とする文章は、１つのセンテンス（句点によって区切られる単位）から成るものであってもよいし、複数のセンテンスから成るものであってもよい。

単語抽出部１１は、学習用データ入力部１０により入力されたｍ個の文章を解析し、当該ｍ個の文章からｎ個（ｎは２以上の任意の整数）の単語を抽出する。文章の解析方法としては、例えば、公知の形態素解析を用いることが可能である。ここで、単語抽出部１１は、形態素解析によって分割される全ての品詞の形態素を単語として抽出するようにしてもよいし、特定の品詞の形態素のみを単語として抽出するようにしてもよい。

なお、ｍ個の文章の中には、同じ単語が複数含まれていることがある。この場合、単語抽出部１１は、同じ単語を複数個抽出することはせず、１つのみ抽出する。すなわち、単語抽出部１１が抽出するｎ個の単語とは、ｎ種類の単語という意味である。ここで、単語抽出部１１は、ｍ個の電子カルテ中の文章から同じ単語が抽出される頻度を計測し、出現頻度が大きい方からｎ個（ｎ種類）の単語、あるいは出現頻度が閾値以上であるｎ個（ｎ種類）の単語を抽出するようにしてもよい。

ベクトル算出部１２は、ｍ個の文章およびｎ個の単語から、ｍ個の文章ベクトルおよびｎ個の単語ベクトルを算出する。ここで、文章ベクトル算出部１２Ａは、単語抽出部１１による解析対象とされたｍ個の文章をそれぞれ所定のルールに従ってｑ次元にベクトル化することにより、ｑ個（ｑは２以上の任意の整数）の軸成分から成るｍ個の文章ベクトルを算出する。また、単語ベクトル算出部１２Ｂは、単語抽出部１１により抽出されたｎ個の単語をそれぞれ所定のルールに従ってｑ次元にベクトル化することにより、ｑ個の軸成分から成るｎ個の単語ベクトルを算出する。

本実施形態では、一例として、以下のようにして文章ベクトルおよび単語ベクトルを算出する。今、ｍ個の文章とｎ個の単語とから成る集合Ｓ＝＜ｄ∈Ｄ，ｗ∈Ｗ＞を考える。ここで、各文章ｄ_ｉ（ｉ＝１，２，・・・，ｍ）および各単語ｗ_ｊ（ｊ＝１，２，・・・，ｎ）に対してそれぞれ文章ベクトルｄ_ｉ→および単語ベクトルｗ_ｊ→（以下では、記号“→”はベクトルであることを指すものとする）を関連付ける。そして、任意の単語ｗ_ｊと任意の文章ｄ_ｉに対して、次の式(1)に示す確率Ｐ（ｗ_ｊ｜ｄ_ｉ）を計算する。

なお、この確率Ｐ（ｗ_ｊ｜ｄ_ｉ）は、例えば、文章や文書をパラグラフ・ベクトルにより評価することについて記述した論文「“Distributed Representations of Sentences and Documents”by Quoc Le and Tomas Mikolov, Google Inc, Proceedings of the 31st International Conference on Machine Learning Held in Bejing, China on 22-24 June 2014」に開示されている確率ｐに倣って算出することが可能な値である。この論文には、例えば、“the”、“cat”、“sat”という３つの単語があるときに、４つ目の単語として“on”を予測するとあり、その予測確率ｐの算出式が掲載されている。当該論文に記載されている確率ｐ（wt｜wt-k,・・・,wt+k）は、複数の単語wt-k,・・・,wt+kから別の１つの単語wtを予測したときの正解確率である。

これに対し、本実施形態で用いる式(1)に示される確率Ｐ（ｗ_ｊ｜ｄ_ｉ）は、ｍ個の文章のうち一の文章ｄ_ｉから、ｎ個の単語のうち一の単語ｗ_ｊが予想される正解確率を表している。１つの文章ｄ_ｉから１つの単語ｗ_ｊを予測するというのは、具体的には、ある文章ｄ_ｉが出現したときに、その中に単語ｗ_ｊが含まれる可能性を予測するということである。

式(1)では、ｅを底とし、単語ベクトルｗ→と文章ベクトルｄ→との内積値を指数とする指数関数値を用いる。そして、予測対象とする文章ｄ_ｉと単語ｗ_ｊとの組み合わせから計算される指数関数値と、文章ｄ_ｉとｎ個の単語ｗ_ｋ（ｋ＝１，２，・・・，ｎ）との各組み合わせから計算されるｎ個の指数関数値の合計値との比率を、一の文章ｄ_ｉから一の単語ｗ_ｊが予想される正解確率として計算している。

ここで、単語ベクトルｗ_ｊ→と文章ベクトルｄ_ｉ→との内積値は、単語ベクトルｗ_ｊ→を文章ベクトルｄ_ｉ→の方向に投影した場合のスカラ値、つまり、単語ベクトルｗ_ｊ→が有している文章ベクトルｄ_ｉ→の方向の成分値とも言える。これは、単語ｗ_ｊが文章ｄ_ｉに寄与している程度を表していると考えることができる。したがって、このような内積を利用して計算される指数関数値を用いて、ｎ個の単語ｗ_ｋ（ｋ＝１，２，・・・，ｎ）について計算される指数関数値の合計に対する、１つの単語ｗ_ｊについて計算される指数関数値の比率を求めることは、１つの文章ｄ_ｉからｎ個の単語のうち１つの単語ｗ_ｊが予想される正解確率を求めることに相当する。

なお、式(1)は、ｄ_ｉとｗ_ｊについて対称なので、ｎ個の単語のうち一の単語ｗ_ｊから、ｍ個の文章のうち一の文章ｄ_ｉが予想される確率Ｐ（ｄ_ｉ｜ｗ_ｊ）を計算してもよい。１つの単語ｗ_ｊから１つの文章ｄ_ｉを予測するというのは、ある単語ｗ_ｊが出現したときに、それが文章ｄ_ｉの中に含まれる可能性を予測するということである。この場合、文章ベクトルｄ_ｉ→と単語ベクトルｗ_ｊ→との内積値は、文章ベクトルｄ_ｉ→を単語ベクトルｗ_ｊ→の方向に投影した場合のスカラ値、つまり、文章ベクトルｄ_ｉ→が有している単語ベクトルｗ_ｊ→の方向の成分値とも言える。これは、文章ｄ_ｉが単語ｗ_ｊに寄与している程度を表していると考えることができる。

なお、ここでは、単語ベクトルｗ→と文章ベクトルｄ→との内積値を指数とする指数関数値を用いる計算例を示したが、指数関数値を用いることを必須とするものではない。単語ベクトルｗ→と文章ベクトルｄ→との内積値を利用した計算式であればよく、例えば、内積値そのものの比率により確率を求めるようにしてもよい。

次に、ベクトル算出部１２は、次の式(2)に示すように、上記式(1)により算出される確率Ｐ（ｗ_ｊ｜ｄ_ｉ）を全ての集合Ｓについて合計した値Ｌを最大化するような文章ベクトルｄ_ｉ→および単語ベクトルｗ_ｊ→を算出する。すなわち、文章ベクトル算出部１２Ａおよび単語ベクトル算出部１２Ｂは、上記式(1)により算出される確率Ｐ（ｗ_ｊ｜ｄ_ｉ）を、ｍ個の文章とｎ個の単語との全ての組み合わせについて算出し、それらを合計した値を目標変数Ｌとして、当該目標変数Ｌを最大化する文章ベクトルｄ_ｉ→および単語ベクトルｗ_ｊ→を算出する。

ｍ個の文章とｎ個の単語との全ての組み合わせについて算出した確率Ｐ（ｗ_ｊ｜ｄ_ｉ）の合計値Ｌを最大化するというのは、ある文章ｄ_ｉ（ｉ＝１，２，・・・，ｍ）からある単語ｗ_ｊ（ｊ＝１，２，・・・，ｎ）が予想される正解確率を最大化するということである。つまり、ベクトル算出部１２は、この正解確率が最大化するような文章ベクトルｄ_ｉ→および単語ベクトルｗ_ｊ→を算出するものと言える。

ここで、本実施形態では、上述したように、ベクトル算出部１２は、ｍ個の文章ｄ_ｉをそれぞれｑ次元にベクトル化することにより、ｑ個の軸成分から成るｍ個の文章ベクトルｄ_ｉ→を算出するとともに、ｎ個の単語をそれぞれｑ次元にベクトル化することにより、ｑ個の軸成分から成るｎ個の単語ベクトルｗ_ｊ→を算出する。これは、ｑ個の軸方向を可変として、上述の目標変数Ｌが最大化するような文章ベクトルｄ_ｉ→および単語ベクトルｗ_ｊ→を算出することに相当する。

指標値算出部１３は、ベクトル算出部１２により算出されたｍ個の文章ベクトルｄ_ｉ→とｎ個の単語ベクトルｗ_ｊ→との内積をそれぞれとることにより、ｍ個の文章ｄ_ｉおよびｎ個の単語ｗ_ｊ間の関係性を反映したｍ×ｎ個の類似性指標値を算出する。本実施形態では、指標値算出部１３は、次の式(3)に示すように、ｍ個の文章ベクトルｄ_ｉ→の各ｑ個の軸成分（ｄ₁₁〜ｄ_mq）を各要素とする文章行列Ｄと、ｎ個の単語ベクトルｗ_ｊ→の各ｑ個の軸成分（ｗ₁₁〜ｗ_nq）を各要素とする単語行列Ｗとの積をとることにより、ｍ×ｎ個の類似性指標値を各要素とする指標値行列ＤＷを算出する。ここで、Ｗ^ｔは単語行列の転置行列である。

このようにして算出された指標値行列ＤＷの各要素は、どの単語がどの文章に対してどの程度寄与しているのかを表したものと言える。例えば、１行２列の要素ｄｗ₁₂は、単語ｗ₂が文章ｄ₁に対してどの程度寄与しているのかを表した値である。これにより、指標値行列ＤＷの各行は文章の類似性を評価するものとして用いることが可能であり、各列は単語の類似性を評価するものとして用いることが可能である。

分類モデル生成部１４は、指標値算出部１３により算出されたｍ×ｎ個の類似性指標値を用いて、１つの文章ｄ_ｉ（ｉ＝１，２，・・・，ｍ）についてｎ個の類似性指標値ｄｗ_ｊ（ｊ＝１，２，・・・，ｎ）から成る文章指標値群をもとに、転倒転落が発生する可能性の高さについてｍ個の文章ｄ_ｉをそれぞれ２つに分類するための分類モデルを生成する。すなわち、分類モデル生成部１４は、転倒転落を起こしたことが既知である患者の電子カルテをもとに算出される文章指標値群については「転倒転落あり」に分類され、転倒転落を起こしていないことが既知である患者の電子カルテをもとに算出される文章指標値群については「転倒転落なし」に分類されるような分類モデルを生成する。そして、分類モデル生成部１４は、生成した分類モデルを分類モデル記憶部３０に記憶させる。

ここで、文章指標値群とは、例えば１つ目の文章ｄ_１の場合、指標値行列ＤＷの１行目に含まれるｎ個の類似性指標値ｄｗ₁₁〜ｄｗ_1nがこれに該当する。同様に、２つ目の文章ｄ₂の場合、指標値行列ＤＷの２行目に含まれるｎ個の類似性指標値ｄｗ₂₁〜ｄｗ_2nがこれに該当する。以下、ｍ個目の文章ｄ_mに関する文章指標値群（ｎ個の類似性指標値ｄｗ_m1〜ｄｗ_mn）まで同様である。

分類モデル生成部１４は、例えば、各文章ｄ_ｉの文章指標値群についてそれぞれ特徴量を算出し、当該算出した特徴量の値に応じて、マルコフ連鎖モンテカルロ法による２群分離の最適化を行うことにより、各文章ｄ_ｉを２つの事象に分類するための分類モデルを生成する。ここで、分類モデル生成部１４が生成する分類モデルは、文章指標値群を入力として、予測したい２つの事象（転倒転落の発生の可能性の有無）のうち何れかを解として出力する学習モデルである。あるいは、転倒転落の「可能性あり」に分類される確率を数値として出力する学習モデルとしてもよい。学習モデルの形態は任意である。

例えば、分類モデル生成部１４が生成する分類モデルの形態は、回帰モデル（線形回帰、ロジスティック回帰、サポートベクターマシーンなどをベースとする学習モデル）、木モデル（決定木、回帰木、ランダムフォレスト、勾配ブースティング木などをベースとする学習モデル）、ニューラルネットワークモデル（パーセプトロン、畳み込みニューラルネットワーク、再起型ニューラルネットワーク、残差ネットワーク、ＲＢＦネットワーク、確率的ニューラルネットワーク、スパイキングニューラルネットワーク、複素ニューラルネットワークなどをベースとする学習モデル）、ベイズモデル（ベイズ推論などをベースとする学習モデル）、クラスタリングモデル（ｋ近傍法、階層型クラスタリング、非階層型クラスタリング、トピックモデルなどをベースとする学習モデル）などのうち何れかとすることが可能である。なお、ここに挙げた分類モデルは一例に過ぎず、これに限定されるものではない。

予測用データ入力部２０は、予測対象とする患者に関する電子カルテに含まれるｍ’個（ｍ’は１以上の任意の整数）の文章を予測用データとして入力する。例えば、予測用データ入力部２０は、本実施形態の危険行動予測装置を導入している病院における現在の入院患者の人数分の電子カルテを入力し、当該電子カルテに含まれている診療記録テキストから成る文章を予測用データとして入力する。

実際の病院の運用としては、予測用データ入力部２０によって各入院患者の電子カルテの入力を定期的に（例えば、毎日）行い、危険行動予測部２１によって各入院患者の転倒転落の予測を定期的に行うのが好ましい。例えば、予測用データ入力部２０は、電子カルテのデータを保存した電子カルテシステム（図示せず）から各入院患者の電子カルテを定期的に入力するようにしてよい。電子カルテ内の診療記録テキストの記述は、医師による日次の診療を通じて更新されている可能性がある。よって、更新され得る診療記録テキストの文章の内容に基づいて、各入院患者の転倒転落の予測を日次で行うことになる。

ここで、予測用データ入力部２０が入力する電子カルテは、転倒転落の発生の可能性が未知の患者、および、転倒転落の発生の可能性が現時点ではないと予測されている患者の電子カルテとする。転倒転落の発生の可能性があると既に予測されている患者の電子カルテは必ずしも入力対象としなくてもよい。ただし、患者の症状や体調の改善によって転倒転落の発生の可能性がなくなる可能性もあるので、転倒転落の発生の可能性があると既に予測されている患者の電子カルテを入力対象に含めてもよい。

なお、電子カルテの更新履歴と、転倒転落の予測実施履歴とを患者ごとに記録したデータベースを作成し、予測用データ入力部２０がこのデータベースの履歴情報に基づいて、予測対象とする患者の電子カルテを電子カルテシステムから選択的に入力するようにしてもよい。例えば、予測用データ入力部２０は、電子カルテの更新が行われていて、その更新よりも後に転倒転落の予測処理が実行されていないことが履歴情報により示されている患者の電子カルテを電子カルテシステムから検索して入力するようにしてもよい。

危険行動予測部２１は、予測用データ入力部２０により入力された予測用データに対して、類似性指標値算出部１００の単語抽出部１１、ベクトル算出部１２および指標値算出部１３の処理を実行することによって得られる類似性指標値を、分類モデル生成部１４により生成された分類モデル（分類モデル記憶部３０に記憶された分類モデル）に適用することにより、予測対象とする患者が転倒転落の危険行動を起こす可能性を予測する。

例えば、予測用データ入力部２０により電子カルテ内に含まれるｍ’個の診療記録テキストの文章が予測用データとして入力された場合、危険行動予測部２１の指示によりこのｍ’個の診療記録テキストの文章について類似性指標値算出部１００の処理を実行することにより、ｍ’個の文章指標値群を得る。危険行動予測部２１は、類似性指標値算出部１００により算出されたｍ’個の文章指標値群を１つずつ分類モデルに入力データとして与えることにより、ｍ’個の文章のそれぞれについて、患者の転倒転落の発生の可能性を予測する。

ここで、単語抽出部１１は、ｍ個の学習用データから抽出したｎ個の単語と同じ単語をｍ’個の予測用データから抽出するのが好ましい。予測用データから抽出されるｎ個の単語から成る文章指標値群が、学習用データから抽出されたｎ個の単語から成る文章指標値群と同じ単語を要素とするものとなるので、分類モデル記憶部３０に記憶された分類モデルに対する適合度が高くなるからである。ただし、学習時と同じｎ個の単語を予測時にも抽出することを必須とするものではない。学習時とは異なる単語の組み合わせによって予測用の文章指標値群が生成される場合、分類モデルに対する適合度が低くなるものの、適合度が低いということ自体も評価の一要素として、事象に該当する可能性を予測すること自体は可能だからである。

図２は、上記のように構成した本実施形態による危険行動予測装置の動作例を示すフローチャートである。図２（ａ）は、分類モデルを生成する学習時の動作例を示し、図２（ｂ）は、生成された分類モデルを用いて転倒転落の発生の可能性の予測を行う予測時の動作例を示している。

図２（ａ）に示す学習時において、まず、学習用データ入力部１０は、転倒転落の危険行動を起こしたか否かについて既知である患者に関する電子カルテに含まれるｍ個の文章（診療記録テキスト）を学習用データとして入力する（ステップＳ１）。単語抽出部１１は、学習用データ入力部１０により入力されたｍ個の文章を解析し、当該ｍ個の文章からｎ個の単語を抽出する（ステップＳ２）。

次いで、ベクトル算出部１２は、学習用データ入力部１０により入力されたｍ個の文章および単語抽出部１１により抽出されたｎ個の単語から、ｍ個の文章ベクトルｄ_ｉ→およびｎ個の単語ベクトルｗ_ｊ→を算出する（ステップＳ３）。そして、指標値算出部１３は、ｍ個の文章ベクトルｄ_ｉ→とｎ個の単語ベクトルｗ_ｊ→との内積をそれぞれとることにより、ｍ個の文章ｄ_ｉおよびｎ個の単語ｗ_ｊ間の関係性を反映したｍ×ｎ個の類似性指標値（ｍ×ｎ個の類似性指標値を各要素とする指標値行列ＤＷ）を算出する（ステップＳ４）。

さらに、分類モデル生成部１４は、指標値算出部１３により算出されたｍ×ｎ個の類似性指標値を用いて、１つの文章ｄ_ｉについてｎ個の類似性指標値ｄｗ_ｊから成る文章指標値群をもとに、転倒転落が発生する可能性の高さについてｍ個の文章ｄ_ｉを２つに分類するための分類モデルを生成し、生成した分類モデルを分類モデル記憶部３０に記憶させる（ステップＳ５）。以上により、学習時の動作が終了する。

図２（ｂ）に示す予測時において、まず、予測用データ入力部２０は、予測対象とする患者に関する電子カルテに含まれるｍ’個の文章（診療記録テキスト）を予測用データとして入力する（ステップＳ１１）。危険行動予測部２１は、予測用データ入力部２０により入力された予測用データを類似性指標値算出部１００に供給し、類似性指標値の算出を指示する。

この指示に応じて、単語抽出部１１は、予測用データ入力部２０により入力されたｍ’個の文章を解析し、当該ｍ’個の文章からｎ個の単語（学習用データから抽出されたものと同じ単語）を抽出する（ステップＳ１２）。なお、ｍ’個の文章の中にｎ個の単語が全て含まれているとは限らない。ｍ’個の文章の中に存在しない単語についてはＮｕｌｌ値となる。

次いで、ベクトル算出部１２は、予測用データ入力部２０により入力されたｍ’個の文章および単語抽出部１１により抽出されたｎ個の単語から、ｍ’個の文章ベクトルｄ_ｉ→およびｎ個の単語ベクトルｗ_ｊ→を算出する（ステップＳ１３）。

そして、指標値算出部１３は、ｍ’個の文章ベクトルｄ_ｉ→とｎ個の単語ベクトルｗ_ｊ→との内積をそれぞれとることにより、ｍ’個の文章ｄ_ｉおよびｎ個の単語ｗ_ｊ間の関係性を反映したｍ’×ｎ個の類似性指標値（ｍ’×ｎ個の類似性指標値を各要素とする指標値行列ＤＷ）を算出する（ステップＳ１４）。指標値算出部１３は、算出したｍ’×ｎ個の類似性指標値を危険行動予測部２１に供給する。

危険行動予測部２１は、類似性指標値算出部１００から供給されたｍ’×ｎ個の類似性指標値をもとに、ｍ’個の文章指標値群をそれぞれ分類モデル記憶部３０に記憶された分類モデルに適用することにより、ｍ’個の文章のそれぞれについて、予測対象とする患者が転倒転落の危険行動を起こす可能性を予測する（ステップＳ１５）。これにより、予測時の動作が終了する。

以上詳しく説明したように、本実施形態では、患者の電子カルテに含まれるｍ個の文章を学習用データとして入力し、当該入力された文章から算出した文章ベクトルと、文章内に含まれる単語から算出した単語ベクトルとの内積を計算することによって、文章および単語間の関係性を反映した類似性指標値を算出し、この類似性指標値を用いて分類モデルを生成している。これにより、どの単語がどの文章に対してどの程度寄与しているのか、あるいは、どの文章がどの単語に対してどの程度寄与しているのかを表した類似性指標値を用いて分類モデルが生成される。このため、ｍ個の文章とｎ個の単語との寄与度を加味した上で、電子カルテ内の文章を、転倒転落の発生の可能性の有無という２つの事象のうち何れかに適切に分類することができるようになる。よって、本実施形態によれば、患者が危険行動を起こす可能性の予測を行う装置において、学習によって生成する分類モデルの精度を上げて、危険行動の発生を精度よく予測することができるようになる。

なお、上記実施形態では、「転倒転落あり」および「転倒転落なし」の２つの事象のうちどちらに該当するかが既知である文章に関する文章データを学習用データとして用いる教師あり学習を適用した例について説明したが、これに強化学習を組み合わせるようにしてもよい。図３は、強化学習の仕組みを追加した他の実施形態に係る危険行動予測装置の機能構成例を示すブロック図である。

図３に示すように、他の実施形態に係る危険行動予測装置は、図１に示した構成に加えて実績データ入力部２２および報酬決定部２３を更に備えている。また、他の実施形態に係る危険行動予測装置は、図１に示した分類モデル生成部１４に代えて分類モデル生成部１４’を備えている。

実績データ入力部２２は、退院患者の電子カルテに含まれている危険行動記録レポートを実績データとして入力する。すなわち、電子カルテには、上述した患者の氏名、生年月日、血液型、性別、診療科、診察日、診療記録テキストのほかに、退院後サマリーの項目が含まれていることがある。この退院後サマリーは、患者の退院後に、入院中における患者の状態を要約として記述するための項目である。この退院後サマリーに、患者が入院中に危険行動を起こしたか否かの記録レポートが記述される。実績データ入力部２２は、この退院後サマリーに記述されている危険行動記録レポートの内容、つまり患者が入院中に危険行動を起こしたか否かの情報を実績データとして入力する。

なお、実績データ入力部２２による実績データの入力方法はこれに限定されない。例えば、患者が入院中に危険行動を起こしたか否かの情報が電子カルテの診療記録テキストに記述される場合もある。よって、実績データ入力部２２は、診療記録テキストに記述されている危険行動記録レポートの内容を実績データとして入力するようにしてもよい。

具体的には、実績データ入力部２２は、退院後サマリーまたは診療記録テキストに記述されている文章を解析することによって、患者が入院中に危険行動を起こしたか否かを判定し、その判定結果を実績データとして入力する。あるいは、退院後サマリーまたは診療記録テキストに記述されている文章を医師や看護師等の医療従事者が目視により確認し、医師や看護師等の医療従事者がキーボードやタッチパネル等の入力デバイスを操作することによって入力した情報を実績データ入力部２２が入力することにより、退院患者の入院中における危険行動の発生の有無を実績データとして入力するようにしてもよい。

報酬決定部２３は、危険行動予測部２１により予測された転倒転落の発生の可能性に対し、実績データ入力部２２より入力された転倒転落の発生の実績に応じて、分類モデル生成部１４’に与える報酬を決定する。例えば、報酬決定部２３は、危険行動予測部２１により予測された転倒転落の発生の可能性を示す予測データと、実績データ入力部２２により入力された実績データとが一致している場合にはプラスの報酬を与えるように決定し、一致していない場合は無報酬またはマイナスの報酬を与えるように決定する。

分類モデル生成部１４’は、図１に示した分類モデル生成部１４と同様に、学習用データ入力部１０により入力された学習用データをもとに、分類モデルを生成し、分類モデル記憶部３０に記憶させる。これに加え、分類モデル生成部１４’は、報酬決定部２３により決定された報酬に応じて、分類モデル記憶部３０に記憶された分類モデルを改変する。このように、教師あり学習の仕組みに対して強化学習の仕組みを加えて分類モデルを生成することにより、分類モデルの精度を更に向上させることができる。

なお、上記実施形態では、学習および予測に使用する医療情報として電子カルテを用いる例について説明したが、例えば看護記録レポートなど、患者の危険行動の発生の可能性を予測し得る文章が含まれているものであれば、電子カルテ以外の医療情報を用いてもよい。

また、上記実施形態では、患者の危険行動として転倒転落の発生の可能性を予測する例について説明したが、本発明はこれに限定されない。すなわち、医師や看護師側ではなく患者側の事情に起因する危険行動の発生を予測することに広く利用することが可能である。

また、上記実施形態では、転倒転落が発生する可能性の高さについて文章を２つに分類する例について説明したが、３つ以上のランクに分類するようにしてもよい。

また、上記実施形態では、入院中の患者に関する転倒転落の発生を予測することについて説明したが、本発明はこれに限定されない。例えば、外来患者、在宅訪問治療の対象患者、遠隔医療システムを利用している遠隔治療患者など、電子カルテまたはそれに類する医療情報が存在する患者についても、在宅での転倒転落の発生の可能性を予測することが可能である。

また、上記実施形態では、病院において患者が危険行動を起こす可能性を予測することについて説明したが、介護施設などにおいて被介護者が危険行動を起こす可能性を予測することも可能である。本明細書および特許請求の範囲では、被介護者も「患者」に含まれる概念であるものとする。

その他、上記実施形態は、何れも本発明を実施するにあたっての具体化の一例を示したものに過ぎず、これによって本発明の技術的範囲が限定的に解釈されてはならないものである。すなわち、本発明はその要旨、またはその主要な特徴から逸脱することなく、様々な形で実施することができる。

１０学習用データ入力部
１１単語抽出部
１２ベクトル算出部
１２Ａ文章ベクトル算出部
１２Ｂ単語ベクトル算出部
１３指標値算出部
１４，１４’ 分類モデル生成部
２０予測用データ入力部
２１危険行動予測部
２２実績データ入力部
２３報酬決定部
３０分類モデル記憶部
１００類似性指標値算出部

Claims

危険行動を起こしたか否かについて既知である患者に関する医療情報に含まれるｍ個（ｍは２以上の任意の整数）の文章を学習用データとして入力する学習用データ入力部と、
上記学習用データ入力部により上記学習用データとして入力された上記ｍ個の文章を解析し、当該ｍ個の文章からｎ個（ｎは２以上の任意の整数）の単語を抽出する単語抽出部と、
上記ｍ個の文章をそれぞれ所定のルールに従ってｑ次元（ｑは２以上の任意の整数）にベクトル化することにより、ｑ個の軸成分から成るｍ個の文章ベクトルを算出する文章ベクトル算出部と、
上記ｎ個の単語をそれぞれ所定のルールに従ってｑ次元にベクトル化することにより、ｑ個の軸成分から成るｎ個の単語ベクトルを算出する単語ベクトル算出部と、
上記ｍ個の文章ベクトルと上記ｎ個の単語ベクトルとの内積をそれぞれとることにより、上記ｍ個の文章および上記ｎ個の単語間の関係性を反映したｍ×ｎ個の類似性指標値を算出する指標値算出部と、
上記指標値算出部により算出された上記ｍ×ｎ個の類似性指標値を用いて、１つの文章についてｎ個の類似性指標値から成る文章指標値群をもとに、上記危険行動が発生する可能性の高さについて上記ｍ個の文章を分類するための分類モデルを生成する分類モデル生成部と、
予測対象とする患者に関する医療情報に含まれるｍ’個（ｍ’は１以上の任意の整数）の文章を予測用データとして入力する予測用データ入力部と、
上記予測用データ入力部により入力された上記予測用データに対して上記単語抽出部、上記文章ベクトル算出部、上記単語ベクトル算出部および上記指標値算出部の処理を実行することによって得られる類似性指標値を、上記分類モデル生成部により生成された上記分類モデルに適用することにより、上記予測対象とする患者が上記危険行動を起こす可能性を予測する危険行動予測部とを備えたことを特徴とする危険行動予測装置。
上記文章ベクトル算出部および上記単語ベクトル算出部は、上記ｎ個の単語のうち一の単語から上記ｍ個の文章のうち一の文章が予想される確率、または、上記ｍ個の文章のうち一の文章から上記ｎ個の単語のうち一の単語が予想される確率を、上記ｍ個の文章と上記ｎ個の単語との全ての組み合わせについて算出して合計した値を目標変数とし、当該目標変数を最大化する文章ベクトルおよび単語ベクトルを算出することを特徴とする請求項１に記載の危険行動予測装置。
上記指標値算出部は、上記ｍ個の文章ベクトルの各ｑ個の軸成分を各要素とする文章行列と、上記ｎ個の単語ベクトルの各ｑ個の軸成分を各要素とする単語行列との積をとることにより、ｍ×ｎ個の上記類似性指標値を各要素とする指標値行列を算出することを特徴とする請求項１または２に記載の危険行動予測装置。
上記学習用データ入力部は、上記危険行動を起こしたか否かについて既知である患者の電子カルテを上記医療情報として入力し、当該電子カルテに含まれている診療記録テキストから成る文章を上記学習用データとして入力し、
上記予測用データ入力部は、現在の入院患者の電子カルテを上記医療情報として入力し、当該電子カルテに含まれている診療記録テキストから成る文章を上記予測用データとして入力することを特徴とする請求項１〜３の何れか１項に記載の危険行動予測装置。
退院患者の電子カルテに含まれている危険行動記録レポートを実績データとして入力する実績データ入力部と、
上記退院患者の入院時に上記危険行動予測部により予測された上記危険行動の発生可能性に対し、上記実績データ入力部により入力された上記実績データにより示される上記危険行動の発生実績に応じて、上記分類モデル生成部に与える報酬を決定する報酬決定部とを更に備え、
上記分類モデル生成部は、上記報酬決定部により決定された報酬に応じて、上記分類モデルを改変することを特徴とする請求項４に記載の危険行動予測装置。
危険行動を起こしたか否かについて既知である患者に関する医療情報に含まれるｍ個（ｍは２以上の任意の整数）の文章を学習用データとして入力する学習用データ入力部と、
上記学習用データ入力部により上記学習用データとして入力された上記ｍ個の文章を解析し、当該ｍ個の文章からｎ個（ｎは２以上の任意の整数）の単語を抽出する単語抽出部と、
上記ｍ個の文章をそれぞれ所定のルールに従ってｑ次元（ｑは２以上の任意の整数）にベクトル化することにより、ｑ個の軸成分から成るｍ個の文章ベクトルを算出する文章ベクトル算出部と、
上記ｎ個の単語をそれぞれ所定のルールに従ってｑ次元にベクトル化することにより、ｑ個の軸成分から成るｎ個の単語ベクトルを算出する単語ベクトル算出部と、
上記ｍ個の文章ベクトルと上記ｎ個の単語ベクトルとの内積をそれぞれとることにより、上記ｍ個の文章および上記ｎ個の単語間の関係性を反映したｍ×ｎ個の類似性指標値を算出する指標値算出部と、
上記指標値算出部により算出された上記ｍ×ｎ個の類似性指標値を用いて、１つの文章についてｎ個の類似性指標値から成る文章指標値群をもとに、上記危険行動が発生する可能性の高さについて上記ｍ個の文章を分類するための分類モデルを、上記文章から上記危険行動が発生する可能性を予測するための予測モデルとして生成する分類モデル生成部とを備えたことを特徴とする予測モデル生成装置。
上記文章ベクトル算出部および上記単語ベクトル算出部は、上記ｎ個の単語のうち一の単語から上記ｍ個の文章のうち一の文章が予想される確率、または、上記ｍ個の文章のうち一の文章から上記ｎ個の単語のうち一の単語が予想される確率を、上記ｍ個の文章と上記ｎ個の単語との全ての組み合わせについて算出して合計した値を目標変数とし、当該目標変数を最大化する文章ベクトルおよび単語ベクトルを算出することを特徴とする請求項６に記載の予測モデル生成装置。
上記指標値算出部は、上記ｍ個の文章ベクトルの各ｑ個の軸成分を各要素とする文章行列と、上記ｎ個の単語ベクトルの各ｑ個の軸成分を各要素とする単語行列との積をとることにより、ｍ×ｎ個の上記類似性指標値を各要素とする指標値行列を算出することを特徴とする請求項６または７に記載の予測モデル生成装置。
危険行動を起こしたか否かについて既知である患者に関する医療情報に含まれるｍ個（ｍは２以上の任意の整数）の文章を学習用データとして入力する学習用データ入力手段、
上記学習用データ入力手段により上記学習用データとして入力された上記ｍ個の文章を解析し、当該ｍ個の文章からｎ個（ｎは２以上の任意の整数）の単語を抽出する単語抽出手段、
上記ｍ個の文章をそれぞれ所定のルールに従ってｑ次元（ｑは２以上の任意の整数）にベクトル化するとともに、上記ｎ個の単語をそれぞれ所定のルールに従ってｑ次元にベクトル化することにより、ｑ個の軸成分から成るｍ個の文章ベクトルおよびｑ個の軸成分から成るｎ個の単語ベクトルを算出するベクトル算出手段、および
上記ｍ個の文章ベクトルと上記ｎ個の単語ベクトルとの内積をそれぞれとることにより、上記ｍ個の文章および上記ｎ個の単語間の関係性を反映したｍ×ｎ個の類似性指標値を算出する指標値算出手段、および
上記指標値算出手段により算出された上記ｍ×ｎ個の類似性指標値を用いて、１つの文章についてｎ個の類似性指標値から成る文章指標値群をもとに、上記危険行動が発生する可能性の高さについて上記ｍ個の文章を分類するための分類モデルを、上記文章から上記危険行動が発生する可能性を予測するための予測モデルとして生成する分類モデル生成手段、
としてコンピュータを機能させるための危険行動予測用プログラム。
予測対象とする患者に関する医療情報に含まれるｍ’個（ｍ’は１以上の任意の整数）の文章を予測用データとして入力する予測用データ入力手段、および
上記予測用データ入力手段により入力された上記予測用データに対して上記単語抽出手段、上記ベクトル算出手段および上記指標値算出手段の処理を実行することによって得られる類似性指標値を、上記分類モデル生成手段により生成された上記分類モデルに適用することにより、上記予測対象とする患者が上記危険行動を起こす可能性を予測する危険行動予測手段
としてコンピュータを更に機能させるための請求項９に記載の危険行動予測用プログラム。