本発明は、医療データ生成の際に、データ生成の作業を容易にすることで、作業負担を軽減し、医師の業務を支援するものである。以下に、図面を用いて本発明の実施形態に係る登録装置、生成方法及び医療データ生成プログラムについて説明する。なお、以下の説明において、登録装置は、医療データ管理システムに含まれるものとして説明する。また、以下の図において、同一の構成については、同一の符号を付して説明を省略する。
「医療データ」は、医療行為において生成される種々のデータであって、具体例としては、内視鏡検査や放射線検査の検査結果であるレポートや、手術報告のレポートが考えられる。
〈医療データ管理システム〉
図1に示すように、医療データ管理システム1は、医療データの生成及び登録に利用する登録装置10と、検査に利用する検査装置20とを有する。例えば、検査装置20は、内視鏡検査に使用する内視鏡装置や、放射線検査に利用する放射線装置(レントゲン装置、MRI装置、CT装置等)等である。以下の説明において、検査装置20は、内視鏡装置であるものとして説明する。また、登録装置10は、医療データとして、検査装置20による内視鏡検査の結果に関するレポートを生成し、登録するものとして説明する。
〈登録装置〉
図1に示すように、登録装置10は、制御部11、記憶部12、入力装置13、出力装置14及び通信インタフェース(通信I/F)15を備える情報処理装置である。
制御部11は、登録装置10における演算やデータの処理を実行する中央処理装置(CPU)等である。また、記憶部12は、ROMやRAM等である。登録装置10は、記憶部12に記憶されるプログラムPが実行されることで、制御部11が、特定部111、抽出部112、演算部113、予測部114、選択部115、作成部116、提示部117、生成部118及び登録部119としての処理を実行する。
図1に示す例では、記憶部12は、プログラムPの他、結果データD1、単語データD2、文型データD3及び医療データD4を記憶する。
入力装置13は、例えば、操作ボタン、キーボード、マウス、タッチパネル、マイクロフォン等の操作信号やデータの入力に利用する手段である。また、出力装置14は、ディスプレイ、プリンタ、スピーカ等の検査結果や処理結果等のデータの出力に利用する手段である。通信I/F15は、検査装置20等の外部の装置と通信回線を利用してデータの送受信を実行する。通信I/F15が利用する通信プロトコルは限定されず、無線又は有線のいずれによって通信を実行してもよい。
なお、登録装置10は、複数のコンピュータで構成されていてもよい。例えば、データの一部が、他の装置に記憶されており、そのデータを読み出すように構成されていてもよい。また例えば、図1に示すいずれかの処理部111〜119が外部の装置において実行されてもよい。具体的には、結果データD1は、外部の記憶装置に記憶されており、登録装置10は、外部の記憶装置から対象の結果データD1を読み出して利用してもよい。また、登録装置10は、生成した医療データD4を外部の記憶装置に記憶させるようにしてもよい。
結果データD1は、検査装置20で得られたデータである。具体的には、結果データD1は、検査装置20である内視鏡装置で得られた静止画像データや動画像データ等の画像データである。
単語データD2は、レポートの生成に使用する複数の単語を含む。この単語データD2では、複数の単語が、ツリー構造で関連付けられる。「ツリー構造」とは、いわゆる「木構造」であり、単語についてのツリー構造は、上位の単語について下位の単語が関連付けられる構造である。このとき、下位の単語にさらに下位の単語が関連付けられてもよい。したがって、単語データD2における階層の数は、限定されず、複数の階層に渡って単語が関連付けられる構成である。また、単語データD2では、上位の単語に関連付けられる下位の単語の数も、限定されない。したがって、各階層に含まれる単語の数は限定されず、生成対象の医療データに応じて異なる。ここで、同一の階層の単語は、レポート生成の際、同一の項目で使用されうる単語である。
ここでは、登録装置10は、内視鏡検査の検査結果であるレポートを生成して登録する例で説明するため、単語データD2は、内視鏡検査の検査結果を特定するために標準化された単語をツリー構造で関連付けるデータである。すなわち、単語データD2に含まれる単語は、MSTで規定される用語であり、MSTで規定される条件でツリー構造に関連付けられる。また、レポートは、MSTで規定される条件で生成されるため、「検査種別」、「診断」、「部位」、「所見」及び「処置」範囲で、「臓器」、「カテゴリ」、「細項目」、「属性」等の項目の情報を含む。このとき、各範囲で、同一の項目の情報を使用することができるため、登録装置10では、同一の情報については、1回の操作で、各範囲に反映されるようにする。
また、単語データD2では、各単語にパラメータ及び文型番号が関連付けられる。
「パラメータ」は、レポートの生成に利用する単語の予測に利用する値である。具体的には、「パラメータ」は、ツリー構造の上位の各単語に対し、下位の単語を使用する可能性を特定する値である。ここで、各単語は、条件毎に設定された複数のパラメータを関連付けることができる。例えば、パラメータの条件には、「作成者」、「患者」、「使用頻度」等がある。
「作成者」毎に設定されたパラメータは、レポートを生成する作成者に依存して設定された値である。ここで、「作成者」とは、医師、診療科、病院等である。上述したように、医師、診療科、病院には、それぞれ専門や得意分野がある。したがって、各作成者がレポートを生成する際に使用する単語は、限定されることが多く、特定の単語の使用頻度等が高くなる傾向がある。そのため、作成者毎にパラメータ値を設定することができる。パラメータは、作成者毎に個別に設定してもよいし、作成者にグループを割り当て、作成者に割り当てられるグループ毎に設定してもよい。
「患者」毎に設定されたパラメータは、レポートの生成対象である患者に依存して設定された値である。例えば、患者も、複数種の疾患を有することは少なく、各患者についてレポートを生成する際に使用する単語は、限定されることが多く、特定の単語の使用頻度等が高くなる傾向がある。したがって、患者毎にパラメータ値を設定することができる。パラメータは、患者毎に設定してもよいし、患者にグループを割り当て、患者に割り当てられるグループ毎に設定してもよい。
「使用頻度」について設定されたパラメータは、医療データ管理システム1又は登録装置10における各単語の使用頻度に依存する値である。例えば、システムや装置全体においてレポートを生成する際に使用する単語は、限定されることが多く、特定の単語の使用頻度が高くなる傾向がある。具体的には、全体として発生する可能性の高い又は低い疾患は決まっており、これに応じてレポート生成で使用する可能性の高い又は低い単語は決められる。したがって、医療データ管理システム1毎又は登録装置10毎の使用頻度に応じて得られた値をパラメータとすることができる。
また、パラメータは、レポートを生成する病院毎に設定することができる。例えば、病院が得意とする診療の専門等があるとき、その専門で使用する可能性の高い単語のパラメータの値を高く設定することができる。したがって、例えば、病院が各単語に対し、パラメータ値を設定してもよい。
「文型」とは、文章の構成を特定するものであり、例えば、各単語と助詞等の組み合わせで表される文の形式である。「文型番号」は、選択される単語を使用してレポートに含まれる文章を生成する文型の識別情報である。文型の例については、図3A乃至3Dを用いて後述する。
図2A乃至2Eを用いて、単語データD2の構成の一例を説明する。ここで、単語データD2は、図2A乃至図2Eに示す全てのデータを含み、単語が5つの階層で関連付けられるデータであるものとして説明する。
例えば、図2Aは、ツリー構造のうち最上位の単語のクラスタである。具体的には、図2Aに示す例は、「検査種別」の単語のクラスタである。ここで、「クラスタ」とは、ツリー構造における同一階層の単語のグループである。図2Aに示すように、例えば、検査種別のクラスタの単語データD2-1は、単語の識別情報である「ID」と、当該識別情報によって識別される「単語」と、当該単語に対し、当該単語に関連づけられる下位の単語を使用する可能性を特定する値である「パラメータ」とを含む。
例えば、「パラメータ」としては、使用する可能性のある下位の単語のIDと、パラメータ値とを関連付ける。仮に、「上部消化管」の単語に対し、「頭頚部」、「食道」及び「胃」の単語が関連付けられるとき、「上部消化管」と関連付けられる「パラメータ」として、「頭頚部」を使用する可能性を特定するパラメータ値、「食道」を使用する可能性を特定するパラメータ値、「胃」を使用する可能性を特定するパラメータ値を含む。仮に、「頭頚部」のパラメータとして「0.7」、「食道」のパラメータとして「0.2」、「胃」のパラメータとして「0.1」が関連付けられる場合、「頭頚部」を使用する可能性が最も高く、「胃」を使用する可能性は最も低いものと規定されることを意味する。
このとき、「パラメータ」では、上述したように、各条件に応じた複数のパラメータ値を含む。例えば、「頭頚部」、「食道」及び「胃」のそれぞれについて、「特定の作成者に関するパラメータ値」、「特定の患者に関するパラメータ値」及び「使用頻度のパラメータ値」等の複数のパラメータ値を関連付ける。また、作成者のパラメータ値としても、医師等の作成者毎に設定されるため、複数の作成者のパラメータ値を含む。具体的には、「上部消化管」に対する「頭頚部」についてのパラメータ値として、第1の医師のパラメータ値、第2の医師のパラメータ値、第3の医師のパラメータ値等のように複数のパラメータ値を含む。同様に、患者のパラメータ値としても、患者毎に設定されるため、複数の患者のパラメータ値を含む。
図2Bに示す例は、「識別種別」の下位となる単語のクラスタである。具体的には、図2Bに示す例は、「臓器」の単語のクラスタの単語データD2-2である。図2Bに示すように、単語データD2-2も、図2Aで上述した単語データD2-1と同様に、「ID」、「単語」及び「パラメータ」とを含む。ここで、「パラメータ」では、上述したように、使用する可能性のある下位の単語のIDと、条件毎に設定されたパラメータ値とを関連付ける。
図2Cに示す例は、「臓器」の単語の下位となる「カテゴリ」の単語のクラスタの単語データD2-3である。図2Cに示すように、単語データD2-3も、図2Aで上述した単語データD2-1と同様に、「ID」、「単語」及び「パラメータ」とを含む。ここで、「パラメータ」では、上述したように、使用する可能性のある下位の単語のIDと、条件毎に設定されたパラメータ値とを関連付ける。
図2Dに示す例は、「カテゴリ」の単語の下位となる「細項目」の単語のクラスタの単語データD2-4である。図2Dに示すように、単語データD2-4も、図2Aで上述した単語データD2-1と同様に、「ID」、「単語」及び「パラメータ」とを含む。ここで、「パラメータ」では、上述したように、使用する可能性のある下位の単語のIDと、条件毎に設定されたパラメータ値とを関連付ける。
図2Eに示す例は、「細項目」の単語の下位となる「属性」の単語のクラスタの単語データD2-4である。仮に、属性のクラスタに含まれる単語は、最下位の単語であるとき、図2Eに示すように、単語データD2-5は、「ID」及び「単語」を含むが、「パラメータ」を含まない。一方、図2Eに示すように、単語データD2−5は、各単語を含む場合に文章の生成に利用する文型の識別番号を関連付ける。すなわち、属性で関連付けられる文型番号に応じて、文章を生成する文型が選択される。図2Eの例では、属性に「梨状陥凸右」が選択された場合、文型番号がI-2の文型を用いる。
例えば、属性の単語を選択する必要がない場合もある。このような場合、図2EのID「w507」に示すように、単語は関連付けられず、文型番号のみが関連付けられる。例えば、細項目の単語が仮に「異常なし」である場合、その下位である属性の単語の選択が不要であるとき、「異常なし」には、下位の単語として「w507」が選択されるようにパラメータとして「1」が関連付けられる。これにより、属性で単語を選択することなく文型が選択される。
また、図示を用いた説明は省略するが、上位の単語から下位の単語への遷移に文型番号を関連付けてもよい。これにより、下位の単語は同一であっても、ある上位の単語との組み合わせのときにはI-2の文型となるが、別の上位の単語との組み合わせのときにはI-3の文型となる場合もある。具体的には、「属性」の項目で『軽度』という単語が選択されたとき、細項目の単語が『カンジタ症』である場合には「軽度のカンジタ症と診断される」という文章が生成され、細項目の単語が『炎症』である場合には「炎症は軽度」という文章が生成されるように文型番号を関連付けることができる。
なお、図2A乃至図2Eに示す例では、単語データD2は、上位の単語に、下位の単語と、各回の単語を使用する可能性に関するパラメータとを関連付けるものとして説明したが、これに限定されない。例えば、最上位の単語にはパラメータを関連付けず、各下位の単語に、上位の単語と、当該下位の単語とともに各上位の単語を使用する可能性に関するパラメータを関連付ける単語データD2を使用してもよい。
文型データD3は、選択された単語を用いて文章を作成する際の文型の番号と、この文型の番号の文型とを関連付けるデータである。例えば、使用する単語毎に、生成する文章の構成が変わることがある。したがって、文型データD3は、使用する単語に応じた文章の構成に関するデータである。具体的には、後述するが、図3A乃至図3Dに、文型データD3に含まれる文型の一例を示す。ここでは、説明の便宜のため、文型データD3が、図3A乃至図3Dに示す全ての構成データを含むものとして説明する。なお、文型データD3は、文型と、その文型で文章を作成する条件とを含んでいれば、その構成は、図3A乃至図3Dに示す構成に限定されない。
なお、文型データD3は、ユーザである医師や病院等によって変更可能とすることができる。例えば、文章として、「○○が認められる」、「○○と診断される」、「○○あり」等の文章は、同義である場合もあり、どの文章を使用するかはユーザの好みによって決定される場合もある。このような場合、ユーザは初期設定とは異なる文章の作成を希望する場合、文型データD3の文型を変更させるようにしてもよい。
医療データD4は、登録装置10で生成され、登録されたデータである。上述したように、ここでは、医療データD4は、内視鏡検査に関する検査結果に関するレポートであるものとして説明する。
登録装置10では、レポート生成のため、図4に示すようなレポート生成画面W1が利用される。レポート生成画面W1は、図4に示すように、検査装置20により得られた検査結果であって、レポート生成の対象である検査の種別を選択する検査種別選択用のボックスb11、患者の識別情報を入力する患者識別情報入力用のボックスb12、レポートの作成者である医師の識別情報を入力する作成者識別情報入力用のボックスb13を有する。図4に示す例は、レポート生成画面W1の初期状態において、必要な情報として、ボックスb11において、「上位消化管」が選択された一例である。図4に示すようなレポート生成画面W1において、「診断」、「所見」及び「処置」等の各範囲のボックスで、必要な単語が選択され又は入力されることで、文章が作成され、選択又は入力された単語と、作成された文章を含むレポートが生成される。
図4の例では、診断に関する情報の選択や入力は、ボックスb21,b23〜b26で実行可能であり、その結果得られた診断に関する情報の候補は、ボックスb22で表示される。また、各ボックスb21,b23〜b26で選択された情報は、ボックスb21に表示される。
診断の部位に関する情報の選択や入力は、ボックスb33,b34で実行可能であり、その結果得られた部位に関する情報の候補は、ボックスb32で表示される。また、各ボックスb33,b34で選択された情報は、ボックスb31に表示される。そして、ボックスb21及びb31に表示される情報により、診断に関して作成された文章がボックスb27に表示される。
所見に関する情報の選択や入力は、ボックスb43,b44で実行可能であり、その結果得られた所見に関する情報の候補は、ボックスb42で表示される。また、各ボックスb43,b44で選択された情報は、ボックスb41に表示される。そして、ボックスb41に表示される情報により、所見に関して作成された文章がボックスb45に表示される。
処置に関する情報の選択や入力は、ボックスb53〜b55で実行可能であり、その結果得られた所見に関する情報の候補は、ボックスb52で表示される。また、各ボックスb53〜b55で選択された情報は、ボックスb51に表示される。そして、ボックスb51に表示される情報により、所見に関して作成された文章がボックスb56に表示される。
特定部111は、レポート生成のため、重み付けに使用するパラメータの抽出に必要な条件を特定する。例えば、特定部111は、条件として、レポートを生成する医師の識別情報、属性や診療履歴等(作成者の条件)、レポート生成の対象となる患者の識別情報、属性や病歴等(患者の条件)を特定する。ここで、特定部111は、1つのレポートの生成に対し、複数の条件を特定することもある。具体的には、特定部111は、作成者である医師の識別情報と、患者の識別情報の条件を特定し、単語の予測に使用してもよい。
例えば、特定部111は、図4に示すようなレポート生成画面W1において、ボックスb12から患者の識別情報(患者の条件)を特定したり、ボックスb13から入力者である医師の識別情報(作成者の条件)を特定することができる。
また、特定部111は、初めに入力又は選択された単語を条件として特定してもよい。すなわち、図4に示すように、ボックスb11で「上部消化管」が選択された場合、この「上部消化管」の単語を条件と特定してもよい。
「医師の属性」とは、医師の「専門」等の医師を表す情報である。医師の専門によって、診療対象の患者の症状が特定されることがある。したがって、医師の専門に関する情報に応じて、レポート生成の際に使用する可能性が高い又は単語を予測することができる可能性があるためである。
「医師の診療履歴」とは、他の患者を含め、レポートを生成する医師が過去にレポートを生成した履歴やその他の診療履歴である。上述したように、医師は、専門があり、専門によりレポートの生成で使用する対象の単語が異なる。したがって、過去の診療履歴も、レポートの生成で使用する可能性が高い又は単語を予測することができる可能性がある。すなわち、過去に使用した頻度が高い単語を今回も使用する可能性が高いと考え、過去に使用した頻度が引く単語を今回も使用する可能性が低いと考えることができるものとする。ここで、過去の診療履歴については、過去の全ての期間でなく、例えば、1年以内又は3年以内等の直近の所定期間の履歴であってもよい。なお、医師の識別情報から、電子カルテやレポート等を参照し、診療履歴を抽出することもできる。また、医師の情報の代わりに、診療科や病院の情報を条件としてもよい。
「患者の属性」とは、患者の「年齢」、「性別」等の患者を表す情報である。また、患者の属性に喫煙や飲酒等の「生活習慣」に関する情報を含んでもよい。「年齢」や「性別」によって、生じやすい病気や生じることのない病気があり、レポート生成の際に使用する可能性が高い単語の予測に利用できるためである。また、「生活習慣」によっても、生じやすい病気があり、レポート生成の際に使用する可能性が高い単語の予測に利用できるためである。その他、患者の属性に、「既往歴」や「血縁者の病歴」に関する情報や「人種」に関する情報を含んでもよい。これにより、患者自身の他の病院で診療を受けた病歴を含むことが可能となり、また患者自身の病歴の他、遺伝的背景を含めることができる。さらに、患者の属性には、「出産経験の有無」を含んでもよい。これらの情報も、患者に生じやすい病気等を特定することが可能となり、レポートの生成に役立つためである。具体的には、登録装置10では、患者の属性が予めグループ分けされており、特定部111は、患者がいずれのグループに該当するかを特定してもよい。
「患者の病歴」とは、過去の患者の診療等に関する情報である。過去の病歴も、レポート生成の際に使用する可能性が高い単語の予測に利用できるためである。具体的には、登録装置10では、患者の病歴に関し予めグループ分けされており、特定部111は、患者がいずれのグループに該当するかを特定してもよい。なお、患者の識別情報から、電子カルテやレポート等を参照し、属性や病歴を抽出することもできる。
抽出部112は、特定部111で特定された条件に関し、各単語に関連付けられるパラメータの値を抽出する。仮に、複数の条件が特定された場合、各条件について各単語に関連付けられるパラメータの値を抽出する。具体的には、医師の条件(作成者の条件)と、患者の条件が特定された場合、各単語に、医師のパラメータ値と、患者のパラメータ値とを抽出する。また、抽出部112は、使用頻度のパラメータを使用することが規定されている場合、各単語に関連付けられる使用頻度のパラメータ値を抽出する。
また、図4に示すように、「上部消化管」が選択され、条件と特定された場合、抽出部112は、上部消化管の下位の単語についてパラメータ値を抽出する。仮に、特定部111で「作成者の識別情報」及び「患者の識別情報」とともに、「上部消化管」の単語が特定された場合、抽出部112は、単語データD2において「上部消化管」の単語と関連付けられる各単語の複数のパラメータ値のうち、条件として特定された作成者のパラメータ値と、条件として特定された患者のパラメータ値とを抽出する。なお、使用頻度のパラメータ値も使用することが規定されている場合、抽出部112は、「上部消化管」の単語と関連付けられる各単語の使用頻度のパラメータ値を抽出する。
演算部113は、特定された条件に対して単語に設定されるパラメータの値を用いて各単語について重み付けを行ない、レポートの生成に使用する単語の予測に利用する遷移確率Xを演算する。遷移確率Xは、レポートの生成について、ある単語に対し、下位の単語が使用される可能性を予測する値である。ここで、複数の条件が特定されると、演算部113は、条件毎に設定される複数のパラメータの値を用いて各単語について重み付けを行う。このとき、演算部113は、各パラメータの値に対し、予め設定された重み値で重み付けする。例えば、演算部113は、式(1)により、各単語について、下位の単語への遷移確率Xを求めるために重み付け演算を行う。すなわち、登録装置10では、例えば、記憶部12において、複数のパラメータを使用した遷移確率Xの算出式を有する。また、演算部113は、予め求めた各遷移確率Xを上位の単語及び下位の単語と関連付けて、記憶部12に記憶させる。
X = 作成者のパラメータ値×(A+Da)
+ 患者のパラメータ値×(B+Db)
+ 使用頻度のパラメータ値×(C +Dc) ・・・(1)
A:作成者のパラメータについての重み値
Da:作成者のパラメータに対する補正値
B:患者のパラメータについての重み値
Db:患者のパラメータに対する補正値
C:使用頻度のパラメータについての重み値
Dc:使用頻度のパラメータに対する補正値
なお、登録装置10では、式(1)に示すように、特定のパラメータに対し、補正値を加算し、ウェイトを大きくしてもよい。
また、使用頻度のパラメータを予め単語データD2に関連付ける方法の他、演算部113が、過去にレポートの生成で利用された単語の履歴である履歴データ(図示せず)を参照し、条件で過去に生成されたレポートで使用された単語について使用頻度を求め、この使用頻度をパラメータとして利用して重み付けし、遷移確率Xを求めてもよい。例えば、使用頻度は、レポートの生成の度に更新されるが、パラメータとして予め単語データD2に使用頻度を関連付ける場合、最新の使用頻度を用いて遷移確率Xを演算することができない恐れがある。これに対し、レポート生成の度に履歴データを参照して使用頻度を求めることで、最新の使用頻度を使用することができる。なお、毎回、レポート生成のタイミングで使用頻度を求めるのではなく、レポートの生成が所定回数(例えば、100回)実行されたタイミングで使用頻度を求め、この値で単語データD2において各単語に関連付けるパラメータの値を更新する方法でもよい。
予測部114は、複数の単語について、特定部111で特定されたレポートの生成の条件に応じて設定されたパラメータを用いて重み付けされた値である遷移確率Xに応じて、特定部111で特定された条件下でレポートを生成する際に複数の項目でそれぞれ利用する単語の候補として予測する。具体的には、予測部114は、複数のツリー構造で関連付けられる単語を含む単語データD2に含まれる各単語について、各単語に関連付けられるパラメータを用いた重み付けで得られ、記憶部12に記憶された遷移確率Xの高い単語を、レポートの生成に利用する単語の候補として予測する。
なお、予測部114で遷移確率Xの高い候補の単語が予測されると、抽出部112は、予測された単語を仮選択の状態とし、仮選択された単語に関し、パラメータ値の抽出を実行する。また、演算部113は、抽出部112で抽出されたパラメータ値を用いて、再度、複数の遷移確率Xを演算する。そして、予測部114は、新たに得られた複数の遷移確率Xを用いて、前回予測した単語に対する、下位の単語又は上位の単語を予測する。登録装置10ではこの処理を繰り返し、レポートの生成に必要な項目の単語について候補の単語を予測する。
具体的には、図4のレポート生成画面W1に示すように「上部消化管」が選択された場合、抽出部112は、「上部消化管」と関連付けられる各パラメータ値を抽出する。そして、演算部113は、抽出部112が抽出したパラメータ値を用いて、「上部消化管」の下位の単語のそれぞれについて、遷移確率Xを求める。その後、例えば、図5に示すように、予測部114は、遷移確率Xの最も高い「頭頚部」を候補の単語として予測する。続いて、登録装置10では、同様の処理を繰り替えし、「頭頚部」の下位の候補の単語として「部位」が予測され、「部位」の下位の候補の単語として「下咽頭」が予測され、「下咽頭」の下位の候補の単語として「輪状後部左」が予測される。そして、各項目について最も遷移確率Xが高い単語をボックスb51に表示するとともに、ボックスb22において遷移確率Xの降順で複数の単語を選択可能に表示する。また、各項目について遷移確率Xの最も高い各単語は、ボックスb23〜b26において、仮選択状態として表示するとともに、複数の単語を遷移確率Xの降順で選択可能に表示させてもよい。このように、登録装置10では、レポートの生成においてパラメータを利用して各項目に対する候補の単語が予測され、各候補の単語が容易に選択可能に表示される。
また、ボックスb23〜b26の項目について選択された単語に関し、ボックスb33,b34の項目について予測された単語のうち、遷移確率Xが最も高い単語をボックスb31と、ボックスb33及びb34の最上位に表示するとともに、ボックスb32〜34において、複数の単語を遷移確率Xの降順で選択可能に表示させてもよい。
同様に、ボックスb23〜b26,b33,b34の項目について選択された単語に関し、ボックスb43,b44の項目について予測された単語のうち、遷移確率Xが最も高い単語をボックスb41と、ボックスb43及びb44の最上位に表示するとともに、ボックスb42〜44において、複数の単語を遷移確率Xの降順で選択可能に表示させてもよい。
さらに、ボックスb23〜b26,b33,b34,b43,b44の項目について選択された単語に関し、ボックスb53〜b55の項目について予測された単語のうち、遷移確率Xが最も高い単語をボックスb51と、ボックスb53〜b55の最上位に表示するとともに、ボックスb52〜54において、複数の単語を遷移確率Xの降順で選択可能に表示させてもよい。
選択部115は、文型データD3から、予測部114で予測された単語の条件に関連付けられる文型を選択する。仮に、予測部114で複数の単語が予測された場合、遷移確率Xが最も高い単語に関連付けられる文型を選択する。また、選択部115は、提示部117で提示されることにより、特定の項目の単語として選択された単語の条件に関連付けられる文型を選択する。
図3Aは、診断に関する文章の作成に利用する文型の選択に利用する文型データD3-1の一例である。「診断に関する文章」とは、検査結果に関し、診断内容を特定する文章である。図3Aに一例を示す文型データD3-1では、文型の識別符号である「番号」と、文章を作成する際の文型に相当する「構成」とが関連付けられる。
具体的には、選択部115は、予測部114で選択された単語と関連付けられる文型番号の文型を選択する。なお、ここでの「単語の選択」としては、医師等の利用者の操作による単語の選択の他、予測部114によって単語が予測されたことによる仮選択も含むものとする。すなわち、予測部114で予測された単語を利用して選択部115で文型が選択されることもありうる。
仮に、「上部消化管」が選択されたことにより、診断に関し、図5に示すように各項目の単語が予測された結果、各ボックスb23〜b26に単語が表示され、細項目のボックスb25から「粘膜下腫瘍」が選択されたとする。また、登録装置10では、細項目のボックスb25から「粘膜下腫瘍」選択されると、各項目に対して、この「粘膜下腫瘍」に対して各単語のパラメータ値を抽出するとともに新たに遷移確率Xを求め、遷移確率Xの高い単語を候補として予測する。ここで、仮に、属性の単語「平滑筋腫」に文型番号「I-2」が関連付けられ、属性の単語として「平滑筋腫」の単語が選択されたとき、選択部115は、「平滑筋腫」に関連付けられる番号「I-2」の文型を選択する。また、各項目の各ボックスb23〜b26で選択された単語を、番号「I-2」の文型に当てはめて生成した文章をボックスb27に表示する。また、登録装置10では、他の項目についてもこの「粘膜下腫瘍」に対して利用される可能性の高い各単語を予測し、図6に示すレポート生成画面W2のように、他のボックスb31〜b35,b41〜b44,b51〜55に表示する。さらに、登録装置10では、図6に示すレポート生成画面W2のように、予測された単語に応じて生成された文章をボックスb27,b45及びb56に表示する。
なお、単語の予測の結果、各ボックスb21〜b55に各項目の単語や文章が表示された後、いずれの項目の単語を再選択してもよい。具体的には、ボックスb11において、仮に「上部消化管」が選択された後、各項目のボックスb23〜b26,b32,b33,b43,b44,b53〜b55で表示される単語がレポートの生成に正しくない場合、最上位の項目のボックスb23から正しい単語を選択する必要はない。例えば、下位の項目のボックスb44から単語を選択してもよい。この場合であっても、選択された単語に対し、上位の方向及び下位の方向に各単語に関する予測処理が実行され、各項目のボックスb23〜b26,b32,b33,b43,b44,b53〜b55に対して単語が予測される。なお、ここでは、上位から下位の方向に単語を予測する場合で説明したが、同様の方法により、下位から上位の方向に単語を予測することもできる。
図3Bは、部位に関する文章の作成に利用する文型の選択に利用する文型データD3-2の一例である。「部位に関する文章」とは、検査対象の部位を特定する文章である。この「部位に関する文章」は、図3Aを用いて上述した「診断に関する文章」の中に含まれるものである。図3Bに一例を示す文型データD3-2では、文型の識別部号である「番号」と、文章を作成する際の「構成」とが関連付けられる。
図3Cは、所見に関する文章の作成に利用する文型の選択に利用する文型データD3-3の一例である。「所見に関する文章」とは、検査結果である検査結果の所見を表す文章である。図3Cに一例を示す文型データD3-3では、文型の識別部号である「番号」と、文章を作成する際の「構成」とが関連付けられる。
図3Dは、処置に関する文章の作成に利用する文型の選択に利用する文型データD3-4の一例である。「処置に関する文章」とは、検査の際に行われた処置内容を表す文章である。図3Dに一例を示す文型データD3-4では、文型の識別部号である「番号」と、文章を作成する際の「構成」とが関連付けられる。
なお、予測部114は、遷移確率Xが最も高い単語を候補として予測し、仮選択するが、必ず仮選択された単語が使用されるものではない。したがって、図6のようなレポート生成画面W2を生成する場合、仮選択された単語以外の遷移確率Xが高い単語についても、例えば順候補として、作成者に容易に選択可能に降順で表示させてもよい。これにより、利用者は、仮に、レポートの生成に予測部114で予測され仮選択状態の単語を使用しない場合であっても、他の遷移確率Xの高い順候補の単語から使用する単語を容易に選択することが可能となる。例えば、遷移確率Xが0.7の単語、0.5の単語、0.2の単語があるとき、遷移確率Xが0.7の単語を仮選択状態とし、遷移確率Xが0.5及び0.2の単語も選択可能に表示する。
作成部116は、予測部114によって予測された単語を、選択部115で選択された文型に当てはめて文章を作成する。
例えば、選択部115により番号「II-1」の文型(図3B)が選択された場合、作成部116は、『細項目の単語』+『属性の単語』+『が認められる』の組み合わせにより、部位に関する文章を作成する。また、選択部115により番号「II-2」の文型(図3B)が選択された場合、作成部116は、『属性の単語』のみにより、部位に関する文章を作成する。
仮に、選択部115により、番号「I-2」の文型(図3A)及び番号「II-1」の文型(図3B)が選択された場合、作成部116は、番号「I-2」の文型の診断の文章の作成の際、番号「II-1」の文型の部位の文章を用いて文章を生成する。具体的には、細項目のボックスb33で「口腔」が選択され、属性のボックスb34で「口腔底 右」が選択され、部位の文章として「口腔 口腔底 右」の文章が作成されたとする。そして、「臓器」のボックスb23で「頭頚部」が選択され、「細項目」のボックスb25で「属性」のボックスで「平滑筋腫」が選択され、番号「I-2」の文型が選択された場合、番号「I-2」の文型に、それぞれ以下の単語又は文章を当てはめる。
臓器: 頭頚部
部位の文章: 口腔 口腔底 右
細項目: 粘膜下腫瘍
属性: 平滑筋腫
これにより、図6に示すように、文章のボックスb27で「頭頚部 口腔 口腔底 右 において 粘膜下腫瘍 (平滑筋腫) が認められる」と表示される。
仮に、選択部115により、番号「III-1」の文型(図3C)が選択された場合、作成部116は、『細項目の単語』+『属性の単語』の組み合わせにより、所見に関する文章を生成する。
仮に、「細項目」のボックスb43で「主肉眼型」が選択され、「属性」のボックスb44で「0-Ip」が選択され、選択部115により、番号「III-2」の文型(図3C)が選択された場合、作成部116は、番号「III-2」の文型により、それぞれ、以下の単語を当てはめる。
細項目:主肉眼型
属性:0-Ip
これにより、図6に示すように、文章のボックスb45で、「主肉眼型(0-Ip)が認められる」と表示される。
仮に、選択部115により、番号「IV-2」の文型(図3D)が選択された場合、作成部116は、『カテゴリの単語』+『にて』+『細項目の単語』+『は』+『属性』の組み合わせにより、処置に関する文章を作成する。また、選択部115により、番号「IV-3」の文型(図3D)が選択された場合、作成部116は、『カテゴリの単語』+『は』+『属性の単語』の組み合わせにより、処置に関する文章を生成する。
なお、文型データD3の構成は限定されず、作成する文章等に応じて設定されるものであり、図3A〜図3Dを用いて上述した文型は一例である。
作成部116は、仮選択状態の場合には、文章をせず、全ての項目の単語が確定された場合に文章を生成するようにしてもよい。
提示部117は、予測部114で予測された単語を、複数の項目にそれぞれ利用する単語の候補として、予測部114で予測された候補の単語を優先して提示する。このとき、提示部117は、予測部114で予測された複数の単語のうち、重み付けで得られた遷移確率Xが上位の単語を仮選択状態として他の予測された単語と共に提示する。
また、提示部117は、提示される複数の単語のうち、仮選択状態として予測された単語以外の単語が選択されると、選択された単語を確定された単語とし、この確定された単語と、確定された単語に応じて作成部116で作成された文章とを提示する。なお、確定されていない単語があるとき、確定された単語に関連付けられる遷移確率Xが上位の単語を仮選択状態として選択された単語とともに提示する。
生成部118は、提示部117により提示された単語を用いてレポートを生成する。具体的には、生成部118は、仮選択状態で提示された単語について選択が確定されると、当該単語を用いてレポートを生成する。このとき、生成部118は、確定された単語とともに、作成部116で作成された文章を含むレポートを生成する。
登録部119は、生成部118で生成されたレポートを医療データD4として記憶部12に記憶させる。
《生成及び登録処理》
図7に示すフローチャートを用いて、登録装置10における医療データであるレポートの生成及び登録処理について説明する。
レポートの生成が開始されると、特定部111は、条件を特定する(S1)。例えば、図4を用いて上述したようなレポート生成画面W1において、ボックスb11で選択された単語、ボックスb12に入力された識別情報、ボックスb13に入力された識別情報を条件とすることができる。
ステップS1で条件が特定されると、抽出部112は、単語データD2から、特定された条件に応じた単語とパラメータの値を抽出する(S2)。ここで、ボックスb11で単語が選択され、ボックスb12及びボックスb13に識別情報が入力された場合、ボックスb11で選択された単語の複数の下位の単語を特定するとともに、各単語についてパラメータ値を抽出するが、ボックスb12で入力された識別情報に関連付けられるパラメータ値と、ボックスb13で入力された識別情報に関連付けられるパラメータ値とを抽出する。
ステップS2でパラメータ値が抽出されると、演算部113は、抽出されたパラメータを用いて単語毎に、遷移確率Xを演算する(S3)。
ステップS3で遷移確率Xが求められると、予測部114は、遷移確率Xが最も高い単語をレポートの生成に使用する単語の候補として予測し、仮選択状態とする(S4)。
ステップS4で候補の単語が予測されると、予測部114は、他に候補の単語を予測する必要のある項目があるか否かを判定する(S5)。すなわち、予測部114は、レポートの生成に必要な項目の単語が全て選択されたか否かを判定する。
他に予測が必要な項目があるとき(S5でYES)、登録装置10は、ステップS2に戻り、ステップS2〜S5の処理を繰り返す。
一方、予測が必要な項目がないとき(S5でNO)、選択部115は、各項目について選択された単語を用いて文型データD3から文章の作成に利用する文型を選択する(S6)。
ステップS6で文型が選択されると、作成部116は、ステップS6で選択された文型に、ステップS4で選択された単語を当てはめて文章を作成する(S7)。
ステップS7で文章が作成されると、提示部117は、ステップS4で選択された単語及びステップS7で作成された文章を提示する(S8)。登録装置10は、これにより、作成者である医師に、レポートの生成情報が正確に選択されたか否かを確認させることができる。
ステップS8で提示した単語と文章で確定されない場合(S9でNO)、ステップS2に戻り、ステップS2〜9の処理を繰り返す。具体的には、提示部117は、入力装置13を介して作成者から確定又は、正しい単語の選択のいずれかを受け付ける。提示された単語及び文章が適切である場合、例えば、作成者は、確定の操作信号を入力する。一方、提示された単語及び文章が適切でない場合、例えば、作成者は、正しい単語の選択操作を入力する。すなわち、ステップS4で予測された各項目の単語の中に、今回のレポートについて適切でない単語が含まれる場合、例えば、作成者は、仮選択状態の単語とともに提示される他の候補の単語を選択することができる。これにより、ステップS2において、再度、選択された他の候補の単語についてパラメータの抽出がされ、ステップS3〜S9の処理が実行される。
ステップS8で提示した単語と文章で確定されると(S9でYES)、生成部118は、確定した単語及び文章でレポートを生成する(S10)。
ステップS10でレポートが生成されると、登録部119は、生成されたレポートを医療データD4として記憶部12に記憶させる(S11)。
なお、上述した説明では、登録装置10は、検査装置20で得られた結果データD1に関して生成するレポートとして医療データD4を生成するものとして説明した。しかしながら、登録装置10が生成する医療データD4は、検査装置20で得られた結果データD1に関するレポートとして生成するものには限定されない。例えば、手術報告等のレポート等であってもよい。
上述したように実施形態に係る登録装置、生成方法及び医療データ生成プログラムによれば、依頼が医療データ生成の際、データの入力や選択等の操作回数を減少させることが可能であり、医療データ生成に関する業務を支援することができる。