JP6978997B2 - 類似データの検索方法、情報検索装置及びプログラム - Google Patents

類似データの検索方法、情報検索装置及びプログラム Download PDF

Info

Publication number
JP6978997B2
JP6978997B2 JP2018184018A JP2018184018A JP6978997B2 JP 6978997 B2 JP6978997 B2 JP 6978997B2 JP 2018184018 A JP2018184018 A JP 2018184018A JP 2018184018 A JP2018184018 A JP 2018184018A JP 6978997 B2 JP6978997 B2 JP 6978997B2
Authority
JP
Japan
Prior art keywords
data
information
similar
threshold value
rule
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018184018A
Other languages
English (en)
Other versions
JP2020052912A (ja
Inventor
大 明石
高伸 大崎
剛志 柴田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP2018184018A priority Critical patent/JP6978997B2/ja
Publication of JP2020052912A publication Critical patent/JP2020052912A/ja
Application granted granted Critical
Publication of JP6978997B2 publication Critical patent/JP6978997B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Description

本発明は、医療データの分析業務を支援する技術に関する。
一般的な業務として、多様な項目を記載情報として含むデータを点検し、そのデータの可否を判断する業務が存在する。例えば、保険者によるレセプトの再審査等の請求や、保健指導対象となる患者の判定といった点検及び分析の業務が挙げられる。
日本の保険診療において、医療機関は1か月分の医療行為を患者毎にまとめた診療報酬明細書、通称レセプトと呼ばれる書類を審査機関を通じて保険者へと提出し、保険者から医療費の支払いを診療報酬という形で受けとる。
保険者は、受け付けたレセプトの点検を実施し、被保険者の加入資格や診療内容に関して疑義のあるレセプトについては、審査機関に対して再審査の請求を行う。保険者による再審査請求に関する点検業務は、点検者ごとに目視で行い点検者のスキルに依存するため、点検結果に差異が生じやすい。
そこで、点検対象のレセプトに対して、記載内容の類似した過去のレセプトの点検結果の傾向を分析して、再審査請求の割合や、再審査請求の要因といった点検業務の支援情報を可視化して点検者に提示する技術が必要である。
しかし、医療データを分析する上で、不要な項目を含むデータを類似した医療データとして抽出した場合、分析結果に無関係な要因が含まれることが課題となる。
これに対し、例えば特許文献1には、複数の属性からなるヘルスケアデータに関して、各属性の類似度の総合値から、類似したヘルスケアデータを有するユーザの情報を取得する技術が開示されている。また、特許文献2には、医用文書や医用画像を入力として、類似した症例のデータを検索する技術が開示されている。
特開2016−218954号公報 特開2015−203920号公報
しかし、上記従来技術は、どの項目同士を比較すべきかが予め分かっているデータを対象としている。このため上記従来技術は、レセプトのように、分析を目的とした類似データを抽出するうえで、どの項目の一致度が重要であるかが不明なデータへの適用は困難である。上記従来技術を、レセプトへ適用した場合、抽出した類似データを用いて再審査請求の要因分析等を行っても、再審査請求とは無関係な項目が要因として誤検出される可能性が高い。
レセプトの記載内容は項目の種類数が数万と多く、かつ項目の組み合わせ方によって審査の結果が変わるため、単純に記載内容の一致度を用いても、再審査請求の割合や再審査請求要因を分析する上で類似したレセプトを抽出することが困難である。
そこで本発明は、上記問題点に鑑みてなされたもので、審査の傾向を分析するために、入力データと類似するレセプトのグループを抽出することを目的とする。
本発明は、プロセッサとメモリを有する計算機が、検索対象データから入力データに類似するデータを抽出する類似データの検索方法であって、前記計算機が、前記入力データの記載情報と前記入力データの第1のルールを受け付け、前記検索対象データを受け付ける入力ステップと、前記計算機が、閾値の初期値を設定する初期値設定ステップと、前記計算機が、前記入力データに対する前記検索対象データの一致情報を算出し、一致情報と前記閾値を比較して候補データを抽出する候補データ抽出ステップと、前記計算機が、前記候補データから、前記第1のルールのみを含む第1のデータと、前記第1のルール群に含まれない第2のルールを含む第2のデータとを抽出するグループ抽出ステップと、前記計算機が、前記第1のデータと前記第2のデータが所定の閾値決定条件を満たしていない場合には前記閾値を変更する閾値変更ステップと、を含む。
本発明は、再審査請求の割合や再審査請求要因といった審査傾向を分析するために、入力データと類似したレセプトのグループ(候補データ)を抽出することが可能となる。
本明細書において開示される主題の、少なくとも一つの実施の詳細は、添付されている図面と以下の記述の中で述べられる。開示される主題のその他の特徴、態様、効果は、以下の開示、図面、請求項により明らかにされる。
本発明の実施例1を示し、医療データ分析支援システムの構成の一例を示すブロック図である。 本発明の実施例1を示し、類似データの閾値毎の統計情報(レセプト数)の表示画面を示す図である。 本発明の実施例1を示し、類似データの閾値毎の統計情報(ルールが一致するデータの割合)の表示画面を示す図である。 本発明の実施例1を示し、類似データの閾値毎の統計情報(ルールが一致しないデータの割合)の表示画面を示す図である。 本発明の実施例1を示し、類似データの閾値毎の統計情報(再審査請求割合)の表示画面を示す図である。 本発明の実施例1を示し、傷病名情報の一例を示す図である。 本発明の実施例1を示し、診療行為情報の一例を示す図である。 本発明の実施例1を示し、医薬品情報の一例を示す図である。 本発明の実施例1を示し、特定器材情報の一例を示す図である。 本発明の実施例1を示し、再審査請求情報の一例を示す図である。 本発明の実施例1を示し、整形情報の一例を示す図である。 本発明の実施例1を示し、ルール情報の適応テーブルの一例を示す図である。 本発明の実施例1を示し、ルール情報の禁忌テーブルの一例を示す図である。 本発明の実施例1を示し、類似データ抽出処理の一例を示すフローチャートである。 本発明の実施例2を示し、類似データ抽出処理の一例を示すフローチャートである。 本発明の実施例2を示し、重み付けの選択画面の一例を示す図である。
以下、本発明の実施形態を添付図面に基づいて説明する。
本実施例1では、入力とする医療データに対し、記載情報の一致度に加え、医療データに含まれる医療ルールの有無を指標として、類似する医療データを抽出する例を示す。
<全体の構成>
本発明の実施例1における医療データ分析支援システムの構成の一例を図1に示す。
医療データ分析支援システムは、医療データ分析装置10と、データベース20とで構成される。なお、データベース20は、医療データ分析装置10からアクセス可能であればよく、外部の計算機がデータベースを提供する構成でも良い。
医療データ分析装置10は、演算装置140と、メモリ150と、出力部160と、入力部170と、記憶装置180から構成される。
入力部170は、マウスや、キーボードまたはタッチパネルなどのユーザインターフェースであり、医療データ分析装置10への入力を受け付ける。出力部160は、医療データ分析装置10による演算結果を出力するディスプレイやプリンタを指す。
記憶装置180は、磁気ディスクドライブや不揮発性メモリなどの不揮発性記憶装置を指し、本発明を実現する各種プログラムと、プログラムの実行結果を保持する。メモリ150には、記憶装置180に格納されたプログラムが展開される。演算装置140は、CPUあるいはGPUなどのプロセッサを指し、メモリ150上に展開されたプログラムを実行する。
データベース20は、医療データ格納部210と、ルール格納部220と、検索履歴格納部230とを有している。医療データ格納部210は、入力部170や外部から入力された医療データを格納する。
医療データは、レセプト(診療報酬明細書)情報を含む。レセプト情報は、傷病名情報320(図3)と、診療行為情報330(図4)と、医薬品情報340(図5)と、特定器材情報350(図6)、及び再審査請求情報360(図7)を含む。なお、レセプト情報は、上記以外にも入院または外来、保険点数、症状詳記、コメントといった請求情報や、再審査請求の理由情報なども含むが、本実施例1の説明には不要のため、記載を省略する。
ルール格納部220には、傷病と診療行為の適応関係や、医薬品同士の関係といった、ルール情報380(図9、図10)を格納する。検索履歴格納部230には、類似するレセプト情報の検索に用いた入力データの記載情報や、重み値などのパラメータといった履歴情報などを格納される。
データベース20に保持されている情報は、必ずしもデータベース20上で保持される必要はなく、医療データ分析装置10の記憶装置180で保持してもよい。
本医療データ分析支援システムの全体構成の概要として、入力部170を介してユーザが選択した医療データを分析対象の入力データとして、類似データ検索部114がレセプト情報から類似データを抽出する。そして、抽出された類似データについて分析処理部112が分析処理を実施し、可視化部115を介してユーザに分析結果が提示される。類似データ検索部114及び分析処理部112で処理するための医療データの整形処理はデータ整形部111が実施する。
演算装置140は、各機能部のプログラムに従って処理を実行することによって、所定の機能を提供する機能部として稼働する。例えば、演算装置140は、類似データ検索プログラムに従って処理を実行することで類似データ検索部114として機能する。他のプログラムについても同様である。さらに、演算装置140は、各プログラムが実行する複数の処理のそれぞれの機能を提供する機能部としても稼働する。計算機及び計算機システムは、これらの機能部を含む装置及びシステムである。
以下、各種情報、及び各部について詳細を説明する。
<医療データ(レセプト情報)>
以下、本実施例で使用するレセプト情報について説明する。
図3は、傷病名情報320の構成の一例を示す図である。傷病名情報320は、検索番号1001と、行番号1002と、傷病名コード1201と、傷病名1202を構成項目として含んでいる。
検索番号1001は、レセプトを一意に識別するための識別子である。行番号1002は当該情報がレセプトに記載される行番号である。傷病名コード1101は、レセプトに記載される傷病名のコードである。傷病名1202は、当該傷病名コード1201に対応する傷病の名称である。
図4は、診療行為情報330の構成の一例を示す図である。診療行為情報330は、検索番号1001と、行番号1002と、診療行為コード1301と、診療行為名1302と、点数1303とを構成項目として含んでいる。
検索番号1001は、レセプトを一意に識別するための識別子であり、傷病名情報320の検索番号1001(図3)と同じ番号を用いる。行番号1002は当該情報がレセプトに記載される行番号である。
診療行為コード1301は、レセプトに記載された診療行為を識別するための識別子である。点数1303は、当該診療行為の保険点数である。診療行為名1302は、当該診療行為コードに対応する診療行為の名称である。
図5は、医薬品情報340の構成の一例を示す図である。医薬品情報340は、検索番号1001と、行番号1002と、医薬品コード1401と、医薬品名1402と、点数1403とを構成項目として含んでいる。
検索番号1001は、レセプトを一意に識別するための識別子であり、傷病名情報320の検索番号1001(図3)と同じ番号を用いる。行番号1002は当該情報がレセプトに記載される行番号である。医薬品コード1401は、レセプトに記載された医薬品を識別するための医薬品コードである。医薬品名1402は、当該医薬品コードに対応する医薬品の名称である。点数1403は、当該医薬品の保険点数である。
図6は、特定器材情報350の構成の一例を示す図である。特定器材情報350は、検索番号1001と、行番号1002と、特定器材コード1501と、特定器材名1502と、点数1503とを構成項目として含んでいる。
検索番号1001は、レセプトを一意に識別するための識別子であり、傷病名情報320の検索番号1001(図3)と同じ番号を用いる。行番号1002は当該情報がレセプトに記載される行番号である。特定器材コード1501は、レセプトに記載された特定器材を識別するための特定器材コードである。特定器材名1502は、当該特定器材コードに対応する特定器材の名称である。点数1503は、当該特定器材の保険点数である。
図7は、再審査請求情報360の構成の一例を示す図である。再審査請求情報360は、再審査請求に関する情報を含み、保険者から審査機関への再審査請求時に生成される。
再審査請求情報360は、検索番号1001と、一連番号1601と、理由番号1602と、理由番号補足1603と、理由内容1604と、理由対象行1605を構成項目として含んでいる。
検索番号1001は、レセプトを一意に識別するための識別子であり、傷病名情報320の検索番号1001(図3)と同じ番号を用いる。
一連番号1601は、再審査請求等情報のレセプト毎の記録順序を示す情報である。理由番号1602は、再審査請求の理由が、資格関係か、診療内容か、事務上か、突合再審査か、等の理由を表すコード情報である。
理由番号補足1603は、理由番号1602を補足する自由記載の情報である。理由内容1604は、理由番号1602が表す再審査請求の理由より、さらに詳細な理由の情報であり、医療行為の適応外、過剰、重複などといった理由を表すコード情報である。理由内容1604は、さらに再審査請求の理由に関する自由記載の情報を含んでもよい。理由番号補足1603及び理由内容1604は、具体的にどの医療行為や傷病名が再審査請求の対象となったかを保持してもよい。
理由対象行1605は、傷病名情報320や診療行為情報330、特定機材情報350、医薬品情報340のどの項目が再審査請求になったかを示す情報であり、行番号1002の情報が格納される。
なお、以降は診療行為コード、特定器材コード、医薬品コードを総称する際は、簡単のため医療行為と呼ぶ。
<ルール情報>
以下、本実施例で使用するルール情報について説明する。
図9、図10は、ルール情報380の構成の一例を示す図である。ルール情報380は、図9に示す適応テーブル380−1と、図10に示す禁忌テーブル380−2を保持する。
図9の適応テーブル380−1は、ルール番号2001と、項目A2002、項目B2003を有する。ルール番号2001は、ルール情報380内で一意に割り当てられる番号である。項目A2002及び項目B20003は、いずれかの傷病名あるいは医療行為が記載される。図10の禁忌テーブル380−2も適応テーブル380−1と同様の構成を有する。両テーブルの違いとして、適応テーブル380−1は、医学的に妥当である適応関係が記載されているのに対し、禁忌テーブル380−2は医学的に不適当である禁忌関係が記載されている。
なお、ルール情報380の形態は上記の例に制限されない。例えば、1つのルールは条件として3つ以上の傷病名および医療行為の情報を保持してもよく、その組み合わせの条件として、いかなる論理演算を用いてもよい。また、複数のルールが医学的に同じ意味を含む場合、複数のルールを集約するようなルールを保持してもよい。また、数値や等号、不等号を含む条件を保持してもよい。
なお、上記ではルール情報380を適応テーブル380−1と禁忌テーブル380−2に分割した例を示したが、一つのテーブルとしてもよい。この場合、適応または禁忌を示す項目を加えればよい。また、ルール情報380は、予め設定された情報であり。外部の計算機に格納されていてもよく、必要に応じて参照可能であればよい。
<データ整形部及び整形情報>
以下、データ整形部111の処理の概要と、データ整形部111が生成する整形情報370について説明する。
データ整形部110は、傷病名情報320と、診療行為情報330と、医薬品情報340と、特定器材情報350、再審査請求情報360、ルール情報380を入力とし、検索番号1001及び行番号1002を結合または集計のキーとして突合、集計を行い、整形情報370を出力する。
図8は、整形情報370の構成の一例を示す図である。整形情報370は、検索番号1001と、項目一覧1701と、再審査請求結果1702を含んでいる。検索番号1001は、レセプトを一意に識別するための識別子であり、傷病名情報320の検索番号1001(図3)と同じ番号を用いる。
項目一覧1701は、検索番号1001を検索キーとして、傷病名情報320の傷病名コード1201と、診療行為情報330の診療行為コード1301と、医薬品情報340の医薬品コード1401と、特定器材情報350の特定器材コード1501の一覧を取得したものである。
また、項目一覧1701はルール番号2001を含み、類似データ検索部114は、ルール情報380と項目一覧1701に含まれる傷病名あるいは医療行為や医薬品名を照合して、項目一覧1701のルール番号2001の値をルール情報380から取得して設定する。
なお、項目一覧1701のルール番号2001を設定する処理は、整形情報370を生成する際にデータ整形部111で行っておいてもよい。
再審査請求結果1702は、検索番号1001に該当するレセプトが再審査請求された結果を表す情報であり、検索番号1001を結合キーとして、再審査請求情報360から取得された情報である。
整形情報370のうち項目一覧1701は、該当の項目がレセプト内に存在するか否かを表現する「1」もしくは「0」の値を保持してもよいし、診療等が実施された回数や、数量、日数といった数値の情報を保持してもよい。
再審査請求結果1702は、再審査請求が行われたか否かを表現する「1」もしくは「0」の値を保持してもよいし、再審査請求の理由を表す理由番号1602や理由内容1604、理由対象となった医療行為の情報を保持してもよい。
なお、整形情報370は、類似データを検索する際に、レセプト情報の記載内容の一致度を計算するためのデータ構造であるが、必ずしも図示の通りの構造でデータを保持する必要はない。
また、類似データ検索部114は、整形情報370を用いて一致度の計算を行うこともできるが、一致度の計算の高速化を目的として、別途検索インデックスの情報を保持してもよい。
なお、図8では、項目一覧1701がコードや番号で構成される例を示したが、これに限定されるものではなく、傷病名、医療行為の名称や、ルールの名称等で構成されてもよい。
<分析処理部>
分析処理部112は、類似データ検索部114が抽出した類似データ(後述)に対して、再審査請求の要因を抽出する分析処理を実行し、抽出した要因に関して再審査請求の割合などの統計情報を可視化する。
再審査請求の要因抽出に用いる分析処理は、要因分析に用いられる周知または公知の機械学習的手法あるいは統計的手法であれば特に制限はされず、例えば、ロジスティック回帰分析や、勾配ブースティングや、Random Forestや、決定木学習などを用いてよく、分析の目的に応じて医療データ分析支援システムのユーザが機能を選択または実装可能なものとする。
なお、分析処理部112に入力するデータは、整形情報370を用いてもよいが、類似データの検索番号1001をキーとして取得可能なレセプトのいかなる情報を追加したデータを用いてよい。
<類似データ検索部>
以下、類似データ検索部114による類似データの抽出処理の一例を示す。図11は、本医療データ分析支援システムにおける類似医療データ抽出処理のフローチャートを示す。この処理は、医療データ分析支援システムのユーザの指令に基づいて開始される。医療データ分析装置10は、比較対象となるレセプトの情報を受け付けて、類似したレセプトを整形情報370から検索し、類似するレセプトのグループを類似データとして抽出する。
類似データ検索部114は、医療データ分析支援システムのユーザが選択した分析対象のレセプトの記載情報を入力データとして受け付ける(S101)。ユーザは入力部170等からレセプトの記載情報を指定または入力する。なお、入力データは、図8に示した整形情報370と同様の項目を含む。
類似データ検索部114は、入力データに対応するルール情報380を指定する(S102)。入力データのルールは、ユーザが入力部170から指定または入力してもよいし、類似データ検索部114がルール情報380から取得してもよい。
次に、類似データ検索部114は、検索対象となる医療データを検索対象データとして受け付ける(S103)。検索対象データは、ユーザが入力部170を介して検索対象の整形情報370を指定する。なお、検索対象データは、整形情報370の生成期間や審査機関などの条件に応じて選択することができる。
なお、医療データ分析支援システムのユーザは、データ整形部111に分析対象のレセプトを入力して、整形情報370を予め生成させておく。
次に、類似データ検索部114は、類似データ検索処理に使用する一致度の閾値の初期値を設定する(S104)。閾値の初期値は「0」から「1」の範囲の実数値であればよい。初期値の同範囲内であれば特に制限されないが、簡単のため、ここでは「1」に近い値(0.9など)を設定する。類似データ検索部114は、後述するように、閾値の値を刻み値ずつ下げていきながら最終的な閾値を決定する例を説明する。なお、刻み値は、ステップS105〜S108のループの度に閾値を低減する変化量であり、例えば、0.05等の所定値が設定される。
次に、類似データ検索部114は、分析対象の入力データの記載情報と、検索対象データの項目の一致度が閾値以上となる整形情報370を検索し、類似データの候補(候補データ)として抽出する(S105)。レセプト間の一致度を計算するための入力として使用するレセプトの記載情報は、整形情報370の項目一覧1701の情報であり、傷病名、医療行為、ルールといった情報を使用する。
一致度の計算には、項目一覧1701が「1」か「0」の情報である場合は、値の存在の有無について一致度を計算すればよい。例えば、ジャカード距離や、重み付けジャカード距離などの値を一致度として用いてよい。
また、項目一覧1701が数量や、回数、日数などの数値情報を含む場合は、数値情報を用いて類似度等を一致度の指標として算出すればよい。類似度の算出方法としては、例えば、コサイン距離や、ユークリッド距離などの公知または周知の指標を用いることができる。なお、類似データ検索部114は、入力データに対する検索対象データの一致度または類似度を算出して閾値と比較すればよい。本実施例1では、一致度または類似度を、一致情報とする。
また、類似データ検索部114では、一致度に重み付けを行ってもよい。重み付けの方法として、例えば、TF−IDF(TF:Term Frequency:単語の出現頻度、IDF:Inverse Document Frequency:逆文書頻度)などの周知または公知の手法を用いてもよい。
次に、類似データ検索部114は、一致度が閾値以上で抽出した類似データ候補(候補データ)であるレセプト(整形情報370)に含まれる指標値として、以下の値を算出する(S106)。
(a) 入力データのルールと一致するルール以外に、一致するルールを含まない候補データの数=類似データ数X1
(b) 入力データのルールと一致するルール以外のルールを含む候補データの数=類似データ数X2
(c) 入力データのルールと一致するルール以外にも、一致するルールを含み、かつそのルールが禁忌であるか、もしくは再審査請求された項目の一部を含む候補データの数=類似データ数X3
上記(a)の類似データ数X1は、入力データのルールが「A」の場合、ルールが「A」のみの候補データの数を示す。
また、上記(b)の類似データ数X2は、入力データのルールが「A」の場合、ルールが「A」の他に「B」や「C」等の無関係のルールを含む候補データの数を示す。
また、上記(c)の類似データ数X3は、候補データに該当するルールが「A」の場合、ルールが「A」の他に「D」や「E」等の無関係のルールを含み、かつ、ルールが禁忌テーブル380−2に含まれ、または再審査請求1702の再審査請求の発生に関する記載がある候補データの数を示す。
類似データ検索部114は、抽出された候補データの特徴を示す指標値を、上記(a)〜(c)の類似データ数X1〜X3として算出する。
次に、類似データ検索部114は、抽出した候補データの指標値が、予め設定された閾値決定条件を満たすか否かを判定する(S107)。閾値決定条件の一例としてはとしては、以下が挙げられる。
(1) 上記(c)の類似データ数X3が「1」以上になる
(2) 上記(a)の類似データ数X1が(b)の類似データ数X2を下回る
(3) 前回の閾値による処理結果と比較して(a)の類似データ数X1が今回は増加せず、(b)の類似データ数X2が増加する
すなわち、上記(1)の条件を満たす閾値(以下Th1)の場合、入力データのルールとは関係のないルールを含み、かつ、ルールが禁忌または再審査請求が発生した候補データが抽出される。したがって、現在の閾値Th1で抽出した類似データで分析を行うと、入力データのルールとは無関係なルールで、禁忌または再審査請求等の属性情報を有するデータが含まれるため、分析対象としては望ましくない、と判定される。
また、上記(2)の条件を満たす閾値(以下Th2)の場合、入力データのルールのみを含む類似データ数X1が、入力データのルールとは関係のないルールを含む類似データ数X2よりも低下する。したがって、現在の閾値Th2よりも閾値を低下させると、入力データとは無関係なルールを含む候補データの方が多いため、分析精度の向上は望めない。なお、閾値Th2は、類似データ数X1=類似データ数X2から類似データ数X1<類似データ数X2へ遷移する境界となる値である。
また、上記(3)の条件を満たす閾値(以下Th3)の場合、刻み値で低下させる前の前回の閾値による処理結果を、類似データ数X1(−1)、類似データ数X2(−1)とすると、
類似データ数X1≒類似データ数X1(−1)
類似データ数X2>類似データ数X2(−1)
という候補データが抽出される。
したがって、閾値Th3の候補データは、入力データとは無関係なルールを含む候補データの増分が多いため、閾値Th3より低下させると分析の精度が低下する。
このように、閾値決定条件は、レセプトの項目間の一致度だけではなく、レセプトに適合するルールも加えて判定することで、入力データとは無関係な項目を含む候補データを除外できる閾値を判定することができる。
類似データ検索部114は、上記の(1)〜(3)のいずれかの条件を満たす場合、閾値決定条件を満たしたものと判定し、いずれも満たさなかった場合は閾値決定条件を満たしていないと判定する。
ステップS107において閾値決定条件を満たさない場合、類似データ検索部114は、現在の閾値と指標値を履歴情報として検索履歴格納部230に格納し、閾値を刻み値分だけ減少させる(S108)。そして、上記ステップS105に戻って、減少させた閾値で上記処理を繰り返す。
一方、ステップS107において、閾値決定条件を満たす場合、類似データ検索部114は、一致度が最後の閾値以上となるレセプトの整形情報370を類似データとして抽出して、類似データ抽出処理を終了する。
以上の手順で類似データを抽出することで、本発明の医療データ分析支援システムでは、入力データとは無関係な医療のルールを含むデータの割合を低減することが可能となる。そして、医療データ分析支援システムは、入力データとは無関係な医療のルールに基づいて再審査請求されたデータ(または属性情報を有するデータ)を除外することで、再審査請求の要因分析として不要な項目の混入が少ない類似データを分析対象のデータとして抽出することができる。
<指標値、閾値のバリエーション>
以下、図11のステップS106及びステップS107における指標値及び閾値決定条件のバリエーションを以下に示す。
ステップS106の指標値に関して、上記(a)、(b)、(c)のそれぞれで、「入力データのルールと一致するルール」と記載しているが、これに代わって「入力データと部分的に一致するルール」としてもよい。これにより、レセプトには傷病名などの情報が欠落して請求される場合もあるため、このような場合においても、本来関連のあるレセプトを類似データとして抽出することが可能となる。
また、上記(b)の代わりに、「入力データのルールと一致するルールの数よりも、それ以外のルールに一致する数が多い候補データの数=類似データ数X2A」を用いてもよい。上記の例では、入力データとは無関係なルールを1つでも含むだけで、そのデータは類似データを取得する範囲を狭める指標として機能してしまう。
しかし、入力データとは無関係なルールであっても、当該ルールが再審査請求とは無関係である場合、入力データに一致するルールの割合よりも含まれる数が少ないのであれば、再審査請求の要因分析の阻害要因になる可能性は低い。そのため、本指標を導入することで、抽出する類似データの数を不必要に少なくすることを予防することができる。
また、ステップS107の閾値決定条件に関して、上記(1)の代わりに、新たな(4)「前回の閾値による処理結果と比較して(a)の類似データ数X1が増加せず、(c)の類似データ数X3のみが増加する」としてもよい。
これは上記(c)の指標値(類似データ数X3)に該当するデータを類似データから除外する上で、必ずしも一致度の閾値の調整だけで類似データの範囲を決定する必要はなく、候補データの中から(c)に該当するデータを除外することも可能なためである。
ただし、再審査請求の要因が入力データとは無関係なデータのみが増加する場合は、閾値を下げて類似データの範囲を広げても分析の上で有用なデータ数は増えない。このため、閾値決定条件として上記(4)を用いることで、不要なデータを類似データとして抽出されることを防ぐことが可能となる。ただし、上記(4)の閾値決定条件を用いる場合、類似データの中から、上記(c)に該当する候補データは抽出対象から除外する。
なお、上記の例では、閾値決定条件を満たした時点で類似データを抽出して処理を終了しているが、後述する統計情報を可視化するために、予め決められた回数だけ、閾値を刻み幅分下げて履歴情報を取得した後に、類似データ抽出処理を終了してもよい。
また、閾値の初期値で類似データを抽出した際に、指標値である(c)の値が0以上だった場合、閾値決定条件として上記(1)を使用せず、上記(4)を使用してもよい。これにより、レセプトに多少の異常値が混在する場合においても、類似データ取得の範囲が極端に小さくなることを防ぐことができる。
なお、上記実施例1では、類似データ検索部114が、閾値決定条件の(1)〜(3)のいずれかを満足した場合の閾値Th1〜Th3で候補データ(または検索対象データ)から分析用の類似データを抽出する例を示したが、これに限定されるものではない。例えば、医療データ分析装置10が、閾値Th1〜Th3を出力部160に表示して、ユーザに閾値を選択させ、選択された閾値で候補データの抽出を行うようにしてもよい。
また、上記実施例1では類似データ検索部114が、入力データの記載情報と、検索対象データの整形情報370の一致度を算出し、一致度に対する閾値によって候補データを抽出する例を示したが、これに限定されるものではない。例えば、類似データ検索部114が、入力データの記載情報と、検索対象データの整形情報370の類似度を算出し、類似度に対する閾値によって候補データを抽出してもよい。
また、入力データのルール以外のルールを含む候補データに、再審査請求の情報(属性情報)が出現するまで閾値を低下させてもよい。この場合、類似データの数を増大させて分析の精度を向上させることができる。
<可視化部>
本発明の実施例1により、類似データ検索部114が、抽出した類似データの統計情報の可視化の例を図2A〜図2Dに示す。
図2A〜図2Dは、可視化部115が、最終的に決定した閾値(Th1〜Th3)の情報と、検索履歴格納部230に蓄積された履歴情報である閾値毎の類似データの統計情報を出力部160へ表示する画面の一例を示す。
図2Aは、閾値毎の類似データの数を、レセプト数の棒グラフとして可視化部115が表示する画面41の一例を示す。
画面41には、類似データ検索部114が上記図11の処理で決定した閾値を表示する決定閾値51と、ユーザが閾値を入力する入力欄52を含む。入力欄52へユーザが閾値を入力することで、医療データ分析装置10は入力された閾値でレセプト数を算出し、出力部160へ表示する。
図2Bは、閾値毎に入力データのルールに一致するルールのみを有する類似データの比率を棒グラフとして可視化部115が表示する画面42の一例を示す。
画面42には、類似データ検索部114が上記図11の処理で決定した閾値を表示する決定閾値51と、ユーザが閾値を入力する入力欄52を含む。入力欄52へユーザが閾値を入力することで、医療データ分析装置10は入力された閾値でレセプト数に対する類似データ数X1の割合を算出し、出力部160へ表示する。
図2Cは、閾値毎に入力データのルールに一致するルールの他に、他のルールを有する類似データ数X2の比率を棒グラフとして可視化部115が表示する画面43の一例を示す。
画面43には、類似データ検索部114が上記図11の処理で決定した閾値を表示する決定閾値51と、ユーザが閾値を入力する入力欄52を含む。入力欄52へユーザが閾値を入力することで、医療データ分析装置10は入力された閾値でレセプト数と、他のルールを有する類似データ数X2の割合を算出し、出力部160へ表示する。
図2Dは、閾値毎に再審査請求のデータ(属性情報を有するデータ)の割合を棒グラフとして可視化部115が表示する画面44の一例を示す。図示の例では、閾値毎にレセプト数に対する再審査請求の割合と、レセプト数に対して入力データとは無関係な再審査請求の割合が表示される例を示す。
画面44には、類似データ検索部114が上記図11の処理で決定した閾値を表示する決定閾値51と、ユーザが閾値を入力する入力欄52を含む。入力欄52へユーザが閾値を入力することで、医療データ分析装置10は入力された閾値でレセプト数に対する再審査請求の割合と、入力データとは無関係な再審査請求の割合を算出し、出力部160へ表示する。
以上の本実施例1において、再審査請求の点検業務に関して、医療データ分析装置10が再審査請求の要因分析のために類似データを抽出する例を述べた。上記以外の本発明の他の実施例として、例えば、再審査請求の情報の代わりに、病気の発症に関する記録情報を使用して、病気の発症要因の分析に適用してもよい。
<概要>
保険者が点検するレセプトは、請求通りのレセプトに対し、再審査請求のレセプト数が少ない。そのため、機械学習や統計的手法を用いた再審査請求の要因分析において、正例と負例のデータ量が不均衡となるため、要因抽出の精度が悪化するという課題がある。
本実施例2では、再審査請求と関連する項目に重み付けを実施してから、前記実施例1に示した類似データの抽出を行うことで、再審査請求の割合が高くなるような類似データのグループを抽出する例を示す。
また、レセプトの点検業務の度に重み値が変わると、点検業務の判断にばらつきが生じる可能性があるため、過去の点検業務で使用した重み値を履歴情報として検索履歴格納部230に蓄積し、レセプトの点検時に履歴情報の使用を選択する例も示す。
<再審査請求項目に重み付けを行う類似データ抽出のフローチャート>
以下、再審査請求と関連する項目に重み付けを行ったうえで類似データを抽出する処理の例について述べる。なお、再審査請求と関連する項目は、前記実施例1の整形情報370の項目一覧1701に含まれる。
図12は、重み付けを用いた類似データ抽出処理のフローチャートを示す。
まず、本医療データ分析支援システムの類似データ検索部114は、前記実施例1と同様にユーザが選択した分析対象のレセプトの記載情報を入力データとして取得し、検索対象データを受け付ける。
類似データ検索部114は、過去に入力データとして使用したレセプトの記載情報と、その重み値で構成される履歴情報から、入力データに対する一致度の高い順に記載情報及び履歴情報を取得し、最も一致度の高い履歴情報のレセプトの記載情報及び重み値の情報を出力部160に表示する(S301)。
次に、入力部170は、ユーザが出力部160に提示された重み値の情報を使用して類似データの検索を行うか否かを受け付ける(S302)。なお、入力データに対する履歴情報がない場合は、本医療データ分析支援システムはユーザに何も提示せず、ステップS303へと進む。
ユーザがステップS302で提示された重み値の情報を使用しない場合、類似データ検索部114は、一致度算出の入力となる項目一覧1701の各項目に対して重み値の初期値を設定する(S303)。重み値の初期値の設定は、周知または公知の一致度の計算に使用される手法であれば特に制限はなく、例えばTF−IDFのような手法をしてもよい。
また、特定の項目の重み付けに偏りのない、すなわち重みを付加しないような値を初期値として設定してもよい。なお、本実施例2で用いる一致度の指標は実施例1とほぼ同様であるが、使用できる指標値は重み付けが可能な指標のみに制限される。
次に、類似データ検索部114は、設定された重み値を使用して、入力データの記載情報と一致度の高いデータを候補データとして整形情報370から抽出する(S304)。候補データを抽出する処理は、重み値を使用する以外は図11及び実施例1の説明と同様のため、説明を省略する。
次に、類似データ検索部114は、抽出された類似データから、再審査請求された項目(1702)と、類似データ内の再審査請求の割合で構成される再審査請求統計情報を取得する(S305)。再審査請求統計情報は、例えば、前記実施例1の図2Dに示した再審査請求の割合と同様にして算出される。
再審査請求された項目は、図7の再審査請求情報360で示したように、理由対象行番号1605と、傷病名情報320(図3)、診療行為情報330(図4)、医薬品情報340(図5)、特定機材情報350(図6)の各行番号1002を突合して類似データ検索部114で取得してもよいし、項目理由番号補足1603や理由内容1604内の自由記載情報を品詞分解したことで得られる単語の情報などから取得してもよい。
次に、類似データ検索部114は、取得した再審査請求の割合が、前回の重み値割合と比較して増加しているか否かを判定し、増加していなければ、重み値決定条件を満たすと判定する(S306)。
類似データ検索部114は、ステップS306で重み値決定条件を満たしてないと判定した場合、ステップS305で取得した再審査請求統計情報を一時記録情報として保持し、再審査請求された項目への重み値を所定の刻み幅分増加させて、ステップS304へと戻る(S307)。
一方、類似データ検索部114は、ステップS306で重み値決定条件を満たすと判定した場合、現在の重み値の情報と、入力データの記載情報を履歴情報として記録したうえで、ステップS304で抽出した類似データを履歴情報に記録する(S308)。類似データ検索部114は、当該入力データで使用する重み値を現在の値に決定し、入力データと類似データを履歴情報に格納する。
類似データ検索部114は、ステップS302において、ユーザが出力部160に提示された重み値情報を選択した場合は、履歴情報から重み値を取得して、重み値を設定し(S309)、類似データを抽出する(S310)。
ここで、履歴情報の重み値に入力データに記載のない項目への重み付けが含まれる場合は、類似データ検索部114が、該当の項目に重み付けを実施しないことをユーザに通知したうえで、該当の項目の重み付けを行わない。
以上の実施例2により、医療データ分析装置10は、再審査請求のデータを多く含んだ類似データを整形情報370から抽出し、かつ点検の度に異なる重み付け情報を使用することを防ぐことができ、可視化の度に点検支援の情報にばらつきが生じることを防ぐことが可能となる。
<重み付けのユーザ選択画面>
本発明の実施例2により、医療データ分析装置10のユーザが履歴情報に基づいて重み付けを選択する画面61の一例を図13に示す。画面61は可視化部115によって、出力部160に表示される。
図13の画面61の表示例では、過去にユーザが選択した入力データの記載情報62と、履歴情報から取得した過去の入力データの記載情報63及び重み付け情報64が表示される。
記載情報62には、一致度の最も高い過去の入力データの情報が表示される。また、入力データに含まれない重み値が履歴情報に存在する場合は、該当項目がわかるように強調して表示される。
ユーザは表示されたレセプトの記載情報と記載情報62とを比較し、提示された重み値を使用するか、別のレセプトの記載情報62を閲覧するか、履歴情報の重み付け情報64を使用せずに重み値を計算しなおすかを選択できる。なお、別のレセプトの選択や再計算の選択は、選択項目65のチェックボックスをチェックすることで行われる。
ユーザが別のレセプトの履歴情報の閲覧を選択した場合、医療データ分析支援システムは、次に一致度の高いレセプトの記載情報62を表示する。ユーザが選択項目65で履歴情報の重み値の使用あるいは不使用を選択した場合、上記図12のフローチャートにしたがって、類似データ検索部114は整形情報370から類似データを抽出する。
<ユーザの目的に応じて、実施例2の重み付けの方法の変更>
医療データ分析装システムのユーザは、再審査請求の要因分析の他に、確実に再審査請求される、もしくは再審査請求を回避可能なレセプトのパターンを点検ルールとして抽出したい場合がある。
本医療データ分析支援システムでは、上記実施例2に加え、ユーザは分析の目的情報として、以下(a)、(b)のいずれかを入力部170を操作して入力してよい。
(a) 再審査請求のあるレセプトを判定するルールの抽出、あるいは再審査請求の要因分析
(b) 再審査請求のないレセプトを判定するルールの抽出
上記(a)の場合、上述した通り、図12のステップS303、S307で重み付けされる項目は再審査請求された項目となり、またステップS306の重み値決定条件は、再審査請求が前回の重み値と比較して増加していないことが条件となる。
一方で、上記(b)の場合、図12のステップS303、S307で重み付けされる項目は再審査請求されなかった項目となり、またステップS306の重み値決定条件は、類似データの中から再審査請求がなくなるか一定値以下になることが条件となる。
これにより、類似データ検索部114は、再審査請求と関連のある項目を含む類似データを取得するか、再審査請求されない項目を含む類似データを取得するかを、ユーザの分析目的に応じて切り替えることが可能となる。
なお、本発明の実施形態は、汎用コンピュータ上で稼働するソフトウェアで実装しても良いし専用ハードウェア又はソフトウェアとハードウェアの組み合わせで実装しても良い。上記の説明では「テーブル」形式によって本発明の各情報について説明したが、これら情報は必ずしもテーブルによるデータ構造で表現されていなくても良く、リスト、DB、キュー等のデータ構造やそれ以外で表現されていても良い。そのため、データ構造に依存しないことを示すために「テーブル」、「リスト」、「DB」、「キュー」等について単に「情報」と呼んでもよい。
<まとめ>
以上のように、上記実施例1、2の類似データの検索方法は、プロセッサ(140)とメモリ(150)を有する計算機(10)が、検索対象データから入力データに類似するデータを抽出する類似データの検索方法であって、前記計算機(10)が、前記入力データの記載情報と前記入力データの第1のルールを受け付け、前記検索対象データを受け付ける入力ステップと(S101、S102)、前記計算機(10)が、閾値の初期値を設定する初期値設定ステップと(S103)、前記計算機(10)が、前記入力データに対する前記検索対象データの一致情報(一致度または類似度)を算出し、一致情報と前記閾値を比較して候補データを抽出する候補データ抽出ステップと(S104)、前記計算機(10)が、前記候補データから、前記第1のルールのみを含む第1のデータと、前記第1のルール群に含まれない第2のルールを含む第2のデータとを抽出するグループ抽出ステップ(S105)と、前記計算機(10)が、前記第1のデータと前記第2のデータが所定の閾値決定条件を満たしていない場合には前記閾値を変更する閾値変更ステップ(S106、S107)と、を含む。
上記構成により、類似データの検索方法は、入力データとは無関係な医療のルールを含むデータの割合を低減することが可能となる。そして、類似データの検索方法は、入力データとは無関係な医療のルールに基づいて再審査請求されたデータ(属性情報を有するデータ)を除外することで、再審査請求の要因分析として不要な項目の混入が少ない類似データを分析対象のデータとして抽出することができる。
また、前記閾値変更ステップは(S106、S107)、前記第2のデータに含まれる属性情報(再審査請求または禁忌のルール)の有無に基づいて前記閾値決定条件を満たしているか否かを判定する。
これにより、入力データとは無関係な医療のルールに基づいて再審査請求されたデータ(属性情報を有するデータ)を除外することが可能となる。
また、計算機(10)が、前記第1のデータと前記第2のデータが所定の閾値決定条件を満たしている場合には、前記一致情報が前記閾値以上の前記検索対象データを類似データとして抽出する類似データ抽出ステップを、さらに含む。
これにより、値を更新された最終的な閾値以上の一致度の検索対象データから類似データを抽出することができる。
また、前記閾値変更ステップ(S106、S107)は、前記第2のデータに属性情報が含まれるまで前記閾値を低下させる。これにより、類似データの数を増大させて分析の精度を向上させることができる。
また、前記閾値変更ステップ(S106、S107)は、前記閾値毎に前記第1のデータの数と、前記第2のデータの数を取得し、前記第2のデータの数が第1のデータの数を上回るまで前記閾値を低下させる。これにより、不要なデータを類似データとして抽出されることを防ぐことが可能となる。
前記閾値変更ステップ(S106、S107)は、前記閾値毎に前記第1のデータの数と、前記第2のデータの数を取得し、前記第1のデータの数が増加せずかつ前記第2のデータの数のみが増加するまで前記閾値を低下させる。これにより、候補データの中から上記(c)に該当するデータを除外することも可能となる。
前記閾値変更ステップ(S106、S107)は、前記閾値毎に前記第1のデータの数と、前記属性情報を含む前記第2のデータの数を取得し、前記第1のデータの数が増加せずかつ前記属性情報を持つ前記第2のデータの数のみが増加するまで前記閾値を低下させる。これにより、類似データ取得の範囲が極端に小さくなることを防ぐことができる。
また、前記入力データ及び検索対象データは、医療情報を含むレセプトの情報であって、前記記載情報は、前記レセプトに記載された傷病名(1202)と、診療行為(1302)と、特定器材(1502)と、医薬品(1402)と、ルール(2001)の情報を含み、前記ルール(2001)は、医療情報の組み合わせが適応(380−1)であるか禁忌(380−2)であるかの情報を含み、前記属性情報は、第1の属性情報もしくは第2の属性情報であって、前記第1の属性情報は、前記レセプトに記載された再審査請求の情報(1702)であり、前記第2の属性情報は、前記第2のルールが禁忌(380−2)の情報であるか、前記第2のルールが再審査請求された項目(1603)を含む。
また、前記計算機(10)が、前記候補データから、前記第1の属性情報を持つ記載情報を取得する再審査請求抽出ステップ(S305)と、前記計算機(10)が、前記第1の属性情報が示す記載情報に重み値を付加して再度候補データを抽出する重み設定ステップ(S307)と、をさらに含む。
これにより、再審査請求と関連する項目に重み付けを実施してから、前記実施例1に示した類似データの抽出を行うことで、再審査請求の割合が高くなるような類似データのグループを抽出することが可能となる。
また、前記再審査請求抽出ステップ(S305)は、前記重み値毎に、前記候補データに含まれる前記第1の属性情報の割合である属性割合情報を取得し、前記重み設定ステップ(S307)は、前記属性割合情報が増加しなくなるまで前記重み値を増加させて前記候補データを抽出する。
これにより、再審査請求のデータを多く含んだ類似データを整形情報370から抽出し、かつ点検の度に異なる重み付け情報を使用することを防ぐことができ、可視化の度に点検支援の情報にばらつきが生じることを防ぐことが可能となる。
また、前記計算機(10)が、過去の入力データ毎に重み値の履歴情報を蓄積する履歴情報蓄積ステップ(S307)と、前記計算機(10)が、新たな入力データを用いて候補データを抽出する場合に、前記新たな入力データとの一致度が最も高い過去の入力データの重み値情報を出力し、前記重み値情報を用いて候補データを検索するか否かの選択を受け付ける重み選択ステップ(S301)と、をさらに含む。
過去の点検業務で使用した重み値を履歴情報として検索履歴格納部230に蓄積し、レセプトの点検時に履歴情報の使用を選択することで、可視化の度に点検支援の情報にばらつきが生じることを防ぐことが可能となる。
前記重み設定ステップ(S303、S307)は、前記重み付けの対象を前記第1の属性情報が付与された記載情報とするか、前記第1の属性情報が付与されていない記載情報を対象とするかを、分析目的の情報に従って切り替え、かつ、前記属性割合情報が増加しなくなるまで重み値を増加させるか、前記属性割合情報がなくなるまで重み値を増加させるかを切り替えて、類似データを抽出する。
これにより、類似データ検索部114は、再審査請求と関連のある項目を含む類似データを取得するか、再審査請求されない項目を含む類似データを取得するかを、ユーザの分析目的に応じて切り替えることが可能となる。
また、前記計算機(10)が、前記閾値毎の候補データの統計情報として、候補データの数(41)と、前記入力データに存在するルールのうち候補データ内に存在するルールの数(42)と、入力データに存在しないルールのうち候補データに存在するルールの数(43)と、候補データに存在する前記第1の属性情報の割合を表示(44)する可視化ステップを、さらに含む。
これにより、検索対象データに含まれるレセプト数や入力データのルールと一致するデータの割合などを表示することができる。
なお、本発明は上記した実施例1、2に限定されるものではなく、様々な変形例が含まれる。例えば、上記した実施例は本発明を分かりやすく説明するために詳細に記載したものであり、必ずしも説明した全ての構成を備えるものに限定されるものではない。また、ある実施例の構成の一部を他の実施例の構成に置き換えることが可能であり、また、ある実施例の構成に他の実施例の構成を加えることも可能である。また、各実施例の構成の一部について、他の構成の追加、削除、又は置換のいずれもが、単独で、又は組み合わせても適用可能である。
また、上記の各構成、機能、処理部、及び処理手段等は、それらの一部又は全部を、例えば集積回路で設計する等によりハードウェアで実現してもよい。また、上記の各構成、及び機能等は、プロセッサがそれぞれの機能を実現するプログラムを解釈し、実行することによりソフトウェアで実現してもよい。各機能を実現するプログラム、テーブル、ファイル等の情報は、メモリや、ハードディスク、SSD(Solid State Drive)等の記録装置、または、ICカード、SDカード、DVD等の記録媒体に置くことができる。
また、制御線や情報線は説明上必要と考えられるものを示しており、製品上必ずしも全ての制御線や情報線を示しているとは限らない。実際には殆ど全ての構成が相互に接続されていると考えてもよい。
10 医療データ分析装置
20 データベース
210 医療データ格納部
220 ルール格納部
230 履歴情報格納部
111 データ整形部
112 分析処理部
114 類似データ検索部
115 可視化部
320 傷病名情報
330 診療行為情報
340 医薬品情報
350 特定器材情報
360 再審査請求情報
370 整形情報
380 ルール情報

Claims (15)

  1. プロセッサとメモリを有する計算機が、検索対象データから入力データに類似するデータを抽出する類似データの検索方法であって、
    前記計算機が、前記入力データの記載情報と前記入力データの第1のルールを受け付け、前記検索対象データを受け付ける入力ステップと、
    前記計算機が、閾値の初期値を設定する初期値設定ステップと、
    前記計算機が、前記入力データに対する前記検索対象データの一致情報を算出し、一致情報と前記閾値を比較して候補データを抽出する候補データ抽出ステップと、
    前記計算機が、前記候補データから、前記第1のルールのみを含む第1のデータと、前記第1のルールに含まれない第2のルールを含む第2のデータとを抽出するグループ抽出ステップと、
    前記計算機が、前記第1のデータと前記第2のデータが所定の閾値決定条件を満たしていない場合には前記閾値を変更する閾値変更ステップと、
    を含むことを特徴とする類似データの検索方法。
  2. 請求項1に記載の類似データの検索方法であって、
    前記閾値変更ステップは、
    前記第2のデータに含まれる属性情報の有無に基づいて前記閾値決定条件を満たしているか否かを判定することを特徴とする類似データの検索方法。
  3. 請求項1に記載の類似データの検索方法であって、
    前記計算機が、前記第1のデータと前記第2のデータが所定の閾値決定条件を満たしている場合には、前記一致情報が前記閾値以上の前記検索対象データを類似データとして抽出する類似データ抽出ステップを、さらに含むことを特徴とする類似データの検索方法。
  4. 請求項1に記載の類似データの検索方法であって、
    前記閾値変更ステップは、
    前記第2のデータに属性情報が含まれるまで前記閾値を低下させることを特徴とする類似データの検索方法。
  5. 請求項1に記載の類似データの検索方法であって、
    前記閾値変更ステップは、
    前記閾値毎に前記第1のデータの数と、前記第2のデータの数を取得し、前記第2のデータの数が第1のデータの数を上回るまで前記閾値を低下させることを特徴とする類似データの検索方法。
  6. 請求項1に記載の類似データの検索方法であって、
    前記閾値変更ステップは、
    前記閾値毎に前記第1のデータの数と、前記第2のデータの数を取得し、前記第1のデータの数が増加せずかつ前記第2のデータの数のみが増加するまで前記閾値を低下させることを特徴とする類似データの検索方法。
  7. 請求項2に記載の類似データの検索方法であって、
    前記閾値変更ステップは、
    前記閾値毎に前記第1のデータの数と、前記属性情報を含む前記第2のデータの数を取得し、前記第1のデータの数が増加せずかつ前記属性情報を持つ前記第2のデータの数のみが増加するまで前記閾値を低下させることを特徴とする類似データの検索方法。
  8. 請求項2に記載の類似データの検索方法であって、
    前記入力データ及び検索対象データは、医療情報を含むレセプトの情報であって、
    前記記載情報は、前記レセプトに記載された傷病名と、診療行為と、特定器材と、医薬品と、ルールの情報を含み、
    前記ルールは、医療情報の組み合わせが適応であるか禁忌であるかの情報を含み、
    前記属性情報は、第1の属性情報もしくは第2の属性情報であって、
    前記第1の属性情報は、前記レセプトに記載された再審査請求の情報であり、
    前記第2の属性情報は、前記第2のルールが禁忌の情報であるか、前記第2のルールが再審査請求された項目を含むことを特徴とする類似データの検索方法。
  9. 請求項8に記載の類似データの検索方法であって、
    前記計算機が、前記候補データから、前記第1の属性情報を持つ記載情報を取得する再審査請求抽出ステップと、
    前記計算機が、前記第1の属性情報が示す記載情報に重み値を付加して再度候補データを抽出する重み設定ステップと、
    をさらに含むことを特徴とする類似データの検索方法。
  10. 請求項9に記載の類似データの検索方法であって、
    前記再審査請求抽出ステップは、
    前記重み値毎に、前記候補データに含まれる前記第1の属性情報の割合である属性割合情報を取得し、
    前記重み設定ステップは、
    前記属性割合情報が増加しなくなるまで前記重み値を増加させて前記候補データを抽出することを特徴とする類似データの検索方法。
  11. 請求項8に記載の類似データの検索方法であって、
    前記計算機が、過去の入力データ毎に重み値の履歴情報を蓄積する履歴情報蓄積ステップと、
    前記計算機が、新たな入力データを用いて候補データを抽出する場合に、前記新たな入力データとの一致度が最も高い過去の入力データの重み値情報を出力し、前記重み値情報を用いて候補データを検索するか否かの選択を受け付ける重み選択ステップと、
    をさらに含むことを特徴とする類似データの検索方法。
  12. 請求項10に記載の類似データの検索方法であって、
    前記重み設定ステップは、
    重み付けの対象を前記第1の属性情報が付与された記載情報とするか、前記第1の属性情報が付与されていない記載情報を対象とするかを、分析目的の情報に従って切り替え、かつ、前記属性割合情報が増加しなくなるまで重み値を増加させるか、前記属性割合情報がなくなるまで重み値を増加させるかを切り替えて、類似データを抽出することを特徴とする類似データの検索方法。
  13. 請求項8に記載の類似データの検索方法であって、
    前記計算機が、前記閾値毎の候補データの統計情報として、候補データの数と、前記入力データに存在するルールのうち候補データ内に存在するルールの数と、入力データに存在しないルールのうち候補データに存在するルールの数と、候補データに存在する前記第1の属性情報の割合を表示する可視化ステップを、さらに含むことを特徴とする類似データの検索方法。
  14. プロセッサとメモリを有し、検索対象データから入力データに類似するデータを抽出する情報検索装置であって、
    前記プロセッサが、前記入力データの記載情報と、前記入力データの第1のルールと、前記検索対象データを受け付けて、閾値の初期値を設定し、
    前記プロセッサが、前記入力データに対する前記検索対象データの一致情報を算出し、当該一致情報と前記閾値を比較して候補データを抽出し、前記候補データから、前記第1のルールのみを含む第1のデータと、前記第1のルールに含まれない第2のルールを含む第2のデータとを抽出し、
    前記プロセッサが、前記第1のデータと前記第2のデータが所定の閾値決定条件を満たしていない場合には前記閾値を変更することを特徴とする情報検索装置。
  15. プロセッサとメモリを有する計算機で、検索対象データから入力データに類似するデータを抽出させるためのプログラムであって、
    前記入力データの記載情報と前記入力データの第1のルールを受け付ける第1のステップと、
    前記検索対象データを受け付ける第2のステップと、
    閾値の初期値を設定する第3のステップと、
    前記入力データに対する前記検索対象データの一致情報を算出し、一致情報と前記閾値を比較して候補データを抽出する第4のステップと、
    前記候補データから、前記第1のルールのみを含む第1のデータと、前記第1のルールに含まれない第2のルールを含む第2のデータとを抽出するグループ抽出ステップと、
    前記第1のデータと前記第2のデータが所定の閾値決定条件を満たしていない場合には前記閾値を変更する閾値変更ステップと、
    を前記計算機に実行させるためのプログラム。
JP2018184018A 2018-09-28 2018-09-28 類似データの検索方法、情報検索装置及びプログラム Active JP6978997B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2018184018A JP6978997B2 (ja) 2018-09-28 2018-09-28 類似データの検索方法、情報検索装置及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018184018A JP6978997B2 (ja) 2018-09-28 2018-09-28 類似データの検索方法、情報検索装置及びプログラム

Publications (2)

Publication Number Publication Date
JP2020052912A JP2020052912A (ja) 2020-04-02
JP6978997B2 true JP6978997B2 (ja) 2021-12-08

Family

ID=69997391

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018184018A Active JP6978997B2 (ja) 2018-09-28 2018-09-28 類似データの検索方法、情報検索装置及びプログラム

Country Status (1)

Country Link
JP (1) JP6978997B2 (ja)

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3707738B2 (ja) * 2003-05-29 2005-10-19 株式会社日立製作所 診療報酬明細書審査支援装置および方法ならびにそのプログラム
JP4392259B2 (ja) * 2004-02-10 2009-12-24 富士通株式会社 予約管理プログラム、予約管理方法および予約管理装置
JP2005309836A (ja) * 2004-04-22 2005-11-04 Link Genomics Kk がん診断支援システム
US7734566B2 (en) * 2004-11-01 2010-06-08 Sap Ag Information retrieval method with efficient similarity search capability
JP5504620B2 (ja) * 2008-12-10 2014-05-28 富士通株式会社 データ選択支援プログラム、データ選択支援装置およびデータ選択支援方法
JP5856499B2 (ja) * 2012-02-15 2016-02-09 リーズンホワイ株式会社 レセプト分析装置及びレセプト分析プログラム
JP2014092955A (ja) * 2012-11-05 2014-05-19 Panasonic Corp 類似コンテンツ検索処理装置、類似コンテンツ検索処理方法、およびプログラム
JP2015207111A (ja) * 2014-04-18 2015-11-19 ソニー株式会社 検査サーバ、検査方法および検査システム

Also Published As

Publication number Publication date
JP2020052912A (ja) 2020-04-02

Similar Documents

Publication Publication Date Title
Tsafnat et al. Systematic review automation technologies
US10886025B2 (en) Drug adverse event extraction method and apparatus
Powney et al. A review of the handling of missing longitudinal outcome data in clinical trials
JP2023011610A (ja) モデル支援コホート選択を行うシステム及び方法
Vallmuur Machine learning approaches to analysing textual injury surveillance data: a systematic review
Hu et al. Automated detection of postoperative surgical site infections using supervised methods with electronic health record data
US8600772B2 (en) Systems and methods for interfacing with healthcare organization coding system
US11651252B2 (en) Prognostic score based on health information
US10467252B1 (en) Document classification and characterization using human judgment, tiered similarity analysis and language/concept analysis
JP5891305B2 (ja) 診療プロセス分析システム
JP6542612B2 (ja) テストシナリオ生成支援装置およびテストシナリオ生成支援方法
US20100305969A1 (en) Systems and methods for generating subsets of electronic healthcare-related documents
KR20170133692A (ko) 의료 기록 문서에서의 의료 단어의 연관 규칙 생성 방법 및 그 장치
US20130060793A1 (en) Extracting information from medical documents
JP6177609B2 (ja) 医療カルテシステム及び医療カルテ検索方法
CN114270391A (zh) 量化隐私影响
CN110729054A (zh) 异常就诊行为检测方法、装置、计算机设备及存储介质
JP4250284B2 (ja) 診療報酬明細書分析システム
JP6963535B2 (ja) 分析方法、分析装置及びプログラム
KR101401225B1 (ko) 문서 분석 시스템
JP6978997B2 (ja) 類似データの検索方法、情報検索装置及びプログラム
Cruz et al. Prognostic value of myocardial blush grade in ST-elevation MI: a systematic review and meta-analysis
JP2019074921A (ja) 分類プログラム、分類方法、および分類装置
JP6979392B2 (ja) 分析方法、分析装置及びプログラム
KR101836465B1 (ko) 건강보험 심사청구 스크리닝 시스템 및 방법

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20201110

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20211007

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20211102

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20211112

R150 Certificate of patent or registration of utility model

Ref document number: 6978997

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150