JP2018072337A - Method of predicting recurrence risk of major adverse cardiac event - Google Patents

Method of predicting recurrence risk of major adverse cardiac event Download PDF

Info

Publication number
JP2018072337A
JP2018072337A JP2017204770A JP2017204770A JP2018072337A JP 2018072337 A JP2018072337 A JP 2018072337A JP 2017204770 A JP2017204770 A JP 2017204770A JP 2017204770 A JP2017204770 A JP 2017204770A JP 2018072337 A JP2018072337 A JP 2018072337A
Authority
JP
Japan
Prior art keywords
data
amount
level
learning model
history
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2017204770A
Other languages
Japanese (ja)
Inventor
邦宏 西村
Kunihiro Nishimura
邦宏 西村
恵宏 宮本
Yoshihiro Miyamoto
恵宏 宮本
聡 安田
Satoshi Yasuda
聡 安田
暉夫 野口
Teruo Noguchi
暉夫 野口
久雄 小川
Hisao Ogawa
久雄 小川
聡史 加藤
Satoshi Kato
聡史 加藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujirebio Inc
National Cerebral and Cardiovascular Center
Original Assignee
Fujirebio Inc
National Cerebral and Cardiovascular Center
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujirebio Inc, National Cerebral and Cardiovascular Center filed Critical Fujirebio Inc
Publication of JP2018072337A publication Critical patent/JP2018072337A/en
Pending legal-status Critical Current

Links

Landscapes

  • Investigating Or Analysing Biological Materials (AREA)

Abstract

PROBLEM TO BE SOLVED: To allow for predicting recurrence risk of a major adverse cardiac event within a predetermined period by means of a simple test.SOLUTION: First data, which is either based on measurements taken from a test sample collected from a subject or on predetermined index parameters obtained from the subject, is processed using a learning model that has been built on the basis of predetermined second data to predict recurrence risk of a major adverse cardiac event.SELECTED DRAWING: Figure 1

Description

本発明は、主要有害心イベント(Major adverse cardiovascular events:MACE)の再発リスクの予測方法、予測のためのプログラム及び予測装置に関する。   The present invention relates to a method for predicting recurrence risk of major adverse cardiac events (MACE), a program for prediction and a prediction device.

主要有害心イベントの再発リスクの予測は、主要有害心イベントの再発が、結果として深刻な結果を招来しかねないため、極めて重要である。   Predicting the risk of recurrence of major adverse events is extremely important because the recurrence of major adverse events can result in serious consequences.

例えば、下記特許文献1は、急性冠症候群のうちの少なくとも1つの症状を発症後、1年以内に主要有害心イベントを再発するリスクを決定する方法を開示している。   For example, Patent Document 1 below discloses a method for determining the risk of recurrent major adverse cardiac events within one year after the onset of at least one symptom of acute coronary syndrome.

米国特許第8658384号U.S. Pat. No. 8,658,384

前記特許文献1においては、主要有害心イベントを再発するリスクを決定するにあたり、いわゆる心筋マーカーである、心筋トロポニンI(cTnI)、プロB型ナトリウム利尿ペプチド(プロBNP)又はその切断産物、高感度C反応性タンパク質(hsCRP)、ミエロペルオキシダーゼ(MPO)、胎盤増殖因子(PIGF)、推算糸球体濾過量(eGFR)、ホモシステイン(HCY)、コリン、虚血修飾アルブミン(IMA)、可溶性CD40リガンド(sCD40L)及びリポタンパク質関連ホスホリパーゼA(LpPLA2)からなる群から選択される、少なくとも3種類のバイオマーカーの試験試料中の量を指標として用いている。 In Patent Document 1, in determining the risk of recurrence of major adverse cardiac events, so-called myocardial markers, cardiac troponin I (cTnI), pro-B-type natriuretic peptide (pro-BNP) or a cleavage product thereof, high sensitivity C-reactive protein (hsCRP), myeloperoxidase (MPO), placental growth factor (PIGF), estimated glomerular filtration rate (eGFR), homocysteine (HCY), choline, ischemia modified albumin (IMA), soluble CD40 ligand ( The amount of at least three kinds of biomarkers selected from the group consisting of sCD40L) and lipoprotein-related phospholipase A 2 (LpPLA2) in the test sample is used as an indicator.

しかしながら、前記特許文献1にかかる決定方法では、試験試料中の心筋マーカーの量を指標として用いるため、例えば入院検査や健康診断で一般的に行われる検査とは別途に特殊かつ高額の費用が必要な検査の実施が必要であり、結果として実施のための負担が大きくなってしまっていた。   However, since the determination method according to Patent Document 1 uses the amount of the myocardial marker in the test sample as an index, for example, a special and expensive cost is required separately from, for example, a test generally performed in a hospitalization test or a health checkup. It was necessary to carry out a proper inspection, and as a result, the burden for the implementation became large.

本発明は、前記課題に鑑みてなされたものである。本発明者らは、このように高負荷の検査などを別途実施することなく、入院検査や健康診断で一般的に行われる簡便かつ安価な検査のみによっても、上記課題を解決できることを見出し、本発明を完成するに至った。   The present invention has been made in view of the above problems. The present inventors have found that the above-described problems can be solved only by a simple and inexpensive test that is generally performed in a hospitalization test or a health checkup without separately performing a high-load test or the like. The invention has been completed.

すなわち、本発明は、下記[1]〜[14]を提供する。
[1] 被検体から採取された試験試料を用いて測定されたか、又は被検体から得られた指標パラメータであって、C反応性タンパク質量、Dダイマー量、HDL−コレステロール量、LDL−コレステロール量、プロトロンビン時間(国際標準比(INR))、γ−グルタミルトランスペプチターゼ量、アスパラギン酸アミノトランスフェラーゼ量、アミラーゼ量、アラニンアミノトランスフェラーゼ量、アルカリホスファターゼ量、アルブミン量、アンチトロンビン量、グリコヘモグロビン量、クロール量、トリグリセリド量、フィブリノゲン量、フィブリン/フィブリノゲン分解産物量、活性化部分トロンボプラスチン時間、血清クレアチニン量、血中尿素窒素量、血糖量、総コレステロール量、総ビルビリン量、単球数、直接ビリルビン量、乳酸脱水素酵素(LDH)量、尿酸量、pH、カリウム量、カルシウム量、ナトリウム量、赤血球数、ヘマトクリット値、ヘモグロビン量、リンパ球数、血小板数、好塩基球数、好酸球数、好中球数、性別、糖尿病既往歴、高血圧症既往歴、脂質異常症既往歴、喫煙習慣の有無、貧血の有無、急性心筋梗塞の既往歴、冠動脈形成術(PCI)を必要とした狭心症の既往歴、心不全の既往歴、アブレーション治療を必要とした心房細動の既往歴、脳梗塞の既往歴、末梢動脈疾患の既往歴、大動脈解離の既往歴、透析、年齢、身長、体重、心拍数、尿たんぱく(定性)、尿糖(定性)、入院理由及び入院時現症からなる群より選択頻度に基づいて選択される2種以上の指標パラメータに基づく第1データを取得するステップと、
前記第1データを、第2データに基づいて構築された学習モデルで処理して、再発リスクを予測するステップと
を含む、所定期間内における主要有害心イベントの再発リスクの予測方法。
[2] 前記第2データは所定期間内の主要有害心イベントの再発歴を指標パラメータとして含むデータであり、かつ前記第2データは、C反応性タンパク質量、Dダイマー量、HDL−コレステロール量、LDL−コレステロール量、プロトロンビン時間(国際標準比(INR))、γ−グルタミルトランスペプチターゼ量、アスパラギン酸アミノトランスフェラーゼ量、アミラーゼ量、アラニンアミノトランスフェラーゼ量、アルカリホスファターゼ量、アルブミン量、アンチトロンビン量、グリコヘモグロビン量、クロール量、トリグリセリド量、フィブリノゲン量、フィブリン/フィブリノゲン分解産物量、活性化部分トロンボプラスチン時間、血清クレアチニン量、血中尿素窒素量、血糖量、総コレステロール量、総ビルビリン量、単球数、直接ビリルビン量、乳酸脱水素酵素(LDH)量、尿酸量、pH、カリウム量、カルシウム量、ナトリウム量、赤血球数、ヘマトクリット値、ヘモグロビン量、リンパ球数、血小板数、好塩基球数、好酸球数、好中球数、性別、糖尿病既往歴、高血圧症既往歴、脂質異常症既往歴、喫煙習慣の有無、貧血の有無、急性心筋梗塞の既往歴、冠動脈形成術(PCI)を必要とした狭心症の既往歴、心不全の既往歴、アブレーション治療を必要とした心房細動の既往歴、脳梗塞の既往歴、末梢動脈疾患の既往歴、大動脈解離の既往歴、透析、年齢、身長、体重、心拍数、尿たんぱく(定性)、尿糖(定性)、入院理由及び入院時現症からなる群よりさらに選択される1種以上の指標パラメータに基づくデータである、[1]に記載の所定期間内における主要有害心イベントの再発リスクの予測方法。
[3] 前記第1データ及び前記第2データが、心筋マーカーに由来する指標パラメータをさらに含む群から選択される指標パラメータに基づくデータである、[1]又は[2]に記載の所定期間内における主要有害心イベントの再発リスクの予測方法。
[4] 前記心筋マーカーが、クレアチンキナーゼMB、ヒト心臓型脂肪酸結合タンパク質、心筋トロポニンI、心筋トロポニンT、脳性ナトリウム利尿ペプチド、プロ脳性ナトリウム利尿ペプチド又はその切断産物、ミエロペルオキシダーゼ、胎盤増殖因子、推算糸球体濾過量、ホモシステイン、虚血修飾アルブミン、可溶性CD40リガンド、リポタンパク質関連ホスホリパーゼA2、コリン、及び高感度C反応性タンパク質からなる群から選択される1種以上である、[3]に記載の所定期間内における主要有害心イベントの再発リスクの予測方法。
[5] 前記試験試料が、血液又は血液由来試料である、[1]〜[4]のいずれか1つに記載の所定期間内における主要有害心イベントの再発リスクの予測方法。
[6] 前記主要有害心イベントが、急性心筋梗塞、冠血行再建術が施術された狭心症、入院を要した心不全、心房細動、脳卒中、又は循環器を理由とする死亡である、[1]〜[5]のいずれか1つに記載の所定期間内における主要有害心イベントの再発リスクの予測方法。
[7] 前記学習モデルが、前記第2データを複数のデータ群に分割し、該データ群それぞれを教師データとして用い、かつ複数の該データ群ごとに異なる複数のパラメータ条件で行われる機械学習により構築される、主要有害心イベントの再発があるか又は不明であるかを予測する複数の第1学習モデル、及び主要有害心イベントの再発がないか又は不明であるかを予測する複数の第2学習モデルであり、
前記主要有害心イベントの再発リスクを予測するステップが、前記第1データを、前記第1学習モデル及び前記第2学習モデルにより処理して、再発リスクを予測するステップである、[1]〜[6]のいずれか1つに記載の所定期間内における主要有害心イベントの再発リスクの予測方法。
[8] 前記学習モデルが、複数の前記第1学習モデル及び複数の前記第2学習モデルごとに、感度及び陽性的中率に基づいて選抜された複数の第1選抜学習モデル、及び複数の第2選抜学習モデルであり、
前記主要有害心イベントの再発リスクを予測するステップが、前記第1データを、前記第1選抜学習モデル及び前記第2選抜学習モデルにより処理して、再発リスクを予測するステップである、[7]に記載の所定期間内における主要有害心イベントの再発リスクの予測方法。
[9] 前記主要有害心イベントの再発リスクを予測するステップが、前記第1データを、前記第1選抜学習モデル及び前記第2選抜学習モデルにより処理し、前記第1選抜学習モデル及び前記第2選抜学習モデルごとに第1判定結果を取得し、該第1判定結果について投票を行い、前記第1選抜学習モデル及び前記第2選抜学習モデルごとに得票率に基づく第2判定結果を取得し、前記第1選抜学習モデルの第2判定結果及び前記第2選抜学習モデルの前記第2判定結果を統合して、第3判定結果を取得し、該第3判定結果に基づいて、主要有害心イベントの再発リスクを予測するステップである、[8]に記載の所定期間内における主要有害心イベントの再発リスクの予測方法。
[10] 演算部を備えるコンピュータにより実行される下記のステップを含む、所定期間内における主要有害心イベントの再発リスクを予測するためのプログラムであって、
演算部が、被検体から採取された試験試料を用いて測定されたか、又は被検体から得られた指標パラメータであって、C反応性タンパク質量、Dダイマー量、HDL−コレステロール量、LDL−コレステロール量、プロトロンビン時間(国際標準比(INR))、γ−グルタミルトランスペプチターゼ量、アスパラギン酸アミノトランスフェラーゼ量、アミラーゼ量、アラニンアミノトランスフェラーゼ量、アルカリホスファターゼ量、アルブミン量、アンチトロンビン量、グリコヘモグロビン量、クロール量、トリグリセリド量、フィブリノゲン量、フィブリン/フィブリノゲン分解産物量、活性化部分トロンボプラスチン時間、血清クレアチニン量、血中尿素窒素量、血糖量、総コレステロール量、総ビルビリン量、単球数、直接ビリルビン量、乳酸脱水素酵素(LDH)量、尿酸量、pH、カリウム量、カルシウム量、ナトリウム量、赤血球数、ヘマトクリット値、ヘモグロビン量、リンパ球数、血小板数、好塩基球数、好酸球数、好中球数、性別、糖尿病既往歴、高血圧症既往歴、脂質異常症既往歴、喫煙習慣の有無、貧血の有無、急性心筋梗塞の既往歴、冠動脈形成術(PCI)を必要とした狭心症の既往歴、心不全の既往歴、アブレーション治療を必要とした心房細動の既往歴、脳梗塞の既往歴、末梢動脈疾患の既往歴、大動脈解離の既往歴、透析、年齢、身長、体重、心拍数、尿たんぱく(定性)、尿糖(定性)、入院理由及び入院時現症からなる群より選択頻度に基づいて選択される2種以上の指標パラメータに基づく第1データを取得するステップと、
前記演算部が、前記第1データを、第2データに基づいて構築された学習モデルで処理して、所定期間内における主要有害心イベントの再発リスクを予測するステップと
を含む、プログラム。
[11] 前記学習モデルが、前記第2データを複数のデータ群に分割し、該データ群それぞれを教師データとして用い、かつ複数の該データ群ごとに異なる複数のパラメータ条件で行われる機械学習により構築される、主要有害心イベントの再発があるか又は不明であるかを予測する複数の第1学習モデル、及び主要有害心イベントの再発がないか又は不明であるかを予測する複数の第2学習モデルであり、
前記主要有害心イベントの再発リスクを予測するステップが、前記演算部が、前記第1データを、前記第1学習モデル及び前記第2学習モデルにより処理して、所定期間内における主要有害心イベントの再発リスクを予測するステップである、[10]に記載のプログラム。
[12] 前記学習モデルが、複数の前記第1学習モデル及び複数の前記第2学習モデルごとに、感度及び陽性的中率に基づいて選抜された複数の第1選抜学習モデル、及び複数の第2選抜学習モデルであり、
前記主要有害心イベントの再発リスクを予測するステップが、前記演算部が、前記第1データを、前記第1選抜学習モデル及び前記第2選抜学習モデルにより処理して、所定期間内における主要有害心イベントの再発リスクを予測するステップである、[11]に記載のプログラム。
[13] 前記主要有害心イベントの再発リスクを予測するステップが、前記演算部が、前記第1データを、前記第1選抜学習モデル及び前記第2選抜学習モデルにより処理し、前記第1選抜学習モデル及び前記第2選抜学習モデルごとに第1判定結果を取得し、該第1判定結果について投票を行い、前記第1選抜学習モデル及び前記第2選抜学習モデルごとに得票率に基づく第2判定結果を取得し、前記第1選抜学習モデルの第2判定結果及び前記第2選抜学習モデルの前記第2判定結果を統合して、第3判定結果を取得し、該第3判定結果に基づいて、所定期間内における主要有害心イベントの再発リスクを予測するステップである、[12]に記載のプログラム。
[14] 被検体から採取された試験試料を用いて測定されたか、又は被検体から得られた指標パラメータであって、C反応性タンパク質量、Dダイマー量、HDL−コレステロール量、LDL−コレステロール量、プロトロンビン時間(国際標準比(INR))、γ−グルタミルトランスペプチターゼ量、アスパラギン酸アミノトランスフェラーゼ量、アミラーゼ量、アラニンアミノトランスフェラーゼ量、アルカリホスファターゼ量、アルブミン量、アンチトロンビン量、グリコヘモグロビン量、クロール量、トリグリセリド量、フィブリノゲン量、フィブリン/フィブリノゲン分解産物量、活性化部分トロンボプラスチン時間、血清クレアチニン量、血中尿素窒素量、血糖量、総コレステロール量、総ビルビリン量、単球数、直接ビリルビン量、乳酸脱水素酵素(LDH)量、尿酸量、pH、カリウム量、カルシウム量、ナトリウム量、赤血球数、ヘマトクリット値、ヘモグロビン量、リンパ球数、血小板数、好塩基球数、好酸球数、好中球数、性別、糖尿病既往歴、高血圧症既往歴、脂質異常症既往歴、喫煙習慣の有無、貧血の有無、急性心筋梗塞の既往歴、冠動脈形成術(PCI)を必要とした狭心症の既往歴、心不全の既往歴、アブレーション治療を必要とした心房細動の既往歴、脳梗塞の既往歴、末梢動脈疾患の既往歴、大動脈解離の既往歴、透析、年齢、身長、体重、心拍数、尿たんぱく(定性)、尿糖(定性)、入院理由及び入院時現症からなる群より選択頻度に基づいて選択される2種以上の指標パラメータに基づく第1データを生成して取得する第1データ生成取得部と、
第1データ生成取得部が取得した前記第1データを、第2データに基づいて構築された学習モデルで処理して、所定期間内における主要有害心イベントの再発リスクを予測する予測部と
を備える、所定期間内における主要有害心イベントの再発リスクの予測装置。
That is, the present invention provides the following [1] to [14].
[1] An index parameter measured using a test sample collected from a subject or obtained from a subject, the amount of C-reactive protein, the amount of D-dimer, the amount of HDL-cholesterol, the amount of LDL-cholesterol , Prothrombin time (international standard ratio (INR)), γ-glutamyl transpeptidase level, aspartate aminotransferase level, amylase level, alanine aminotransferase level, alkaline phosphatase level, albumin level, antithrombin level, glycohemoglobin level, crawl Amount, triglyceride amount, fibrinogen amount, fibrin / fibrinogen degradation product amount, activated partial thromboplastin time, serum creatinine amount, blood urea nitrogen amount, blood glucose level, total cholesterol level, total bilbilin level, monocyte count, direct biliruby Quantity, lactate dehydrogenase (LDH) quantity, uric acid quantity, pH, potassium quantity, calcium quantity, sodium quantity, red blood cell count, hematocrit value, hemoglobin quantity, lymphocyte count, platelet count, basophil count, eosinophil count , Neutrophil count, gender, history of diabetes, history of hypertension, history of dyslipidemia, presence of smoking habits, presence of anemia, history of acute myocardial infarction, narrowness requiring coronary angioplasty (PCI) History of heart disease, history of heart failure, history of atrial fibrillation requiring ablation treatment, history of cerebral infarction, history of peripheral arterial disease, history of aortic dissection, dialysis, age, height, weight Acquiring first data based on two or more index parameters selected from the group consisting of: heart rate, urine protein (qualitative), urine sugar (qualitative), reason for hospitalization, and on-hospital disease When,
Processing the first data with a learning model constructed based on the second data to predict a recurrence risk, a prediction method for a recurrence risk of a major adverse cardiac event within a predetermined period.
[2] The second data is data including a history of recurrence of major adverse cardiac events within a predetermined period as an index parameter, and the second data includes the amount of C-reactive protein, the amount of D-dimer, the amount of HDL-cholesterol, LDL-cholesterol amount, prothrombin time (international standard ratio (INR)), γ-glutamyltransferase peptidase amount, aspartate aminotransferase amount, amylase amount, alanine aminotransferase amount, alkaline phosphatase amount, albumin amount, antithrombin amount, glyco Hemoglobin level, chlor level, triglyceride level, fibrinogen level, fibrin / fibrinogen degradation product level, activated partial thromboplastin time, serum creatinine level, blood urea nitrogen level, blood glucose level, total cholesterol level, total bilbilin level, Number of spheres, direct bilirubin content, lactate dehydrogenase (LDH) content, uric acid content, pH, potassium content, calcium content, sodium content, red blood cell count, hematocrit value, hemoglobin content, lymphocyte count, platelet count, basophil count , Eosinophil count, neutrophil count, gender, history of diabetes, history of hypertension, history of dyslipidemia, smoking habit, presence of anemia, history of acute myocardial infarction, coronary angioplasty (PCI) A history of angina pectoris, a history of heart failure, a history of atrial fibrillation requiring ablation treatment, a history of cerebral infarction, a history of peripheral arterial disease, a history of aortic dissection, dialysis, Data based on one or more index parameters further selected from the group consisting of age, height, weight, heart rate, urinary protein (qualitative), urine sugar (qualitative), reason for hospitalization, and symptoms at the time of hospitalization, [1 ] In the specified period Method for predicting the risk of recurrence of major adverse cardiac events in the inner.
[3] The predetermined data according to [1] or [2], wherein the first data and the second data are data based on an index parameter selected from a group further including an index parameter derived from a myocardial marker. Of predicting the risk of recurrence of major adverse cardiac events in Japan.
[4] The myocardial marker is creatine kinase MB, human cardiac fatty acid binding protein, cardiac troponin I, cardiac troponin T, brain natriuretic peptide, pro-brain natriuretic peptide or its cleavage product, myeloperoxidase, placental growth factor, estimation [3], which is one or more selected from the group consisting of glomerular filtration rate, homocysteine, ischemia-modified albumin, soluble CD40 ligand, lipoprotein-related phospholipase A2, choline, and highly sensitive C-reactive protein. Of predicting the risk of recurrence of major adverse cardiac events within a given period of time.
[5] The method for predicting the risk of recurrence of a major adverse cardiac event within a predetermined period according to any one of [1] to [4], wherein the test sample is blood or a blood-derived sample.
[6] The main adverse cardiac event is acute myocardial infarction, angina pectoris with coronary revascularization, heart failure requiring hospitalization, atrial fibrillation, stroke, or death due to cardiovascular disease. [1] The prediction method for the risk of recurrence of major adverse cardiac events within a predetermined period as described in any one of [5].
[7] The learning model divides the second data into a plurality of data groups, uses each of the data groups as teacher data, and performs machine learning performed under a plurality of parameter conditions different for each of the plurality of data groups. A plurality of first learning models constructed to predict whether there is a recurrence of a major adverse heart event or unknown, and a plurality of second models for predicting whether there is no or unknown recurrence of a major adverse cardiac event Learning model,
The step of predicting the recurrence risk of the major adverse cardiac event is a step of processing the first data by the first learning model and the second learning model to predict a recurrence risk [1] to [ 6] The method for predicting the risk of recurrence of major adverse cardiac events within a predetermined period of any one of [6]
[8] The learning model includes a plurality of first selection learning models selected based on sensitivity and positive predictive value for each of the plurality of first learning models and the plurality of second learning models, and a plurality of first learning models. 2 selection learning model,
The step of predicting the recurrence risk of the major adverse cardiac event is a step of processing the first data by the first selective learning model and the second selective learning model to predict a recurrence risk [7] A method for predicting the risk of recurrence of major adverse cardiac events within a predetermined period as described in.
[9] The step of predicting the recurrence risk of the major adverse heart event processes the first data by the first selection learning model and the second selection learning model, and the first selection learning model and the second Obtaining a first determination result for each selection learning model, voting on the first determination result, obtaining a second determination result based on a vote rate for each of the first selection learning model and the second selection learning model; The second determination result of the first selective learning model and the second determination result of the second selective learning model are integrated to obtain a third determination result. Based on the third determination result, a major adverse event The method for predicting the risk of recurrence of major adverse cardiac events within the predetermined period according to [8], wherein the risk of recurrence is predicted.
[10] A program for predicting a risk of recurrence of a major adverse cardiac event within a predetermined period, including the following steps executed by a computer including a calculation unit,
The calculation unit is an index parameter measured by using a test sample collected from a subject or obtained from a subject, the amount of C-reactive protein, the amount of D-dimer, the amount of HDL-cholesterol, the LDL-cholesterol Amount, prothrombin time (international standard ratio (INR)), γ-glutamyl transpeptidase amount, aspartate aminotransferase amount, amylase amount, alanine aminotransferase amount, alkaline phosphatase amount, albumin amount, antithrombin amount, glycohemoglobin amount, Amount of crawl, amount of triglyceride, amount of fibrinogen, amount of fibrin / fibrinogen degradation product, activated partial thromboplastin time, amount of serum creatinine, amount of blood urea nitrogen, blood glucose level, total cholesterol level, total bilbilin level, monocyte count, direct biliary count Bin volume, lactate dehydrogenase (LDH) volume, uric acid volume, pH, potassium volume, calcium volume, sodium volume, red blood cell count, hematocrit level, hemoglobin volume, lymphocyte count, platelet count, basophil count, eosinophil Number, neutrophil count, sex, history of diabetes, history of hypertension, history of dyslipidemia, presence of smoking, presence of anemia, history of acute myocardial infarction, coronary angioplasty (PCI) History of angina pectoris, history of heart failure, history of atrial fibrillation requiring ablation treatment, history of cerebral infarction, history of peripheral arterial disease, history of aortic dissection, dialysis, age, height, Obtain first data based on two or more index parameters selected from the group consisting of weight, heart rate, urinary protein (qualitative), urine sugar (qualitative), reason for hospitalization, and on-hospital disease, based on selection frequency Steps,
The calculation unit includes a step of processing the first data with a learning model constructed based on the second data to predict a recurrence risk of a major adverse cardiac event within a predetermined period.
[11] The learning model divides the second data into a plurality of data groups, uses each of the data groups as teacher data, and performs machine learning performed under a plurality of parameter conditions different for each of the plurality of data groups. A plurality of first learning models constructed to predict whether there is a recurrence of a major adverse heart event or unknown, and a plurality of second models for predicting whether there is no or unknown recurrence of a major adverse cardiac event Learning model,
The step of predicting the risk of recurrence of the major adverse event is that the calculation unit processes the first data by the first learning model and the second learning model to determine the major adverse event within a predetermined period. The program according to [10], which is a step of predicting a recurrence risk.
[12] The learning model includes a plurality of first selection learning models selected based on sensitivity and positive predictive value for each of the plurality of first learning models and the plurality of second learning models, and a plurality of first learning models. 2 selection learning model,
The step of predicting the risk of recurrence of the major adverse heart event is such that the calculation unit processes the first data by the first selective learning model and the second selective learning model, and the major adverse heart in a predetermined period. The program according to [11], which is a step of predicting a risk of recurrence of an event.
[13] The step of predicting the recurrence risk of the major adverse cardiac event is such that the calculation unit processes the first data by the first selection learning model and the second selection learning model, and the first selection learning A first determination result is obtained for each model and the second selection learning model, voting is performed on the first determination result, and a second determination based on a vote rate is obtained for each of the first selection learning model and the second selection learning model. Obtaining a result, integrating the second determination result of the first selective learning model and the second determination result of the second selective learning model, obtaining a third determination result, and based on the third determination result The program according to [12], which is a step of predicting a recurrence risk of a major adverse cardiac event within a predetermined period.
[14] An index parameter measured using a test sample collected from a subject or obtained from a subject, the amount of C-reactive protein, the amount of D-dimer, the amount of HDL-cholesterol, the amount of LDL-cholesterol , Prothrombin time (international standard ratio (INR)), γ-glutamyl transpeptidase level, aspartate aminotransferase level, amylase level, alanine aminotransferase level, alkaline phosphatase level, albumin level, antithrombin level, glycohemoglobin level, crawl Amount, triglyceride amount, fibrinogen amount, fibrin / fibrinogen degradation product amount, activated partial thromboplastin time, serum creatinine amount, blood urea nitrogen amount, blood glucose level, total cholesterol level, total bilbilin level, monocyte count, direct biliyl Level, lactate dehydrogenase (LDH) level, uric acid level, pH, potassium level, calcium level, sodium level, red blood cell count, hematocrit level, hemoglobin level, lymphocyte count, platelet count, basophil count, eosinophil Number, neutrophil count, sex, history of diabetes, history of hypertension, history of dyslipidemia, presence of smoking, presence of anemia, history of acute myocardial infarction, coronary angioplasty (PCI) History of angina pectoris, history of heart failure, history of atrial fibrillation requiring ablation treatment, history of cerebral infarction, history of peripheral arterial disease, history of aortic dissection, dialysis, age, height, Generate first data based on two or more index parameters selected from the group consisting of body weight, heart rate, urine protein (qualitative), urine sugar (qualitative), reason for hospitalization, and on-hospital disease First data raw An acquisition unit,
A prediction unit that processes the first data acquired by the first data generation acquisition unit with a learning model constructed based on the second data, and predicts a recurrence risk of a major adverse cardiac event within a predetermined period. , A prediction device for the risk of recurrence of major adverse cardiac events within a given period.

本発明にかかる主要有害心イベントの再発リスクの予測方法によれば、より簡便なステップで、より精度の高い再発リスクの判定を行うことができる。これにより、治療方針、通院頻度などについてのより精度の高いコンサルティングを行うことができる。また、特殊かつ高額な費用が必要なバイオマーカーの測定などの高負荷の検査を行わずとも、より簡易で安価な検査のみによっても実施できるので、実施のための負担をより軽減することができる。   According to the method for predicting the risk of recurrence of major adverse cardiac events according to the present invention, it is possible to determine the risk of recurrence with higher accuracy in simpler steps. As a result, it is possible to provide more accurate consulting on the treatment policy, the frequency of hospital visits, and the like. In addition, it is possible to carry out only simpler and cheaper examinations without carrying out high-load examinations such as measurement of biomarkers that require special and expensive costs, so the burden for implementation can be further reduced. .

図1は、主要有害心イベントの再発リスクの予測方法を示すフローチャートである。FIG. 1 is a flowchart showing a method for predicting the risk of recurrence of major adverse cardiac events. 図2は、ステップ(S1)を説明するためのフローチャートである。FIG. 2 is a flowchart for explaining step (S1). 図3は、ステップ(S0)を説明するためのフローチャートである。FIG. 3 is a flowchart for explaining the step (S0). 図4は、第2データにかかる指標パラメータの例を示す表である。FIG. 4 is a table showing an example of index parameters according to the second data. 図5は、第2データを生成するための完全データの構成を説明する模式的な図である。FIG. 5 is a schematic diagram illustrating a configuration of complete data for generating the second data. 図6は、第2データの模式的な図である。FIG. 6 is a schematic diagram of the second data. 図7は、ステップ(S2)を説明するためのフローチャートである。FIG. 7 is a flowchart for explaining step (S2). 図8は、カットオフ値の評価結果を説明するための表である。FIG. 8 is a table for explaining the evaluation result of the cutoff value. 図9は、カットオフ値の評価結果を説明するための表である。FIG. 9 is a table for explaining the evaluation result of the cutoff value. 図10は、コンピュータの構成を説明するための模式的なブロック図である。FIG. 10 is a schematic block diagram for explaining the configuration of the computer. 図11は、演算部の構成を説明するための模式的なブロック図である。FIG. 11 is a schematic block diagram for explaining the configuration of the calculation unit. 図12は、評価用のデータ群をMACE高リスク群と低リスク群とに層別化した結果を示すグラフである。FIG. 12 is a graph showing the results of stratifying the evaluation data group into a MACE high risk group and a low risk group. 図13は、予測性能を示すグラフである。FIG. 13 is a graph showing the prediction performance. 図14は、全体の選抜学習モデルのうちのある指標パラメータが用いられている選抜学習モデルの割合に基づく選択頻度を示すグラフである。FIG. 14 is a graph showing the selection frequency based on the ratio of selection learning models in which a certain index parameter is used in the entire selection learning model.

以下、図面を参照して、本発明の実施形態について説明する。なお、各図面は、発明が理解できる程度に、構成要素の形状、大きさ及び配置を概略的に示しているに過ぎない。本発明は以下の記述によって限定されるものではなく、各構成要素は本発明の要旨を逸脱しない範囲において適宜変更可能である。以下の説明に用いる図面において、同様の構成要素については同一の符号を付して示し、重複する説明については省略する場合がある。また、本発明の実施形態にかかる構成要素は、必ずしも図面に示される配置で、製造され、あるいは使用されるとは限らない。   Embodiments of the present invention will be described below with reference to the drawings. In addition, each drawing has shown only the shape of the component, the magnitude | size, and arrangement | positioning to such an extent that an invention can be understood. The present invention is not limited to the following description, and each component can be appropriately changed without departing from the gist of the present invention. In the drawings used for the following description, the same components are denoted by the same reference numerals, and overlapping descriptions may be omitted. Moreover, the component concerning embodiment of this invention is not necessarily manufactured or used by arrangement | positioning shown by drawing.

本発明は、所定期間内における主要有害心イベントの再発リスクの予測方法に関する。かかる予測方法は、被検体から採取された試験試料を用いて測定されたか、又は被検体から得られた指標パラメータであって、C反応性タンパク質量、Dダイマー量、HDL−コレステロール量、LDL−コレステロール量、プロトロンビン時間(国際標準比(INR))、γ−グルタミルトランスペプチターゼ量、アスパラギン酸アミノトランスフェラーゼ量、アミラーゼ量、アラニンアミノトランスフェラーゼ量、アルカリホスファターゼ量、アルブミン量、アンチトロンビン量、グリコヘモグロビン量、クロール量、トリグリセリド量、フィブリノゲン量、フィブリン/フィブリノゲン分解産物量、活性化部分トロンボプラスチン時間、血清クレアチニン量、血中尿素窒素量、血糖量、総コレステロール量、総ビルビリン量、単球数、直接ビリルビン量、乳酸脱水素酵素(LDH)量、尿酸量、pH、カリウム量、カルシウム量、ナトリウム量、赤血球数、ヘマトクリット値、ヘモグロビン量、リンパ球数、血小板数、好塩基球数、好酸球数、好中球数、性別、糖尿病既往歴、高血圧症既往歴、脂質異常症既往歴、喫煙習慣の有無、貧血の有無、急性心筋梗塞の既往歴、冠動脈形成術(PCI)を必要とした狭心症の既往歴、心不全の既往歴、アブレーション治療を必要とした心房細動の既往歴、脳梗塞の既往歴、末梢動脈疾患の既往歴、大動脈解離の既往歴、透析、年齢、身長、体重、心拍数、尿たんぱく(定性)、尿糖(定性)、入院理由及び入院時現症からなる群より選択される2以上の指標パラメータに基づく第1データを取得するステップと、前記第1データを、複数の第2データを含むデータ群に基づいて構築された学習モデルで処理して、再発リスクを予測するステップとを含む。   The present invention relates to a method for predicting the risk of recurrence of major adverse cardiac events within a predetermined period. Such a prediction method is an index parameter that is measured using a test sample collected from a subject or obtained from a subject, and includes C-reactive protein amount, D-dimer amount, HDL-cholesterol amount, LDL- Cholesterol content, prothrombin time (international standard ratio (INR)), γ-glutamyl transpeptidase content, aspartate aminotransferase content, amylase content, alanine aminotransferase content, alkaline phosphatase content, albumin content, antithrombin content, glycohemoglobin content , Crawl amount, triglyceride amount, fibrinogen amount, fibrin / fibrinogen degradation product amount, activated partial thromboplastin time, serum creatinine amount, blood urea nitrogen amount, blood glucose level, total cholesterol level, total bilbilin level, monocyte count, Contacted bilirubin, lactate dehydrogenase (LDH), uric acid, pH, potassium, calcium, sodium, red blood cell count, hematocrit, hemoglobin content, lymphocyte count, platelet count, basophil count, eosinic acid Requires sphere count, neutrophil count, gender, history of diabetes, history of hypertension, history of dyslipidemia, smoking habit, presence of anemia, history of acute myocardial infarction, coronary angioplasty (PCI) History of angina pectoris, history of heart failure, history of atrial fibrillation requiring ablation treatment, history of cerebral infarction, history of peripheral arterial disease, history of aortic dissection, dialysis, age, height Obtaining first data based on two or more index parameters selected from the group consisting of body weight, heart rate, urinary protein (qualitative), urine sugar (qualitative), reason for hospitalization, and oncology at the time of hospitalization; 1 data is duplicated Processing with a learning model constructed based on a data group including a number of second data to predict a recurrence risk.

〔用語の説明〕
本明細書において「主要有害心イベント」とは、急性心筋梗塞、冠血行再建術が施術された狭心症、入院を要した心不全、心房細動、脳卒中(一過性脳虚血発作(TIA)を除く。)、又は循環器を理由とする死亡を意味している。
[Explanation of terms]
As used herein, “major adverse cardiac event” refers to acute myocardial infarction, angina pectoris with coronary revascularization, heart failure requiring hospitalization, atrial fibrillation, stroke (transient ischemic attack (TIA) ), Or death due to cardiovascular reasons.

本明細書において「再発リスクの予測」とは、主要有害心イベントの発症後所定期間(例えば、3ヵ月、6ヵ月、1年、1年6ヵ月、2年、3年あるいはより長期)内のさらなる主要有害心イベントの再発の有無(あるいは不明)、又は可能性の高低(あるいは不明)を予測することを意味している。   As used herein, “prediction of recurrence risk” means within a predetermined period (eg, 3 months, 6 months, 1 year, 1 year, 6 months, 2 years, 3 years or longer) after the onset of major adverse cardiac events. It means predicting the recurrence (or unknown) or the likelihood (or unknown) of further major adverse cardiac events.

本明細書において「被検体」とは、再発リスクの予測対象である生体を意味しており、具体的には例えば患者が挙げられる。   In the present specification, the “subject” means a living body that is a prediction target of recurrence risk, and specifically includes, for example, a patient.

本明細書において「試験試料」とは、後述する指標パラメータを得ることができる任意の試料を意味している。このような試験試料としては、例えば、液体試料(例、血液(全血)または血液由来試料(例、血清、血漿)、尿、唾液、腹水、組織抽出液、細胞抽出液)、非液体試料(例、組織サンプル、細胞サンプル)が挙げられるが、液体試料が好ましく、血液または血液由来試料がより好ましく、血液がより好ましい。試験試料は、測定前に、事前に処理されてもよい。このような処理としては、例えば、遠心分離、抽出、濃縮、分画、細胞固定、組織固定、組織凍結、組織薄片化が挙げられる。   In the present specification, the “test sample” means an arbitrary sample capable of obtaining an index parameter described later. Examples of such test samples include liquid samples (eg, blood (whole blood) or blood-derived samples (eg, serum, plasma), urine, saliva, ascites, tissue extract, cell extract), non-liquid samples. (For example, a tissue sample, a cell sample) is mentioned, but a liquid sample is preferable, blood or a blood-derived sample is more preferable, and blood is more preferable. The test sample may be processed in advance before measurement. Examples of such treatment include centrifugation, extraction, concentration, fractionation, cell fixation, tissue fixation, tissue freezing, and tissue thinning.

本明細書において「指標パラメータ」とは、上記の試験試料について実施された種々の検査結果、例えば生化学検査、血糖検査、血液一般検査、凝固検査などのいわゆる血液検査の結果(所定の成分の含有量、数量、特性など)に加え、その他の生体情報などに基づくパラメータを意味する。   In this specification, the “index parameter” refers to the results of various tests performed on the above-described test sample, for example, the results of so-called blood tests (such as biochemical tests, blood glucose tests, general blood tests, and coagulation tests). Content, quantity, characteristics, etc.) and other parameters based on biological information.

「指標パラメータ」の例としては、C反応性タンパク質(CRP)、Dダイマー、HDL−コレステロール(HDL−C)、LDL−コレステロール(LDL−C)、プロトロンビン時間(国際標準比(INR))(PT−INR)、γ−グルタミルトランスペプチターゼ(γ−GTP)、アスパラギン酸アミノトランスフェラーゼ(AST(GOT))、アミラーゼ(AMY)、アラニンアミノトランスフェラーゼ(ALT(GPT))、アルカリホスファターゼ(ALP)、アルブミン(ALB)、アンチトロンビン(AT)、グリコヘモグロビン(HbA1c)、クロール(Cl)、トリグリセリド(TG)、フィブリノゲン(Fbg)、フィブリン/フィブリノゲン分解産物(FDP)、活性化部分トロンボプラスチン時間(APTT)、血清クレアチニン(CRE)、血中尿素窒素(BUN)、血糖(Glu)、総コレステロール(CHO)、総ビルビリン(T・Bil)、単球数(Mono)、直接ビリルビン(D・Bil)、乳酸脱水素酵素(LD(LDH))、尿たんぱく(定性)(UP)、尿酸(UA)、尿糖(定性)(US)、pH、カリウム(K)、カルシウム(Ca)、ナトリウム(Na)、赤血球数(RBC)、ヘマトクリット値(Ht)、ヘモグロビン(Hb)、リンパ球数(Lymp)、血小板数(PL)、好塩基球数(Baso)、好酸球数(Eos)、及び好中球数(Neut)が挙げられる。試験試料におけるこれらの測定値の情報は、常法により得ることができる。   Examples of “index parameters” include C-reactive protein (CRP), D-dimer, HDL-cholesterol (HDL-C), LDL-cholesterol (LDL-C), prothrombin time (international standard ratio (INR)) (PT -INR), γ-glutamyl transpeptidase (γ-GTP), aspartate aminotransferase (AST (GOT)), amylase (AMY), alanine aminotransferase (ALT (GPT)), alkaline phosphatase (ALP), albumin ( ALB), antithrombin (AT), glycated hemoglobin (HbA1c), chlor (Cl), triglyceride (TG), fibrinogen (Fbg), fibrin / fibrinogen degradation product (FDP), activated partial thromboplastin time (APTT) ), Serum creatinine (CRE), blood urea nitrogen (BUN), blood glucose (Glu), total cholesterol (CHO), total bibilin (T · Bil), monocyte count (Mono), direct bilirubin (D · Bil), Lactate dehydrogenase (LD (LDH)), urine protein (qualitative) (UP), uric acid (UA), urine sugar (qualitative) (US), pH, potassium (K), calcium (Ca), sodium (Na) , Red blood cell count (RBC), hematocrit value (Ht), hemoglobin (Hb), lymphocyte count (Lym), platelet count (PL), basophil count (Baso), eosinophil count (Eos), and neutrophil One example is the number of balls (Neut). Information on these measured values in the test sample can be obtained by a conventional method.

また「指標パラメータ」の例としては、所定期間内における主要有害心イベントの再発歴、性別、入院理由、入院時現症、糖尿病既往歴、高血圧症既往歴、脂質異常症既往歴、喫煙習慣、貧血の有無、急性心筋梗塞の既往歴、冠動脈形成術(PCI)を必要とした狭心症の既往歴、心不全の既往歴、アブレーション治療を必要とした心房細動の既往歴、脳梗塞の既往歴、末梢動脈疾患の既往歴、大動脈解離の既往歴、透析、年齢、身長、体重、心拍数などの生体情報(属性、定性データ)について2値化あるいは数値化したパラメータがさらに挙げられる。これらのうち、「入院理由」については、例えば、患者(被検体)が入院する際の医師の診断及び処置に基づいて決定することができる。   Examples of “index parameters” include the history of recurrence of major adverse cardiac events within a given period, gender, reason for hospitalization, current onset symptoms, history of diabetes, history of hypertension, history of dyslipidemia, smoking habits, History of anemia, history of acute myocardial infarction, history of angina requiring coronary angioplasty (PCI), history of heart failure, history of atrial fibrillation requiring ablation treatment, history of cerebral infarction Further examples include binarized or digitized parameters for biometric information (attributes, qualitative data) such as history, history of peripheral arterial disease, history of aortic dissection, dialysis, age, height, weight, heart rate. Among these, the “reason for hospitalization” can be determined based on, for example, a doctor's diagnosis and treatment when the patient (subject) is hospitalized.

具体的には、例えば、被検体が急性心筋梗塞(AMI)と診断され入院した患者である場合には指標パラメータは1とすればよく、被検体が冠血行再建術が施術された狭心症を理由として入院した患者である場合には指標パラメータは2とすればよく、被検体が心不全(HF)と診断され入院した患者である場合には指標パラメータは3とすればよく、被検体が(心筋焼灼術(アブレーション処置)を要した)心房細動を理由として入院した患者である場合には指標パラメータは4とすればよく、被検体が脳梗塞(CI)と診断され入院した患者である場合には指標パラメータは5とすればよく、被検体が一過性脳虚血発作(TIA)と診断され入院した患者である場合には指標パラメータは6とすればよい。   Specifically, for example, when the subject is a patient who has been diagnosed with acute myocardial infarction (AMI) and is hospitalized, the index parameter may be set to 1, and an angina pectoris in which the subject has undergone coronary revascularization. If the patient is hospitalized for the reason, the index parameter may be 2, and if the subject is a patient who has been diagnosed with heart failure (HF) and is hospitalized, the index parameter may be 3. If the patient is hospitalized because of atrial fibrillation (required myocardial ablation (ablation)), the index parameter may be 4, and the patient is diagnosed with cerebral infarction (CI) and hospitalized. In some cases, the index parameter may be 5, and when the subject is a patient diagnosed with a transient ischemic attack (TIA) and hospitalized, the index parameter may be 6.

また、「入院時現症」については、例えば、心電図波形に基づく病理学的所見により、「心房細動なし」(洞調律:正常)の場合は指標パラメータは0とされ、心房細動ありの場合は指標パラメータは1とされる。   As for “oncology at admission”, for example, the pathological findings based on the electrocardiogram waveform indicate that the index parameter is 0 in the case of “no atrial fibrillation” (sinus rhythm: normal), and there is atrial fibrillation. In this case, the index parameter is 1.

本明細書において「心筋マーカー」とは、試験試料について実施された検査の結果のうち、特に心臓(心筋)に関する指標を意味する。「心筋マーカー」の例としては、クレアチンキナーゼMB(CKMB)、ヒト心臓型脂肪酸結合タンパク質、心筋トロポニンI、心筋トロポニンT、脳性ナトリウム利尿ペプチド(BNP)、プロ脳性ナトリウム利尿ペプチド又はその切断産物、ミエロペルオキシダーゼ、胎盤増殖因子、推算糸球体濾過量、ホモシステイン、虚血修飾アルブミン、可溶性CD40リガンド、リポタンパク質関連ホスホリパーゼA2、コリン、及び高感度C反応性タンパク質が挙げられる。   In the present specification, the “myocardial marker” means an index related to the heart (myocardium) in particular, among the results of examinations performed on test samples. Examples of “myocardial markers” include creatine kinase MB (CKMB), human cardiac fatty acid binding protein, cardiac troponin I, cardiac troponin T, brain natriuretic peptide (BNP), pro-brain natriuretic peptide or its cleavage product, myel Examples include peroxidase, placental growth factor, estimated glomerular filtration rate, homocysteine, ischemia-modified albumin, soluble CD40 ligand, lipoprotein-related phospholipase A2, choline, and highly sensitive C-reactive protein.

〔所定期間内における主要有害心イベントの再発リスクの予測方法〕
以下、本実施形態の主要有害心イベントの再発リスクの予測方法が含むステップそれぞれについて具体的に説明する。なお、本実施形態においては、特に断りがない限り「ステップ」はコンピュータによって実行される(詳細は後述する。)。
[Method of predicting the risk of recurrence of major adverse cardiac events within a specified period]
Hereinafter, each of the steps included in the method for predicting the risk of recurrence of major adverse heart events according to the present embodiment will be described in detail. In this embodiment, unless otherwise specified, “steps” are executed by a computer (details will be described later).

図1を参照して、本実施形態の所定期間内における主要有害心イベントの再発リスクの予測方法について説明する。図1は、予測方法を示すフローチャートである。   With reference to FIG. 1, the prediction method of the recurrence risk of the main adverse cardiac event within the predetermined period of this embodiment is demonstrated. FIG. 1 is a flowchart showing a prediction method.

(1)被検体から採取された試験試料を用いて測定されたか、又は被検体から得られた指標パラメータであって、C反応性タンパク質量、Dダイマー量、HDL−コレステロール量、LDL−コレステロール量、プロトロンビン時間(国際標準比(INR))、γ−グルタミルトランスペプチターゼ量、アスパラギン酸アミノトランスフェラーゼ量、アミラーゼ量、アラニンアミノトランスフェラーゼ量、アルカリホスファターゼ量、アルブミン量、アンチトロンビン量、グリコヘモグロビン量、クロール量、トリグリセリド量、フィブリノゲン量、フィブリン/フィブリノゲン分解産物量、活性化部分トロンボプラスチン時間、血清クレアチニン量、血中尿素窒素量、血糖量、総コレステロール量、総ビルビリン量、単球数、直接ビリルビン量、乳酸脱水素酵素(LDH)量、尿酸量、pH、カリウム量、カルシウム量、ナトリウム量、赤血球数、ヘマトクリット値、ヘモグロビン量、リンパ球数、血小板数、好塩基球数、好酸球数、好中球数、性別、糖尿病既往歴、高血圧症既往歴、脂質異常症既往歴、喫煙習慣の有無、貧血の有無、急性心筋梗塞の既往歴、冠動脈形成術(PCI)を必要とした狭心症の既往歴、心不全の既往歴、アブレーション治療を必要とした心房細動の既往歴、脳梗塞の既往歴、末梢動脈疾患の既往歴、大動脈解離の既往歴、透析、年齢、身長、体重、心拍数、尿たんぱく(定性)、尿糖(定性)、入院理由及び入院時現症からなる群より選択される2種以上の指標パラメータに基づく第1データを取得するステップ(S1)
図1に示されるように、本実施形態の所定期間内における主要有害心イベントの再発リスクの予測方法は、前記ステップ(S1)を含んでいる。
(1) An index parameter measured using a test sample collected from a subject or obtained from a subject, the amount of C-reactive protein, the amount of D-dimer, the amount of HDL-cholesterol, the amount of LDL-cholesterol , Prothrombin time (international standard ratio (INR)), γ-glutamyl transpeptidase level, aspartate aminotransferase level, amylase level, alanine aminotransferase level, alkaline phosphatase level, albumin level, antithrombin level, glycohemoglobin level, crawl Amount, triglyceride amount, fibrinogen amount, fibrin / fibrinogen degradation product amount, activated partial thromboplastin time, serum creatinine amount, blood urea nitrogen amount, blood glucose level, total cholesterol level, total bilbilin level, monocyte count, direct biliruby Quantity, lactate dehydrogenase (LDH) quantity, uric acid quantity, pH, potassium quantity, calcium quantity, sodium quantity, red blood cell count, hematocrit value, hemoglobin quantity, lymphocyte count, platelet count, basophil count, eosinophil count , Neutrophil count, gender, history of diabetes, history of hypertension, history of dyslipidemia, presence of smoking habits, presence of anemia, history of acute myocardial infarction, narrowness requiring coronary angioplasty (PCI) History of heart disease, history of heart failure, history of atrial fibrillation requiring ablation treatment, history of cerebral infarction, history of peripheral arterial disease, history of aortic dissection, dialysis, age, height, weight Acquiring first data based on two or more index parameters selected from the group consisting of: heart rate, urinary protein (qualitative), urine sugar (qualitative), reason for hospitalization, and on-hospital disease (S1)
As shown in FIG. 1, the method for predicting the risk of recurrence of major adverse cardiac events within a predetermined period of the present embodiment includes the step (S1).

以下、ステップ(S1)について、図2を参照して具体的に説明する。図2は、ステップ(S1)を説明するためのフローチャートである。   Hereinafter, step (S1) will be specifically described with reference to FIG. FIG. 2 is a flowchart for explaining step (S1).

なお、ステップ(S1)に先だって、後述する学習モデルを構築しておくことが好ましい。   Prior to step (S1), it is preferable to construct a learning model to be described later.

図2に示されるように、ステップ(S1)においては、まず、試験試料を採取するステップ(S1−1)が行われる。ステップ(S1−1)における試験試料の選択、試験試料の採取の方法は、指標パラメータを取得することができることを条件として特に限定されない。   As shown in FIG. 2, in step (S1), first, a step (S1-1) of collecting a test sample is performed. The method of selecting the test sample and collecting the test sample in step (S1-1) is not particularly limited on condition that the index parameter can be acquired.

例えば、試験試料が特に血液にかかる試料である場合には、通常の採血方法により試験試料を得ることができる。   For example, when the test sample is a sample particularly related to blood, the test sample can be obtained by a normal blood collection method.

本実施形態では、指標パラメータとして、被験体から採取された試験試料に基づく検査結果及び/又は生体情報が用いられる。   In the present embodiment, an examination result and / or biological information based on a test sample collected from a subject is used as the index parameter.

本実施形態の所定期間内における主要有害心イベントの再発リスクの予測方法においては、簡便性を向上させ、負荷をより低減することができるので、心筋マーカーに非由来の指標パラメータを用いることが好ましい。   In the method for predicting the risk of recurrence of major adverse cardiac events within a predetermined period of the present embodiment, it is preferable to use an index parameter that is not derived from a myocardial marker because it can improve convenience and reduce the load. .

よって、本実施形態では、次に、得られた試験試料を用いて測定された心筋マーカーに非由来の指標パラメータに基づく第1データを取得するステップ(S1−2)を行うことが好ましい。   Therefore, in this embodiment, it is preferable to next perform the step (S1-2) of acquiring the first data based on the index parameter not derived from the myocardial marker measured using the obtained test sample.

このステップ(S1−2)は、得られた試験試料について、従来公知の任意好適な検査手段(測定手段)及び検査方法(測定方法)を用いて分析(測定)することにより行うことができる。   This step (S1-2) can be performed by analyzing (measuring) the obtained test sample using any conventionally known suitable inspection means (measurement means) and inspection method (measurement method).

本実施形態に適用することができる心筋マーカーに非由来の指標パラメータの例としては、C反応性タンパク質量、Dダイマー量、HDL−コレステロール量、LDL−コレステロール量、プロトロンビン時間(国際標準比(INR))、γ−グルタミルトランスペプチターゼ量、アスパラギン酸アミノトランスフェラーゼ量、アミラーゼ量、アラニンアミノトランスフェラーゼ量、アルカリホスファターゼ量、アルブミン量、アンチトロンビン量、グリコヘモグロビン量、クロール量、トリグリセリド量、フィブリノゲン量、フィブリン/フィブリノゲン分解産物量、活性化部分トロンボプラスチン時間、血清クレアチニン量、血中尿素窒素量、血糖量、総コレステロール量、総ビルビリン量、単球数、直接ビリルビン量、乳酸脱水素酵素(LDH)量、尿酸量、pH、カリウム量、カルシウム量、ナトリウム量、赤血球数、ヘマトクリット値、ヘモグロビン量、リンパ球数、血小板数、好塩基球数、好酸球数、及び好中球数が挙げられる。   Examples of index parameters not derived from myocardial markers that can be applied to the present embodiment include C-reactive protein amount, D-dimer amount, HDL-cholesterol amount, LDL-cholesterol amount, prothrombin time (international standard ratio (INR)). )), Γ-glutamyl transpeptidase amount, aspartate aminotransferase amount, amylase amount, alanine aminotransferase amount, alkaline phosphatase amount, albumin amount, antithrombin amount, glycohemoglobin amount, chlorine amount, triglyceride amount, fibrinogen amount, fibrin / Fibrinogen degradation product amount, activated partial thromboplastin time, serum creatinine amount, blood urea nitrogen amount, blood glucose level, total cholesterol level, total bilbilin level, monocyte count, direct bilirubin level, lactate dehydrogenase LDH), uric acid, pH, potassium, calcium, sodium, red blood cell count, hematocrit value, hemoglobin content, lymphocyte count, platelet count, basophil count, eosinophil count, and neutrophil count Can be mentioned.

第1データの形式については、本発明の予測方法(後述するステップ(S2))に適用できることを条件として特に限定されない。   The format of the first data is not particularly limited on condition that it can be applied to the prediction method of the present invention (step (S2) described later).

また、第1データを取得するステップ(S1−2)において、既に説明した「心筋マーカーに非由来の指標パラメータの群」にさらに加えて用いられる、心筋マーカーに非由来の指標パラメータの例としては、性別、糖尿病既往歴、高血圧症既往歴、脂質異常症既往歴、喫煙習慣の有無、貧血の有無、急性心筋梗塞の既往歴、冠動脈形成術(PCI)を必要とした狭心症の既往歴、心不全の既往歴、アブレーション治療を必要とした心房細動の既往歴、脳梗塞の既往歴、末梢動脈疾患の既往歴、大動脈解離の既往歴、透析、年齢、身長、体重、心拍数、尿たんぱく(定性)、及び尿糖(定性)などの被検体から得られた生体情報が挙げられる。   Further, in the step (S1-2) of acquiring the first data, examples of the index parameter not derived from the myocardial marker used in addition to the already described “group of index parameters not derived from the myocardial marker” , Sex, history of diabetes, history of hypertension, history of dyslipidemia, presence of smoking, presence of anemia, history of acute myocardial infarction, history of angina requiring coronary angioplasty (PCI) History of heart failure, history of atrial fibrillation requiring ablation treatment, history of cerebral infarction, history of peripheral arterial disease, history of aortic dissection, dialysis, age, height, weight, heart rate, urine Examples thereof include biological information obtained from a subject such as protein (qualitative) and urine sugar (qualitative).

また、既に説明した心筋マーカーに非由来の指標パラメータの群にさらに加えて用いられる、心筋マーカーに非由来の指標パラメータの例としては、入院理由及び入院時現症などの被検体から得られた生体情報が挙げられる。   In addition, as an example of the index parameter not derived from the myocardial marker, which is used in addition to the group of index parameters not derived from the myocardial marker already described, it was obtained from a subject such as the reason for hospitalization and on-hospital disease. Biological information can be mentioned.

本実施形態において、第1データ(及び後述する第2データ)は、既に説明した心筋マーカーに非由来の指標パラメータの群にさらに加えて、既に説明した心筋マーカーに由来する指標パラメータをさらに含む群から選択される指標パラメータに基づくデータとしてもよい。   In the present embodiment, the first data (and second data described later) further includes an index parameter derived from the already explained myocardial marker, in addition to a group of index parameters not derived from the already described myocardial marker. It is good also as data based on the index parameter selected from.

このように心筋マーカーに由来する指標パラメータをさらに用いれば、例えば、主要有害心イベントの発症後「3ヵ月以内」といった比較的短期間における再発リスクの予測精度をより向上させることができる。   Thus, if the index parameter derived from the myocardial marker is further used, for example, the prediction accuracy of the recurrence risk in a relatively short period such as “within 3 months” after the onset of the major adverse cardiac event can be further improved.

第1データ(及び後述する第2データ)は、既に説明した心筋マーカーに非由来の指標パラメータの群にさらに加えて、心電図に由来する指標パラメータをさらに含む群から選択される指標パラメータに基づくデータとすることができる。   The first data (and second data described later) is data based on an index parameter selected from the group further including an index parameter derived from an electrocardiogram in addition to the index parameter group not derived from the myocardial marker already described. It can be.

このような心電図に由来する指標パラメータの例としては、P波の高さ、R波の間隔(RR間隔)、PQ時間、R波の高さ、QRS幅、ST部分の変化量(S波の高さとT波の高さの総和)、T波の高さ、及び心電図をフーリエ変換して得られるパワースペクトルが挙げられる。   Examples of index parameters derived from such an electrocardiogram include P wave height, R wave interval (RR interval), PQ time, R wave height, QRS width, ST portion change amount (S wave The sum of the height and the height of the T wave), the height of the T wave, and the power spectrum obtained by Fourier transforming the electrocardiogram.

このように心電図に由来する指標パラメータをさらに用いれば、指標パラメータの数をさらに増やすことができるので、主要有害心イベントの再発リスクの予測精度をより向上させることができるという効果を得ることができる。   If the index parameters derived from the electrocardiogram are further used in this way, the number of index parameters can be further increased, so that the effect of improving the prediction accuracy of the recurrence risk of the main adverse cardiac event can be obtained. .

第1データは、既に説明した複数の指標パラメータの群から選択される2種以上の指標パラメータに基づいて生成することができる。かかる指標パラメータは、後述する選択頻度に基づいて選択することが好ましい。   The first data can be generated based on two or more types of index parameters selected from the group of index parameters already described. Such an index parameter is preferably selected based on a selection frequency described later.

本実施形態の所定期間内における主要有害心イベントの再発リスクの予測方法において、用いられ得る指標パラメータの数は、予測に要する時間などを勘案して任意好適な数とすることができる。用いられ得る指標パラメータの数は、例えば選択頻度がより高い指標パラメータを予測精度を勘案して適宜選択することにより決定することができる。   In the method for predicting the risk of recurrence of a major adverse event within a predetermined period of the present embodiment, the number of index parameters that can be used can be arbitrarily set in consideration of the time required for prediction. The number of index parameters that can be used can be determined, for example, by appropriately selecting an index parameter having a higher selection frequency in consideration of prediction accuracy.

本実施形態の所定期間内における主要有害心イベントの再発リスクの予測方法において、第1データ(及び後述する第2データ)は、既に説明した指標パラメータのうち、2種以上の指標パラメータが用いられる。しかしながら、用いられ得る指標パラメータの数は特に限定されない。指標パラメータとしては、例えば、2種のみならず、5種以上、10種以上、15種以上、20種以上、25種以上、30種以上、35種以上、40種以上、45種以上又は既に説明したすべてを用い得る。   In the method for predicting the risk of recurrence of a major adverse event within a predetermined period of the present embodiment, two or more types of index parameters are used as the first data (and second data described later) among the index parameters already described. . However, the number of indicator parameters that can be used is not particularly limited. Examples of the index parameter include not only two types but also 5 types or more, 10 types or more, 15 types or more, 20 types or more, 25 types or more, 30 types or more, 35 types or more, 40 types or more, 45 types or more or already All described can be used.

2種以上の指標パラメータが用いられる場合、かかる2種以上の指標パラメータの組み合わせは、相関ルール分析、クラスタリングなどの処理によって適切な組み合わせを選択することができる。   When two or more types of index parameters are used, an appropriate combination of the two or more types of index parameters can be selected by processing such as correlation rule analysis or clustering.

(2)第1データを、第2データに基づいて構築された学習モデルで処理して、再発リスクを予測するステップ(S2)
図1に示されるように、本実施形態の所定期間内における主要有害心イベントの予測方法は、上記ステップ(S2)を含んでいる。
(2) A step of processing the first data with a learning model constructed based on the second data to predict a recurrence risk (S2)
As shown in FIG. 1, the method for predicting major adverse event within a predetermined period of the present embodiment includes the above step (S2).

ここで、まず、図3を参照して、ステップ(S2)に用いられる学習モデルを構築するステップ(S0)について説明する。図3は、ステップ(S0)を説明するためのフローチャートである。   Here, first, with reference to FIG. 3, the step (S0) for constructing the learning model used in the step (S2) will be described. FIG. 3 is a flowchart for explaining the step (S0).

なお、この学習モデルを構築するステップ(S0)は、既に説明したステップ(S1)に先行して行うこともできる。   Note that the step (S0) of building the learning model can be performed prior to the step (S1) already described.

図3に示されるように、まず、複数のビットストリングを含む第2データを準備するステップ(S0−1)が行われる。   As shown in FIG. 3, first, a step of preparing second data including a plurality of bit strings (S0-1) is performed.

具体的には、既に説明した「心筋マーカーに非由来の複数の指標パラメータからなる群」に加えられた群から選択頻度に基づいて選択された2種以上の指標パラメータに基づくビットストリングである第2データを生成して、準備する。   Specifically, the bit string is based on two or more index parameters selected based on the selection frequency from the group added to the “group consisting of a plurality of index parameters not derived from the myocardial marker” already described. 2 Generate and prepare data.

第2データは、学習モデルを構築するための教師データである。ここで第2データ及びその生成について説明する。   The second data is teacher data for constructing a learning model. Here, the second data and generation thereof will be described.

まず、予め収集された症例データ群を準備する。本実施形態の症例データ群は、主要有害心イベントを発症した患者にかかる複数の指標パラメータについての数値データを含む症例データを収集することにより構成されたデータ群であって第1データに対応している。   First, a case data group collected in advance is prepared. The case data group of the present embodiment is a data group configured by collecting case data including numerical data on a plurality of index parameters related to a patient who has developed a major adverse cardiac event, and corresponds to the first data. ing.

症例データ群は、入院から1年以上の所定期間内における主要有害心イベントの再発の有無が判明している複数の症例データ、すなわち所定期間内に主要有害心イベントを再発した「再発あり」と分類される「再発あり」症例データ及び所定期間内に主要有害心イベントを再発しなかった「再発なし」と分類される「再発なし」症例データを含む。   Case data group consists of multiple case data for which the presence or absence of recurrence of major adverse events within a prescribed period of 1 year or more after hospitalization, that is, “with recurrence”, which has recurred major adverse events within a prescribed period. Includes “relapsed” case data classified and “no relapse” case data classified as “no recurrence” that did not recur major adverse cardiac events within a predetermined period.

よって、症例データ群は、複数の「再発あり」症例データからなる「再発あり」症例データ群と、複数の「再発なし」症例データからなる「再発なし」症例データ群とから構成される。   Therefore, the case data group includes a “relapsed” case data group composed of a plurality of “relapsed” case data and a “no relapsed” case data group composed of a plurality of “no relapsed” case data.

次に、症例データ群、すなわち、主要有害心イベントの「再発あり」症例データ群及び「再発なし」症例データ群それぞれを、(i)学習モデル構築用の症例データ群と(ii)評価用の症例データ群とに分割する。これらのうち、分割された「学習モデル構築用の症例データ」を用いて第2データを生成させる。   Next, each of the case data groups, that is, the “relapsed” case data group and the “no relapse” case data group of the main adverse cardiac event, are (i) a case data group for constructing a learning model and (ii) an evaluation Divide into case data group. Among these, the second data is generated using the divided “case data for constructing a learning model”.

ここで「学習モデル構築用の症例データ群」に含まれる「再発あり」症例データの数と「再発なし」症例データの数とが同等ではなく偏りがある場合には、学習モデルの構築にあたり学習バイアスが生じてしまうおそれがある。   If the number of “recurring” case data included in the “case data group for learning model construction” and the number of “no recurrence” case data are not equal and biased, learning is performed when constructing the learning model. There is a risk of bias.

よって、このように偏りがある場合には「再発あり」症例データの数と「再発なし」症例データの数とを同程度に揃える均等化処理を行って、学習モデル構築用の「均等化済み症例データ群」を調製する。具体的には、例えば「再発あり」症例データの数が「再発なし」症例データの数よりも少ない場合には、「再発あり」症例データの数と同一数の「再発なし」症例データを抽出して双方の数を揃える均等化処理を行うことが好ましい。   Therefore, if there is a bias in this way, an equalization process is performed to equalize the number of “recurrent” case data and the number of “non-recurrent” case data to the same level. “Case data group” is prepared. Specifically, for example, if the number of “relapsed” case data is less than the number of “no recurrence” case data, the same number of “no recurrence” case data as the number of “recurring” case data is extracted. Thus, it is preferable to perform equalization processing to make both numbers uniform.

次に、均等化済み症例データ群を、さらに複数の群に分割する。分割された群それぞれに含まれる症例データの数は同程度であればよく、同一とすることが好ましい。分割後の群の総数は特に限定されないが、例えば4程度とすることが好ましい。   Next, the equalized case data group is further divided into a plurality of groups. The number of case data included in each of the divided groups may be approximately the same, and is preferably the same. The total number of groups after division is not particularly limited, but is preferably about 4, for example.

次いで、分割された複数の均等化済み症例データ群のうちの一部を用いて「部分データ」を生成する。例えば4つの均等化済み症例データ群に分割された場合には、そのうちの3つの群(75%)を用いて「部分データ」を生成させればよい。なお、この場合、残りの1つの群(25%)は、「評価用データ」とされる。   Next, “partial data” is generated using a part of the divided plurality of equalized case data groups. For example, when the data is divided into four equalized case data groups, “partial data” may be generated using three groups (75%) of them. In this case, the remaining one group (25%) is set as “evaluation data”.

そして、この生成した複数の部分データ及び部分データの生成に用いられた元データである完全データ(症例データ)を含むデータ群である第2データを用いて、学習モデルが構築される(詳細は後述する。)。   And a learning model is constructed | assembled using the 2nd data which is the data group containing the complete data (case data) which is the original data used for the production | generation of this some partial data and partial data (for details, see FIG. (It will be described later.)

ここで、図4を参照して、第2データにかかる指標パラメータの例を説明する。図4は、第2データにかかる指標パラメータの例を示す表である。
図4には、指標パラメータ名及び指標パラメータに加えて、指標パラメータの定義及び単位、並びに指標パラメータの種類が示されている。また、指標パラメータにはID番号として通し番号(1〜24)が付されている。
Here, with reference to FIG. 4, the example of the parameter | index parameter concerning 2nd data is demonstrated. FIG. 4 is a table showing an example of index parameters according to the second data.
In FIG. 4, in addition to the index parameter name and the index parameter, the definition and unit of the index parameter, and the type of the index parameter are shown. The index parameters are assigned serial numbers (1 to 24) as ID numbers.

第2データについては「主要有害心イベントの発症後所定期間内に主要有害心イベントを再発したか、又は再発しなかったか(所定期間内における主要有害心イベントの再発歴)についての指標パラメータ」の選択は必須である。なお、第1データにおいては、かかる指標パラメータはそもそも存在し得ないため選択されない。   For the second data, refer to “Indicator parameter about whether major adverse events recurred within the prescribed period after the occurrence of major adverse events, or did not recur (history of major adverse events within the prescribed period)” Selection is mandatory. In the first data, such an index parameter cannot be selected because it cannot exist in the first place.

第2データにかかる指標パラメータの群は、「主要有害心イベントの発症後所定期間内に主要有害心イベントを再発したか、又は再発しなかったかについての指標パラメータ」が含まれることを除き、既に説明した第1データにかかる指標パラメータの群と同一とすることができる。   The group of index parameters according to the second data has already been included, except that “index parameters regarding whether or not a major adverse event has recurred within a predetermined period after the occurrence of a major adverse event” has been included. It can be the same as the group of index parameters according to the first data described.

第2データにおける指標パラメータの選択において、第1データと同一の指標パラメータからなる群から選択される指標パラメータは、選択頻度に基づいて選択することが好ましい(詳細については後述する。)。   In the selection of the index parameter in the second data, it is preferable to select the index parameter selected from the group consisting of the same index parameters as the first data based on the selection frequency (details will be described later).

図5及び図6を参照して、第2データについて説明する。図5は、部分データを生成するための完全データの構成を説明する模式的な図である。図6は、部分データである第2データの模式的な図である。   The second data will be described with reference to FIGS. FIG. 5 is a schematic diagram for explaining the configuration of complete data for generating partial data. FIG. 6 is a schematic diagram of second data that is partial data.

図5及び図6に示されるように完全データ及びかかる完全データから生成される部分データを含む第2データは、機械学習時に使用される指標パラメータの選択及び症例データの選択をビット列(ビットストリング)として表現しているデータである。
図5に示される例では、部分データを生成するための完全データにおいては、10種の指標パラメータ及び10症例の症例データを用いている。
As shown in FIG. 5 and FIG. 6, the second data including complete data and partial data generated from the complete data is a bit string (bit string) for selecting an index parameter and selecting case data used during machine learning. It is data expressed as
In the example shown in FIG. 5, 10 index parameters and 10 case data are used in the complete data for generating partial data.

ここで「症例データ」とは、選択された指標パラメータに対応する症例(患者)を特定するためのデータ(パラメータ)である。なお、単一の患者についての複数の症例が、別個の症例データとして存在する場合もありうる。   Here, the “case data” is data (parameters) for specifying a case (patient) corresponding to the selected index parameter. Note that a plurality of cases for a single patient may exist as separate case data.

図5及び図6に示されるように、完全データ及びその部分データを含む第2データにかかるビットストリングは、指標パラメータの選択又は非選択が記述される第1部分BSP1と症例データの選択又は非選択が記述される第2部分BSP2とにより構成される。この例では第1部分BSP1の後に連続的に第2部分BSP2が記述されて構成されている。なお、この例では第1部分BSP1に10種の指標パラメータ(ID:1〜10)が記述され、第2部分BSP2には用いられる10症例の症例データ(ID:PT1〜PT10)が記述されている。   As shown in FIG. 5 and FIG. 6, the bit string for the second data including the complete data and the partial data includes the first partial BSP1 in which the selection or non-selection of the index parameter is described and the selection or non-selection of the case data. It consists of a second part BSP2 in which the selection is described. In this example, the second part BSP2 is described continuously after the first part BSP1. In this example, ten index parameters (ID: 1 to 10) are described in the first part BSP1, and case data (ID: PT1 to PT10) of ten cases used are described in the second part BSP2. Yes.

すなわち、図5及び図6において、最上段の数列はID番号を示しており、それより下段の数値は指標パラメータの選択又は非選択、並びに症例データの選択又は非選択を表している。   That is, in FIG. 5 and FIG. 6, the uppermost number sequence indicates the ID number, and the numerical values on the lower level indicate selection or non-selection of the index parameter and selection or non-selection of the case data.

なお、図5に示されるビットストリングは、10種の指標パラメータ及び10症例の症例データをすべて用いた例を示す完全データであるので、ビットストリングを構成する数値はすべてが「1」で構成されている。ここで、仮に図4に示される指標パラメータと関連づけて考えると、かかるビットストリングは、具体的には(ID:1〜10)にかかる指標パラメータが対照されて用いられることを意味している。   The bit string shown in FIG. 5 is complete data showing an example using all 10 kinds of index parameters and case data of 10 cases. Therefore, the numerical values constituting the bit string are all composed of “1”. ing. Here, if considered in association with the index parameter shown in FIG. 4, this bit string specifically means that the index parameter related to (ID: 1 to 10) is used in contrast.

図4に示されるように、得られた検査結果及び/又は生体情報が、例えば所定の成分の含有量、年齢、身長といった定量データ(数値データ)として取得される場合には、そのまま指標パラメータとして用いることができる。   As shown in FIG. 4, when the obtained test result and / or biological information is acquired as quantitative data (numerical data) such as the content, age, and height of a predetermined component, for example, it is used as an index parameter as it is. Can be used.

また、かかる定量データ(数値データ)は、例えば、年齢(高齢者、中高年、青年、少年、幼齢)を勘案して、順序尺度、間隔尺度、比例尺度などに変換して指標パラメータとして用いることができる。   In addition, such quantitative data (numerical data) should be converted into an ordinal scale, interval scale, proportional scale, etc., taking into account the age (elderly, middle-aged, adolescent, boy, young), for example, and used as an index parameter. Can do.

また、糖尿病既往歴、高血圧症既往歴、脂質異常症既往歴などの生体情報にかかる属性データ、陽性(レベル)、陰性などの定性データについては、例えば「あり=1、なし=0」と2値化するなどして指標パラメータとして用いることができる。   For attribute data relating to biological information such as a history of diabetes, a history of hypertension, a history of dyslipidemia, and qualitative data such as positive (level) and negative, for example, “Yes = 1, No = 0” and 2 It can be used as an index parameter by converting it into a value.

次に、完全データ、及び完全データに基づく部分データを含む第2データの生成について説明する。具体的には、完全データに含まれる複数の指標パラメータ(データ群の列)、及び症例データ(データ群の行)について取捨選択を行い、もとの完全データとは異なる複数の部分データを生成することにより、完全データ、及び完全データに基づく複数の部分データを含むデータ群である第2データを準備する。   Next, generation of second data including complete data and partial data based on the complete data will be described. Specifically, multiple index parameters (data group columns) and case data (data group rows) included in complete data are selected, and multiple partial data different from the original complete data are generated. Thus, the second data which is a data group including the complete data and a plurality of partial data based on the complete data is prepared.

上述のとおり、第2データには、対応する学習モデルの予測性能が十分であることを条件として、複数の部分データに加えて、すべての指標パラメータ及びすべての症例データを含む完全データが含まれていてもよい。   As described above, the second data includes complete data including all index parameters and all case data in addition to a plurality of partial data, provided that the prediction performance of the corresponding learning model is sufficient. It may be.

ここで、図6を参照して、部分データ及び部分データの生成について説明する。
ここでは、図5を参照して既に説明した第2データを構成し得る完全データ(ビットストリング)に基づく部分データ(ビットストリング)及びその生成ステップについて説明する。
Here, the generation of partial data and partial data will be described with reference to FIG.
Here, partial data (bit string) based on complete data (bit string) that can constitute the second data already described with reference to FIG. 5 and generation steps thereof will be described.

図6に示されるように、この例では10種の指標パラメータのうち6種(ID=1、3、4、6、7及び9)が選択され、4種(ID=2、5、8及び10)が非選択とされるとともに、10症例の症例データのうち4症例(ID=PT1、PT4、PT7及びPT10)が選択され、6症例(ID=PT2、PT3、PT5、PT6、PT8及びPT9)が非選択とされている。   As shown in FIG. 6, in this example, 6 types (ID = 1, 3, 4, 6, 7, and 9) are selected from 10 types of index parameters, and 4 types (ID = 2, 5, 8, and 8) are selected. 10) is not selected, and 4 cases (ID = PT1, PT4, PT7 and PT10) are selected from the case data of 10 cases, and 6 cases (ID = PT2, PT3, PT5, PT6, PT8 and PT9) are selected. ) Is not selected.

部分データは、具体的には、例えば、選択された指標パラメータ及び学習モデルの組み合わせを特に考慮することなく、選択結果が重複しないようにランダムに選択して複数の部分データを生成させることにより得ることができる。そして、得られた複数の部分データを第2データに含める処理が行われる。   Specifically, for example, the partial data is obtained by generating a plurality of partial data by randomly selecting the selection results so as not to overlap without particularly considering the combination of the selected index parameter and the learning model. be able to. Then, a process of including the obtained partial data in the second data is performed.

このように指標パラメータ(特徴量)をリサンプリングして得られた複数の部分データを組み入れたデータセットである第2データを得るステップを行うことにより、より大きな分散(Variance)を有する学習モデルを得ることができる。   A learning model having a larger variance is obtained by performing the step of obtaining second data that is a data set incorporating a plurality of partial data obtained by re-sampling the index parameter (feature value) in this way. Can be obtained.

なお、図6に示されるように本実施形態においては、部分データを含む第2データは、複数のビットストリングを含むデータセットとして管理、保存される。図6には、第2データであるデータセットに含まれる3つのパターンを有する部分データのビットストリング(BS1、BS2及びBS3)が示されている。複数のビットストリングを含むデータセット(第2データ)にかかる処理の詳細については、後述する。   As shown in FIG. 6, in the present embodiment, the second data including partial data is managed and stored as a data set including a plurality of bit strings. FIG. 6 shows bit strings (BS1, BS2, and BS3) of partial data having three patterns included in the data set that is the second data. Details of the processing relating to a data set (second data) including a plurality of bit strings will be described later.

次に、得られた第2データを用いて、機械学習により学習モデルを構築するステップ(S0−2)が実施される。   Next, a step (S0-2) of constructing a learning model by machine learning is performed using the obtained second data.

本実施形態で構築される学習モデルには、複数種類の学習モデル、すなわち第1学習モデル及び第2学習モデルが含まれる。   The learning model constructed in the present embodiment includes a plurality of types of learning models, that is, a first learning model and a second learning model.

本実施形態において、第1学習モデルは、「所定期間内の主要有害心イベントの再発あり」又は「不明」を予測する学習モデルである。また、第2学習モデルは、「所定期間内の主要有害心イベントの再発なし」又は「不明」を予測する学習モデルである。   In the present embodiment, the first learning model is a learning model that predicts “there is a major adverse cardiac event reoccurring within a predetermined period” or “unknown”. The second learning model is a learning model that predicts “no recurrence of major adverse cardiac events within a predetermined period” or “unknown”.

以下、ステップ(S0−2)について具体的に説明する。
ここでは、第2データに含まれ得る完全データ、複数の部分データそれぞれを教師データとして用い、機械学習により複数の学習モデル、すなわち、複数の第1学習モデル及び複数の第2学習モデルを構築する。
Hereinafter, step (S0-2) will be specifically described.
Here, complete data that can be included in the second data and each of the plurality of partial data are used as teacher data, and a plurality of learning models, that is, a plurality of first learning models and a plurality of second learning models are constructed by machine learning. .

本実施形態において、第1学習モデル及び第2学習モデルは、サポートベクターマシン(SVM)であることが好ましい。また、サポートベクターマシン以外の手段として、例えばニューラルネットワークなどの他の手段を用いることもできる。   In the present embodiment, the first learning model and the second learning model are preferably support vector machines (SVM). Also, as means other than the support vector machine, other means such as a neural network can be used.

本実施形態において、学習モデルを構築するための機械学習に用いられ得るサポートベクターマシンの例としては、ウェブサイト(https://cran.r−project.org/web/packages/e1071)にて入手可能である「R言語(https://www.R−project.org)のe1071パッケージ」に基づくサポートベクターマシンが挙げられる。   In this embodiment, an example of a support vector machine that can be used for machine learning to construct a learning model is obtained from a website (https://cran.r-project.org/web/packages/e1071). A support vector machine based on the "e1071 package of R language (https://www.R-project.org)" is possible.

ここで、学習モデルは、第2データを複数のデータ群に分割し、該データ群それぞれを教師データとして用い、かつ複数の該データ群ごとに異なる複数のパラメータ条件で行われる機械学習により構築されることが好ましい。   Here, the learning model is constructed by machine learning performed by dividing the second data into a plurality of data groups, using each of the data groups as teacher data, and performing a plurality of parameter conditions different for each of the plurality of data groups. It is preferable.

本実施形態にかかる主要有害心イベントの予測方法において、機械学習にはカーネル関数としてRBFカーネル(ガウスカーネル)を用いたサポートベクターマシンを用いることができる。   In the method for predicting major adverse event according to this embodiment, a support vector machine using an RBF kernel (Gauss kernel) as a kernel function can be used for machine learning.

機械学習は、具体的には、異なる複数のパラメータ条件で行われる。この「異なる複数のパラメータ条件」は、例えばランダムサンプリングにより最適な調整係数(ハイパーパラメータ)を調整することにより設定することができる。   Specifically, the machine learning is performed under a plurality of different parameter conditions. The “different parameter conditions” can be set by adjusting an optimum adjustment coefficient (hyper parameter) by, for example, random sampling.

例えば、上記のとおりガウスカーネルを採用したサポートベクターマシンを用いる場合には、調整係数であるγパラメータ及びCパラメータを調整することにより、同一の部分データから複数の異なる学習モデルを構築することができる。   For example, when using a support vector machine employing a Gaussian kernel as described above, a plurality of different learning models can be constructed from the same partial data by adjusting the γ parameter and the C parameter, which are adjustment coefficients. .

この場合、例えば、識別境界線の複雑さを調節するγパラメータとして、γ=0.01、γ=0.02、γ=0.03、γ=0.04、γ=0.05の5種類を使用し、ソフトマージンの許容パラメータCについては機械学習時の性能評価の際に用いられる識別関数(後述する。)によって代替されるため固定して、C=100として学習モデルを構築することができる。   In this case, for example, five parameters, γ = 0.01, γ = 0.02, γ = 0.03, γ = 0.04, and γ = 0.05, are used as γ parameters for adjusting the complexity of the identification boundary line. , And the allowable parameter C of the soft margin is replaced by a discriminant function (described later) used in performance evaluation during machine learning, so that the learning model can be constructed with C = 100. it can.

調整係数を例えば上記のように設定することにより、より大きな分散(Variance)を有する学習モデルを得ることができる。   For example, by setting the adjustment coefficient as described above, a learning model having a larger variance can be obtained.

サポートベクターマシンは、本来は分散が小さくなるように構築される学習モデルである。しかしながら、本実施形態では、あえて分散の大きいサポートベクターマシンを構築し、後述する処理をさらに行っている。   The support vector machine is a learning model that is originally constructed so that the variance is small. However, in the present embodiment, a support vector machine having a large dispersion is constructed, and the processing described later is further performed.

本実施形態によれば、あえて分散の大きいサポートベクターマシンを構築することで、結果として、予測精度をより向上させることができる。以下の説明において、特に断らない限り、学習モデルとしてサポートベクターマシンを用いる処理について説明する。   According to the present embodiment, as a result, prediction accuracy can be further improved by constructing a support vector machine having a large variance. In the following description, processing using a support vector machine as a learning model will be described unless otherwise specified.

次いで、評価用データを学習モデルで処理し、予測結果をパレートランクにより評価するステップ(S0−3)が行われる。   Next, a step (S0-3) of processing the evaluation data with the learning model and evaluating the prediction result based on the Pareto rank is performed.

このステップ(S0−3)では、感度及び陽性的中率を指標とするパレートランクにより第1学習モデル及び第2学習モデルの性能を評価する。以下、この評価ステップについて具体的に説明する。   In this step (S0-3), the performance of the first learning model and the second learning model is evaluated based on the Pareto rank using the sensitivity and the positive predictive value as indices. Hereinafter, this evaluation step will be specifically described.

1)まず、構築された学習モデル(第1学習モデル及び第2学習モデル)と既に説明した評価用データとを用いて、すべての学習モデルについて予測結果を得る。   1) First, prediction results are obtained for all learning models using the constructed learning models (first learning model and second learning model) and the evaluation data already described.

2)予測可能な領域と不可能な領域を前提とする識別問題を扱う場合、誤識別の度合いをなるべく小さくするとともに、正しく予測できる対象の数をなるべく大きくすることが重要である。そのため、目的関数O(予測可能な領域において、予測エラーを計測するための関数)及び目的関数O(データ空間上で正しく予測できるデータ数を計数するための関数)を用いて、得られた予測結果を評価する。 2) When dealing with an identification problem that assumes a predictable area and an impossible area, it is important to reduce the degree of misidentification as much as possible and to increase the number of objects that can be correctly predicted as much as possible. Therefore, it is obtained using the objective function O 1 (function for measuring a prediction error in a predictable region) and the objective function O 2 (function for counting the number of data that can be correctly predicted in the data space). Evaluate the predicted results.

ここで、目的関数O及び目的関数Oについて説明する。ここでは、識別関数としてサポートベクターマシンを利用して、「再発あり」を予測目標とする第1学習モデルを評価する場合について説明する。 Here, the objective function O 1 and the objective function O 2 will be described. Here, a case will be described in which a support vector machine is used as the discriminant function to evaluate the first learning model whose prediction target is “with recurrence”.

前提として、評価用データ(x,y)において、xはある症例について測定された値の組であり、yは正解ラベルであり、「再発あり=+1」および「再発なし=−1」という符号データとして、いずれかの値を取るものとする。   As a premise, in the evaluation data (x, y), x is a set of values measured for a certain case, y is a correct answer label, and signs “with recurrence = + 1” and “without recurrence = −1”. Any value is assumed as data.

所定の第2データを用いて学習することで構築された第1学習モデルの識別関数をfとすると、この学習モデルの識別目標である「再発あり」に基づき、識別関数fにかかるxを入力したときに算出された予測値f(x)に基づいて、f(x)>0であれば「再発あり」と予測され、f(x)<0であれば「不明」とされる。逆に、識別目標が「再発なし」である第2学習モデルにおいては、識別関数の予測値がf(x)<0であれば「再発なし」と予測され、f(x)>0であれば「不明」とされる。   If the discriminating function of the first learning model constructed by learning using predetermined second data is f, x corresponding to the discriminating function f is input based on “there is a recurrence” that is the discriminating target of this learning model. Based on the predicted value f (x) calculated at this time, if f (x)> 0, it is predicted as “recurring”, and if f (x) <0, it is determined as “unknown”. Conversely, in the second learning model whose identification target is “no recurrence”, “no recurrence” is predicted if the predicted value of the discrimination function is f (x) <0, and f (x)> 0. “Unknown”.

本実施形態にかかる「再発あり又は不明」を予測する第1学習モデルは、予測可能領域に存在するデータについては常に「再発あり」と予測し、予測可能領域外に存在するデータについては「不明」とされる。   The first learning model for predicting “with or without recurrence” according to the present embodiment always predicts “with recurrence” for data existing in the predictable region, and “unknown” for data existing outside the predictable region. "

よって、第1学習モデルの予測可能領域に「再発なし」と判定されるべきデータが存在してしまったときには、予測は常に失敗することになる。   Therefore, when data that should be determined as “no recurrence” exists in the predictable region of the first learning model, the prediction always fails.

第1学習モデルの「再発あり」との予測可能領域における、目的関数Oと目的関数Oとによる評価について説明する。 The evaluation by the objective function O 1 and the objective function O 2 in the predictable region of “there is recurrence” in the first learning model will be described.

なお、目的関数Oによる評価は、学習モデルとしてサポートベクターマシン以外を用いる場合にも、2群判別関数を用いた学習モデルに対して一般化することができる。具体的には、例えば、線形判別関数、2次判別関数、ロジスティック判別関数を用いる場合にも、サポートベクターマシンの場合と同様に、誤予測したデータから識別線までの距離を用いて評価を行うことができる。 Note that the evaluation by the objective function O 1 can be generalized for the learning model using the two-group discriminant function even when a learning model other than the support vector machine is used. Specifically, for example, when a linear discriminant function, a quadratic discriminant function, or a logistic discriminant function is used, evaluation is performed using the distance from the mispredicted data to the identification line as in the case of the support vector machine. be able to.

目的関数Oでは、誤予測したデータから識別線までの距離(SVM Confidence Margin)の総和の最小化を考える。 In the objective function O 1 , the minimization of the sum total of the distance (SVM Confidence Margin) from the mispredicted data to the identification line is considered.

SVM Confidence Marginは、評価用データ(x,y)の識別関数fが算出する予測値f(x)を用いて、予測値f(x)と正解ラベルyとの積yf(x)と定義される。   The SVM Confidence Margin is defined as the product yf (x) of the predicted value f (x) and the correct answer label y using the predicted value f (x) calculated by the identification function f of the evaluation data (x, y). The

ここで、評価用データが正しく「再発あり」と予測される場合、SVM Confidence Marginは、f(x)>0という予測値と正解ラベル「再発あり=+1」との積であるので、正の値をとる。他方、予測可能領域内における誤予測、すなわちf(x)>0となり「再発あり」と予測されたにもかかわらず、正解ラベルyは「再発なし=−1」であった場合、予測値と正解ラベルとの積は、負の値をとる。   Here, when the evaluation data is correctly predicted to be “with recurrence”, the SVM Confidence Margin is a product of the predicted value f (x)> 0 and the correct answer label “with recurrence = + 1”. Takes a value. On the other hand, if the correct label y is “no recurrence = −1” even though it is predicted to be mispredicted in the predictable region, that is, f (x)> 0 and “recurring”, the predicted value is The product with the correct answer label takes a negative value.

同様に、第2学習モデルにおいても、SVM Confidence Marginは、評価用データが正しく「再発なし」と予測される場合、f(x)<0という予測値と正解ラベル「再発なし=−1」との積であるので、正の値をとり、誤予測されると負の値をとる。   Similarly, in the second learning model, when the evaluation data is correctly predicted as “no recurrence”, the SVM Confidence Margin indicates that the predicted value f (x) <0 and the correct label “no recurrence = −1”. Therefore, it takes a positive value and takes a negative value if it is mispredicted.

SVM Confidence Marginによる目的関数Oの最小化は下記式(1)で表される。
The minimization of the objective function O 1 by SVM Confidence Margin is expressed by the following equation (1).

式(1)中、m(y,f(x))について、
であり、abs[x]はxの絶対値を表す。すなわち、式(1)は、SVM Confidence Marginにおいて、予測可能領域における誤識別の度合いのみを集計するための機能を有する。
In formula (1), for m (y, f (x))
And abs [x] represents the absolute value of x. That is, the expression (1) has a function for counting only the degree of misidentification in the predictable region in the SVM Confidence Margin.

「再発あり」を予測目標とする第1学習モデルを評価する場合、各評価用データの識別線からの距離について、「再発あり」データが負例(f(x)<0)と予測された評価用データの予測距離だけを集計する。 When evaluating the first learning model whose prediction target is “with recurrence”, “with recurrence” data is predicted as a negative example (f (x i ) <0) for the distance from the identification line of each evaluation data. Only the estimated distance of the evaluation data.

次に、目的関数Oについて、誤予測をある程度許容しながら、正しく予測される「再発あり」の評価用データの個数の最大化を考える。 Next, with regard to the objective function O 2 , let us consider maximizing the number of “recurring” evaluation data that is correctly predicted while allowing a certain degree of erroneous prediction.

識別関数fの予測の正誤を正解ラベルy及び予測値f(x)を用いて表すと下記式(2)で表される。
When the correctness of the prediction of the discrimination function f is expressed using the correct answer label y and the predicted value f (x), it is expressed by the following formula (2).

ここでk個の評価用データについて予測を行った場合の目的関数Oの最大化は下記式(3)で表される。
Here, maximization of the objective function O 2 when prediction is performed for k pieces of evaluation data is expressed by the following equation (3).

式(3)中、右辺第2項は予測可能領域内の「再発なし」の総数による正則化を表している。   In Expression (3), the second term on the right side represents regularization based on the total number of “no recurrence” in the predictable region.

式(3)中、誤予測の許容度を調整する変数であるα(1>α>0)は、α=0.3と設定することが好ましい。   In equation (3), α (1> α> 0), which is a variable for adjusting the tolerance of misprediction, is preferably set to α = 0.3.

こうして、学習モデルの予測結果が、パレートランクにより評価される。   Thus, the prediction result of the learning model is evaluated by the Pareto rank.

次いで、評価が高い学習モデル及び、評価が高い学習モデルを構築できたビットストリングを選抜するステップ(S0−4)が行われる。   Next, a step (S0-4) of selecting a learning model having a high evaluation and a bit string for which a learning model having a high evaluation can be constructed is performed.

具体的には、既に説明した目的関数O及びOによる評価値(O,1/O)がより小さかった学習モデル(第1学習モデル及び第2学習モデル)及びかかる学習モデルを構築することできたビットストリング(第2データ)が選抜される。 Specifically, a learning model (first learning model and second learning model) in which the evaluation values (O 1 , 1 / O 2 ) by the objective functions O 1 and O 2 already described are smaller and such a learning model are constructed. The bit string (second data) that can be selected is selected.

ここで、ステップ(S0−4)について具体的に説明する。   Here, step (S0-4) will be specifically described.

まず、既に説明した第1データと指標パラメータの構成が同一であるデータであって、かつ指標パラメータの数値が第1データとは一致しない複数の評価用データを用意する。   First, a plurality of evaluation data is prepared which has the same index parameter configuration as that of the first data described above and whose index parameter values do not match the first data.

学習モデルの選抜に用いる評価用データとしては、例えば、分割された複数の均等化済み症例データ群のうちの第2データ(部分データ)の生成に用いられなかった均等化済み症例データ群に属する症例データを用いることができる。   The evaluation data used for selecting the learning model belongs to, for example, an equalized case data group that has not been used to generate second data (partial data) among a plurality of divided equalized case data groups Case data can be used.

次いで、かかる評価用データを複数の第1学習モデル及び複数の第2学習モデルでそれぞれ処理して、所定期間内における主要有害心イベントを再発するリスクを予測する。   Then, the evaluation data is processed by a plurality of first learning models and a plurality of second learning models, respectively, to predict a risk of recurrence of a major adverse cardiac event within a predetermined period.

次に、得られた予測結果について、既に説明した目的関数O及びOを用いて感度及び陽性的中率を指標とするパレートランクにより第1学習モデル及び第2学習モデルを評価する。 Next, with respect to the obtained prediction results, the first learning model and the second learning model are evaluated by the Pareto rank using the sensitivity and positive predictive value as indices using the objective functions O 1 and O 2 already described.

得られた評価結果に基づいて、感度及び陽性的中率がいずれも高い、すなわち、評価が高い学習モデル(第1学習モデル及び第2学習モデル)及びかかる学習モデルを構築することができた第2データ(ビットストリング)を選抜して保存する。   Based on the obtained evaluation results, both the sensitivity and the positive predictive value are high, that is, the learning model (the first learning model and the second learning model) having a high evaluation and such a learning model can be constructed. Two data (bit strings) are selected and stored.

選抜される学習モデル及び対応するビットストリングの個数は、要する時間、実施規模などを勘案して、任意好適な個数とすることができる。既に説明した本実施形態の場合には、40個程度とすることが好ましい。   The number of learning models to be selected and the number of corresponding bit strings can be arbitrarily set in consideration of the time required, the implementation scale, and the like. In the case of this embodiment which has already been described, it is preferable that the number is about 40.

評価が高い学習モデル(第1学習モデル及び第2学習モデル)及び対応するビットストリング(第2データ)を選抜するステップ(S0−4)は、感度については1以下であって、0.95以上、0.7以上又は0.6以上とすることが好ましく、偽陽性率については0以上であって、0.4以下、0.3以下又は0.05以下とすることが好ましい。   The step (S0-4) of selecting a highly evaluated learning model (first learning model and second learning model) and a corresponding bit string (second data) has a sensitivity of 1 or less and 0.95 or more. 0.7 or more, preferably 0.6 or more, and the false positive rate is 0 or more, preferably 0.4 or less, 0.3 or less, or 0.05 or less.

なお、この評価が高い第1学習モデル及び第2学習モデルを選抜するステップにより選抜された学習モデルにかかる指標パラメータの選択頻度を分析した分析結果は、第1データ及び第2データを構築するための指標パラメータの選択に用いることができる。   The analysis result of analyzing the selection frequency of the index parameter concerning the learning model selected by the step of selecting the first learning model and the second learning model having a high evaluation is used to construct the first data and the second data. Can be used to select the index parameter.

具体的には、第1学習モデル及び第2学習モデルを構築するにあたり、選択頻度が高い指標パラメータを第1データ及び第2データを生成する際に予め選択すれば、予測方法の実施に必要な時間を短縮することができ、予測精度をより向上させることができる。   Specifically, when the first learning model and the second learning model are constructed, if an index parameter having a high selection frequency is selected in advance when the first data and the second data are generated, it is necessary to implement the prediction method. Time can be shortened and prediction accuracy can be further improved.

また、評価が高い第1学習モデル及び第2学習モデルを構築することができたビットストリングを用いて、採用された指標パラメータの組み合わせを解析することにより、予測精度をより向上させ得る複数の指標パラメータの組み合わせを見出すことができる。   In addition, a plurality of indices that can further improve the prediction accuracy by analyzing a combination of the adopted index parameters using the bit strings that have been able to build the first learning model and the second learning model that are highly evaluated. A combination of parameters can be found.

このようにして見出された複数の指標パラメータの組み合わせを第1データ及び第2データを生成する際に予め選択すれば、予測方法の実施に必要な時間を短縮することができ、予測精度をより向上させることができる。   If a combination of a plurality of index parameters found in this way is selected in advance when generating the first data and the second data, the time required to implement the prediction method can be shortened, and the prediction accuracy can be improved. It can be improved further.

次に、学習モデルが所定の要件を満たすか判定するステップ(S0−5)が行われる。
具体的には、上記ステップ(S0−4)の実施により選抜された学習モデル(第1学習モデル及び第2学習モデル)が所定の要件を満たしているか否かについて判定するステップ(S0−5)が行われる。
Next, a step (S0-5) of determining whether the learning model satisfies a predetermined requirement is performed.
Specifically, a step (S0-5) for determining whether or not the learning models (the first learning model and the second learning model) selected by performing the step (S0-4) satisfy a predetermined requirement. Is done.

具体的には、ステップ(S0−5)は、第1学習モデル及び第2学習モデルが所定の要件、例えば、ビットストリングの性能、すなわち選抜された第1学習モデル及び第2学習モデルの予測精度が所定の予測精度、例えば予測精度の改善率が0.1%を下回るか否か、第1学習モデル及び第2学習モデル(ビットストリング)の更新にかかる世代数が任意に設定した世代数の上限(例えば、100世代)を満たすか否かについての判定が行われる。   Specifically, in step (S0-5), the first learning model and the second learning model have predetermined requirements, for example, the performance of bit strings, that is, the prediction accuracy of the selected first learning model and second learning model. Is a predetermined prediction accuracy, for example, whether the improvement rate of the prediction accuracy is less than 0.1%, or the number of generations required to update the first learning model and the second learning model (bit string) is an arbitrarily set number of generations A determination is made as to whether an upper limit (eg, 100 generations) is satisfied.

まず、上記ステップ(S0−5)において、上記ステップ(S0−4)の実施により、選抜された第1学習モデル及び第2学習モデルが所定の要件を満たしていない場合(ステップ(S0−5)において「No」の場合)について説明する。   First, in the step (S0-5), when the selected first learning model and second learning model do not satisfy the predetermined requirements due to the execution of the step (S0-4) (step (S0-5)). In the case of “No” in FIG.

選抜された第1学習モデル及び第2学習モデル(学習モデル)が所定の要件を満たしていない場合(ステップ(S0−5)において「No」の場合、例えば、前記例における判定の結果、第1学習モデル及び第2学習モデルの予測精度が0.1%を下回っていた場合、及び/又は第1学習モデル及び第2学習モデル(ビットストリング)の世代数が100世代に達していない場合)、かかる学習モデルに対応する、選抜されたビットストリングに対し、遺伝的アルゴリズムを用いて、進化的な処理を行い、新たなビットストリングを生成するステップ(S0−6)が行われる。   When the selected first learning model and second learning model (learning model) do not satisfy the predetermined requirements (“No” in step (S0-5)), for example, as a result of the determination in the example, the first When the prediction accuracy of the learning model and the second learning model is less than 0.1% and / or when the number of generations of the first learning model and the second learning model (bit string) does not reach 100 generations), A step (S0-6) of generating a new bit string by performing evolutionary processing on the selected bit string corresponding to the learning model using a genetic algorithm is performed.

なお、かかるビットストリングの生成(最適化)のステップは、遺伝的アルゴリズムのみならず、例えば、全パターンの組み合わせの探索、ランダム探索などによっても行うことができる。   Note that the bit string generation (optimization) step can be performed not only by a genetic algorithm but also by, for example, a search for a combination of all patterns, a random search, or the like.

ここでは、遺伝的アルゴリズムを用いるビットストリングの最適化のステップについて説明する。   Here, the step of optimizing a bit string using a genetic algorithm will be described.

遺伝的アルゴリズムを用いるビットストリングの最適化のステップでは、より優れた予測性能を備える学習モデルを構築することができたビットストリングの選抜と選抜された複数のビットストリングを含む第2データ(データセット)の更新及び保存とが行われる。   In the step of optimizing the bit string using the genetic algorithm, the selection of the bit string and the second data including the plurality of selected bit strings (data set) that can construct the learning model having better prediction performance ) Is updated and saved.

(1)まず、既に説明したとおり、目的関数O及びOによる学習モデルの評価に基づいて、より評価が高い、すなわちパレートランクが高い学習モデルを構築することができたビットストリングがより上位となるように順位付けする。 (1) First, as already described, based on the evaluation of the learning model by the objective functions O 1 and O 2, the bit string that can construct the learning model having a higher evaluation, that is, the Pareto rank is higher. Ranking so that

具体的には、順位付けが済んだビットストリングについて、例えば、より上位のビットストリングがより上段に来るよう並べ替え、データセットに含まれるビットストリングの数なども考慮して、評価が低いビットストリングをデータセットから除外するなど編集する。そして、更新された複数のビットストリングを含むデータセット(第2データ)を、かかるデータセットに含まれるビットストリングが読み出しできる状態として保存する。   Specifically, for the bit strings that have already been ranked, for example, rearrange the higher-order bit strings to the upper level, and consider the number of bit strings included in the data set. Edit by excluding from the dataset. Then, the data set (second data) including the updated plurality of bit strings is stored in a state where the bit strings included in the data set can be read.

図6に示されるビットストリングを例に取ると、ビットストリングBS1が最上位のビットストリングであり、ビットストリングBS2が第2位のビットストリングであり、ビットストリングBS3が第3位のビットストリングである。   Taking the bit string shown in FIG. 6 as an example, bit string BS1 is the most significant bit string, bit string BS2 is the second most significant bit string, and bit string BS3 is the third most significant bit string. .

(2)次に、遺伝的アルゴリズムを用いて、順位付けがされたビットストリングに対して、淘汰、交叉、突然変異の導入、ビットストリングの評価といった進化的な処理を行う。   (2) Next, the genetic algorithm is used to perform evolutionary processing such as selection, crossover, mutation introduction, and bit string evaluation on the ranked bit strings.

かかる遺伝的アルゴリズムによる処理は、本実施形態では、例えば、NSGA−II(Elitist Non−dominated Sorting Genetic Algorithm)を用いて実施することができる。ここで、NSGA−IIは、非優越ソート遺伝的アルゴリズムである。   In the present embodiment, the processing using such a genetic algorithm can be performed using, for example, NSGA-II (Elitist Non-Dominated Sorting Genetic Algorithm). Here, NSGA-II is a non-dominant sort genetic algorithm.

かかる遺伝的アルゴリズムによる処理は、特に限定されないが、例えば、一世代あたりのモデル数を500とし、アーカイブサイズを125とし、ビットストリングあたりの突然変異率を10%とし、一点交叉させ、80世代まで更新する条件として行うことができる。   The processing by such a genetic algorithm is not particularly limited. For example, the number of models per generation is set to 500, the archive size is set to 125, the mutation rate per bit string is set to 10%, and one point crossover is performed up to 80 generations. This can be done as a condition for updating.

そして、かかる遺伝的アルゴリズムによる処理により新たに生成されたビットストリングをもとの第2データに組み込んで、最新の第2データ(データセット)に更新し、データセットに含まれるビットストリングを読み出しできる状態として保存する処理を行う(S0−7)。   Then, the bit string newly generated by the processing by the genetic algorithm is incorporated into the original second data, updated to the latest second data (data set), and the bit string included in the data set can be read. A process of saving as a state is performed (S0-7).

次いで、更新された最新の第2データを用いて、再度、既に説明した複数のビットストリングを含む第2データを準備するステップ(S0−1)に戻って、再度ステップ(S0−5)までのステップが繰り返され、さらにステップ(S0−5)における判定結果が「No」の場合には、ステップ(S0−5)における判定結果が「Yes」となるまで、ステップ(S0−1)からステップ(S0−7)までが繰り返し実施される。   Next, using the updated second data, the process returns to the step (S0-1) for preparing the second data including the plurality of bit strings already described, and the steps up to step (S0-5) are performed again. If the step is repeated and the determination result in step (S0-5) is “No”, step (S0-1) to step (S0-1) are repeated until the determination result in step (S0-5) is “Yes”. Steps S0-7) are repeated.

このようにして、より優れた学習モデルを構築することができるビットストリングが選抜され、より優れた第2データにかかるデータセットを保持することができる。   In this way, a bit string capable of constructing a better learning model is selected, and a data set related to better second data can be held.

かかる遺伝的アルゴリズムによるビットストリングの最適化の処理においては、変数(指標データ)の選択が同時に行われる。具体的には、成績(予測精度)がより優れた第2データ(ビットストリング)が採用している変数と採用していない変数とを、例えば、変数の選択頻度を比較することで、各変数の重要性を評価し、重要性が高いと判断される変数を選択して採用する。   In the process of optimizing a bit string by such a genetic algorithm, selection of variables (index data) is performed simultaneously. Specifically, for example, by comparing the variable used in the second data (bit string) with better results (prediction accuracy) and the variable not used, for example, by comparing the selection frequency of the variables. Evaluate the importance of and select variables that are judged to be highly important.

かかる変数選択により、予測により寄与すると考えられる変数の抽出、あるいは変数の組み合わせの絞り込みを効果的に行うことができる。   By such variable selection, it is possible to effectively extract variables considered to contribute to prediction or narrow down combinations of variables.

そして、ステップ(S0−5)における判定結果が、既に説明した所定の要件を満たしており「Yes」であった場合(前記例における判定の結果、第1学習モデル及び第2学習モデルの予測精度が0.1%以上であった場合、及び/又は第1学習モデル及び第2学習モデル(ビットストリング)の世代数が100世代に達していた場合)には、ビットストリング(第2データ)の更新は終了し、最終的なビットストリングに基づく学習モデルが選抜学習モデル(第1選抜学習モデル及び第2選抜学習モデル)として選抜される。   If the determination result in step (S0-5) satisfies the predetermined requirement already described and is “Yes” (the determination accuracy in the above example, the prediction accuracy of the first learning model and the second learning model) Is 0.1% or more and / or the number of generations of the first learning model and the second learning model (bit string) reaches 100 generations), the bit string (second data) The update is completed, and a learning model based on the final bit string is selected as a selection learning model (a first selection learning model and a second selection learning model).

最後に、第1選抜学習モデル及び第2選抜学習モデルが保存される(S0−8)。より具体的には、最終的に選抜された第1選抜学習モデル及び第2選抜学習モデルが、読み出し可能な状態として保存される。またここで、更新が終了した第2データ(ビットストリング)を読み出しできる状態として保存する。
かかるステップ(S0−8)が実施されることによりステップ(S0)は終了する。
Finally, the first selection learning model and the second selection learning model are stored (S0-8). More specifically, the first selection learning model and the second selection learning model that are finally selected are stored in a readable state. Here, the second data (bit string) that has been updated is stored in a state where it can be read out.
By executing step (S0-8), step (S0) is completed.

次に、図7を参照して、ステップ(S2)について説明する。図7は、ステップ(S2)を説明するためのフローチャートである。   Next, step (S2) will be described with reference to FIG. FIG. 7 is a flowchart for explaining step (S2).

まず、第1データを、第1選抜学習モデル及び第2選抜学習モデルで処理し、第1選抜学習モデル及び第2選抜学習モデルごとに第1判定結果を取得するステップ(S2−1)が行われる。   First, the first data is processed by the first selection learning model and the second selection learning model, and the step of obtaining the first determination result for each of the first selection learning model and the second selection learning model (S2-1) is performed. Is called.

このステップ(S2−1)により、複数の第1選抜学習モデルそれぞれの複数の第1判定結果及び複数の第2選抜学習モデルの複数の第1判定結果を取得することができる。   By this step (S2-1), a plurality of first determination results of each of the plurality of first selection learning models and a plurality of first determination results of the plurality of second selection learning models can be acquired.

次に、複数の第1選抜学習モデルの複数の第1判定結果及び複数の第2選抜学習モデルの複数の第1判定結果それぞれについて投票が行われ、第1選抜学習モデル及び第2選抜学習モデルごとに得票率に基づく第2判定結果を取得するステップが行われる。以下、かかるステップについて具体的に説明する。   Next, voting is performed for each of the plurality of first determination results of the plurality of first selection learning models and the plurality of first determination results of the plurality of second selection learning models, and the first selection learning model and the second selection learning model. A step of acquiring a second determination result based on the vote rate is performed every time. Hereinafter, this step will be specifically described.

まず、複数の第1選抜学習モデルの複数の第1判定結果及び複数の第2選抜学習モデルの複数の第1判定結果それぞれについて投票が行われる(S2−2)。   First, voting is performed for each of the plurality of first determination results of the plurality of first selection learning models and the plurality of first determination results of the plurality of second selection learning models (S2-2).

具体的には、得られた第1判定結果に基づいて、複数の第1選抜学習モデルは「再発あり」又は「不明」のいずれかに投票する。複数の第2選抜学習モデルは「再発なし」又は「不明」のいずれかに投票する。それぞれの投票結果は、第1選抜学習モデル及び第2選抜学習モデルごとに集計される。   Specifically, based on the obtained first determination result, the plurality of first selection learning models vote for “recurring” or “unknown”. The plurality of second selection learning models vote for “no recurrence” or “unknown”. Each voting result is totaled for each of the first selection learning model and the second selection learning model.

次に、第1選抜学習モデル及び第2選抜学習モデルごとに得票率が算出される。次いで、得票率とカットオフ値とが対照され、得票率がカットオフ値と等しいか又は上回るか否か(カットオフ値≦得票率)が判定される(S2−3)。なお、カットオフ値の詳細については後述する。   Next, a vote rate is calculated for each of the first selection learning model and the second selection learning model. Next, the vote rate is compared with the cut-off value, and it is determined whether the vote rate is equal to or exceeds the cut-off value (cut-off value ≦ voting rate) (S2-3). Details of the cutoff value will be described later.

結果として、得票率が設定されたカットオフ値と等しいか又は上回る場合(ステップ(S2-3)において「Yes」の場合)には、第1選抜学習モデルについては所定期間内の主要有害心イベントの再発を「あり」と判定する第2判定結果が取得され、また、第2選抜学習モデルについては所定期間内の主要有害心イベントの再発を「なし」と判定する第2判定結果が取得される(S2−4)。   As a result, when the vote rate is equal to or exceeds the set cut-off value (in the case of “Yes” in step (S2-3)), the primary adverse event within a predetermined period for the first selection learning model The second determination result for determining the recurrence of “Yes” is acquired, and for the second selective learning model, the second determination result for determining the recurrence of the main adverse cardiac event within the predetermined period as “No” is acquired. (S2-4).

得票率が設定されたカットオフ値よりも小さい場合(ステップ(S2−3)において「No」の場合)には、第1選抜学習モデル及び第2選抜学習モデルのいずれについても所定期間内の主要有害心イベントの再発リスクを「不明」とする第2判定結果が取得される(S2−5)。   When the vote rate is smaller than the set cut-off value (in the case of “No” in step (S2-3)), both the first selection learning model and the second selection learning model are main within a predetermined period. A second determination result with “unknown” as the risk of recurrence of an adverse heart event is acquired (S2-5).

ここで、表1を参照して、複数の第1選抜学習モデルについての複数の第1判定結果に基づく投票結果の例について説明する。   Here, an example of voting results based on a plurality of first determination results for a plurality of first selection learning models will be described with reference to Table 1.

表1は、第1選抜学習モデルにかかる得票率及び第2判定結果の例を示す表である。ここでは、3個の第1データそれぞれについて4個の第1選抜学習モデルを用いて第2判定結果を得る例について説明する。なお、この例は、第2判定結果を得るにあたり、1年以内における主要有害心イベントの再発を「あり」と判定する場合の得票率を75%(3/4)、すなわち、カットオフ値を0.75とした例である。   Table 1 is a table showing an example of the vote rate and the second determination result according to the first selection learning model. Here, an example in which the second determination result is obtained using four first selection learning models for each of the three first data will be described. In this example, in order to obtain the second determination result, the vote rate when determining that there is a recurrence of the major adverse event within one year as “Yes” is 75% (3/4), that is, the cut-off value is This is an example of 0.75.

表1に示されるとおり、この例では、第1データ(1)については、第1学習モデル(1)〜(4)のいずれも主要有害心イベントの再発を「あり」と判定したため、「あり」の得票率は100%(4/4)であり、結果として、設定されたカットオフ値を上回る(カットオフ値≦得票率)ため、第2判定結果は「あり」とされる。   As shown in Table 1, in this example, for the first data (1), since any of the first learning models (1) to (4) determined that the recurrence of the major adverse cardiac event was “Yes”, “Yes” "" Is 100% (4/4) and, as a result, exceeds the set cut-off value (cut-off value≤voting rate), the second determination result is "Yes".

第1データ(2)については、第1学習モデル(1)〜(3)が「あり」と判定し、第1学習モデル(4)は「不明」と判定したため、「あり」の得票率は75%(3/4)であり、結果として、第2判定結果は「あり」とされる。   For the first data (2), the first learning models (1) to (3) are determined to be “present”, and the first learning model (4) is determined to be “unknown”. 75% (3/4), and as a result, the second determination result is “present”.

第1データ(3)については、第1学習モデル(1)〜(3)が「不明」と判定し、第1学習モデル(4)は「あり」と判定したため、「あり」の得票率は25%(1/4)であり、設定されたカットオフ値よりも小さい(カットオフ値>得票率)ため、結果として、第2判定結果は「不明」とされる。   For the first data (3), the first learning models (1) to (3) are determined to be “unknown”, and the first learning model (4) is determined to be “present”. Since it is 25% (1/4) and smaller than the set cut-off value (cut-off value> voting rate), the second determination result is “unknown” as a result.

表1に示される例は、「あり」又は「不明」を予測する第1学習モデルにかかる例であるところ、「なし」又は「不明」を予測する第2学習モデルにかかる第2判定結果についても、表1中の第1学習モデル(1)〜(4)それぞれを第2学習モデル(1)〜(4)に置換し、第2判定結果を含め、「あり」を「なし」に反転することで同様に説明することができる。   The example shown in Table 1 is an example related to the first learning model that predicts “Yes” or “Unknown”, and the second determination result related to the second learning model that predicts “None” or “Unknown”. In Table 1, the first learning models (1) to (4) in Table 1 are replaced with the second learning models (1) to (4), and the second determination result is included and “Yes” is inverted to “No”. This can be explained similarly.

本実施形態の予測方法では、第1判定結果について投票が行われ、得票率に基づく第2判定結果を取得するステップが行われる。本実施形態では、予測精度について、用いられる学習モデルの数が増加するに従って、単体の学習モデルを用いる場合の予測性能と比較して改善する傾向がある。また、学習モデルの数が所定数に達すると、以後の学習モデルの数のさらなる増加に従って予測エラーの数が増加する傾向がある。   In the prediction method of the present embodiment, voting is performed on the first determination result, and a step of acquiring the second determination result based on the vote rate is performed. In the present embodiment, the prediction accuracy tends to improve as compared to the prediction performance when a single learning model is used as the number of learning models used increases. Further, when the number of learning models reaches a predetermined number, the number of prediction errors tends to increase as the number of learning models increases thereafter.

このことは、用いられる学習モデルの数に最適値があることを示唆している。よって、予測精度を向上させるため(予測エラーの数を低減するため)、例えば、学習モデルの数と学習モデルの数の増加に伴う予測エラーの発生数の変動を観測するなどして、予測エラーの発生数が増加する方向に変動してしまった学習モデルの数よりも、用いる学習モデルの数を少なくすることにより、予測精度の向上(予測エラーの数の低減)を図ることができる。本実施形態においては、予測エラーの発生数の増加に加えて、「再発あり」の予測と「再発なし」の予測との投票数を揃えることも考慮すると、多くとも40モデル程度ずつの第1選抜学習モデル及び第2選抜学習モデルをそれぞれ使用することが好ましい。   This suggests that there is an optimal value for the number of learning models used. Therefore, to improve prediction accuracy (to reduce the number of prediction errors), for example, by observing fluctuations in the number of learning errors and the number of occurrences of prediction errors as the number of learning models increases, By reducing the number of learning models used rather than the number of learning models that have fluctuated in the direction of increasing the number of occurrences, it is possible to improve prediction accuracy (reduce the number of prediction errors). In the present embodiment, in addition to the increase in the number of occurrences of prediction errors, taking into account the equal number of votes for the prediction of “with recurrence” and the prediction of “without recurrence”, the first model of about 40 models at most. It is preferable to use the selective learning model and the second selective learning model, respectively.

本実施形態では、カットオフ値は、より目的に適した予測を行うために適宜調整することができる。ここで、第1選抜学習モデルの得票率のカットオフ値と、第2選抜学習モデルの得票率のカットオフ値とを異なる値に設定することができる。   In the present embodiment, the cut-off value can be appropriately adjusted in order to perform prediction more suitable for the purpose. Here, the cut-off value of the vote rate of the first selection learning model and the cut-off value of the vote rate of the second selection learning model can be set to different values.

本実施形態では、主要有害心イベントが対象であるので、偽陰性、すなわち、再発なしと予測したにもかかわらず再発を起こしてしまったケースを可能な限り除外することが必要である。そこで、第1学習モデルのカットオフ値が第2学習モデルのカットオフ値よりも小さくなるように、すなわち、第2学習モデルのカットオフ値が第1学習モデルのカットオフ値よりも大きくなるように設定することで、偽陰性率をより低くすることができる。このようにすれば、より「除外診断」に適した予測方法とすることができる。   In the present embodiment, since the main adverse cardiac event is a target, it is necessary to exclude as many false negatives as possible, that is, cases in which recurrence has occurred despite prediction of no recurrence. Therefore, the cutoff value of the first learning model is made smaller than the cutoff value of the second learning model, that is, the cutoff value of the second learning model is made larger than the cutoff value of the first learning model. By setting to, the false negative rate can be further reduced. In this way, a prediction method more suitable for “exclusion diagnosis” can be achieved.

また、第1学習モデルのカットオフ値が第2学習モデルのカットオフ値よりも大きくなるように設定することで、偽陽性率をより低くすることができる。結果として、より「確定診断」に適した予測方法とすることができる。   Further, by setting the cutoff value of the first learning model to be larger than the cutoff value of the second learning model, the false positive rate can be further reduced. As a result, a prediction method more suitable for “definite diagnosis” can be obtained.

カットオフ値は、予測結果が誤りであった場合の重大性などに鑑みて適宜調整される。   The cut-off value is appropriately adjusted in view of the seriousness when the prediction result is incorrect.

本実施形態では、第1学習モデル(再発あり)の予測及び第2学習モデル(再発なし)の予測のいずれについても、投票により決定されるという性質上、カットオフ値が高すぎるといかなる第1データを適用したとしてもすべて「不明」と予測されてしまい、カットオフ値が低すぎると逆にすべて「再発あり」と予測されてしまうおそれがある。以上に鑑みると、本実施形態では、カットオフ値は、0.3〜0.7の範囲で設定することが好ましい。   In the present embodiment, both of the prediction of the first learning model (with recurrence) and the prediction of the second learning model (without recurrence) are determined by voting. Even if the data is applied, all of them are predicted as “unknown”, and if the cut-off value is too low, there is a possibility that all of them are predicted as “recurring”. In view of the above, in the present embodiment, the cutoff value is preferably set in the range of 0.3 to 0.7.

本実施形態においては、具体的には、第1学習モデルのカットオフ値を0.3〜0.6の範囲とし、第2学習モデルのカットオフ値を0.4〜0.7の範囲とすることが第1学習モデル及び第2学習モデルの投票結果の採択率に勾配を持たせる観点から好ましい。   In the present embodiment, specifically, the cutoff value of the first learning model is in the range of 0.3 to 0.6, and the cutoff value of the second learning model is in the range of 0.4 to 0.7. This is preferable from the viewpoint of providing a gradient in the acceptance rate of the voting results of the first learning model and the second learning model.

カットオフ値の評価について、図8及び図9を参照して説明する。図8及び図9は、カットオフ値の評価結果を説明するための表である。   The evaluation of the cutoff value will be described with reference to FIGS. 8 and 9 are tables for explaining the evaluation result of the cutoff value.

ここでは、全症例数が1231であるうち、陽性症例数(1年以内に主要有害心イベントを再発した患者数)が100であり、陰性症例数(1年以内に主要有害心イベントを再発しなかった患者数)が1131であるモデルを用いる例を示す。   Here, out of a total of 1231 cases, the number of positive cases (the number of patients who recurred major adverse events within one year) was 100, and the number of negative cases (the major adverse events recurred within one year). An example of using a model in which the number of patients who did not exist is 1131 is shown.

第1学習モデルのカットオフ値を0.35と設定した場合の第2学習モデルのカットオフ値の最適値を探索したところ、第2学習モデルの最適なカットオフ値は0.45であった。   When the optimum value of the cutoff value of the second learning model was searched for when the cutoff value of the first learning model was set to 0.35, the optimum cutoff value of the second learning model was 0.45. .

図8及び図9から明らかなように、第1学習モデルのカットオフ値を0.35と設定し、第2学習モデルのカットオフ値を0.45に設定した場合(図9において、P35_N45)の感度は0.77であり、特異度は0.45であった。   As is apparent from FIGS. 8 and 9, when the cutoff value of the first learning model is set to 0.35 and the cutoff value of the second learning model is set to 0.45 (in FIG. 9, P35_N45). The sensitivity was 0.77, and the specificity was 0.45.

なお、図8においては、予測結果が「不明」であったケースを非計数とした計算値が上段に示されており、下段には従来法に従った計算値が示されている。   In FIG. 8, the calculated value in which the case where the prediction result is “unknown” is not counted is shown in the upper part, and the calculated value according to the conventional method is shown in the lower part.

また、図8において、「YY」は「第1学習モデルが『再発あり』と判定し(Y)、かつ第2学習モデルが『再発なし』と判定した(Y)ケースの数を表しており、「UU」は「第1学習モデルが『不明』と判定し(U)、かつ第2学習モデルが『不明』と判定した(U)ケースの数を表している。   In FIG. 8, “YY” indicates the number of cases where “the first learning model is determined to be“ recurring ”(Y) and the second learning model is determined to be“ no recurrence ”(Y). , “UU” represents the number of cases where the first learning model is determined as “unknown” (U) and the second learning model is determined as “unknown” (U).

次に、第1選抜学習モデルの第2判定結果及び第2選抜学習モデルの第2判定結果を統合して、第3判定結果を取得するステップ(S2−6)が行われる。   Next, a step (S2-6) of acquiring a third determination result by integrating the second determination result of the first selection learning model and the second determination result of the second selection learning model is performed.

このステップ(S2−6)により、第1選抜学習モデル(第1学習モデル)の「所定期間内における主要有害心イベントの再発あり、又は不明」にかかる分類問題の第2判定結果と、第2選抜学習モデル(第2学習モデル)の「所定期間内における主要有害心イベントの再発なし、又は不明」の分類問題にかかる第2判定結果とが統合される。結果として、第1選抜学習モデルの第2判定結果と、第2選抜学習モデルの第2判定結果とが統合された第3判定結果が取得される。   By this step (S2-6), the second determination result of the classification problem relating to “there is a major adverse cardiac event reoccurring or unknown within a predetermined period” of the first selection learning model (first learning model), and the second The second determination result concerning the classification problem of “no recurrence of major adverse cardiac events within a predetermined period or unknown” in the selective learning model (second learning model) is integrated. As a result, a third determination result obtained by integrating the second determination result of the first selective learning model and the second determination result of the second selective learning model is acquired.

具体的には、例えば(1)第1選抜学習モデルにかかる第2判定結果が「主要有害心イベントの再発あり」であり、かつ第2選抜学習モデルにかかる第2判定結果が「不明」である場合には、第3判定結果は「主要有害心イベントの再発あり」とされる。また、(2)第1選抜学習モデルにかかる第2判定結果が「不明」であり、かつ第2選抜学習モデルにかかる第2判定結果が「主要有害心イベントの再発なし」である場合には、第3判定結果は「主要有害心イベントの再発なし」とされる。   Specifically, for example, (1) the second determination result relating to the first selection learning model is “there is a major adverse cardiac event reoccurring”, and the second determination result relating to the second selection learning model is “unknown” In some cases, the third determination result is “reoccurrence of major adverse cardiac event”. (2) When the second determination result concerning the first selective learning model is “unknown” and the second determination result concerning the second selective learning model is “no recurrence of major adverse cardiac events” The third determination result is “no major recurrence of adverse cardiac events”.

なお、第1選抜学習モデルにかかる第2判定結果が「主要有害心イベントの再発あり」であり、かつ第2選抜学習モデルにかかる第2判定結果が「主要有害心イベントの再発なし」である場合、及び第1選抜学習モデルにかかる第2判定結果が「不明」であり、かつ第2選抜学習モデルにかかる第2判定結果も「不明」である場合には、第3判定結果は「不明」とされる。   The second determination result related to the first selective learning model is “there is a major adverse heart event recurrence”, and the second determination result related to the second selective learning model is “there is no major adverse heart event recurrence”. And the second determination result concerning the first selection learning model is “unknown” and the second determination result concerning the second selection learning model is also “unknown”, the third determination result is “unknown” "

次に、第3判定結果に基づいて、主要有害心イベントの再発リスクを予測するステップ(S2−7)が行われる。
具体的には、既に説明したステップ(S2−6)により得られた第3判定結果に基づいて、前記(1)の場合には「所定の期間内において主要有害心イベントの再発のリスクが高い」と判定され、前記(2)の場合には「所定の期間内において主要有害心イベントの再発のリスクが低い」と判定され、前記(1)及び(2)以外の場合には、所定の期間内における主要有害心イベントの再発のリスクの判定は保留される。
Next, based on the third determination result, a step (S2-7) of predicting the recurrence risk of the main adverse cardiac event is performed.
Specifically, based on the third determination result obtained in step (S2-6) already described, in the case of (1) above, “the risk of recurrence of a major adverse cardiac event is high within a predetermined period. In the case of (2) above, it is determined that “the risk of recurrence of major adverse cardiac events is low within a predetermined period”, and in cases other than (1) and (2) above, Determination of the risk of recurrence of major adverse cardiac events within the period is pending.

既に説明したとおり、このステップ(S2−7)は、通常、コンピュータにより行われる。しかしながら、第3判定結果に基づく再発リスクの予測、再発リスクの予測に基づく通院頻度の決定などは、例えば、医師、コンサルタントなどの知見に基づいたルール定義ファイルやアルゴリズムに従った処理とすることもできる。   As already described, this step (S2-7) is usually performed by a computer. However, the prediction of recurrence risk based on the third determination result, the determination of the frequency of visit based on the prediction of recurrence risk, etc., for example, may be processing according to a rule definition file or algorithm based on knowledge of doctors, consultants, etc. it can.

既に説明した第2判定結果に基づいて、予測された再発リスクの信頼度を算出するステップ(S2−8)を実施することができる。   The step (S2-8) of calculating the reliability of the predicted relapse risk can be performed based on the second determination result already described.

具体的には、まず、第2判定結果の取得にあたり、複数の学習モデルが、例えば、「再発あり」と判定した場合には「+1」点、「再発なし」と判定した場合には「−1」点、「不明」と判定した場合には「0」点を付与し、同一の被検体にかかる全モデルについてのスコアの総和を算定し、かかる総和に対する「再発あり」のスコアの総和又は「再発なし」のスコアの総和の割合を、信頼度(%)として算出する。   Specifically, first, in acquiring the second determination result, for example, when a plurality of learning models determines that “there is recurrence”, “+1” points, and when “no recurrence” is determined, “−” If it is determined as “1” or “unknown”, “0” is given, and the sum of scores for all models for the same subject is calculated. The ratio of the total score of “no recurrence” is calculated as the reliability (%).

なお、算出される信頼度(%)の値は、−100(%)(主要有害心イベントの再発のリスクが小さい)から100(%)(主要有害心イベントの再発のリスクが大きい)までの値を取り得る。   The calculated reliability (%) values range from -100 (%) (the risk of recurrence of major adverse events is low) to 100 (%) (the risk of recurrence of major adverse events is high). Can take a value.

かかる信頼度(%)は、過去の症例に基づいて既に説明したとおり、機械学習による解析と学習に用いたデータにおける再発頻度とを紐つけして算出されているので、信頼度の指標として好適である。   As described above based on past cases, the reliability (%) is calculated by associating the analysis by machine learning and the recurrence frequency in the data used for learning, so it is suitable as an index of reliability. It is.

〔予測装置〕
本実施形態の予測方法、すなわち、前記ステップ(S1)及び(S2)は、通常、演算部を備えるコンピュータにより実行される。以下、図10及び図11を参照して、本実施形態に好適に用いることができる予測装置であるコンピュータ10の構成について、説明する。
[Prediction device]
The prediction method of the present embodiment, that is, the steps (S1) and (S2) are usually executed by a computer including a calculation unit. Hereinafter, with reference to FIG. 10 and FIG. 11, a configuration of the computer 10 that is a prediction device that can be suitably used in the present embodiment will be described.

図10は、コンピュータの構成を説明するための模式的なブロック図である。図11は、演算部の構成を説明するための模式的なブロック図である。   FIG. 10 is a schematic block diagram for explaining the configuration of the computer. FIG. 11 is a schematic block diagram for explaining the configuration of the calculation unit.

図10に示されるように、コンピュータ10は、取得されたパラメータに基づいてデータを生成したり、かかるデータを格納させるなどの命令を処理する演算部12を備えている。   As shown in FIG. 10, the computer 10 includes an arithmetic unit 12 that processes instructions such as generating data based on the acquired parameters and storing the data.

演算部12は、例えば、マイクロプロセッサ(CPU)、グラフィックプロセッサ(GPU)などに相当する機能部である。   The calculation unit 12 is a functional unit corresponding to, for example, a microprocessor (CPU), a graphic processor (GPU), or the like.

コンピュータ10は、入力されたデータ、生成されたデータ等を一時的に、あるいは所定期間記憶することができ、かつ読み出し可能な状態で格納する記憶部14をさらに備えている。   The computer 10 further includes a storage unit 14 that can store input data, generated data, and the like temporarily or for a predetermined period and store them in a readable state.

記憶部14は、例えば、メモリ(RAM)装置、ハードディスクドライブ、SSDなどに相当し、演算部12と協働するように構成される機能部である。   The storage unit 14 corresponds to, for example, a memory (RAM) device, a hard disk drive, an SSD, and the like, and is a functional unit configured to cooperate with the calculation unit 12.

記憶部14に、読み出し可能な状態で格納されて保存され得るデータの例としては、第1データ、第2データ(完全データ、部分データ、更新されたビットストリングのデータセット)、評価用データ、サポートベクターマシン、第1学習モデル、第2学習モデル、第1選抜学習モデル、第2選抜学習モデルが挙げられる。   Examples of data that can be stored and stored in the storage unit 14 in a readable state include first data, second data (complete data, partial data, updated bit string data set), evaluation data, Examples include a support vector machine, a first learning model, a second learning model, a first selection learning model, and a second selection learning model.

コンピュータ10は、外部の機能部、機器とデータをやりとりするための例えばシリアル接続、パラレル接続等のインターフェースである入出力部16などの機能部をさらに備えている。   The computer 10 further includes external functional units and functional units such as an input / output unit 16 that is an interface such as serial connection and parallel connection for exchanging data with the device.

また、コンピュータ10には、入出力部16に接続されることにより機能する、キーボード、マウスなどの入力装置22、データを視覚的に表示できる表示機器、紙媒体などに生成されたデータを出力することができるプリンター、データベースを構成する読み出し及び書き込みが可能な大容量の外部記憶装置32などのいわゆるコンピュータハードウェア資源、あるいはこれらの各構成要素に対応する専用のハードウェア資源が、コンピュータ10が備える機能部と協働するように接続される構成とすることもできる。   In addition, the computer 10 outputs data generated on an input device 22 such as a keyboard and a mouse, a display device capable of visually displaying data, a paper medium, and the like, which functions when connected to the input / output unit 16. The computer 10 includes a so-called computer hardware resource such as a printer capable of reading and writing, a large-capacity external storage device 32 that can read and write, or a dedicated hardware resource corresponding to each of these components. It can also be set as the structure connected so that it may cooperate with a function part.

具体的には、例えば、既に説明した第1データについてのデータベースと第2データについてのデータベースとを格納する外部記憶装置、あるいは第1データをデータベースとして格納するハードウェア資源と第2データをデータベースとして格納するハードウェア資源とをそれぞれ別体の外部記憶装置として構成し、これらを既に説明したコンピュータの設置地から物理的に離間した遠隔地に設置し、これらを電気通信回線により協働可能なように接続するように構成してもよい。   Specifically, for example, the external storage device that stores the database for the first data and the database for the second data that have already been described, or the hardware resource that stores the first data as the database and the second data as the database The hardware resources to be stored are configured as separate external storage devices, installed in remote locations that are physically separated from the computer installation locations described above, and can cooperate with each other by electric communication lines. You may comprise so that it may connect to.

ここで「電気通信回線により接続されている」とは、電気、光等の媒体による有線または無線による情報回線により、データ、制御信号等をやりとりすることができるように接続して、接続された機器が協働できるように構成されていることを意味している。   Here, “connected by telecommunication line” means connected by connecting data, control signals, etc. via a wired or wireless information line using a medium such as electricity or light. This means that the devices are configured to work together.

本実施形態の予測方法を実施するための予測装置は、単体のコンピュータで構成されていても、複数のコンピュータ(サーバ、操作端末なども含む。)及びその他の周辺機器が電気通信回線により一体的に接続されたシステムとして構成されていてもよい。   Even if the prediction device for carrying out the prediction method of the present embodiment is composed of a single computer, a plurality of computers (including servers, operation terminals, etc.) and other peripheral devices are integrated by an electric communication line. It may be configured as a system connected to.

また、上述した実施形態で説明した各処理のうち、自動的に行なわれるものとして説明した処理の全部または一部を手動的に行うこともでき、手動的に行なわれるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。その他、上述の説明及び図面で示した処理手順、制御手順、具体的名称、各種のデータ、パラメータを含む情報、画面例、データベースの構成については、特記する場合を除いて任意に変更することができる。   In addition, among the processes described in the above-described embodiments, all or part of the processes described as being automatically performed can be manually performed, or all of the processes described as being performed manually are performed. Alternatively, a part can be automatically performed by a known method. In addition, the processing procedures, control procedures, specific names, various data, information including parameters, screen examples, and database configurations shown in the above description and drawings may be arbitrarily changed unless otherwise specified. it can.

本実施形態の予測装置は、所定期間内における主要有害心イベントの再発リスクを予測する予測装置である。   The prediction device of this embodiment is a prediction device that predicts the recurrence risk of a major adverse cardiac event within a predetermined period.

より具体的には、予測装置は、被検体から採取された試験試料を用いて測定されたか、又は被検体から得られた指標パラメータであって、C反応性タンパク質量、Dダイマー量、HDL−コレステロール量、LDL−コレステロール量、プロトロンビン時間(国際標準比(INR))、γ−グルタミルトランスペプチターゼ量、アスパラギン酸アミノトランスフェラーゼ量、アミラーゼ量、アラニンアミノトランスフェラーゼ量、アルカリホスファターゼ量、アルブミン量、アンチトロンビン量、グリコヘモグロビン量、クロール量、トリグリセリド量、フィブリノゲン量、フィブリン/フィブリノゲン分解産物量、活性化部分トロンボプラスチン時間、血清クレアチニン量、血中尿素窒素量、血糖量、総コレステロール量、総ビルビリン量、単球数、直接ビリルビン量、乳酸脱水素酵素(LDH)量、尿酸量、pH、カリウム量、カルシウム量、ナトリウム量、赤血球数、ヘマトクリット値、ヘモグロビン量、リンパ球数、血小板数、好塩基球数、好酸球数、好中球数、性別、糖尿病既往歴、高血圧症既往歴、脂質異常症既往歴、喫煙習慣の有無、貧血の有無、急性心筋梗塞の既往歴、冠動脈形成術(PCI)を必要とした狭心症の既往歴、心不全の既往歴、アブレーション治療を必要とした心房細動の既往歴、脳梗塞の既往歴、末梢動脈疾患の既往歴、大動脈解離の既往歴、透析、年齢、身長、体重、心拍数、尿たんぱく(定性)、尿糖(定性)、入院理由及び入院時現症からなる群より選択頻度に基づいて選択される2種以上の指標パラメータに基づく第1データを生成して取得する第1データ生成取得部と、第1データ生成取得部が取得した前記第1データを、複数の第2データを含むデータ群に基づいて構築された学習モデルで処理して、所定期間内における主要有害心イベントの再発リスクを予測する予測部とを備える。   More specifically, the prediction apparatus is an index parameter measured using a test sample collected from a subject or obtained from a subject, and includes C-reactive protein amount, D-dimer amount, HDL- Cholesterol level, LDL-cholesterol level, prothrombin time (international standard ratio (INR)), γ-glutamyl transpeptidase level, aspartate aminotransferase level, amylase level, alanine aminotransferase level, alkaline phosphatase level, albumin level, antithrombin level Amount, glycohemoglobin amount, crawl amount, triglyceride amount, fibrinogen amount, fibrin / fibrinogen degradation product amount, activated partial thromboplastin time, serum creatinine amount, blood urea nitrogen amount, blood glucose level, total cholesterol level, total bilbilin level Monocyte count, direct bilirubin level, lactate dehydrogenase (LDH) level, uric acid level, pH, potassium level, calcium level, sodium level, red blood cell count, hematocrit level, hemoglobin level, lymphocyte count, platelet count, basophil Count, eosinophil count, neutrophil count, sex, history of diabetes, history of hypertension, history of dyslipidemia, smoking habits, presence of anemia, history of acute myocardial infarction, coronary angioplasty (PCI) ) History of angina pectoris, history of heart failure, history of atrial fibrillation requiring ablation treatment, history of cerebral infarction, history of peripheral arterial disease, history of aortic dissection, dialysis Based on two or more index parameters selected based on the selection frequency from the group consisting of age, height, weight, heart rate, urinary protein (qualitative), urine sugar (qualitative), reason for hospitalization, and oncology Generate 1 data A first data generation / acquisition unit to be obtained and the first data acquired by the first data generation / acquisition unit are processed by a learning model constructed based on a data group including a plurality of second data, and within a predetermined period A predictor for predicting the risk of recurrence of major adverse cardiac events.

図11に示されるように、本実施形態の予測装置100は、既に説明した演算部12において相互に協働して機能する複数の機能部を含んでいる。本実施形態の予測装置100は、第1データ生成取得部12a、第2データ生成取得部12b、学習モデル構築部12d、学習モデル選抜部12e、第1判定結果生成取得部12f、第2判定結果生成取得部12g、第3判定結果生成取得部12h及び予測部12iを備えている。   As illustrated in FIG. 11, the prediction device 100 of the present embodiment includes a plurality of functional units that function in cooperation with each other in the arithmetic unit 12 that has already been described. The prediction device 100 of the present embodiment includes a first data generation acquisition unit 12a, a second data generation acquisition unit 12b, a learning model construction unit 12d, a learning model selection unit 12e, a first determination result generation acquisition unit 12f, and a second determination result. A generation acquisition unit 12g, a third determination result generation acquisition unit 12h, and a prediction unit 12i are provided.

本発明の一実施形態の予測装置100は、被検体から採取された試験試料を用いて測定されたか、又は被検体から得られた2以上の指標パラメータを取得し、該指標パラメータに基づいて第1データを生成して取得する第1データ生成取得部12aと、第1データ生成取得部12aが取得した第1データを、第1選抜学習モデル及び第2選抜学習モデルにより処理し、該第1選抜学習モデル及び第2選抜学習モデルごとに第1判定結果を生成して取得する第1判定結果生成取得部12fと、第1判定結果生成取得部12fが取得した複数の第1選抜学習モデルの複数の第1判定結果及び複数の第2選抜学習モデルの複数の第1判定結果に基づいて、第2判定結果を生成して取得する第2判定結果生成取得部12gと、第2判定結果生成取得部12gが取得した第1選抜学習モデルの第2判定結果及び第2選抜学習モデルの第2判定結果を統合して、第3判定結果を生成して取得する第3判定結果生成取得部12hと、第3判定結果生成取得部12hが取得した第3判定結果に基づいて、主要有害心イベントの再発リスクを予測する予測部12iとを備えている。   The prediction apparatus 100 according to an embodiment of the present invention acquires two or more index parameters measured using a test sample collected from a subject or obtained from a subject, and performs a first measurement based on the index parameter. The first data generation / acquisition unit 12a that generates and acquires one data and the first data acquired by the first data generation / acquisition unit 12a are processed by the first selection learning model and the second selection learning model, and the first data A first determination result generation acquisition unit 12f that generates and acquires a first determination result for each of the selection learning model and the second selection learning model, and a plurality of first selection learning models acquired by the first determination result generation acquisition unit 12f. Based on a plurality of first determination results and a plurality of first determination results of a plurality of second selection learning models, a second determination result generation acquisition unit 12g that generates and acquires a second determination result, and a second determination result generation Acquisition department A third determination result generation acquisition unit 12h that generates and acquires a third determination result by integrating the second determination result of the first selection learning model acquired by 2g and the second determination result of the second selection learning model; And a prediction unit 12i that predicts the recurrence risk of the main adverse heart event based on the third determination result acquired by the third determination result generation acquisition unit 12h.

別の一実施形態の予測装置100は、所定期間内に主要有害心イベントを再発したか、又は再発しなかった複数の被検体についての複数の指標パラメータからなる群から選択された2種以上の該指標パラメータに基づく第2データを生成して取得する第2データ生成取得部12bと、第2データ生成取得部12bから取得した第2データに基づいて、主要有害心イベントの再発あり又は不明を予測する複数の第1学習モデル、及び前記主要有害心イベントの再発なし又は不明を予測する複数の第2学習モデルを構築する学習モデル構築部12dと、学習モデル構築部12dが構築した複数の第1学習モデル及び複数の第2学習モデルごとに、複数の第1選抜学習モデル、及び複数の第2選抜学習モデルを選抜する学習モデル選抜部12eとをさらに含むことが好ましい。   The prediction apparatus 100 according to another embodiment includes two or more types selected from the group consisting of a plurality of index parameters for a plurality of subjects who have recurred or did not recur a major adverse cardiac event within a predetermined period. Based on the second data acquired from the second data generation / acquisition unit 12b that generates and acquires the second data based on the index parameter, the presence or absence of the recurrence of the major adverse heart event is determined. A plurality of first learning models to be predicted and a plurality of second learning models to predict whether there is no recurrence or unknown of the major adverse heart event, and a plurality of first models constructed by the learning model building unit 12d A learning model selection unit 12e that selects a plurality of first selection learning models and a plurality of second selection learning models for each learning model and a plurality of second learning models. It is preferable to include in La.

さらに別の一実施形態の予測装置100においては、第2データ生成取得部12bが、複数の指標パラメータについて取捨選択を行い、部分データを生成することにより、複数の部分データ及び部分データの生成に用いられた完全データ(症例データ)を含み得る第2データを生成する機能部であることが好ましい。   In the prediction device 100 of yet another embodiment, the second data generation / acquisition unit 12b selects a plurality of index parameters and generates partial data, thereby generating a plurality of partial data and partial data. It is preferable that it is a function part which produces | generates the 2nd data which may contain the used complete data (case data).

さらにまた別の一実施形態の予測装置100においては、学習モデル構築部12dが、第2データ生成取得部12bから取得した第2データを複数のデータ群に分割し、該データ群それぞれを教師データとして用い、かつ複数の該データ群ごとに異なる複数のパラメータ条件で行われる機械学習により、複数の第1学習モデル及び複数の第2学習モデルを構築する機能部であることが好ましい。   In the prediction apparatus 100 according to yet another embodiment, the learning model construction unit 12d divides the second data acquired from the second data generation acquisition unit 12b into a plurality of data groups, and each of the data groups is teacher data. And a functional unit that constructs a plurality of first learning models and a plurality of second learning models by machine learning performed under a plurality of parameter conditions that differ for each of the plurality of data groups.

また別の一実施形態の予測装置100においては、第2判定結果生成取得部12gが、複数の第1選抜学習モデルの複数の第1判定結果及び複数の第2選抜学習モデルの複数の第1判定結果について投票を行い、第1選抜学習モデル及び第2選抜学習モデルごとに得票率に基づく第2判定結果を生成して取得する機能部であることが好ましい。   In the prediction apparatus 100 according to another embodiment, the second determination result generation acquisition unit 12g includes a plurality of first determination results of the plurality of first selection learning models and a plurality of first of the plurality of second selection learning models. It is preferable that the function unit performs voting on the determination result, and generates and acquires the second determination result based on the vote rate for each of the first selection learning model and the second selection learning model.

〔プログラム及びプログラムが記録された記憶媒体〕
本発明は、既に説明した本実施形態の予測方法を実施するためのプログラム及びプログラムが記録された記憶媒体にも関する。
[Program and storage medium on which the program is recorded]
The present invention also relates to a program for executing the prediction method of the present embodiment described above and a storage medium on which the program is recorded.

ここで、「プログラム」とは任意の言語や記述方法にて記述されたデータ処理方法であり、ソースコード、バイナリコードなどの形式を問わない。なお、「プログラム」は、必ずしも単一的に構成されるものに限られず、複数のモジュールやライブラリとして分散構成されていてもよく、OS(Operating System)に代表される別個のプログラムと協働してその機能を達成するものを含む。   Here, the “program” is a data processing method described in an arbitrary language or description method, and may be in any format such as source code or binary code. The “program” is not necessarily limited to a single configuration, and may be distributed as a plurality of modules and libraries, and cooperates with a separate program represented by an OS (Operating System). Including those that achieve their functions.

なお、プログラムは、通常、既に説明した記憶部14に準じた記録媒体に記録されており、必要に応じて予測方法を実施するコンピュータに読み取られる。記録媒体に記録されたプログラムを各装置で読み取るための具体的な構成、読み取り手順、読み取り後のインストール手順などについては、周知の構成及び手順を用いることができる。   Note that the program is normally recorded on a recording medium according to the storage unit 14 already described, and is read by a computer that performs the prediction method as necessary. As a specific configuration for reading a program recorded in a recording medium by each device, a reading procedure, an installation procedure after reading, and the like, a well-known configuration and procedure can be used.

また、「記録媒体」は、任意の「可搬の物理媒体」、任意の「固定用の物理媒体」、「通信媒体」を含む。なお、「可搬の物理媒体」とはフレキシブルディスク、光磁気ディスク、ROM、EPROM、EEPROM、CD−ROM、MO、DVDなどである。「固定用の物理媒体」とは、各種コンピュータシステムに内蔵されるROM、RAM、ハードディスクドライブなどである。「通信媒体」は、LAN、WAN、インターネットなどのネットワークを介してプログラムを送信する場合における通信回線や搬送波のように、短期間、プログラムを保持する。   The “recording medium” includes any “portable physical medium”, any “fixed physical medium”, and “communication medium”. The “portable physical medium” is a flexible disk, a magneto-optical disk, a ROM, an EPROM, an EEPROM, a CD-ROM, an MO, a DVD, or the like. The “fixed physical medium” is a ROM, a RAM, a hard disk drive or the like built in various computer systems. The “communication medium” holds the program for a short period of time like a communication line or a carrier wave in the case of transmitting the program via a network such as a LAN, WAN, or the Internet.

本発明の一実施形態のプログラムは、演算部12を備えるコンピュータ10により実行される下記のステップを含む、所定期間内における主要有害心イベントの再発リスクを予測するためのプログラムであって、演算部12が、被検体から採取された試験試料を用いて測定されたか、又は被検体から得られた指標パラメータであって、C反応性タンパク質量、Dダイマー量、HDL−コレステロール量、LDL−コレステロール量、プロトロンビン時間(国際標準比(INR))、γ−グルタミルトランスペプチターゼ量、アスパラギン酸アミノトランスフェラーゼ量、アミラーゼ量、アラニンアミノトランスフェラーゼ量、アルカリホスファターゼ量、アルブミン量、アンチトロンビン量、グリコヘモグロビン量、クロール量、トリグリセリド量、フィブリノゲン量、フィブリン/フィブリノゲン分解産物量、活性化部分トロンボプラスチン時間、血清クレアチニン量、血中尿素窒素量、血糖量、総コレステロール量、総ビルビリン量、単球数、直接ビリルビン量、乳酸脱水素酵素(LDH)量、尿酸量、pH、カリウム量、カルシウム量、ナトリウム量、赤血球数、ヘマトクリット値、ヘモグロビン量、リンパ球数、血小板数、好塩基球数、好酸球数、好中球数、性別、糖尿病既往歴、高血圧症既往歴、脂質異常症既往歴、喫煙習慣の有無、貧血の有無、急性心筋梗塞の既往歴、冠動脈形成術(PCI)を必要とした狭心症の既往歴、心不全の既往歴、アブレーション治療を必要とした心房細動の既往歴、脳梗塞の既往歴、末梢動脈疾患の既往歴、大動脈解離の既往歴、透析、年齢、身長、体重、心拍数、尿たんぱく(定性)、尿糖(定性)、入院理由及び入院時現症からなる群より選択頻度に基づいて選択される2種以上の指標パラメータに基づく第1データを取得するステップと、演算部12が、第1データを、複数の第2データを含むデータ群に基づいて構築された学習モデルで処理して、再発リスクを予測するステップとを含む。   A program according to an embodiment of the present invention is a program for predicting a recurrence risk of a major adverse cardiac event within a predetermined period, including the following steps executed by a computer 10 including a calculation unit 12. 12 is an index parameter measured using a test sample collected from the subject or obtained from the subject, the amount of C-reactive protein, the amount of D-dimer, the amount of HDL-cholesterol, the amount of LDL-cholesterol , Prothrombin time (international standard ratio (INR)), γ-glutamyl transpeptidase level, aspartate aminotransferase level, amylase level, alanine aminotransferase level, alkaline phosphatase level, albumin level, antithrombin level, glycohemoglobin level, crawl Amount, triglyceres Level, fibrinogen level, fibrin / fibrinogen degradation product level, activated partial thromboplastin time, serum creatinine level, blood urea nitrogen level, blood glucose level, total cholesterol level, total bilbilin level, monocyte count, direct bilirubin level, lactate dehydration Elementary enzyme (LDH) level, uric acid level, pH, potassium level, calcium level, sodium level, red blood cell count, hematocrit level, hemoglobin level, lymphocyte count, platelet count, basophil count, eosinophil count, neutrophil Number, sex, history of diabetes, history of hypertension, history of dyslipidemia, presence of smoking, presence of anemia, history of acute myocardial infarction, history of angina requiring coronary angioplasty (PCI) History, history of heart failure, history of atrial fibrillation requiring ablation treatment, history of cerebral infarction, history of peripheral arterial disease, history of aortic dissection, dialysis, year First based on two or more index parameters selected from the group consisting of age, height, weight, heart rate, urinary protein (qualitative), urine sugar (qualitative), reason for hospitalization, and oncology at the time of hospitalization The step of acquiring data, and the calculating part 12 process the 1st data with the learning model constructed | assembled based on the data group containing several 2nd data, and the step which estimates a recurrence risk.

本発明の他の一実施形態のプログラムにおいては、第2データは所定期間内における主要有害心イベントの再発歴を指標パラメータとして含むデータであり、かつ第2データは、C反応性タンパク質量、Dダイマー量、HDL−コレステロール量、LDL−コレステロール量、プロトロンビン時間(国際標準比(INR))、γ−グルタミルトランスペプチターゼ量、アスパラギン酸アミノトランスフェラーゼ量、アミラーゼ量、アラニンアミノトランスフェラーゼ量、アルカリホスファターゼ量、アルブミン量、アンチトロンビン量、グリコヘモグロビン量、クロール量、トリグリセリド量、フィブリノゲン量、フィブリン/フィブリノゲン分解産物量、活性化部分トロンボプラスチン時間、血清クレアチニン量、血中尿素窒素量、血糖量、総コレステロール量、総ビルビリン量、単球数、直接ビリルビン量、乳酸脱水素酵素(LDH)量、尿酸量、pH、カリウム量、カルシウム量、ナトリウム量、赤血球数、ヘマトクリット値、ヘモグロビン量、リンパ球数、血小板数、好塩基球数、好酸球数、好中球数、性別、糖尿病既往歴、高血圧症既往歴、脂質異常症既往歴、喫煙習慣の有無、貧血の有無、急性心筋梗塞の既往歴、冠動脈形成術(PCI)を必要とした狭心症の既往歴、心不全の既往歴、アブレーション治療を必要とした心房細動の既往歴、脳梗塞の既往歴、末梢動脈疾患の既往歴、大動脈解離の既往歴、透析、年齢、身長、体重、心拍数、尿たんぱく(定性)、尿糖(定性)、入院理由及び入院時現症からなる群よりさらに選択される1種以上の指標パラメータに基づくデータであることが好ましい。   In the program according to another embodiment of the present invention, the second data is data including a history of recurrence of major adverse cardiac events within a predetermined period as an index parameter, and the second data is C-reactive protein amount, D Dimer amount, HDL-cholesterol amount, LDL-cholesterol amount, prothrombin time (international standard ratio (INR)), γ-glutamyl transpeptidase amount, aspartate aminotransferase amount, amylase amount, alanine aminotransferase amount, alkaline phosphatase amount, Albumin level, antithrombin level, glycohemoglobin level, chlor level, triglyceride level, fibrinogen level, fibrin / fibrinogen degradation product level, activated partial thromboplastin time, serum creatinine level, blood urea nitrogen level, blood glucose level Total cholesterol level, total bilbilin level, monocyte count, direct bilirubin level, lactate dehydrogenase (LDH) level, uric acid level, pH, potassium level, calcium level, sodium level, red blood cell count, hematocrit level, hemoglobin level, lymphocytes Count, platelet count, basophil count, eosinophil count, neutrophil count, gender, history of diabetes, history of hypertension, history of dyslipidemia, smoking habit, presence of anemia, acute myocardial infarction Medical history, history of angina pectoris requiring coronary angioplasty (PCI), history of heart failure, history of atrial fibrillation requiring ablation treatment, history of cerebral infarction, history of peripheral arterial disease One or more indicators selected from the group consisting of: history of aortic dissection, dialysis, age, height, weight, heart rate, urinary protein (qualitative), urine sugar (qualitative), hospitalization reason and on-hospital disease Based on parameters It is preferable that the data.

本発明の他の一実施形態のプログラムにおいては、第1データ及び前記第2データが、心筋マーカーに由来する指標パラメータをさらに含む群から選択される指標パラメータに基づくデータであることが好ましい。   In a program according to another embodiment of the present invention, it is preferable that the first data and the second data are data based on an index parameter selected from a group further including an index parameter derived from a myocardial marker.

本発明のまた他の一実施形態のプログラムにおいては、心筋マーカーが、クレアチンキナーゼMB、ヒト心臓型脂肪酸結合タンパク質、心筋トロポニンI、心筋トロポニンT、脳性ナトリウム利尿ペプチド、プロ脳性ナトリウム利尿ペプチド又はその切断産物、ミエロペルオキシダーゼ、胎盤増殖因子、推算糸球体濾過量、ホモシステイン、虚血修飾アルブミン、可溶性CD40リガンド、リポタンパク質関連ホスホリパーゼA2、コリン、及び高感度C反応性タンパク質からなる群から選択される1種以上であることが好ましい。   In another embodiment of the present invention, the myocardial marker is creatine kinase MB, human cardiac fatty acid binding protein, cardiac troponin I, cardiac troponin T, brain natriuretic peptide, pro-brain natriuretic peptide or its cleavage. 1 selected from the group consisting of product, myeloperoxidase, placental growth factor, estimated glomerular filtration rate, homocysteine, ischemia modified albumin, soluble CD40 ligand, lipoprotein-related phospholipase A2, choline, and sensitive C-reactive protein It is preferable that it is a seed or more.

本発明のさらにまた他の一実施形態のプログラムにおいては、第1データ及び前記第2データが、心電図に由来する指標パラメータをさらに含む群から選択される指標パラメータに基づくデータであることが好ましい。   In a program according to still another embodiment of the present invention, the first data and the second data are preferably data based on an index parameter selected from a group further including an index parameter derived from an electrocardiogram.

本発明のまた他の一実施形態のプログラムにおいては、心電図に由来する指標パラメータが、P波の高さ、R波の間隔、PQ時間、R波の高さ、QRS幅、ST部分の変化量、T波の高さ、及び心電図をフーリエ変換して得られるパワースペクトルからなる群から選択されることが好ましい。   In the program according to still another embodiment of the present invention, the index parameter derived from the electrocardiogram includes P wave height, R wave interval, PQ time, R wave height, QRS width, and ST portion change amount. The height of the T wave and the power spectrum obtained by Fourier transforming the electrocardiogram are preferably selected.

本発明のさらにまた他の一実施形態のプログラムにおいては、試験試料が、血液又は血液由来試料であることが好ましい。   In a program according to still another embodiment of the present invention, the test sample is preferably blood or a blood-derived sample.

本発明のまた他の一実施形態のプログラムにおいては、主要有害心イベントが、急性心筋梗塞、冠血行再建術が施術された狭心症、入院を要した心不全、心房細動、脳卒中、又は循環器を理由とする死亡であることが好ましい。   In a program of yet another embodiment of the invention, the major adverse cardiac event is acute myocardial infarction, angina with coronary revascularization, heart failure requiring hospitalization, atrial fibrillation, stroke, or circulation Preferably, the death is due to a vessel.

本発明のさらにまた他の一実施形態のプログラムにおいては、主要有害心イベントの再発リスクを予測するステップが、第2データを複数のデータ群に分割し、該データ群それぞれを教師データとして用い、かつ複数の該データ群ごとに異なる複数のパラメータ条件で行われる機械学習により、主要有害心イベントの再発があるか又は不明であるかを予測する複数の第1学習モデル、及び主要有害心イベントの再発がないか又は不明であるかを予測する複数の第2学習モデルを構築するステップをさらに含み、第1データを、前記第1学習モデル及び第2学習モデルにより処理して、所定期間内における主要有害心イベントの再発リスクを予測するステップであることが好ましい。   In a program according to still another embodiment of the present invention, the step of predicting the recurrence risk of a major adverse cardiac event divides the second data into a plurality of data groups, and each of the data groups is used as teacher data. And a plurality of first learning models for predicting whether a major adverse cardiac event is recurring or unknown by machine learning performed under a plurality of different parameter conditions for each of the plurality of data groups, and Further comprising the step of constructing a plurality of second learning models for predicting whether there is no recurrence or unknown, wherein the first data is processed by the first learning model and the second learning model and within a predetermined period Preferably, the step is predicting the risk of recurrence of a major adverse cardiac event.

本発明のまた他の一実施形態のプログラムにおいては、主要有害心イベントの再発リスクを予測するステップが、複数の第1学習モデル及び複数の第2学習モデルごとに、感度及び陽性的中率に基づいて複数の第1選抜学習モデル、及び複数の第2選抜学習モデルを選抜するステップをさらに含み、第1データを、第1選抜学習モデル及び第2選抜学習モデルにより処理して、所定期間内における主要有害心イベントの再発リスクを予測するステップであることが好ましい。   In a program according to another embodiment of the present invention, the step of predicting the risk of recurrence of a major adverse cardiac event is performed with sensitivity and positive predictive value for each of a plurality of first learning models and a plurality of second learning models. A step of selecting a plurality of first selection learning models and a plurality of second selection learning models based on the first data, and processing the first data by the first selection learning model and the second selection learning model within a predetermined period Preferably, the step is predicting the recurrence risk of major adverse heart events in

本発明のさらにまた他の一実施形態のプログラムにおいては、主要有害心イベントの再発リスクを予測するステップが、第1データを、第1選抜学習モデル及び第2選抜学習モデルにより処理し、第1選抜学習モデル及び第2選抜学習モデルごとに第1判定結果を取得し、該第1判定結果について投票を行い、第1選抜学習モデル及び第2選抜学習モデルごとに得票率に基づく第2判定結果を取得し、第1選抜学習モデルの第2判定結果及び第2選抜学習モデルの第2判定結果を統合して、第3判定結果を取得し、該第3判定結果に基づいて、所定期間内における主要有害心イベントの再発リスクを予測するステップであることが好ましい。   In a program according to still another embodiment of the present invention, the step of predicting the risk of recurrence of a major adverse cardiac event processes the first data using a first selection learning model and a second selection learning model, The first determination result is acquired for each of the selection learning model and the second selection learning model, the first determination result is voted, and the second determination result based on the vote rate for each of the first selection learning model and the second selection learning model. , The second determination result of the first selection learning model and the second determination result of the second selection learning model are integrated to acquire a third determination result, and within a predetermined period based on the third determination result Preferably, the step is predicting the recurrence risk of major adverse heart events in

〔実施例〕
以下、本発明を詳細に説明するために実施例を示す。本発明は下記の実施例に限定されない。
〔Example〕
Examples are given below to explain the present invention in detail. The present invention is not limited to the following examples.

<実施例1>(データの調製及び学習モデルの構築)
(1)被検体及び指標パラメータの収集
2012年9月20日から2014年11月28までの期間中に、発症48時間以内の急性心筋梗塞(AMI)、冠動脈形成術(PCI)を必要とした狭心症(AP)、心不全(HF)、アブレーション治療を必要とした心房細動(AF)および脳梗塞(CI)のうちのいずれかを理由として入院した患者2273名を被検体(群)とした。
<Example 1> (Data preparation and learning model construction)
(1) Collection of subjects and index parameters During the period from September 20, 2012 to November 28, 2014, acute myocardial infarction (AMI) and coronary angioplasty (PCI) within 48 hours of onset were required. 2273 patients hospitalized because of angina pectoris (AP), heart failure (HF), atrial fibrillation (AF) requiring ablation treatment, or cerebral infarction (CI) did.

入院後365日時点までの循環器系の疾患による死亡(cardiac death)、心筋梗塞(mi)、脳卒中(stroke)、及び心不全(hf)のいずれかの発症をMACEの再発と定義し、予測目標をMACEの再発の有無とした。   Predictive goal by defining any occurrence of cardiovascular disease, cardiovascular infarction (mi), stroke (stroke), or heart failure (hf) as a recurrence of MACE until 365 days after admission Was the presence or absence of recurrence of MACE.

被検体について、指標パラメータを収集して第1データを構成した。用いられた指標パラメータを下記表2−1及び2−2に示す。   For the subject, index parameters were collected to construct first data. The index parameters used are shown in Tables 2-1 and 2-2 below.

被検体の入院日を基準として、2013年10月1日の前後で被検体群(対応する第1データ群)を2群に分割した。具体的には、入院日が2013年9月30日以前である1659例を学習モデル構築用のデータ群(development cohort)とし、入院日が2013年10月1日以後である614例を評価用のデータ群(validation cohort)とした。   The subject group (corresponding first data group) was divided into two groups before and after October 1, 2013 on the basis of the hospitalization date of the subject. Specifically, 1659 cases whose hospital admission date is before September 30, 2013 are taken as a data group for development of a learning model (development cohort), and 614 patients whose hospital admission date is after October 1, 2013 are used for evaluation. Data group (validation cohort).

結果として、学習モデル構築用のデータ群のうちの102例、評価用のデータ群のうちの56例が「再発あり」に該当していた。   As a result, 102 cases in the learning model construction data group and 56 cases in the evaluation data group corresponded to “with recurrence”.

(2)部分データの生成
まず、上記(1)の学習モデル構築用のデータ群を、第1分割データ群及び第2分割データ群の2つのデータ群にさらに分割した。ここで、第1分割データ群及び第2分割データ群(評価用データ群)に含まれるデータの数の割合が、第1分割データ群:第2分割データ群=6:4になるように分割した。
(2) Generation of partial data First, the data group for constructing the learning model in (1) was further divided into two data groups, a first divided data group and a second divided data group. Here, the division is performed so that the ratio of the number of data included in the first divided data group and the second divided data group (evaluation data group) is first divided data group: second divided data group = 6: 4. did.

次いで、第1分割データ群を用いて、400パターンの部分データをランダムに生成した。   Next, partial data of 400 patterns was randomly generated using the first divided data group.

部分データの生成は、下記のとおり行った。
(i)第1分割データ群に属するデータ(完全データ)から、指標パラメータの一部(列)を削除した。なお、IDと期間内のMACEの再発の有無に関する指標パラメータはすべての部分データで維持した。
(ii)次に、指標パラメータの一部が削除されたデータから、さらに症例データのうちの一部(行)を削除した。
(iii)上記(i)の処理と上記(ii)の処理を繰り返して、複数の異なる部分データを生成した。部分データにおける指標パラメータの組み合わせ、及び症例データの組み合わせはビットストリングとして記述し、一次元の情報として管理した。得られた部分データをもとの第1分割データ群に含めて第2データとして得た。
The generation of partial data was performed as follows.
(I) A part (column) of the index parameter is deleted from the data (complete data) belonging to the first divided data group. Note that the index parameters for the ID and the presence or absence of recurrence of MACE within the period were maintained in all partial data.
(Ii) Next, a part (row) of the case data was further deleted from the data from which a part of the index parameter was deleted.
(Iii) A plurality of different partial data were generated by repeating the process (i) and the process (ii). The combination of index parameters and the combination of case data in the partial data were described as bit strings and managed as one-dimensional information. The obtained partial data was included in the original first divided data group to obtain second data.

(3)機械学習による学習モデルの構築
得られた第2データを教師データとして用いる機械学習を行うことにより複数の学習モデルを構築した。機械学習にはSVM(e1071パッケージ)を用い、カーネル関数としてRBFカーネルを用いた。識別境界線の複雑さを調節するパラメータγは0.01とした。SVMにおけるソフトマージンの許容パラメータCは100に固定した。結果として、総数400の学習モデルを構築した。
(3) Construction of learning model by machine learning A plurality of learning models were constructed by performing machine learning using the obtained second data as teacher data. SVM (e1071 package) was used for machine learning, and an RBF kernel was used as a kernel function. The parameter γ for adjusting the complexity of the identification boundary line was set to 0.01. The soft margin allowable parameter C in the SVM is fixed at 100. As a result, a total of 400 learning models were constructed.

(4)構築された学習モデルによる予測性能の評価
上記(2)の第2分割データ群を用いて、すべての学習モデルの予測結果を評価した。それぞれの学習モデルの予測結果はパレートランクにより評価した。具体的には、既に説明した目的関数O及びOによる評価値(O,1/O)を得て、かかる評価値に基づいて感度及び陽性的中率を指標とするパレートランクにより学習モデルを評価した。
(4) Evaluation of prediction performance by constructed learning model Using the second divided data group of (2) above, the prediction results of all learning models were evaluated. The prediction results of each learning model were evaluated by Pareto rank. Specifically, the evaluation values (O 1 , 1 / O 2 ) based on the objective functions O 1 and O 2 described above are obtained, and based on the evaluation values, the Pareto rank with the sensitivity and the positive median as indexes. The learning model was evaluated.

(5)学習モデル(選抜学習モデル)の選抜
得られた評価結果に基づいて、評価値(O,1/O)がより小さい、すなわち感度及び陽性的中率がいずれも高い学習モデルを選抜学習モデルとして選抜した。具体的には、感度が0.7以上であり、かつ陽性的中率が0.7以上である学習モデルを選抜学習モデルとして選抜した。結果として、総数40の選抜学習モデルが選抜された。
(5) Selection of learning model (selected learning model) Based on the obtained evaluation results, a learning model having a smaller evaluation value (O 1 , 1 / O 2 ), that is, a higher sensitivity and a positive predictive value. Selected as a selection learning model. Specifically, a learning model having a sensitivity of 0.7 or more and a positive predictive value of 0.7 or more was selected as a selection learning model. As a result, a total of 40 selection learning models were selected.

なお、併せて、選抜学習モデルを構築することができた総数40の第2データ(ビットストリング)を選抜した。   In addition, a total of 40 second data (bit strings) for which a selection learning model could be constructed was selected.

(6)遺伝的アルゴリズムを用いる第2データの最適化
非優越ソート遺伝的アルゴリズム(NSGA; Elitist Non−Dominated Sorting Genetic Algorithm)を用い、既に説明した手法により第2データを最適化して更新した。具体的には、上記(5)において選抜されたビットストリング(群)を第一世代とし、一世代あたりのモデル数を400とし、アーカイブサイズを40として、ビットストリングあたりの突然変異率を10%とし、一点交叉させることにより変異を導入した。これを5世代にわたって繰り返し、より予測精度に優れた学習モデルを構築することができる、すなわち成績のよいビットストリング(第2データ)を得た。
(6) Optimization of the second data using the genetic algorithm The second data was optimized and updated by the method already described using a non-dominant sort genetic algorithm (NSGA). Specifically, the bit string (group) selected in (5) above is the first generation, the number of models per generation is 400, the archive size is 40, and the mutation rate per bit string is 10%. The mutation was introduced by crossing at one point. This was repeated over 5 generations, and a learning model with better prediction accuracy could be constructed, that is, a bit string (second data) with good results was obtained.

<実施例2>(MACEの再発の予測)
上記実施例1により構築された選抜学習モデルと評価用のデータ群(validation cohort)とを用いて、既に説明したとおりMACEの再発を予測した。
得られた予測結果にもとづいて、1年再発リスクの層別化を行った。結果を図12に示す。図12は、評価用のデータ群(Original:点線)をMACE高リスク群(High:黒線)と低リスク群(Low:灰色線)とに層別化した結果を示すグラフである。
<Example 2> (Prediction of recurrence of MACE)
As described above, recurrence of MACE was predicted using the selective learning model constructed in Example 1 and the evaluation data group.
Based on the obtained prediction results, the risk of recurrence for one year was stratified. The results are shown in FIG. FIG. 12 is a graph showing the results of stratification of the evaluation data group (Original: dotted line) into a MACE high risk group (High: black line) and a low risk group (Low: gray line).

結果として、評価用のデータ群(original)(n=614 with 56 observations、9.1%)を、高リスク群(High)(n=247のうちの51例、20.6%)と低リスク群(Low)(n=367のうちの5例、1.4%)の2群に分割することができた。   As a result, the evaluation data group (original) (n = 614 with 56 observations, 9.1%) was replaced with the high risk group (High) (51 out of n = 247, 20.6%) and the low risk group. It was possible to divide into two groups of groups (Low) (5 out of n = 367, 1.4%).

図12に示されるように、これらの2群ともに、MACEを再発した割合(a)及び1年後までの累積生存率(b)について、評価用のデータ群のMACEを再発した割合及び1年後までの累積生存率と比較して有意な差が見られた。   As shown in FIG. 12, in these two groups, the rate of recurrence of MACE (a) and the cumulative survival rate (b) up to 1 year later, the rate of recurrence of MACE in the data group for evaluation and 1 year There was a significant difference compared to the cumulative survival rate until later.

<実施例3>(予測性能の評価)
評価用のデータ群を用いた場合の予測性能についてAUC解析により評価した。結果を図13(a)に示す。図13(a)は、予測性能を示すグラフである。
図13(a)に示されるように、予測性能は、AUC=0.853(95%CI=0.816−0.890)であった。
また、特異度を0.9に固定した条件での感度は、0.672(95%CI=0.595ー0.762)であった。
<Example 3> (Evaluation of prediction performance)
Predictive performance when an evaluation data group was used was evaluated by AUC analysis. The results are shown in FIG. FIG. 13A is a graph showing the prediction performance.
As shown in FIG. 13A, the prediction performance was AUC = 0.653 (95% CI = 0.816−0.890).
The sensitivity under the condition where the specificity was fixed at 0.9 was 0.672 (95% CI = 0.595-0.762).

<比較例1>(予測性能の評価)
従来用いられているCox比例ハザードモデルを用いた回帰分析により、評価用のデータ群を用いた場合の予測性能を評価した。図13(b)、(c)及び(d)に示す。図13(b)、(c)及び(d)は従来用いられている手法による予測性能を示すグラフである。
<Comparative example 1> (Evaluation of prediction performance)
The prediction performance in the case of using a data group for evaluation was evaluated by regression analysis using a conventionally used Cox proportional hazard model. It shows to FIG.13 (b), (c) and (d). FIGS. 13B, 13C, and 13D are graphs showing prediction performance by a conventionally used method.

図13(b)に示されるとおり、予測性能は、AUC=0.819(95%CI=0.768−0.869)であった。
また、図13(c)に示されるとおり、GRACE scoreでは、AUC=0.609(95%CI=0.562−0.656)であった。
さらに、図13(d)に示されるとおり、Framingham risk scoreでは、AUC=0.535(95%CI=0.488−0.582)であった。
このように、比較例1にかかる上記の結果は、実施例3の結果と比較していずれも劣っていた。
As shown in FIG. 13B, the prediction performance was AUC = 0.919 (95% CI = 0.768-0.869).
Further, as shown in FIG. 13C, in GRACE score, AUC = 0.609 (95% CI = 0.562-0.656).
Furthermore, as shown in FIG. 13 (d), AUC = 0.535 (95% CI = 0.488-0.582) in the Framingham risk score.
Thus, the above results according to Comparative Example 1 were all inferior to the results of Example 3.

加えて、従来のCox比例ハザードモデルを用いた場合に特異度を0.9に固定した条件での感度は、0.393(95%CI=0.250−0.536)であった。
このように、比較例1にかかる感度は、実施例3の感度と比較して劣っていた。
In addition, when the conventional Cox proportional hazard model was used, the sensitivity under the condition where the specificity was fixed at 0.9 was 0.393 (95% CI = 0.250−0.536).
Thus, the sensitivity according to Comparative Example 1 was inferior to the sensitivity of Example 3.

<実施例4>(指標パラメータの重要度の評価)
上記(6)により得られた成績のよいビットストリング(第2データ)が採用している指標パラメータの選択頻度を比較することで、指標データの重要度を評価した。
結果を図14に示す。図14は、全体の選抜学習モデルのうちのある指標パラメータが用いられている選抜学習モデルの割合に基づく選択頻度を示すグラフである。縦軸は指標パラメータを示し、横軸は選択頻度を示していており、選択頻度が高い変数ほど予測の上で重要であると考えられる。
<Example 4> (Evaluation of importance of index parameter)
The importance of the index data was evaluated by comparing the selection frequency of the index parameters adopted by the good bit string (second data) obtained by (6) above.
The results are shown in FIG. FIG. 14 is a graph showing the selection frequency based on the ratio of selection learning models in which a certain index parameter is used in the entire selection learning model. The vertical axis indicates the index parameter, and the horizontal axis indicates the selection frequency. A variable with a higher selection frequency is considered more important for prediction.

10 コンピュータ
12 演算部
12a 第1データ生成取得部
12b 第2データ生成取得部
12d 学習モデル構築部
12e 学習モデル選抜部
12f 第1判定結果生成取得部
12g 第2判定結果生成取得部
12h 第3判定結果生成取得部
12i 予測部
14 記憶部
16 入出力部
22 入力装置
32 外部記憶装置
100 予測装置
DESCRIPTION OF SYMBOLS 10 Computer 12 Calculation part 12a 1st data generation acquisition part 12b 2nd data generation acquisition part 12d Learning model construction part 12e Learning model selection part 12f 1st determination result generation acquisition part 12g 2nd determination result generation acquisition part 12h 3rd determination result Generation acquisition unit 12i Prediction unit 14 Storage unit 16 Input / output unit 22 Input device 32 External storage device 100 Prediction device

Claims (14)

被検体から採取された試験試料を用いて測定されたか、又は被検体から得られた指標パラメータであって、C反応性タンパク質量、Dダイマー量、HDL−コレステロール量、LDL−コレステロール量、プロトロンビン時間(国際標準比(INR))、γ−グルタミルトランスペプチターゼ量、アスパラギン酸アミノトランスフェラーゼ量、アミラーゼ量、アラニンアミノトランスフェラーゼ量、アルカリホスファターゼ量、アルブミン量、アンチトロンビン量、グリコヘモグロビン量、クロール量、トリグリセリド量、フィブリノゲン量、フィブリン/フィブリノゲン分解産物量、活性化部分トロンボプラスチン時間、血清クレアチニン量、血中尿素窒素量、血糖量、総コレステロール量、総ビルビリン量、単球数、直接ビリルビン量、乳酸脱水素酵素(LDH)量、尿酸量、pH、カリウム量、カルシウム量、ナトリウム量、赤血球数、ヘマトクリット値、ヘモグロビン量、リンパ球数、血小板数、好塩基球数、好酸球数、好中球数、性別、糖尿病既往歴、高血圧症既往歴、脂質異常症既往歴、喫煙習慣の有無、貧血の有無、急性心筋梗塞の既往歴、冠動脈形成術(PCI)を必要とした狭心症の既往歴、心不全の既往歴、アブレーション治療を必要とした心房細動の既往歴、脳梗塞の既往歴、末梢動脈疾患の既往歴、大動脈解離の既往歴、透析、年齢、身長、体重、心拍数、尿たんぱく(定性)、尿糖(定性)、入院理由及び入院時現症からなる群より選択頻度に基づいて選択される2種以上の指標パラメータに基づく第1データを取得するステップと、
前記第1データを、第2データに基づいて構築された学習モデルで処理して、再発リスクを予測するステップと
を含む、所定期間内における主要有害心イベントの再発リスクの予測方法。
An index parameter measured using a test sample collected from a subject or obtained from a subject, the amount of C-reactive protein, the amount of D-dimer, the amount of HDL-cholesterol, the amount of LDL-cholesterol, the prothrombin time (International standard ratio (INR)), γ-glutamyl transpeptidase level, aspartate aminotransferase level, amylase level, alanine aminotransferase level, alkaline phosphatase level, albumin level, antithrombin level, glycohemoglobin level, crawl level, triglyceride level Amount, fibrinogen amount, fibrin / fibrinogen degradation product amount, activated partial thromboplastin time, serum creatinine amount, blood urea nitrogen amount, blood glucose level, total cholesterol level, total bilbilin level, monocyte count, direct bilirubin level, Acid dehydrogenase (LDH) level, uric acid level, pH, potassium level, calcium level, sodium level, red blood cell count, hematocrit level, hemoglobin level, lymphocyte count, platelet count, basophil count, eosinophil count, favorable Anemia requiring neutrophil count, gender, history of diabetes, history of hypertension, history of dyslipidemia, smoking habit, presence of anemia, history of acute myocardial infarction, coronary angioplasty (PCI) History of heart failure, history of heart failure, history of atrial fibrillation requiring ablation treatment, history of cerebral infarction, history of peripheral arterial disease, history of aortic dissection, dialysis, age, height, weight, heart rate Obtaining first data based on two or more index parameters selected based on the frequency of selection from the group consisting of number, urinary protein (qualitative), urine sugar (qualitative), hospitalization reason and on-hospital manifestation; and
Processing the first data with a learning model constructed based on the second data to predict a recurrence risk, a prediction method for a recurrence risk of a major adverse cardiac event within a predetermined period.
前記第2データは所定期間内の主要有害心イベントの再発歴を指標パラメータとして含むデータであり、かつ前記第2データは、C反応性タンパク質量、Dダイマー量、HDL−コレステロール量、LDL−コレステロール量、プロトロンビン時間(国際標準比(INR))、γ−グルタミルトランスペプチターゼ量、アスパラギン酸アミノトランスフェラーゼ量、アミラーゼ量、アラニンアミノトランスフェラーゼ量、アルカリホスファターゼ量、アルブミン量、アンチトロンビン量、グリコヘモグロビン量、クロール量、トリグリセリド量、フィブリノゲン量、フィブリン/フィブリノゲン分解産物量、活性化部分トロンボプラスチン時間、血清クレアチニン量、血中尿素窒素量、血糖量、総コレステロール量、総ビルビリン量、単球数、直接ビリルビン量、乳酸脱水素酵素(LDH)量、尿酸量、pH、カリウム量、カルシウム量、ナトリウム量、赤血球数、ヘマトクリット値、ヘモグロビン量、リンパ球数、血小板数、好塩基球数、好酸球数、好中球数、性別、糖尿病既往歴、高血圧症既往歴、脂質異常症既往歴、喫煙習慣の有無、貧血の有無、急性心筋梗塞の既往歴、冠動脈形成術(PCI)を必要とした狭心症の既往歴、心不全の既往歴、アブレーション治療を必要とした心房細動の既往歴、脳梗塞の既往歴、末梢動脈疾患の既往歴、大動脈解離の既往歴、透析、年齢、身長、体重、心拍数、尿たんぱく(定性)、尿糖(定性)、入院理由及び入院時現症からなる群よりさらに選択される1種以上の指標パラメータに基づくデータである、請求項1に記載の所定期間内における主要有害心イベントの再発リスクの予測方法。   The second data is data including the history of recurrence of major adverse cardiac events within a predetermined period as an index parameter, and the second data includes C-reactive protein amount, D-dimer amount, HDL-cholesterol amount, LDL-cholesterol. Amount, prothrombin time (international standard ratio (INR)), γ-glutamyl transpeptidase amount, aspartate aminotransferase amount, amylase amount, alanine aminotransferase amount, alkaline phosphatase amount, albumin amount, antithrombin amount, glycohemoglobin amount, Amount of crawl, amount of triglyceride, amount of fibrinogen, amount of fibrin / fibrinogen degradation product, activated partial thromboplastin time, amount of serum creatinine, amount of blood urea nitrogen, blood glucose level, total cholesterol level, total bilbilin level, monocyte count Direct bilirubin content, lactate dehydrogenase (LDH) content, uric acid content, pH, potassium content, calcium content, sodium content, red blood cell count, hematocrit value, hemoglobin content, lymphocyte count, platelet count, basophil count, eosinic acid Requires sphere count, neutrophil count, gender, history of diabetes, history of hypertension, history of dyslipidemia, smoking habit, presence of anemia, history of acute myocardial infarction, coronary angioplasty (PCI) History of angina pectoris, history of heart failure, history of atrial fibrillation requiring ablation treatment, history of cerebral infarction, history of peripheral arterial disease, history of aortic dissection, dialysis, age, height The data based on one or more index parameters further selected from the group consisting of: body weight, heart rate, urinary protein (qualitative), urine sugar (qualitative), reason for hospitalization, and on-hospital disease. Within the prescribed period of Of predicting the risk of recurrence of major adverse cardiac events in Japan. 前記第1データ及び前記第2データが、心筋マーカーに由来する指標パラメータをさらに含む群から選択される指標パラメータに基づくデータである、請求項1又は2に記載の所定期間内における主要有害心イベントの再発リスクの予測方法。   The major adverse cardiac event within a predetermined period according to claim 1 or 2, wherein the first data and the second data are data based on an index parameter selected from a group further including an index parameter derived from a myocardial marker. Of predicting the risk of recurrence. 前記心筋マーカーが、クレアチンキナーゼMB、ヒト心臓型脂肪酸結合タンパク質、心筋トロポニンI、心筋トロポニンT、脳性ナトリウム利尿ペプチド、プロ脳性ナトリウム利尿ペプチド又はその切断産物、ミエロペルオキシダーゼ、胎盤増殖因子、推算糸球体濾過量、ホモシステイン、虚血修飾アルブミン、可溶性CD40リガンド、リポタンパク質関連ホスホリパーゼA2、コリン、及び高感度C反応性タンパク質からなる群から選択される1種以上である、請求項3に記載の所定期間内における主要有害心イベントの再発リスクの予測方法。   The myocardial marker is creatine kinase MB, human cardiac fatty acid binding protein, cardiac troponin I, cardiac troponin T, brain natriuretic peptide, pro-brain natriuretic peptide or its cleavage product, myeloperoxidase, placental growth factor, estimated glomerular filtration 4. The predetermined period according to claim 3, which is at least one selected from the group consisting of an amount, homocysteine, ischemic modified albumin, soluble CD40 ligand, lipoprotein-related phospholipase A2, choline, and high-sensitivity C-reactive protein. For predicting the risk of recurrence of major adverse cardiac events 前記試験試料が、血液又は血液由来試料である、請求項1〜4のいずれか1項に記載の所定期間内における主要有害心イベントの再発リスクの予測方法。   The method for predicting the risk of recurrence of a major adverse cardiac event within a predetermined period according to any one of claims 1 to 4, wherein the test sample is blood or a blood-derived sample. 前記主要有害心イベントが、急性心筋梗塞、冠血行再建術が施術された狭心症、入院を要した心不全、心房細動、脳卒中、又は循環器を理由とする死亡である、請求項1〜5のいずれか1項に記載の所定期間内における主要有害心イベントの再発リスクの予測方法。   The major adverse cardiac event is acute myocardial infarction, angina with coronary revascularization, heart failure requiring hospitalization, atrial fibrillation, stroke, or death due to cardiovascular disease. 6. The method for predicting the risk of recurrence of major adverse cardiac events within a predetermined period according to any one of 5 above. 前記学習モデルが、前記第2データを複数のデータ群に分割し、該データ群それぞれを教師データとして用い、かつ複数の該データ群ごとに異なる複数のパラメータ条件で行われる機械学習により構築される、主要有害心イベントの再発があるか又は不明であるかを予測する複数の第1学習モデル、及び主要有害心イベントの再発がないか又は不明であるかを予測する複数の第2学習モデルであり、
前記主要有害心イベントの再発リスクを予測するステップが、前記第1データを、前記第1学習モデル及び前記第2学習モデルにより処理して、再発リスクを予測するステップである、請求項1〜6のいずれか1項に記載の所定期間内における主要有害心イベントの再発リスクの予測方法。
The learning model is constructed by machine learning performed by dividing the second data into a plurality of data groups, using each of the data groups as teacher data, and performing a plurality of parameter conditions different for each of the plurality of data groups. A plurality of first learning models for predicting whether a major adverse cardiac event is recurring or unknown, and a plurality of second learning models for predicting whether a major adverse cardiac event is recurrent or unknown. Yes,
The step of predicting the recurrence risk of the major adverse cardiac event is a step of processing the first data by the first learning model and the second learning model to predict a recurrence risk. The prediction method of the recurrence risk of the main adverse heart event within the predetermined period of any one of 1.
前記学習モデルが、複数の前記第1学習モデル及び複数の前記第2学習モデルごとに、感度及び陽性的中率に基づいて選抜された複数の第1選抜学習モデル、及び複数の第2選抜学習モデルであり、
前記主要有害心イベントの再発リスクを予測するステップが、前記第1データを、前記第1選抜学習モデル及び前記第2選抜学習モデルにより処理して、再発リスクを予測するステップである、請求項7に記載の所定期間内における主要有害心イベントの再発リスクの予測方法。
A plurality of first selection learning models, and a plurality of second selection learning, wherein the learning model is selected based on sensitivity and positive predictive value for each of the plurality of first learning models and the plurality of second learning models. Model
The step of predicting the recurrence risk of the major adverse event is a step of processing the first data by the first selective learning model and the second selective learning model to predict a recurrence risk. A method for predicting the risk of recurrence of major adverse cardiac events within a predetermined period as described in.
前記主要有害心イベントの再発リスクを予測するステップが、前記第1データを、前記第1選抜学習モデル及び前記第2選抜学習モデルにより処理し、前記第1選抜学習モデル及び前記第2選抜学習モデルごとに第1判定結果を取得し、該第1判定結果について投票を行い、前記第1選抜学習モデル及び前記第2選抜学習モデルごとに得票率に基づく第2判定結果を取得し、前記第1選抜学習モデルの第2判定結果及び前記第2選抜学習モデルの前記第2判定結果を統合して、第3判定結果を取得し、該第3判定結果に基づいて、主要有害心イベントの再発リスクを予測するステップである、請求項8に記載の所定期間内における主要有害心イベントの再発リスクの予測方法。   The step of predicting the recurrence risk of the major adverse cardiac event includes processing the first data by the first selective learning model and the second selective learning model, and the first selective learning model and the second selective learning model. A first determination result is obtained for each, a vote is performed on the first determination result, a second determination result based on a vote rate is obtained for each of the first selection learning model and the second selection learning model, and the first The second determination result of the selective learning model and the second determination result of the second selective learning model are integrated to obtain a third determination result. Based on the third determination result, the risk of recurrence of major adverse cardiac events The method for predicting the risk of recurrence of major adverse cardiac events within a predetermined period according to claim 8, wherein 演算部を備えるコンピュータにより実行される下記のステップを含む、所定期間内における主要有害心イベントの再発リスクを予測するためのプログラムであって、
演算部が、被検体から採取された試験試料を用いて測定されたか、又は被検体から得られた指標パラメータであって、C反応性タンパク質量、Dダイマー量、HDL−コレステロール量、LDL−コレステロール量、プロトロンビン時間(国際標準比(INR))、γ−グルタミルトランスペプチターゼ量、アスパラギン酸アミノトランスフェラーゼ量、アミラーゼ量、アラニンアミノトランスフェラーゼ量、アルカリホスファターゼ量、アルブミン量、アンチトロンビン量、グリコヘモグロビン量、クロール量、トリグリセリド量、フィブリノゲン量、フィブリン/フィブリノゲン分解産物量、活性化部分トロンボプラスチン時間、血清クレアチニン量、血中尿素窒素量、血糖量、総コレステロール量、総ビルビリン量、単球数、直接ビリルビン量、乳酸脱水素酵素(LDH)量、尿酸量、pH、カリウム量、カルシウム量、ナトリウム量、赤血球数、ヘマトクリット値、ヘモグロビン量、リンパ球数、血小板数、好塩基球数、好酸球数、好中球数、性別、糖尿病既往歴、高血圧症既往歴、脂質異常症既往歴、喫煙習慣の有無、貧血の有無、急性心筋梗塞の既往歴、冠動脈形成術(PCI)を必要とした狭心症の既往歴、心不全の既往歴、アブレーション治療を必要とした心房細動の既往歴、脳梗塞の既往歴、末梢動脈疾患の既往歴、大動脈解離の既往歴、透析、年齢、身長、体重、心拍数、尿たんぱく(定性)、尿糖(定性)、入院理由及び入院時現症からなる群より選択頻度に基づいて選択される2種以上の指標パラメータに基づく第1データを取得するステップと、
前記演算部が、前記第1データを、第2データに基づいて構築された学習モデルで処理して、所定期間内における主要有害心イベントの再発リスクを予測するステップと
を含む、プログラム。
A program for predicting the risk of recurrence of major adverse cardiac events within a predetermined period, including the following steps executed by a computer having a calculation unit,
The calculation unit is an index parameter measured by using a test sample collected from a subject or obtained from a subject, the amount of C-reactive protein, the amount of D-dimer, the amount of HDL-cholesterol, the LDL-cholesterol Amount, prothrombin time (international standard ratio (INR)), γ-glutamyl transpeptidase amount, aspartate aminotransferase amount, amylase amount, alanine aminotransferase amount, alkaline phosphatase amount, albumin amount, antithrombin amount, glycohemoglobin amount, Amount of crawl, amount of triglyceride, amount of fibrinogen, amount of fibrin / fibrinogen degradation product, activated partial thromboplastin time, amount of serum creatinine, amount of blood urea nitrogen, blood glucose level, total cholesterol level, total bilbilin level, monocyte count, direct biliary count Bin volume, lactate dehydrogenase (LDH) volume, uric acid volume, pH, potassium volume, calcium volume, sodium volume, red blood cell count, hematocrit level, hemoglobin volume, lymphocyte count, platelet count, basophil count, eosinophil Number, neutrophil count, sex, history of diabetes, history of hypertension, history of dyslipidemia, presence of smoking, presence of anemia, history of acute myocardial infarction, coronary angioplasty (PCI) History of angina pectoris, history of heart failure, history of atrial fibrillation requiring ablation treatment, history of cerebral infarction, history of peripheral arterial disease, history of aortic dissection, dialysis, age, height, Obtain first data based on two or more index parameters selected from the group consisting of weight, heart rate, urinary protein (qualitative), urine sugar (qualitative), reason for hospitalization, and on-hospital disease, based on selection frequency Steps,
The calculation unit includes a step of processing the first data with a learning model constructed based on the second data to predict a recurrence risk of a major adverse cardiac event within a predetermined period.
前記学習モデルが、前記第2データを複数のデータ群に分割し、該データ群それぞれを教師データとして用い、かつ複数の該データ群ごとに異なる複数のパラメータ条件で行われる機械学習により構築される、主要有害心イベントの再発があるか又は不明であるかを予測する複数の第1学習モデル、及び主要有害心イベントの再発がないか又は不明であるかを予測する複数の第2学習モデルであり、
前記主要有害心イベントの再発リスクを予測するステップが、前記演算部が、前記第1データを、前記第1学習モデル及び前記第2学習モデルにより処理して、所定期間内における主要有害心イベントの再発リスクを予測するステップである、請求項10に記載のプログラム。
The learning model is constructed by machine learning performed by dividing the second data into a plurality of data groups, using each of the data groups as teacher data, and performing a plurality of parameter conditions different for each of the plurality of data groups. A plurality of first learning models for predicting whether a major adverse cardiac event is recurring or unknown, and a plurality of second learning models for predicting whether a major adverse cardiac event is recurrent or unknown. Yes,
The step of predicting the risk of recurrence of the major adverse event is that the calculation unit processes the first data by the first learning model and the second learning model to determine the major adverse event within a predetermined period. The program according to claim 10, which is a step of predicting a recurrence risk.
前記学習モデルが、複数の前記第1学習モデル及び複数の前記第2学習モデルごとに、感度及び陽性的中率に基づいて選抜された複数の第1選抜学習モデル、及び複数の第2選抜学習モデルであり、
前記主要有害心イベントの再発リスクを予測するステップが、前記演算部が、前記第1データを、前記第1選抜学習モデル及び前記第2選抜学習モデルにより処理して、所定期間内における主要有害心イベントの再発リスクを予測するステップである、請求項11に記載のプログラム。
A plurality of first selection learning models, and a plurality of second selection learning, wherein the learning model is selected based on sensitivity and positive predictive value for each of the plurality of first learning models and the plurality of second learning models. Model
The step of predicting the risk of recurrence of the major adverse heart event is such that the calculation unit processes the first data by the first selective learning model and the second selective learning model, and the major adverse heart in a predetermined period. The program according to claim 11, which is a step of predicting a recurrence risk of an event.
前記主要有害心イベントの再発リスクを予測するステップが、前記演算部が、前記第1データを、前記第1選抜学習モデル及び前記第2選抜学習モデルにより処理し、前記第1選抜学習モデル及び前記第2選抜学習モデルごとに第1判定結果を取得し、該第1判定結果について投票を行い、前記第1選抜学習モデル及び前記第2選抜学習モデルごとに得票率に基づく第2判定結果を取得し、前記第1選抜学習モデルの第2判定結果及び前記第2選抜学習モデルの前記第2判定結果を統合して、第3判定結果を取得し、該第3判定結果に基づいて、所定期間内における主要有害心イベントの再発リスクを予測するステップである、請求項12に記載のプログラム。   The step of predicting the recurrence risk of the major adverse cardiac event is such that the calculation unit processes the first data by the first selection learning model and the second selection learning model, and the first selection learning model and the The first determination result is acquired for each second selection learning model, the first determination result is voted, and the second determination result based on the vote rate is acquired for each of the first selection learning model and the second selection learning model. Then, the second determination result of the first selection learning model and the second determination result of the second selection learning model are integrated to obtain a third determination result, and based on the third determination result, a predetermined period of time is obtained. The program according to claim 12, which is a step of predicting a risk of recurrence of a major adverse cardiac event in the brain. 被検体から採取された試験試料を用いて測定されたか、又は被検体から得られた指標パラメータであって、C反応性タンパク質量、Dダイマー量、HDL−コレステロール量、LDL−コレステロール量、プロトロンビン時間(国際標準比(INR))、γ−グルタミルトランスペプチターゼ量、アスパラギン酸アミノトランスフェラーゼ量、アミラーゼ量、アラニンアミノトランスフェラーゼ量、アルカリホスファターゼ量、アルブミン量、アンチトロンビン量、グリコヘモグロビン量、クロール量、トリグリセリド量、フィブリノゲン量、フィブリン/フィブリノゲン分解産物量、活性化部分トロンボプラスチン時間、血清クレアチニン量、血中尿素窒素量、血糖量、総コレステロール量、総ビルビリン量、単球数、直接ビリルビン量、乳酸脱水素酵素(LDH)量、尿酸量、pH、カリウム量、カルシウム量、ナトリウム量、赤血球数、ヘマトクリット値、ヘモグロビン量、リンパ球数、血小板数、好塩基球数、好酸球数、好中球数、性別、糖尿病既往歴、高血圧症既往歴、脂質異常症既往歴、喫煙習慣の有無、貧血の有無、急性心筋梗塞の既往歴、冠動脈形成術(PCI)を必要とした狭心症の既往歴、心不全の既往歴、アブレーション治療を必要とした心房細動の既往歴、脳梗塞の既往歴、末梢動脈疾患の既往歴、大動脈解離の既往歴、透析、年齢、身長、体重、心拍数、尿たんぱく(定性)、尿糖(定性)、入院理由及び入院時現症からなる群より選択頻度に基づいて選択される2種以上の指標パラメータに基づく第1データを生成して取得する第1データ生成取得部と、
第1データ生成取得部が取得した前記第1データを、第2データに基づいて構築された学習モデルで処理して、所定期間内における主要有害心イベントの再発リスクを予測する予測部と
を備える、所定期間内における主要有害心イベントの再発リスクの予測装置。
An index parameter measured using a test sample collected from a subject or obtained from a subject, the amount of C-reactive protein, the amount of D-dimer, the amount of HDL-cholesterol, the amount of LDL-cholesterol, the prothrombin time (International standard ratio (INR)), γ-glutamyl transpeptidase level, aspartate aminotransferase level, amylase level, alanine aminotransferase level, alkaline phosphatase level, albumin level, antithrombin level, glycohemoglobin level, crawl level, triglyceride level Amount, fibrinogen amount, fibrin / fibrinogen degradation product amount, activated partial thromboplastin time, serum creatinine amount, blood urea nitrogen amount, blood glucose level, total cholesterol level, total bilbilin level, monocyte count, direct bilirubin level, Acid dehydrogenase (LDH) level, uric acid level, pH, potassium level, calcium level, sodium level, red blood cell count, hematocrit level, hemoglobin level, lymphocyte count, platelet count, basophil count, eosinophil count, favorable Anemia requiring neutrophil count, gender, history of diabetes, history of hypertension, history of dyslipidemia, smoking habit, presence of anemia, history of acute myocardial infarction, coronary angioplasty (PCI) History of heart failure, history of heart failure, history of atrial fibrillation requiring ablation treatment, history of cerebral infarction, history of peripheral arterial disease, history of aortic dissection, dialysis, age, height, weight, heart rate Generate and obtain first data based on two or more index parameters selected based on the frequency of selection from the group consisting of number, urine protein (qualitative), urine sugar (qualitative), reason for hospitalization, and oncology A first data generation and acquisition unit; ,
A prediction unit that processes the first data acquired by the first data generation acquisition unit with a learning model constructed based on the second data, and predicts a recurrence risk of a major adverse cardiac event within a predetermined period. , A prediction device for the risk of recurrence of major adverse cardiac events within a given period.
JP2017204770A 2016-10-21 2017-10-23 Method of predicting recurrence risk of major adverse cardiac event Pending JP2018072337A (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2016207221 2016-10-21
JP2016207221 2016-10-21

Publications (1)

Publication Number Publication Date
JP2018072337A true JP2018072337A (en) 2018-05-10

Family

ID=62115143

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017204770A Pending JP2018072337A (en) 2016-10-21 2017-10-23 Method of predicting recurrence risk of major adverse cardiac event

Country Status (1)

Country Link
JP (1) JP2018072337A (en)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109346179A (en) * 2018-12-10 2019-02-15 陈阳 Recurrence prediction model and its modeling method, device after a kind of coronary intervention
WO2020054721A1 (en) * 2018-09-12 2020-03-19 株式会社島津製作所 Method for measuring atrial fibrillation index value
WO2020137640A1 (en) * 2018-12-27 2020-07-02 株式会社堀場製作所 Blood analysis device, computer program, and blood analysis method
CN113421648A (en) * 2021-06-21 2021-09-21 中国科学院北京基因组研究所(国家生物信息中心) Model for predicting risk of ejection fraction retention type heart failure

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020054721A1 (en) * 2018-09-12 2020-03-19 株式会社島津製作所 Method for measuring atrial fibrillation index value
JPWO2020054721A1 (en) * 2018-09-12 2021-09-02 株式会社島津製作所 How to measure atrial fibrillation index value
JP7280582B2 (en) 2018-09-12 2023-05-24 株式会社島津製作所 How to measure atrial fibrillation index
CN109346179A (en) * 2018-12-10 2019-02-15 陈阳 Recurrence prediction model and its modeling method, device after a kind of coronary intervention
WO2020137640A1 (en) * 2018-12-27 2020-07-02 株式会社堀場製作所 Blood analysis device, computer program, and blood analysis method
CN113421648A (en) * 2021-06-21 2021-09-21 中国科学院北京基因组研究所(国家生物信息中心) Model for predicting risk of ejection fraction retention type heart failure
CN113421648B (en) * 2021-06-21 2024-04-23 中国科学院北京基因组研究所(国家生物信息中心) Model for predicting ejection fraction retention type heart failure risk

Similar Documents

Publication Publication Date Title
JP2018067266A (en) Program for forecasting onset risk or recurrence risk of disease
Steele et al. Machine learning models in electronic health records can outperform conventional survival models for predicting patient mortality in coronary artery disease
Ikemura et al. Using automated machine learning to predict the mortality of patients with COVID-19: prediction model development study
Du et al. Accurate prediction of coronary heart disease for patients with hypertension from electronic health records with big data and machine-learning methods: model development and performance evaluation
VanHouten et al. Machine learning for risk prediction of acute coronary syndrome
JP2018072337A (en) Method of predicting recurrence risk of major adverse cardiac event
JP7286863B2 (en) Automated validation of medical data
Laengsri et al. ThalPred: a web-based prediction tool for discriminating thalassemia trait and iron deficiency anemia
CN113327679A (en) Pulmonary embolism clinical risk and prognosis scoring method and system
EP3433614A1 (en) Use of clinical parameters for the prediction of sirs
Moreno-Sánchez Data-driven early diagnosis of chronic kidney disease: development and evaluation of an explainable AI model
Emakhu et al. Acute coronary syndrome prediction in emergency care: A machine learning approach
Alfieri et al. Continuous and early prediction of future moderate and severe Acute Kidney Injury in critically ill patients: development and multi-centric, multi-national external validation of a machine-learning model
US20230223151A1 (en) Identifying an individual&#39;s likelihood of having an acute heart failure
Rathi et al. Early Prediction of Diabetes Using Machine Learning Techniques
Bayati et al. A low-cost method for multiple disease prediction
Deng et al. Characterizing risk of in-hospital mortality following subarachnoid hemorrhage using machine learning: a retrospective study
CN113782197B (en) New coronary pneumonia patient outcome prediction method based on interpretable machine learning algorithm
Liu et al. Interpretable machine learning model for early prediction of mortality in elderly patients with multiple organ dysfunction syndrome (MODS): a multicenter retrospective study and cross validation
Bresso et al. Inductive database to support iterative data mining: Application to biomarker analysis on patient data in the Fight-HF project
KR102541510B1 (en) Method for constructing prediction model of suicide using national medical check-up data
Armañanzas et al. Derivation of a cost-sensitive COVID-19 mortality risk indicator using a multistart framework
Shakhgeldyan et al. Interpretable machine learning for in-hospital mortality risk prediction in patients with ST-elevation myocardial infarction after percutaneous coronary interventions
Sun et al. ED-Copilot: Reduce Emergency Department Wait Time with Language Model Diagnostic Assistance
Ding et al. Mortality prediction for ICU patients using just-in-time learning and extreme learning machine

Legal Events

Date Code Title Description
AA64 Notification of invalidation of claim of internal priority (with term)

Free format text: JAPANESE INTERMEDIATE CODE: A241764

Effective date: 20171114

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20171116