JP7433503B1 - High-throughput real-world drug efficacy and safety evaluation methods and systems - Google Patents

High-throughput real-world drug efficacy and safety evaluation methods and systems Download PDF

Info

Publication number
JP7433503B1
JP7433503B1 JP2023095912A JP2023095912A JP7433503B1 JP 7433503 B1 JP7433503 B1 JP 7433503B1 JP 2023095912 A JP2023095912 A JP 2023095912A JP 2023095912 A JP2023095912 A JP 2023095912A JP 7433503 B1 JP7433503 B1 JP 7433503B1
Authority
JP
Japan
Prior art keywords
sub
drug
outcome
target
safety
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2023095912A
Other languages
Japanese (ja)
Other versions
JP2024035072A (en
Inventor
▲勁▼松 李
▲ユー▼ 王
爽 ▲馬▼
嘉▲チー▼ 王
雨 田
天舒 周
Original Assignee
之江実験室
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 之江実験室 filed Critical 之江実験室
Application granted granted Critical
Publication of JP7433503B1 publication Critical patent/JP7433503B1/en
Publication of JP2024035072A publication Critical patent/JP2024035072A/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H70/00ICT specially adapted for the handling or processing of medical references
    • G16H70/40ICT specially adapted for the handling or processing of medical references relating to drugs, e.g. their side effects or intended usage
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients

Abstract

【課題】ハイスループットのリアルワールドにおける薬物の有効性及び安全性を評価する方法及びシステムを提供する。【解決手段】方法は、データセットを構築するステップと、薬物の有効性/安全性指標表現型ライブラリを構築するステップと、対象薬物を選択し、対象イベント、アウトカムイベント、対象日付、アウトカム日付を定義し、患者ID、対象日付及びアウトカム日付を抽出するステップと、薬物の有効性/安全性指標表現型ライブラリから指標を選択し、対象薬物-有効性/安全性指標ペアを得て、イベントシーケンス対称性分析で対象薬物-有効性/安全性指標ペアのハイスループットのシグナルスクリーニングを行い、一次スクリーニング陽性シグナルを得るステップと、一次スクリーニング陽性シグナルに対して因果評定を行い、対象薬物の有効性及び安全性を判定するステップと、を含む。【選択図】図1The present invention provides a method and system for evaluating drug efficacy and safety in a high-throughput real-world setting. [Solution] The method includes the steps of constructing a dataset, constructing a drug efficacy/safety indicator phenotype library, selecting a target drug, and identifying a target event, an outcome event, a target date, and an outcome date. the step of defining and extracting patient ID, target date and outcome date, selecting indicators from the drug efficacy/safety indicator phenotype library, obtaining target drug-efficacy/safety indicator pairs, and creating an event sequence. Perform high-throughput signal screening of the target drug-efficacy/safety indicator pair using symmetry analysis to obtain a primary screening positive signal, and perform causal evaluation on the primary screening positive signal to determine the effectiveness and efficacy of the target drug. and determining safety. [Selection diagram] Figure 1

Description

本発明は薬物管理の技術分野に関し、特にハイスループットのリアルワールドにおける薬物の有効性及び安全性の評価方法及びシステムに関する。 The present invention relates to the technical field of drug management, and particularly to a high-throughput real-world evaluation method and system for drug efficacy and safety.

薬物評価は臨床における合理的な投薬を促進し、医薬費用を効果的に制御するための重要な手段である。医学研究は、最高品質の証拠を利用して新型の治療物質の治療効果及び安全性を判定し、且つ薬物が市場に投入されるまでの時間を最大限に短縮することに力を集中している。ランダム化比較試験(Random clinical trials、RCTs)の使用は20世紀で医学の発展を徹底的に変え、薬物の治療効果の評定にゴールドスタンダードを提供した。しかし、ランダム化比較試験は常に実行可能であるわけでなく、特に重症又は希少疾患において、被験者の募集は非常に困難で時間がかかる。実際の診断及び治療プロセスで電子的に収集された通常の医療データ(「リアルワールドデータ(Real-world data、RWD)」とも呼称される)の量と可用性は、近年、急速に増加しており、薬物発売後の安全性及び有効性を評定するための新しい方法として使用できる。臨床試験に比べて、RWDは、異なる特徴を持つ患者を多く含むため、治療の実際の状況を反映することが多く、従って、RWDを使用した研究は臨床実践における治療する必要がある実際の人群をよりよく代表することができる。RWDによる薬物評価は、薬物発売後の臨床における実際の応用状況の証拠を得て、患者の投薬の安全性及び有効性を促進する一方、新薬の研究開発、旧薬の新規使用の新しい臨床試験の設計に啓発を提供することができる。 Drug evaluation is an important tool to promote rational dosing in clinical practice and effectively control pharmaceutical costs. Medical research is focused on using the highest quality evidence to determine the therapeutic efficacy and safety of new therapeutic substances and maximizing the time it takes to bring drugs to market. There is. The use of randomized controlled trials (RCTs) revolutionized the development of medicine in the 20th century, providing a gold standard for evaluating the therapeutic efficacy of drugs. However, randomized controlled trials are not always feasible, and recruiting subjects is extremely difficult and time-consuming, especially in severe or rare diseases. The amount and availability of routine medical data collected electronically during the actual diagnosis and treatment process (also referred to as “real-world data (RWD)”) has increased rapidly in recent years. , it can be used as a new method to assess the safety and efficacy of drugs after release. Compared to clinical trials, RWD often reflects the actual situation of treatment as it includes more patients with different characteristics, and therefore studies using RWD reflect the actual population that needs to be treated in clinical practice. can be better represented. Drug evaluation by RWD helps to obtain evidence of the actual clinical application situation after drug release, promoting the safety and effectiveness of patient medication, while also supporting the research and development of new drugs and new clinical trials of new uses of old drugs. can provide enlightenment for the design of

近年、世界各国はRWDを使用して新薬の研究開発及び発売を促進するための政策や法令を発行しているが、如何にRWDを利用して薬物評価を行うかについての一般的な方法及び枠組はまだない。有効性の面については、公開番号がCN114025253Aである発明特許《リアルワールド研究に基づく薬物治療効果の評定システム》に記載のシステムは、VNA広域バリアフリーデータ収集を実現することにより、リアルワールド医療データを多局面的に収集し、病巣変化効果の評定に適用でき、該発明は薬物評価システムのシステムネットワーク構成に重点を置き、如何にリアルワールドデータを利用して治療効果を評価することを開示していない。安全性の面については、登録番号がCN111402971Bである発明特許《ビッグデータに基づく薬物有害反応の迅速識別方法及びシステム》及び登録番号がCN104765947Bである発明特許《ビッグデータに向けた潜在的な薬物有害反応データのマイニング方法》の両方は報告された薬物有害反応情報に基づき、分野の知識及びリアルワールドデータにおける薬物と有害反応との関連度を組み合わせて薬物有害反応を発見又は評定する。出願番号がCN202111628626.3である発明特許《医薬品有害反応の識別方法及び装置》は処方シーケンス対称性分析という方法で有害反応を識別し、その基本原理はラベル薬物を薬物有害反応の代理イベントとして使用し、指標薬物とラベル薬物の使用時間の前後を分析することにより薬物有害反応を識別することである。 In recent years, countries around the world have issued policies and laws to promote the research, development, and launch of new drugs using RWD. There is no framework yet. In terms of effectiveness, the system described in the invention patent ``System for evaluating drug treatment effects based on real-world research'' with publication number CN114025253A has the ability to collect real-world medical data by realizing wide-area VNA barrier-free data collection. The present invention focuses on the system network configuration of a drug evaluation system and discloses how to use real-world data to evaluate therapeutic effects. Not yet. Regarding the safety aspect, the invention patent with the registration number CN111402971B "Method and system for rapid identification of adverse drug reactions based on big data" and the invention patent with the registration number CN104765947B "Potential drug adverse reactions towards big data" Both reaction data mining methods discover or evaluate adverse drug reactions based on reported adverse drug reaction information, combining field knowledge and the degree of association between drugs and adverse reactions in real-world data. The invention patent "Method and device for identifying adverse drug reactions" with application number CN202111628626.3 identifies adverse reactions by a method called prescription sequence symmetry analysis, and its basic principle is to use labeled drugs as surrogate events for adverse drug reactions. and to identify adverse drug reactions by analyzing before and after use of the index drug and label drug.

上記内容については、以下の限界性がある。1)薬物-有害反応関係のシグナルは薬物有害反応報告システムからであり、リアルワールドにおいて実際に発生したが気づかれていないシグナルが多く紛失し、2)分野の知識とリアルワールドデータを組み合わせて得られるのは薬物-有害反応の関連関係であり、薬物と有害反応との間に因果関係があることを表さず、3)処方シーケンス対称性分析は常に保険データベースに適用し、代理薬物の選択はアルゴリズムアウトカムの信頼性に深刻な影響を与える。 The above content has the following limitations. 1) Drug-adverse reaction related signals are from the drug adverse reaction reporting system, and many signals that actually occurred in the real world but were not noticed are missing; 2) signals obtained by combining domain knowledge and real-world data 3) Prescription sequence symmetry analysis is always applied to insurance databases and surrogate drug selection. seriously impacts the reliability of algorithm outcomes.

そのため、ハイスループットのリアルワールドにおける薬物の有効性及び安全性の評価方法及びシステムを提案する。 Therefore, we propose a high-throughput real-world evaluation method and system for drug efficacy and safety.

本発明は上記技術的課題を解決するために、ハイスループットのリアルワールドにおける薬物の有効性及び安全性の評価方法及びシステムを提供する。 In order to solve the above technical problems, the present invention provides a high-throughput real-world evaluation method and system for drug efficacy and safety.

本発明が用いる技術的解決手段は以下のとおりである。 The technical solution used by the present invention is as follows.

ハイスループットのリアルワールドにおける薬物の有効性及び安全性の評価方法であって、
リアルワールドデータを取得し、前記リアルワールドデータに対して統合データコーディングを行い、統合データコーディングの後に前記リアルワールドデータの必要最小限のデータを抽出し、データセットの構築を完了するステップS1と、
概念セットと行為と標準とを含むトリプレットモードを構築し、前記トリプレットモード、薬物の有効性/安全性用語セット、及び臨床指標により薬物の有効性/安全性指標表現型ライブラリを構築するステップS2と、
対象薬物を選択し、前記薬物の有効性/安全性指標表現型ライブラリから指標を選択し、対象薬物-有効性/安全性指標ペアを得て、対象イベント、アウトカムイベント、対象日付、アウトカム日付を定義し、患者ID、対象日付及びアウトカム日付を抽出し、ハイスループットのシグナル一次スクリーニングを行うデータセットを構成するステップS3と、
前記ハイスループットのシグナル一次スクリーニングのデータセットに対して、イベントシーケンス対称性分析で前記対象薬物-有効性/安全性指標ペアのハイスループットのシグナルスクリーニングを行い、一次スクリーニング陽性シグナルを得るステップS4と、
前記一次スクリーニング陽性シグナルに対して因果評定を行い、前記対象薬物の有効性及び安全性を判定するステップS5とを含む。
A high-throughput real-world evaluation method for drug efficacy and safety, the method comprising:
Step S1: acquiring real world data, performing integrated data coding on the real world data, extracting the minimum necessary data of the real world data after the integrated data coding, and completing the construction of a dataset;
Step S2 of constructing a triplet mode including a concept set, a behavior, and a standard, and constructing a drug efficacy/safety indicator phenotype library using the triplet mode, a drug efficacy/safety term set, and a clinical index; ,
Select a target drug, select an indicator from the efficacy/safety indicator phenotype library of the drug, obtain a target drug-efficacy/safety indicator pair, and specify the target event, outcome event, target date, and outcome date. step S3 of defining a data set, extracting patient ID, target date, and outcome date, and configuring a data set for performing high-throughput signal primary screening;
Performing high-throughput signal screening of the target drug-efficacy/safety indicator pair on the data set of the high-throughput signal primary screening using event sequence symmetry analysis to obtain a positive signal for the primary screening, step S4;
The step S5 includes performing a causal evaluation on the positive signal of the primary screening to determine the effectiveness and safety of the target drug.

更に、前記ステップS3は、具体的に、
前記対象薬物の初回の使用を対象イベントとし、前記薬物の有効性/安全性指標表現型ライブラリからユーザが選択した1つ又は複数の指標をアウトカム指標として構成し、各前記アウトカム指標の初回の発生をアウトカムイベントとするサブステップS31と、
前記対象イベントの発生日付を対象日付とし、前記アウトカムイベントの発生日付をアウトカム日付とするサブステップS32と、
前記対象イベント及び前記アウトカムイベントを選択し、前記データセットにおける前記対象イベントと前記アウトカムイベントの両方が発生した患者をスクリーニングし、患者ID、対象日付及びアウトカム日付を抽出し、ハイスループットのシグナル一次スクリーニングを行うデータセットを構成するサブステップS33とを含む。
Furthermore, the step S3 specifically includes:
The target event is the first use of the target drug, one or more indicators selected by the user from the drug efficacy/safety indicator phenotype library are configured as outcome indicators, and the first occurrence of each of the outcome indicators is configured as an outcome indicator. a substep S31 in which the outcome event is set as an outcome event;
a substep S32 in which the date of occurrence of the target event is set as a target date, and the date of occurrence of the outcome event is set as an outcome date;
Select the target event and the outcome event, screen patients in the dataset in which both the target event and the outcome event occur, extract the patient ID, target date, and outcome date, and perform high-throughput signal primary screening. and a sub-step S33 of configuring a data set for performing.

更に、前記ステップS4は、具体的に、
前記対象イベントが発生した後に前記アウトカムイベントが発生した人の数と前記対象イベントが発生する前に前記アウトカムイベントが発生した人の数との比を利用して順序比を計算するサブステップS41と、
無効果順序比を計算し、前記無効果順序比を利用して前記順序比を調整して、修正された順序比を得るサブステップS42と、
対象イベントが発生した後にアウトカムイベントが発生する確率の信頼区間を計算することにより、前記修正された順序比の信頼区間を計算するサブステップS43と、
前記修正された順序比の信頼区間の下限が1よりも大きいシグナルを一次スクリーニング陽性シグナルとするサブステップS44とを含む。
Furthermore, the step S4 specifically includes:
a sub-step S41 of calculating an ordinal ratio using a ratio between the number of people for whom the outcome event occurred after the target event occurred and the number of people for whom the outcome event occurred before the target event occurred; ,
a sub-step S42 of calculating an ineffective ordinal ratio and adjusting the ordinal ratio using the ineffective ordinal ratio to obtain a modified ordinal ratio;
a sub-step S43 of calculating a confidence interval of the modified ordinal ratio by calculating a confidence interval of the probability that the outcome event occurs after the target event occurs;
and a substep S44 in which a signal in which the lower limit of the confidence interval of the corrected ordinal ratio is greater than 1 is determined as a primary screening positive signal.

更に、前記サブステップS42は、具体的に、
ハイスループットのシグナル一次スクリーニングを行う前記データセットに対して、前記対象イベントが発生した後の予め設定された観察窓内で前記アウトカムイベントが発生する全体の平均確率を計算するサブステップS421と、
前記全体の平均確率を利用して無効果順序比を算出するサブステップS422と、
前記順序比と前記無効果順序比との比を計算して、修正された順序比を得るサブステップS423とを含む。
Furthermore, the sub-step S42 specifically includes:
a sub-step S421 of calculating an overall average probability of the outcome event occurring within a preset observation window after the target event occurs for the data set performing high-throughput signal primary screening;
a sub-step S422 of calculating a no-effect order ratio using the overall average probability;
and a substep S423 of calculating a ratio between the ordinal ratio and the no-effect ordinal ratio to obtain a modified ordinal ratio.

更に、前記ステップS5は、具体的に、
前記一次スクリーニング陽性シグナルに対応する前記対象薬物-有効性/安全性指標ペアに対して、前記データセットにおける前記対象イベントが発生した患者をスクリーニングし、前記患者をユーザキュー及び初期の非ユーザキューに割り当てるサブステップS51と、
前記初期の非ユーザキューの患者が使用する薬物から一種の薬物を代替薬物としてランダムに選択し、非ユーザキューを構築するサブステップS52と、
前記対象薬物又は前記代替薬物の初回の使用時間を登録時間とし、前記対象薬物又は前記代替薬物の使用を治療方式とし、前記アウトカムイベントが発生するか否かを結果とし、前記患者が登録する前のベースラインデータを抽出し、前記データセットの人口統計的情報と前記ベースラインデータとを共変数セットとして構成し、特徴を抽出し、スクリーニングして平均治療効果を計算することに用いられる変数を得るサブステップS53と、
平均治療効果を計算することに用いられる前記変数を利用して前記対象薬物の平均治療効果を計算するサブステップS54と、
最大試験回数に達するまで、サブステップS52~サブステップS54を繰り返し、すべての前記平均治療効果の平均作用を計算し、前記平均作用の信頼区間を計算することにより前記対象薬物の有効性及び安全性を判定するサブステップS55とを含む。
Furthermore, the step S5 specifically includes:
Screening patients in the data set in which the event of interest occurred against the target drug-efficacy/safety indicator pair corresponding to the primary screening positive signal, and placing the patient in a user queue and an initial non-user queue. a substep S51 of allocating;
a sub-step S52 of randomly selecting one type of drug as an alternative drug from among the drugs used by the patient in the initial non-user cue to construct a non-user cue;
The first use of the target drug or the alternative drug is the registration time, the use of the target drug or the alternative drug is the treatment method, and whether or not the outcome event occurs is the result, before the patient registers. extracting baseline data of the data set, configuring the demographic information of the data set and the baseline data as a covariable set, extracting features, screening variables used to calculate the average treatment effect. A substep S53 of obtaining
a sub-step S54 of calculating the average therapeutic effect of the target drug using the variables used to calculate the average therapeutic effect;
Repeat substeps S52 to S54 until the maximum number of tests is reached, calculate the average effect of all the average therapeutic effects, and calculate the confidence interval of the average effect to evaluate the effectiveness and safety of the target drug. and a sub-step S55 for determining.

更に、前記サブステップS51は、具体的に、
前記一次スクリーニング陽性シグナルに対応する前記対象薬物-有効性/安全性指標ペアに対して、前記データセットにおける前記対象イベントが発生した患者をスクリーニングし、前記患者が受診した主要な診断を取得し、ICD-10コードに基づいて前記患者を統計し、前記患者数が最も多い主要な診断を基礎診断とするサブステップS511と、
前記患者をユーザキュー及び初期の非ユーザキューに割り当てるサブステップS512とを含む。
Furthermore, the sub-step S51 specifically includes:
Screening the patient in the data set in which the target event occurred for the target drug-efficacy/safety indicator pair corresponding to the primary screening positive signal, and obtaining the main diagnosis received by the patient; a sub-step S511 that statistics the patients based on ICD-10 codes and sets the main diagnosis with the largest number of patients as the basic diagnosis;
and assigning the patient to a user queue and an initial non-user queue.

更に、前記サブステップS53は、具体的に、
前記共変数セットから1つの共変数を選択し、前記共変数を重要性共変数と記し、前記共変数セットのうちの残りの変数を残りの変数と記すサブステップS531と、
前記重要性共変数及び前記残りの変数が与えられた条件の下で、前記結果の条件付き期待値に対して、全体共変数を入力変数とするアウトカムイベント予測モデルを構築し、前記結果の条件付き期待値の推定値を得るサブステップS532と、
前記残りの変数が与えられた条件の下で、前記重要性共変数の値が1である確率を推定し、推定値を得るサブステップS533と、
前記重要性共変数が1である確率の推定値を利用して変数重要性指示外乱変数を構築するサブステップS534と、
前記結果の条件付き期待値の推定値を切片項とし、前記変数重要性指示外乱変数を入力変数とし、アウトカムイベント回帰モデルを構築し、変数重要性外乱パラメータを得るサブステップS535と、
前記変数重要性外乱パラメータ及び前記変数重要性指示外乱変数を利用して前記結果の条件付き期待値の推定値を更新し、変数重要性を算出するサブステップS536と、
前記変数重要性の標準偏差及び信頼区間を計算するサブステップS537と、
前記共変数セットの各共変数をトラバースするまで、サブステップS531~サブステップS537を繰り返し、変数重要性の標準偏差の左右信頼区間に零が含まれない変数を、平均治療効果を計算することに用いられる変数とするサブステップS538とを含む。
Furthermore, the sub-step S53 specifically includes:
a sub-step S531 of selecting one covariate from the set of covariates, marking the covariate as an importance covariate, and marking the remaining variables of the set of covariables as remaining variables;
An outcome event prediction model using the overall covariate as an input variable is constructed for the conditional expected value of the result under conditions given the importance covariate and the remaining variables, and the condition of the result is a substep S532 of obtaining an estimated value of expected value;
a substep S533 of estimating the probability that the value of the importance covariate is 1 under conditions given the remaining variables and obtaining an estimated value;
a sub-step S534 of constructing a variable importance indicating disturbance variable using the estimated value of the probability that the importance covariate is 1;
a substep S535 of constructing an outcome event regression model using the estimated value of the conditional expected value of the result as an intercept term and the variable importance indicating disturbance variable as an input variable, and obtaining a variable importance disturbance parameter;
a sub-step S536 of updating the estimated value of the conditional expected value of the result using the variable importance disturbance parameter and the variable importance indicating disturbance variable, and calculating variable importance;
a sub-step S537 of calculating the standard deviation and confidence interval of the variable importance;
Substeps S531 to S537 are repeated until each covariate in the covariate set is traversed, and the average treatment effect is calculated for variables whose left and right confidence intervals of the standard deviation of variable importance do not include zero. and a substep S538 in which variables are used.

更に、前記サブステップS54は、具体的に、
前記治療方式及び平均治療効果を計算することに用いられる前記変数を入力変数としてアウトカムイベント予測モデルを構築し、アウトカムイベントの条件付き期待値の推定値を得るサブステップS541と、
治療割り当ての確率を評定して治療割り当ての推定値を得るサブステップS542と、
前記治療割り当ての推定値を利用して指示外乱変数を構築するサブステップS543と、
前記治療方式及び前記平均治療効果の変数を入力として算出されたアウトカムイベントの条件付き期待値の推定値を切片項とし、前記アウトカムイベントと前記指示外乱変数の回帰モデルを構築し、推定外乱パラメータを得るサブステップS544と、
前記推定外乱パラメータ及び前記指示外乱変数を利用して前記アウトカムイベントの条件付き期待値の推定値を更新し、平均治療効果を算出するサブステップS545とのサブステップを含む。
Furthermore, the sub-step S54 specifically includes:
a substep S541 of constructing an outcome event prediction model using the variables used to calculate the treatment method and average treatment effect as input variables, and obtaining an estimated value of the conditional expected value of the outcome event;
estimating the probability of treatment assignment to obtain an estimate of treatment assignment S542;
a sub-step S543 of constructing an instruction disturbance variable using the estimated value of the treatment allocation;
A regression model of the outcome event and the indicated disturbance variable is constructed using the estimated value of the conditional expected value of the outcome event calculated by inputting the variables of the treatment method and the average treatment effect as an intercept term, and the estimated disturbance parameter is A substep S544 of obtaining
The method includes a substep S545 of updating the estimated value of the conditional expected value of the outcome event using the estimated disturbance parameter and the indicated disturbance variable, and calculating an average treatment effect.

更に、前記サブステップS55は、具体的に、
最大試験回数に達するまで、サブステップS52~サブステップS54を繰り返し、すべての前記平均治療効果の平均作用を計算するサブステップS551と、
前記平均作用の信頼区間を計算し、左信頼区間が零よりも大きいシグナル又は右信頼区間が零よりも小さいシグナルを最終的な陽性シグナルとして取得し、前記対象薬物の有効性及び安全性を判定するサブステップS552とのサブステップを含む。
Furthermore, the sub-step S55 specifically includes:
a substep S551 of repeating substeps S52 to S54 until the maximum number of tests is reached, and calculating the average effect of all the average treatment effects;
Calculating the confidence interval of the average effect, obtaining a signal with a left confidence interval larger than zero or a signal with a right confidence interval smaller than zero as a final positive signal, and determining the efficacy and safety of the target drug. The substep S552 includes the substep S552.

本発明はハイスループットのリアルワールドにおける薬物の有効性及び安全性の評価システムをさらに提供し、
既存のデータからデータを取得し、前記データをクリーニングしてデータセットの構築を完了するためのデータ収集モジュールと、
前記データセットにおけるデータを臨床イベントに変換し、イベントシーケンス対称性分析でハイスループットのシグナルスクリーニングを行い、一次スクリーニング陽性シグナルを得るためのハイスループットのシグナルスクリーニングモジュールと、
前記一次スクリーニング陽性シグナルに対して因果評定を行い、前記対象薬物の有効性及び安全性を判定するための因果評定モジュールと、
前記対象薬物の有効性及び安全性の結果を表示するための結果表示モジュールとを含む。
The present invention further provides a high-throughput real-world drug efficacy and safety evaluation system,
a data collection module for retrieving data from existing data and cleaning said data to complete the construction of the dataset;
a high-throughput signal screening module for converting data in the dataset into clinical events and performing high-throughput signal screening with event sequence symmetry analysis to obtain a primary screening positive signal;
a causal evaluation module for performing causal evaluation on the positive signal of the primary screening and determining the effectiveness and safety of the target drug;
and a result display module for displaying efficacy and safety results of the target drug.

本発明の有益な効果は以下のとおりである。 The beneficial effects of the present invention are as follows.

1、本発明は大型のリアルワールドデータセットに基づき、特定の薬物と特定の有効性/安全性指標に限定されず、ハイスループットのシグナルスクリーニングと臨床試験シミュレーションに基づく因果評定アルゴリズムにより、対象薬物の薬効の因果性評価をハイスループットに完了することができる。 1. The present invention is based on a large-scale real-world data set, is not limited to a specific drug and specific efficacy/safety indicators, and uses a causal assessment algorithm based on high-throughput signal screening and clinical trial simulation to evaluate the target drug. Causal evaluation of drug efficacy can be completed in a high-throughput manner.

2、本発明は「概念セット+行為+標準」のトリプレットモードに基づいて、拡張可能な薬物の有効性/安全性表現型ライブラリを構築し、ハイスループットのリアルワールドにおける薬物評価に用いられる。 2. The present invention constructs a scalable drug efficacy/safety phenotype library based on the triplet mode of "concept set + action + standard", which is used for high-throughput real-world drug evaluation.

3、本発明は対象薬物とアウトカムイベントとの因果関係評定において、2段階の対象最尤推定を用い、まず、患者キューのリアルワールドで生成された全部のデータ特徴重要性を評定し、人間の専門家の知識に依存しておらず、データ駆動については、アウトカムイベント及び治療割り当てに最も関連する共変数を選択し、次に、これらの変数の比較に基づいて平均治療効果を計算し、復元方式で代替薬物をランダムに選択して臨床試験をシミュレートするのを複数回で実行することにより、確実な平均治療効果の結果を得て、これにより対象薬物-アウトカム指標の定量的な因果関係評定を得る。 3. In evaluating the causal relationship between the target drug and the outcome event, the present invention uses two-stage target maximum likelihood estimation. First, the importance of all data features generated in the real world of patient cues is evaluated, and human For data-driven and not dependent on expert knowledge, select the covariates most relevant to the outcome event and treatment assignment, then calculate and restore the average treatment effect based on a comparison of these variables. By randomly selecting an alternative drug and simulating a clinical trial multiple times, we can obtain reliable average treatment effect results, thereby establishing a quantitative causal relationship between the target drug and the outcome measure. Get a grade.

本発明に係るハイスループットのリアルワールドにおける薬物の有効性及び安全性の評価方法のフローチャートである。1 is a flowchart of a high-throughput real-world drug efficacy and safety evaluation method according to the present invention. 本発明に係るハイスループットのリアルワールドにおける薬物の有効性及び安全性の評価システムの模式図である。FIG. 1 is a schematic diagram of a high-throughput real-world drug efficacy and safety evaluation system according to the present invention.

以下の少なくとも1つの例示的な実施例に対する記述は実際に説明的なものに過ぎず、決して本発明及びその応用又は使用を制限するものではない。本発明の実施例に基づき、当業者が創造的な労働を必要とせずに取得するすべてのその他の実施例は、いずれも本発明の保護範囲に属する。 The following description of at least one exemplary embodiment is only illustrative in nature and in no way limits the invention and its application or use. Based on the embodiments of the present invention, all other embodiments obtained by those skilled in the art without the need for creative efforts fall within the protection scope of the present invention.

図1に示すように、ハイスループットのリアルワールドにおける薬物の有効性及び安全性の評価方法は、ステップS1~ステップS5を含む。 As shown in FIG. 1, the high-throughput real-world evaluation method for drug efficacy and safety includes steps S1 to S5.

ステップS1では、リアルワールドデータを取得し、前記リアルワールドデータに対して統合データコーディングを行い、統合データコーディングの後に前記リアルワールドデータの必要最小限のデータを抽出し、データセットの構築を完了する。 In step S1, real world data is acquired, integrated data coding is performed on the real world data, and after the integrated data coding, the minimum necessary data of the real world data is extracted to complete the construction of the dataset. .

ステップS2では、概念セット+行為+標準のトリプレットモードを構築し、前記トリプレットモード、薬物の有効性/安全性用語セット、及び臨床指標により薬物の有効性/安全性指標表現型ライブラリを構築する。 In step S2, a triplet mode of concept set + action + standard is constructed, and a drug efficacy/safety indicator phenotype library is constructed using the triplet mode, drug efficacy/safety term set, and clinical index.

ステップS3では、対象薬物を選択し、前記薬物の有効性/安全性指標表現型ライブラリから指標を選択し、対象薬物-有効性/安全性指標ペアを得て、対象イベント、アウトカムイベント、対象日付、アウトカム日付を定義し、患者ID、対象日付及びアウトカム日付を抽出し、ハイスループットのシグナル一次スクリーニングを行うデータセットを構成する。 In step S3, a target drug is selected, an index is selected from the efficacy/safety index phenotype library of the drug, a target drug-efficacy/safety index pair is obtained, and a target event, an outcome event, and a target date are obtained. , define the outcome date, extract the patient ID, target date, and outcome date, and construct a dataset for high-throughput signal primary screening.

ステップS31では、前記対象薬物の初回の使用を対象イベントとし、前記薬物の有効性/安全性指標表現型ライブラリからユーザが選択した1つ又は複数の指標をアウトカム指標として構成し、各前記アウトカム指標の初回の発生をアウトカムイベントとする。 In step S31, the first use of the target drug is set as a target event, one or more indicators selected by the user from the drug efficacy/safety indicator phenotype library are configured as outcome indicators, and each of the outcome indicators The first occurrence of is the outcome event.

ステップS32では、前記対象イベントの発生日付を対象日付とし、前記アウトカムイベントの発生日付をアウトカム日付とする。 In step S32, the date of occurrence of the target event is set as the target date, and the date of occurrence of the outcome event is set as the outcome date.

ステップS33では、前記対象イベント及び前記アウトカムイベントを選択し、前記データセットにおける前記対象イベントと前記アウトカムイベントの両方が発生した患者をスクリーニングし、患者ID、対象日付及びアウトカム日付を抽出し、ハイスループットのシグナル一次スクリーニングを行うデータセットを構成する。 In step S33, the target event and the outcome event are selected, patients in the data set in which both the target event and the outcome event occur are screened, patient IDs, target dates, and outcome dates are extracted, and high-throughput Construct a data set for primary signal screening.

ステップS4では、前記ハイスループットのシグナル一次スクリーニングのデータセットに対して、イベントシーケンス対称性分析で前記対象薬物-有効性/安全性指標ペアのハイスループットのシグナルスクリーニングを行い、一次スクリーニング陽性シグナルを得る。 In step S4, high-throughput signal screening of the target drug-efficacy/safety indicator pair is performed on the data set of the high-throughput signal primary screening using event sequence symmetry analysis to obtain a positive signal for the primary screening. .

ステップS41では、前記対象イベントが発生した後に前記アウトカムイベントが発生した人の数と前記対象イベントが発生する前に前記アウトカムイベントが発生した人の数との比を利用して順序比を計算する。 In step S41, an ordinal ratio is calculated using the ratio of the number of people for whom the outcome event occurred after the target event occurred and the number of people for whom the outcome event occurred before the target event occurred. .

ステップS42では、無効果順序比を計算し、前記無効果順序比を利用して前記順序比を調整して、修正された順序比を得る。 In step S42, an ineffective ordinal ratio is calculated, and the ordinal ratio is adjusted using the ineffective ordinal ratio to obtain a corrected ordinal ratio.

ステップS421では、ハイスループットのシグナル一次スクリーニングを行う前記データセットに対して、前記対象イベントが発生した後の予め設定された観察窓内で前記アウトカムイベントが発生する全体の平均確率を計算する。 In step S421, the overall average probability that the outcome event occurs within a preset observation window after the target event occurs is calculated for the data set that performs high-throughput signal primary screening.

ステップS422では、前記全体の平均確率を利用して無効果順序比を算出する。 In step S422, the no-effect order ratio is calculated using the overall average probability.

ステップS423では、前記順序比と前記無効果順序比との比を計算して、修正された順序比を得る。 In step S423, a ratio between the order ratio and the no-effect order ratio is calculated to obtain a corrected order ratio.

ステップS43では、対象イベントが発生した後にアウトカムイベントが発生する確率の信頼区間を計算することにより、前記修正された順序比の信頼区間を計算する。 In step S43, a confidence interval for the modified ordinal ratio is calculated by calculating a confidence interval for the probability that the outcome event will occur after the target event occurs.

ステップS44では、前記修正された順序比の信頼区間の下限が1よりも大きいシグナルを一次スクリーニング陽性シグナルとする。 In step S44, a signal for which the lower limit of the confidence interval of the corrected ordinal ratio is greater than 1 is determined to be a positive signal for the primary screening.

ステップS5では、前記一次スクリーニング陽性シグナルに対して因果評定を行い、前記対象薬物の有効性及び安全性を判定する。 In step S5, a causal evaluation is performed on the positive signal of the primary screening to determine the effectiveness and safety of the target drug.

ステップS51では、前記一次スクリーニング陽性シグナルに対応する前記対象薬物-有効性/安全性指標ペアに対して、前記データセットにおける前記対象イベントが発生した患者をスクリーニングし、前記患者をユーザキュー及び初期の非ユーザキューに割り当てる。 In step S51, a patient in the data set in which the target event has occurred is screened for the target drug-efficacy/safety index pair corresponding to the primary screening positive signal, and the patient is screened for the user cue and the initial Assign to non-user queues.

ステップS511では、前記一次スクリーニング陽性シグナルに対応する前記対象薬物-有効性/安全性指標ペアに対して、前記データセットにおける前記対象イベントが発生した患者をスクリーニングし、前記患者が受診した主要な診断を取得し、ICD-10コードに基づいて前記患者を統計し、前記患者数が最も多い主要な診断を基礎診断とする。 In step S511, the patient in which the target event occurred in the data set is screened for the target drug-efficacy/safety index pair corresponding to the primary screening positive signal, and the main diagnosis that the patient received is screened. is obtained, statistics are made on the patients based on the ICD-10 code, and the main diagnosis with the largest number of patients is set as the basic diagnosis.

ステップS512では、前記患者をユーザキュー及び初期の非ユーザキューに割り当てる。 In step S512, the patient is assigned to a user queue and an initial non-user queue.

ステップS52では、前記初期の非ユーザキューの患者が使用する薬物から一種の薬物を代替薬物としてランダムに選択し、非ユーザキューを構築する。 In step S52, one type of drug is randomly selected as an alternative drug from among the drugs used by the patient in the initial non-user queue, and a non-user queue is constructed.

ステップS53では、前記対象薬物又は前記代替薬物の初回の使用時間を登録時間とし、前記対象薬物又は前記代替薬物の使用を治療方式とし、前記アウトカムイベントが発生するか否かを結果とし、前記患者が登録する前のベースラインデータを抽出し、前記データセットの人口統計的情報と前記ベースラインデータとを共変数セットとして構成し、特徴を抽出し、スクリーニングして平均治療効果を計算することに用いられる変数を得る。 In step S53, the first use time of the target drug or the alternative drug is set as a registration time, the use of the target drug or the alternative drug is set as a treatment method, and whether or not the outcome event occurs is set as a result, and the patient extracting baseline data before enrollment, configuring the demographic information of the dataset and the baseline data as a covariate set, extracting features, screening and calculating the average treatment effect. Get the variables used.

ステップS531では、前記共変数セットから1つの共変数を選択し、前記共変数を重要性共変数と記し、前記共変数セットのうちの残りの変数を残りの変数と記す。 In step S531, one covariate is selected from the covariable set, the covariate is designated as an importance covariate, and the remaining variables in the covariable set are designated as remaining variables.

ステップS532では、前記重要性共変数及び前記残りの変数が与えられた条件の下で、前記結果の条件付き期待値に対して、全体共変数を入力変数とするアウトカムイベント予測モデルを構築し、前記結果の条件付き期待値の推定値を得る。 In step S532, under conditions given the importance covariate and the remaining variables, construct an outcome event prediction model using the overall covariate as an input variable for the conditional expected value of the result; Obtaining an estimate of the conditional expectation of the result.

ステップS533では、前記残りの変数が与えられた条件の下で、前記重要性共変数の値が1である確率を推定し、推定値を得る。 In step S533, the probability that the value of the importance covariate is 1 is estimated under the conditions given the remaining variables, and an estimated value is obtained.

ステップS534では、前記重要性共変数が1である確率の推定値を利用して変数重要性指示外乱変数を構築する。 In step S534, a variable importance indicating disturbance variable is constructed using the estimated value of the probability that the importance covariate is 1.

ステップS535では、前記結果の条件付き期待値の推定値を切片項とし、前記変数重要性指示外乱変数を入力変数とし、アウトカムイベント回帰モデルを構築し、変数重要性外乱パラメータを得る。 In step S535, the estimated value of the conditional expected value of the result is used as an intercept term, the variable importance indicating disturbance variable is used as an input variable, an outcome event regression model is constructed, and a variable importance disturbance parameter is obtained.

ステップS536では、前記変数重要性外乱パラメータ及び前記変数重要性指示外乱変数を利用して前記結果の条件付き期待値の推定値を更新し、変数重要性を算出する。 In step S536, the estimated value of the conditional expected value of the result is updated using the variable importance disturbance parameter and the variable importance indicating disturbance variable, and the variable importance is calculated.

ステップS537では、前記変数重要性の標準偏差及び信頼区間を計算する。 In step S537, the standard deviation and confidence interval of the variable importance are calculated.

ステップS538では、前記共変数セットの各共変数をトラバースするまで、ステップS531~S537を繰り返し、変数重要性の標準偏差の左右信頼区間に零が含まれない変数を、平均治療効果を計算することに用いられる変数とする。 In step S538, steps S531 to S537 are repeated until each covariate in the covariate set is traversed, and the average treatment effect is calculated for variables whose left and right confidence intervals of the standard deviation of variable importance do not include zero. Let it be a variable used in

ステップS54では、平均治療効果を計算することに用いられる前記変数を利用して前記対象薬物の平均治療効果を計算する。 In step S54, the average therapeutic effect of the target drug is calculated using the variables used to calculate the average therapeutic effect.

ステップS541では、前記治療方式及び平均治療効果を計算することに用いられる前記変数を入力変数としてアウトカムイベント予測モデルを構築し、アウトカムイベントの条件付き期待値の推定値を得る。 In step S541, an outcome event prediction model is constructed using the treatment method and the variables used to calculate the average treatment effect as input variables, and an estimated value of the conditional expected value of the outcome event is obtained.

ステップS542では、治療割り当ての確率を評定して治療割り当ての推定値を得る。 In step S542, the probability of treatment assignment is evaluated to obtain an estimate of treatment assignment.

ステップS543では、前記治療割り当ての推定値を利用して指示外乱変数を構築する。 In step S543, an instruction disturbance variable is constructed using the estimated value of the treatment assignment.

ステップS544では、前記治療方式及び前記平均治療効果の変数を入力として算出されたアウトカムイベントの条件付き期待値の推定値を切片項とし、前記アウトカムイベントと前記指示外乱変数の回帰モデルを構築し、推定外乱パラメータを得る。 In step S544, a regression model of the outcome event and the indicated disturbance variable is constructed using the estimated value of the conditional expected value of the outcome event calculated by inputting the variables of the treatment method and the average treatment effect as an intercept term, Obtain estimated disturbance parameters.

ステップS545では、前記推定外乱パラメータ及び前記指示外乱変数を利用して前記アウトカムイベントの条件付き期待値の推定値を更新し、平均治療効果を算出する。 In step S545, the estimated value of the conditional expected value of the outcome event is updated using the estimated disturbance parameter and the indicated disturbance variable, and the average treatment effect is calculated.

ステップS55では、最大試験回数に達するまで、ステップS52~ステップS54を繰り返し、すべての前記平均治療効果の平均作用を計算し、前記平均作用の信頼区間を計算することにより前記対象薬物の有効性及び安全性を判定する。 In step S55, steps S52 to S54 are repeated until the maximum number of tests is reached, the average effect of all the average therapeutic effects is calculated, and the confidence interval of the average effect is calculated to determine the effectiveness of the target drug. Determine safety.

ステップS551では、最大試験回数に達するまで、ステップS52~ステップS54を繰り返し、すべての前記平均治療効果の平均作用を計算する。 In step S551, steps S52 to S54 are repeated until the maximum number of tests is reached, and the average effect of all the average treatment effects is calculated.

ステップS552では、前記平均作用の信頼区間を計算し、左信頼区間が零よりも大きいシグナル又は右信頼区間が零よりも小さいシグナルを最終的な陽性シグナルとして取得し、前記対象薬物の有効性及び安全性を判定する。 In step S552, a confidence interval of the average effect is calculated, and a signal with a left confidence interval larger than zero or a signal with a right confidence interval smaller than zero is obtained as a final positive signal, and the effectiveness of the target drug is determined. Determine safety.

図2に示すように、ハイスループットのリアルワールドにおける薬物の有効性及び安全性の評価システムは、
既存のデータからデータを取得し、前記データをクリーニングしてデータセットの構築を完了するためのデータ収集モジュールと、
前記データセットにおけるデータを臨床イベントに変換し、イベントシーケンス対称性分析でハイスループットのシグナルスクリーニングを行い、一次スクリーニング陽性シグナルを得るためのハイスループットのシグナルスクリーニングモジュールと、
前記一次スクリーニング陽性シグナルに対して因果評定を行い、前記対象薬物の有効性及び安全性を判定するための因果評定モジュールと、
前記対象薬物の有効性及び安全性の結果を表示するための結果表示モジュールとを含む。
As shown in Figure 2, the high-throughput real-world drug efficacy and safety evaluation system
a data collection module for retrieving data from existing data and cleaning said data to complete the construction of the dataset;
a high-throughput signal screening module for converting data in the dataset into clinical events and performing high-throughput signal screening with event sequence symmetry analysis to obtain a primary screening positive signal;
a causal evaluation module for performing causal evaluation on the positive signal of the primary screening and determining the effectiveness and safety of the target drug;
and a result display module for displaying efficacy and safety results of the target drug.

実施例では、ハイスループットのリアルワールドにおける薬物の有効性及び安全性の評価方法は、ステップS1~ステップS5を含む。 In an embodiment, a high-throughput real-world evaluation method for drug efficacy and safety includes steps S1 to S5.

ステップS1では、リアルワールドデータを取得し、前記リアルワールドデータに対して統合データコーディングを行い、統合データコーディングの後に前記リアルワールドデータの必要最小限のデータを抽出し、データセットの構築を完了する。 In step S1, real world data is acquired, integrated data coding is performed on the real world data, and after the integrated data coding, the minimum necessary data of the real world data is extracted to complete the construction of the dataset. .

リアルワールドデータを取得し、電子カルテデータから投薬データ、診断データ、手術データ、実験室検査結果等を取得し、データの発生時間を処理せず、元の日時を保留し、具体的には、取得される情報は、(1)生年月日、性別、民族を含む人口統計的情報、(2)アレルギー歴、家族歴、血液型を含む医療基本情報、(3)診断記録、化学検査結果、投薬記録、手術記録、画像検査報告を含む診断及び治療情報を含む。 Acquire real world data, acquire medication data, diagnostic data, surgical data, laboratory test results, etc. from electronic medical record data, do not process the time of data occurrence, retain the original date and time, specifically, The information obtained includes (1) demographic information including date of birth, gender, and ethnicity, (2) basic medical information including allergy history, family history, and blood type, (3) diagnostic records, chemical test results, Contains diagnostic and treatment information, including medication records, surgical records, and imaging reports.

まず、統合データコーディングを行い、性別、年齢、民族、血液型、化学検査項目、投薬情報には本実施例の自己設定コードが使用され、診断、家族病史にはICD-10コードが使用され、手術情報にはICD-9-CMコードが使用される。 First, integrated data coding was performed, and the self-defined codes of this example were used for gender, age, ethnicity, blood type, chemical test items, and medication information, and ICD-10 codes were used for diagnosis and family disease history. ICD-9-CM codes are used for surgical information.

前記ステップS1に記載のデータセットは人口統計的情報、化学検査結果、投薬情報、診断情報、手術記録及び臨床症状を含む。 The data set described in step S1 includes demographic information, chemical test results, medication information, diagnostic information, surgical records, and clinical symptoms.

統合データコーディングの後、まず、構造化データに対して必要最小限のデータを抽出して臨床イベント変換に用いる。構造化データの必要最小限のデータは、以下を含み、
人口統計的情報:患者ID、生年月日、民族、血液型、
化学検査結果:患者ID、化学検査項目コード、化学検査イベント、化学検査結果、
投薬情報:患者ID、薬物コード、投薬開始時間、
診断情報:患者ID、診断コード、診断時間、
手術記録:患者ID、手術コード、手術時間、
画像検査報告における自然言語テキスト情報に対して、まず、固有表現抽出技術で身体部位と臨床症状を抽出し、自己設定コードのマッピングを完了した後に、必要最小限のデータに変換し、
臨床症状:患者ID、臨床症状コード、臨床症状時間。
After integrated data coding, first extract the minimum necessary data from the structured data and use it for clinical event conversion. The minimum required structured data includes the following:
Demographic information: patient ID, date of birth, ethnicity, blood type,
Chemical test results: patient ID, chemical test item code, chemical test event, chemical test result,
Medication information: patient ID, drug code, medication start time,
Diagnosis information: patient ID, diagnosis code, diagnosis time,
Surgery record: patient ID, surgery code, surgery time,
First, body parts and clinical symptoms are extracted from the natural language text information in the image test report using named entity extraction technology, and after mapping of self-configured codes is completed, the information is converted to the minimum necessary data.
Clinical symptoms: patient ID, clinical symptom code, clinical symptom time.

ステップS2では、概念セット+行為+標準のトリプレットモードを構築し、前記トリプレットモード、薬物の有効性/安全性用語セット、及び臨床指標により薬物の有効性/安全性指標表現型ライブラリを構築する。 In step S2, a triplet mode of concept set + action + standard is constructed, and a drug efficacy/safety indicator phenotype library is constructed using the triplet mode, drug efficacy/safety term set, and clinical index.

薬物の有効性/安全性指標表現型は異なる薬物、異なる評価次元により異なり、従って本実施例では、「概念セット+行為+標準」のトリプレットモードを提案する。「概念セット」は1つ又は複数のデータコード(例えば診断コード、化学検査コード等)で構成され、「行為」は一連の行為又は状態で構成され、「発生」、「よりも多い」、「よりも少ない」、「等しい」、「増加」、「減少」を含み、「標準」は具体的な有効性/安全性指標のレベルの意味を表し、省略してもよい。以下、
「腫瘍大きさ」+「減少」+「0.5cm」、
「血清アラニンアミノトランスフェラーゼ」+「よりも多い」+「正常値上限の3倍」の2つの例であり、
上記トリプレットモードを使用して、既存の薬物の有効性/安全性用語セット及び臨床ガイドラインにおける臨床的に広く認められている指標に基づいて薬物の有効性/安全性表現型ライブラリを構築することができ、ユーザのニーズに応じて特定の有効性/安全性指標に対して個性化の事前定義を行い、薬物の有効性/安全性指標表現型ライブラリを改善することもできる。
The efficacy/safety index phenotype of a drug is different for different drugs and different evaluation dimensions, therefore, in this example, a triplet mode of "concept set + action + standard" is proposed. A "concept set" consists of one or more data codes (e.g., diagnostic code, chemical test code, etc.), and an "action" consists of a series of actions or conditions, such as "occurrence,""morethan,"""Lessthan","Equal","Increase","Decrease", and "Standard" refers to the level of a specific efficacy/safety indicator and may be omitted. below,
"Tumor size" + "reduction" + "0.5 cm",
Two examples are “serum alanine aminotransferase” + “more than” + “3 times the upper limit of normal value”.
The above triplet mode can be used to build a drug efficacy/safety phenotype library based on existing drug efficacy/safety term sets and clinically accepted indicators in clinical guidelines. It is also possible to predefine personalization for specific efficacy/safety indicators according to the user's needs to improve the drug efficacy/safety indicator phenotype library.

ステップS3では、対象薬物を選択し、前記薬物の有効性/安全性指標表現型ライブラリから指標を選択し、対象薬物-有効性/安全性指標ペアを得て、対象イベント、アウトカムイベント、対象日付、アウトカム日付を定義し、患者ID、対象日付及びアウトカム日付を抽出し、ハイスループットのシグナル一次スクリーニングを行うデータセットを構成する。 In step S3, a target drug is selected, an index is selected from the efficacy/safety index phenotype library of the drug, a target drug-efficacy/safety index pair is obtained, and a target event, an outcome event, and a target date are obtained. , define the outcome date, extract the patient ID, target date, and outcome date, and construct a dataset for high-throughput signal primary screening.

ステップS31では、前記対象薬物の初回の使用を対象イベントとし、前記薬物の有効性/安全性指標表現型ライブラリからユーザが選択した1つ又は複数の指標をアウトカム指標として構成し、各前記アウトカム指標の初回の発生をアウトカムイベントとする。 In step S31, the first use of the target drug is set as a target event, one or more indicators selected by the user from the drug efficacy/safety indicator phenotype library are configured as outcome indicators, and each of the outcome indicators The first occurrence of is the outcome event.

対象薬物は単一の薬物であってもよく、同じ治療効果又は同じ特性を有する薬物のクラスであってもよく、薬物のクラスを対象薬物として選択すると、選択された複数種の薬物は同じ薬物と見なされる。 The target drug may be a single drug or a class of drugs with the same therapeutic effect or the same properties, and when a class of drugs is selected as the target drug, the selected drugs may be the same drug. considered to be.

ステップS32では、前記対象イベントの発生日付を対象日付とし、前記アウトカムイベントの発生日付をアウトカム日付とする。 In step S32, the date of occurrence of the target event is set as the target date, and the date of occurrence of the outcome event is set as the outcome date.

ステップS33では、前記対象イベント及び前記アウトカムイベントを選択し、前記データセットにおける前記対象イベントと前記アウトカムイベントの両方が発生した患者をスクリーニングし、患者ID、対象日付及びアウトカム日付を抽出し、ハイスループットのシグナル一次スクリーニングを行うデータセットを構成する。 In step S33, the target event and the outcome event are selected, patients in the data set in which both the target event and the outcome event occur are screened, patient IDs, target dates, and outcome dates are extracted, and high-throughput Construct a data set for primary signal screening.

ステップS4では、前記ハイスループットのシグナル一次スクリーニングのデータセットに対して、イベントシーケンス対称性分析で前記対象薬物-有効性/安全性指標ペアのハイスループットのシグナルスクリーニングを行い、一次スクリーニング陽性シグナルを得る。 In step S4, high-throughput signal screening of the target drug-efficacy/safety indicator pair is performed on the data set of the high-throughput signal primary screening using event sequence symmetry analysis to obtain a positive signal for the primary screening. .

ステップS41では、前記対象イベントが発生した後に前記アウトカムイベントが発生した人の数と前記対象イベントが発生する前に前記アウトカムイベントが発生した人の数との比を利用して順序比srを計算する。 In step S41, the order ratio sr is calculated using the ratio of the number of people for whom the outcome event occurred after the target event occurred and the number of people for whom the outcome event occurred before the target event occurred. do.

イベントシーケンス対称性分析は時間に伴って医療行為の変化傾向の影響を受ける可能性があり、例えば、医療保険政策の変化により、特定の期間内のある化学検査、投薬が急に増加又は減少するようになり、いずれも偏差のある効果推定を招く可能性がある。このような偏差を補正するために、無効果順序比null_effect_srを計算することができ、それは何らの因果関係がない場合に対象イベントの後にアウトカムイベントが発生する順序確率に基づいて順序比srを調整する。 Event sequence symmetry analysis can be affected by changing trends in medical practice over time, for example, changes in health insurance policies that cause a sudden increase or decrease in certain chemical tests or medications within a certain time period. Both of these can lead to erroneous effect estimates. To correct for such deviations, a no-effect order ratio null_effect_sr can be calculated, which adjusts the order ratio sr based on the order probability that the outcome event occurs after the target event in the absence of any causal relationship. do.

ステップS42では、無効果順序比を計算し、前記無効果順序比を利用して前記順序比を調整して、修正された順序比を得る。 In step S42, an ineffective ordinal ratio is calculated, and the ordinal ratio is adjusted using the ineffective ordinal ratio to obtain a corrected ordinal ratio.

ステップS421では、ハイスループットのシグナル一次スクリーニングを行う前記データセットに対して、前記対象イベントが発生した後の予め設定された観察窓内で前記アウトカムイベントが発生する全体の平均確率pを計算する。 In step S421, the overall average probability p a of the outcome event occurring within a preset observation window after the target event occurs is calculated for the data set on which high-throughput signal primary screening is performed. .

無効果順序比null_effect_srの計算は、対象イベントが発生した患者ごとに、対象イベントが発生した後の指定された観察窓内でアウトカムイベントが発生する確率pから派生される。

Figure 0007433503000002
The calculation of the no-effect ordinal ratio null_effect_sr is derived from the probability p that the outcome event occurs within a specified observation window after the event of interest occurs, for each patient in which the event of interest occurs.
Figure 0007433503000002

ここで、dは連続的な観察窓の時間長さであり、xは対象イベントが発生した日であり、Oはt日目にアウトカムイベントが発生した患者数である。 where d is the time length of the continuous observation window, x is the day on which the event of interest occurred, and O t is the number of patients in which the outcome event occurred on day t.

患者群全体に対して、対象イベントの後にアウトカムイベントが発生する全体の平均確率pの計算方法は、観察期間内のm日間連続して対象イベントが発生した患者数を重み付けし、次にすべての日の平均値を求めることである。

Figure 0007433503000003
For the entire patient group, the overall average probability p a of the outcome event occurring after the target event is calculated by weighting the number of patients in which the target event occurred for m consecutive days within the observation period, and then The purpose is to find the average value for the days.
Figure 0007433503000003

ここで、uは観察期間の最終日を示し、Oはその日にアウトカムイベントが発生した人の数を示し、Tはm日目に対象イベントが発生した人の数を示し、及びdは連続的な観察窓の時間長さである。 Here, u indicates the last day of the observation period, O t indicates the number of people for whom the outcome event occurred on that day, T m indicates the number of people for whom the target event occurred on day m, and d indicates the number of people for whom the outcome event occurred on day m. is the time length of a continuous observation window.

ステップS422では、前記全体の平均確率を利用して無効果順序比null_effect_srを算出する。

Figure 0007433503000004
In step S422, the no-effect order ratio null_effect_sr is calculated using the overall average probability.
Figure 0007433503000004

ステップS423では、前記順序比と前記無効果順序比との比を計算して、修正された順序比adjusted_srを得る。

Figure 0007433503000005
In step S423, a ratio between the ordinal ratio and the ineffective ordinal ratio is calculated to obtain a modified ordinal ratio adjusted_sr.
Figure 0007433503000005

ステップS43では、対象イベントが発生した後にアウトカムイベントが発生する確率

Figure 0007433503000006
の信頼区間を計算することにより、前記修正された順序比adjusted_srの信頼区間を計算する。 In step S43, the probability that the outcome event will occur after the target event occurs is determined.
Figure 0007433503000006
A confidence interval for the modified ordinal ratio adjusted_sr is computed by computing a confidence interval for the modified order ratio adjusted_sr.

Figure 0007433503000007
を対象イベントが発生した後にアウトカムイベントが発生する確率とし、すなわち、
Figure 0007433503000008
であると、
Figure 0007433503000009
が得られる。
Figure 0007433503000007
Let be the probability that the outcome event occurs after the target event occurs, i.e.,
Figure 0007433503000008
So,
Figure 0007433503000009
is obtained.

対象イベントが発生した後にアウトカムイベントが発生する確率

Figure 0007433503000010
の95%信頼区間を計算することにより修正された順序比adjusted_srの信頼区間を計算する。本実施例では、対象イベントが発生した後にアウトカムイベントが発生する確率
Figure 0007433503000011
の信頼区間の計算は下式を使用する。
Figure 0007433503000012
Probability that the outcome event will occur after the target event occurs
Figure 0007433503000010
Calculate the confidence interval of the modified ordinal ratio adjusted_sr by calculating the 95% confidence interval of adjusted_sr. In this example, the probability that the outcome event will occur after the target event occurs is
Figure 0007433503000011
To calculate the confidence interval of , use the following formula.
Figure 0007433503000012

ここで、nは計算に参加した患者の総数であり、

Figure 0007433503000013
は1.96を取る。 where n is the total number of patients participating in the calculation,
Figure 0007433503000013
takes 1.96.

ステップS44では、前記修正された順序比の信頼区間の下限が1よりも大きいシグナルを一次スクリーニング陽性シグナルとする。 In step S44, a signal for which the lower limit of the confidence interval of the corrected ordinal ratio is greater than 1 is determined to be a positive signal for the primary screening.

ステップS5では、前記一次スクリーニング陽性シグナルに対して因果評定を行い、前記対象薬物の有効性及び安全性を判定する。 In step S5, a causal evaluation is performed on the positive signal of the primary screening to determine the effectiveness and safety of the target drug.

ステップS51では、前記一次スクリーニング陽性シグナルに対応する前記対象薬物-有効性/安全性指標ペアに対して、前記データセットにおける前記対象イベントが発生した患者をスクリーニングし、前記患者をユーザキュー及び初期の非ユーザキューに割り当てる。 In step S51, a patient in the data set in which the target event has occurred is screened for the target drug-efficacy/safety index pair corresponding to the primary screening positive signal, and the patient is screened for the user cue and the initial Assign to non-user queues.

ステップS511では、前記一次スクリーニング陽性シグナルに対応する前記対象薬物-有効性/安全性指標ペアに対して、前記データセットにおける前記対象イベントが発生した患者をスクリーニングし、前記患者が受診した主要な診断を取得し、ICD-10コードに基づいて前記患者を統計し、前記患者数が最も多い主要な診断を基礎診断として、Dと記す。 In step S511, the patient in which the target event occurred in the data set is screened for the target drug-efficacy/safety index pair corresponding to the primary screening positive signal, and the main diagnosis that the patient received is screened. is obtained, statistics are made on the patients based on the ICD-10 code, and the main diagnosis with the largest number of patients is designated as the basic diagnosis and marked as D.

ステップS512では、前記患者をユーザキュー及び初期の非ユーザキューに割り当てる。 In step S512, the patient is assigned to a user queue and an initial non-user queue.

前記データセットから主要な診断が基礎診断である患者をスクリーニングし、以下の組込標準を満たすと、患者をユーザキューに割り当てる。(1)患者が対象薬物を連続的に服用していること(例えば、二回の投薬の間隔が30日未満である)、(2)患者が最初に処方箋を取得した時点は、基礎診断記録Dが発生した後であること、(3)最初に処方箋が与えられる前に、患者はデータセットにおいて少なくとも一年(365日)の診断及び治療記録を有すること。前記データセットから主要な診断が基礎診断である患者をスクリーニングし、対象薬物を使用していないと、初期の非ユーザキューに割り当てる。 Screen patients whose primary diagnosis is the underlying diagnosis from the data set and assign them to a user queue if they meet the following inclusion criteria: (1) the patient has been taking the drug continuously (e.g., less than 30 days have passed between two doses), and (2) the time the patient first obtained the prescription must be in the baseline diagnostic record. (3) the patient has at least one year (365 days) of diagnostic and treatment records in the dataset before the first prescription is given. Patients whose main diagnosis is the underlying diagnosis are screened from the data set and assigned to the initial non-user queue if they are not using the target drug.

ステップS52では、前記初期の非ユーザキューの患者が使用する薬物から一種の薬物を代替薬物としてランダムに選択し、非ユーザキューを構築する。 In step S52, one type of drug is randomly selected as an alternative drug from among the drugs used by the patient in the initial non-user queue, and a non-user queue is constructed.

薬物の効果を推定しようとする場合、ユーザキューと代替薬物が割り当てられる非ユーザキューとを比較する必要がある。代替薬物が特定されると、非ユーザキューは上記と同じ組込標準によって定義されるが、代替薬物に関連する。ユーザキューと非ユーザキューとの間の重複を回避するために、本実施例は更に非ユーザキューから対象薬物を使用するあらゆる患者を除外する。本実施例では、代替薬物は非ユーザキューの患者が使用するすべての薬物からランダムに選択されるものであり、対象薬物自体を含まない。このような非ユーザキューは対象薬物と同じ治療適応症を有する薬物とを直接比較し、それにより異なる適応症による混乱を減少する。 When trying to estimate the effect of a drug, it is necessary to compare user cues and non-user cues to which alternative drugs are assigned. Once an alternative drug is identified, non-user cues are defined by the same built-in standards as above, but related to the alternative drug. To avoid overlap between user and non-user queues, the present embodiment further excludes any patients using the target drug from the non-user queue. In this example, the alternative drug is randomly selected from all drugs used by patients in the non-user queue and does not include the target drug itself. Such non-user cues directly compare the drug of interest to drugs with the same therapeutic indication, thereby reducing confounding by different indications.

ステップS53では、前記対象薬物又は前記代替薬物の初回の使用時間を登録時間とし、前記対象薬物又は前記代替薬物の使用を治療方式とし、前記アウトカムイベントが発生するか否かを結果とし、前記患者が登録する前のベースラインデータを抽出し、前記データセットの人口統計的情報と前記ベースラインデータとを共変数セットとして構成し、特徴を抽出し、スクリーニングして平均治療効果を計算することに用いられる変数を得る。 In step S53, the first use time of the target drug or the alternative drug is set as a registration time, the use of the target drug or the alternative drug is set as a treatment method, and whether or not the outcome event occurs is set as a result, and the patient extracting baseline data before enrollment, configuring the demographic information of the dataset and the baseline data as a covariate set, extracting features, screening and calculating the average treatment effect. Get the variables used.

診断データは登録時間前の1年以内のデータを抽出し、化学検査結果、手術、臨床症状は登録時間前の1ヶ月以内のデータを抽出し、投薬情報は登録時間前の7日間以内のデータを抽出する。次に第1段階の対象最尤推定を起動して各ベースライン変数の重要性を評定し、更に平均治療効果の評定に用いられる交絡因子をスクリーニングする。 Diagnosis data is extracted from within one year before registration time, chemical test results, surgery, and clinical symptoms are extracted from within one month before registration time, and medication information is data from within 7 days before registration time. Extract. A first stage of targeted maximum likelihood estimation is then activated to assess the importance of each baseline variable and further screen for confounding factors used in assessing the average treatment effect.

ステップS531では、前記共変数セットから1つの共変数を選択し、前記共変数を重要性共変数と記し、前記共変数セットのうちの残りの変数を残りの変数と記す。 In step S531, one covariate is selected from the covariable set, the covariate is designated as an importance covariate, and the remaining variables in the covariable set are designated as remaining variables.

データセットにおいて、データ構造をO=(W,A,Y)とし、ここで、W=W,W,…,Wは共変数セットであり、本実施例において人口統計的情報及び抽出されたベースラインデータからなり、Aは治療方式、すなわち対象薬物を使用するか、それとも代替薬物を使用するかということであり、Yは結果、すなわちアウトカムイベントが発生するか否かということである。

Figure 0007433503000014
が重要性を評定しようとする重要性共変数であり、
Figure 0007433503000015
が残りの変数であるとする。 In the dataset, the data structure is O = (W, A, Y), where W = W 1 , W 2 , ..., W k is a covariate set, and in this example, demographic information and extracted A is the treatment method, i.e., whether to use the target drug or an alternative drug, and Y is the outcome, i.e., whether the outcome event occurs or not. .
Figure 0007433503000014
is the importance covariate whose importance is to be rated, and
Figure 0007433503000015
Let be the remaining variables.

ステップS532では、前記重要性共変数及び前記残りの変数が与えられた条件の下で、前記結果の条件付き期待値Eに対して、全体共変数を入力変数とするアウトカムイベント予測モデルを構築し、前記結果の条件付き期待値の推定値を得る。 In step S532, an outcome event prediction model using the overall covariate as an input variable is constructed for the conditional expected value E of the result under conditions given the importance covariate and the remaining variables. , obtain an estimate of the conditional expectation of the result.

重要性共変数

Figure 0007433503000016
、残りの変数
Figure 0007433503000017
が与えられた条件の下で、結果Yの条件付き期待値
Figure 0007433503000018
に対してフィッティング推定を行い、すなわち全体共変数Wを入力変数とするアウトカムイベント予測モデル
Figure 0007433503000019
を構築し、重要性を評定しようとする各重要性共変数
Figure 0007433503000020
に対して、
Figure 0007433503000021
の値は結果Yの条件付き期待値
Figure 0007433503000022
の推定値であり、ロジスティック回帰等の任意の機械学習分類方法を使用して、
Figure 0007433503000023
である場合の結果Yの条件付き期待値の推定値
Figure 0007433503000024
及び
Figure 0007433503000025
である場合の結果Yの条件付き期待値の推定値
Figure 0007433503000026
をそれぞれ計算することができる。 importance covariate
Figure 0007433503000016
, remaining variables
Figure 0007433503000017
The conditional expectation value of the outcome Y under the given conditions
Figure 0007433503000018
In other words, the outcome event prediction model uses the overall covariate W as an input variable.
Figure 0007433503000019
and evaluate the importance of each covariate.
Figure 0007433503000020
For,
Figure 0007433503000021
The value of is the conditional expected value of the outcome Y
Figure 0007433503000022
is an estimate of , using any machine learning classification method such as logistic regression,
Figure 0007433503000023
Estimate of the conditional expectation of outcome Y if
Figure 0007433503000024
as well as
Figure 0007433503000025
Estimate of the conditional expectation of outcome Y if
Figure 0007433503000026
can be calculated respectively.

ステップS533では、前記残りの変数が与えられた条件の下で、前記重要性共変数の値が1である確率を推定し、推定値を得る。 In step S533, the probability that the value of the importance covariate is 1 is estimated under the conditions given the remaining variables, and an estimated value is obtained.

残りの変数

Figure 0007433503000027
が設定された前提下で、重要性共変数
Figure 0007433503000028
が1である確率
Figure 0007433503000029
を推定し、
Figure 0007433503000030
と記し、ロジスティック回帰等の任意の機器学習分類方法を使用して、モデルをフィッティングした後に、残りの変数
Figure 0007433503000031
が設定された前提下で、重要性共変数
Figure 0007433503000032
が1である確率の推定値
Figure 0007433503000033
及び残りの変数
Figure 0007433503000034
が設定された前提下で、重要性共変数
Figure 0007433503000035
が0である確率の推定値
Figure 0007433503000036
を算出することもできる。 remaining variables
Figure 0007433503000027
The importance covariate under the assumption that
Figure 0007433503000028
The probability that is 1
Figure 0007433503000029
Estimate
Figure 0007433503000030
and after fitting the model using any instrumental learning classification method such as logistic regression, the remaining variables
Figure 0007433503000031
The importance covariate under the assumption that
Figure 0007433503000032
estimate of the probability that is 1
Figure 0007433503000033
and the remaining variables
Figure 0007433503000034
The importance covariate under the assumption that
Figure 0007433503000035
estimate of the probability that is 0
Figure 0007433503000036
It is also possible to calculate

ステップS534では、前記重要性共変数が1である確率の推定値を利用して変数重要性指示外乱変数を構築する。 In step S534, a variable importance indicating disturbance variable is constructed using the estimated value of the probability that the importance covariate is 1.

Figure 0007433503000037
により変数重要性指示外乱変数Hを構築する。
Figure 0007433503000038
Figure 0007433503000037
A variable importance indicating disturbance variable H j is constructed by .
Figure 0007433503000038

ここで、Iは指示関数であり、

Figure 0007433503000039
である場合、
Figure 0007433503000040
である。 Here, I is an indicator function,
Figure 0007433503000039
If it is,
Figure 0007433503000040
It is.

ステップS535では、前記結果の条件付き期待値の推定値を切片項とし、前記変数重要性指示外乱変数を入力変数とし、アウトカムイベント回帰モデルを構築し、変数重要性外乱パラメータを得る。 In step S535, the estimated value of the conditional expected value of the result is used as an intercept term, the variable importance indicating disturbance variable is used as an input variable, an outcome event regression model is constructed, and a variable importance disturbance parameter is obtained.

このとき、本実施例では、

Figure 0007433503000041
と結果Yの条件付き期待値
Figure 0007433503000042
との間に偏差があり、変数重要性外乱パラメータε
Figure 0007433503000043
を修正する必要がある。使用方法については、
Figure 0007433503000044
の値を切片項とし、アウトカムイベントと変数重要性指示外乱変数の回帰モデル、すなわち
Figure 0007433503000045
を構築し、モデルをフィッティングした後に、変数重要性指示外乱変数
Figure 0007433503000046
の係数は変数重要性外乱パラメータεである。 At this time, in this embodiment,
Figure 0007433503000041
and the conditional expected value of the outcome Y
Figure 0007433503000042
There is a deviation between the variable importance disturbance parameter ε j
Figure 0007433503000043
needs to be corrected. For instructions on how to use,
Figure 0007433503000044
A regression model of the outcome event and the disturbance variable indicating variable importance, with the value of as the intercept term, i.e.
Figure 0007433503000045
After building and fitting the model, the variable importance indicates the disturbance variable
Figure 0007433503000046
The coefficient of is the variable importance disturbance parameter ε j .

ステップS536では、前記変数重要性外乱パラメータ及び前記変数重要性指示外乱変数を利用して前記結果の条件付き期待値の推定値を更新し、変数重要性を算出する。 In step S536, the estimated value of the conditional expected value of the result is updated using the variable importance disturbance parameter and the variable importance indicating disturbance variable, and the variable importance is calculated.

Figure 0007433503000047
の更新を完了する。
Figure 0007433503000048
Figure 0007433503000047
Complete the update.
Figure 0007433503000048

変数重要性は下式で計算される。

Figure 0007433503000049
Variable importance is calculated using the following formula.
Figure 0007433503000049

ここで、nはデータセットの患者数であり、iはデータセットのi番目の記録である。 where n is the number of patients in the dataset and i is the i-th record in the dataset.

ステップS537では、前記変数重要性の標準偏差及び信頼区間を計算する。 In step S537, the standard deviation and confidence interval of the variable importance are calculated.

変数のスクリーニングを完了するために、変数重要性の標準偏差を計算する必要があり、計算式は以下のとおりである。

Figure 0007433503000050
In order to complete the variable screening, it is necessary to calculate the standard deviation of variable importance, and the calculation formula is as follows:
Figure 0007433503000050

ここで、

Figure 0007433503000051
であり、Varは標本分散を示し、従って、VIの95%信頼区間は
Figure 0007433503000052
である。 here,
Figure 0007433503000051
, Var indicates the sample variance, and therefore the 95% confidence interval of VI j is
Figure 0007433503000052
It is.

ステップS538では、前記共変数セットの各共変数をトラバースするまで、ステップS531~S537を繰り返し、変数重要性の標準偏差の左右信頼区間に零が含まれない変数を、平均治療効果を計算することに用いられる変数Wimportantとする。 In step S538, steps S531 to S537 are repeated until each covariate in the covariate set is traversed, and the average treatment effect is calculated for variables whose left and right confidence intervals of the standard deviation of variable importance do not include zero. Let the variable W important be used for

左右信頼区間

Figure 0007433503000053
の変数を、更に平均治療効果を行うための変数Wimportantとする。 left and right confidence interval
Figure 0007433503000053
The variable W is further defined as a variable W important for calculating the average treatment effect.

ステップS54では、平均治療効果を計算することに用いられる前記変数を利用して前記対象薬物の平均治療効果を計算する。 In step S54, the average therapeutic effect of the target drug is calculated using the variables used to calculate the average therapeutic effect.

本実施例に提案されたフレームワークは、対象薬物による複数種の薬物の有効性/安全性の臨床結果に対する影響を評定することができる。対象薬物による潜在的な結果Yに対する平均治療効果(Average Treatment Effect、ATE)をATE=E(Y)-E(Y)であるように定義し、ここで、E(Y),(a=0,1)は、シミュレートされた臨床試験においてすべての患者が治療aに割り当てられた場合、患者の完全な追跡調査期間内にアウトカムイベントが発生する可能性を示す。潜在的な結果は反事実と呼称され、理由としては、任意の所定の個人に対して、そのうちの1つだけが観察される。ランダム化比較試験では、治療方案がランダムに割り当てられたユーザキューと非ユーザキューとの間のアウトカムイベントの発生状況を測定し、E(Y)はE(Y|A=1)として直接推定でき、E(Y)はE(Y|A=0)として推定できる。しかし、リアルワールドの観察データでは、治療割り当ては常にランダムでないため、本実施例は二重ロバスト法で交絡因子による影響を最大限に排除する。本実施例では、非ユーザキューの患者が使用する薬物から復元方式で連続的に代替薬物をランダムに選択し、そのアウトカムイベントの発生状況とユーザキューとを比較することにより、平均治療効果(Average Treatment Effect、ATE)を計算し、ATEの計算式は以下のとおり定義される。

Figure 0007433503000054
The framework proposed in this example can evaluate the effect of a target drug on the clinical outcome of efficacy/safety of multiple types of drugs. Define the average treatment effect (ATE) on the potential outcome Y of the drug of interest to be ATE=E(Y 1 )−E(Y 0 ), where E(Y a ), ( a = 0, 1) indicates the probability that the outcome event would occur within the patient's complete follow-up period if all patients were assigned to treatment a in the simulated clinical trial. The potential outcomes are called counterfactuals because, for any given individual, only one of them is observed. In randomized controlled trials, the occurrence of outcome events between randomly assigned user cues and non-user cues is measured, and E(Y 1 ) is directly estimated as E(Y|A=1). and E(Y 0 ) can be estimated as E(Y|A=0). However, in real-world observational data, treatment assignment is not always random, so this example uses a double robust method to eliminate the influence of confounding factors to the maximum extent possible. In this example, alternative drugs are successively randomly selected from drugs used by patients with non-user cues in a restorative manner, and the average treatment effect (Average Treatment Effect, ATE) is calculated, and the calculation formula for ATE is defined as follows.
Figure 0007433503000054

ステップS541では、前記治療方式及び平均治療効果を計算することに用いられる前記変数を入力変数としてアウトカムイベント予測モデルを構築し、アウトカムイベントの条件付き期待値の推定値を得る。 In step S541, an outcome event prediction model is constructed using the treatment method and the variables used to calculate the average treatment effect as input variables, and an estimated value of the conditional expected value of the outcome event is obtained.

治療方式A、重要な変数Wimportantが与えられた条件の下で、結果Yの条件付き期待値E(Y│A,W)に対してフィッティング推定を行い、すなわち、前のステップでスクリーニングされた共変数

Figure 0007433503000055
を入力変数とするアウトカムイベント予測モデル
Figure 0007433503000056
を使用し、Q(A,W)の値を結果Yの条件付き期待値の推定値
Figure 0007433503000057
とする。このモデルの構築は、ロジスティック回帰等の任意の機械学習分類方法を使用して、A=0である場合の結果Yの条件付き期待値の推定値Q(0,W)及びA=1である場合の結果Yの条件付き期待値の推定値Q(1,W)をそれぞれ計算することができる。 For treatment scheme A, a fitting estimation is performed for the conditional expectation value E(Y|A,W) of outcome Y under the given conditions of the important variable W important , i.e., the value screened in the previous step. covariable
Figure 0007433503000055
Outcome event prediction model with input variables
Figure 0007433503000056
and let the value of Q 0 (A, W) be the estimate of the conditional expectation of the outcome Y
Figure 0007433503000057
shall be. The construction of this model uses any machine learning classification method, such as logistic regression, to estimate the conditional expectation of the outcome Y when A= 0 and An estimate Q 0 (1, W) of the conditional expected value of the outcome Y for a certain case can be calculated respectively.

ステップS542では、治療割り当ての確率を評定して治療割り当ての推定値を得る。 In step S542, the probability of treatment assignment is evaluated to obtain an estimate of treatment assignment.

治療割り当ての確率P(A|W)を推定し、g(A,W)と記し、該モデルは、ロジスティック回帰等の任意の機器学習分類方法を使用して、モデルをフィッティングした後に、治療割り当てA=1の確率の推定値g(1,W)及び治療割り当てA=0の確率の推定値g(0,W)を算出することもできる。 Estimate the probability of treatment assignment P(A|W) and denote it as g(A,W), and the model can be used to estimate the probability of treatment assignment after fitting the model using any instrumental learning classification method such as logistic regression. An estimate of the probability g(1,W) of A=1 and an estimate g(0,W) of the probability of treatment assignment A=0 can also be calculated.

ステップS543では、前記治療割り当ての推定値を利用して指示外乱変数を構築する。 In step S543, an instruction disturbance variable is constructed using the estimated value of the treatment assignment.

治療割り当ての推定値g(A,W)を使用して指示外乱変数H(A,W)を構築する。

Figure 0007433503000058
The treatment assignment estimate g(A,W) is used to construct the indicated disturbance variable H(A,W).
Figure 0007433503000058

ここで、Iは指示関数であり、A=1である場合、I(A=1)=1である。 Here, I is an indicator function, and when A=1, I(A=1)=1.

ステップS544では、前記治療方式及び前記平均治療効果の変数を入力として算出されたアウトカムイベントの条件付き期待値の推定値を切片項とし、前記アウトカムイベントと前記指示外乱変数の回帰モデルを構築し、推定外乱パラメータを得る。 In step S544, a regression model of the outcome event and the indicated disturbance variable is constructed using the estimated value of the conditional expected value of the outcome event calculated by inputting the variables of the treatment method and the average treatment effect as an intercept term, Obtain estimated disturbance parameters.

このとき、本実施例では、Q(A,W)とE(Y│A,W)との間に偏差があり、従って、推定外乱パラメータεでQ(A,W)を修正する必要がある。使用方法については、Q(A,W)の値を切片項とし、アウトカムイベントと指示外乱変数回帰モデル、すなわち

Figure 0007433503000059
を構築し、モデルをフィッティングした後に、指示外乱変数H(A,W)の係数は推定外乱パラメータεである。 At this time, in this example, there is a deviation between Q 0 (A, W) and E (Y|A, W), and therefore it is necessary to correct Q (A, W) with the estimated disturbance parameter ε. be. As for how to use it, the value of Q 0 (A, W) is used as the intercept term, and the outcome event and indicated disturbance variable regression model, i.e.
Figure 0007433503000059
After constructing and fitting the model, the coefficient of the indicated disturbance variable H(A,W) is the estimated disturbance parameter ε.

ステップS545では、前記推定外乱パラメータ及び前記指示外乱変数を利用して前記アウトカムイベントの条件付き期待値の推定値を更新し、平均治療効果を算出する。 In step S545, the estimated value of the conditional expected value of the outcome event is updated using the estimated disturbance parameter and the indicated disturbance variable, and the average treatment effect is calculated.

(A,W)の更新を完了する。

Figure 0007433503000060
Complete the update of Q 0 (A, W).
Figure 0007433503000060

ATEは下式で計算できる。

Figure 0007433503000061
ATE can be calculated using the formula below.
Figure 0007433503000061

ここで、n’はユーザキューの患者数と非ユーザキューにおける現在選択された代替薬物を使用している患者数であり、iは該データセットのi番目の記録である。 where n' is the number of patients in the user queue and the number of patients currently using the selected alternative drug in the non-user queue, and i is the i-th record of the data set.

ステップS55では、最大試験回数に達するまで、ステップS52~ステップS54を繰り返し、すべての前記平均治療効果の平均作用を計算し、前記平均作用の信頼区間を計算することにより前記対象薬物の有効性及び安全性を判定する。 In step S55, steps S52 to S54 are repeated until the maximum number of tests is reached, the average effect of all the average therapeutic effects is calculated, and the confidence interval of the average effect is calculated to determine the effectiveness of the target drug. Determine safety.

ステップS551では、最大試験回数に達するまで、ステップS52~ステップS54を繰り返し、すべての前記平均治療効果の平均作用を計算する。 In step S551, steps S52 to S54 are repeated until the maximum number of tests is reached, and the average effect of all the average treatment effects is calculated.

元の非ユーザキューの患者が服用している薬物の種類数nに基づいて最大試験回数rを特定する。

Figure 0007433503000062
The maximum number of tests r is determined based on the number n d of types of drugs taken by the patient in the original non-user queue.
Figure 0007433503000062

非ユーザキューで代替薬物をランダムに選択して試験を繰り返す回数がr回に達すると、対象薬物によるアウトカム指標に対する最終的な平均作用

Figure 0007433503000063
の計算は以下のとおりである。
Figure 0007433503000064
Once r trials are repeated with random selection of alternative drugs in the non-user cue, the final average effect of the target drug on the outcome measure
Figure 0007433503000063
The calculation is as follows.
Figure 0007433503000064

ここで、ATEは対象薬物とi回目にランダムに選択された代替薬物との平均治療効果である。 Here, ATE i is the average treatment effect of the target drug and the i-th randomly selected alternative drug.

ステップS552では、前記平均作用の信頼区間を計算し、左信頼区間が零よりも大きいシグナル又は右信頼区間が零よりも小さいシグナルを最終的な陽性シグナルとして取得し、前記対象薬物の有効性及び安全性を判定する。 In step S552, a confidence interval of the average effect is calculated, and a signal with a left confidence interval larger than zero or a signal with a right confidence interval smaller than zero is obtained as a final positive signal, and the effectiveness of the target drug is determined. Determine safety.

最終的に特定された薬物とアウトカム指標との因果効果を完了するために、さらに95%信頼区間

Figure 0007433503000065
を計算する必要があり、ここでσATEはサブランダムシミュレーションATEの標準偏差である。アウトカム指標が有効性指標である場合、
Figure 0007433503000066
のシグナルを最終的な陽性シグナルとして選択し、すなわち該薬物は対応する肯定的なアウトカムが発生すると見なし、アウトカム指標が安全性指標である場合、
Figure 0007433503000067
のシグナルを最終的な陽性シグナルとして選択し、すなわち該薬物は対応する安全性アウトカムが発生すると見なす。 An additional 95% confidence interval is used to complete the causal effect between the drug and the outcome measure finally identified.
Figure 0007433503000065
needs to be calculated, where σ ATE is the standard deviation of the subrandom simulation ATE. If the outcome measure is an effectiveness measure,
Figure 0007433503000066
is selected as the final positive signal, i.e. the drug is considered to produce the corresponding positive outcome, and the outcome indicator is a safety indicator;
Figure 0007433503000067
is selected as the final positive signal, ie the drug is considered to produce the corresponding safety outcome.

以上は本発明の好ましい実施例に過ぎず、本発明を制限するためのものではなく、当業者にとって、本発明は様々な変更や変化を有してもよい。本発明の精神及び原則内に行われるあらゆる修正、同等置換、改良等はいずれも本発明の保護範囲内に含まれるべきである。

The above are only preferred embodiments of the present invention and are not intended to limit the present invention, and the present invention may have various modifications and variations to those skilled in the art. Any modifications, equivalent substitutions, improvements, etc. made within the spirit and principles of the present invention should be included within the protection scope of the present invention.

Claims (6)

ハイスループットのリアルワールドにおける薬物の有効性及び安全性の評価方法であって、ステップS1~ステップS5を含み、
前記ステップS1では、リアルワールドデータを取得し、前記リアルワールドデータに対して統合データコーディングを行い、統合データコーディングの後に前記リアルワールドデータの必要最小限のデータを抽出し、データセットの構築を完了し、
前記ステップS2では、概念セットと行為と標準とを含むトリプレットモードを構築し、前記概念セットが1つ又は複数のデータコードで構成され、前記行為が一連の行為又は状態で構成され、前記標準が有効性/安全性指標のレベルの意味を表し、前記トリプレットモード、薬物の有効性/安全性用語セット、及び臨床指標により薬物の有効性/安全性指標表現型ライブラリを構築し、
前記ステップS3では、対象薬物を選択し、前記薬物の有効性/安全性指標表現型ライブラリから指標を選択し、対象薬物-有効性/安全性指標ペアを得て、対象イベント、アウトカムイベント、対象日付、アウトカム日付を定義し、患者ID、対象日付及びアウトカム日付を抽出し、ハイスループットのシグナル一次スクリーニングを行うデータセットを構成し、
前記ステップS3はサブステップS31~サブステップS33を含み、
前記サブステップS31では、前記対象薬物の初回の使用を対象イベントとし、前記薬物の有効性/安全性指標表現型ライブラリからユーザが選択した1つ又は複数の指標をアウトカム指標として構成し、各前記アウトカム指標の初回の発生をアウトカムイベントとし、
前記サブステップS32では、前記対象イベントの発生日付を対象日付とし、前記アウトカムイベントの発生日付をアウトカム日付とし、
前記サブステップS33では、前記対象イベント及び前記アウトカムイベントを選択し、前記データセットにおける前記対象イベントと前記アウトカムイベントの両方が発生した患者をスクリーニングし、患者ID、対象日付及びアウトカム日付を抽出し、ハイスループットのシグナル一次スクリーニングを行うデータセットを構成し、
前記ステップS4では、前記ハイスループットのシグナル一次スクリーニングのデータセットに対して、イベントシーケンス対称性分析で前記対象薬物-有効性/安全性指標ペアのハイスループットのシグナルスクリーニングを行い、一次スクリーニング陽性シグナルを取得し、
前記ステップS4はサブステップS41~サブステップS44を含み、
前記サブステップS41では、前記対象イベントが発生した後に前記アウトカムイベントが発生した人の数と前記対象イベントが発生する前に前記アウトカムイベントが発生した人の数との比を利用して順序比を計算し、
前記サブステップS42では、無効果順序比を計算し、前記無効果順序比を利用して前記サブステップS41の前記順序比を調整して、修正された順序比を取得し、
前記サブステップS43では、対象イベントが発生した後にアウトカムイベントが発生する確率の信頼区間を計算することにより、前記修正された順序比の信頼区間を計算し、
前記サブステップS44では、前記修正された順序比の信頼区間の下限が1よりも大きいシグナルを一次スクリーニング陽性シグナルとし、
前記ステップS5では、前記一次スクリーニング陽性シグナルに対して因果評定を行い、前記対象薬物の有効性及び安全性を判定し、
前記ステップS5はサブステップS51~サブステップS55を含み、
前記サブステップS51では、前記一次スクリーニング陽性シグナルに対応する前記対象薬物-有効性/安全性指標ペアに対して、前記データセットにおける前記対象イベントが発生した患者をスクリーニングし、前記患者をユーザキュー及び初期の非ユーザキューに割り当て、
前記サブステップS52では、前記初期の非ユーザキューの患者が使用する薬物から一種の薬物を代替薬物としてランダムに選択し、非ユーザキューを構築し、
前記サブステップS53では、前記対象薬物又は前記代替薬物の初回の使用時間を登録時間とし、前記対象薬物又は前記代替薬物の使用を治療方式とし、前記アウトカムイベントが発生するか否かを結果とし、前記患者が登録する前のベースラインデータを抽出し、前記データセットの人口統計的情報と前記ベースラインデータとを共変数セットとして構成し、特徴を抽出し、スクリーニングして平均治療効果を計算することに用いられる変数を取得し、
前記サブステップS53は、具体的に、サブステップS531~サブステップS538を含み、
前記サブステップS531では、前記共変数セットから1つの共変数を選択し、前記共変数を重要性共変数と記し、前記共変数セットのうちの残りの変数を残りの変数と記し、具体的には、前記データセットにおいて、そのデータ構造をO=(W,A,Y)とし、ここで、W=W ,W ,…,W は共変数セットであって、人口統計的情報及び抽出されたベースラインデータからなり、Aは治療方式、すなわち対象薬物を使用するか、それとも代替薬物を使用するかということであり、Yは結果、すなわちアウトカムイベントが発生するか否かということであり、
Figure 0007433503000068
が重要性を評定しようとする重要性共変数であり、
Figure 0007433503000069
が残りの変数であり、
前記サブステップS532では、前記重要性共変数及び前記残りの変数が与えられた条件の下で、前記結果の条件付き期待値に対して、全体共変数を入力変数とするアウトカムイベント予測モデルを構築し、前記結果の条件付き期待値の推定値を取得し、具体的には、重要性共変数
Figure 0007433503000070
、残りの変数
Figure 0007433503000071
が与えられた条件の下で、結果Yの条件付き期待値
Figure 0007433503000072
に対してフィッティング推定を行い、すなわち全体共変数Wを入力変数とするアウトカムイベント予測モデル
Figure 0007433503000073
を構築し、重要性を評定しようとする各重要性共変数
Figure 0007433503000074
に対して、
Figure 0007433503000075
の値は結果Yの条件付き期待値
Figure 0007433503000076
の推定値であり、ロジスティック回帰等の任意の機械学習分類方法を使用して、
Figure 0007433503000077
である場合の結果Yの条件付き期待値の推定値
Figure 0007433503000078
及び
Figure 0007433503000079
である場合の結果Yの条件付き期待値の推定値
Figure 0007433503000080
をそれぞれ計算し、
前記サブステップS533では、前記残りの変数が与えられた条件の下で、前記重要性共変数の値が1である確率を推定し、推定値を取得し、具体的には、残りの変数
Figure 0007433503000081
が設定された前提下で、重要性共変数
Figure 0007433503000082
が1である確率
Figure 0007433503000083
を推定し、
Figure 0007433503000084
と記し、ロジスティック回帰等の任意の機器学習分類方法を使用して、モデルをフィッティングした後に、残りの変数
Figure 0007433503000085
が設定された前提下で、重要性共変数
Figure 0007433503000086
が1である確率の推定値
Figure 0007433503000087
及び残りの変数
Figure 0007433503000088
が設定された前提下で、重要性共変数
Figure 0007433503000089
が0である確率の推定値
Figure 0007433503000090
を算出し、
前記サブステップS534では、前記重要性共変数が1である確率の推定値を利用して変数重要性指示外乱変数を構築し、具体的には、
Figure 0007433503000091
により変数重要性指示外乱変数H を構築し、
Figure 0007433503000092
ここで、Iは指示関数であり、
Figure 0007433503000093
である場合、
Figure 0007433503000094
であり、
前記サブステップS535では、前記結果の条件付き期待値の推定値を切片項とし、前記変数重要性指示外乱変数を入力変数とし、アウトカムイベント回帰モデルを構築し、変数重要性外乱パラメータを取得し、具体的には、
Figure 0007433503000095
と結果Yの条件付き期待値
Figure 0007433503000096
との間に偏差がある場合に、変数重要性外乱パラメータε
Figure 0007433503000097
を修正し、修正する方法は、
Figure 0007433503000098
の値を切片項とし、アウトカムイベントと変数重要性指示外乱変数の回帰モデル、すなわち
Figure 0007433503000099
を構築し、モデルをフィッティングした後に、変数重要性指示外乱変数
Figure 0007433503000100
の係数が変数重要性外乱パラメータε であることであり、
前記サブステップS536では、前記変数重要性外乱パラメータ及び前記変数重要性指示外乱変数を利用して前記結果の条件付き期待値の推定値を更新し、変数重要性を算出し、具体的には、以下の式8で
Figure 0007433503000101
の更新を完了し、
Figure 0007433503000102
変数重要性は以下の式9で計算され、
Figure 0007433503000103
ここで、nはデータセットの患者数であり、iはデータセットのi番目の記録であり、
前記サブステップS537では、前記変数重要性の標準偏差及び信頼区間を計算し、具体的には、変数のスクリーニングを完了するために、変数重要性の標準偏差を計算する必要があり、計算式は以下の式10に示され、
Figure 0007433503000104
ここで、
Figure 0007433503000105
であり、Varは標本分散を示し、VI の95%信頼区間は
Figure 0007433503000106
であり、
前記サブステップS538では、前記共変数セットの各共変数をトラバースするまで、前記サブステップS531~前記サブステップS537を繰り返し、変数重要性の標準偏差の左右信頼区間に零が含まれない変数を、平均治療効果を計算することに用いられる変数とし、具体的には、左右信頼区間
Figure 0007433503000107
の変数を、更に平均治療効果を行うための変数とし、
前記サブステップS54では、平均治療効果を計算することに用いられる前記変数を利用して前記対象薬物の平均治療効果を計算し、
前記サブステップS55では、最大試験回数に達するまで、前記サブステップS52~前記サブステップS54を繰り返し、すべての前記平均治療効果の平均作用を計算し、前記平均作用の信頼区間を計算することにより前記対象薬物の有効性及び安全性を判定する
ことを特徴とするハイスループットのリアルワールドにおける薬物の有効性及び安全性の評価方法。
A high-throughput real-world evaluation method for drug efficacy and safety, comprising steps S1 to S5,
In step S1, real world data is acquired, integrated data coding is performed on the real world data, and after the integrated data coding, the minimum necessary data of the real world data is extracted to complete the construction of the dataset. death,
In step S2, a triplet mode is constructed that includes a concept set, an action, and a standard, the concept set is composed of one or more data codes, the action is composed of a series of actions or states, and the standard is representing the meaning of the level of efficacy/safety index, constructing a drug efficacy/safety index phenotype library according to the triplet mode, drug efficacy/safety term set, and clinical index;
In step S3, a target drug is selected, an indicator is selected from the efficacy/safety indicator phenotype library of the drug, a target drug-efficacy/safety indicator pair is obtained, and a target event, outcome event, and target Define date, outcome date, extract patient ID, target date and outcome date, configure a dataset for high-throughput signal primary screening,
The step S3 includes sub-steps S31 to S33,
In the sub-step S31, the first use of the target drug is set as a target event, one or more indicators selected by the user from the drug efficacy/safety indicator phenotype library are configured as an outcome indicator, and each of the above-mentioned The first occurrence of an outcome indicator is an outcome event,
In the sub-step S32, the date of occurrence of the target event is set as a target date, the date of occurrence of the outcome event is set as an outcome date,
In the sub-step S33, the target event and the outcome event are selected, the patients in the dataset in which both the target event and the outcome event occur are screened, and the patient ID, target date, and outcome date are extracted; Construct a dataset for high-throughput signal primary screening,
In step S4, high-throughput signal screening of the target drug-efficacy/safety indicator pair is performed on the data set of the high-throughput signal primary screening using event sequence symmetry analysis, and positive signals of the primary screening are detected. Acquired,
The step S4 includes sub-steps S41 to S44,
In the sub-step S41, the ordinal ratio is calculated using the ratio of the number of people for whom the outcome event occurred after the target event occurred and the number of people for whom the outcome event occurred before the target event occurred. calculate,
In the sub-step S42, an ineffective ordinal ratio is calculated, and the ineffective ordinal ratio is used to adjust the ordinal ratio in the sub-step S41 to obtain a modified ordinal ratio;
In the sub-step S43, a confidence interval of the modified ordinal ratio is calculated by calculating a confidence interval of the probability that the outcome event occurs after the target event occurs;
In the sub-step S44, a signal in which the lower limit of the confidence interval of the modified ordinal ratio is greater than 1 is determined to be a primary screening positive signal;
In step S5, a causal evaluation is performed on the positive signal of the primary screening to determine the effectiveness and safety of the target drug,
The step S5 includes sub-steps S51 to S55,
In the sub-step S51, patients in the data set in which the target event has occurred are screened for the target drug-efficacy/safety indicator pair corresponding to the primary screening positive signal, and the patients are screened in the user queue and Assign to the initial non-user queue,
In the sub-step S52, a type of drug is randomly selected as an alternative drug from among the drugs used by the patient in the initial non-user cue, and a non-user cue is constructed;
In the sub-step S53, the first use time of the target drug or the alternative drug is the registration time, the use of the target drug or the alternative drug is the treatment method, and whether or not the outcome event occurs is determined as the result; extracting baseline data before the patient enrolls, configuring the demographic information of the dataset and the baseline data as a covariate set, extracting features, screening and calculating an average treatment effect; Get the variables used in
The sub-step S53 specifically includes sub-steps S531 to S538,
In the sub-step S531, one covariate is selected from the covariable set, the covariate is designated as an importance covariate, the remaining variables in the covariable set are designated as remaining variables, and specifically, In the data set, the data structure is O=(W, A, Y), where W=W 1 , W 2 ,..., W k is a set of covariates, including demographic information and Consisting of extracted baseline data, A is the treatment method, i.e. whether to use the target drug or an alternative drug, and Y is the outcome, i.e. whether the outcome event occurs or not. can be,
Figure 0007433503000068
is the importance covariate whose importance is to be rated, and
Figure 0007433503000069
are the remaining variables,
In the sub-step S532, an outcome event prediction model using the overall covariate as an input variable is constructed for the conditional expected value of the result under conditions given the importance covariate and the remaining variables. and obtain an estimate of the conditional expected value of the outcome, specifically, the importance covariate
Figure 0007433503000070
, remaining variables
Figure 0007433503000071
The conditional expectation value of the outcome Y under the given conditions
Figure 0007433503000072
In other words, the outcome event prediction model uses the overall covariate W as an input variable.
Figure 0007433503000073
and evaluate the importance of each covariate.
Figure 0007433503000074
For,
Figure 0007433503000075
The value of is the conditional expected value of the outcome Y
Figure 0007433503000076
is an estimate of , using any machine learning classification method such as logistic regression,
Figure 0007433503000077
Estimate of the conditional expectation of outcome Y if
Figure 0007433503000078
as well as
Figure 0007433503000079
Estimate of the conditional expectation of outcome Y if
Figure 0007433503000080
Calculate each of
In the sub-step S533, the probability that the value of the importance covariate is 1 is estimated under the condition that the remaining variables are given, and the estimated value is obtained.
Figure 0007433503000081
The importance covariate under the assumption that
Figure 0007433503000082
The probability that is 1
Figure 0007433503000083
Estimate
Figure 0007433503000084
and after fitting the model using any instrumental learning classification method such as logistic regression, the remaining variables
Figure 0007433503000085
The importance covariate under the assumption that
Figure 0007433503000086
estimate of the probability that is 1
Figure 0007433503000087
and the remaining variables
Figure 0007433503000088
The importance covariate under the assumption that
Figure 0007433503000089
estimate of the probability that is 0
Figure 0007433503000090
Calculate,
In the sub-step S534, a variable importance indicating disturbance variable is constructed using the estimated value of the probability that the importance covariate is 1, and specifically,
Figure 0007433503000091
Construct the variable importance indicating disturbance variable H j by
Figure 0007433503000092
Here, I is an indicator function,
Figure 0007433503000093
If it is,
Figure 0007433503000094
and
In the sub-step S535, the estimated value of the conditional expected value of the result is used as an intercept term, the variable importance indicating disturbance variable is used as an input variable, an outcome event regression model is constructed, and a variable importance disturbance parameter is obtained; in particular,
Figure 0007433503000095
and the conditional expected value of the outcome Y
Figure 0007433503000096
If there is a deviation between the variable importance disturbance parameter ε j
Figure 0007433503000097
How to fix and fix
Figure 0007433503000098
A regression model of the outcome event and the disturbance variable indicating variable importance, with the value of as the intercept term, i.e.
Figure 0007433503000099
After building and fitting the model, the variable importance indicates the disturbance variable
Figure 0007433503000100
The coefficient of is the variable importance disturbance parameter ε j ,
In the sub-step S536, the estimated value of the conditional expected value of the result is updated using the variable importance disturbance parameter and the variable importance indicating disturbance variable, and the variable importance is calculated. Specifically, In the following equation 8
Figure 0007433503000101
Complete the update of
Figure 0007433503000102
The variable importance is calculated by Equation 9 below,
Figure 0007433503000103
where n is the number of patients in the dataset, i is the i-th record in the dataset,
In the sub-step S537, the standard deviation and confidence interval of the variable importance are calculated, specifically, in order to complete the variable screening, it is necessary to calculate the standard deviation of the variable importance, and the calculation formula is As shown in equation 10 below,
Figure 0007433503000104
here,
Figure 0007433503000105
, Var indicates the sample variance, and the 95% confidence interval of VI j is
Figure 0007433503000106
and
In the sub-step S538, the sub-steps S531 to S537 are repeated until each covariate of the covariate set is traversed, and the variables whose left and right confidence intervals of the standard deviation of variable importance do not include zero are Variables used to calculate the average treatment effect, specifically the left and right confidence intervals
Figure 0007433503000107
Further, the variables are used as variables for calculating the average treatment effect,
In the sub-step S54, the average therapeutic effect of the target drug is calculated using the variables used to calculate the average therapeutic effect,
In the sub-step S55, the sub-step S52 to the sub-step S54 are repeated until the maximum number of tests is reached, the average effect of all the average treatment effects is calculated, and the confidence interval of the average effect is calculated. A high-throughput, real-world evaluation method for drug efficacy and safety, characterized by determining the efficacy and safety of a target drug.
前記サブステップS42は、具体的に、サブステップS421~サブステップS423を含み、
前記サブステップS421では、ハイスループットのシグナル一次スクリーニングを行う前記データセットに対して、前記対象イベントが発生した後の予め設定された観察窓内で前記アウトカムイベントが発生する全体の平均確率を計算し、
前記サブステップS422では、前記全体の平均確率を利用して無効果順序比を算出し、
前記サブステップS423では、前記サブステップS41の前記順序比と前記無効果順序比との比を計算して、修正された順序比を得る
ことを特徴とする請求項1に記載のハイスループットのリアルワールドにおける薬物の有効性及び安全性の評価方法。
The sub-step S42 specifically includes sub-steps S421 to S423,
In the sub-step S421, the overall average probability that the outcome event occurs within a preset observation window after the target event occurs is calculated for the data set that performs high-throughput signal primary screening. ,
In the sub-step S422, a no-effect order ratio is calculated using the overall average probability,
The high-throughput real-time processing according to claim 1, characterized in that, in the sub-step S423, a ratio between the ordinal ratio in the sub-step S41 and the ineffective ordinal ratio is calculated to obtain a modified ordinal ratio. Methods for evaluating drug efficacy and safety in the world.
前記サブステップS51は、具体的に、サブステップS511~サブステップS512を含み、
前記サブステップS511では、前記一次スクリーニング陽性シグナルに対応する前記対象薬物-有効性/安全性指標ペアに対して、前記データセットにおける前記対象イベントが発生した患者をスクリーニングし、前記患者が受診した主要な診断を取得し、ICD-10コードに基づいて前記患者を統計し、前記患者数が最も多い主要な診断を基礎診断とし、
前記サブステップS512では、前記患者をユーザキュー及び初期の非ユーザキューに割り当てる
ことを特徴とする請求項1に記載のハイスループットのリアルワールドにおける薬物の有効性及び安全性の評価方法。
The sub- step S51 specifically includes sub-steps S511 to S512,
In the sub-step S511, the patient in which the target event occurred in the data set is screened for the target drug-efficacy/safety index pair corresponding to the primary screening positive signal, and obtain a diagnosis of the patient, perform statistics on the patient based on the ICD-10 code, and set the main diagnosis with the largest number of patients as the basic diagnosis;
The method of claim 1, wherein the sub-step S512 assigns the patient to a user queue and an initial non-user queue.
前記サブステップS54は、具体的に、サブステップS541~サブステップS545を含み、
前記サブステップS541では、前記治療方式及び平均治療効果を計算することに用いられる前記変数を入力変数としてアウトカムイベント予測モデルを構築し、アウトカムイベントの条件付き期待値の推定値を取得し、
前記サブステップS542では、治療割り当ての確率を評定して治療割り当ての推定値を取得し、
前記サブステップS543では、前記治療割り当ての推定値を利用して指示外乱変数を構築し、
前記サブステップS544では、前記治療方式及び前記平均治療効果の変数を入力として算出されたアウトカムイベントの条件付き期待値の推定値を切片項とし、前記アウトカムイベントと前記指示外乱変数の回帰モデルを構築し、推定外乱パラメータを取得し、
前記サブステップS545では、前記推定外乱パラメータ及び前記指示外乱変数を利用して前記アウトカムイベントの条件付き期待値の推定値を更新し、平均治療効果を算出する
ことを特徴とする請求項1に記載のハイスループットのリアルワールドにおける薬物の有効性及び安全性の評価方法。
The sub- step S54 specifically includes sub-steps S541 to S545,
In the sub-step S541, an outcome event prediction model is constructed using the treatment method and the variables used to calculate the average treatment effect as input variables, and an estimated value of the conditional expected value of the outcome event is obtained;
The sub-step S542 evaluates the probability of treatment assignment to obtain an estimate of treatment assignment;
In the sub-step S543, an instruction disturbance variable is constructed using the estimated value of the treatment assignment;
In the sub-step S544, a regression model of the outcome event and the indicated disturbance variable is constructed using the estimated value of the conditional expected value of the outcome event calculated by inputting the variables of the treatment method and the average treatment effect as an intercept term. and obtain the estimated disturbance parameters,
According to claim 1, in the sub-step S545, the estimated value of the conditional expected value of the outcome event is updated using the estimated disturbance parameter and the indicated disturbance variable, and an average treatment effect is calculated. A high-throughput, real-world method for evaluating drug efficacy and safety.
前記サブステップS55は、具体的に、サブステップS551~サブステップS552を含み、
前記サブステップS551では、最大試験回数に達するまで、前記サブステップS52~前記サブステップS54を繰り返し、すべての前記平均治療効果の平均作用を計算し、
前記サブステップS552では、前記平均作用の信頼区間を計算し、左信頼区間が零よりも大きいシグナル又は右信頼区間が零よりも小さいシグナルを最終的な陽性シグナルとして取得し、前記対象薬物の有効性及び安全性を判定する
ことを特徴とする請求項1に記載のハイスループットのリアルワールドにおける薬物の有効性及び安全性の評価方法。
The sub- step S55 specifically includes sub-steps S551 to S552,
In the sub-step S551, repeat the sub-steps S52 to S54 until the maximum number of tests is reached, and calculate the average effect of all the average treatment effects,
In the sub-step S552, a confidence interval of the average effect is calculated, and a signal with a left confidence interval larger than zero or a signal with a right confidence interval smaller than zero is obtained as a final positive signal, and the effectiveness of the target drug is determined. 2. The high-throughput, real-world evaluation method for drug efficacy and safety according to claim 1, wherein the method comprises determining the efficacy and safety of a drug.
請求項1~のいずれか1項に記載のハイスループットのリアルワールドにおける薬物の有効性及び安全性の評価方法に基づくシステムであって、データ収集モジュール、ハイスループットのシグナルスクリーニングモジュール、因果評定モジュール及び結果表示モジュールを含み、
前記データ収集モジュールは、既存のデータからデータを取得し、前記データをクリーニングしてデータセットの構築を完了することに用いられ、
前記ハイスループットのシグナルスクリーニングモジュールは、前記データセットにおけるデータを臨床イベントに変換し、イベントシーケンス対称性分析でハイスループットのシグナルスクリーニングを行い、一次スクリーニング陽性シグナルを得ることに用いられ、
前記因果評定モジュールは、前記一次スクリーニング陽性シグナルに対して因果評定を行い、前記対象薬物の有効性及び安全性を判定することに用いられ、
前記結果表示モジュールは、前記対象薬物の有効性及び安全性の結果を表示することに用いられる
ことを特徴とするハイスループットのリアルワールドにおける薬物の有効性及び安全性の評価システム。
A system based on the high-throughput real-world drug efficacy and safety evaluation method according to any one of claims 1 to 5 , comprising a data collection module, a high-throughput signal screening module, and a causal evaluation module. and a result display module,
the data collection module is used to obtain data from existing data and clean the data to complete the construction of the dataset;
The high-throughput signal screening module is used to convert data in the dataset into clinical events, perform high-throughput signal screening with event sequence symmetry analysis, and obtain a primary screening positive signal;
The causal evaluation module performs causal evaluation on the positive signal of the primary screening, and is used to determine the effectiveness and safety of the target drug,
A high-throughput real-world drug efficacy and safety evaluation system, wherein the result display module is used to display efficacy and safety results of the target drug.
JP2023095912A 2022-08-31 2023-06-09 High-throughput real-world drug efficacy and safety evaluation methods and systems Active JP7433503B1 (en)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
CN202211051408.2 2022-08-31
CN202211051408.2A CN115148375B (en) 2022-08-31 2022-08-31 High-throughput real world drug effectiveness and safety evaluation method and system

Publications (2)

Publication Number Publication Date
JP7433503B1 true JP7433503B1 (en) 2024-02-19
JP2024035072A JP2024035072A (en) 2024-03-13

Family

ID=83415505

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2023095912A Active JP7433503B1 (en) 2022-08-31 2023-06-09 High-throughput real-world drug efficacy and safety evaluation methods and systems

Country Status (2)

Country Link
JP (1) JP7433503B1 (en)
CN (1) CN115148375B (en)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115424741B (en) * 2022-11-02 2023-03-24 之江实验室 Adverse drug reaction signal discovery method and system based on cause and effect discovery
CN116504423B (en) * 2023-06-26 2023-09-26 北京大学 Drug effectiveness evaluation method
CN117334347B (en) * 2023-12-01 2024-03-22 北京大学 Method, device, equipment and storage medium for evaluating treatment effect

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111933242A (en) 2020-08-12 2020-11-13 陈灿 Medicine usage coding information processing method, system, storage medium and terminal

Family Cites Families (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101603088A (en) * 2009-07-16 2009-12-16 张俊 The method and system of the dependency of assessment gene order and pharmacological reaction of medicament
KR20120124234A (en) * 2011-05-03 2012-11-13 (주)제이브이엠 Automatic reinspection system and the method of prescription drugs
US10614196B2 (en) * 2014-08-14 2020-04-07 Accenture Global Services Limited System for automated analysis of clinical text for pharmacovigilance
CN105139083A (en) * 2015-08-10 2015-12-09 石庆平 Method and system for reevaluating safety of drug after appearance on market
JP7390711B2 (en) * 2017-05-12 2023-12-04 ザ・リージェンツ・オブ・ザ・ユニバーシティ・オブ・ミシガン Individual and cohort pharmacological phenotype prediction platform
CN107480443A (en) * 2017-08-08 2017-12-15 复旦大学附属儿科医院 A kind of clinical drug integrated evaluating method based on real world
BR112020019087A2 (en) * 2018-03-23 2020-12-29 F. Hoffmann-La Roche Ag METHODS FOR TRACKING AN INDIVIDUAL AS TO THE RISK OF CHRONIC KIDNEY DISEASE AND METHOD IMPLEMENTED BY COMPUTER
CN111145845A (en) * 2019-12-20 2020-05-12 四川大学华西第二医院 Block chain based anti-tumor drug grading management and tracking medication compliance system
CN111599480B (en) * 2020-04-20 2022-12-02 国家药品监督管理局药品评价中心(国家药品不良反应监测中心) Method, device, terminal and readable medium for evaluating adverse drug reactions
CN113035369B (en) * 2021-03-10 2021-12-03 浙江大学 Construction method of kidney transplantation anti-infective drug dosage prediction model
CN114025253A (en) * 2021-11-05 2022-02-08 杭州联众医疗科技股份有限公司 Drug efficacy evaluation system based on real world research
CN114300158A (en) * 2021-12-28 2022-04-08 刘玉强 Method and device for identifying adverse drug reactions

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111933242A (en) 2020-08-12 2020-11-13 陈灿 Medicine usage coding information processing method, system, storage medium and terminal

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
佐藤 睦美,ライフサイエンス産業戦略バイブル,第1版,日本,株式会社東急エージェンシー,2021年02月16日,pp. 77-78, 102, 139-141
新谷 歩,みんなの医療統計 多変量解析編 10日間で基礎理論とEZRを完全マスター!,第4刷,日本,株式会社講談社,2018年04月16日,pp. 25-38

Also Published As

Publication number Publication date
CN115148375A (en) 2022-10-04
JP2024035072A (en) 2024-03-13
CN115148375B (en) 2022-11-15

Similar Documents

Publication Publication Date Title
JP7433503B1 (en) High-throughput real-world drug efficacy and safety evaluation methods and systems
US5993386A (en) Computer assisted method for the diagnosis and treatment of illness
JP4781710B2 (en) Treatment effect prediction system and program thereof
Hlatky et al. Tying clinical research to patient care by use of an observational database
Lix et al. Using multiple data features improved the validity of osteoporosis case ascertainment from administrative databases
KR20180064952A (en) Apparatus and method for predicting health information using big data
WO2009114795A2 (en) Non-natural pattern identification for cognitive assessment
Ryder et al. Decision analysis and cost-effectiveness analysis
WO2010005656A2 (en) Brain condition assessment
Mullainathan et al. A machine learning approach to low-value health care: wasted tests, missed heart attacks and mis-predictions
US20220051795A1 (en) Analysis system and analysis method
Pinhasi et al. Epidemiological approaches in palaeopathology
EP3799064A1 (en) Analysis system and analysis method
DeSisto et al. Hypertension at delivery hospitalization–United States, 2016–2017
Batista‐Foguet et al. Using structural equation models to evaluate the magnitude of measurement error in blood pressure
Thornley et al. Estimating diabetes prevalence in South Auckland: how accurate is a method that combines lists of linked health datasets?
Chui et al. Variation in hospital use of cardiac resynchronization therapy-defibrillator among eligible patients and association with clinical outcomes
Kavya et al. Heart Disease Prediction Using Logistic Regression
Flanders et al. Quality of health care surveillance systems: review and implementation in the Swiss setting
KR102650936B1 (en) Mental health risk signal detection system, and mental health risk signal detection method using thereof
Vardhana et al. CARDIAC DISEASE PREDICTION USING RANDOM FOREST WITH LINEAR MODEL
JP6960369B2 (en) Analytical system and analytical method
Wang et al. Causal Evaluation of Post-Marketing Drugs for Drug-induced Liver Injury from Electronic Health Records
Holt et al. A nationwide adaptive prediction tool for coronary heart disease prevention.
Queyam et al. Simulation and Analysis of Heart Disease Predictor Using Machine Learning Techniques

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20230609

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20230705

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20230922

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20231110

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20240131

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20240206

R150 Certificate of patent or registration of utility model

Ref document number: 7433503

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150