JP2022545017A - Unsupervised Learning and Treatment Line Prediction from High-Dimensional Time Series Drug Data - Google Patents

Unsupervised Learning and Treatment Line Prediction from High-Dimensional Time Series Drug Data Download PDF

Info

Publication number
JP2022545017A
JP2022545017A JP2022511315A JP2022511315A JP2022545017A JP 2022545017 A JP2022545017 A JP 2022545017A JP 2022511315 A JP2022511315 A JP 2022511315A JP 2022511315 A JP2022511315 A JP 2022511315A JP 2022545017 A JP2022545017 A JP 2022545017A
Authority
JP
Japan
Prior art keywords
treatment
therapy
interval
patient
lot
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2022511315A
Other languages
Japanese (ja)
Other versions
JPWO2021035224A5 (en
Inventor
マシュー・バーバー
ライアン・モーク
Original Assignee
テンパス・ラボズ・インコーポレイテッド
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by テンパス・ラボズ・インコーポレイテッド filed Critical テンパス・ラボズ・インコーポレイテッド
Publication of JP2022545017A publication Critical patent/JP2022545017A/en
Publication of JPWO2021035224A5 publication Critical patent/JPWO2021035224A5/ja
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/60ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/213Feature extraction, e.g. by transforming the feature space; Summarisation; Mappings, e.g. subspace methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N7/00Computing arrangements based on specific mathematical models
    • G06N7/01Probabilistic graphical models, e.g. probabilistic networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/7715Feature extraction, e.g. by transforming the feature space, e.g. multi-dimensional scaling [MDS]; Mappings, e.g. subspace methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/19Recognition using electronic means
    • G06V30/191Design or setup of recognition systems or techniques; Extraction of features in feature space; Clustering techniques; Blind source separation
    • G06V30/19173Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/413Classification of content, e.g. text, photographs or tables
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H15/00ICT specially adapted for medical reports, e.g. generation or transmission thereof
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H20/00ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance
    • G16H20/10ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance relating to drugs or medications, e.g. for ensuring correct administration to patients
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/70ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for mining of medical data, e.g. analysing previous cases of other patients
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Abstract

一態様において、本開示は、患者に同時投与される1つまたは複数の薬剤を治療ラインとしてラベル付けするための方法を提供する。この方法は、複数のデジタル記録から患者の医療記録を識別することと、医療記録のサブセットから、患者に投与された少なくとも1つの薬剤と時間間隔とを含む複数の治療間隔を作成することと、薬剤の投与が時間間隔内に収まるときに1つまたは複数の治療の薬剤をそれぞれの治療間隔に関連付けることと、1つまたは複数の治療のうちの1つの治療がその時間間隔から外れているが、延長期間内にあるときにそれぞれの治療間隔の時間間隔を精緻化することと、複数の治療間隔から1つまたは複数の潜在的治療ラインを識別することと、最高の最尤推定を有する潜在的治療ラインを治療ラインとしてラベル付けすることとを含む。In one aspect, the present disclosure provides a method for labeling one or more agents co-administered to a patient as a line of therapy. The method comprises: identifying a patient medical record from a plurality of digital records; creating from a subset of the medical records a plurality of treatment intervals including at least one drug administered to the patient and a time interval; Associating one or more therapeutic agents with their respective treatment intervals when the administration of the agents falls within the time interval and one treatment of the one or more treatments falling outside that time interval , refining the time interval for each treatment interval when within the extension period, identifying one or more potential treatment lines from multiple treatment intervals, and identifying the potential treatment line(s) with the highest maximum likelihood estimate. and labeling the therapeutic line of treatment as a therapeutic line.

Description

関連出願の相互参照
本出願は、内容全体が参照により本明細書に組み込まれている、2019年8月22日に出願した米国仮特許出願第62/890,178号、名称「Unsupervised Learning And Prediction Of Lines Of Therapy From High-Dimensional Longitudinal Medications Data」の優先権の利益を主張するものである。
CROSS-REFERENCE TO RELATED APPLICATIONS This application is the subject of U.S. Provisional Patent Application No. 62/890,178, entitled "Unsupervised Learning And Prediction Of Lines," filed Aug. 22, 2019, the entire contents of which are incorporated herein by reference. of Therapy From High-Dimensional Longitudinal Medications Data”.

本開示は、患者記録内に存在する治療ラインにラベル付けするための、コンピュータで実装される方法およびシステムに関係し、より詳細には、薬剤データから治療ラインをラベル付けするための教師なしアプローチに関係する。 FIELD OF THE DISCLOSURE The present disclosure relates to computer-implemented methods and systems for labeling lines of care present in patient records, and more particularly, unsupervised approaches for labeling lines of care from drug data. related to

治療ライン(LoT)は、抗悪性腫瘍薬による治療を議論するための標準的な命名法である。標準治療(SoC)の治療ガイドラインを発行する団体であるNational Comprehensive Cancer NetworkおよびAssociation for Clinical Oncology (ASCO)の両方が、LoTの枠組み内の研究結果を提示している。癌専門医は、患者に対する治療方針を立てる際にこれらのガイドラインを詳しく検討する。それに加えて、LoTの構成は、規制当局、支払者(民間および機関の両方)、および提供者グループが、新しい抗癌剤の計画、承認、および支払を行う際に考慮される。そのようなものとして、製薬会社もLoTおよび新薬によって実現される患者に対する潜在的影響/利益を考慮して計画および試験的設計にアプローチする。医師は、患者に処方されたLoT、任意の悪影響、増悪、または介入した事象、および患者の転帰を改善するために治療を補償しまたは適合させるためのLoTへのその後の任意の変更を強調することによって別の医師に患者の履歴を頻繁に要約する。残念ながら、このタイプの非公式な要約は、患者の電子医療/健康記録(EMR/EHR)に決して入力されない。医師が患者のEMRを提供することに同意したときに、提供された記録を解析して、LoTさらには重要な、介在する(取って代わる)事象(増悪、退行、転移、時間の長さを含む)を引き抜き、医師の便宜のために医師に提供し、各患者に対するLoT履歴に関する医師の理解を改善することが望ましい。 Line of treatment (LoT) is the standard nomenclature for discussing antineoplastic therapy. Both the National Comprehensive Cancer Network and the Association for Clinical Oncology (ASCO), bodies that publish treatment guidelines for standard of care (SoC), present findings within the LoT framework. Oncologists consider these guidelines closely when planning treatment for their patients. Additionally, the composition of the LoT will be considered by regulators, payers (both private and institutional), and provider groups in planning, approving, and paying for new anticancer agents. As such, pharmaceutical companies also approach planning and pilot design with consideration of the potential impacts/benefits to patients realized by LoT and new drugs. Physician highlights LoT prescribed for patient, any adverse, exacerbation, or intervening events, and any subsequent changes to LoT to compensate or adapt treatment to improve patient outcome Frequently summarize the patient's history to another physician by Unfortunately, this type of informal summary is never entered into a patient's Electronic Medical/Health Record (EMR/EHR). When a physician consents to provide a patient's EMR, the provided records are analyzed to determine the LoT as well as the significant intervening (superseding) events (progression, regression, metastasis, length of time). ) and provided to physicians for their convenience to improve physicians' understanding of the LoT history for each patient.

これが達成困難な課題であるのは、EHRおよび/または経過記録だけから回復可能な情報は決して完全ではないからである。記録中に出現し得る(または出現し得ない)不正確さ、矛盾、記録の欠落、および他の不完全な項目が多数あり、これらは考慮される必要がある。たとえば、癌専門医が2つのLoTを考慮することがあり、1つは治療ラインまたは一連の単剤療法としてのシクロホスファミド、ドキソルビシン、パクリタキセルの薬剤/治療/療法の組み合わせである。患者の保険会社側で、費用の面からパクリタキセルの採用を拒絶することがあり、したがって患者はシクロホスファミドおよびドキソルビシンを受ける。一連の投与の後、患者はこの組み合わせでは健康全般に悪影響があると判断し、患者はパクリタキセル単独の維持療法に移行することもある。EMRでは、これらの薬剤はすべて数カ月間記録されるように見え得るが、これは患者がEMRの最初の数項目でパクリタキセルを受けたすらなく、シクロホスファミドを受けたのはその期間の一部においてだけだったとしてもである。その後、腫瘍の成長を観察するために、癌専門医がCTスキャンを指示することもある。患者が、6カ月後、症状が悪化したことから再診したときに、医者は症状の悪化を増悪事象として経過記録に記載し、薬剤カルボプラチンおよびゲムシタビンをリストし得るか、または医者は薬剤ゲムシタビンだけをリストし、以前の薬剤については記録を曖昧にしたままにしておく。抽象化の観点から、EMRは単に前治療薬が処方され、6カ月後にゲムシタビンが処方されたことを記録するだけである。EMRは、CTスキャンさらには6カ月の時間枠における症状悪化も記録し得る。これらの記録からLoTを作成することの難しさは、多岐にわたる。
1)患者が服薬しない、あるいはそれを中止した場合、それらを服薬したことを示すLoTはデータサイエンスの観点からは信頼できない。
2)業界の観点からは、薬剤に対する悪影響の回避のために薬剤を調整しただけのLoTの変更は、新しいLoTではなく、同じLoTである。したがって、薬剤変更は必ずしも新しいLoTを示すものではない。薬剤の変更が、増悪事象、症状悪化、または他の任意の重要な介入事象と一致しているかどうかを識別することは、扱いにくい場合があり、たとえば、保険の問題または副作用の問題で患者が服薬しなかった場合、これはLoTの変更として症状の悪化に対して修正することが困難であるか、または元のLoTに対して副作用を避けるだけであり得る。
3)データサイエンスの観点からは、新薬が処方された後であっても、薬剤が年間を通して一部または全部継続されたかどうかをインピュートすることは困難であり得る。
4)臨床医の観点からは、いくつかの薬物は、名称の変更がありながら、本質的に同じ薬物とみなされ得る。
5)患者は、治療の一環として、「対症療法」薬剤と呼ばれる多くの薬剤を受けているが、LoTの割り当てには無関係である。さらに、これらを区別することは、必ずしも直接的ではないが、それは、「対症療法」対「初期治療」と考えられる薬剤は、癌型によって異なるからである。
6)データソースの異質性。EHRおよび経過観察記録からのキュレーションはソース毎に異なり、LoT決定の前に共通の標準への調和を必要とする。
7)むらのあるデータの負担および複雑さの克服。癌治療記録がEHRおよびキュレーションされた経過記録の両方で完全にカバーされている患者はほとんどいない。多くの場合、一方または他方のみが利用可能であり、両方が存在する場合、これらは患者のタイムラインの調和しない部分を記述しています。これは、特に、記録が一般に薬剤のセットの始まりを記録しているが、それらがいつ停止されたかをほとんど記録しないときに、問題を複雑にする。
This is a difficult task to achieve because the information recoverable from EHRs and/or progress notes alone is never complete. There are many inaccuracies, discrepancies, missing records, and other imperfections that may (or may not) appear in the record, and these need to be considered. For example, an oncologist may consider two LoTs, one drug/treatment/therapy combination of cyclophosphamide, doxorubicin, paclitaxel as a line of treatment or series of monotherapy. A patient's insurance company may refuse to take paclitaxel because of the cost, so the patient receives cyclophosphamide and doxorubicin. After a series of doses, the patient may decide that the combination is adversely affecting their overall health and may transition to maintenance therapy with paclitaxel alone. On the EMR, all these agents can appear to be registered for several months, but this is because the patient did not even receive paclitaxel for the first few items of the EMR and only received cyclophosphamide for one portion of that period. Even if it was only in the department. A CT scan may then be ordered by an oncologist to monitor tumor growth. When the patient returns 6 months later with worsening symptoms, the physician may record the worsening of symptoms as an exacerbation event and list the drugs carboplatin and gemcitabine, or the physician may give the drug gemcitabine alone. and keep the record obscure for previous medications. From an abstraction point of view, the EMR simply records that the prior medication was prescribed and that gemcitabine was prescribed 6 months later. EMR can document CT scans and even worsening symptoms over a 6-month time frame. The difficulty of creating LoT from these records is manifold.
1) If a patient does not take or discontinues their medication, the LoT that indicates that they have taken them is unreliable from a data science perspective.
2) From an industry perspective, a change in LoT that merely adjusts a drug to avoid adverse drug effects is not a new LoT, but the same LoT. Therefore, a drug change does not necessarily represent a new LoT. Identifying whether a change in medication is consistent with an exacerbation event, worsening symptoms, or any other significant interventional event can be tricky, for example, when patients If not taken, this can be difficult to correct for exacerbation of symptoms as a change in LoT, or just avoid side effects relative to the original LoT.
3) From a data science point of view, it can be difficult to impute whether a drug was continued partly or wholly throughout the year, even after a new drug was prescribed.
4) From a clinician's point of view, some drugs can be considered essentially the same drug despite name changes.
5) Patients receive a number of medications, termed 'palliative care' medications, as part of their treatment, but are irrelevant to LoT assignment. Moreover, distinguishing between these is not always straightforward, as agents considered "palliative therapy" versus "primary therapy" vary by cancer type.
6) Heterogeneity of data sources. Curation from EHRs and follow-up records varies from source to source, requiring harmonization to common standards prior to LoT decisions.
7) Overcoming the burden and complexity of spotty data. Few patients have complete cancer treatment records covered by both the EHR and curated follow-up records. Often only one or the other is available, and when both are present, they describe inconsistent parts of the patient's timeline. This complicates matters, especially when the records generally record the beginning of a set of drugs, but rarely when they are stopped.

現在のところ、EMRからLoTを予測し、ダイジェストし、またはインピュートするためのいかなるアルゴリズムも存在しない。これは一般に、熟練した施術者がファイルを手動でレビューして、すべての患者についてケースバイケースでこれらの決定を行うことを必要とし、これはコストと時間を要するものである。機械学習は、不完全なデータからLoTが予測され得ることを典型的に反映する介在事象による特定の診断のための薬剤変更の頻度、よくある出現に基づき、すべての患者について横断的にすべての薬剤を考察するために適用され得る。これに対処するために、ルールベースの構造などのヒューリスティックと臨床的洞察とを合成する機械学習アプローチと、機械学習アルゴリズム(MLA)を使用して効果的な予測を行う期待値最大化(EM)アルゴリズムが考察され得る。 Currently, no algorithms exist to predict, digest, or impute LoT from EMR. This generally requires a trained practitioner to manually review files and make these decisions on a case-by-case basis for every patient, which is costly and time consuming. Machine learning cross-sectionally for all patients based on the frequency of medication changes for a particular diagnosis due to intervening events, which typically reflect that LoT can be predicted from imperfect data, is common occurrence. It can be applied to discuss drugs. To address this, machine learning approaches that synthesize heuristics such as rule-based structures with clinical insights and expectation maximization (EM) that use machine learning algorithms (MLA) to make effective predictions. Algorithms can be considered.

米国特許出願第16/732,168号U.S. Patent Application No. 16/732,168

一態様において、本開示は、患者に同時投与される1つまたは複数の薬剤を治療ラインとしてラベル付けするための方法を提供する。この方法は、複数のデジタル記録から患者の医療記録を識別することであって、医療記録のサブセットは患者の病状診断後の1つまたは複数の治療に関する患者の医療履歴を反映する、識別することと、医療記録のサブセットから、患者に投与された少なくとも1つの薬剤と時間間隔とを含む複数の治療間隔を作成することと、薬剤の投与が時間間隔内に収まるときに1つまたは複数の治療の薬剤をそれぞれの治療間隔に関連付けることと、それぞれの治療間隔の時間間隔を、1つまたは複数の治療のうちの1つ治療が時間間隔から外れているが延長期間内にあるときに精緻化することであって、精緻化された時間間隔において、間隔優先事象が起こらない、精緻化することと、教師なし人工知能エンジンを介して、複数の治療間隔から1つまたは複数の潜在的治療ラインを識別することであって、各潜在的治療ラインは、複数の治療間隔のうちの1つまたは複数、および最尤推定を含む、識別することと、教師なし人工知能エンジンを介して、最高の最尤推定を有する潜在的治療ラインを治療ラインとしてラベル付けすることとを含む。 In one aspect, the present disclosure provides a method for labeling one or more agents co-administered to a patient as a line of therapy. The method comprises identifying a patient's medical record from a plurality of digital records, wherein a subset of the medical records reflects the patient's medical history regarding one or more treatments after diagnosis of the patient's medical condition. and from a subset of the medical records, creating a plurality of treatment intervals comprising at least one drug administered to the patient and the time interval; and administering one or more treatments when the drug administration falls within the time interval. drugs to their respective treatment intervals and the time interval of each treatment interval is refined when one of the one or more treatments falls outside the time interval but within the extension period and no interval precedence events occur in the refined time interval, refining and, via an unsupervised artificial intelligence engine, one or more potential treatment lines from multiple treatment intervals. wherein each potential treatment line includes one or more of a plurality of treatment intervals and maximum likelihood estimation, and through an unsupervised artificial intelligence engine, the best labeling potential lines of therapy with maximum likelihood estimates as lines of therapy.

この方法は、教師なし人工知能エンジンを介して、連続する時間間隔において追加の潜在的治療ラインを、各先行する治療ラインの後に時系列的に発生し、各連続する時間間隔内の潜在的治療ラインのそれぞれの最高の最尤推定を有する潜在的治療ラインから増分的に番号を振られた治療ラインとしてラベル付けすることをさらに含み得る。この方法は、教師なし人工知能エンジンを介して、複数の患者に対するそれぞれの増分的に番号を振られた治療ラインをラベル付けすることと、患者の複数のコホートを識別することと、患者の複数のコホートの各々に対する増分的に番号を振られた治療ラインを報告することとをさらに含み得る。この方法は、標準化された治療ガイドラインに対する施設規模のおよび医師固有のコンプライアンスを報告することをさらに含み得る。この方法は、少なくとも一部は各治療ラインのそれぞれの時間間隔に基づき、経時的な治療ラインの変更を報告することをさらに含み得る。この方法は、患者の第1のコホートと患者の第2のコホートとの間の治療影響の差異に関する分析を報告することをさらに含み得、コホートは、1つまたは複数の類似の治療日、治療ライン、診断、転帰、地理的位置、治療医師、治療施設、ゲノムマーカー、または臨床特性を有するものとして患者を識別する。この方法は、第1のコホートと第2のコホートとの間の無増悪生存率に関する分析を報告することをさらに含んでもよい。この方法は、共通する少なくとも1つのラベル付けされた治療ラインを有する患者の第1のコホートに対する無増悪生存曲線を生成することと、共通する少なくとも1つの他のラベル付けされた治療ラインを有する患者の第2のコホートに対する無増悪生存曲線を生成することと、第1のコホートおよび第2のコホートに対する無増悪生存曲線を同じ生存グラフ上に表示することとをさらに含み得る。この方法において、ラベル付けされた治療ラインは、薬剤名、治療ロールアップクラス、投与量、または投与方法のうちの1つもしくは複数を含み得る。 The method chronologically generates additional potential lines of treatment in consecutive time intervals after each preceding line of treatment, via an unsupervised artificial intelligence engine, and generates potential lines of treatment within each consecutive time interval. It may further include labeling the treatment lines as incrementally numbered from the potential treatment lines having the highest maximum likelihood estimates for each of the lines. The method includes, via an unsupervised artificial intelligence engine, labeling each incrementally numbered treatment line for multiple patients, identifying multiple cohorts of patients, and multiple cohorts of patients. reporting the incrementally numbered lines of treatment for each of the cohorts. The method may further include reporting facility-wide and physician-specific compliance to standardized treatment guidelines. The method may further include reporting changes in treatment lines over time based at least in part on respective time intervals for each treatment line. The method may further comprise reporting an analysis of differences in treatment impact between a first cohort of patients and a second cohort of patients, the cohorts comprising one or more similar treatment days, treatment Identify patients as having line, diagnosis, outcome, geographic location, treating physician, treatment site, genomic marker, or clinical characteristics. The method may further comprise reporting an analysis of progression-free survival between the first cohort and the second cohort. The method comprises generating a progression-free survival curve for a first cohort of patients having at least one labeled line of therapy in common and patients having at least one other labeled line of therapy in common. and displaying the progression-free survival curves for the first and second cohorts on the same survival graph. In this method, the labeled therapeutic line may include one or more of drug name, therapeutic rollup class, dosage, or method of administration.

この方法は、レポートを生成することであって、レポートは患者およびそれぞれの時間間隔についてラベル付けされた各治療ラインを含む、生成することをさらに含み得る。 The method may further include generating a report, the report including each treatment line labeled for the patient and the respective time interval.

この方法では、病状診断は、癌、心臓病、うつ病、精神衛生、糖尿病、感染症、てんかん、皮膚科、および自己免疫疾患を含み得る。 In this method, medical condition diagnoses can include cancer, heart disease, depression, mental health, diabetes, infectious diseases, epilepsy, dermatology, and autoimmune diseases.

この方法では、病状診断は、癌であり得る。 In this method, the medical condition diagnosis may be cancer.

この方法において、複数のデジタル記録は、1つまたは複数のEHR医療記録、および1つまたは複数のキュレーションされた医療記録を含んでもよい。この方法では、キュレーションされた医療記録は、1つまたは複数のEHR医療記録に含まれない記録の画像であってもよい。この方法は、キュレーションされた医療記録を2値化し、光学的文字認識し、構造化形式に符号化することをさらに含み得る。 In this method, the plurality of digital records may include one or more EHR medical records and one or more curated medical records. In this method, the curated medical records may be images of records that are not included in one or more EHR medical records. The method may further include binarizing, optical character recognition, and encoding the curated medical records into a structured format.

この方法は、治療識別子によって、患者に投与された治療と、その治療が投与された投与日とを識別することをさらに含み得る。 The method may further include identifying the therapy administered to the patient and the administration date on which the therapy was administered by the therapy identifier.

この方法では、治療は、薬剤、薬物、分子、または化学薬品の投与、医療デバイスの植え込み、医療デバイスの使用、生物療法、ウイルス療法、ファージ療法、植物療法、遺伝子療法、エピジェネティック療法、タンパク質療法、酵素補充療法、ホルモン療法、細胞療法、免疫療法、抗体療法、栄養療法、電磁放射線波療法の使用もしくは放射線療法、外科的手技、または放射線外科手術のうちの1つまたは複数を含み得る。 In this method, treatment includes administration of drugs, drugs, molecules or chemicals, implantation of medical devices, use of medical devices, biotherapy, viral therapy, phage therapy, phytotherapy, gene therapy, epigenetic therapy, protein therapy. , enzyme replacement therapy, hormone therapy, cell therapy, immunotherapy, antibody therapy, nutritional therapy, use of electromagnetic radiation therapy or radiation therapy, surgical procedures, or radiosurgery.

別の態様において、本開示は、患者に同時投与される1つまたは複数の薬剤を治療ラインとしてラベル付けするためのシステムを提供する。システムは、少なくとも1つのプロセッサを有する少なくとも1つのコンピュータであって、プロセッサは、複数のデジタル記録から患者の医療記録を識別することであって、医療記録のサブセットは、患者の病状態診断後の1つまたは複数の治療に関する患者の医療履歴を反映する、識別することと、医療記録のサブセットから、患者に投与された少なくとも1つの薬剤と時間間隔とを含む複数の治療間隔を作成することと、薬剤の投与が時間間隔内に収まるときに1つまたは複数の治療の薬剤をそれぞれの治療間隔に関連付けることと、それぞれの治療間隔の時間間隔を、1つまたは複数の治療のうちの1つの治療が時間間隔を外れているが延長期間内にあるときに精緻化することであって、精緻化された時間間隔において、間隔優先事象が起こらない、精緻化することとを行うようにプログラムされた、少なくとも1つのコンピュータを含み、少なくとも1つのコンピュータは、教師なし人工知能エンジンを含み、教師なし人工知能エンジンは、複数の治療間隔から1つまたは複数の潜在的治療ラインを識別することであって、各潜在的治療ラインは、複数の治療間隔のうちの1つまたは複数、および最尤推定を含む、識別することと、最高の最尤推定を有する潜在的治療ラインをその治療ラインとしてラベル付けすることとを行うようにプログラムされる。 In another aspect, the present disclosure provides a system for labeling one or more drugs co-administered to a patient as a line of therapy. The system is at least one computer having at least one processor for identifying patient medical records from a plurality of digital records, wherein a subset of the medical records includes identifying, reflecting a patient's medical history regarding one or more treatments, and creating from a subset of the medical records a plurality of treatment intervals including at least one drug administered to the patient and a time interval; , associating the drugs of one or more treatments with their respective treatment intervals when the administration of the drugs falls within the time interval, and the time interval of each treatment interval to one of the one or more treatments refining when the treatment is out of the time interval but within the extension period, wherein no interval precedence event occurs in the refined time interval, refining. and at least one computer, the at least one computer including an unsupervised artificial intelligence engine, the unsupervised artificial intelligence engine to identify one or more potential treatment lines from the plurality of treatment intervals. each potential treatment line includes one or more of the plurality of treatment intervals and a maximum likelihood estimate; and labeling the potential treatment line with the highest maximum likelihood estimate as that treatment line. It is programmed to attach and

システムにおいて、教師なし人工知能エンジンは、連続する時間間隔において追加の潜在的治療ラインを、各先行する治療ラインの後に時系列的に発生し、各連続する時間間隔内の潜在的治療ラインのそれぞれの最高の最尤推定を有する潜在的治療ラインから増分的に番号を振られた治療ラインとしてラベル付けするようにプログラムされ得る。システムにおいて、教師なし人工知能エンジンは、複数の患者についてそれぞれの増分的に番号を振られた治療ラインをラベル付けし、患者の複数のコホートを識別し、患者の複数のコホートの各々について増分的に番号を振られた治療ラインを報告するようにプログラムされ得る。システムにおいて、少なくとも1つのコンピュータは、標準化された治療ガイドラインに対する施設規模のおよび医師固有のコンプライアンスを報告するようにさらにプログラムされ得る。システムにおいて、少なくとも1つのコンピュータは、少なくとも一部は各治療ラインのそれぞれの時間間隔に基づき、経時的な治療ラインの変更を報告するようにプログラムされ得る。システムにおいて、少なくとも1つのコンピュータは、患者の第1のコホートと患者の第2のコホートとの間の治療影響の差異に関する分析を報告することであって、ようにさらにプログラムされ得、コホートは、1つまたは複数の類似の治療日、治療ライン、診断、転帰、地理的位置、治療医師、治療施設、ゲノムマーカー、または臨床特性を有するものとして患者を識別する。システムにおいて、少なくとも1つのコンピュータは、第1のコホートと第2のコホートとの間の無増悪生存率に関する分析を報告するようにさらにプログラムされ得る。システムにおいて、少なくとも1つのコンピュータは、共通する少なくとも1つのラベル付けされた治療ラインを有する患者の第1のコホートに対する無増悪生存曲線を生成し、共通する少なくとも1つの他のラベル付けされた治療ラインを有する患者の第2のコホートに対する無増悪生存曲線を生成し、第1のコホートおよび第2のコホートに対する無増悪生存曲線を同じ生存グラフ上に表示するようにさらにプログラムされ得る。システムにおいて、ラベル付けされた治療ラインは、薬剤名、治療ロールアップクラス、投与量、または投与方法のうちの1つもしくは複数を含み得る。 In the system, an unsupervised artificial intelligence engine chronologically generates an additional potential line of treatment in successive time intervals after each preceding line of treatment, and generates an additional potential line of treatment in each successive time interval. can be programmed to label as the treatment line numbered incrementally from the potential treatment line with the highest maximum likelihood estimate of . In the system, an unsupervised artificial intelligence engine labels each incrementally numbered treatment line for multiple patients, identifies multiple cohorts of patients, and incrementally identifies multiple cohorts of patients for each of the multiple cohorts of patients. can be programmed to report the line of treatment numbered to. In the system, at least one computer may be further programmed to report facility-wide and physician-specific compliance to standardized treatment guidelines. In the system, at least one computer can be programmed to report changes in treatment lines over time based, at least in part, on respective time intervals for each treatment line. In the system, the at least one computer may be further programmed to report an analysis of differences in treatment impact between a first cohort of patients and a second cohort of patients, the cohorts comprising: Identify patients as having one or more similar treatment dates, lines of treatment, diagnoses, outcomes, geographic location, treating physicians, treatment centers, genomic markers, or clinical characteristics. In the system, at least one computer can be further programmed to report an analysis of progression-free survival between the first cohort and the second cohort. In the system, at least one computer generates a progression-free survival curve for a first cohort of patients having at least one labeled line of therapy in common and at least one other labeled line of therapy in common. and to display the progression-free survival curves for the first and second cohorts on the same survival graph. In the system, a labeled therapeutic line may include one or more of drug name, therapeutic rollup class, dosage, or method of administration.

システムにおいて、病状診断は、癌、心臓病、うつ病、精神衛生、糖尿病、感染症、てんかん、皮膚科、および自己免疫疾患を含み得る。 In the system, medical condition diagnoses can include cancer, heart disease, depression, mental health, diabetes, infectious diseases, epilepsy, dermatology, and autoimmune diseases.

システムにおいて、複数のデジタル記録は、1つまたは複数のEHR医療記録と1つまたは複数のキュレーションされた医療記録とを含んでもよい。システムにおいて、少なくとも1つのコンピュータは、キュレーションされた医療記録を2値化し、光学的文字認識し、構造化形式に符号化するようにさらにプログラムされ得る。 In the system, the multiple digital records may include one or more EHR medical records and one or more curated medical records. In the system, at least one computer may be further programmed to binarize, optical character recognize, and encode the curated medical records into a structured format.

システムにおいて、治療は、薬剤、薬物、分子、または化学薬品の投与、医療デバイスの植え込み、医療デバイスの使用、生物療法、ウイルス療法、ファージ療法、植物療法、遺伝子療法、エピジェネティック療法、タンパク質療法、酵素補充療法、ホルモン療法、細胞療法、免疫療法、抗体療法、栄養療法、電磁放射線波療法の使用もしくは放射線療法、外科的手技、または放射線外科手術のうちの1つまたは複数を含み得る。 In the system, treatment includes administration of drugs, drugs, molecules or chemicals, implantation of medical devices, use of medical devices, biological therapy, viral therapy, phage therapy, plant therapy, gene therapy, epigenetic therapy, protein therapy, It may include one or more of enzyme replacement therapy, hormone therapy, cell therapy, immunotherapy, antibody therapy, nutritional therapy, use of electromagnetic radiation therapy or radiation therapy, surgical procedures, or radiosurgery.

本特許のファイルは、カラーで作成された少なくとも1つの図面/写真を含む。カラー図面/写真を含む本特許の写しは、請求と必要な手数料の支払とによって当局から提供される。 The file of this patent contains at least one drawing/photograph executed in color. Copies of this patent with color drawings/photographs will be provided by the Office upon request and payment of the necessary fee.

治療ライン(LoT)予測の準備、訓練、および生成の一実施形態を示すフローチャートである。[0014] Figure 4 is a flowchart illustrating one embodiment of line of treatment (LoT) prediction preparation, training, and generation. ルールベース前処理とともにMLAアプローチを使用する治療ライン(LoT)予測の準備、訓練、および生成の一実施形態を示すフローチャートである。[0013] Figure 1 is a flow chart illustrating one embodiment of preparing, training, and generating line of care (LoT) predictions using the MLA approach with rule-based preprocessing. 転移性非小細胞肺癌と診断された第1の患者に対するLoT予測の説明図である。FIG. 4 is an illustration of LoT prediction for a first patient diagnosed with metastatic non-small cell lung cancer. 卵巣癌と診断された第2の患者に対するLoT予測の説明図である。FIG. 10 is an illustration of LoT prediction for a second patient diagnosed with ovarian cancer. 乳癌と診断された第3の患者に対するLoT予測の説明図である。FIG. 11 is an illustration of LoT prediction for a third patient diagnosed with breast cancer; キュレーションされた患者履歴から複雑なキュレーションされたフィールドをインピュートし、それらを非キュレーション患者または少量のデータを有する患者に適用する方法を実装するルールベースの前処理を伴う人工知能エンジンアプローチを使用して治療ライン(LoT)を準備し、訓練し、割り当てる一実施形態であるシステム600を示すフローチャートである。An artificial intelligence engine approach with rule-based preprocessing that implements a method to impute complex curated fields from curated patient histories and apply them to non-curated patients or patients with small amounts of data. 6 is a flowchart illustrating one embodiment of the system 600 used to prepare, train, and assign lines of treatment (LoT). 3つの段階にわたる治療ライン(LoT)モデルを準備し、訓練し、生成する一実施形態を示すフローチャートである。[0014] Figure 4 is a flow chart showing one embodiment of preparing, training and generating a line of treatment (LoT) model over three stages. 転移性非小細胞肺癌と診断された第1の患者に対するLoT予測の説明図である。FIG. 4 is an illustration of LoT prediction for a first patient diagnosed with metastatic non-small cell lung cancer. 卵巣癌と診断された第2の患者に対するLoT予測の説明図である。FIG. 10 is an illustration of LoT prediction for a second patient diagnosed with ovarian cancer. 乳癌と診断された第3の患者に対するLoT予測の説明図である。FIG. 11 is an illustration of LoT prediction for a third patient diagnosed with breast cancer; フローの第1のステップを例示する図である。FIG. 4 illustrates the first step of the flow; 図11Aのフローの第2のステップに含まれる投薬間隔の数を例示する図である。11B illustrates the number of dosing intervals included in the second step of the flow of FIG. 11A. FIG. 図11Aのフローの第3のステップにおいて1つまたは複数の投薬間隔を精緻化するためにヒューリスティックを適用することを例示する図である。11B illustrates applying heuristics to refine one or more dosing intervals in the third step of the flow of FIG. 11A. FIG. 図11Aのフローの第4のステップにおいてライン割り当てを出力することを例示する図である。11B illustrates outputting line assignments in the fourth step of the flow of FIG. 11A; FIG. フローの第1のステップを例示する図である。FIG. 4 illustrates the first step of the flow; 図12Aのフローの第2のステップに含まれる投薬間隔の数を例示する図である。12B illustrates the number of dosing intervals included in the second step of the flow of FIG. 12A. FIG. 図12Aのフローの第3のステップにおいて1つまたは複数の投薬間隔を精緻化するためにヒューリスティックを適用することを例示する図である。12B illustrates applying heuristics to refine one or more dosing intervals in the third step of the flow of FIG. 12A. FIG. 図12Aのフローの第4のステップにおいて1つまたは複数の投薬間隔を精緻化するために期待値最大化モデルを適用することを例示する図である。FIG. 12B illustrates applying an expectation maximization model to refine one or more dosing intervals in the fourth step of the flow of FIG. 12A. 図12Aのフローの第4のステップにおいて1つまたは複数の投薬間隔を精緻化するために期待値最大化モデルを適用することを例示する図である。FIG. 12B illustrates applying an expectation maximization model to refine one or more dosing intervals in the fourth step of the flow of FIG. 12A. 図12Aのフローの第5のステップにおいてライン割り当てを出力することを例示する図である。12B illustrates outputting line assignments in the fifth step of the flow of FIG. 12A; FIG. フローの第1のステップを例示する図である。FIG. 4 illustrates the first step of the flow; 図13Aのフローの第2のステップに含まれる投薬間隔の数を例示する図である。13B illustrates the number of dosing intervals included in the second step of the flow of FIG. 13A. FIG. 図13Aのフローの第3のステップにおいて1つまたは複数の投薬間隔を精緻化するためにヒューリスティックを適用することを例示する図である。FIG. 13B illustrates applying heuristics to refine one or more dosing intervals in the third step of the flow of FIG. 13A. 図13Aのフローの第4のステップにおいて1つまたは複数の投薬間隔を精緻化するために期待値最大化モデルを適用することを例示する図である。FIG. 13B illustrates applying an expectation maximization model to refine one or more dosing intervals in the fourth step of the flow of FIG. 13A. 図13Aのフローの第4のステップにおいて1つまたは複数の投薬間隔を精緻化するために期待値最大化モデルを適用することを例示する図である。FIG. 13B illustrates applying an expectation maximization model to refine one or more dosing intervals in the fourth step of the flow of FIG. 13A. 図13Aのフローの第5のステップにおいてライン割り当てを出力することを例示する図である。13B illustrates outputting line assignments in the fifth step of the flow of FIG. 13A; FIG. 少なくとも癌免疫(IO)レジメン療法を有する患者に適用されるような治療ラインを例示するサンキーダイアグラムである。1 is a Sankey diagram illustrating lines of therapy as applied to patients with at least immuno-oncology (IO) regimen therapy. 異なる第1の治療ラインを受けた患者の生存曲線を描いた無増悪生存率(PFS)グラフである。1 is a progression-free survival (PFS) graph depicting survival curves for patients receiving different first lines of therapy. 一実施形態による患者に対する治療ラインを使用者が編集するための治療ライン編集ツールの説明図である。FIG. 12 is an illustration of a line of treatment editing tool for user editing of a line of treatment for a patient according to one embodiment. 一実施形態によるLoTラベル付けが実行された後の患者タイムラインの構造化データ表現の説明図である。FIG. 10 is an illustration of a structured data representation of a patient timeline after LoT labeling has been performed according to one embodiment; 肺癌コホートおよび乳癌コホートにおける患者のコホートから識別されるLoTの平均持続時間のボックスプロット図である。Boxplot of average duration of LoT identified from cohorts of patients in lung cancer cohort and breast cancer cohort. 患者に投与された乳癌治療薬に対する第1のLoTに基づくLoT頻度の説明図である。FIG. 4 is an explanatory diagram of LoT frequencies based on the first LoT for breast cancer therapeutics administered to patients. 患者に投与された乳癌治療薬に対する第2のLoTに基づくLoT頻度の説明図である。FIG. 10 is an explanatory diagram of LoT frequencies based on the second LoT for breast cancer therapeutics administered to patients. 患者に投与された非小細胞肺癌(NSCLC)治療薬に対する第1のLoTに基づくLoT頻度の説明図である。FIG. 4 is an illustration of LoT frequencies based on the first LoT for non-small cell lung cancer (NSCLC) therapeutics administered to patients. 患者に投与された非小細胞肺癌治療薬に対する第2のLoTに基づくLoT頻度の説明図である。FIG. 4 is an illustration of LoT frequencies based on the second LoT for non-small cell lung cancer therapeutics administered to patients. 列挙されたLoTの少なくとも1つを含むコホートに割り当てられた各原発癌に対する患者の割合の棒グラフ図である。FIG. 10 is a bar graph representation of the percentage of patients for each primary cancer assigned to cohorts containing at least one of the listed LoTs. 本開示のいくつかの実装形態が動作し得るコンピュータシステムの一実装形態のブロック図の説明図である。1 is an illustration of a block diagram of one implementation of a computer system upon which some implementations of the disclosure may operate; FIG.

「病状」という語句は、癌、心臓病、うつ病、精神衛生、糖尿病、感染症、てんかん、皮膚科、自己免疫疾患、または他の疾病などの疾病の状態を意味する。病状は、被験者における疾病の有無を反映するものとしてよく、それが存在するときにその疾患の重篤度をさらに反映し得る。 The phrase "medical condition" means a disease state such as cancer, heart disease, depression, mental health, diabetes, infectious disease, epilepsy, dermatology, autoimmune disease, or other disease. A medical condition may reflect the presence or absence of a disease in a subject, and may further reflect the severity of the disease when it is present.

図1は、投与された薬剤および臨床記録に基づき患者に対する治療ラインをラベル付けするためのコンピュータ実装システム100の一実施形態を例示している。治療ラインは、システムアーキテクチャ100によって実装される臨床健康記録110によって表される患者情報から生成され得る。システム100は、ハードウェアまたはハードウェアとソフトウェアの両方の組み合わせである、コンテンツサーバ(LoTエンジンとも呼ばれる)であってよい。医療提供者または患者などの使用者は、GUI170a~170nを通じてリモートアクセスを与えられ、これにより使用者自身のローカルデバイス(たとえば、パーソナルコンピュータまたはワイヤレスハンドヘルドデバイス)を使用して患者の医療状態に関する情報を閲覧し、更新し、分析する。使用者は、システムをインタラクティブに操作して電子記録を生成し、電子記録を更新し、他のアクションを実行する指示を出すことができる。コンテンツサーバは、異なる形式の様々な情報を受信するように構成され、これは、コンテンツサーバ上の、またはコンテンツサーバと連動する治療ラインモジュール120の動作による処理に適している標準化された形式に情報を変換する。したがって、患者の電子医療記録(EMR)、非構造化テキスト、遺伝子シークエンシング、画像処理、および他の様々な情報から取得された情報は、1つもしくは複数の人工知能エンジンまたは機械学習モデルを訓練するために使用される特徴に変換され得る。 FIG. 1 illustrates one embodiment of a computer-implemented system 100 for labeling treatment lines for patients based on drugs administered and clinical records. A line of treatment may be generated from patient information represented by the clinical health record 110 implemented by the system architecture 100 . System 100 may be a content server (also called a LoT engine), which is hardware or a combination of both hardware and software. A user, such as a healthcare provider or patient, is given remote access through the GUIs 170a-170n to obtain information about the patient's medical condition using their own local device (e.g., personal computer or wireless handheld device). Browse, update and analyze. A user can interact with the system to generate electronic records, update electronic records, and issue instructions to perform other actions. The content server is configured to receive a variety of information in different formats, which is put into a standardized format suitable for processing by the operation of the line of care module 120 on or in conjunction with the content server. to convert Thus, information obtained from a patient's electronic medical record (EMR), unstructured text, genetic sequencing, image processing, and a variety of other information is used to train one or more artificial intelligence engines or machine learning models. can be converted into features used to

コンテンツサーバ100によって取得され、処理され、生成される情報は、ネットワークベースのストレージデバイスのうちの1つまたは複数に記憶される。使用者は、コンテンツサーバをインタラクティブに操作してネットワークベースのストレージデバイスに記憶されている情報にアクセスすることができ、コンテンツサーバは、使用者提供情報を受け取り、ネットワークベースのストレージに記憶されている1つまたは複数のモデルを情報に適用し、電子形式で、モデル適用の結果を、ユーザデバイスのグラフィカルユーザインターフェース上で使用者に提供することができる。電子情報は、その情報にアクセスする使用者に対してコンピュータネットワーク上で標準化形式により伝送される。このようにして、使用者は、自動的に生成することができるシステムの予測に従って医療診断および治療戦略を容易に適合させることができる。さらに、システムは、患者診断および治療に関する使用者への推奨を生成する。 Information retrieved, processed, and generated by the content server 100 is stored in one or more of the network-based storage devices. A user can interact with a content server to access information stored in a network-based storage device, the content server receiving user-provided information stored in the network-based storage. One or more models can be applied to the information and, in electronic form, the results of the model application can be provided to the user on the graphical user interface of the user device. Electronic information is transmitted in a standardized format over computer networks to users who access that information. In this way, the user can readily adapt medical diagnosis and treatment strategies according to the system's predictions, which can be automatically generated. In addition, the system generates recommendations to the user regarding patient diagnosis and treatment.

いくつかの実施形態において、説明されているシステムおよび方法は、デジタルおよび実験室ヘルスケアプラットフォームの一部として実装される。プラットフォームは、ターゲット医療的ケア精密薬剤治療の一部として分子レポートを自動的に生成し得る。いくつかの実施形態において、本開示の実施形態に係るシステムは、1つまたは複数のマイクロサービス上で動作し、これは、発注管理システムのマイクロサービスであってもよい。いくつかの実施形態において、本システムは、細胞型プロファイリングサービスの1つまたは複数のマイクロサービスと併せて実装される。 In some embodiments, the systems and methods described are implemented as part of a digital and laboratory healthcare platform. The platform can automatically generate molecular reports as part of targeted medical care precision drug therapy. In some embodiments, systems according to embodiments of the present disclosure operate on one or more microservices, which may be microservices of an order management system. In some embodiments, the system is implemented in conjunction with one or more microservices of cell type profiling services.

臨床健康記録110は、システム100に情報が存在する一部またはすべての患者について生成された特徴、または状態特性の集合体を記憶し得る。これらの特徴は、システム100を使用して薬剤および優先事象を識別するために使用され得る。すべての患者にわたる特徴範囲は情報的密度が高いが、患者の特徴セットは、すべての患者にわたるすべての特徴の集合的特徴範囲の全体にわたって要素がまばらに配置されているものとしてよい。たとえば、すべての患者にわたる特徴範囲は数万の特徴に拡大し得るが、患者の固有特徴セットは、その患者について利用可能な記録に基づき集合的特徴範囲の数百または数千個からなるサブセットを含み得る。 A clinical health record 110 may store a collection of features, or condition characteristics, generated for some or all patients for whom information exists in the system 100 . These characteristics can be used to identify drugs and priority events using system 100 . Although the feature coverage across all patients is informationally dense, the Patient Feature Set may be sparsely populated across the collective feature coverage of all features across all patients. For example, feature coverage across all patients may grow to tens of thousands of features, but a patient's unique feature set may be a subset of the collective feature coverage of hundreds or thousands based on available records for that patient. can contain.

臨床健康記録110内に存在する複数の特徴は、患者の健康記録内で利用可能なフィールドの多様なセットを含んでもよい。臨床情報は、たとえば、医師、看護師、または他の医療専門家もしくは代表者によって、自動的にもしくは手動により行われ得る、電子医療記録(EMR)または電子健康記録(EHR)に入力されたフィールドに基づくものとしてよい。他の臨床情報は、たとえば、遺伝子シークエンシング報告(たとえば、分子フィールドから)、経過報告、検査結果、保険請求コードおよび/または記録、ならびに患者に対する他の医療文書などの、他の情報源から得られるデジタル方式でキュレーションされた情報114であってもよい。シークエンシングは、次世代シークエンシング(NGS)を含むものとしてよく、ロングリード、ショートリード、または患者の体細胞および/または正常なゲノムをシークエンシングする他の形態であってよい。追加の臨床健康記録内の特徴の包括的集合体は、診断、治療レジメンへの反応、遺伝子プロファイル、臨床および表現型の特徴、および/または他の医学的、地理的、人口統計学的、臨床的、分子的、もしくは遺伝的な特徴を含み得る様々な医学分野にわたって様々な特徴を一緒に組み合わせたものであってよい。たとえば、特徴のサブセットは、RNAまたはDNAシークエンシングから導出される特徴、病理学者による細胞レビューから導出される病理学的特徴、または他の画像などの、分子データ特徴を含み得る。 The multiple features present within the clinical health record 110 may include a diverse set of fields available within a patient's health record. Clinical information fields entered into an electronic medical record (EMR) or electronic health record (EHR), which may be performed automatically or manually by, for example, a doctor, nurse, or other medical professional or representative may be based on Other clinical information may be obtained from other sources such as, for example, genetic sequencing reports (e.g., from molecular fields), progress reports, laboratory results, insurance claims codes and/or records, and other medical documentation for patients. It may also be digitally curated information 114 that is published. Sequencing may include next generation sequencing (NGS) and may be long reads, short reads, or other forms of sequencing the patient's somatic cells and/or normal genome. A comprehensive collection of features within an additional clinical health record may include diagnostics, response to therapeutic regimens, genetic profiles, clinical and phenotypic features, and/or other medical, geographic, demographic, and clinical characteristics. Various features may be combined together across various medical disciplines, which may include genetic, molecular, or genetic features. For example, the subset of features may include molecular data features such as features derived from RNA or DNA sequencing, pathological features derived from cellular review by a pathologist, or other images.

画像特徴は、たとえば、染色されたH&EまたはIHCスライドのレビューなど、病理学者による標本のレビューを通じて識別される特徴を含み得る。別の例として、特徴のサブセットは、そのような特徴セットの個別の結果および組み合わされた結果の解析から取得された派生的特徴を含み得る。DNAおよびRNAシークエンシングから導出される特徴は、シークエンシングされた試料中で識別できる遺伝的バリアントを含み得る。遺伝的バリアントのさらなる分析は、一塩基または複数塩基多型を識別するステップ、変異が挿入または欠失事象であるかどうかを識別するステップ、機能喪失または機能獲得を識別するステップ、融合を識別するステップ、コピー数変化を計算するステップ、マイクロサテライト不安定性を計算するステップ、腫瘍遺伝子変異量を計算するステップ、またはDNAおよびRNA内の他の構造的変化などのステップを含み得る。H&E染色またはIHC染色のためのスライドの解析は、腫瘍浸潤、プログラム細胞死リガンド1(PD-L1)の状態、ヒト白血球抗原(HLA)の状態、または他の免疫学関係特徴などの特徴を明らかにし得る。 Image features may include, for example, features identified through review of specimens by a pathologist, such as review of stained H&E or IHC slides. As another example, a subset of features may include derived features obtained from analysis of individual and combined results of such feature sets. Features derived from DNA and RNA sequencing can include genetic variants that are identifiable in the sequenced samples. Further analysis of genetic variants includes identifying single or multiple nucleotide polymorphisms, identifying whether the mutation is an insertion or deletion event, identifying loss-of-function or gain-of-function, identifying fusions. steps, calculating copy number changes, calculating microsatellite instability, calculating tumor gene mutational burden, or other structural changes in DNA and RNA. Analysis of slides for H&E or IHC staining reveals features such as tumor infiltration, programmed cell death ligand 1 (PD-L1) status, human leukocyte antigen (HLA) status, or other immunologically relevant features can be

構造化された、キュレーションされた、および/または電子的な医療もしくは健康記録112および114から導出される特徴は、診断、症状、治療法、転帰などの臨床的特徴、患者名、生年月日、性別、民族、死亡日、住所、喫煙状態、癌、病気、疾患、糖尿病、鬱病、他の身体的または精神的な疾病の診断日などの患者人口統計、既往歴、家族病歴、初診日、転移診断日などの臨床診断、癌病期、腫瘍キャラクタリゼーション、原発組織、治療ライン、治療グループ、臨床試験、処方されるまたは服用される薬剤、外科手術、放射線療法、画像診断、副作用、関連する転帰などの治療および転帰、遂行度スコア、実験室検査、病理結果、予後指標などの遺伝子検査および実験室情報、遺伝子検査日、使用される検査提供者、遺伝子シーケンシング方法または遺伝子パネルなどの使用される検査方法、含まれる遺伝子、バリアント、発現レベル/状態などの遺伝子結果、または上記のいずれかに関連付けられている対応する日付を含み得る。 Features derived from structured, curated, and/or electronic medical or health records 112 and 114 include clinical features such as diagnoses, symptoms, treatments, outcomes, patient name, date of birth, , gender, ethnicity, date of death, address, smoking status, cancer, illness, disease, diabetes, depression, patient demographics such as date of diagnosis of other physical or mental illness, medical history, family medical history, date of first medical examination; Clinical diagnosis such as date of diagnosis of metastases, cancer stage, tumor characterization, tissue of origin, treatment line, treatment group, clinical trials, prescribed or taken medications, surgery, radiotherapy, imaging, side effects, related Treatment and outcomes such as outcomes, performance scores, laboratory tests, pathology results, genetic testing and laboratory information such as prognostic indicators, genetic test dates, test providers used, uses such as genetic sequencing methods or gene panels The method of testing performed, genes included, variants, genetic results such as expression levels/status, or corresponding dates associated with any of the above.

機械学習モデルおよび/または人工知能エンジンは、任意の特徴から選択することによって、分類ラベル付け、および/または分析を実行し得る。患者の特徴セットを強化するための1つの方法は、何万もの特徴からの特徴セットを一握りの特徴に折り畳むなどの次元削減を含んでもよい。情報を失うことなく次元削減を実行することは、教師なし方式または教師あり方式でアプローチされ得る。教師なし方法は、RNA変分オートエンコーダ、SVD、PCA、KernelPCA、SparsePCA、DictionaryLearning、Isomap、NMF、UMAP、特徴凝集、患者相関クラスタリング、KMeans、Gaussian Mixture、または球状KMeansを含み得る。教師あり方式で次元削減を実行することは、線形判別分析、近傍成分分析、MLP転送学習、または樹木教師あり埋め込みを含んでもよい。 Machine learning models and/or artificial intelligence engines may perform classification labeling and/or analysis by selecting from arbitrary features. One method for enriching the patient feature set may include dimensionality reduction, such as collapsing a feature set from tens of thousands of features into a handful of features. Performing dimensionality reduction without losing information can be approached in an unsupervised or supervised manner. Unsupervised methods may include RNA Variational Autoencoder, SVD, PCA, KernelPCA, SparsePCA, DictionaryLearning, Isomap, NMF, UMAP, Feature Aggregation, Patient Correlated Clustering, KMeans, Gaussian Mixture, or Spherical KMeans. Performing dimensionality reduction in a supervised manner may include linear discriminant analysis, neighborhood component analysis, MLP transfer learning, or tree supervised embedding.

機械学習モデルまたは人工知能エンジンは、勾配ブースティングモデル、ランダムフォレストモデル、ニューラルネットワーク(NN)、回帰モデル、ナイーブベイズモデル、または機械学習アルゴリズム(MLA)を介して実装され得る。MLAまたはNNは、各患者または画像および特徴に対する特徴ベクトルを有する複数の行列などの訓練データセットから訓練され得る。例示的な予測プロファイルでは、訓練データセットは、EHRからキュレーションされたもの、または遺伝子シークエンシングレポートなど、患者の画像、病理、臨床、および/または分子レポートならびに詳細を含み得る。MLAは、線形回帰、ロジスティック回帰、決定木、分類および回帰木、ナイーブベイズ、最近傍クラスタリングを使用する教師ありアルゴリズム(データセット内の特徴/分類がアノテーションされているアルゴリズムなど)、アプリオリ、meansクラスタリング、主成分解析、ランダムフォレスト、適応型ブースティングを使用する教師なしアルゴリズム(データセット内の特徴/分類がアノテーションされていないアルゴリズムなど)、生成アプローチ(ガウス分布の混合、多項分布の混合、隠れマルコフモデルなど)、低密度分離、グラフベースのアプローチ(mincut、調和関数、多様体正則化など)、発見的アプローチ、またはサポートベクターマシンを使用する半教師ありアルゴリズム(データセット内の不完全な数の特徴/分類がアノテーションされているアルゴリズムなど)を含む。NNは、条件付き確率場、畳み込みニューラルネットワーク、注意ベースニューラルネットワーク、ディープラーニング、長短期記憶ネットワーク、または他のニューラルモデルを含み、訓練データセットは、複数の腫瘍サンプル、各サンプルに対するRNA発現データ、および各サンプルに対するイメージングデータをカバーする病理レポートを含む。MLAおよびニューラルネットワークは、機械学習の異なるアプローチを識別するが、これらの用語は、本明細書では交換可能に使用され得る。したがって、特に断りのない限り、MLAの言及は対応するNNを含み得るか、またはNNの言及は対応するMLAを含み、人工知能エンジンは階層型アーキテクチャにおける各々のうちの1つまたは複数を具現化し得る。 Machine learning models or artificial intelligence engines can be implemented via gradient boosting models, random forest models, neural networks (NN), regression models, naive Bayes models, or machine learning algorithms (MLA). An MLA or NN can be trained from a training data set such as multiple matrices with feature vectors for each patient or image and features. In an exemplary prediction profile, the training data set may include patient images, pathology, clinical, and/or molecular reports and details, such as curated from EHRs or genetic sequencing reports. MLA includes linear regression, logistic regression, decision trees, classification and regression trees, naive Bayes, supervised algorithms using nearest neighbor clustering (such as algorithms where features/classifications in the dataset are annotated), a priori, means clustering , principal component analysis, random forests, unsupervised algorithms using adaptive boosting (e.g. algorithms where the features/classifications in the dataset are not annotated), generative approaches (gaussian mixtures, multinomial mixtures, hidden markov models), sparse separation, graph-based approaches (mincut, harmonic functions, manifold regularization, etc.), heuristic approaches, or semi-supervised algorithms using support vector machines (e.g. algorithms whose features/classifications are annotated). NNs include conditional random fields, convolutional neural networks, attention-based neural networks, deep learning, long short-term memory networks, or other neural models, and the training dataset consists of multiple tumor samples, RNA expression data for each sample, and a pathology report covering imaging data for each sample. MLA and neural networks identify different approaches to machine learning, but the terms may be used interchangeably herein. Thus, unless otherwise noted, references to an MLA may include a corresponding NN, or references to an NN include a corresponding MLA and an artificial intelligence engine embodying one or more of each in a hierarchical architecture. obtain.

いくつかの実施形態において、人工知能エンジンは、訓練された機械学習モデルであってよい。いくつかの実施形態において、訓練された機械学習モデルは、1つまたは複数のLoTを有する医療記録上で機械学習モデルを訓練することによって生成され得る。いくつかの実施形態において、訓練された機械学習モデルは、回帰モデルであってよい。いくつかの実施形態において、訓練された機械学習モデルは、クラスタリングモデルであってよい。いくつかの実施形態において、訓練された機械学習モデルは、次元削減モデルであってよい。いくつかの実施形態において、訓練された機械学習モデルは、分類モデルであってよい。 In some embodiments, the artificial intelligence engine may be a trained machine learning model. In some embodiments, a trained machine learning model may be generated by training a machine learning model on medical records having one or more LoTs. In some embodiments, the trained machine learning model may be a regression model. In some embodiments, the trained machine learning model may be a clustering model. In some embodiments, the trained machine learning model may be a reduced dimensionality model. In some embodiments, the trained machine learning model may be a classification model.

訓練は、最適化されたデータセットを各患者に対する特徴ベクトルの行列として提供することと、これらの特徴を患者記録内に出現するときに監視信号としてラベル付けすることと、出力分類、予測、またはラベルを予測するようにMLAを訓練することとを含み得る。人工NNは、強力な計算モデルであり、人工知能の難しい問題を解くことに強みのあることを示している。これらが普遍的近似器であることも示されている(適切なパラメータを与えたときに広範な関数を表現することができる)。MLAの中には、重要な特徴を識別し、それらに対する係数、すなわち重みを識別するものもある。係数は、特徴の出現頻度と掛け合わされてスコアを生成し、1つまたは複数の特徴のスコアが閾値を超えたときに、MLAによっていくつかの分類が予測され得る。係数スキーマは、ルールベーススキーマと組み合わされ、複数の特徴に基づく予測などの、より複雑な予測を生成するものとしてよい。たとえば、異なる分類において10個の重要な特徴が識別され得る。係数のリストは、重要な特徴に対して存在し、ルールセットは、分類に対して存在し得る。ルールセットは、特徴の出現数、特徴のスケーリングされた重み、または当業者に知られているロジックで符号化された特徴の他の定性的および定量的な評価に基づくものとしてよい。他のMLAでは、特徴は、二分木構造で編成されてもよい。たとえば、大部分の分類を区別する主要な特徴は、二分木のルートとして、また木における後続の各枝として、木の終端ノードに到達することに基づき分類が与えられ得るまで、存在し得る。たとえば、二分木は、第1の特徴を検定するルートノードを有し得る。この特徴の出現または非出現は、存在していなければならず(二分決定)、ロジックは、分類される項目に対して真である枝をトラバースするものとしてよい。追加のルールは、閾値、範囲、または他の定性的および定量的検定に基づくものとしてよい。訓練データセットが多数の知られている値またはアノテーションを有するときに教師ありの方法は有用であるが、EMR/EHRドキュメントの性質上、多数のアノテーションが与えられていない場合もある。大量のラベル付けされていないデータを探索するときに、教師なしの方法はデータセット内のインスタンスのビン分割/バケット化に対して有益である。上記のモデルの単一のインスタンス、または2つもしくはそれ以上のそのようなインスタンスは組み合わせることで、本明細書において説明されているモデルまたはエンジンの目的のためにモデルを構成し得る。 Training consists of providing the optimized dataset as a matrix of feature vectors for each patient, labeling these features as supervisory signals when they occur in patient records, and output classification, prediction, or and training the MLA to predict the labels. Artificial NNs are powerful computational models that show their strength in solving difficult problems for artificial intelligence. It has also been shown that they are universal approximators (a wide range of functions can be represented given suitable parameters). Some MLAs identify important features and identify coefficients, or weights, for them. The coefficients are multiplied by the frequency of occurrence of the feature to produce a score, and some classification can be predicted by MLA when the score of one or more features exceeds a threshold. Coefficient schemas may be combined with rule-based schemas to generate more complex predictions, such as predictions based on multiple features. For example, 10 significant features can be identified in different classifications. A list of coefficients may exist for important features and a rule set may exist for classification. A rule set may be based on feature occurrence counts, feature scaled weights, or other qualitative and quantitative evaluations of features encoded in logic known to those skilled in the art. In other MLAs, features may be organized in a binary tree structure. For example, the main feature that distinguishes most classes may exist as the root of a binary tree and as each subsequent branch in the tree, until a class can be given based on reaching the terminal node of the tree. For example, a binary tree may have a root node that tests the first feature. Occurrence or non-occurrence of this feature must be present (binary decision) and the logic may be to traverse branches that are true for the item being classified. Additional rules may be based on thresholds, ranges, or other qualitative and quantitative tests. Supervised methods are useful when the training dataset has a large number of known values or annotations, but due to the nature of EMR/EHR documents, many annotations may not be provided. Unsupervised methods are beneficial for binning/bucketing instances in datasets when exploring large amounts of unlabeled data. A single instance of the above model, or two or more such instances may be combined to form a model for the purposes of the model or engine described herein.

治療ラインモジュール120は、複数のモジュール、すなわち、記録調和モジュール122、間隔生成モジュール124、および治療ライン割り当てモジュール126を含み得る。記録調和モジュール122は、図3に関して以下でより詳細に開示されているように、EMR112およびデジタル方式でキュレーションされた記録114に含まれる記録を調和させて、重複を除去し、類似の記録を組み合わせ、追加の調和ステップを取るものとしてよい。間隔生成モジュール124は、図4に関して以下でより詳細に開示されているように、調和された記録を受け取り、調和された記録に基づいて複数の治療間隔を生成し、精緻化するものとしてよい。治療ライン割り当てモジュール126は、複数の治療間隔を受け取り、潜在的治療ラインを識別し、患者に投与される1つまたは複数の治療ラインを識別しラベル付けするために、訓練済み人工知能エンジンを潜在的治療ラインに適用し得る。 The line of treatment module 120 may include multiple modules: a record harmonization module 122 , an interval generation module 124 , and a line of treatment assignment module 126 . A record reconciliation module 122 reconciles the records contained in the EMR 112 and the digitally curated records 114 to remove duplicates and avoid similar records, as disclosed in more detail below with respect to FIG. combination, which may take additional harmonization steps. Interval generation module 124 may receive the reconciled records and generate and refine multiple treatment intervals based on the reconciled records, as disclosed in more detail below with respect to FIG. A treatment line assignment module 126 receives a plurality of treatment intervals, identifies potential treatment lines, and activates a trained artificial intelligence engine to identify and label one or more treatment lines to be administered to the patient. It can be applied to therapeutic lines of therapy.

治療ライン(LoT)ストア150は、LoTモジュール120から生成されたLoTを受け取り、システム100で使用するためにそれらを記憶しておくものとしてよい。LoTは、たとえば、いくつかの実施形態において、ウェブフォーム160a~160nを含み得る、ウェブフォームベースの対話型ユーザインターフェースなどのユーザインターフェースによって取り出せるように構造化形式で記憶され得る。ウェブフォームは、モジュール120からの即時LoTを開始するか、もしくは閲覧すること、またはモジュール120がそこからの分析を実行し得る患者のコホートを開始するか、もしくは調整することを含む、複数の分析機能を実行するためのコンピュータシステムの使用者に、コンピュータによって表示できるGUIをサポートし得る。電子レポート170a~170nは、グラフィカルユーザインターフェース(GUI)165を介して生成され、使用者に提供され得る。GUI165は、ネットワークを介してコンテンツサーバ/予測エンジン100に接続されているユーザデバイス上に提示され得ることは理解されるべきである。 A line of care (LoT) store 150 may receive LoTs generated from the LoT module 120 and store them for use in the system 100 . The LoT may be stored in a structured format for retrieval by, for example, a user interface such as a web forms-based interactive user interface, which in some embodiments may include web forms 160a-160n. A web form may be used to initiate or view an immediate LoT from module 120 or multiple analyzes, including initiating or coordinating patient cohorts from which module 120 may perform an analysis. It may support a GUI that can be displayed by the computer to the user of the computer system to perform the functions. Electronic reports 170a-170n may be generated and provided to users via a graphical user interface (GUI) 165. FIG. It should be appreciated that GUI 165 may be presented on a user device that is connected to content server/prediction engine 100 via a network.

レポート170a~170nは、様々な医師および医療提供者(検査室を含む)から患者情報を収集して標準化形式に変換し、統合し、それをネットワークベースのストレージデバイスに記憶し、本開示の実施形態に従ってレポートが生成された後電子レポートを含むメッセージを生成するネットワークベースの患者管理システムの一部として使用者に提供され得る。このようにして、使用者(たとえば、医師、癌専門医、もしくは任意の他の医療提供者、または患者は、生成されたLoTに関係するコンピュータ生成された予測、分析、および他のレポートを受け取る。 Reports 170a-170n collect patient information from various physicians and healthcare providers (including laboratories), convert it into a standardized format, consolidate it, store it in a network-based storage device, and implement the present disclosure. After the report is generated according to the form, it can be provided to the user as part of a network-based patient management system that generates a message containing the electronic report. In this way, a user (e.g., a physician, oncologist, or any other healthcare provider, or patient) receives computer-generated predictions, analysis, and other reports related to the generated LoT.

いくつかの実施形態において、電子レポートは、類似の治療を受けたことのある類似の患者の反応に基づく予測反応と相関する次のLoTまたは治療を使用して患者を治療するための医師への推奨を含み得る。 In some embodiments, the electronic report is an indication to the physician for treating the patient using the next LoT or treatment that correlates with the predicted response based on the response of similar patients who have received similar treatments. May contain recommendations.

図2は、複数のデジタル記録から1つまたは複数の治療ラインを生成するための方法のフローチャートを例示している。ステップ210において、システム200は、複数のデジタル記録から患者に対する医療記録を識別し得る。これらの記録は、EMR/EHR内に記録されるか、非構造化データからデジタル方式でキュレーションされてもよい。医療記録は、特定の時間期間からのものに限定されてもよく、癌などの病状の診断から始まる時間期間を含む。追加の時間期間は、経時的なLoT開発の分析を実行するときに特定の年間隔を含み得る。 FIG. 2 illustrates a flowchart of a method for generating one or more lines of therapy from multiple digital records. At step 210, the system 200 may identify medical records for the patient from the plurality of digital records. These records may be recorded within the EMR/EHR or digitally curated from unstructured data. Medical records may be limited to those from a particular time period, including time periods beginning with the diagnosis of a medical condition such as cancer. Additional time periods may include specific yearly intervals when performing an analysis of LoT development over time.

ステップ220において、システム200は、時間間隔において少なくとも1つの薬剤を有する複数の治療間隔を作成し得る。これらの薬剤は患者記録から識別され、診断に関連するものとしてさらに識別されている。時間間隔は、開始日および/または終了日に関連付けられ、日付は、患者記録から直接割り当てられ得るか、または類似の薬剤、標準診療、もしくは類似の患者記録で訓練された人工知能エンジンからの学習済み間隔などの追加の支援情報からインピュートされ得る。 At step 220, system 200 may create multiple treatment intervals having at least one drug in the time interval. These agents have been identified from patient records and further identified as relevant to diagnosis. Time intervals are associated with start and/or end dates, and dates can be assigned directly from patient records or learned from an artificial intelligence engine trained on similar medications, standard practice, or similar patient records. It can be imputed from additional supporting information, such as the pre-interval.

ステップ230において、システム200は、薬剤の投与が時間間隔内に収まるときに薬剤をそれぞれの治療間隔に関連付け得る。たとえば、6月1日から6月23日までの治療間隔が存在する場合、6月15日に投与されたそれぞれの薬剤は、治療間隔と関連付けられ得るが、9月1日に投与された薬剤は、その投与が時間間隔内に入らないので治療間隔と関連付けられ得ない。 At step 230, the system 200 may associate medications with respective treatment intervals when administration of the medication falls within the time interval. For example, if there is a treatment interval from June 1 to June 23, each drug administered on June 15 can be associated with the treatment interval, but the drug administered on September 1 cannot be associated with a treatment interval as its administration does not fall within the time interval.

ステップ240において、システム200は、各それぞれの治療間隔の時間間隔を精緻化し得る。時間間隔は、重複する間隔を組み合わせること、間隔を分割すること、または1つまたは複数のヒューリスティック、規則、もしくは訓練されたモデルに従って開始日および/もしくは終了日を調整することによって精緻化され得る。 At step 240, system 200 may refine the time interval for each respective treatment interval. Time intervals may be refined by combining overlapping intervals, splitting intervals, or adjusting start and/or end dates according to one or more heuristics, rules, or trained models.

ステップ250において、システム200は、複数の治療間隔から1つまたは複数の潜在的治療ラインを識別し得る。識別は、訓練されたモデル、尤度に基づく順位付けを伴う網羅的列挙、または本明細書に開示されている他の方法を使用して実行され得る。 At step 250, system 200 may identify one or more potential treatment lines from multiple treatment intervals. Identification may be performed using trained models, exhaustive enumeration with likelihood-based ranking, or other methods disclosed herein.

ステップ260において、システム200は、最高の最尤推定を有する潜在的治療ラインを治療ラインとしてラベル付けし得る。たとえば、潜在的治療ラインの順位付けされたリストが与えられた場合、最も高い順位付け(最も信頼度が高い)を有する治療ラインは、治療ラインとして選択され得る。 At step 260, system 200 may label the potential treatment line with the highest maximum likelihood estimate as the treatment line. For example, given a ranked list of potential treatment lines, the treatment line with the highest ranking (highest confidence) may be selected as the treatment line.

図3は、図1の記録調和122のサブプロセスを実装する例示的な記録調和モジュール300を例示している。 FIG. 3 illustrates an exemplary record reconciliation module 300 that implements the sub-processes of record reconciliation 122 of FIG.

記録調和は、記録ホワイトリストおよび/または記録ブラックリストモジュール322、記録関連付けモジュール324、記録組み合わせモジュール326、およびヒューリスティック処理モジュール328などの1つまたは複数のモジュールを含み得る。 Record reconciliation may include one or more modules such as record whitelist and/or record blacklist module 322 , record association module 324 , record combination module 326 , and heuristic processing module 328 .

記録ホワイトリストおよび/または記録ブラックリストモジュール322は、そのコンテンツ、品質、信頼性、または他の評価メトリックに基づき記録を含むかまたは除外するものとしてよい。たとえば、記録は、そのソースがそれぞれの施設からの撮像結果であると識別され得るときに含まれるか、画像解像度が可読性に関して許容閾値を下回る場合に除外されるか、または記録が性別、人種、または他の不変特性/人口統計学における不整合などの患者の不整合を含む場合に除外され得る。 A recording whitelist and/or recording blacklist module 322 may include or exclude recordings based on their content, quality, reliability, or other rating metrics. For example, a record is included when its source can be identified as imaging results from the respective institution, or is excluded if the image resolution is below an acceptable threshold for readability, or if a record is classified according to gender, ethnicity, etc. , or patient inconsistencies such as inconsistencies in other invariant characteristics/demographics.

記録関連付けモジュール324は、冗長性がないか記録をチェックし、複数回出現する記録、または他の記録と同じ情報を含む記録を削除し得る。薬剤、投薬開始日、または投薬終了日との関連付けは、割り当てられるか、またはインピュートされ得る。 The record association module 324 may check records for redundancy and remove records that appear multiple times or contain the same information as other records. Associations with drugs, dosing start dates, or dosing end dates can be assigned or imputed.

記録組み合わせモジュール326は、十分に重複する関連付けを有する記録を組み合わせてもよい。十分に重複する関連付けは、同じ薬剤または類似の薬剤(後発医薬品対ブランド名、競合するブランド名、知られている同等物、または他の類似物など)を含んでもよい。類似の薬剤について同じ開始日を有する複数の記録は、単一の記録に「ロールアップ」されてもよい。 A record combination module 326 may combine records that have sufficiently overlapping associations. Sufficiently overlapping associations may involve the same drug or similar drugs (generic versus brand name, competing brand name, known equivalent, or other analog, etc.). Multiple records with the same start date for similar medications may be "rolled up" into a single record.

ヒューリスティック処理モジュール328は、ルールベースまたは人工知能駆動型記録調和構造を組み込み得る。一例において、人工知能エンジンは、類似の薬剤を識別するように薬剤名に関して訓練されるか、または各薬剤タイプについて患者に最もよく処方されている薬剤の持続期間を予測するように投薬間隔に関して訓練されてもよい。モデルは、それに加えて、開始日、終了日の割り当てに設定された閾値を適用するか、または各記録に対する最小もしくは最大の時間期間を強制するためのルールセットを含み得る。 The heuristic processing module 328 may incorporate rule-based or artificial intelligence driven record reconciliation structures. In one example, the artificial intelligence engine is trained on drug names to identify similar drugs, or trained on dosing intervals to predict the duration of the most commonly prescribed drugs for patients for each drug type. may be The model may additionally include a set of rules for applying set thresholds to the allocation of start dates, end dates, or for enforcing minimum or maximum time periods for each recording.

追加の記録調和ステップは、データ取込および調和に関して以下に開示される。 Additional record reconciliation steps are disclosed below with respect to data capture and reconciliation.

図4は、図1の間隔生成124のサブプロセスを実装する例示的な間隔生成モジュール400を例示している。 FIG. 4 illustrates an exemplary interval generation module 400 that implements the sub-process of interval generation 124 of FIG.

間隔生成は、診断関連性フィルタ422、間隔日付割り当て424、間隔日付インピュテーション426、間隔日付延長428、または間隔日付セグメント化430などの1つまたは複数のモジュールを含んでもよい。 Interval generation may include one or more modules such as diagnostic relevance filter 422, interval date assignment 424, interval date imputation 426, interval date extension 428, or interval date segmentation 430.

診断関連性フィルタ422は、診断を扱うことが知られている薬剤を含む知識データベースを組み込み得る。これらの薬剤は、FDA承認、臨床試験、出版物、または患者記録に関する人工知能分析からキュレーションされ得る。診断の治療に関連しない薬剤は、診断を扱う目的で投与されそうもないので、LoTに対する処理から除外され得る。 Diagnosis relevance filter 422 may incorporate a knowledge database containing agents known to treat diagnoses. These agents may be curated from FDA approvals, clinical trials, publications, or artificial intelligence analysis of patient records. Agents not relevant to the treatment of diagnosis may be excluded from treatment for LoT as they are unlikely to be administered for the purpose of treating the diagnosis.

間隔日付割り当て424は、記録キュレーション、調和、または関連性フィルタリングにおいて先行するモジュールの1つから削除されていない各薬剤記録に間隔を割り当てることを含み得る。薬剤および少なくとも開始日を含む医療記録は、薬剤を有しない、または同じもしくは類似の薬剤を有する間隔に割り当てられ得る。 Interval date assignment 424 may include assigning an interval to each medication record that has not been deleted from one of the preceding modules in record curation, reconciliation, or relevance filtering. A medical record containing a drug and at least a start date can be assigned to an interval with no drug or with the same or similar drug.

間隔日付インピュテーション426は、その間隔の薬剤の投与の正確な推定を反映するために、間隔に対する開始日または終了日をインピュートすることを含み得る。たとえば、投薬が設定された日数間継続すると予想される場合(抗生物質、ステロイド、または知られている周期性を有する他の薬剤の過程)、終了日は、それぞれの薬剤が7日後、14日後、3カ月後などの予想される持続期間に基づき割り当てられる間隔についてインピュートされ得る。 Interval date imputation 426 may include imputing a start date or end date for an interval to reflect an accurate estimate of drug administration for that interval. For example, if medication is expected to continue for a set number of days (a course of antibiotics, steroids, or other drugs with a known periodicity), the end dates are 7 days and 14 days after each drug. , can be imputed for intervals assigned based on expected duration, such as after 3 months.

間隔日付延長428は、連続する間隔が重なるときを識別することと、薬剤が同じであるかまたは類似しているときに他の重なる間隔を包含するように最初の重なる間隔の持続時間を延長することとを含み得る。それに加えて、薬剤が間隔に対して割り当てられるか、またはインピュートされるときに、それぞれの間隔の開始日または終了日は、延長が閾値時間期間の範囲内に収まるときに追加の投薬の日付を含むように延長され得る。一例において、閾値時間期間は、上記の記録組み合わせ326と同様に、22日などの設定された持続期間、またはその間隔の投薬に基づく薬剤毎の時間期間を含み得る。 Interval date extension 428 identifies when successive intervals overlap and extends the duration of the first overlapping interval to encompass other overlapping intervals when the drugs are the same or similar. and In addition, when medications are assigned or imputed for an interval, the start or end date of the respective interval indicates the date of additional medication when the extension falls within the threshold time period. can be extended to include In one example, the threshold time period may include a set duration, such as 22 days, or a time period for each medication based on the interval dosing, similar to record combination 326 above.

間隔日付セグメント化430は、1つまたは複数の間隔において間隔優先事象が発生したときを識別し、優先事象の日付で各それぞれの間隔を分割することを含み得る。たとえば、癌診断において、転移の発生は、間隔優先事象として参照されてもよく、転移の日付を超えて延長する任意の間隔は、元の間隔開始日および終了日としての転移の日付を有する第1の間隔と、間隔開始日としての転移の日付および元の間隔終了日を有する第2の間隔とに分割され得る。優先事象は、治療ライン変更を引き起こす事象を含み、患者記録の人工知能分析を通じて、またはルールセットを介して、またはFDA承認、臨床試験、出版物からキュレーションされ得るようなそれらの事象を通じて、識別され得る。 Interval date segmentation 430 may include identifying when an interval priority event occurs in one or more intervals and dividing each respective interval by the date of the priority event. For example, in cancer diagnostics, the occurrence of metastasis may be referred to as an interval-priority event, and any interval that extends beyond the date of metastasis will have the date of metastasis as the original interval start and end date. 1 interval and a second interval with the date of transition as the interval start date and the original interval end date. Priority events include events that trigger a change in treatment line and are identified through artificial intelligence analysis of patient records or through rulesets or through those events as they may be curated from FDA approvals, clinical trials, publications. can be

図5は、図1の治療ライン割り当て126のサブプロセスを実装するための例示的な治療ライン割り当てモジュール500を例示している。 FIG. 5 illustrates an exemplary line of treatment assignment module 500 for implementing the sub-processes of line of treatment assignment 126 of FIG.

治療ライン割り当ては、LoT割り当て推定522、LoT割り当て確率524、LoT順位付け526、またはLoTラベル付け528などの1つまたは複数のモジュールを含んでもよい。 Treatment line assignment may include one or more modules such as LoT assignment estimation 522 , LoT assignment probability 524 , LoT ranking 526 , or LoT labeling 528 .

LoT割り当て推定522は、潜在的治療ラインを識別するために間隔が互いに間隔に対して一部および全体として考慮され得るように利用可能な間隔の整数の結合の評価を実行することを含んでもよい。別の実施形態において、人工知能エンジンは、複数の治療間隔を受け取り、複数の潜在的治療ラインを出力し得る。 LoT assignment estimation 522 may include performing an integral combination evaluation of the available intervals so that the intervals may be considered in part and as a whole with respect to each other to identify potential treatment lines. . In another embodiment, the artificial intelligence engine may receive multiple treatment intervals and output multiple potential treatment lines.

LoT割り当て確率524は、各潜在的治療ラインが連続的に番号を振られた治療ライン(第1の治療ライン、第2の治療ライン、第3の治療ラインなど)として含まれるであろう可能性を識別するために各潜在的治療ラインの期待最大確率を計算することを含み得る。 The LoT assignment probability 524 is the likelihood that each potential line of treatment will be included as a sequentially numbered line of treatment (first line of treatment, second line of treatment, third line of treatment, etc.). calculating the expected maximum probability for each potential treatment line to identify .

LoT順位付け526は、最も高い確率を有する潜在的治療ラインが順位付けの最上位にあり、最も低い確率を有する潜在的治療ラインが順位付けの最下位にあるようにそれらの尤度に基づき複数の潜在的治療ラインを順位付けすることを含み得る。 The LoT ranking 526 is multiple based on their likelihood such that the potential treatment line with the highest probability is at the top of the ranking and the potential treatment line with the lowest probability is at the bottom of the ranking. may include ranking potential treatment lines for

LoTラベル付け528は、最も可能性の高い潜在的治療ラインをその治療ラインとして識別するか、または連続する潜在的治療ラインを評価して、各先行する治療ラインの後に時系列的に発生し、各連続する時間間隔における潜在的治療ラインのそれぞれの最高の最尤推定値を有する連続する増分的に番号を振られた治療ラインを識別するものとしてよい。たとえば、第1の潜在的治療ラインが1月に開始し、第2の潜在的治療ラインが5月に開始する場合、第1の潜在的治療ラインは、第1の治療ラインとしてラベル付けされ、第2の潜在的治療ラインは、両方の治療ラインが5月以前および5月以降の間隔でそれぞれ最高順位付け潜在的治療ラインであるときにその第2の治療ラインとしてラベル付けされ得る。それに加えて、人工知能エンジンは、治療ラインおよび/または反復的に連続する治療ラインを識別し、ラベル付けするように訓練されてもよい。 LoT labeling 528 identifies the most likely potential line of treatment as that line of treatment, or evaluates consecutive potential lines of treatment, occurring chronologically after each preceding line of treatment, Consecutive, incrementally numbered treatment lines with the highest maximum likelihood estimates for each of the potential treatment lines in each consecutive time interval may be identified. For example, if a first potential line of treatment starts in January and a second potential line of treatment starts in May, the first potential line of treatment is labeled as the first line of treatment, A second potential line of treatment may be labeled as the second line of treatment when both lines of treatment are the highest ranking potential lines of treatment in the pre-May and post-May intervals, respectively. Additionally, the artificial intelligence engine may be trained to identify and label lines of treatment and/or iteratively consecutive lines of treatment.

図3~図5のモジュールは、次のステップまたはプロセスのうちの1つまたは複数を実行するように構成され得る。 The modules of FIGS. 3-5 may be configured to perform one or more of the following steps or processes.

一例において、ルールのセットが、患者の記録から1つまたは複数のLoTをラベル付けするプロセスをガイドし得る。ルールは、1つまたは複数の「ハード」ルールまたは「ソフト」ルールを含み得る。 In one example, a set of rules can guide the process of labeling one or more LoTs from patient records. Rules may include one or more "hard" or "soft" rules.

ハードルール
前立腺癌の初期診断後、患者にロイプロリドを処方し、生涯投与することが一般的であり得る。したがって、EMRにロイプロライドが出現した後、LoTが変更されたとしても、常にLoTの一部として残り得る。別の例示的なハードルールは、治療中止、転移、または進行性疾患転帰など、LoTの変更を必要とするいくつかの介在事象を含み得る。その反対もハードルールとして符号化され得る。たとえば、アベマシクリブへの投薬変更が記録された患者は、一般に乳癌の転移によってのみ出現する。EMRが不完全であり、患者の癌が転移によって広がったことを記載していない場合でも、これはインピュートされEMRに追加されるとともに、それぞれの治療間隔、潜在的LoT、または検出後LoTをセグメント化し得る。同様に、一方のクラスの薬物から別のクラスの薬物への進行もハードルールとして実装されてよく、それぞれの治療間隔、潜在的LoT、またはLoTのセグメント化を強制し得る。
Hard Rules It may be common for patients to be prescribed leuprolide for life after initial diagnosis of prostate cancer. Therefore, after leuprolide appears in the EMR, it can always remain part of the LoT, even if it changes. Another exemplary hard rule may include some intervening event that requires modification of LoT, such as treatment discontinuation, metastasis, or progressive disease outcome. The opposite can also be encoded as a hard rule. For example, patients documenting a dosing change to abemaciclib generally only present with breast cancer metastasis. Even if the EMR is incomplete and does not describe that the patient's cancer has spread by metastasis, this is imputed and added to the EMR, as well as segmenting the respective treatment interval, latent LoT, or post-detection LoT. can become Similarly, progression from one class of drug to another class of drug may also be implemented as a hard rule, enforcing each treatment interval, potential LoT, or segmentation of the LoT.

ソフトルール
ルールが形成されるが、条件付きで適用され得るときに、それらはソフトルールとして符号化され得る。一例において、癌専門医は、LoTを異なる仕方で各々定義する、すなわち、一部をカルボプラチンとシスプラチンとを一緒にLoTと見なすが、その後のメンテナンスペムブロリズマブをLoTのコア部分ではないと見なし得るものも、シスプラチンおよびカルボプラチンをメンテナンスペムブロリズマブと併せて1つのLoTと見なし得るものもいることに留意されたい。副作用回避のためとは言え、逸脱を新たなLoTと考える人もいれば、そうでない人もいる。これらのタイプの選好は、LoTに追加の重みを与えるが、EMRで見たときに新しいLoTが生成されることを必要としないソフトルールとして生成され得る。2つの薬剤が、同じ有効成分を有する、または異なる有効成分で同じ効果を達成するなど、類似している場合、一方から他方への変更は、LoT変更の有無を決定するために加重されてよい。さらに、一方のソフトルールを適用することが別のソフトルールを適用することよりも好まれることが記録され、医師毎または施設毎に適用され、それにより特定のソフトルールが、そのソフトルールの使用を選択した特定の医師または施設のケアの下にある患者に基づき条件付きで適用され得る。
Soft Rules When rules are formed, but can be applied conditionally, they can be encoded as soft rules. In one example, oncologists may each define LoT differently, i.e., consider part carboplatin and cisplatin together as LoT, but not the subsequent maintenance pembrolizumab as a core part of LoT. Note that some may consider cisplatin and carboplatin together with maintenance pembrolizumab as one LoT. Some people consider deviation to be a new LoT, even if it's to avoid side effects, while others don't. These types of preferences can be generated as soft rules that give additional weight to LoT, but do not require new LoT to be generated when viewed in EMR. If two drugs are similar, such as having the same active ingredient or achieving the same effect with different active ingredients, the change from one to the other may be weighted to determine whether there is a LoT change. . Additionally, it is noted that the application of one soft rule is preferred over the application of another, and is applied on a per-physician or per-institution basis, whereby a particular soft rule is enforced by the use of that soft rule. may be applied conditionally based on the patient under the care of the particular physician or institution that has chosen to do so.

アルゴリズムの方法論および出力例
一アプローチにおいて、EMRおよびキュレーションされた進行レポートは、すべての診断、薬剤、有意な事象、ならびに薬剤の組み合わせ、有意な事象、および薬剤の他の組み合わせに基づき任意のLoTを識別することに関連し得る他の特徴について解析され得る。MLAは、大きく分けて2つのステップで機能する。最初のステップは、EHRおよびキュレーションされた経過記録をまたがる投薬、転帰、診断を含む、異種のデータソースを合成し調和させ、患者ケアの固有の間隔を作成することからなる。第2のステップでは、これらの間隔のすべての可能な組み合わせを考慮し、しかるべくLoTを割り当てる。薬歴がTHECATSATという文字列として表現される辞書的例では、各文字は第1のステップによるダイジェスト作成の後、固有の薬剤の組み合わせを表し得る。患者データにまたがって訓練した後、第2のステップのゴールは、ヒューリスティックを考慮して、共通の投薬パターンを認識し、これを「THE」+「CAT」+「SAT」に分離することである。患者EMRに基づく例は、図8~図13Fに関して以下で説明される。
Algorithm Methodology and Example Output In one approach, EMR and curated progression reports are generated based on all diagnoses, agents, significant events, and any LoT combinations based on combinations of agents, significant events, and other combinations of agents. can be analyzed for other features that may be relevant to identifying the . MLA works in two main steps. The first step consists of synthesizing and harmonizing disparate data sources, including medications, outcomes, and diagnoses across EHRs and curated progress notes, to create unique intervals of patient care. The second step considers all possible combinations of these intervals and assigns the LoT accordingly. In the lexical example where the medication history is represented as the string THECATSAT, each letter may represent a unique drug combination after digesting by the first step. After training across patient data, the goal of the second step is to consider heuristics to recognize common dosing patterns and separate them into 'THE' + 'CAT' + 'SAT'. . Examples based on patient EMR are described below with respect to FIGS. 8-13F.

モデルの訓練
モデルの訓練は、大きな訓練コホート内の各患者に対する固有の治療間隔(「T」または「H」のような、上記の例からの「文字」)を定義すること、集約のすべての組み合わせ(T+HEC+AT対THE+CAT)を反復的に考察すること、これらの集約を割り当てること、これらの結果として得られる集約(単語)の頻度を計算すること、終了条件に到達するまで集約を再割り当てることからなるものとしてよい。集約のこれらの組み合わせは、整数の結合のアプローチを使用して列挙される。そのような5つの薬剤のLoT表現を有する簡素化された例において、整数の結合のアプローチを使用して16の異なる可能なLoTグルーピングに分割する。
Model Training Model training consists of defining a unique treatment interval (a "letter" from the example above, such as "T" or "H") for each patient within a large training cohort, all of the aggregates Considering combinations (T+HEC+AT vs. THE+CAT) iteratively, assigning these aggregates, calculating the frequency of these resulting aggregates (words), until the termination condition is reached. It may consist of reassigning aggregates. These combinations of aggregates are enumerated using an integer join approach. In a simplified example with such five drug LoT representations, we divide them into 16 different possible LoT groupings using an integer combination approach.

5の16個の合成は次の通りである。
● 5
● 4 + 1
● 3 + 2
● 3 + 1 + 1
● 2 + 3
● 2 + 2 + 1
● 2 + 1 + 2
● 2 + 1 + 1 + 1
● 1 + 4
● 1 + 3 + 1
● 1 + 2 + 2
● 1 + 2 + 1 + 1
● 1 + 1 + 3
● 1 + 1 + 2 + 1
● 1 + 1 + 1 + 2
● 1 + 1 + 1 + 1 + 1.
The 16 syntheses of 5 are as follows.
● 5
● 4+1
● 3 + 2
● 3 + 1 + 1
● 2 + 3
● 2 + 2 + 1
● 2 + 1 + 2
● 2 + 1 + 1 + 1
● 1 + 4
● 1 + 3 + 1
● 1 + 2 + 2
● 1 + 2 + 1 + 1
● 1 + 1 + 3
● 1 + 1 + 2 + 1
● 1 + 1 + 1 + 2
● 1 + 1 + 1 + 1 + 1.

この頻度分析は、診断情報、臨床情報、および有意な事象と併せてハード/ソフトルールと組み合わされ、それにより、各結合に対する包括的確率推定を提供し得る。次いで、この最もありそうな結合(THE+CAT+SAT)が、割り当てられたLoTとして出力される。 This frequency analysis can be combined with hard/soft rules along with diagnostic information, clinical information, and significant events to provide global probability estimates for each combination. This most likely combination (THE+CAT+SAT) is then output as the assigned LoT.

一ゴールは、テキストの大きなコーパスを研究した後、THE|CAT|SATと読めるように、この文字列の切り出し点を識別することである。アルファベットの各文字が子音(C)および母音(V)などの何らかの下位階層にマッピングされていれば、このような問題はより簡単で、上記はT→C、H→V、E→C、C→C、A→V、T→C、S→C、A→V、T→Cと読めるということもあり得る。この場合、セパレータCVC|CVC|CVCを学習する方がはるかに簡単である。このために、解剖治療化学(ATC)分類システムは、薬物の有効成分を、作用する器官またはシステムおよびその治療的、薬理学的、および化学的特性に従って分類する薬物分類システムである。これは世界保健機関の薬物統計方法論協力センター(WHOCC)によって管理されており、1976年に初めて発表された。この医薬品コーディングシステムでは、薬物を、作用する器官またはシステム、その治療の意図または性質、および薬物の化学的特性に従って異なるグループに分ける。異なるブランドは、同じ活性物質および指示を有している場合に同じコードを共有する。各下位レベルのATCコードは、単一の指示(または使用)において医薬品として使用される物質、または物質の組み合わせを表している。これは、1つの薬物が複数のコードを有することができる、たとえば、アセチルサリチル酸(アスピリン)はA01AD05(WHO)を経口局所治療のための薬物として、B01AC06(WHO)を血小板阻害薬として、N02BA01(WHO)を鎮痛および解熱薬として有し、さらには1つのコードが複数の有効成分を表すことができる、たとえば、C09BB04(WHO)はペリンドプリルとアムロジピンとの組み合わせであり、2つの有効成分は単独で処方されたときにはそれ自体のコード(それぞれC09AA04(WHO)およびC08CA01(WHO))を有する。ATC分類システムは厳密な階層構造になっている、すなわち、親を有しない最上位の14のコードを除き、各コードは必ず唯一の親コードを有する。これらのコードは、意味的識別子である、すなわち、それらは、それ自体親の完全な系統を表す。ATC階層は、所与の薬剤に対して第3レベル階層と第4レベル階層を提供する。各薬剤をこの階層に再マッピングできれば、特にデータセットがより小さいか、または極めて高い薬剤カーディナリティがある文脈では、これらのより単純な表現においてLoTを定義することの改善が実現され得る。注目すべき具体的な事例は、1つの癌で極めて一般的であるが、従来のMLA技術を使用して学習することが困難である、ホルモン維持療法および他の療法であり得る。 One goal, after studying a large corpus of text, is to identify a cut point for this string that reads THE|CAT|SAT. Such a problem would be simpler if each letter of the alphabet were mapped to some sub-hierarchy such as consonant (C) and vowel (V), the above would be T→C, H→V, E→C, C →C, A→V, T→C, S→C, A→V, T→C. In this case it is much easier to learn the separator CVC|CVC|CVC. To this end, the Anatomical Therapeutic Chemistry (ATC) classification system is a drug classification system that classifies the active ingredients of drugs according to the organ or system they act on and their therapeutic, pharmacological, and chemical properties. It is administered by the World Health Organization's Collaborating Center for Pharmacostatistics and Methodology (WHOCC) and was first published in 1976. This drug coding system divides drugs into different groups according to the organ or system they act on, their therapeutic intent or nature, and the drug's chemical properties. Different brands share the same code if they have the same active substance and directions. Each sublevel ATC code represents a substance, or combination of substances, that is used as a drug in a single indication (or use). This means that one drug can have multiple codes, for example, acetylsalicylic acid (aspirin) has A01AD05 (WHO) as a drug for oral topical therapy, B01AC06 (WHO) as a platelet inhibitor, N02BA01 ( WHO) as an analgesic and antipyretic, and one code can represent multiple active ingredients, for example, C09BB04 (WHO) is a combination of perindopril and amlodipine, the two active ingredients alone They have their own codes when prescribed (C09AA04 (WHO) and C08CA01 (WHO) respectively). The ATC classification system is strictly hierarchical, ie each code has exactly one parent code, except for the top 14 codes which have no parent. These codes are semantic identifiers, ie they represent the complete lineage of the parent as such. The ATC hierarchy provides a third level hierarchy and a fourth level hierarchy for a given drug. An improvement in defining LoT in these simpler representations could be realized if each drug could be remapped to this hierarchy, especially in contexts with smaller datasets or very high drug cardinality. A notable specific case could be hormone maintenance therapy and other therapies that are very common in one cancer but difficult to learn using conventional MLA techniques.

たとえば、乳癌LoTでは、コホートは、乳癌に関連する約55の固有の抗悪性腫瘍薬を有し得る。これらの薬剤をそれらの基礎となるATC階層に、レベル3または4のいずれかを通じてグループ化すると、その結果、ATCレベル4の下で20、およびATCレベル3の下で9というこの薬剤空間の著しい減少が生じる。識別されたLoT状態(乳癌の患者セット全体からのLoTの分類)の数は、薬剤名のみを使用して1117であり、ATCレベル4の下で656、ATCレベル3の下で289である。大まかに言って、次第に非特異的な薬剤グルーピングを採用してゆくと、固有の「薬剤」の数は1/2に減少し、それに応じて、出力モデルにおける薬剤状態の数はおおよそ1/2減少する。 For example, in the Breast Cancer LoT, a cohort may have approximately 55 unique antineoplastic agents associated with breast cancer. Grouping these drugs into their underlying ATC hierarchies, either through levels 3 or 4, results in a significant increase in this drug space of 20 under ATC level 4 and 9 under ATC level 3. A decrease occurs. The number of identified LoT states (classifications of LoT from the entire breast cancer patient set) is 1117 using drug name only, 656 under ATC level 4 and 289 under ATC level 3. Roughly speaking, adopting increasingly non-specific drug groupings reduces the number of unique 'drugs' by a factor of two, and correspondingly, the number of drug states in the output model is roughly halved. Decrease.

ATC階層によって提供される同等性は、主として乳癌で観察される「維持」問題を解決するために実装された。第一選択である化学療法(ドキシサイクリンおよびシクロホスファミド)に続いてタモキシフェンまたはアナストロゾール(ホルモン療法)を行う患者がしばしば見られるが、これはすべて1つのLoTと見なされる。しかし、基本患者データからLoTを識別することに対する純粋な頻度ベースのアプローチでは、ほとんど常に、化学療法およびホルモン療法は別のLoTであると言うが、それは、ホルモン療法はどこにでもあるものだからであり、全患者投薬状態の半分は、ホルモン療法であり(すなわち、患者が少なくとも1つの薬剤を服用していれば、半分の時間は、ホルモン療法である)、第2に、第一選択として化学療法を受ける患者は、時間の半分である、180日以内にホルモン療法に移行する。言葉の例(THECATSAT)に戻ると、これは、人はEをほぼいつでも見ていて、THを規則正しいペースで見ていて、THEについては時間のほぼ半分であると言っているようなものである。純粋な頻度では、TH|Eが結果である。これは、部分的にはEの偏在性(prob(E)が高い)によりprob(TH)*(E)>prob(THE)であるからである。実際、これは、Eが後にある、または単にEである何百ものバリエーションを観察するからである。この場合、Eは単一の文字のみであると考えるであろう。 The equivalence provided by the ATC hierarchy was implemented primarily to solve the "maintenance" problem observed in breast cancer. Patients are often seen with first-line chemotherapy (doxycycline and cyclophosphamide) followed by tamoxifen or anastrozole (hormonal therapy), all of which are considered one LoT. However, pure frequency-based approaches to discerning LoT from baseline patient data almost always refer to chemotherapy and hormone therapy as separate LoTs because hormone therapy is ubiquitous. , half of all patient medications are on hormonal therapy (i.e., if the patient is taking at least one drug, half the time is on hormonal therapy), and second, chemotherapy as the first choice. Patients who receive it transition to hormone therapy within 180 days, half the time. Returning to our verbal example (THECATSAT), this is like saying that one sees E almost all the time, TH at a regular pace, and THE about half the time. . In pure frequency, TH|E is the result. This is partly because prob(TH)*(E)>prob(THE) due to the ubiquity of E (prob(E) is high). In fact, this is because we observe hundreds of variations that are followed by an E or simply an E. In this case, one would consider E to be only a single letter.

したがって、維持の問題は、純粋頻度モデルのコア問題の結果であり、Eの出現が重要でないとき、および第2に、Eが一般的に単独で見られる場合、およびTH、実際には1つの「単語」になり得るいくつかの事例があるときに常に分離していなければならないことである。これらの両方は、確率表現に符号化されてよく、THEは、prob_1(TH)*prob_2(E)<prob_1(THE)である場合に単語であり、prob_1は所与の文字を第1(1)、第2(2)などを観察する確率を示す。後者は、THEの「word-ness」がprob(E|TH)>prob(X|TH)*prob(E|X)である、すなわち、所与のTHが前にあり、Eの存在が偶然(または任意の他の所与の薬剤、X)に比べて有意に高い場合であるとして符号化されるものとしてよく、場合によってはEの頻度によって変調される。 The maintenance problem is therefore a consequence of the core problem of the pure frequency model, when the occurrence of E is insignificant, and second, when E is commonly seen alone, and TH, in fact one It must be separated whenever there are several cases that can be a "word". Both of these may be encoded into a probability representation, where THE is a word if prob_1(TH)*prob_2(E)<prob_1(THE) and prob_1 is the first (1 ), the probability of observing the second (2), etc. The latter means that the "word-ness" of THE is prob(E|TH)>prob(X|TH)*prob(E|X), i.e., preceded by a given TH and the presence of E happens to be (or any other given agent, X), possibly modulated by the frequency of E.

どのモデルを実装すべきかを選択することは、基礎となるシステムの性能を評価する事例である。治療ラインは、しばしばNCCNガイドラインの結果であり、癌専門医は、ほんのわずかの変更で、所与の時点における「計画」を選択し、転帰が観察された後これを変更し、および/または治療への患者の反応はよくない。したがって、後者の方がより適切な確率空間の表現方法である。前者の表現は、prob_1(TH)*prob_2(E)!=prob_2(TH)*prob_3(E)を意味し、時間順序付けが厳密に確率を変化させることを意味する。これは同様にその場合である可能性が高いが、捕らえるべきより望ましい特徴は、EまたはTHだけを見ることがTHEが単語かどうかを予測することに重要ではなく、むしろTH(X)と(Z)Eとを比較し、X=E、Z=THのときに有意な濃縮があるかどうかを予測することに重要であるということである。 Choosing which model to implement is a case of evaluating the performance of the underlying system. Lines of treatment are often the result of NCCN guidelines, in which oncologists select a "plan" at a given time point, change it after outcomes are observed, and/or make changes to treatment, with only minor changes. patients do not respond well. Therefore, the latter is a more appropriate way of expressing the probability space. The former expression implies prob_1(TH)*prob_2(E)!=prob_2(TH)*prob_3(E), implying that time ordering strictly varies probabilities. This is likely to be the case as well, but the more desirable features to capture are that seeing only E or TH is not important to predict whether THE is a word, but rather TH(X) and ( Z) is important for comparing E and predicting whether there is significant enrichment when X=E and Z=TH.

上で説明されているように、確率モデルは、その生の形態において、進行事象を通常インピュートする方式への不明確なマッピングを有する。最悪の場合、進行事象を実際には見ることはほとんどないときに一貫して進行事象をインピュートするときがある。モデルと転帰との間の一致を一層高めるために、以下のような基礎となる確率モデルを用いて強化されたモデルおよび対応するモデルの訓練が実施される。
prob(A→B)=prob(A)*prob(B)*prog_w(A,B )対prob(AB)*[1-prog_w(A,B )]、
ここで、prog_w(A,B)は、投薬状態Aと投薬状態Bとの間の観察される進行発生率の推定を表す。上記の状態がLoTブレークを開始することは、A→Bへの遷移で通常観測される進行の発生率により修正され、この状態がより一般的になればなるほど、両者が1つのLoTである状況と比較してより可能性が高くなる。このモデルは、prog_w(A,B)を、この遷移を観測した総回数に対するこの遷移において観察された進行の回数として実装し得る。しかしながら、大多数の遷移は、ほとんど未観察なので、モデルに著しいバイアスをかけることになる。0.5に向かう傾向のある「ベイズ」推定(つまり、進行発生率ではなく、モデルの基本的な頻度空間に決定を任せる)がなされる。サンプルサイズが大きければ大きいほど、観察された推定値を使いたくなり、小さければ小さいほど、0.5を使いたくなる。これを実装する古典的な方法は、加法的平滑化であり、prog_wは次の通りであり得る。
prog_w(A→B)=(prog_f)±abs(prog_f-0.5)*(upper_95(prog_f)-lower_5(prog_f))。
ここで、prog_fはA→Bの遷移で観察された進行の回数を全体の発生率で割ったものであり、upper_95(prog_f)、lower_5(prog_f)はprog_fに対するClopper Pearson法に基づく95番目と5番目の二項比率CI推定値である。サンプルサイズが大きくなると、信頼区間が0に近づくので、prog_fに適用される「センタリング」は減少する。サンプルサイズが増加すると、信頼区間は発散し(最大1.0)、これは最大のシフトが適用されることを意味し、prog_wは0.5に向かう傾向を有する。
As explained above, the probabilistic model, in its raw form, has an imprecise mapping to the way in which progress events are usually imputed. At worst, it consistently imputes Progressive Events when it rarely actually sees Progressive Events. To further improve the agreement between models and outcomes, an enhanced model and corresponding model training are performed using an underlying probabilistic model as follows.
prob(A→B)=prob(A)*prob(B)*prog_w(A,B) vs prob(AB)*[1-prog_w(A,B)],
where prog_w(A,B) represents an estimate of the observed incidence of progression between medication state A and medication state B; The condition above initiates a LoT break is modified by the incidence of progress normally observed in A→B transitions, and the more common this condition becomes, the more common the situation is when both are one LoT. more likely compared to The model may implement prog_w(A,B) as the number of progressions observed in this transition over the total number of times this transition was observed. However, the majority of transitions are largely unseen, thus significantly biasing the model. A "Bayesian" estimate (ie, leaving the decision to the underlying frequency space of the model rather than the progressive incidence) is made with a trend toward 0.5. The larger the sample size, the more likely we want to use the observed estimate, the smaller the more likely we want to use 0.5. The classical way to implement this is additive smoothing, where prog_w could be:
prog_w(A→B)=(prog_f)±abs(prog_f-0.5)*(upper_95(prog_f)-lower_5(prog_f)).
where prog_f is the observed number of progressions on the A→B transition divided by the overall incidence, upper_95(prog_f), lower_5(prog_f) are the 95th and 5th progressions based on the Clopper Pearson method for prog_f. th binomial proportion CI estimate. As the sample size increases, the "centering" applied to prog_f decreases as the confidence interval approaches 0. As the sample size increases, the confidence interval diverges (up to 1.0), which means that the maximum shift is applied, prog_w tends towards 0.5.

ATCおよび強化されたモデルは、共通の遷移と最も高い一致を示している。最も重要なことは、モデルが次にデータ(トラスツズマブ→トロゾール)との最も少ない有意な矛盾を示し、データ中の1/319の発生率は出力中の319のうちの30に匹敵し、これは極めて小さな差であるか、またはタキサン→トロゾールなどの~29の追加事象の注入である。これは、化学療法などの強力で迅速な開始療法から維持療法への遷移として極めて一般的なものである。即時LoTラベル付け人工知能エンジンの利点は、要求実体に基づき可能な3つのLoTをカバーするソフトルールにおける微妙な差異を許すことである。は開始療法、維持療法、または開始療法と維持療法の組み合わせを含むことが可能であるLoT。 ATC and enhanced models show common transitions and highest agreement. Most importantly, the model then showed the least significant discrepancy with the data (trastuzumab→trozole), with an incidence of 1/319 in the data comparable to 30 of 319 in the output, which Either a very small difference or an infusion of ˜29 additional events such as taxane→trozole. This is very common as a transition from an intensive, rapid starting therapy such as chemotherapy to maintenance therapy. An advantage of the instant LoT labeling artificial intelligence engine is that it allows nuances in the soft rules covering the three possible LoTs based on the request entity. The LoT can include initiation therapy, maintenance therapy, or a combination of initiation and maintenance therapy.

したがって、強化されたモデルは、高次の相互作用の可能性を維持しながら、維持療法に関する誤ったLoTの変化を除去するか、またはモデルと観察されたデータとの間の矛盾の発生を減少させる。 Thus, the enhanced model either removes spurious LoT changes related to maintenance therapy or reduces the occurrence of discrepancies between the model and observed data while maintaining the potential for higher-order interactions. Let

別の実施形態において、教師なしモデルなどの、人工知能モデルは、患者の健康情報または他の治療情報に関して訓練され得る。教師なしモデルは、患者が受けた投薬または他の療法および進行に関する情報、または治療間隔優先事象を含む情報に関して訓練され得る。いくつかの例において、モデル訓練と関連性のある進行事象は、第1の療法が中止された後、第2の療法が開始される前に発生した進行事象である。 In another embodiment, an artificial intelligence model, such as an unsupervised model, can be trained on patient health information or other treatment information. Unsupervised models can be trained on information about medications or other therapies received by patients and progress, or information including treatment interval preference events. In some examples, a progressive event associated with model training is a progressive event that occurred after the first therapy was discontinued but before the second therapy was initiated.

いくつかの実施形態において、患者の健康データを使用して訓練されたモデルによって識別される治療ラインは、National Comprehensive Cancer Network(NCCN)によって公開されているガイドライン、FDAガイドライン、臨床試験、または他の出版物などの、所定の標準的治療法ガイドラインに従う。 In some embodiments, the treatment line identified by the model trained using patient health data is based on guidelines published by the National Comprehensive Cancer Network (NCCN), FDA guidelines, clinical trials, or other Follow established standard treatment guidelines, including published publications.

いくつかの実施形態において、半教師ありアプローチは、多数の治療ラインがNCCNガイドライン、FDA勧告、臨床試験、医薬品ファクトシート、または他の出版物からキュレーションされる場合に実装され、次いで、半教師ありアプローチの教師なし部分においてキュレーションされたラベルに一致しないラベルが生成された患者におけるラベルを識別するための出発点として使用され得る。当業者であれば、半教師ありアプローチは、セットアップおよび実行のために操作中に追加の時間を要するが、正確なLoT指定を含む出発基準を与えられているのでより信頼性の高いLoTを提供することを認識するであろう。 In some embodiments, a semi-supervised approach is implemented when multiple lines of therapy are curated from NCCN guidelines, FDA recommendations, clinical trials, drug fact sheets, or other publications, and then semi-supervised It can be used as a starting point to identify labels in patients for whom labels were generated that did not match the curated labels in the unsupervised portion of the ALI approach. Those skilled in the art will appreciate that the semi-supervised approach takes additional time during operation to set up and run, but provides a more reliable LoT given the starting criteria, including an accurate LoT designation. will recognize that

いくつかの実施形態において、2つまたはそれ以上の治療の投与日が互いの時間期間内にあるときに同じ治療識別子を有する治療から連結治療を生成することによって治療が生成され得る。いくつかの実施形態において、時間期間は、少なくとも一部は病状に基づくことができる。いくつかの実施形態において、時間期間は、少なくとも一部は治療識別子に基づくことができる。いくつかの実施形態において、時間期間は、少なくとも一部は病状および治療識別子に基づくことができる。 In some embodiments, treatments may be generated by generating a concatenated treatment from treatments with the same treatment identifier when the administration dates of two or more treatments are within a time period of each other. In some embodiments, the time period can be based at least in part on medical conditions. In some embodiments, the time period can be based at least in part on the treatment identifier. In some embodiments, the time period can be based at least in part on the medical condition and treatment identifier.

任意の特定の患者記録について、記録から識別される治療ラインは、標準的治療法ガイドラインで公表されている治療ラインに揃えるものとしてよい。たとえば、卵巣癌では、標準的治療法ガイドラインは、2またはそれ以上の白金ベース治療ラインを受け、最近の再発治療ラインに対して完全もしくは部分的反応を有していた白金感受性疾患の患者に対する維持療法としてニラパリブを推奨し得る。ウェブページ160A~160NまたはGUI170を介して実行されるものなどの分析は、NCCN、FDA、または他のガイドライン設定実体からのガイドラインへのコンプライアンス統計を医師または施設に対して提供し得る。 For any particular patient record, the lines of therapy identified from the record may align with the lines of therapy published in standard therapeutic guidelines. For example, in ovarian cancer, the standard of care guideline is maintenance for patients with platinum-sensitive disease who have received 2 or more lines of platinum-based therapy and who have had a complete or partial response to a recent recurrent line of therapy. Niraparib may be recommended as therapy. Analyzes such as those performed via web pages 160A-160N or GUI 170 may provide physicians or institutions with compliance statistics for guidelines from the NCCN, FDA, or other guideline-setting entity.

治療ラインのいくつかは、NCCNガイドラインで識別される治療法ガイドラインなどの、標準的治療法ガイドラインに一致する。治療ラインのうちの他のものは、標準的治療法ガイドラインと一致しない場合がある。これらの場合において、LoT決定は、間違っている可能性のある医療記録内のデータを識別する品質改善の目的に使用され得る。他の場合では、LoT決定は、FDA承認された療法の組み合わせを試験する試験などの臨床試験に参加した患者を識別し得る。他の例では、LoT決定は、現在の標準的治療法ガイドラインにまだ反映されていない臨床診療の新しい傾向を識別し得る。たとえば、LoT化学療法レジームとその後のLoT維持標的療法(PARP阻害剤またはEGFR阻害剤のような標的阻害剤など)を受ける患者の卵巣癌における治療ライン。 Some of the lines of therapy conform to standard treatment guidelines, such as those identified in the NCCN Guidelines. Others of the lines of treatment may not conform to standard treatment guidelines. In these cases, the LoT determination can be used for quality improvement purposes to identify data within the medical record that may be erroneous. In other cases, LoT determinations may identify patients who have participated in clinical trials, such as trials testing FDA-approved therapeutic combinations. In other examples, LoT determinations may identify new trends in clinical practice that are not yet reflected in current standard of care guidelines. For example, a line of treatment in ovarian cancer in patients undergoing a LoT chemotherapy regime followed by LoT maintenance targeted therapy (such as targeted inhibitors such as PARP inhibitors or EGFR inhibitors).

別の半教師ありアプローチは、LoTのタイムラインに対するバケット化を強制し得る。たとえば、1980年には、2つの薬物を有する最初のLoTが標準であり得るが、1993年には、それらの2つの薬物は、LoTとして中止され、置き換えられる。半教師ありアプローチでは、公的記録からガイドラインの変更を取り込むか、または臨床試験に含まれることに基づき新しい治療がリリースされた年を識別し、LoTの発展が長年にわたって追跡されるように教師なしLoTキュレーションをLoT変更の年の間に来るよう境界を付け得る。一実施形態において、それらの境界は、スライディングウィンドウとして設定され、図7に関してより詳細に示されるようなEMと類似の最適化されたEMに基づき自動的に決定され得る。類似のバケット化は、医師、施設、州、地域、国、または患者のコホートに対する他の共通の特徴などによる地理的基準に基づき実行され得る。教師なし学習は、既存の患者記録から意味のあるLoTを引き出すために、時間または場所に基づき新しいウィンドウを識別しようと試みることの本質的に可変な性質に起因してこれらの分析に優れている。分析は、ウィンドウイングを使用して実行され、それにより、特定のLoTが最も効果的である地域、施設、または年を識別し得る。 Another semi-supervised approach can force bucketing on the LoT timeline. For example, in 1980 the original LoT with 2 drugs may be the norm, but in 1993 those 2 drugs will be discontinued and replaced as LoT. A semi-supervised approach would identify the year in which new treatments were released based on incorporating guideline changes from public records or inclusion in clinical trials, and unsupervised so that development of LoT would be tracked over the years. LoT curation could be bounded to come between years of LoT changes. In one embodiment, those bounds can be set as a sliding window and automatically determined based on an optimized EM similar to the EM as shown in more detail with respect to FIG. Similar bucketing can be performed based on geographic criteria such as by physician, institution, state, region, country, or other common characteristic for cohorts of patients. Unsupervised learning excels in these analyzes due to the inherently variable nature of attempting to identify new windows based on time or location in order to derive meaningful LoT from existing patient records. . Analysis may be performed using windowing to identify areas, facilities, or years where a particular LoT would be most effective.

いくつかの実施形態において、教師なしアプローチは、異なる癌およびその投薬に従ってシステムを微調整することを可能にする。たとえば、前立腺癌の治療は、たとえば、伝統的に短い間隔を有する肺癌を治療するために投与される静脈内投薬よりも長い間隔で服用される経口薬剤を含む。制限的な構造化モデルは、癌亜型およびラベルの微妙な差異は、訓練中にプログラマーによって列挙されるか、またはキュレーションされたデータのシステムから利用可能であるような薬剤のカテゴリのみに制限され得るので、ラベルを学習するのに困難が伴い得る。 In some embodiments, the unsupervised approach allows fine-tuning the system according to different cancers and their medications. For example, treatment of prostate cancer involves oral medications taken at longer intervals than, for example, intravenous medications traditionally administered to treat lung cancer, which has short intervals. Restrictive structured models limit cancer subtypes and label nuances to only those categories of drugs that are enumerated by the programmer during training or are available from a system of curated data. It can be difficult to learn labels.

図6は、キュレーションされた患者履歴から複雑なキュレーションされたフィールドをインピュートし、それらを非キュレーション患者または少量のデータを有する患者に適用する方法を実装するルールベースの前処理を伴う人工知能エンジンアプローチを使用して治療ライン(LoT)を準備し、訓練し、割り当てる一実施形態であるシステム600を示すフローチャートである。 Figure 6 shows an artificial field with rule-based preprocessing that implements a method to impute complex curated fields from curated patient histories and apply them to non-curated patients or patients with small amounts of data. 6 is a flowchart illustrating system 600, one embodiment of preparing, training, and assigning lines of treatment (LoT) using an intelligence engine approach.

患者の薬歴は、経過記録および電子医療記録(EHR)MR112などのデジタル文書の機械学習、および医療専門家アノテーションの組み合わせから導出されるキュレーションされた医療記録(MR)114の組み合わせを通じて臨床医療記録110として捕捉される。患者の医療記録の特徴は、構造化され、システム600内の複数のモジュールに送信され得る。システム600は、この冗長で反復的で、時には一貫性のない生の入力を取り込み、患者の癌を治療するために使用される最も顕著な薬剤を捕らえる一連の凝縮された記録に変換することに焦点を当てている。次のステップは、この変換を実行するための例示的な方法である。 A patient's medication history is analyzed in clinical practice through a combination of machine learning of digital documents such as progress notes and electronic health records (EHRs) MRs112, and curated medical records (MRs)114 derived from a combination of medical expert annotations. Captured as record 110. Characteristics of a patient's medical record may be structured and transmitted to multiple modules within system 600 . The system 600 takes this redundant, repetitive, and sometimes inconsistent raw input and transforms it into a series of condensed records that capture the most prominent drugs used to treat a patient's cancer. Focused. The following steps are an exemplary method for performing this conversion.

別の実施形態では、記録調和122は、薬剤フィルタリングモジュール605、薬剤組み合わせモジュール610、薬剤調和モジュール615を含み得る。薬剤フィルタリング605は、キュレーションされた記録114およびEHR112から臨床健康記録110の薬剤を、抗悪性腫瘍薬などの、薬物癌療法にフィルタリングすることを含み得る。フィルタは、また、治療ラインに関連する薬剤を識別するなどのために、他の薬剤特性に対して適用され得る。典型的には治療ラインの一部ではない薬剤をフィルタリングすることで、利用可能な膨大な数の患者記録を処理するのに必要な計算負荷を低減する。たとえば、電子医療記録(EHR)は、鎮痛剤、抗生物質、プラシーボ、マルチビタミンなど様々な、発注され、患者に投与されるすべての薬剤からなる。フィルタリング段階605は、抗悪性腫瘍薬(抗癌剤)として識別され内部値セットに記憶されていることのない任意の薬剤を除去する。この値セットは、臨床チームによって定義されるか、または機械学習モデルさらには内外の出版物、臨床試験、FDA承認、NCCNガイドライン、または医薬品レポートからキュレーションされてもよい。 In another embodiment, record reconciliation 122 may include drug filtering module 605 , drug combination module 610 , and drug reconciliation module 615 . Drug filtering 605 may include filtering clinical health record 110 drugs from curated records 114 and EHR 112 to drug cancer therapies, such as antineoplastic drugs. Filters may also be applied to other drug characteristics, such as to identify drugs associated with a line of therapy. Filtering drugs that are not typically part of a line of therapy reduces the computational load required to process the vast number of available patient records. For example, the Electronic Health Record (EHR) consists of all medications ordered and administered to a patient, varying from pain relievers, antibiotics, placebos, multivitamins, and so on. A filtering step 605 removes any drugs that have been identified as anti-neoplastic drugs (anti-cancer drugs) and not stored in the internal value set. This value set may be defined by the clinical team or curated from machine learning models as well as internal and external publications, clinical trials, FDA approvals, NCCN guidelines, or pharmaceutical reports.

薬剤組み合わせ610は、22日などの閾値日数(d)内の薬剤記録(MR)を組み合わせるものとしてよい。閾値は、薬剤、薬物クラス、活性成分によって設定されるか、または人工知能エンジンを介して患者記録から学習されてもよい。EHR MRは、薬剤の発注および投与毎に発生する反復性が非常に高い定期的記録である。多くの抗腫瘍療法は、22d(1サイクルと呼ばれる)毎に投与され、したがって22d内の記録を組み合わせることによって、患者が薬剤に投与されている持続時間全体を捕捉する著しい記録圧縮が達成され得る。手順的には、日付インピュテーションのための1つのプロセスが、各レコードに対して実行されるものとしてよく、これは以下を含む。
a) MRが年単位の開始日または終了日を有する場合、または開始日がない場合、調和615に進む。
b) MRが月のみの開始日または終了日を有する場合、その月の15日にインピュートする。
c) MRが欠落終了日を有する場合、終了日を開始日に設定する。
ネイティブの記録およびキュレーションされた記録について別々に(つまり、ネイティブの記録のすべての薬剤について次のステップをさらにはキュレーションされた記録のすべての薬剤についても実行する)、各薬剤について次を実行する。
i) 薬剤の各MRを開始日順に並べ替える。
ii) 薬剤の各MRについて:
(1) 記録の最後と後続の記録の最初とを比較する。MRが互いの22d以内である場合、記録を組み合わせる。これは、記録の終わりを後続の記録の終わりに設定し、その薬剤に対する介在するMRを削除することによって達成され得る。
(2) 次のレコードに進む。
A medication combination 610 may combine medication records (MRs) within a threshold number of days (d), such as 22 days. Thresholds may be set by drug, drug class, active ingredient, or learned from patient records via an artificial intelligence engine. EHR MRs are highly repetitive periodic records that occur for each drug order and administration. Many antineoplastic therapies are administered every 22d (referred to as one cycle), so by combining recordings within the 22d, significant recording compression can be achieved that captures the entire duration the patient is on drug. . Procedurally, one process for date imputation may be run for each record, which includes:
a) If MR has an annual start or end date, or no start date, go to reconciliation 615.
b) If MR has a month-only start or end date, impute on the 15th of that month.
c) If the MR has a missing end date, set the end date to the start date.
Separately for native and curated recordings (i.e. perform the following steps for all drugs in native recordings and also for all drugs in curated recordings), for each drug: do.
i) Sort each MR for a drug by start date.
ii) For each MR of the drug:
(1) Compare the end of a record with the beginning of a subsequent record. Combine records if the MRs are within 22d of each other. This can be accomplished by setting the end of the record to the end of the subsequent record and deleting the intervening MR for that drug.
(2) advance to the next record;

調和615は、冗長な、時には矛盾する、情報を識別し、是正するものとしてよい。「調和」は、機械学習アルゴリズム、内外の出版物および医療専門家から学習したヒューリスティックのセットを指し、これらの冗長性または矛盾を取り除き、EHR MR112の高い時間分解能とキュレーションされたMR114の専門家知識とを組み合わせたMRの一貫性のあるセットを確立する。手順的には、調和の一実施形態は、以下のことを伴い得る。
a) 何らかのキュレーションされたEMRの時間分解能の低さを是正し、調和に必要に応じて1日、1週間、または1カ月以内に正確になるようにMRの分解能を満たすように次のインピュテーションルールを課す。以下のアプローチは、これらの記録の最大の持続時間を想定し、場合によってはより高い分解能を有するEHR MRがこれらの日付を明確にすることを可能にする。
i) 月のみの開始の場合、日をその月の1日に設定する。年のみの場合、月を1月に設定し、日を1日に設定する。
ii) 月のみの終了の場合、その日を15日に設定する。年のみの場合は、月を12月に設定し、日を31日に設定する。
b) すべての記録がネイティブであるか、またはキュレーションされており、調和の必要がない場合、間隔生成124に進む。
c) 組み合わされた記録を開始日で並べ替える。
d) 患者記録内の各薬剤タイプについて:
i) 空の「出力リスト」を作成する。(リストの最後のエントリはoutput[-1]として参照される)
ii) この薬剤タイプの各記録について:
(1) これが最初のエントリである場合、出力に追加する。
(2) 現在の記録がoutput[-1]より後に発生した場合、記録を出力に付加する。続く。
(3) 記録がoutput[-1]よりも高い分解能の開始日または終了日を有する場合(月または年の分解能など、および記録は日の分解能を有する)、低い分解能の日付を高い分解能の日付に置き換える。
(4) 記録がoutput[-1]の時間枠内に出現する場合(数カ月間のキュレーションされた記録内に出現する1日の記録など)、この異質な記録を出力リストから除外する。
e) 出力リストを、分類され構造化された各MRの薬剤を有する調和された薬剤テーブル620として返す。
Reconciliation 615 may identify and correct redundant and sometimes conflicting information. “Harmony” refers to a set of machine learning algorithms, heuristics learned from internal and external publications and medical experts, removing these redundancies or inconsistencies, and combining the high temporal resolution of EHR MR112 with the curated MR114 expert Establish a consistent set of MRs that combine knowledge and Procedurally, one embodiment of reconciliation may involve the following.
a) Correct the poor temporal resolution of any curated EMR and adjust the next inset to meet the resolution of the MR to be accurate within 1 day, 1 week, or 1 month as needed for harmonization. impose a putation rule. The following approach assumes the maximum duration of these records, possibly allowing EHR MRs with higher resolution to clarify these dates.
i) For month-only starts, set the day to the 1st of the month. For year only, set month to January and day to 1.
ii) For month only ends, set the day to the 15th. For year only, set month to December and day to 31st.
b) If all records are native or curated and there is no need for harmonization, proceed to interval generation 124;
c) Sort the combined records by start date.
d) For each drug type in the patient record:
i) Create an empty "output list". (The last entry in the list is referenced as output[-1])
ii) For each record of this drug type:
(1) If this is the first entry, add it to the output.
(2) Append the record to the output if the current record occurs after output[-1]. Continue.
(3) If the record has a start or end date with higher resolution than output[-1] (such as month or year resolution, and the record has day resolution), replace the low resolution date with the high resolution date. replace with
(4) If the record appears within the output[-1] timeframe (such as a one-day record that appears within months of curated records), exclude this extraneous record from the output list.
e) Return the output list as a harmonized drug table 620 with each MR's drug classified and structured.

別の実施形態において、間隔生成124は、原発性癌(PC)関連性フィルタ625、日付パディング630、PCキュレーションモデル635を使用するMRの組み合わせ、および間隔生成640に対するモジュールを含み得る。治療ラインは、1つまたは複数の薬剤の投与(これに限らないが「レジメン」など)を記述する連続的医療ケアの期間によって最もよく説明される。ここで、連続的ケアのこれらの期間は、「間隔」、または「治療間隔」と称される。「間隔生成」は、調和されたMRをこれらの治療/投薬間隔(MI)に変換するプロセスである。これらは、患者が薬剤の1つのセットを服用している持続時間を単に表し、患者の原発性癌型に関連する抗悪性腫瘍薬の変更、追加、または差し引きが生じたときに新しいMIが開始する。 In another embodiment, interval generation 124 may include modules for primary cancer (PC) relevance filter 625 , date padding 630 , MR combination using PC curation model 635 , and interval generation 640 . A line of therapy is best described by a period of continuous medical care that describes the administration (such as, but not limited to, a "regimen") of one or more drugs. Here, these periods of continuous care are referred to as "intervals" or "treatment intervals." "Interval generation" is the process of converting harmonized MRs into these treatment/medication intervals (MI). They simply represent the duration that the patient has been on one set of drugs, and a new MI is initiated when there is a change, addition, or subtraction of antineoplastic drugs related to the patient's primary cancer type. do.

PC関連性フィルタ625は、さらに患者の原発性癌(PC)、診断、または治療ラインにバイアスをかけるための他の識別子に関連する薬剤によって調和された薬剤テーブルをフィルタリングし得る。このリストは、機械学習モデル、内外の出版物、および医療専門家によって定義される。これは、いくつかの癌(前立腺癌など)では支持療法であるが、他の癌(骨肉腫など)には顕著であると考えられるデノスマブなどの薬剤を取り除く。PCフィルタリングの一実施形態は、以下のことを伴い得る。
a) PC関連性フィルタを使用して患者MRをフィルタリングする。
b) 残りのMR内の有意な不確実性のある患者をフィルタリングする。これは以下を含む。
i) 年のみの投薬記録。
ii) 実際の薬剤名ではなく、キュレーションされた進行メモから存在する曖昧なまたは一般的な薬剤名(「白金化合物」または「抗悪性腫瘍薬」など)。
A PC relevance filter 625 may further filter the reconciled drug table by drugs associated with the patient's primary cancer (PC), diagnosis, or other identifiers to bias the line of treatment. The list is defined by machine learning models, internal and external publications, and medical experts. This removes drugs such as denosumab, which are considered supportive in some cancers (such as prostate cancer) but prominent in others (such as osteosarcoma). One embodiment of PC filtering may involve the following.
a) Filter patient MRs using the PC relevance filter.
b) Filter patients with significant uncertainty within the remaining MR. This includes:
i) year-only medication records;
ii) Ambiguous or generic drug names that exist from curated progress notes (such as “platinum compounds” or “antineoplastic agents”) rather than actual drug names.

日付パディング630は、日付を識別し、パディングし得る。多数のMRが、開始日、または開始日に相当する終了日のみからなる。投薬間隔を構築するために、最小限の持続時間が必要であり、したがってこれらの記録は、間隔区別閾値(DATE_PAD、典型的には21d、DATE_PADは、使用者の閾値選択に基づき使用者によって設定され得るチューニング可能なハイパーパラメータ)を使用して終了日を与えられる。一実施形態は、以下のことを伴い得る。
A) 記録が終了日を有しないか、または終了日==開始日の場合、終了日=開始日+DATE_PADを設定する。
Date padding 630 may identify and pad the date. A number of MRs consist only of a start date or an end date corresponding to a start date. A minimum duration is required to construct a dosing interval, so these records are set by an interval discrimination threshold (DATE_PAD, typically 21d, where DATE_PAD is set by the user based on the user's threshold selection). given the end date using a tunable hyperparameter that can be One embodiment may involve the following.
A) If the record has no end date or end date == start date, set end date = start date + DATE_PAD.

PCキュレーションモデル635を使用するMR組み合わせは、薬剤特異的ロールアップを実行するものとしてよい。多数の抗悪性腫瘍薬がおおよそ21d毎に投与される一方で、いくつかのホルモン治療薬は毎月またはそれ以下の頻度で投与される。これを考慮するために、薬剤特異的ロールアップ(典型的には22d~180d)が、各薬剤について機械学習および医療専門家の知識との組み合わせから学習され得る。このプロセスは、PCキュレーションモデルのセクションに関してより詳細に後述される。一実施形態は、以下のことを伴い得る。
a) 学習された薬剤特異的ロールアップは、各薬剤記録に適用される。各薬剤および各記録について:
i) 前の記録の終わりと後の記録の始まりがこのロールアップ内にある場合、その記録を組み合わせ、2つの記録を縫い合わせる。
MR combinations using the PC curated model 635 may perform drug-specific rollups. While many antineoplastic agents are administered approximately every 21 d, some hormone therapy agents are administered monthly or less frequently. To account for this, drug-specific rollups (typically 22d-180d) can be learned from a combination of machine learning and medical expert knowledge for each drug. This process is described in more detail below with respect to the PC Curation Model section. One embodiment may involve the following.
a) A learned drug-specific rollup is applied to each drug record. For each drug and each record:
i) If the end of the previous record and the start of the next record are within this rollup, combine the records and stitch the two records together.

間隔生成640は、MRから投薬間隔への変換を含んでもよい。患者の薬歴は、典型的には、時間的に重なり合う複数の抗悪性腫瘍薬MRからなる。この変換処理で、1つまたは複数の薬剤の均質な治療の定義済み間隔が生成され、抗悪性腫瘍薬が患者の投薬記録から追加されるか、または差し引かれたときに必ず、新しい投薬間隔が開始される。一実施形態は、以下のことを伴い得る。
a) 結果的に得られた投薬記録を開始日で並べ替え、各記録について以下を実行する。
i) 次のうちの1つに該当する場合、新しい間隔を作成する。
(1) 最初の投薬記録、
(2) 投薬記録が最後の間隔の終了後に開始する、または
(3) 投薬記録が最後の間隔終了の終わりの間隔区別閾値(たとえば、22日)以内に開始し、記録の開始または前の間隔の終了のいずれかが月単位の分解能である。
ii) 投薬記録が最後の間隔と重なる場合、この投薬記録をその間隔に追加する。
iii) 複数の重なる記録があることにより、少なくとも間隔区別閾値の間隔が構築できない場合、その患者に対してLoTは決定され得ず、失敗状態を返す。
iv) そうでない場合、投薬記録は複数の他の間隔にまたがって出現し、したがってこの薬剤を重なり合う任意の記録に追加する。最後の間隔の終了後も記録が続いている場合、記録の残り部分に対して新しい間隔を作成する。
b) 投薬間隔645を出力し、治療間隔を含むすべての記録、開始および終了、および関連付けられている薬剤を記述する。
Interval generation 640 may include conversion from MR to dosing interval. A patient's medical history typically consists of multiple antineoplastic MRs that overlap in time. This conversion process produces a defined interval of homogeneous treatment for one or more drugs and creates a new dosing interval whenever an antineoplastic agent is added or subtracted from a patient's medication record. be started. One embodiment may involve the following.
a) Sort the resulting medication records by start date and for each record do the following:
i) Create a new interval if one of the following applies:
(1) first medication record;
(2) the medication record begins after the end of the last interval, or
(3) The medication record starts within the interval discrimination threshold (eg, 22 days) of the end of the last interval end, and either the start of the record or the end of the previous interval has monthly resolution.
ii) If a medication record overlaps the last interval, add this medication record to that interval.
iii) If an interval of at least the interval discrimination threshold cannot be constructed due to multiple overlapping records, then LoT cannot be determined for that patient and returns a failure status.
iv) Otherwise, the medication record will span multiple other intervals, thus adding this medication to any overlapping records. If recording continues after the end of the last interval, create a new interval for the remainder of the recording.
b) Output Medication Intervals 645, describing all records containing treatment intervals, start and end, and associated medications.

当業者であれば、上記のステップは、本開示が働き得る実施形態を表していることを理解するであろう。本明細書の開示と一致する他のシステムおよび方法も利用可能である。 Those skilled in the art will appreciate that the above steps represent embodiments in which the present disclosure may work. Other systems and methods consistent with the disclosure herein are also available.

治療ライン(LoT)割り当て126は、転帰650、モデル化されたLoT頻度655、推定確率660、LoTラベル付け665、または後処理LoT670で間隔を精緻化する1つまたは複数のモジュールを備え得る。患者の治療ラインは、その人の癌を管理するために癌専門医によって採用される治療戦略を捕らえるものである。各ラインは、1つまたは複数の計画された抗悪性腫瘍薬であり、患者に間隔優先事象(たとえば、患者の予後悪化または転移事象を示す画像結果)が発生したときに、薬剤の新しいセットまたは新しい「治療ライン」が提案される。反応データが不完全なせいで(多くの場合に、単独で経過報告内に存在する)、これらの予定外の事象は、患者MRではしばしば見あたらない。主なゴールは、一般的な治療パターンを学習し、反応データが乏しい場合にこれらを適用して、計算によって導出されたLoTの割り当てを生成することである。ここで、LoT割り当て126から生成された間隔は、存在するときに、患者の臨床健康記録110からの反応データでアノテーションされ、精緻化された間隔リストを生成する。整数の結合(COI)アプローチを使用して、これらの間隔セットの最も可能性の高い組み合わせが決定され、その患者の増分的に数値化されたLoTが考慮される。いくつかの実施形態において、1つまたは複数のLoTがアノテーションされ得る。いくつかの実施形態において、1つまたは複数のLoTはアノテーションされ得ない。いくつかの実施形態において、治療は、アノテーションされ得る。いくつかの実施形態において、治療は、アノテーションされ得ない。 Line of treatment (LoT) assignment 126 may comprise one or more modules for refining intervals with outcomes 650, modeled LoT frequencies 655, estimated probabilities 660, LoT labeling 665, or post-processing LoT 670. A patient's line of treatment captures the therapeutic strategies employed by an oncologist to manage that person's cancer. Each line is one or more of the planned antineoplastic agents, and a new set of agents or A new "line of treatment" is proposed. Due to incomplete response data (often present in follow-up reports alone), these unplanned events are often missed in patient MR. The main goal is to learn common treatment patterns and apply these when response data are scarce to generate computationally derived LoT assignments. Here, the intervals generated from the LoT assignments 126 are annotated with response data from the patient's clinical health record 110, when present, to produce a refined interval list. Using a combination of integers (COI) approach, the most probable combination of these interval sets is determined, taking into account the patient's incrementally quantified LoT. In some embodiments, one or more LoTs may be annotated. In some embodiments, one or more LoTs may not be annotated. In some embodiments, treatments can be annotated. In some embodiments, treatments may not be annotated.

転帰で間隔を精緻化すること650は、LoTの変化の絶対的な指標である、転帰などの、いくつかの「治療間隔優先事象」または患者事象を識別し得る。これらは投薬間隔に追加され、間隔の1つまたは複数の分割されたセットからなる精緻化された間隔リストを生成する。完了のためのそのような1つのプロセスは、以下を含み得る。
a) すべての患者転帰を収集し、LoTに関連する転帰および介入にフィルタリングする。これらは、去勢抵抗性前立腺癌(CRPC)診断などの、癌型固有のものであるか、または一般的に転移診断もしくは進行性疾患転帰のようなものであり得る。一般的に除去される転帰は、完全および部分反応(LoTが成功し、継続されるべきであることを示す)を含む。
b) 各転帰および患者間隔を繰り返し、新しい間隔の開始の間隔区別閾値内に転帰が出現する場合、この患者間隔リストを間隔の2つの別々のセットに分離する。転帰が2つの間隔の閾値内にある場合、時間的に近い方の間隔で分離し、後者を選択する。
c) 患者精緻化間隔リストを繰り返し、治療ライン最大持続時間閾値(たとえば、180日)分離が出現した場合に、追加のセットに分ける。
Interval refinement 650 by outcome may identify some “treatment interval priority events” or patient events, such as outcomes, that are absolute indicators of change in LoT. These are added to the dosing intervals to generate a refined interval list consisting of one or more partitioned sets of intervals. One such process for completion may include the following.
a) Collect all patient outcomes and filter to LoT relevant outcomes and interventions. These may be cancer-type specific, such as castration-resistant prostate cancer (CRPC) diagnosis, or generally metastatic diagnosis or progressive disease outcome. Commonly excluded outcomes include complete and partial responses (indicating that the LoT was successful and should be continued).
b) Repeat each outcome and patient interval and separate this patient interval list into two separate sets of intervals if the outcome occurs within the interval discrimination threshold of the start of a new interval. If the outcome is within the threshold of two intervals, separate by the interval closer in time and choose the latter.
c) Repeat the patient refinement interval list, splitting into additional sets if treatment line maximum duration threshold (eg, 180 days) separation occurs.

モデル化されたLoT頻度655は、各治療間隔に対して整数分割の結合を列挙するか、または潜在的な治療ラインに分割する薬剤のすべての順次的な順列を生成するものとしてよい。一例において、これは、患者記録に関して訓練された人工知能エンジンを含んでもよい。 The modeled LoT frequencies 655 may enumerate a combination of integer divisions for each treatment interval or generate all sequential permutations of drugs that divide into potential treatment lines. In one example, this may include an artificial intelligence engine trained on patient records.

推定確率660は、潜在的LoT、および各LoTに対するそれぞれの尤度を生成するための治療間隔の集まりを受け取るものとしてよい。いくつかの実施形態において、655および660は、人工知能エンジンが、転帰データに基づき精緻化済み間隔を受け取り、間隔から潜在的LoTを分離し、さらには各潜在的LoTがLoTである尤度を測定する確率を生成するように単一の段階に組み合わされ得る。一例において、プロセスは以下を含んでもよい。
a) 精緻化された間隔リストを、転帰を与えられたセットに分離した後、各セットについて繰り返し、以下を実行する(LoTカウンター=1を設定する)。
i) 整数の結合アプローチ、または患者データからLoTを識別するように訓練された教師なし人工知能エンジンを使用して、間隔のすべての可能な結合(潜在的LoT)を計算する。
ii) モデルの訓練中に学習された頻度を使用してこれらの間隔結合の各々の確率を計算する。所与の間隔組み合わせの全確率は、個別の組み合わされた間隔の積である(2間隔の場合、これはProb(間隔1)*Prob(間隔2)およびProb(間隔1の後に間隔2)である)。
iii) 最も高い確率を有する間隔の組み合わせをLoT割り当てと考える。(Prob(間隔1)*Prob(間隔2)>Prob(間隔1の後に間隔2)の場合、間隔1は第1のLoTとなり、間隔2は第2のLoTとなる。)
Estimated probability 660 may take a collection of potential LoTs and treatment intervals to generate respective likelihoods for each LoT. In some embodiments, 655 and 660 indicate that the artificial intelligence engine receives refined intervals based on outcome data, separates potential LoTs from the intervals, and determines the likelihood that each potential LoT is a LoT. It can be combined into a single step to produce probabilities to measure. In one example, the process may include the following.
a) After separating the refined interval list into sets given the outcome, repeat for each set and do the following (set LoT counter=1).
i) Compute all possible combinations of intervals (potential LoT) using an integer combination approach or an unsupervised artificial intelligence engine trained to identify LoT from patient data.
ii) Compute the probability of each of these interval connections using the frequencies learned during model training. The total probability of a given interval combination is the product of the individual combined intervals (for 2 intervals this is Prob(interval 1)*Prob(interval 2) and Prob(interval 1 followed by interval 2) be).
iii) Consider the combination of intervals with the highest probability as the LoT assignment. (If Prob(interval 1)*Prob(interval 2) > Prob(interval 1 followed by interval 2) then interval 1 is the first LoT and interval 2 is the second LoT.)

LoTラベル付け665は、投薬間隔のセットの最も可能性の高い結合(各連続する時間期間について最高の尤度を有する潜在的LoT)を識別し、これは患者のLoTと考えられ得る。一例において、プロセスは以下を含んでもよい。
i) これらの間隔組み合わせの各々に、LoTカウンターを用いて番号を振り、毎回増分する。(2間隔の場合に、LoT1が割り当てられた間隔が先行していた場合、間隔1はLoT2を割り当てられ、間隔2はLoT3を割り当てられる)。
LoT labeling 665 identifies the most probable combination of the set of dosing intervals (the potential LoT with the highest likelihood for each successive time period), which can be considered the patient's LoT. In one example, the process may include the following.
i) Number each of these interval combinations using the LoT counter and increment each time. (In the case of two intervals, interval 1 is assigned LoT2 and interval 2 is assigned LoT3 if it was preceded by an interval assigned LoT1).

後処理LoT670は、是正されるかまたは修正され得るLoTを識別することを含んでもよい。たとえば、まれな場合では、連続する組み合わされた間隔は、薬剤の同じセットを有し得るが、薬剤または間隔に対する組み合わせ閾値を超える時間期間によって分離されていたが、いかなる治療間隔優先事象を有さず、したがって同じLoTであると考えられ得る。後処理で是正されるかまたは調整され得るパターンに入る任意のLoTは、同じLoTに割り当てられてよく、続くLoTは増分的に調整され得る。一例において、これは以下を含んでもよい。
a) すべての最も可能性の高い間隔結合を最終的LoTリストに組み合わせる。
b) 間隔結合の各々を繰り返し、以下を実行する。
i) 2つの連続するLoTが同じ薬剤を有する場合、それらに同じLoTを割り当てる(例:[ドキソルビシン、シクロホスファミドおよびドキソルビシン]|[シクロホスファミドおよびドキソルビシン、シクロホスファミドおよびドキソルビシンおよびパクリタキセル、アナストロゾール]は最終出力リスト[ドキソルビシン、シクロホスファミドおよびドキソルビシン、シクロホスファミドおよびドキソルビシン、シクロホスファミドおよびドキソルビシンおよびパクリタキセル、アナストロゾール]を生成し、これは[ドキソルビシン、シクロホスファミドおよびドキソルビシン、シクロホスファミドおよびドキソルビシンおよびパクリタキセル、アナストロゾール]に変換され、ここで、「|」バーは転帰を示し、「、」読点は新しいLoTを示し、「および」でグループ化された薬剤が組み合わせになっている)。
Post-processing LoT 670 may include identifying LoTs that can be remedied or modified. For example, in rare cases, consecutive combined intervals may have the same set of drugs, but were separated by a period of time exceeding the combination threshold for the drug or interval, but had no treatment interval precedence event. not, and therefore can be considered to be the same LoT. Any LoT that falls into a pattern that can be corrected or adjusted in post-processing may be assigned to the same LoT, and subsequent LoTs may be adjusted incrementally. In one example, this may include:
a) Combine all most probable interval joins into a final LoT list.
b) Iterate through each of the interval joins and do the following:
i) If two consecutive LoTs have the same drug, assign them the same LoT (e.g. [doxorubicin, cyclophosphamide and doxorubicin]|[cyclophosphamide and doxorubicin, cyclophosphamide and doxorubicin and paclitaxel) , anastrozole] produces the final output list [doxorubicin, cyclophosphamide and doxorubicin, cyclophosphamide and doxorubicin, cyclophosphamide and doxorubicin and paclitaxel, anastrozole], which produces the final output list [doxorubicin, cyclophosphamide famid and doxorubicin, cyclophosphamide and doxorubicin and paclitaxel, anastrozole], where '|' bars indicate outcomes, ',' commas indicate new LoTs, grouped by 'and' drugs in combination).

いくつかの実施形態において、LoTストア150に記憶されているLoTテーブルなどの出力LoTテーブルは、jsonファイル、xmlファイル、または他の形式などの構造化形式であってよく、次の構造化されたデータフィールドのサブセットを有し得る。
● patient_id:テーブル間で一意のpatient_id。
● interval_start:投薬間隔の開始。
● interval_end:投薬間隔の終了。
● medication:関連する薬剤(1行に最大1つ)。
● lot:割り当てられたLoT。(1~n、整数)。
● complete_lot_start:1つまたは複数の間隔にまたがる、包括的なLoTの開始。
● complete_lot_end:1つまたは複数の間隔にまたがる、包括的なLoTの終了。
● complete_lot_medications:所与のLoTにおける関連付けられている薬剤を「+」記号で連結してリストする。
● emr_derived:LoT全体がEHRにのみ存在する投薬記録に由来する場合は1、そうでない場合は0。
● success:LoTが患者について正常に定義できたかどうか。これは、患者がLoTに対して必要な年のみの薬剤を有しているか、または結果として治療間隔をもたらす投薬記録を有する場合に不成功である。
In some embodiments, an output LoT table, such as a LoT table stored in LoT store 150, may be in a structured format, such as a json file, xml file, or other format, and is structured as follows: It can have a subset of data fields.
● patient_id: A unique patient_id across tables.
● interval_start: start of dosing interval.
● interval_end: End of dosing interval.
● medication: Relevant medication (maximum one per line).
● lot: LoT allocated. (1-n, integer).
● complete_lot_start: Start of a comprehensive LoT, spanning one or more intervals.
● complete_lot_end: Comprehensive LoT end, spanning one or more intervals.
- complete_lot_medications: Lists the associated medications in a given LoT, concatenated with a '+' sign.
● emr_derived: 1 if the entire LoT is derived from a medication record that exists only in the EHR, 0 otherwise.
● success: Whether the LoT was successfully defined for the patient. This is unsuccessful when patients have only the required years of medication for LoT or have medication records resulting in treatment intervals.

生成された後、LoTテーブルは、LoTストア150に記憶されるか、または分析モデルでその後使用するために患者のEHRの構造化データと組み合わされてもよい。 Once generated, the LoT table may be stored in the LoT store 150 or combined with structured data of the patient's EHR for subsequent use in analytical models.

原発性癌(PC)キュレーションモデルアルゴリズム
上で説明されているように、異なる薬剤は、原発性癌型により異なり得る異なるサイクルを有する。次のステップは、キュレーションされたMRに存在する医学的知識を活用することによって注目している特定の薬剤に対する原発性癌型のこのサイクル時間を推定するために使用され得る。キュレーションされたMRによって記述されているような薬剤投与の典型的な持続時間を捕捉し、これを使用して、EHR MRに適用されたときにこの典型的な持続時間を繰り返すその薬剤のサイクルタイムを提案することによるものである。これは、非常に反復的なEHR投与記録を、アブストラクターがキュレーションし得るキュレーションされたMR持続時間の「外観」に変換する効果がある。一般性を損なうことなく、このプロセスは、以下、単一の原発性癌型に対する単一の薬剤について説明されているが、本開示を損なうことなく、複数の癌型および複数の薬剤に拡張され得る。
1. 入力:所与の原発性癌型に対する所与の薬剤についてのキュレーションされたMRおよびEHR MR。
2. 次の特性を有するキュレーションされたMRをフィルタリングする:
a. 開始日とは異なる終了日
b. 少なくとも月単位の分解能による開始日および終了日。
3. MR終了日~MR開始日と定義される、これらのキュレーションされたMRにまたがる薬剤投与の持続時間を計算する。
4. キュレーションされたMRにまたがる薬剤投与の持続時間中央値を計算する。
5. 最小間隔閾値(典型的には22d)から始めて、次を実行する。
a. 各患者についてこの閾値内のEHR記録を組み合わせ、(場合によっては)1つまたは複数の記録によって記述されている薬剤投与の持続時間を生成する。
b. これらの記録の各々について薬剤投与の持続時間(終了~開始)を計算する。
c. これらの記録すべてにまたがって持続時間中央値を計算する。
d. この中央値が(4で計算した)キュレーションされたMR中央値と等しい場合、この間隔閾値を「サイクル時間」として返すが、そうでない場合は、間隔閾値を増分する。
e. 増分閾値が最大間隔閾値(典型的には180dに設定される)より大きい場合、ループから出る。
Primary Cancer (PC) Curation Model Algorithm As explained above, different agents have different cycles that may vary depending on the primary cancer type. The next step can be used to estimate this cycle time of primary cancer types to specific drugs of interest by leveraging the medical knowledge that exists in curated MR. Capture the typical duration of drug administration as described by the curated MR and use this to cycle that drug to repeat this typical duration when applied to the EHR MR It is by suggesting time. This has the effect of converting a highly repetitive EHR dosing record into a curated MR duration 'look' that an abstractor can curate. Without loss of generality, this process is described below for a single agent against a single primary cancer type, but is extended to multiple cancer types and multiple agents without detracting from the present disclosure. obtain.
1. Input: curated MRs and EHR MRs for a given drug against a given primary cancer type.
2. Filter curated MRs with the following characteristics:
a. an end date that is different from the start date;
b. Start and end dates with at least monthly resolution.
3. Calculate the duration of drug administration across these curated MRs, defined as MR end date to MR start date.
4. Calculate the median duration of drug administration across the curated MRs.
5. Starting with the minimum interval threshold (typically 22d), do: a.
a. Combine the EHR records within this threshold for each patient to generate the duration of drug administration described by (optionally) one or more records.
b. Calculate the duration of drug administration (end to start) for each of these records.
c. Compute the median duration across all of these recordings.
d. If this median is equal to the curated MR median (calculated in 4), then return this interval threshold as the "cycle time"; otherwise, increment the interval threshold.
e. If the increment threshold is greater than the maximum interval threshold (typically set to 180d), exit the loop.

上記のアプローチは、中央値ではなく、キュレーションされた持続時間分布のカーネル密度近似を計算し、2つの分布の距離メトリック(ユークリッド距離、幾何学的距離、またはカルバックライブラーダイバージェンス)を最小化する閾値を返すものとして一般化され得る。 The above approach computes the kernel density approximation of the curated duration distribution, rather than the median, and minimizes the distance metric (Euclidean distance, geometric distance, or Kullback-Leibler divergence) between the two distributions. It can be generalized as returning a threshold.

図7は、3つの段階710、720、および730にわたる治療ライン(LoT)モデルを準備し、訓練し、生成する一実施形態を示すフローチャートである。 FIG. 7 is a flowchart illustrating one embodiment of preparing, training, and generating a line of care (LoT) model over three stages 710, 720, and 730. FIG.

モデルデータ準備段階710では、診断、予後、治療、および転帰に関連する患者情報のソースが、キュレーションされた、EMR/EHR記録を含む臨床健康記録110においてソースをまたがって集約される。これらの記録からの分析により、癌特異的臨床的洞察705、患者投薬714、およびキュレーションされた進行および治療逸脱712が生成される。たとえば、患者が前立腺癌と診断された場合、前立腺癌臨床洞察(前立腺癌の治療に直接リンクする薬剤、治療、または療法の種類、特定の薬剤、治療、または療法の前立腺癌に対する効果、前立腺癌におけるLoTに関連するコードにリンクする薬剤、治療、または療法名のリスト、去勢抵抗性前立腺癌(CRPC)診断への進行などの各癌型に対するLoTブレークを確立し得る進行事象など)は、要素705および712において、1つもしくは複数のデータベースまたは出版物などの内外のソースから取り出され得る。次いで、経過記録、検査結果、または他の手書き文書などの文書からキュレーションされた薬剤は、治療に対して効果を有する薬剤などのさらなる処理のための診断済み癌に関連する薬剤のみを含むようにフィルタリングされ得る。たとえば、頭痛のためのアンフェタミン、アレルギーのための抗ヒスタミン、うつ病のためのセラトニン受容体阻害剤、または診断された癌の治療以外の目的で患者が服用している薬剤などの無関係な薬剤は、LoT予測からフィルタリングされ得る。モジュール716での癌型によるLoTに関連する薬剤へのフィルタリングは、モデル化された日付および間隔718が各患者に対する診断に関連する治療からのみ計算されるように癌診断からうつ病薬をフィルタリングするように実行され得る。モデル化された日付および間隔718は、対応する開始日および終了日を含むものとしてよく、これはフィルタリングされたLoT薬剤リストに残っている薬剤の各々に関して生成されてよく、初期タイムライン間隔が生成されてよい。モデル化された日付および間隔718の集まりは、たとえば、すべての癌、器官特異的癌(乳房、肺、骨、血液、肝臓、前立腺など)、またはさらには非小細胞肺癌、非浸潤性乳管癌(DCIS)、浸潤性腺管癌(IDC)、トリプルネガティブ乳癌、または他の診断などの特定の診断の関連診断を有するデータセット内のすべての患者についてキュレーションされ
る。
In the model data preparation phase 710, sources of patient information related to diagnosis, prognosis, treatment, and outcome are aggregated across sources in curated clinical health records 110, including EMR/EHR records. Analysis from these records produces cancer-specific clinical insights 705, patient medications 714, and curated progression and treatment deviations 712. For example, if a patient is diagnosed with prostate cancer, prostate cancer clinical insights (types of drugs, treatments, or therapies that are directly linked to treating prostate cancer, effects of specific drugs, treatments, or therapies on prostate cancer, prostate cancer list of drugs, treatments, or therapy names that link to codes associated with the LoT in the element At 705 and 712, it may be retrieved from internal or external sources such as one or more databases or publications. Drugs curated from documents such as follow-up notes, lab results, or other handwritten documents are then to include only drugs associated with diagnosed cancers for further processing, such as drugs that have an effect on treatment. can be filtered to For example, unrelated drugs such as amphetamines for headaches, antihistamines for allergies, serotonin receptor blockers for depression, or drugs the patient is taking for purposes other than treating the diagnosed cancer , can be filtered from the LoT prediction. Filtering to LoT-related drugs by cancer type in module 716 filters depression drugs from cancer diagnoses such that modeled dates and intervals 718 are calculated only from diagnosis-related treatments for each patient. can be run as Modeled dates and intervals 718 may include corresponding start and end dates, which may be generated for each of the drugs remaining in the filtered LoT drug list, such that initial timeline intervals are generated. may be A collection of modeled dates and intervals 718, for example, all cancers, organ-specific cancers (breast, lung, bone, blood, liver, prostate, etc.), or even non-small cell lung cancer, ductal non-invasive Curated for all patients in the dataset with an associated diagnosis of a specific diagnosis such as cancer (DCIS), invasive ductal carcinoma (IDC), triple-negative breast cancer, or other diagnosis.

訓練段階720では、追加の癌特異的臨床的洞察が要素705で取り出され、段階710から要素718で計算された投薬間隔は、薬剤測定間隔頻度(w)722で受信される。追加の癌特有臨床的洞察は、自動LoTブレークを構成する日数(たとえば、急速進行する癌についてはこれは90日とすることが可能であり、より遅いペースで進行する癌についてはこれは180日とすることが可能であり、さらには前立腺癌に対するCRPC診断などの各癌型に対するLoTブレークを確立し得る進行事象)を含み得る。要素722において、治療/投薬間隔は、発生頻度を識別するためにすべての患者データにわたって比較され得る。たとえば、前立腺癌を有する患者では、治療/投薬間隔は、また、日数(w)に対応する幅を有するローリングウィンドウに従って精緻化され得る。このプロセスは、患者集団におけるLoTの最も代表的なセットを識別するために1つまたは複数のウィンドウサイズ(w=30日、90日、120日など)にわたって実行され得る。患者集団において識別された各投薬間隔について、期待値最大化(EM)が、間隔の信頼性を識別するために計算され得る。これらの間隔は、頻度のEMをループした後、LoT分割割り当て724において割り当てられ得る。最適なウィンドウサイズが決定された後、投薬頻度は、投薬頻度精緻化726で精緻化され得る。精緻化は、指定されたウィンドウサイズ(w)での収束が達成されるまで、頻度のEMをもう一回ループすることを含み得る。最も高い期待値を有する治療間隔のセットは、LoT(潜在的LoT)の最良の代表的セットとして選択され得る。すべての患者がLoTの基本セットを識別するように処理された後、段階130は、モデル化されたLoT頻度655から推定されたLoT頻度を出力し得る。 In a training phase 720 , additional cancer-specific clinical insights are retrieved in element 705 and the dosing intervals calculated in steps 710 to 718 are received in drug measurement interval frequency (w) 722 . An additional cancer-specific clinical insight is the number of days that constitute an automatic LoT break (e.g. for rapidly progressing cancers this could be 90 days and for slower paced cancers this could be 180 days). and even progression events that can establish a LoT break for each cancer type, such as CRPC diagnosis for prostate cancer). At element 722, treatment/dosage intervals can be compared across all patient data to identify frequencies of occurrence. For example, in patients with prostate cancer, the treatment/dosage interval can also be refined according to a rolling window with width corresponding to days (w). This process can be run over one or more window sizes (w=30 days, 90 days, 120 days, etc.) to identify the most representative set of LoTs in the patient population. For each dosing interval identified in the patient population, an expectation maximization (EM) can be calculated to identify the reliability of the interval. These intervals may be assigned in LoT partition assignment 724 after looping through the EM of frequencies. After the optimal window size is determined, the dosing frequency can be refined at dosing frequency refinement 726 . Refinement may involve looping the EM of frequencies one more time until convergence with a specified window size (w) is achieved. The set of treatment intervals with the highest expected value can be selected as the best representative set of LoT (Potential LoT). After all patients have been processed to identify a base set of LoT, stage 130 may output LoT frequencies estimated from modeled LoT frequencies 655 .

モデルLoT割り当て段階730で、すべての患者にわたる推定されたLoT頻度655の集まりは、各新規患者の投薬間隔と比較され得る。LoT生成段階732において、潜在的LoTとして指定された治療間隔は、次いで、潜在的LoTの各患者の順位付けに対応する第1、第2、第3などのLoT分割に割り当てられ得る。整数の結合方法に従って列挙された、各潜在的LoT割り当て732は、LoTおよびLoTラベル付け734で患者のLoTとしてラベル付けされた最もありそうなLoTの対応する人気度によって順位付けされ得る。 At the model LoT allocation stage 730, the collection of estimated LoT frequencies 655 across all patients can be compared to each new patient's dosing interval. In the LoT generation stage 732, treatment intervals designated as potential LoTs may then be assigned to first, second, third, etc. LoT partitions corresponding to each patient's ranking of potential LoTs. Each potential LoT assignment 732 , listed according to the integer combining method, may be ranked by the corresponding popularity of the most likely LoT labeled as the patient's LoT in the LoT and LoT labeling 734 .

LoTラベル付けの例示的な用途は、図8~図13に関して以下で説明される。例示的な実施形態は、図1~図7のシステムおよび方法を含む、本明細書において開示されている方法およびシステムのいずれかに従って生成され、ラベル付けされてもよい。次の例は、本明細書における異なる方法およびアプローチが、患者記録の異なる例にどのように適用され得るかを例示するために提供される。 Exemplary applications of LoT labeling are described below with respect to FIGS. 8-13. Exemplary embodiments may be generated and labeled according to any of the methods and systems disclosed herein, including the systems and methods of FIGS. 1-7. The following examples are provided to illustrate how the different methods and approaches herein can be applied to different examples of patient records.

図8~図10は、一実施形態による組み合わせられたEMRおよびキュレーション記録システムからの患者医療記録、計算された投薬間隔、および予測された治療ライン(LoT)を示す図である。投薬、転帰、治療間隔優先事象、および他のLoT特徴を抽出するときに患者記録のタイプおよびソースが考慮され得る。これらの説明図は、記録内の1つまたは複数の治療間隔および潜在的LoTを識別するためのEMRとキュレーションされた記録との間の相互作用を強調する。 8-10 illustrate patient medical records, calculated dosing intervals, and predicted lines of treatment (LoT) from a combined EMR and curated record system, according to one embodiment. Patient record type and source may be considered when extracting medications, outcomes, treatment interval preferences, and other LoT features. These illustrations highlight the interaction between EMR and curated recordings for identifying one or more treatment intervals and potential LoTs within the recording.

図8は、転移性非小細胞肺癌と診断された第1の患者に対するLoT予測の説明図である。第1の患者は、2016年8月に一次診断802でNSCLCと診断された。治療過程における次の1年全体を通して、第1の患者を治療する癌専門医は、患者、第1の患者の薬剤、および関連する転帰を記述するいくつかの経過記録(上で「経過記録」として表されている)を作成した。このデータは、薬剤投与804の電子医療健康記録(EHR)により補完される。 FIG. 8 is an illustration of LoT prediction for a first patient diagnosed with metastatic non-small cell lung cancer. The first patient was diagnosed with NSCLC in August 2016 at primary diagnosis 802. Throughout the next year in the course of treatment, the oncologist treating the first patient maintains several follow-up notes (referred to above as "follow-up notes") describing the patient, the first patient's medications, and related outcomes. ) was created. This data is complemented by electronic medical health records (EHRs) of medication administration 804 .

医療専門家(キュレーター)が、これらの経過記録の各々を調べ、各ノートからの表示される投薬および関連する転帰806を記録した。次に、経過記録の内容が説明される。
経過記録1(PN1):キュレーターは、2016年の8月に患者の一次診断さらにはペメトレキセド、ベバシズマブ、およびカルボプラチンのトリプレット化学療法808の最初の投与の日付を記録した。
PN2:キュレーターは、2016年10月のPN1のトリプレット療法808の終了、関連療法への部分的反応(表示なし、2016年10月)、および2016年11月のペメトレキセド/ベバシズマブ維持療法810の開始を記録した。
PN3:2017年1月、キュレーターは2016年12月に進行性疾患転帰812をペメトレキセド/ベバシズマブ維持療法810およびその関連する終了に記録した。また、癌専門医は、2017年2月に患者にニボルマブ814に投与する意向を記した。
PN4:キュレーターは、2017年2月にニボルマブ814に対する進行性疾患転帰816(この療法が患者の癌の治療に不成功であったことを意味する)を記録した。また、ゲムシタビン療法818の開始が、2017年3月から始めて記録された。
PN5:2017年3月下旬における毒性によるゲムシタビン818の終了が記録され、さらには同時にパクリタキセル820の投与開始が記録された。
PN6:2017年6月にパクリタキセル820の終了が記録され、療法に対する関連する「完全反応」(患者に癌がないことが判明したことを示す)が記録された。
PN7:2017年8月のフォローアップ訪問時に、別の「完全反応」822が記録され、患者が引き続き癌でないことが判明したことを示した。これらのキュレーションされた薬剤は、下流の分析のために、薬剤テーブルに入力され、転帰SQLテーブルに転帰が入力された。
A medical professional (curator) reviewed each of these transcripts and recorded the indicated medications and associated outcomes 806 from each notebook. Next, the contents of the progress record will be explained.
Follow-up note 1 (PN1): The curator documented the date of the patient's primary diagnosis and first dose of triplet chemotherapy 808 of pemetrexed, bevacizumab, and carboplatin in August 2016.
PN2: The curator recommended completion of triplet therapy 808 for PN1 in October 2016, partial response to related therapy (not shown, October 2016), and initiation of pemetrexed/bevacizumab maintenance therapy 810 in November 2016 Recorded.
PN3: In January 2017, the curator recorded progressive disease outcomes 812 to pemetrexed/bevacizumab maintenance therapy 810 and their associated terminations in December 2016. The oncologist also noted his intention to administer nivolumab 814 to the patient in February 2017.
PN4: The curator documented a progressive disease outcome 816 (meaning that this therapy was unsuccessful in treating the patient's cancer) for nivolumab 814 in February 2017. Initiation of gemcitabine therapy818 was also recorded beginning in March 2017.
PN5: Gemcitabine 818 termination due to toxicity in late March 2017 was documented, and paclitaxel 820 initiation was documented at the same time.
PN6: End of paclitaxel 820 was documented in June 2017 and an associated "complete response" to therapy (indicating that the patient was found to be cancer-free).
PN7: At the August 2017 follow-up visit, another "complete response" 822 was recorded, indicating that the patient remained cancer-free. These curated drugs were entered into the drug table and outcomes into the Outcomes SQL table for downstream analysis.

包含およびEHRとの調和
次に、病院からのEHRに存在する薬剤投与記録は、投薬データテーブルに追加された(図1の記録調和122に従ったすべての薬剤投与804およびイベントバー)。デキサメタゾン投与824は、追加的に記録された。これらは、副作用を和らげるために患者が化学療法と併用して一般的に受ける支持療法薬であるので、これらの薬剤はキュレーションされていない。表示されている間、デキサメタゾンはフィルタリングされ、その後の計算において考慮されなかったが、それは、支持療法薬がLoT間隔生成モジュール124にとって顕著であるとは見なされないからである。2016年9月および10月のペメトレキセド、ベバシズマブ、およびカルボプラチン808のEHR投与記録は、これらの薬剤のキュレーションされた記録に追加され、記録調和122においてこれらの薬剤に対する「ネイティブのおよびキュレーションされた」記録を生成した。パクリタキセル820のEHR投与は、2017年の4月から6月においてキュレーションされた記録を増強するために使用されており、別の「ネイティブの、およびキュレーションされた」記録を生成した。8月のパクリタキセルの追加投与(804aにおける)は、記録調和122で患者記録に追加された。
Inclusion and Reconciliation with EHR Next, the drug administration records present in the EHR from the hospital were added to the medication data table (all drug administrations 804 and event bars according to record reconciliation 122 in FIG. 1). Dexamethasone administration 824 was additionally recorded. These agents are not curated because they are supportive care agents that patients commonly receive in combination with chemotherapy to alleviate side effects. While displayed, dexamethasone was filtered and not considered in subsequent calculations because supportive care medications are not considered significant to LoT interval generation module 124 . The September and October 2016 EHR dosing records for pemetrexed, bevacizumab, and carboplatin 808 were added to the curated records for these agents, and the “native and curated ” generated a record. An EHR dose of paclitaxel 820 was used to augment a curated record in April-June 2017, generating another 'native and curated' record. The August paclitaxel booster (in 804a) was added to the patient's record in record reconciliation 122.

投薬間隔の提示
次に、記述された投薬記録は、固有の薬剤の間隔に変換された(点線バーは830a~830eで表される)。これらの間隔は、定義された開始日および終了日で同時に服用された薬剤の集合を表す。投薬間隔は、投薬の変更が生じたときに必ず作成される(間隔生成モジュール124を参照)。
間隔830a:最初の投薬間隔は、トリプレット療法であるペメトレキセド/ベバシズマブ/カルボプラチンから始まり、2016年10月のカルボプラチンの中止で終了する(間隔作成モジュール124)。
間隔830b:ペメトレキセド/ベバシズマブからなり、この間隔はカルボプラチンの中止で始まり、このダブレット療法の終了まで継続する(間隔生成モジュール124)。
間隔830c:これは、2017年2月のニボルマブの患者投与を捕捉する(間隔生成モジュール124)。
間隔830d:この間隔は、2017年3月のゲムシタビンの投与から始まり、その中止およびパクリタキセルの開始で終了する(間隔生成モジュール124)。
間隔830e:キュレーションされた、ネイティブのパクリタキセル記録から始まり、2017年7月のパクリタキセル投与のEHR記録まで続く。患者は2017年5月から始めてデキサメタゾンを受けたけれども、この薬剤はLoT割り当てに関連しないと考えられるので、2017年5月から2017年7月の第6の間隔が生成されることを引き起こさない(間隔生成モジュール124)。
Presentation of Dosage Intervals The written medication records were then converted to unique medication intervals (dotted bars represented by 830a-830e). These intervals represent collections of drugs taken at the same time with defined start and end dates. Medication intervals are created whenever a medication change occurs (see interval generation module 124).
Interval 830a: The first dosing interval begins with triplet therapy pemetrexed/bevacizumab/carboplatin and ends with discontinuation of carboplatin in October 2016 (interval generation module 124).
Interval 830b: Consisting of pemetrexed/bevacizumab, this interval begins with discontinuation of carboplatin and continues until the end of this doublet therapy (interval generation module 124).
Interval 830c: This captures the February 2017 patient administration of nivolumab (interval generation module 124).
Interval 830d: This interval begins with gemcitabine administration in March 2017 and ends with its discontinuation and paclitaxel initiation (interval generation module 124).
Interval 830e: Curated, beginning with native paclitaxel recordings and continuing through July 2017 EHR recordings of paclitaxel administration. Although the patient received dexamethasone beginning in May 2017, this drug is not considered relevant for LoT assignment and therefore does not cause a sixth interval from May 2017 to July 2017 to be generated ( interval generation module 124).

間隔に関するLoT割り当て
次に、確率的選択およびヒューリスティックの組み合わせが、生成された投薬間隔(1~5)に対するLoTを決定するために適用される(LoT割り当てモジュール126)。
LoT Allocation for Intervals A combination of probabilistic selection and heuristics is then applied to determine the LoT for the generated dosing intervals (1-5) (LoT allocation module 126).

異なる間隔を分離するために転帰が考慮される。2017年1月の転帰は、間隔830bを間隔830cから分離するために使用される(LoT割り当てモジュール126)。
2017年2月後半の転帰は、間隔830cと間隔830dとを分離するために使用される(LoT割り当てモジュール126)。
次に、間隔830a~830bについて検討する。この場合、訓練母集団にわたってこれらの間隔の各々の相対的頻度を考慮して確率的選択がなされる。間隔830a(トリプレット療法を表す)を単独で見る確率は10%であり、間隔830b(ペメトレキセド/ベバシズマブ)を単独で見る確率は5%であり、したがって組み合わせ確率は0.5%(10%*5%)となる。しかしながら、間隔830aを見て続いて間隔830bを見るのは2%である。2%>0.5%なので、この間隔は組み合わされ、1LoT(LoT割り当てモジュール126)と定義される。
間隔830cは、間隔830bと間隔830dとによって転帰で分離されているので、この単独の間隔はLoT 2となる(LoT割り当てモジュール126)。
間隔830dおよび830eは、次に、確率的選択の観点から考察される。間隔830dおよび830eを単独で見る確率は7.5%(それぞれ30%および25%、30%*25%=7.5%)であるが、データセットにまたがる間隔830d~830eを見る確率は1%である。7.5%>1%なので、間隔は分離されたLoTと考えられ、間隔830dはLoT3に割り当てられ、間隔830eはLoT4に割り当てられる(LoT割り当てモジュール126)。
Outcomes are considered to separate different intervals. The January 2017 outcome is used to separate interval 830b from interval 830c (LoT allocation module 126).
The late February 2017 outcome is used to separate intervals 830c and 830d (LoT allocation module 126).
Next, consider the intervals 830a-830b. In this case, a probabilistic selection is made considering the relative frequency of each of these intervals across the training population. The probability of seeing Interval 830a (representing triplet therapy) alone is 10% and the probability of seeing Interval 830b (pemetrexed/bevacizumab) alone is 5%, thus the combined probability is 0.5% (10%*5%) becomes. However, 2% see interval 830a followed by interval 830b. Since 2%>0.5%, the intervals are combined and defined as 1 LoT (LoT allocation module 126).
Since interval 830c is separated in outcomes by interval 830b and interval 830d, this single interval becomes LoT 2 (LoT allocation module 126).
Intervals 830d and 830e are now considered in terms of probabilistic selection. The probability of seeing intervals 830d and 830e alone is 7.5% (30% and 25% respectively, 30%*25%=7.5%), but the probability of seeing intervals 830d-830e across the dataset is 1%. Since 7.5%>1%, the intervals are considered isolated LoT, interval 830d is assigned to LoT3 and interval 830e is assigned to LoT4 (LoT assignment module 126).

図9は、卵巣癌と診断された第2の患者に対するLoT予測の説明図である。
患者背景および臨床データソース。
PN1、2015年3月:一次診断および手術、カルボプラチン、ベバシズマブ、およびパクリタキセルの開始。
PN2、2015年9月:ベバシズマブの開始、カルボプラチン、パクリタキセルの終了。
PN3、2016年3月:進行性疾患の転帰
PN4、2016年6月:進行性疾患転帰、ベバシズマブの終了(月のみ)、カルボプラチン、ベバシズマブ、ゲムシタビンの開始。
PN5、2016年10月:カルボプラチン、ベバシズマブ、ゲムシタビンの終了。
EHRソース:アナストロゾール、2017年4月。
FIG. 9 is an illustration of LoT prediction for a second patient diagnosed with ovarian cancer.
Patient demographics and clinical data sources.
PN1, March 2015: Primary diagnosis and surgery, initiation of carboplatin, bevacizumab, and paclitaxel.
PN2, September 2015: Start of bevacizumab, end of carboplatin, paclitaxel.
PN3, March 2016: Progressive disease outcome
PN4, June 2016: Progressive disease outcome, end of bevacizumab (month only), start of carboplatin, bevacizumab, gemcitabine.
PN5, October 2016: End of carboplatin, bevacizumab, gemcitabine.
EHR Source: Anastrozole, April 2017.

間隔構築
間隔930a:トリプレット療法カルボプラチン/ベバシズマブ/パクリタキセル。
間隔930b:ベバシズマブ(間隔生成モジュール124によって間隔930aから分離される)。
間隔930c:カルボプラチン/ベバシズマブ/ゲムシタビン。
間隔930d:アナストロゾール(間隔生成モジュール124によって間隔930aから分離された)。
Interval Construction Interval 930a: Triplet therapy carboplatin/bevacizumab/paclitaxel.
Interval 930b: bevacizumab (separated from interval 930a by interval generation module 124).
Interval 930c: Carboplatin/Bevacizumab/Gemcitabine.
Interval 930d: Anastrozole (separated from interval 930a by interval generation module 124).

LoT割り当て:
2016年6月の転帰は、間隔930a~930bと930c~930dとの間の分離を知らせるために使用される(LoT割り当てモジュール126)。間隔930cおよび930dは、前の終了と次の開始との間の分離に起因して分離される(LoT割り当てモジュール126)。次に、精緻化された間隔リストは、[(間隔930a、間隔930b)、(間隔930c)、(間隔930d)]からなる。
LoT Allocation:
The June 2016 outcome is used to inform the separation between intervals 930a-930b and 930c-930d (LoT allocation module 126). Intervals 930c and 930d are separated due to the separation between the end of the previous and the start of the next (LoT allocation module 126). The refined interval list then consists of [(interval 930a, interval 930b), (interval 930c), (interval 930d)].

最初のセットについて、間隔930aおよび間隔930b単独の確率と組み合わせの確率とが比較される。組み合わせた間隔の方が確率が高いので、セットは(間隔930a+間隔930b)となり、LoT1を割り当てられる(LoT割り当てモジュール126)。
間隔930cはLoT2を割り当てられ、間隔930dはLoT3を割り当てられる(LoT割り当てモジュール126、ただ1つの可能な結合)。
For the first set, the probabilities of intervals 930a and 930b alone and in combination are compared. Since the combined interval has a higher probability, the set becomes (interval 930a+interval 930b) and is assigned LoT1 (LoT assignment module 126).
Interval 930c is assigned LoT2 and interval 930d is assigned LoT3 (LoT assignment module 126, only one possible combination).

図10は、乳癌と診断された第3の患者に対するLoT予測の説明図である。
患者背景および臨床データソース。
PN1、2017年1月:一次診断、乳房、およびドセタキセル、トラスツズマブ、ペルツズマブ、およびカルボプラチンの開始。
PN2、2017年7月:ドセタキセル、トラスツズマブ、ペルツズマブ、およびカルボプラチンの投与終了。
EMR、2017年7月:トラスツズマブの投与
EMR、2017年12月~2018年6月:カペシタビンの投与、トラスツズマブの数回の投与、およびタモキシフェンの2回の投与。
FIG. 10 is an illustration of LoT prediction for a third patient diagnosed with breast cancer.
Patient demographics and clinical data sources.
PN1, January 2017: Primary diagnosis, breast, and initiation of docetaxel, trastuzumab, pertuzumab, and carboplatin.
PN2, July 2017: End of docetaxel, trastuzumab, pertuzumab, and carboplatin.
EMR, July 2017: Administration of Trastuzumab
EMR, December 2017-June 2018: Administration of capecitabine, several doses of trastuzumab, and two doses of tamoxifen.

間隔構築
間隔1030a:ドセタキセル、トラスツズマブ、ペルツズマブ、およびカルボプラチンのクワドラプレット療法。
間隔1030b:トラスツズマブ(間隔生成モジュール124を介して間隔1030aによって分離される)。
間隔1030c:トラスツズマブおよびカペシタビン(新薬および間隔生成モジュール124によって間隔1030bから分離される)。
間隔1030d:トラスツズマブ(カペシタビンの滴下によって間隔1030cから分離される、間隔生成モジュール124はトラスツズマブの継続を参照する)。
間隔1030e:トラスツズマブおよびタモキシフェン(タモキシフェンの導入によって間隔1030dから分離される、間隔生成モジュール124、間隔生成モジュール124を介して継続する、タモキシフェンは207dの薬剤特異的ロールアップを採用する)。
Interval Construction Interval 1030a: Quadruplet therapy of docetaxel, trastuzumab, pertuzumab, and carboplatin.
Interval 1030b: Trastuzumab (separated by interval 1030a via interval generation module 124).
Interval 1030c: Trastuzumab and Capecitabine (separated from interval 1030b by new drug and interval generation module 124).
Interval 1030d: Trastuzumab (separated from interval 1030c by capecitabine instillation, interval generation module 124 sees continuation of trastuzumab).
Interval 1030e: Trastuzumab and Tamoxifen (separated from interval 1030d by the introduction of tamoxifen, interval generation module 124, continuing through interval generation module 124, tamoxifen adopts drug-specific rollup of 207d).

LoT割り当て:この記録は転帰を有していないので、5つの間隔のすべての可能な結合が確率的に検討され(この場合、2(5-1)または16の可能な組み合わせ、LoT割り当てモジュール126)、最も確率の高いものが一連のLoTとして選択される。この場合、2+1+2が最も可能性の高い間隔結合として選択された。 LoT Assignment: Since this record has no outcome, all possible combinations of the 5 intervals are considered probabilistically (in this case 2(5-1) or 16 possible combinations, LoT assignment module 126 ), the one with the highest probability is selected as the set of LoTs. In this case, 2+1+2 was chosen as the most likely interval bond.

図11~図13は、4つのステップを含む別の実施形態による患者記録からの治療ラインラベル付けを例示している。
1) 投薬、癌診断、および間隔優先事象などの転帰を識別する医療記録を組み合わせる。
2) 患者記録における各新規療法または投薬の開始時に複数の投薬間隔を定義する。
3) 複数の患者記録から教師なし方式で訓練した人工知能エンジンを適用し、LoTの完全なリスティングに対して学習済みヒューリスティックを適用すること。
4) 人工知能エンジンから識別されたLoTに従ってLoT割り当てを出力すること。
Figures 11-13 illustrate treatment line labeling from a patient record according to another embodiment involving four steps.
1) Combining medical records that identify outcomes such as medications, cancer diagnoses, and interval priority events.
2) Define multiple dosing intervals at the start of each new therapy or medication in the patient record.
3) Applying an artificial intelligence engine trained unsupervised from multiple patient records and applying learned heuristics to the complete listing of LoT.
4) outputting LoT assignments according to the LoT identified from the artificial intelligence engine;

図11~図13は、時刻0の日における一次診断(pDX)、ある時刻における一次診断の後に発生し、少なくとも1日の持続時間を有する複数の投薬/療法、および外科手術などの任意の間隔優先事象のリスティング、または患者記録からの転帰リスティングを含んでいる。各々は、療法、投薬、または他の事象の間隔を表示するためのpDX開始日および終了日を有する。 Figures 11-13 show the primary diagnosis at time 0 day (pDX), multiple medications/therapies occurring after the primary diagnosis at a time and having a duration of at least 1 day, and any interval such as surgery. Contains listings of priority events or outcome listings from patient records. Each has a pDX start and end date to indicate the interval between therapy, dosing, or other events.

次に、図11A~図11Dを参照すると、治療ライン生成の例示的なフロー1100が示されている。図11Aは、フロー1100の第1のステップを例示している。フロー1100の第1のステップは、1つまたは複数の投薬および/または治療、1つまたは複数の診断(たとえば、癌診断)、および1つまたは複数の転帰(たとえば、進行性疾患転帰)を組み合わせることを含むことができる。例示的なフロー1100において、一次診断は、使用者(たとえば、癌専門医)に1つまたは複数の時間間隔を提供するために事象および/または治療がマッピングされ得るタイムラインの開始を定義することができる。図示されているように、1つまたは複数の投薬および/または治療は、カルボプラチン、ペメトレキセド、ニボルマブ、および外科手術を含むことができる。いくつかの実施形態において、図11Aに示されているようなフロー1100は、図2のステップ210および220を使用して生成され得る。 11A-11D, an exemplary flow 1100 for line of treatment generation is shown. FIG. 11A illustrates the first step of flow 1100. FIG. A first step of flow 1100 combines one or more medications and/or treatments, one or more diagnoses (eg, cancer diagnosis), and one or more outcomes (eg, progressive disease outcome). can include In exemplary flow 1100, primary diagnosis may define the beginning of a timeline to which events and/or treatments may be mapped to provide one or more time intervals to a user (eg, an oncologist). can. As shown, one or more of the medications and/or treatments can include carboplatin, pemetrexed, nivolumab, and surgery. In some embodiments, flow 1100 as shown in FIG. 11A may be generated using steps 210 and 220 of FIG.

図11Bは、フロー1100の第2のステップに含まれる投薬間隔の数を例示している。図11Bのフロー1100は、図11Aの1つまたは複数の投薬および/または治療に基づき生成され得る。いくつかの薬剤は、1つまたは複数の新しい治療に対する共通の間隔と関連付けることができる。図示されているように、カルボプラチンおよびペメトレキセドは、一次診断の約70日後である第1の投薬間隔と関連付けられ得る。第1の投薬間隔は、第1の新しい治療の開始を定義することができる。他の薬剤は、第2の投薬間隔と関連付けることができる。図示されているように、ニボルマブは、第2の投薬間隔と関連付けることができる。第2の投薬間隔は、第2の新しい治療の開始を定義することができる。いくつかの実施形態において、図11Bに示されているようなフロー1100は、図2のステップ230を使用して生成され得る。 FIG. 11B illustrates the number of dosing intervals involved in the second step of flow 1100. FIG. Flow 1100 of FIG. 11B may be generated based on one or more medications and/or treatments of FIG. 11A. Some agents can be associated with a common interval for one or more new treatments. As shown, carboplatin and pemetrexed can be associated with a first dosing interval of approximately 70 days after primary diagnosis. A first dosing interval can define the start of a first new therapy. Other medications can be associated with a second dosing interval. As shown, nivolumab can be associated with a second dosing interval. A second dosing interval can define the start of a second new therapy. In some embodiments, flow 1100 as shown in FIG. 11B may be generated using step 230 of FIG.

図11Cは、フロー1100の第3のステップにおいて1つまたは複数の投薬間隔を精緻化するためにヒューリスティックを適用することを例示している。ヒューリスティックは、重なり合う間隔を組み合わせること、間隔を分割すること、または1つもしくは複数のヒューリスティック、ルール、もしくは訓練済みモデルに従って開始日および/もしくは終了日を調整することによって1つまたは複数の投薬間隔を精緻化することができる。たとえば、カルボプラチンおよびペメトレキセドは、別々の投薬間隔と関連付けることも可能であり、フロー1100は、カルボプラチンおよびペメトレキセドの両方を第1の投薬間隔と関連付けることができる。ヒューリスティックは、進行性疾患転帰に関連付けられているルールに基づき1つまたは複数の投薬間隔を精緻化することができる。たとえば、ヒューリスティックは、診断後約130日の進行性疾患転帰に基づき診断後約130日に開始するように第2の投薬間隔を設定することができる。同じ薬剤(たとえば、ニボルマブ)の継続のために、治療ラインは、ニボルマブを使用する第2の治療に関連付けられている第3の間隔などの、すべての投薬間隔について同じであってよい。いくつかの実施形態において、図11Cに示されているようなフロー1100は、図2のステップ240を使用して生成され得る。 FIG. 11C illustrates applying heuristics to refine one or more dosing intervals in the third step of flow 1100 . The heuristic divides one or more dosing intervals by combining overlapping intervals, dividing intervals, or adjusting start and/or end dates according to one or more heuristics, rules, or trained models. can be refined. For example, carboplatin and pemetrexed can be associated with separate dosing intervals, and flow 1100 can associate both carboplatin and pemetrexed with a first dosing interval. A heuristic can refine one or more dosing intervals based on rules associated with progressive disease outcome. For example, the heuristic may set the second dosing interval to begin about 130 days after diagnosis based on progressive disease outcome about 130 days after diagnosis. For continuation of the same drug (eg, nivolumab), the treatment line may be the same for all dosing intervals, such as a third interval associated with a second treatment using nivolumab. In some embodiments, flow 1100 as shown in FIG. 11C may be generated using step 240 of FIG.

図11Dは、フロー1100の第4のステップにおいてライン割り当てを出力することを例示している。ライン割り当ては、1つまたは複数の投薬間隔から1つまたは複数の潜在的治療ラインに関連付けられ得る。識別は、訓練済みモデル、尤度に基づく順位付けを伴う網羅的列挙、または本明細書に開示されている他の方法を使用して実行され得る。治療ラインは、第1の投薬間隔に関連付けられている第1のライン(たとえば、カルボプラチンおよびペメトレキセド治療)および第2の投薬間隔に関連付けられている第2のライン(たとえば、ニボルマブ治療)を含むことができる。いくつかの実施形態において、図11Dに示されているようなフロー1100は、図2のステップ250および260を使用して生成され得る。 11D illustrates outputting line assignments in the fourth step of flow 1100. FIG. A line assignment can be associated with one or more potential lines of therapy from one or more dosing intervals. Identification may be performed using trained models, exhaustive enumeration with likelihood-based ranking, or other methods disclosed herein. The lines of therapy include a first line (e.g., carboplatin and pemetrexed therapy) associated with a first dosing interval and a second line (e.g., nivolumab therapy) associated with a second dosing interval. can be done. In some embodiments, flow 1100 as shown in FIG. 11D may be generated using steps 250 and 260 of FIG.

次に、図12A~図12Fを参照すると、治療ライン生成の例示的なフロー1200が示されている。図12Aは、フロー1200の第1のステップを例示している。フロー1200の第1のステップは、1つまたは複数の投薬および/または治療ならびに1つまたは複数の診断(たとえば、癌診断)を組み合わせることを含むことができる。例示的なフロー1200において、一次診断は、使用者(たとえば、癌専門医)に1つまたは複数の時間間隔を提供するために事象および/または治療がマッピングされ得るタイムラインの開始を定義することができる。図示されているように、1つまたは複数の投薬および/または治療は、ドキソルビシン、シクロホスファミド、パクリタキセル、タモキシフェン、および外科手術を含むことができる。いくつかの実施形態において、図12Aに示されているようなフロー1200は、図2のステップ210および220を使用して生成され得る。 12A-12F, an exemplary flow 1200 for line of treatment generation is shown. FIG. 12A illustrates the first step of flow 1200. FIG. A first step of flow 1200 can include combining one or more medications and/or treatments and one or more diagnoses (eg, cancer diagnosis). In exemplary flow 1200, primary diagnosis may define the beginning of a timeline to which events and/or treatments may be mapped to provide one or more time intervals to a user (eg, an oncologist). can. As shown, one or more medications and/or treatments can include doxorubicin, cyclophosphamide, paclitaxel, tamoxifen, and surgery. In some embodiments, flow 1200 as shown in FIG. 12A may be generated using steps 210 and 220 of FIG.

図12Bは、フロー1200の第2のステップに含まれる投薬間隔の数を例示している。図12Bのフロー1200は、図12Aの1つまたは複数の投薬および/または治療に基づき生成され得る。いくつかの薬剤は、1つまたは複数の新しい治療に対する共通の間隔と関連付けることができる。図示されているように、ドキソルビシンおよびシクロホスファミドは、一次診断の約50日後である第1の投薬間隔と関連付けられ得る。第1の投薬間隔は、第1の新しい治療の開始を定義することができる。他の薬剤は、第2の投薬間隔または第3の投薬間隔と関連付けることができる。図示されているように、パクリタキセルは、一次診断の約120日後である第2の投薬間隔と関連付けられ得る。第2の投薬間隔は、第2の新しい治療の開始を定義することができる。図示されているように、タモキシフェンは、一次診断の約150日後である第3の投薬間隔と関連付けられ得る。第3の投薬間隔は、第3の新しい治療の開始を定義することができる。いくつかの実施形態において、図12Bに示されているようなフロー1200は、図2のステップ230を使用して生成され得る。 FIG. 12B illustrates the number of dosing intervals involved in the second step of flow 1200. FIG. Flow 1200 of FIG. 12B may be generated based on one or more medications and/or treatments of FIG. 12A. Some agents can be associated with a common interval for one or more new treatments. As shown, doxorubicin and cyclophosphamide can be associated with a first dosing interval of approximately 50 days after primary diagnosis. A first dosing interval can define the start of a first new therapy. Other medications can be associated with a second dosing interval or a third dosing interval. As shown, paclitaxel can be associated with a second dosing interval approximately 120 days after the primary diagnosis. A second dosing interval can define the start of a second new therapy. As shown, tamoxifen can be associated with a third dosing interval approximately 150 days after primary diagnosis. A third dosing interval can define the start of a third new therapy. In some embodiments, flow 1200 as shown in FIG. 12B may be generated using step 230 of FIG.

図12Cは、フロー1200の第3のステップにおいて1つまたは複数の投薬間隔を精緻化するためにヒューリスティックを適用することを例示している。ヒューリスティックは、重なり合う間隔を組み合わせること、間隔を分割すること、または1つもしくは複数のヒューリスティック、ルール、もしくは訓練済みモデルに従って開始日および/もしくは終了日を調整することによって1つまたは複数の投薬間隔を精緻化することができる。たとえば、ドキソルビシンおよびシクロホスファミドは、別々の投薬間隔と関連付けることも可能であり、フロー1200は、ドキソルビシンおよびシクロホスファミドの両方を第1の投薬間隔と関連付けることができる。ヒューリスティックは、ホルモン療法に関連付けられているルールに基づき1つまたは複数の投薬間隔を精緻化することができる。たとえば、ヒューリスティックは、第3の治療がホルモン療法であるため、第3の治療(たとえば、タモキシフェン)を含むように第2の投薬間隔を設定することができる。いくつかの実施形態において、図12Cに示されているようなフロー1200は、図2のステップ240を使用して生成され得る。 FIG. 12C illustrates applying heuristics to refine one or more dosing intervals in the third step of flow 1200 . The heuristic divides one or more dosing intervals by combining overlapping intervals, dividing intervals, or adjusting start and/or end dates according to one or more heuristics, rules, or trained models. can be refined. For example, doxorubicin and cyclophosphamide can be associated with separate dosing intervals, and flow 1200 can associate both doxorubicin and cyclophosphamide with a first dosing interval. A heuristic can refine one or more dosing intervals based on rules associated with hormone therapy. For example, a heuristic may set the second dosing interval to include a third therapy (eg, tamoxifen) because the third therapy is hormone therapy. In some embodiments, flow 1200 as shown in FIG. 12C may be generated using step 240 of FIG.

図12Dは、フロー1200の第4のステップにおいて1つまたは複数の投薬間隔を精緻化するために期待値最大化モデルを適用することを例示している。各投薬間隔について、期待値最大化モデルは、EMを計算して投薬間隔の信頼性を識別するために使用され得る。いくつかの実施形態において、図12Dに示されているようなフロー1200は、図2のステップ240を使用して生成され得る。 FIG. 12D illustrates applying an expectation maximization model to refine one or more dosing intervals in the fourth step of flow 1200. FIG. For each dosing interval, an expectation maximization model can be used to calculate the EM and identify the reliability of the dosing interval. In some embodiments, flow 1200 as shown in FIG. 12D may be generated using step 240 of FIG.

図12Eは、フロー1200の第4のステップにおいて1つまたは複数の投薬間隔を精緻化するために期待値最大化モデルを適用することを例示している。具体的には、フロー1200は、第1の投薬間隔遷移「A」および第2の投薬間隔遷移「B」に期待値最大化モデルを適用して、第1の投薬間隔が第2の投薬間隔と組み合わされるべきか、または分離されたままにしておくべきかを決定し、推定性能を最大化することを含むことができる。1つまたは複数の所与の間隔を観察する確率は、P(X)と表記され得る。2つの間隔の間の進行事象を観察する確率は、P_prog(X→Y)と表記され得る。間隔を2つのラインに分割したときに進行事象を見る確率(P(A)P(B)P_prog(A→B))は、1つのラインを維持したときに進行事象を見る確率(P(AB)(1-P_prog(A→B)))と比較され、より確率の高い選択肢がライン割り当てとして選択され得る。図12Eに示されている例では、より確率の高い選択肢は、間隔を2つのラインに分割することであると決定されたので、間隔「A」および間隔「B」の各々は対応する投薬ラインを有する。 FIG. 12E illustrates applying an expectation maximization model to refine one or more dosing intervals in the fourth step of flow 1200. FIG. Specifically, flow 1200 applies an expectation maximization model to the first dosing interval transition "A" and the second dosing interval transition "B" such that the first dosing interval is equal to the second dosing interval. should be combined with or left separate to maximize estimation performance. The probability of observing one or more given intervals can be denoted as P(X). The probability of observing a progression event between two intervals can be denoted as P_prog(X→Y). The probability of seeing a progress event when dividing the interval into two lines (P(A)P(B)P_prog(A→B)) is the probability of seeing a progress event when keeping one line (P(AB )(1-P_prog(A→B))) and the more probable option can be selected as the line assignment. In the example shown in FIG. 12E, it was decided that the more probable option would be to split the interval into two lines, so each of interval "A" and interval "B" would have a corresponding medication line. have

図12Fは、フロー1200の第5のステップにおいてライン割り当てを出力することを例示している。ライン割り当ては、1つまたは複数の投薬間隔から1つまたは複数の潜在的治療ラインに関連付けられ得る。識別は、訓練済みモデル、尤度に基づく順位付けを伴う網羅的列挙、または本明細書に開示されている他の方法を使用して実行され得る。治療ラインは、第1、第2、および第3の投薬間隔に関連付けられている第1のラインを含むことができる。いくつかの実施形態において、図12Fに示されているようなフロー1200は、図2のステップ250および260を使用して生成され得る。 FIG. 12F illustrates outputting line assignments in the fifth step of flow 1200. FIG. A line assignment can be associated with one or more potential lines of therapy from one or more dosing intervals. Identification may be performed using trained models, exhaustive enumeration with likelihood-based ranking, or other methods disclosed herein. The lines of therapy can include first lines associated with first, second, and third dosing intervals. In some embodiments, flow 1200 as shown in FIG. 12F may be generated using steps 250 and 260 of FIG.

次に、図13A~図13Fを参照すると、治療ライン生成の例示的なフロー1300が示されている。図13Aは、フロー1300の第1のステップを例示している。フロー1300の第1のステップは、1つまたは複数の投薬および/または治療、1つまたは複数の進行性疾患転帰、および1つまたは複数の診断(たとえば、癌診断)を組み合わせることを含むことができる。例示的なフロー1300において、一次診断は、使用者(たとえば、癌専門医)に1つまたは複数の時間間隔を提供するために事象および/または治療がマッピングされ得るタイムラインの開始を定義することができる。図示されているように、1つまたは複数の投薬および/または治療は、デキサメタゾン、レナリドミド、ボルテゾミブ、カルフィルゾミブ、ポマリドミド、ダラツムマブ、および幹細胞移植を含み得る。いくつかの実施形態において、図13Aに示されているようなフロー1300は、図2のステップ210および220を使用して生成され得る。 13A-13F, an exemplary flow 1300 for line of treatment generation is shown. FIG. 13A illustrates the first step of flow 1300. FIG. A first step of flow 1300 can include combining one or more medications and/or treatments, one or more progressive disease outcomes, and one or more diagnoses (eg, cancer diagnosis). can. In exemplary flow 1300, primary diagnosis may define the beginning of a timeline to which events and/or treatments may be mapped to provide a user (eg, an oncologist) with one or more time intervals. can. As shown, one or more medications and/or treatments may include dexamethasone, lenalidomide, bortezomib, carfilzomib, pomalidomide, daratumumab, and stem cell transplantation. In some embodiments, flow 1300 as shown in FIG. 13A may be generated using steps 210 and 220 of FIG.

図13Bは、フロー1300の第2のステップに含まれる投薬間隔の数を例示している。図13Bのフロー1300は、図13Aの1つまたは複数の投薬および/または治療に基づき生成され得る。いくつかの薬剤は、1つまたは複数の新しい治療に対する共通の間隔と関連付けることができる。図示されているように、デキサメタゾン、レナリドミド、およびボルテゾミブは、一次診断の約5日後である第1の投薬間隔と関連付けられ得る。第1の投薬間隔は、第1の新しい治療の開始を定義することができる。他の薬剤は、追加の投薬間隔と関連付けることができる。図示されているように、カルフィルゾミブおよびポマリドミドは、一次診断の約180日後である第2の投薬間隔と関連付けられ得る。第2の投薬間隔は、第2の新しい治療の開始を定義することができる。図示されているように、幹細胞移植は、一次診断の約360日後である第3の投薬間隔と関連付けられ得る。第3の投薬間隔は、第3の新しい治療の開始を定義することができる。図示されているように、レナリドミドは、一次診断の約540日後である第4の投薬間隔と関連付けられ得る。第4の投薬間隔は、第4の新しい治療の開始を定義することができる。図示されているように、ダラツムマブおよびデキサメタゾンは、一次診断の約700日後である第5の投薬間隔と関連付けられ得る。第5の投薬間隔は、第5の新しい治療の開始を定義することができる。図示されているように、ポマリドミドは、一次診断の約750日後である第6の投薬間隔と関連付けられ得る。第6の投薬間隔は、第6の新しい治療の開始を定義することができる。図示されているように、ダラツムマブは、一次診断の約930日後である第7の投薬間隔と関連付けられ得る。第7の投薬間隔は、第7の新しい治療の開始を定義することができる。いくつかの実施形態において、図13Bに示されているようなフロー1300は、図2のステップ230を使用して生成され得る。 FIG. 13B illustrates the number of dosing intervals involved in the second step of flow 1300. FIG. Flow 1300 of FIG. 13B may be generated based on one or more medications and/or treatments of FIG. 13A. Some agents can be associated with a common interval for one or more new treatments. As shown, dexamethasone, lenalidomide, and bortezomib can be associated with a first dosing interval approximately 5 days after primary diagnosis. A first dosing interval can define the start of a first new therapy. Other drugs can be associated with additional dosing intervals. As shown, carfilzomib and pomalidomide can be associated with a second dosing interval approximately 180 days after primary diagnosis. A second dosing interval can define the start of a second new therapy. As shown, stem cell transplantation can be associated with a third dosing interval approximately 360 days after primary diagnosis. A third dosing interval can define the start of a third new therapy. As shown, lenalidomide may be associated with a fourth dosing interval approximately 540 days after primary diagnosis. A fourth dosing interval can define the initiation of a fourth new therapy. As shown, daratumumab and dexamethasone can be associated with a fifth dosing interval approximately 700 days after primary diagnosis. A fifth dosing interval can define the start of a fifth new therapy. As shown, pomalidomide can be associated with a sixth dosing interval approximately 750 days after primary diagnosis. A sixth dosing interval can define the start of a sixth new therapy. As shown, daratumumab can be associated with a seventh dosing interval approximately 930 days after primary diagnosis. A seventh dosing interval can define the start of a seventh new therapy. In some embodiments, flow 1300 as shown in FIG. 13B may be generated using step 230 of FIG.

図13Cは、フロー1300の第3のステップにおいて1つまたは複数の投薬間隔を精緻化するためにヒューリスティックを適用することを例示している。ヒューリスティックは、重なり合う間隔を組み合わせること、間隔を分割すること、または1つもしくは複数のヒューリスティック、ルール、もしくは訓練済みモデルに従って開始日および/もしくは終了日を調整することによって1つまたは複数の投薬間隔を精緻化することができる。ヒューリスティックは、進行性疾患転帰に関連付けられているルールに基づき1つまたは複数の投薬間隔を精緻化することができる。たとえば、ヒューリスティックは、診断後約700日の進行性疾患転帰に基づき診断後約700日に開始するように第5の投薬間隔を設定することができる。いくつかの実施形態において、図13Cに示されているようなフロー1300は、図2のステップ240を使用して生成され得る。 FIG. 13C illustrates applying heuristics to refine one or more dosing intervals in the third step of flow 1300 . The heuristic divides one or more dosing intervals by combining overlapping intervals, dividing intervals, or adjusting start and/or end dates according to one or more heuristics, rules, or trained models. can be refined. A heuristic can refine one or more dosing intervals based on rules associated with progressive disease outcome. For example, the heuristic may set the fifth dosing interval to begin about 700 days after diagnosis based on progressive disease outcome about 700 days after diagnosis. In some embodiments, flow 1300 as shown in FIG. 13C may be generated using step 240 of FIG.

図13Dは、フロー1300の第4のステップにおいて1つまたは複数の投薬間隔を精緻化するために期待値最大化モデルを適用することを例示している。各投薬間隔について、期待値最大化モデルは、EMを計算して投薬間隔の信頼性を識別するために使用され得る。いくつかの実施形態において、図13Dに示されているようなフロー1300は、図2のステップ240を使用して生成され得る。 FIG. 13D illustrates applying an expectation maximization model to refine one or more dosing intervals in the fourth step of flow 1300. FIG. For each dosing interval, an expectation maximization model can be used to calculate the EM and identify the reliability of the dosing interval. In some embodiments, flow 1300 as shown in FIG. 13D may be generated using step 240 of FIG.

図13Eは、フロー1300の第4のステップにおいて1つまたは複数の投薬間隔を精緻化するために期待値最大化モデルを適用することを例示している。具体的には、フロー1300は、第1の投薬間隔遷移「C」および第2の投薬間隔遷移「D」、および第3の投薬間隔遷移「E」に期待値最大化モデルを適用して、デキサメタゾン、ポマリドミド、およびダラツムマブが単一の間隔に組み合わされるべきか、または分離されたままにしておくべきかを決定し、推定性能を最大化することを含むことができる。遷移C-DおよびD-Eにおける新しいラインの確率は、P(C)P(D)P(E)P_prog(C→D)P_prog(D→E)と記すことができる。遷移C-Dにおける新しいラインの確率は、P(CD)P(E)(1-P_prog(C→D))P_prog(D→E)と記すことができる。遷移D-Eにおける新しいラインの確率は、P(C)P(DE)P_prog(C→D)(1-P_prog(D→E))と記すことができる。遷移C、D、およびEが1つのライン上にある確率は、P(CDE)(1-P_prog (C→D))(1-P_prog (D→E))と記すことができる。図13Eに示されている例では、C、D、およびEが1つのライン上にある確率が最も高いと決定された。 FIG. 13E illustrates applying an expectation maximization model to refine one or more dosing intervals in the fourth step of flow 1300. FIG. Specifically, flow 1300 applies an expectation maximization model to the first dosing interval transition 'C', the second dosing interval transition 'D', and the third dosing interval transition 'E' to Determining whether dexamethasone, pomalidomide, and daratumumab should be combined in a single interval or kept separate can include maximizing estimated performance. The probabilities of new lines at transitions C-D and D-E can be denoted as P(C)P(D)P(E)P_prog(C→D)P_prog(D→E). The probability of a new line at transition C-D can be written as P(CD)P(E)(1-P_prog(C→D))P_prog(D→E). The probability of a new line at transition D-E can be written as P(C)P(DE)P_prog(C→D)(1−P_prog(D→E)). The probability that transitions C, D, and E are on one line can be written as P(CDE)(1-P_prog (C→D))(1-P_prog (D→E)). In the example shown in Figure 13E, it was determined that C, D, and E were most likely to be on one line.

図13Fは、フロー1300の第5のステップにおいてライン割り当てを出力することを例示している。ライン割り当ては、1つまたは複数の投薬間隔から1つまたは複数の潜在的治療ラインに関連付けられ得る。識別は、訓練済みモデル、尤度に基づく順位付けを伴う網羅的列挙、または本明細書に開示されている他の方法を使用して実行され得る。治療ラインは、第1の投薬間隔に関連付けられている第1のライン、第2、第3、および第4の投薬間隔に関連付けられている第2のライン、ならびに第5、第6、および第7の投薬間隔に関連付けられている第3のラインを含むことができる。いくつかの実施形態において、図13Fに示されているようなフロー1300は、図2のステップ250および260を使用して生成され得る。 FIG. 13F illustrates outputting line assignments in the fifth step of flow 1300. FIG. A line assignment can be associated with one or more potential lines of therapy from one or more dosing intervals. Identification may be performed using trained models, exhaustive enumeration with likelihood-based ranking, or other methods disclosed herein. The lines of therapy are a first line associated with the first dosing interval, a second line associated with the second, third, and fourth dosing intervals, and a fifth, sixth, and fourth dosing interval. A third line associated with 7 dosing intervals can be included. In some embodiments, flow 1300 as shown in FIG. 13F may be generated using steps 250 and 260 of FIG.

図14は少なくとも癌免疫(IO)レジメン療法を有する患者に適用されるような治療ラインを例示するサンキーダイアグラム1400である。 FIG. 14 is a Sankey diagram 1400 illustrating lines of therapy as applied to patients having at least an immuno-oncology (IO) regimen.

この例における患者記録について、第1の治療ラインは、アテゾリズマブ、ニボルマブ、またはペムブロリズマブなどのIO単剤療法、イピリムマブおよびニボルマブなどの組み合わせIOおよびIO、またはカルボプラチン、ペムブロリズマブ、ペメトレキセドなどの組み合わせIO単剤療法および化学療法、カルボプラチン、パクリタキセル、ペムブロリズマブ、カルボプラチン、タンパク質結合パクリタキセル、ペムブロリズマブ、カルボプラチン、ペムブロリズマブ、ペメトレキセド、または任意の他の列挙された組み合わせを含み得る。第2の治療ラインは、IO療法、ホルモン療法、または維持療法の追加の組み合わせを含む。第3の治療ラインは、ドセタキセル、ラムシルマブ、ビノレルビン、およびゲムシタビンを含む。そして第4の治療ラインは、ドセタキセルおよびゲムシタビンを含む。 For the patient record in this example, the first line of therapy is IO monotherapy such as atezolizumab, nivolumab, or pembrolizumab, combination IO and IO such as ipilimumab and nivolumab, or combination IO monotherapy such as carboplatin, pembrolizumab, pemetrexed and chemotherapy, carboplatin, paclitaxel, pembrolizumab, carboplatin, protein-bound paclitaxel, pembrolizumab, carboplatin, pembrolizumab, pemetrexed, or any other combination listed. A second line of treatment includes additional combinations of IO therapy, hormone therapy, or maintenance therapy. The third line of therapy includes docetaxel, ramucirumab, vinorelbine, and gemcitabine. And the fourth line of therapy includes docetaxel and gemcitabine.

データセットが、各患者がどの治療ラインを投与されたかに従ってラベル付けされた後、追加の分析が実行され得る。 After the dataset is labeled according to which line of therapy each patient received, additional analysis can be performed.

図15は、異なる第1の治療ラインを受けた患者の生存曲線を描いた無増悪生存率(PFS)グラフ1500である。 FIG. 15 is a progression-free survival (PFS) graph 1500 depicting survival curves for patients receiving different first lines of therapy.

患者のコホートは、共通の診断および1つまたは複数の治療ラインに基づき生成され得る。コホートは、また、患者記録に含まれる特徴のどれかに基づきフィルタリングし得る。例示的な治療ライン1510、1520、および1530。医師は、本明細書に開示されている任意のシステムおよび方法に従ってラベル付けされたLoTを含む患者記録から見出された特徴の集まりを含む、図1のウェブポータル160A~160Nなどのウェブポータルを使用してコホートを選択し、PFSグラフに初期値を入れて識別された特性を有する患者のコホートに関して患者の生存を経時的に比較するものとしてよい。ここで、PFS曲線1510に関連付けられている治療ラインを受ける患者は、PFS曲線1520に関連付けられている治療ラインを受ける患者よりも治療によく反応し、両方のコホートは、患者がPFS曲線1530に関連付けられている治療ラインのレジメンを受ける治療よりもよく反応することが経験的に観察され得る。この情報およびコホートの集まりに基づき、医師は、曲線1530に関連付けられているLoTの処方を回避する傾向が強く、曲線1510に関連付けられているLoTの処方を推奨する可能性が高い。 Cohorts of patients can be generated based on a common diagnosis and one or more lines of therapy. Cohorts can also be filtered based on any of the features contained in the patient record. Exemplary lines of therapy 1510, 1520, and 1530. A physician may access a web portal, such as web portals 160A-160N of FIG. 1, containing collections of features found from patient records containing LoT labeled according to any of the systems and methods disclosed herein. Cohort selection may be used to populate the PFS graph to compare patient survival over time for cohorts of patients with the identified characteristics. Here, patients receiving the line of treatment associated with PFS curve 1510 responded better to treatment than patients receiving the line of treatment associated with PFS curve 1520, and both cohorts were positive for patients receiving PFS curve 1530. It can be empirically observed to respond better than to therapy receiving regimens of the associated line of treatment. Based on this information and the cohort population, physicians are more likely to avoid prescribing LoT associated with curve 1530 and more likely to recommend prescribing LoT associated with curve 1510.

オンラインウェブポータルを介し、患者の記録に見られる特徴に基づくコホート選択の一例は、すべての目的に関して参照により本明細書に組み込まれている2019年12月31日に出願した米国特許出願第16/732,168号、名称「A Method And Process For Predicting And Analyzing Patient Cohort Response, Progression And Survival」において説明されている。 An example of cohort selection based on characteristics found in patient records, via an online web portal, is US patent application Ser. 732,168 entitled "A Method And Process For Predicting And Analyzing Patient Cohort Response, Progression And Survival".

米国特許出願第16/732,168号の例示的なオンラインウェブポータルを参照すると、図1~図9のコホート選択、図10~図28の分析、および図29~図33のカスタマイズ可能なウェブポータル(ノートブック)実装は、たとえば、ウェブポータル160a~160nまたはGUI170a~170nにおける図1の臨床健康記録110、患者について識別された少なくとも1つのLoTに基づき表示する分析、および任意の追加のコホート特徴から特徴を選択し、受信するコホート選択としてその全体が参照される。カスタマイズ分析を使用者に表示するのに適しているカスタマイズ可能なノートブックは、PFS、外れ値、手術の有効性、LoT性能に関する患者の分子的特徴、有害事象分析、LoTの持続時間からの効果、または他のコホート分析などに対するカスタムターゲット生成を含むものとしてよく、これはラベル付けされたLoTに基づくものとしてよい。例示的なノートブックは、プログラミングアプローチで、分析のためにR、SQL、または他のデータベースソフトウェアバックエンドを有するカスタムインターフェースを設計することを可能にする。カスタムインターフェースは、特に効果的である可能性がある薬剤および治療の承認適応症外使用を識別することを含み得る。ノートブックは、治療の承認適応症外使用の有効性を検証するために、新しい臨床試験に対する調査を開始して、それを確立するためのインフォマティクスを識別し、提示するものとしてよい。一例において、ノートブックでは、それぞれのLoTが、一般薬名、ブランド薬名、および治療ロールアップクラス(治療の種類[標的、開始、維持、化学療法、放射線療法、チロシンキナーゼ阻害剤(TKI)など]、LoT内の薬剤の投与量、および/または経口、静脈内、放射線曝露などの、治療の投与方法に関連付けられていることを識別してよい。 Referring to the exemplary online web portals of US patent application Ser. No. 16/732,168, cohort selection in FIGS. 1-9, analyzes in FIGS. A book) implementation may, for example, extract features from the clinical health record 110 of FIG. Selected and referred to in its entirety as the cohort selection to receive. A customizable notebook suitable for displaying customized analyzes to the user includes PFS, outliers, surgical efficacy, patient molecular characteristics on LoT performance, adverse event analysis, effect from duration of LoT. , or other cohort analysis, etc., which may include custom target generation, which may be based on labeled LoT. The exemplary notebook is a programming approach that allows designing custom interfaces with R, SQL, or other database software backends for analysis. The custom interface may include identifying off-label uses of drugs and treatments that may be particularly effective. The notebook may identify and present the informatics for initiating and establishing investigations into new clinical trials to test the efficacy of the approved off-label use of the treatment. In one example, in the notebook, each LoT has a generic drug name, a brand name, and a therapeutic rollup class (therapeutic type [target, initiation, maintenance, chemotherapy, radiotherapy, tyrosine kinase inhibitor (TKI), etc.) ], the dosage of the drug within the LoT, and/or the method of administration of the treatment, such as oral, intravenous, radiation exposure, etc., may be identified.

図16は、一実施形態による患者に対する治療ラインを使用者が編集するための治療ライン編集ツール1600の説明図である。 FIG. 16 is an illustration of an edit line of treatment tool 1600 for user editing of a line of treatment for a patient according to one embodiment.

治療ライン編集ツールは、本明細書における方法およびシステムに従って識別された治療ラインを有する患者のセットから任意の患者を受け取るものとしてよい。患者がロードされた後、図11~図13のタイムラインに類似するタイムラインがロードされる。別の実施形態では、図8~図10のタイムラインに類似するタイムラインが同様にロードされ得る。使用者は、カーソルを使って、教師なし人工知能エンジンによって実行されたLoTラベル付けにおける認知された欠陥を是正するいくつかの操作を実行し得る。 The edit line of care tool may receive any patient from the set of patients who have lines of care identified according to the methods and systems herein. After the patient is loaded, a timeline similar to that of Figures 11-13 is loaded. In another embodiment, timelines similar to those of FIGS. 8-10 may be loaded as well. The user can use the cursor to perform some manipulations that correct perceived deficiencies in the LoT labeling performed by the unsupervised artificial intelligence engine.

たとえば、使用者は、任意の治療ライン指定をドラッグ&ドロップ1610して、列挙されたLoTの新しい位置に基づき新しいLoTを再キャリブレーションし得る。使用者は、スペルミスを是正するために、またはブランド名を一般名または薬剤のクラスと置き換えるように、薬剤名1620を編集してよい。使用者は、一次診断軸のところで右クリック1630し、マウスカーソル位置にLoTを挿入するか、または削除し得る。使用者は、投薬間隔をドラッグ&ドロップ1640して、その間隔の開始日または終了日を編集し得る。使用者は、薬剤を右クリック1650して、新しい薬剤を挿入するか、または薬剤を削除し得る。使用者は、転帰を右クリック1660して、手術、手技、または他の優先事象などの新しい転帰を記録に挿入し得る。 For example, the user may drag and drop 1610 any treatment line designation to recalibrate the new LoT based on the new location of the listed LoT. The user may edit the drug name 1620 to correct spelling errors or replace brand names with generic names or drug classes. The user can right click 1630 on the primary diagnostic axis to insert or delete LoT at the mouse cursor position. The user may drag and drop 1640 a dosing interval to edit the start or end date of that interval. The user may right click 1650 on a drug to insert a new drug or delete a drug. The user may right-click 1660 Outcomes to insert new outcomes into the record, such as surgeries, procedures, or other priority events.

コントロール1610~1660は、クリックおよびドラッグおよび右クリックなどのマウスイベントに関して例示されているが、当業者であれば、これらのコントロールは、キーボードコントロール、タッチスクリーンコントロール、またはPCの入出力デバイスもしくはモバイルデバイスのインターフェースの類似のインタラクティブな操作などの異なるイベントを使用して操作されてもよいことを認識するであろう。 Controls 1610-1660 are illustrated in terms of mouse events such as click and drag and right click, but those skilled in the art will appreciate that these controls are keyboard controls, touch screen controls, or input/output devices for PCs or mobile devices. may be manipulated using different events, such as similar interactive manipulations of the interface.

図17は、一実施形態によるLoTラベル付けが実行された後の患者タイムライン1700の構造化データ表現の説明図である。 FIG. 17 is an illustration of a structured data representation of patient timeline 1700 after LoT labeling has been performed according to one embodiment.

患者タイムライン1700は、LoTラベルが挿入されている患者記録に対するすべての重要な間隔アンカーを表す。この例では、患者は、2000/1/1に原発性癌の診断を受け、2000/2/29に第1の治療ラインを開始し、約16カ月後、2001/8/11に進行事象が観察され、進行事象は治療内部優先事象として認められ、2001/12/9から始めて第2の治療ラインが投与され、患者は2002/12/16に遺伝子シークエンシングを実施されたが、これはおそらく別の器官部位への腫瘍の転移などの進行事象による。シークエンシングの日付の時点で、タイムラインは、たとえば、徹底的なウェブポータル160A~160Nを通じて、治療医師から利用可能になっている。次に、医師は、ポータルを利用して、患者の類似のコホートに基づき将来のLoT転帰を確認して、肯定的な反応の可能性を改善するために患者の次のLoTを個人化し得る。他の分析は、他の治療、LoTとしてラベル付けされたもの以外の手技の評価、治療の転帰における遺伝的バリアントの評価、患者に治療中の任意の時点において転移または進行を生じるリスクのレベルの識別、および患者の治療を個人化し肯定的転帰を改善するための他の分析を含む。 Patient timeline 1700 represents all significant interval anchors to patient records that have LoT labels inserted. In this example, a patient received a primary cancer diagnosis on 1/1/2000, started first line of therapy on 2/29/2000, and had a progressive event approximately 16 months later on 8/11/2001. was observed and a progressive event was recognized as an intra-treatment priority event, a second line of therapy was administered beginning on 12/9/2001, and the patient underwent gene sequencing on 12/16/2002, which is likely due to Due to progressive events such as metastasis of the tumor to another organ site. As of the date of sequencing, timelines are made available to the treating physician, for example, through in-depth web portals 160A-160N. Physicians can then utilize the portal to review future LoT outcomes based on similar cohorts of patients and personalize the patient's next LoT to improve the likelihood of a positive response. Other analyzes may include assessment of other treatments, procedures other than those labeled as LoT, assessment of genetic variants in treatment outcomes, and the level of risk patients have of developing metastases or progression at any time during treatment. Including identification and other analyzes to personalize patient treatment and improve positive outcomes.

図18は、肺癌コホートおよび乳癌コホートにおける患者のコホートから識別されるLoTの平均持続時間のボックスプロット図1800である。 FIG. 18 is a box plot 1800 of the average duration of LoT identified from cohorts of patients in the lung cancer cohort and the breast cancer cohort.

上で言及されているように、癌特異的間隔は、複数の患者に対する人工知能エンジンの訓練から学習され得る。そのような学習が、正しい日付がインピュートされ得るように治療の平均持続時間に関係した後、その間隔は、モデルがそこからラベル付けするための意味のある潜在的LoT選択を提供するように適切なサイズに設定される。一例として、肺癌患者は、治療間隔の大半を約70日で経験し、120日を超えるものはほとんどない。LoT1~4の分析は、肺癌の診断において、各連続する治療ラインにわたって変動はごくわずかであることを示している。したがって、肺癌間隔閾値は、約70日~120日であり、評価されるLoT間隔に応じて変化することはない。しかし、乳癌の診断の場合、治療間隔の大半は100日前後であり、第1のLoTは300日、第2のLoTは290日、第3のLoTは260日、第4のLoTは210日程度である。乳癌に対する分析では、薬剤持続時間および治療間隔に対する閾値は肺癌の薬剤持続時間および治療間隔に比べて2~3倍長いことを識別している。 As mentioned above, cancer-specific intervals can be learned from training the artificial intelligence engine on multiple patients. After such learning relates the average duration of treatment so that the correct dates can be imputed, the intervals are appropriate to provide meaningful potential LoT choices for the model to label from. set to a suitable size. As an example, lung cancer patients experience most treatment intervals at about 70 days, and few exceed 120 days. Analysis of LoT1-4 shows that there is negligible variation across each successive treatment line in diagnosing lung cancer. Therefore, the lung cancer interval threshold is approximately 70 days to 120 days and does not change depending on the LoT interval being evaluated. However, for breast cancer diagnosis, the majority of treatment intervals are around 100 days, with 300 days for the first LoT, 290 days for the second LoT, 260 days for the third LoT, and 210 days for the fourth LoT. degree. Analyzes for breast cancer identify thresholds for drug duration and treatment interval that are two to three times longer than those for lung cancer.

図19は、患者に投与された乳癌治療薬に対する第1のLoTに基づくLoT頻度1900の説明図である。 FIG. 19 is an illustration of LoT frequencies 1900 based on the first LoT for breast cancer therapeutics administered to a patient.

教師なし学習を介して生成されたモデルに基づき、乳癌患者の大多数は、アナストロゾール、タモキシフェン、またはAC-T(薬物である塩酸ドキソルビシン(アドリアマイシン)およびシクロホスファミド、次いでパクリタキセル(タキソール)による治療)の第1の治療ラインを開始することになる。乳癌患者の第1のLoT選択には大きなばらつきがあるように見えるが、図20は、乳癌患者に対する第2のLoT頻度分布を表している。 Based on models generated through unsupervised learning, the majority of breast cancer patients have anastrozole, tamoxifen, or AC-T (the drugs doxorubicin hydrochloride (adriamycin) and cyclophosphamide, followed by paclitaxel (Taxol)). therapy) will be initiated. Although there appears to be a large variability in the first LoT selection for breast cancer patients, Figure 20 represents the second LoT frequency distribution for breast cancer patients.

図20は、患者に投与された乳癌治療薬に対する第2のLoTに基づくLoT頻度2000の説明図である。 FIG. 20 is an illustration of LoT frequencies 2000 based on the second LoT for breast cancer drugs administered to patients.

教師なし学習を介して生成されたモデルに基づき、乳癌患者の大多数は、図19の第1の治療ラインと、その後のアナストロゾール、タモキシフェン、レトロゾールの第2の治療ラインを受ける。同様に、AC-Tレジメンは、患者に対する第2のLoTとして処方されることは決してなく、したがって第2の治療ラインに対して学習済みラベル付け空間内に出現しないことは意味があることに留意されたい。乳癌患者に対する第2のLoT選択にはあまりばらつきがないが、これは、維持療法が一般的に第3の治療ラインで処方される治療であることから予想される。 Based on models generated through unsupervised learning, the majority of breast cancer patients receive the first line of therapy in FIG. 19, followed by a second line of anastrozole, tamoxifen, letrozole. Note that similarly, AC-T regimens are never prescribed as a second LoT for a patient, and thus it makes sense not to appear in the learned labeling space for a second line of treatment. want to be There is less variability in second LoT selection for breast cancer patients, which is expected as maintenance therapy is commonly prescribed in the third line of therapy.

図21は、患者に投与された非小細胞肺癌(NSCLC)治療薬に対する第1のLoTに基づくLoT頻度2100の説明図である。 FIG. 21 is an illustration of LoT frequencies 2100 based on the first LoT for non-small cell lung cancer (NSCLC) therapeutics administered to a patient.

教師なし学習を介して生成されたモデルに基づき、NSCLC患者の大多数は、カルボプラチンおよびパクリタキセルで開始し、一部の患者はカルボプラチンおよびペメトレキセドまたはエトポシドのいずれかで開始する。正確性のもう1つのポイントは、NSCLC患者のいずれも、図22にリストされているものなど、標的療法で開始しないことを含む。 Based on models generated through unsupervised learning, the majority of NSCLC patients are started on carboplatin and paclitaxel, and some patients are started on carboplatin and either pemetrexed or etoposide. Another point of accuracy includes that none of the NSCLC patients started on targeted therapies such as those listed in FIG.

図22は、患者に投与された非小細胞肺癌治療薬に対する第2のLoTに基づくLoT頻度2200の説明図である。 FIG. 22 is an illustration of LoT frequencies 2200 based on the second LoT for non-small cell lung cancer therapeutics administered to the patient.

教師なし学習を介して生成されたモデルに基づき、NSCLC癌患者の大多数は、図21の第1の治療ラインと、その後に続く、ニボルマブまたはペメトレキセドの第2の治療ラインを受けるが、かなり均一な分布で第2のLoTとしてゲムシタビン、ドセタキセル、またはトポテカンの標的療法を試みる。 Based on models generated via unsupervised learning, the majority of NSCLC cancer patients receive the first line of therapy in FIG. Try targeted therapy with gemcitabine, docetaxel, or topotecan as a second LoT with an even distribution.

図19~図22は、それぞれの一次診断コホートにおける全患者にわたる特定のLoTの出現頻度を例示している。例示的な例は乳癌および肺癌に限定されたが、本明細書において開示されている方法およびシステムは、本明細書において説明されている実施形態から逸脱することなく任意の癌診断に適用され得る。さらに、間隔および潜在的治療ラインに対する順位付けは、頻度に基づく尤度から直接的に導出されてもよい。たとえば、第1のLoTが第1のLoTとして患者の50%に発生する場合、LoTラベル付けにおいてそれぞれの治療間隔がそれに対応するときに50%の尤度を直接与えてもよい。それに加えて、人工知能エンジンは、互いに連続するLoTの頻度に基づきさらなる尤度の推定を生成し得る。たとえば、カルボプラチンおよびパクリタキセルの第1のLoTの後にニボルマブの第2のLoTが時間の80%で続き、カルボプラチンとパクリタキセルの両方およびニボルマブが連続する治療間隔に入っている場合、第1のLoTがカルボプラチンおよびパクリタキセルであり、第2の治療ラインがニボルマブである確率は、記録がカルボプラチンおよびパクリタキセルの第1のラインのみまたはニボルマブの第2のラインのみを含んでいた場合に比べて高くスケーリングされることになる。 Figures 19-22 illustrate the frequency of occurrence of a particular LoT across all patients in each primary diagnostic cohort. Although illustrative examples were limited to breast cancer and lung cancer, the methods and systems disclosed herein can be applied to any cancer diagnosis without departing from the embodiments described herein. . Additionally, rankings for intervals and potential treatment lines may be derived directly from frequency-based likelihoods. For example, if the first LoT occurs in 50% of patients as the first LoT, a 50% likelihood may be given directly when each treatment interval corresponds to it in LoT labelling. In addition, the artificial intelligence engine may generate further likelihood estimates based on the frequency of LoTs that are consecutive with each other. For example, if the first LoT of carboplatin and paclitaxel was followed by the second LoT of nivolumab 80% of the time, and both carboplatin and paclitaxel and nivolumab were in consecutive treatment intervals, then the first LoT was carboplatin and paclitaxel and the second line of treatment is nivolumab is scaled higher than if the record included only the first line of carboplatin and paclitaxel or only the second line of nivolumab. Become.

図23は、列挙されたLoTの少なくとも1つを含むコホートに割り当てられた各原発癌に対する患者の割合の棒グラフ図2300である。 FIG. 23 is a bar graph diagram 2300 of the proportion of patients for each primary cancer assigned to cohorts containing at least one of the listed LoTs.

この例では、乳癌患者は、70%が第1のLoTをラベル付けされ、15%が第2のLoTをラベル付けされ、5%のみが第3のLoTをラベル付けされるように分布される。逆に、結腸直腸癌(CRC)の一次診断については、60%だけが第1のLoTをラベル付けされ、15%が第2のLoTをラベル付けされ、5%が第3のLoTをラベル付けされる。それぞれのラベルがない患者は、もしあれば、どのようなラベルが適用されるかを識別するために手作業で評価され得る。 In this example, breast cancer patients are distributed such that 70% are labeled 1st LoT, 15% are labeled 2nd LoT, and only 5% are labeled 3rd LoT. . Conversely, for primary diagnosis of colorectal cancer (CRC), only 60% were labeled 1st LoT, 15% were labeled 2nd LoT, and 5% were labeled 3rd LoT. be done. Each label-free patient can be manually evaluated to identify what label, if any, is applied.

図24は、本明細書で説明されている方法のうちの任意の1つまたは複数をマシンに実行させるために、命令セットが実行され得るコンピュータシステム2400の例示的なマシンの説明図である。代替的実装形態において、マシンは、LAN、イントラネット、エクストラネット、および/またはインターネットにおいて他のマシンに(たとえば、ネットワーク)接続され得る。 FIG. 24 is an illustration of an exemplary machine of computer system 2400 on which a set of instructions may be executed to cause the machine to perform any one or more of the methods described herein. In alternative implementations, the machine may be connected (eg, networked) to other machines in a LAN, intranet, extranet, and/or the Internet.

マシンは、クライアントサーバネットワーク環境内のサーバまたはクライアントマシンの能力内で、またはピアツーピア(または分散)ネットワーク環境内のピアマシンとして、またはクラウドコンピューティングインフラストラクチャまたは環境内のサーバもしくはクライアントマシンとして動作し得る。マシンは、パーソナルコンピュータ(PC)、タブレットPC、セットトップボックス(STB)、携帯情報端末(PDA)、携帯電話、ウェブアプライアンス、サーバ、ネットワークルーター、スイッチもしくはブリッジ、またはそのマシンによって実行されるアクションを指定する命令セット(順次または他の方法で)実行することができる任意のマシンであってよい。さらに、単一のマシンが図示されているが、「マシン」という用語は、本明細書で説明されている方法のうちの任意の1つまたは複数を実行するために命令セット(または複数の命令セット)を個別に、または連携して実行するマシンの任意の集合体を含むと解釈されるものとする。 A machine may operate in the capacity of a server or client machine in a client-server network environment, or as a peer machine in a peer-to-peer (or distributed) network environment, or as a server or client machine in a cloud computing infrastructure or environment. A machine can be a personal computer (PC), tablet PC, set-top box (STB), personal digital assistant (PDA), mobile phone, web appliance, server, network router, switch or bridge, or an action performed by that machine. It may be any machine capable of executing the specified instruction set (sequentially or otherwise). Further, although a single machine is illustrated, the term "machine" may refer to a set of instructions (or a set of instructions) for performing any one or more of the methods described herein. set), either individually or in conjunction, shall be construed to include any collection of machines.

例示的なコンピュータシステム2400は、処理デバイス2402、メインメモリ2404(リードオンリーメモリ(ROM)、フラッシュメモリ、シンクロナスダイナミックランダムアクセスメモリ(DRAM)(SDRAM)またはDRAMなどのダイナミックランダムアクセスメモリ(DRAM)、など)、スタティックメモリ2406(フラッシュメモリ、スタティックランダムアクセスメモリ(SRAM)、など)、およびデータストレージデバイス2418を備え、これらはバス2430を介して互いに通信する。 The exemplary computer system 2400 includes a processing device 2402, a main memory 2404 (dynamic random access memory (DRAM) such as read-only memory (ROM), flash memory, synchronous dynamic random access memory (DRAM) (SDRAM) or DRAM, etc.), static memory 2406 (flash memory, static random access memory (SRAM), etc.), and data storage device 2418 , which communicate with each other via bus 2430 .

処理デバイス2402は、マクロプロセッサ、中央演算処理装置、または同様のものなどの1つまたは複数の汎用処理デバイスを表す。より具体的には、処理デバイスは、複合命令セットコンピューティング(CISC)マイクロプロセッサ、縮小命令セットコンピューティング(RISC)マイクロプロセッサ、超長命令語(VLIW)マイクロプロセッサ、または他の命令セットを実装するプロセッサもしくは命令セットの組み合わせを実装するプロセッサであってよい。処理デバイス2402は、特定用途向け集積回路(ASIC)、フィールドプログラマブルゲートアレイ(FPGA)、デジタルシグナルプロセッサ(DSP)、ネットワークプロセッサ、または同様のものなどの1つまたは複数の専用処理デバイスであってもよい。処理デバイス2402は、本明細書で説明されているオペレーションおよびステップを実行する命令2422を実行するように構成される。 Processing device 2402 represents one or more general purpose processing devices such as a microprocessor, central processing unit, or the like. More specifically, the processing device implements a Complex Instruction Set Computing (CISC) microprocessor, Reduced Instruction Set Computing (RISC) microprocessor, Very Long Instruction Word (VLIW) microprocessor, or other instruction set. It can be a processor or a processor implementing a combination of instruction sets. Processing device 2402 may be one or more dedicated processing devices such as application specific integrated circuits (ASICs), field programmable gate arrays (FPGAs), digital signal processors (DSPs), network processors, or the like. good. Processing device 2402 is configured to execute instructions 2422 to perform the operations and steps described herein.

コンピュータシステム2400は、LAN、イントラネット、インターネット、および/またはエクストラネットに接続するためのネットワークインターフェースデバイス2408をさらに含んでもよい。コンピュータシステム2400は、ビデオディスプレイユニット2410(液晶ディスプレイ(LCD)または陰極線管(CRT)など)、英数字入力デバイス2412(キーボードなど)、カーソル制御デバイス2414(マウスなど)、信号発生デバイス2416(スピーカーなど)、およびグラフィックプロセッシングユニット2424(グラフィックスカードなど)も備え得る。 Computer system 2400 may further include a network interface device 2408 for connecting to LANs, intranets, the Internet, and/or extranets. Computer system 2400 includes a video display unit 2410 (such as a liquid crystal display (LCD) or cathode ray tube (CRT)), an alphanumeric input device 2412 (such as a keyboard), a cursor control device 2414 (such as a mouse), and a signal generation device 2416 (such as a speaker). ), and a graphics processing unit 2424 (such as a graphics card).

データストレージデバイス2418は、本明細書で説明されている方法または機能のうちの任意の1つまたは複数を使用する1つまたは複数の命令セットまたはソフトウェア2422が記憶されるマシン可読記憶媒体2428(コンピュータ可読媒体とも呼ばれる)であってよい。命令2422は、コンピュータシステム2400による実行中に完全にまたは少なくとも部分的にメインメモリ2404および/または処理デバイス2402内にも常駐するもものとしてよく、メインメモリ2404および処理デバイス2402もマシン可読媒体を構成する。 Data storage device 2418 includes machine-readable storage medium 2428 (computer readable storage medium 2428) in which is stored one or more sets of instructions or software 2422 for using any one or more of the methods or functions described herein. readable medium). The instructions 2422 may also reside wholly or at least partially in the main memory 2404 and/or the processing device 2402 during execution by the computer system 2400, which also constitute machine-readable media. do.

一実装形態において、命令2422は、治療ラインモジュール(図1の治療ラインモジュール120など)に対する命令および/または治療ラインモジュールとして機能する方法を含むソフトウェアライブラリを含む。命令2422は、記録調和モジュール122、間隔生成モジュール124、およびLoT割り当てモジュール126のための命令をさらに含み得る(図1の記録調和モジュール122、間隔生成モジュール124、およびLoT割り当てモジュール126など)。マシン可読記憶媒体2428は、単一の媒体であるものとして例示的な実装形態において示されているが、「マシン可読記憶媒体」という語は、1つまたは複数の命令セットを記憶する単一の媒体または複数の媒体(集中もしくは分散データベース、および/または関連するキャッシュおよびサーバなど)を含むものとして解釈されるべきである。「マシン可読記憶媒体」という語は、マシンによって実行される命令セットを記憶するか、または符号化することができ、本開示の方法のうちの任意の1つまたは複数をマシンに実行させる任意の媒体を含むものとしても解釈されるべきである。「マシン可読記憶媒体」という語は、限定はしないが、ソリッドステートメモリ、光媒体、および磁気媒体を含むものとしてしかるべく解釈されるものとする。「マシン可読記憶媒体」という用語は、マシン可読記憶媒体を一時的記憶媒体または一時的マシン可読記憶媒体として識別することによって別段の指定がなされていない限り信号などの一時的記憶媒体をしかるべく除外するものとする。 In one implementation, instructions 2422 comprise a software library containing instructions for and/or methods of functioning as a line of care module (such as line of care module 120 of FIG. 1). Instructions 2422 may further include instructions for record harmonization module 122, interval generation module 124, and LoT allocation module 126 (such as record harmonization module 122, interval generation module 124, and LoT allocation module 126 of FIG. 1). Although machine-readable storage medium 2428 is shown in exemplary implementations as being a single medium, the term "machine-readable storage medium" refers to a single medium that stores one or more instruction sets. It should be interpreted as including a medium or multiple mediums (such as centralized or distributed databases and/or associated caches and servers). The term "machine-readable storage medium" refers to any medium capable of storing or encoding a set of instructions to be executed by a machine and causing the machine to perform any one or more of the methods of this disclosure. should also be construed as including medium. The term "machine-readable storage medium" shall be construed accordingly to include, but not be limited to, solid state memory, optical media, and magnetic media. The term "machine-readable storage medium" shall accordingly exclude temporary storage media, such as signals, unless otherwise specified by identifying the machine-readable storage medium as a temporary storage medium or transitory machine-readable storage medium. It shall be.

別の実装形態において、仮想マシン2440は、記録調和モジュール122、間隔生成モジュール124、およびLoT割り当てモジュール126のための命令を実行するモジュールを備え得る。計算では、仮想マシン(VM)がコンピュータシステムのエミュレーションである。仮想マシンは、コンピュータアーキテクチャに基づいており、物理的コンピュータの機能を提供する。それらの実装形態は、専用ハードウェア、ソフトウェア、またはハードウェアとソフトウェアとの組み合わせを伴い得る。 In another implementation, virtual machine 2440 may comprise modules that execute instructions for record harmonization module 122 , interval generation module 124 , and LoT allocation module 126 . In computing, a virtual machine (VM) is an emulation of a computer system. A virtual machine is based on computer architecture and provides the functionality of a physical computer. These implementations may involve dedicated hardware, software, or a combination of hardware and software.

先行する詳細な説明のいくつかの部分は、コンピュータメモリ内のデータビットに対する演算のアルゴリズムおよび記号表現に関して提示されている。これらのアルゴリズムに関する説明および表現は、作業の内容を当業者に最も効果的に伝えるためにデータ処理の技術者によって使用される手段である。アルゴリズムは、本明細書では、また一般的に、望む結果をもたらす演算の自己矛盾のないシーケンスであることが企図される。これらの演算は、物理的量の物理的操作を必要とする演算である。通常、必ずというわけではないが、これらの量は、記憶され、組み合わされ、比較され、および他の何らかの形で操作されることができる電気的または磁気的信号の形態をとる。主に共通使用の理由から、これらの信号をビット、値、要素、記号、文字、語、数、または同様のものとして参照することがときには都合がよいことが実証されている。 Some portions of the preceding detailed description are presented in terms of algorithms and symbolic representations of operations on data bits within a computer memory. These algorithmic descriptions and representations are the means used by those skilled in the data processing arts to most effectively convey the substance of their work to others skilled in the art. An algorithm is contemplated herein, and generally, to be a self-consistent sequence of operations that yields a desired result. These operations are those requiring physical manipulations of physical quantities. Usually, though not necessarily, these quantities take the form of electrical or magnetic signals capable of being stored, combined, compared, and otherwise manipulated. It has proven convenient at times, principally for reasons of common usage, to refer to these signals as bits, values, elements, symbols, characters, terms, numbers, or the like.

しかしながら、これらおよび類似の語のすべては、適切な物理的量と関連付けられるべきであり、これらの量に付けられた都合のよいラベルにすぎないことを覚えておくべきである。上記の説明から明らかなように特に他で断りのない限り、説明全体を通して、「識別すること」または「提供すること」または「計算すること」または「決定すること」または同様の語句などの語を利用する記述は、コンピュータシステムのレジスタおよびメモリ内で物理的(電子的)量として表されているデータを操作し、コンピュータシステムのメモリまたはレジスタまたは他のそのような情報記憶デバイス内で物理的量として同様に表現される他のデータに変換するコンピュータシステム、または類似の電子コンピューティングデバイスのアクションおよびプロセスを指すことは理解される。 It should be remembered, however, that all of these and similar terms are to be associated with appropriate physical quantities and are merely convenient labels applied to these quantities. Throughout the description, words such as "identifying" or "providing" or "calculating" or "determining" or similar terms are used unless otherwise noted, as is clear from the description above. describes manipulating data represented as physical (electronic) quantities in computer system registers and memory; It is understood to refer to the actions and processes of a computer system, or similar electronic computing device, that transform other data similarly expressed as a quantity.

本開示は、本明細書のオペレーションを実行するための装置にも関係する。この装置は、意図された目的のために特別に制作されうるか、またはコンピュータに記憶されているコンピュータプログラムによって選択的にアクティブ化されるかもしくは再構成される1つもしくは複数の汎用コンピュータを備え得る。このようなコンピュータプログラムは、限定はしないが、フロッピィーディスク、光ディスク、CD-ROM、および光磁気ディスクを含む任意の種類のディスク、リードオンリーメモリ(ROM)、ランダムアクセスメモリ(RAM)、EPROM、EEPROM、磁気もしくは光カード、または電子的命令を記憶するのに適した任意の種類の媒体などのコンピュータ可読記憶媒体に記憶されるものとしよく、これらは各々コンピュータシステムバスに結合されている。 The present disclosure also relates to apparatus for performing the operations herein. This apparatus may be specially constructed for the intended purposes, or it may comprise one or more general purpose computers selectively activated or reconfigured by a computer program stored in the computers. . Such computer programs may be stored on any type of disk, including, but not limited to, floppy disks, optical disks, CD-ROMs, and magneto-optical disks, read-only memory (ROM), random-access memory (RAM), EPROM, EEPROM. , magnetic or optical cards, or any type of medium suitable for storing electronic instructions, each of which is coupled to the computer system bus.

本明細書で提示されているアルゴリズムおよび表示は、任意の特定のコンピュータまたは他の装置に本質的に関係しているわけではない。様々な汎用システムが、本明細書の教示に従ってプログラムとともに使用され得るか、または方法を実行するためにより専門化された装置を製作することが都合よいことが実証され得る。様々なこれらのシステムに対する構造は、以下の説明で述べられている通りに見える。それに加えて、本開示は、任意の特定のプログラミング言語を参照して説明されてはいない。本明細書で説明されているように本開示の教示を実装するために様々なプログラミング言語が使用され得ることは理解されるであろう。 The algorithms and displays presented herein are not inherently related to any particular computer or other apparatus. Various general-purpose systems may be used with programs in accordance with the teachings herein, or it may prove convenient to construct more specialized apparatus to perform the methods. The structure for a variety of these systems appears as set forth in the discussion below. Additionally, the present disclosure has not been described with reference to any particular programming language. It will be appreciated that a variety of programming languages may be used to implement the teachings of the disclosure as described herein.

本開示は、本開示に従ってプロセスを実行するようにコンピュータシステム(または他の電子デバイス)をプログラムするために使用され得る、命令が記憶されているマシン可読媒体を含むものとしてよい、コンピュータプログラム製品またはソフトウェアとして提供され得る。マシン可読記憶媒体は、マシン(コンピュータなど)によって読み込むことが可能な形式で情報を記憶するためのメカニズムを備える。たとえば、マシン可読(コンピュータ可読など)媒体は、リードオンリーメモリ(「ROM」)、ランダムアクセスメモリ(「RAM」)、磁気ディスク記憶媒体、光記憶媒体、フラッシュメモリデバイスなどのマシン(コンピュータなど) 可読記憶媒体を含む。 The present disclosure may include a computer program product or machine-readable medium having instructions stored thereon that may be used to program a computer system (or other electronic device) to perform processes in accordance with the present disclosure. It can be provided as software. A machine-readable storage medium provides any mechanism for storing information in a form readable by a machine (such as a computer). For example, a machine-readable (e.g., computer-readable) medium includes read-only memory ("ROM"), random-access memory ("RAM"), magnetic disk storage media, optical storage media, flash memory devices, etc. Including storage media.

上記明細書において、本開示の実装形態は、特定の例示的な実装形態を参照しつつ説明されている。次に示す請求項に規定されているような本開示の実装形態のより広い精神および範囲から逸脱することなくそれに対して様々な修正が行われ得ることは明白であろう。したがって、本明細書および図面は、制限的な意味ではなく例示的な意味で考慮されるべきである。 In the foregoing specification, implementations of the present disclosure have been described with reference to specific example implementations. It will be apparent that various modifications may be made thereto without departing from the broader spirit and scope of implementations of the disclosure as defined in the following claims. The specification and drawings are, accordingly, to be regarded in an illustrative rather than a restrictive sense.

100 コンピュータ実装システム
110 臨床健康記録
112 EMR
114 記録、情報
120 治療ラインモジュール
122 記録調和モジュール
124 間隔生成モジュール
126 治療ライン割り当てモジュール
150 治療ライン(LoT)ストア
160a~160n ウェブフォーム
160A~160N ウェブページ
165 グラフィカルユーザインターフェース(GUI)
170a~170n GUI、電子レポート
200 システム
300 記録調和モジュール
322 記録ホワイトリストおよび/または記録ブラックリストモジュール
324 記録関連付けモジュール
326 記録組み合わせモジュール
328 ヒューリスティック処理モジュール
400 間隔生成モジュール
422 診断関連性フィルタ
424 間隔日付割り当て
426 間隔日付インピュテーション
428 間隔日付延長
430 間隔日付セグメント化
500 間隔生成モジュール、治療ライン割り当てモジュール
522 LoT割り当て推定
524 LoT割り当て確率
526 LoT順位付け
528 LoTラベル付け
600 システム
605 薬剤フィルタリングモジュール
610 薬剤組み合わせモジュール
615 薬剤調和モジュール
620 調和された薬剤テーブル
625 原発性癌(PC)関連性フィルタ
630 日付パディング
635 PCキュレーションモデル
640 間隔生成
645 投薬間隔
650 転帰
655 モデル化されたLoT頻度
660 推定確率
665 LoTラベル付け
670 後処理LoT
705 臨床的洞察
710 モデルデータ準備段階
712 キュレーションされた進行および治療逸脱
714 患者投薬
716 モジュール
718 モデル化された日付および間隔
720 訓練段階
722 薬剤測定間隔頻度(w)
724 LoT分割割り当て
726 投薬頻度精緻化
730 モデルLoT割り当て段階
732 LoT生成段階
734 LoTラベル付け
802 一次診断
804 薬剤投与
806 転帰
808 トリプレット化学療法
810 ペメトレキセド/ベバシズマブ維持療法
812 進行性疾患転帰
814 ニボルマブ
816 進行性疾患転帰
818 ゲムシタビン療法
820 パクリタキセル
822 完全反応
824 デキサメタゾン投与
830a 間隔
830b 間隔
830c 間隔
830d 間隔
830e 間隔
930a 間隔
930b 間隔
930c 間隔
930d 間隔
1030a 間隔
1030b 間隔
1030c 間隔
1030d 間隔
1030e 間隔
1100 フロー
1200 フロー
1300 フロー
1400 サンキーダイアグラム
1500 無増悪生存率(PFS)グラフ
1510、1520、1530 治療ライン
1600 治療ライン編集ツール
1610 コントロール
1620 薬剤名、コントロール
1630 コントロール
1640 コントロール
1650 コントロール
1660 コントロール
1700 患者タイムライン
1800 ボックスプロット図
1900 LoT頻度
2000 LoT頻度
2100 LoT頻度
2200 LoT頻度
2300 棒グラフ図
2400 コンピュータシステム
2402 処理デバイス
2404 メインメモリ
2406 スタティックメモリ
2408 ネットワークインターフェースデバイス
2410 ビデオディスプレイユニット
2412 英数字入力デバイス
2414 カーソル制御デバイス
2416 信号発生デバイス
2418 データストレージデバイス
2422 命令セットまたはソフトウェア、命令
2424 グラフィックプロセッシングユニット
2428 マシン可読記憶媒体
2430 バス
2440 仮想マシン
100 computer implemented system
110 Clinical Health Record
112 EMRs
114 records, information
120 Therapeutic Line Module
122 Record Harmonization Module
124 interval generation module
126 Line of Treatment Assignment Module
150 Line of Treatment (LoT) Store
160a-160n web forms
160A~160N Web page
165 Graphical User Interface (GUI)
170a-170n GUI, electronic reporting
200 systems
300 Record Harmonization Module
322 recording whitelist and/or recording blacklist modules
324 Record Association Module
326 recording combination module
328 Heuristic Processing Module
400 interval generation module
422 Diagnostic Relevance Filter
424 interval date allocation
426 Interval Date Imputation
428 Interval Date Extension
430 interval date segmentation
500 interval generation module, treatment line assignment module
522 LoT Allocation Estimation
524 LoT allocation probability
526 LoT ranking
528 LoT Labeling
600 system
605 Drug Filtering Module
610 drug combination module
615 Drug Harmonization Module
620 Harmonized Drug Table
625 Primary Cancer (PC) Association Filter
630 date padding
635 PC Curation Model
640 interval generation
645 Dosing interval
650 Outcome
655 modeled LoT frequencies
660 estimated probability
665 LoT Labeling
670 Post Processing LoT
705 Clinical Insights
710 Model data preparation stage
712 Curated Progressions and Treatment Deviations
714 Patient Medication
716 modules
718 Modeled Dates and Intervals
720 training phase
722 drug measurement interval frequency (w)
724 LoT split allocation
726 Dosing Frequency Refinement
730 model LoT allocation stage
732 LoT generation stage
734 LoT Labeling
802 Primary Diagnosis
804 Drug Administration
806 Outcomes
808 triplet chemotherapy
810 Pemetrexed/bevacizumab maintenance therapy
812 Progressive disease outcome
814 Nivolumab
816 Progressive disease outcome
818 Gemcitabine therapy
820 Paclitaxel
822 complete response
824 Dexamethasone administration
830a spacing
830b interval
830c spacing
830d spacing
830e spacing
930a spacing
930b spacing
930c spacing
930d spacing
1030a spacing
1030b interval
1030c spacing
1030d spacing
1030e spacing
1100 flow
1200 flow
1300 flow
1400 Sankey diagram
1500 Progression Free Survival (PFS) Graph
1510, 1520, 1530 Lines of Treatment
1600 treatment line editing tools
1610 control
1620 drug name, control
1630 control
1640 control
1650 control
1660 control
1700 patient timeline
1800 boxplot chart
1900 LoT frequency
2000 LoT frequency
2100 LoT frequency
2200 LoT frequency
2300 bar chart chart
2400 computer system
2402 processing device
2404 main memory
2406 static memory
2408 network interface device
2410 Video Display Unit
2412 alphanumeric input device
2414 cursor control device
2416 signal generation device
2418 data storage device
2422 instruction set or software, instructions
2424 graphics processing unit
2428 machine-readable storage medium
2430 Bus
2440 virtual machines

Claims (30)

患者に同時投与される1つまたは複数の薬剤を治療ラインとしてラベル付けするための方法であって、
複数のデジタル記録から前記患者の医療記録を識別するステップであって、前記医療記録のサブセットは、前記患者の病状診断後の1つまたは複数の治療に関する前記患者の医療履歴を反映する、ステップと、
医療記録の前記サブセットから、前記患者に投与された少なくとも1つの薬剤と時間間隔とを含む複数の治療間隔を作成するステップと、
前記薬剤の前記投与が前記時間間隔内に収まるときに前記1つまたは複数の治療の薬剤をそれぞれの治療間隔に関連付けるステップと、
それぞれの治療間隔の前記時間間隔を、前記1つまたは複数の治療のうちの1つ治療が前記時間間隔から外れているが延長期間内にあるときに精緻化することであって、前記精緻化された時間間隔において、間隔優先事象が起こらない、精緻化するステップと、
教師なし人工知能エンジンを介して、前記複数の治療間隔から1つまたは複数の潜在的治療ラインを識別するステップであって、各潜在的治療ラインは、前記複数の治療間隔のうちの1つまたは複数、および最尤推定を含む、ステップと、
前記教師なし人工知能エンジンを介して、最高の最尤推定を有する前記潜在的治療ラインを前記治療ラインとしてラベル付けするステップとを含む方法。
A method for labeling one or more drugs co-administered to a patient as a line of therapy, comprising:
identifying the patient's medical records from a plurality of digital records, wherein the subset of medical records reflects the patient's medical history regarding one or more treatments after diagnosis of the patient's medical condition; ,
creating from the subset of medical records a plurality of treatment intervals comprising at least one drug administered to the patient and a time interval;
associating said one or more therapeutic agents with respective treatment intervals when said administration of said agent falls within said time interval;
refining the time interval of each treatment interval when one of the one or more treatments falls outside the time interval but within an extended period of time, said refining a refining step in which no interval precedence event occurs in the selected time interval;
identifying, via an unsupervised artificial intelligence engine, one or more potential treatment lines from the plurality of treatment intervals, each potential treatment line being one of the plurality of treatment intervals or steps, including multiple and maximum likelihood estimation;
labeling, via the unsupervised artificial intelligence engine, the potential treatment line with the highest maximum likelihood estimate as the treatment line.
前記教師なし人工知能エンジンを介して、連続する時間間隔において追加の潜在的治療ラインを、各先行する治療ラインの後に時系列的に発生し、各連続する時間間隔内の前記潜在的治療ラインの前記それぞれの最高の最尤推定を有する前記潜在的治療ラインから増分的に番号を振られた治療ラインとしてラベル付けするステップをさらに含む請求項1に記載の方法。 Via said unsupervised artificial intelligence engine, additional potential lines of treatment in successive time intervals are chronologically generated after each preceding line of treatment; 2. The method of claim 1, further comprising labeling treatment lines as incrementally numbered from said potential treatment lines having said respective highest maximum likelihood estimates. 前記教師なし人工知能エンジンを介して、複数の患者に対するそれぞれの増分的に番号を振られた治療ラインをラベル付けするステップと、
患者の複数のコホートを識別するステップと、
患者の前記複数のコホートの各々に対する前記増分的に番号を振られた治療ラインを報告するステップとをさらに含む請求項2に記載の方法。
labeling, via said unsupervised artificial intelligence engine, each incrementally numbered treatment line for a plurality of patients;
identifying multiple cohorts of patients;
and reporting the incrementally numbered lines of treatment for each of the plurality of cohorts of patients.
標準化された治療ガイドラインに対する施設規模のおよび医師固有のコンプライアンスを報告するステップをさらに含む請求項3に記載の方法。 4. The method of claim 3, further comprising reporting facility-wide and physician-specific compliance to standardized treatment guidelines. 少なくとも一部は各治療ラインの前記それぞれの時間間隔に基づき、経時的な治療ラインの変更を報告するステップをさらに含む請求項3に記載の方法。 4. The method of claim 3, further comprising reporting changes in treatment lines over time based at least in part on the respective time intervals for each treatment line. 患者の第1のコホートと患者の第2のコホートとの間の治療影響の差異に関する分析を報告するステップをさらに含み、コホートは、1つまたは複数の類似の治療日、治療ライン、診断、転帰、地理的位置、治療医師、治療施設、ゲノムマーカー、または臨床特性を有するものとして患者を識別する、請求項3に記載の方法。 further comprising reporting an analysis of differences in treatment impact between a first cohort of patients and a second cohort of patients, the cohorts having one or more similar treatment dates, lines of treatment, diagnoses, outcomes 4. The method of claim 3, wherein the patient is identified as having the , geographic location, treating physician, treatment facility, genomic marker, or clinical characteristic. 前記第1のコホートと前記第2のコホートとの間の無増悪生存率に関する分析を報告するステップをさらに含む請求項6に記載の方法。 7. The method of claim 6, further comprising reporting an analysis of progression-free survival between said first cohort and said second cohort. 共通する少なくとも1つのラベル付けされた治療ラインを有する患者の第1のコホートに対する無増悪生存曲線を生成するステップと、
共通する少なくとも1つの他のラベル付けされた治療ラインを有する患者の第2のコホートに対する無増悪生存曲線を生成するステップと、
前記第1のコホートおよび前記第2のコホートに対する前記無増悪生存曲線を同じ生存グラフ上に表示するステップとをさらに含む請求項3に記載の方法。
generating a progression-free survival curve for a first cohort of patients having at least one labeled line of therapy in common;
generating a progression-free survival curve for a second cohort of patients having at least one other labeled line of treatment in common;
4. The method of claim 3, further comprising displaying said progression-free survival curves for said first cohort and said second cohort on the same survival graph.
ラベル付けされた治療ラインは、薬剤名、治療ロールアップクラス、投与量、または投与方法のうちの1つもしくは複数を含む請求項8に記載の方法。 9. The method of claim 8, wherein the labeled therapeutic line includes one or more of drug name, therapeutic rollup class, dosage, or method of administration. レポートを生成するステップであって、前記レポートは前記患者および前記それぞれの時間間隔についてラベル付けされた各治療ラインを含む、ステップをさらに含む請求項1に記載の方法。 2. The method of claim 1, further comprising generating a report, said report including each treatment line labeled for said patient and said respective time interval. 病状診断は、癌、心臓病、うつ病、精神衛生、糖尿病、感染症、てんかん、皮膚科、および自己免疫疾患を含む請求項1に記載の方法。 2. The method of claim 1, wherein medical condition diagnosis includes cancer, heart disease, depression, mental health, diabetes, infectious diseases, epilepsy, dermatology, and autoimmune diseases. 前記病状診断は、癌である請求項1に記載の方法。 2. The method of claim 1, wherein the medical condition diagnosis is cancer. 前記複数のデジタル記録は、1つまたは複数のEHR医療記録、および1つまたは複数のキュレーションされた医療記録を含む請求項1に記載の方法。 2. The method of claim 1, wherein the plurality of digital records comprises one or more EHR medical records and one or more curated medical records. キュレーションされた医療記録は、前記1つまたは複数のEHR医療記録に含まれない記録の画像である請求項13に記載の方法。 14. The method of claim 13, wherein curated medical records are images of records not included in the one or more EHR medical records. 前記キュレーションされた医療記録を2値化し、光学的文字認識し、構造化形式に符号化することをさらに含む請求項13に記載の方法。 14. The method of claim 13, further comprising binarizing, optical character recognition, and encoding the curated medical records into a structured format. 治療識別子によって、前記患者に投与された治療と、前記治療が投与された投与日とを識別するステップをさらに含む請求項1に記載の方法。 2. The method of claim 1, further comprising identifying by a therapy identifier the therapy administered to the patient and the administration date on which the therapy was administered. 治療は、
薬剤、薬物、分子、または化学薬品の投与、
医療デバイスの植え込み、
医療デバイスの使用、
生物療法、ウイルス療法、ファージ療法、植物療法、遺伝子療法、エピジェネティック療法、タンパク質療法、酵素補充療法、ホルモン療法、細胞療法、免疫療法、抗体療法、栄養療法、電磁放射線療法、もしくは放射線療法の使用、
外科的手技、または
放射線外科手術
のうちの1つまたは複数を含む請求項1に記載の方法。
treatment is
administration of drugs, drugs, molecules, or chemicals;
implanting medical devices,
use of medical devices;
Use of biotherapy, virus therapy, phage therapy, plant therapy, gene therapy, epigenetic therapy, protein therapy, enzyme replacement therapy, hormone therapy, cell therapy, immunotherapy, antibody therapy, nutritional therapy, electromagnetic radiation therapy, or radiotherapy ,
2. The method of claim 1, comprising one or more of: a surgical procedure; or radiosurgery.
患者に同時投与される1つまたは複数の薬剤を治療ラインとしてラベル付けするためのシステムであって、
少なくとも1つのプロセッサを有する少なくとも1つのコンピュータであって、前記プロセッサは
複数のデジタル記録から前記患者の医療記録を識別することであって、前記医療記録のサブセットは、前記患者の病状診断後の1つまたは複数の治療に関する前記患者の医療履歴を反映する、識別することと
医療記録の前記サブセットから、前記患者に投与された少なくとも1つの薬剤と時間間隔とを含む複数の治療間隔を作成することと、
前記薬剤の前記投与が前記時間間隔内に収まるときに前記1つまたは複数の治療の薬剤をそれぞれの治療間隔に関連付けることと、
それぞれの治療間隔の前記時間間隔を、前記1つまたは複数の治療のうちの1つ治療が前記時間間隔から外れているが延長期間内にあるときに精緻化することであって、前記精緻化された時間間隔において、間隔優先事象が起こらない、精緻化することとを行うようにプログラムされた、少なくとも1つのコンピュータを備え、
前記少なくとも1つのコンピュータは教師なし人工知能エンジンを含み、前記教師なし人工知能エンジンは
前記複数の治療間隔から1つまたは複数の潜在的治療ラインを識別することであって、各潜在的治療ラインは、前記複数の治療間隔のうちの1つまたは複数、および最尤推定を含む、識別することと、
最高の最尤推定を有する前記潜在的治療ラインを前記治療ラインとしてラベル付けすることとを行うようにプログラムされている、システム。
1. A system for labeling one or more agents co-administered to a patient as lines of therapy, comprising:
1. At least one computer having at least one processor, said processor for identifying said patient's medical record from a plurality of digital records, said subset of said medical records being one post-diagnosis of said patient's medical condition. identifying, reflecting the patient's medical history regarding one or more treatments; and creating, from the subset of medical records, a plurality of treatment intervals including at least one drug administered to the patient and a time interval. When,
associating the one or more therapeutic agents with respective treatment intervals when the administration of the agent falls within the time interval;
refining the time interval of each treatment interval when one of the one or more treatments falls outside the time interval but within an extended period of time, said refining at least one computer programmed to refine, wherein no interval precedence event occurs in a set time interval;
The at least one computer includes an unsupervised artificial intelligence engine, the unsupervised artificial intelligence engine to identify one or more potential treatment lines from the plurality of treatment intervals, each potential treatment line comprising: , one or more of the plurality of treatment intervals, and maximum likelihood estimation;
and labeling said potential treatment line with the highest maximum likelihood estimate as said treatment line.
前記教師なし人工知能エンジンは、連続する時間間隔において追加の潜在的治療ラインを、各先行する治療ラインの後に時系列的に発生し、各連続する時間間隔内の前記潜在的治療ラインの前記それぞれの最高の最尤推定を有する前記潜在的治療ラインから増分的に番号を振られた治療ラインとしてラベル付けするようにプログラムされる請求項18に記載のシステム。 The unsupervised artificial intelligence engine chronologically generates additional potential lines of treatment in successive time intervals after each preceding line of treatment; 19. The system of claim 18, programmed to label as the treatment line numbered incrementally from the potential treatment line having the highest maximum likelihood estimate of . 前記教師なし人工知能エンジンは、
複数の患者に対するそれぞれの増分的に番号を振られた治療ラインをラベル付けし、
患者の複数のコホートを識別し、
患者の前記複数のコホートの各々に対する前記増分的に番号を振られた治療ラインを報告するようにプログラムされる請求項19に記載のシステム。
The unsupervised artificial intelligence engine includes:
labeling each incrementally numbered line of treatment for multiple patients;
identify multiple cohorts of patients,
20. The system of claim 19, programmed to report the incrementally numbered lines of treatment for each of the plurality of cohorts of patients.
前記少なくとも1つのコンピュータは、
標準化された治療ガイドラインに対する施設規模のおよび医師固有のコンプライアンスを報告するようにさらにプログラムされる請求項20に記載のシステム。
The at least one computer is
21. The system of claim 20, further programmed to report facility-wide and physician-specific compliance to standardized treatment guidelines.
前記少なくとも1つのコンピュータは、
少なくとも一部は各治療ラインの前記それぞれの時間間隔に基づき、経時的な治療ラインの変更を報告するようにプログラムされる請求項20に記載のシステム。
The at least one computer is
21. The system of claim 20, programmed to report changes in treatment lines over time based at least in part on the respective time intervals for each treatment line.
前記少なくとも1つのコンピュータは、
患者の第1のコホートと患者の第2のコホートとの間の治療影響の差異に関する分析を報告するようにさらにプログラムされ、コホートは、1つまたは複数の類似の治療日、治療ライン、診断、転帰、地理的位置、治療医師、治療施設、ゲノムマーカー、または臨床特性を有するものとして患者を識別する、請求項20に記載のシステム。
The at least one computer is
further programmed to report an analysis of differences in treatment impact between a first cohort of patients and a second cohort of patients, wherein the cohorts are classified according to one or more similar treatment dates, treatment lines, diagnoses, 21. The system of claim 20, wherein the patient is identified as having an outcome, geographic location, treating physician, treatment facility, genomic marker, or clinical characteristic.
前記少なくとも1つのコンピュータは、
前記第1のコホートと前記第2のコホートとの間の無増悪生存率に関する分析を報告するようにさらにプログラムされる請求項23に記載のシステム。
The at least one computer is
24. The system of claim 23, further programmed to report an analysis of progression-free survival between said first cohort and said second cohort.
前記少なくとも1つのコンピュータは、
共通する少なくとも1つのラベル付けされた治療ラインを有する患者の第1のコホートに対する無増悪生存曲線を生成し、
共通する少なくとも1つの他のラベル付けされた治療ラインを有する患者の第2のコホートに対する無増悪生存曲線を生成し、
前記第1のコホートおよび前記第2のコホートに対する前記無増悪生存曲線を同じ生存グラフ上に表示するようにさらにプログラムされる請求項20に記載のシステム。
The at least one computer is
generating a progression-free survival curve for a first cohort of patients having at least one labeled line of therapy in common;
generating a progression-free survival curve for a second cohort of patients having at least one other labeled line of treatment in common;
21. The system of claim 20, further programmed to display said progression-free survival curves for said first cohort and said second cohort on the same survival graph.
ラベル付けされた治療ラインは、
薬剤名、治療ロールアップクラス、投与量、または投与方法のうちの1つまたは複数を含む請求項25に記載のシステム。
The labeled lines of treatment are
26. The system of claim 25, comprising one or more of drug name, therapeutic rollup class, dosage, or method of administration.
病状診断は、癌、心臓病、うつ病、精神衛生、糖尿病、感染症、てんかん、皮膚科、および自己免疫疾患を含む請求項18に記載のシステム。 19. The system of claim 18, wherein medical condition diagnoses include cancer, heart disease, depression, mental health, diabetes, infectious diseases, epilepsy, dermatology, and autoimmune diseases. 前記複数のデジタル記録は、1つまたは複数のEHR医療記録、および1つまたは複数のキュレーションされた医療記録を含む請求項18に記載のシステム。 19. The system of claim 18, wherein the plurality of digital records includes one or more EHR medical records and one or more curated medical records. 前記少なくとも1つのコンピュータは、
前記キュレーションされた医療記録を2値化し、光学的文字認識し、構造化形式に符号化するようにさらにプログラムされる請求項28に記載のシステム。
The at least one computer is
29. The system of claim 28, further programmed to binarize, optical character recognize, and encode the curated medical records into a structured format.
治療は、
薬剤、薬物、分子、もしくは化学薬品の投与、
医療デバイスの植え込み、
医療デバイスの使用、
生物療法、ウイルス療法、ファージ療法、植物療法、遺伝子療法、エピジェネティック療法、タンパク質療法、酵素補充療法、ホルモン療法、細胞療法、免疫療法、抗体療法、栄養療法、電磁放射線療法、もしくは放射線療法の使用、
外科的手技、または
放射線外科
のうちの1つもしくは複数を含む請求項18に記載のシステム。
treatment is
administration of drugs, drugs, molecules, or chemicals;
implanting medical devices,
use of medical devices;
Use of biotherapy, virus therapy, phage therapy, plant therapy, gene therapy, epigenetic therapy, protein therapy, enzyme replacement therapy, hormone therapy, cell therapy, immunotherapy, antibody therapy, nutritional therapy, electromagnetic radiation therapy, or radiotherapy ,
19. The system of claim 18, comprising one or more of: a surgical procedure; or radiosurgery.
JP2022511315A 2019-08-22 2020-08-24 Unsupervised Learning and Treatment Line Prediction from High-Dimensional Time Series Drug Data Pending JP2022545017A (en)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US201962890178P 2019-08-22 2019-08-22
US62/890,178 2019-08-22
PCT/US2020/047704 WO2021035224A1 (en) 2019-08-22 2020-08-24 Unsupervised learning and prediction of lines of therapy from high-dimensional longitudinal medications data

Publications (2)

Publication Number Publication Date
JP2022545017A true JP2022545017A (en) 2022-10-24
JPWO2021035224A5 JPWO2021035224A5 (en) 2023-09-01

Family

ID=74645903

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2022511315A Pending JP2022545017A (en) 2019-08-22 2020-08-24 Unsupervised Learning and Treatment Line Prediction from High-Dimensional Time Series Drug Data

Country Status (6)

Country Link
US (2) US11295841B2 (en)
EP (1) EP4018282A4 (en)
JP (1) JP2022545017A (en)
AU (1) AU2020332939A1 (en)
CA (1) CA3149504A1 (en)
WO (1) WO2021035224A1 (en)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11613783B2 (en) 2020-12-31 2023-03-28 Tempus Labs, Inc. Systems and methods for detecting multi-molecule biomarkers
EP4275208A1 (en) 2021-01-07 2023-11-15 Tempus Labs, Inc. Systems and methods for joint low-coverage whole genome sequencing and whole exome sequencing inference of copy number variation for clinical diagnostics
WO2022159774A2 (en) 2021-01-21 2022-07-28 Tempus Labs, Inc. METHODS AND SYSTEMS FOR mRNA BOUNDARY ANALYSIS IN NEXT GENERATION SEQUENCING
CN112951423B (en) * 2021-03-02 2023-08-29 华中科技大学同济医学院附属协和医院 Risk prediction model for adverse reaction after pemetrexed chemotherapy and construction method thereof
US11282609B1 (en) * 2021-06-13 2022-03-22 Chorus Health Inc. Modular data system for processing multimodal data and enabling parallel recommendation system processing
US20230144221A1 (en) 2021-10-11 2023-05-11 Tempus Labs, Inc. Methods and systems for detecting alternative splicing in sequencing data
WO2023091316A1 (en) 2021-11-19 2023-05-25 Tempus Labs, Inc. Methods and systems for accurate genotyping of repeat polymorphisms
EP4239647A1 (en) 2022-03-03 2023-09-06 Tempus Labs, Inc. Systems and methods for deep orthogonal fusion for multimodal prognostic biomarker discovery

Family Cites Families (57)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5660176A (en) * 1993-12-29 1997-08-26 First Opinion Corporation Computerized medical diagnostic and treatment advice system
US6804656B1 (en) 1999-06-23 2004-10-12 Visicu, Inc. System and method for providing continuous, expert network critical care services from a remote location(s)
US6564105B2 (en) 2000-01-21 2003-05-13 Medtronic Minimed, Inc. Method and apparatus for communicating between an ambulatory medical device and a control device via telemetry using randomized data
US20050170528A1 (en) 2002-10-24 2005-08-04 Mike West Binary prediction tree modeling with many predictors and its uses in clinical and genomic applications
US7490085B2 (en) * 2002-12-18 2009-02-10 Ge Medical Systems Global Technology Company, Llc Computer-assisted data processing system and method incorporating automated learning
US20070005621A1 (en) 2005-06-01 2007-01-04 Lesh Kathryn A Information system using healthcare ontology
US20070219824A1 (en) * 2006-03-17 2007-09-20 Jean Rawlings System and method for identifying and analyzing patterns or aberrations in healthcare claims
US20080195600A1 (en) 2006-05-25 2008-08-14 Deakter Daniel R Efficient method and process to search structured and unstructured patient data to match patients to clinical drug/device trials
US8699664B2 (en) * 2006-07-27 2014-04-15 British Columbia Center Agency Branch Systems and methods for optimization of on-line adaptive radiation therapy
US20080301129A1 (en) 2007-06-04 2008-12-04 Milward David R Extracting and displaying compact and sorted results from queries over unstructured or semi-structured text
WO2009099602A1 (en) 2008-02-04 2009-08-13 Massachusetts Institute Of Technology Selection of nucleic acids by solution hybridization to oligonucleotide baits
US8838628B2 (en) 2009-04-24 2014-09-16 Bonnie Berger Leighton Intelligent search tool for answering clinical queries
US20110288877A1 (en) 2009-11-09 2011-11-24 dbMotion Ltd. Health Information Exchange and Integration System and Methods Useful in Conjunction Therewith
US9542647B1 (en) 2009-12-16 2017-01-10 Board Of Regents, The University Of Texas System Method and system for an ontology, including a representation of unified medical language system (UMLS) using simple knowledge organization system (SKOS)
US20110255789A1 (en) * 2010-01-15 2011-10-20 Copanion, Inc. Systems and methods for automatically extracting data from electronic documents containing multiple layout features
US9208217B2 (en) 2010-10-06 2015-12-08 Linguamatics Ltd. Providing users with a preview of text mining results from queries over unstructured or semi-structured text
US8346804B2 (en) 2010-11-03 2013-01-01 General Electric Company Systems, methods, and apparatus for computer-assisted full medical code scheme to code scheme mapping
US9626650B2 (en) 2011-04-14 2017-04-18 Elwha Llc Cost-effective resource apportionment technologies suitable for facilitating therapies
US20130172774A1 (en) * 2011-07-01 2013-07-04 Neuropace, Inc. Systems and Methods for Assessing the Effectiveness of a Therapy Including a Drug Regimen Using an Implantable Medical Device
WO2013025561A1 (en) 2011-08-12 2013-02-21 Dnanexus Inc Sequence read archive interface
US20130096947A1 (en) 2011-10-13 2013-04-18 The Board of Trustees of the Leland Stanford Junior, University Method and System for Ontology Based Analytics
US10318635B2 (en) 2012-09-28 2019-06-11 Cerner Innovation, Inc. Automated mapping of service codes in healthcare systems
US9594872B2 (en) 2012-10-25 2017-03-14 Intelligent Medical Objects, Inc. Method and system for concept-based terminology management
WO2014100509A1 (en) 2012-12-20 2014-06-26 Dnanexus Inc Application programming interface for tabular genomic datasets
US20140249761A1 (en) 2013-03-01 2014-09-04 DNANEXUS, Inc. Characterizing uncharacterized genetic mutations
US9129013B2 (en) 2013-03-12 2015-09-08 Nuance Communications, Inc. Methods and apparatus for entity detection
US20150324527A1 (en) 2013-03-15 2015-11-12 Northrop Grumman Systems Corporation Learning health systems and methods
US20140278461A1 (en) 2013-03-15 2014-09-18 Memorial Sloan-Kettering Cancer Center System and method for integrating a medical sequencing apparatus and laboratory system into a medical facility
US20140365242A1 (en) 2013-06-07 2014-12-11 Siemens Medical Solutions Usa, Inc. Integration of Multiple Input Data Streams to Create Structured Data
US20150178386A1 (en) 2013-12-19 2015-06-25 Heiner Oberkampf System and Method for Extracting Measurement-Entity Relations
WO2015116344A1 (en) 2014-01-30 2015-08-06 Systemedical Llc Methods, devices, and systems for multi-format data aggregation
US11625424B2 (en) 2014-04-24 2023-04-11 Semantic Technologies Pty Ltd. Ontology aligner method, semantic matching method and apparatus
US10755369B2 (en) 2014-07-16 2020-08-25 Parkland Center For Clinical Innovation Client management tool system and method
WO2016094330A2 (en) * 2014-12-08 2016-06-16 20/20 Genesystems, Inc Methods and machine learning systems for predicting the liklihood or risk of having cancer
US20160196394A1 (en) * 2015-01-07 2016-07-07 Amino, Inc. Entity cohort discovery and entity profiling
EP3164063A4 (en) 2015-04-21 2018-03-28 Medaware Ltd. Medical system and method for predicting future outcomes of patient care
WO2016184498A1 (en) 2015-05-18 2016-11-24 Hewlett-Packard Development Company, L.P. Automated entity-resolution methods and systems
US10878010B2 (en) 2015-10-19 2020-12-29 Intelligent Medical Objects, Inc. System and method for clinical trial candidate matching
US20170177822A1 (en) 2015-12-18 2017-06-22 Pointright Inc. Systems and methods for providing personalized prognostic profiles
US9424532B1 (en) 2015-12-21 2016-08-23 International Business Machines Corporation Machine training and search engine for providing specialized cognitive healthcare apparatus
US20170177597A1 (en) 2015-12-22 2017-06-22 DNANEXUS, Inc. Biological data systems
EP3414693A4 (en) 2016-02-09 2019-10-30 TOMA Biosciences, Inc. Systems and methods for analyzing nucelic acids
US20170237805A1 (en) 2016-02-12 2017-08-17 DNANEXUS, Inc. Worker reuse deadline
PT3478286T (en) * 2016-06-29 2024-01-31 Tesaro Inc Methods of treating ovarian cancer
US10755804B2 (en) 2016-08-10 2020-08-25 Talix, Inc. Health information system for searching, analyzing and annotating patient data
US11288591B2 (en) 2016-08-23 2022-03-29 Microsoft Technology Licensing, Llc Per-article personalized models for recommending content email digests with personalized candidate article pools
US10878962B2 (en) 2016-11-02 2020-12-29 COTA, Inc. System and method for extracting oncological information of prognostic significance from natural language
US20180373844A1 (en) 2017-06-23 2018-12-27 Nuance Communications, Inc. Computer assisted coding systems and methods
US11488713B2 (en) 2017-08-15 2022-11-01 Computer Technology Associates, Inc. Disease specific ontology-guided rule engine and machine learning for enhanced critical care decision support
US20190108912A1 (en) 2017-10-05 2019-04-11 Iquity, Inc. Methods for predicting or detecting disease
US10593423B2 (en) 2017-12-28 2020-03-17 International Business Machines Corporation Classifying medically relevant phrases from a patient's electronic medical records into relevant categories
EP3818496A4 (en) 2018-07-02 2022-04-20 Tempus Labs, Inc. 3d radiomic platform for imaging biomarker development
SG11202100344WA (en) 2018-07-23 2021-02-25 Guardant Health Inc Methods and systems for adjusting tumor mutational burden by tumor fraction and coverage
WO2020081607A1 (en) 2018-10-15 2020-04-23 Tempus Labs, Inc. Microsatellite instability determination system and related methods
US10395772B1 (en) * 2018-10-17 2019-08-27 Tempus Labs Mobile supplementation, extraction, and analysis of health records
US10957433B2 (en) * 2018-12-03 2021-03-23 Tempus Labs, Inc. Clinical concept identification, extraction, and prediction system and related methods
US11676719B2 (en) 2018-12-20 2023-06-13 Oregon Health & Science University Subtyping heterogeneous disorders using functional random forest models

Also Published As

Publication number Publication date
WO2021035224A1 (en) 2021-02-25
AU2020332939A1 (en) 2022-03-24
US20220189600A1 (en) 2022-06-16
EP4018282A4 (en) 2023-08-16
US11295841B2 (en) 2022-04-05
CA3149504A1 (en) 2021-02-25
EP4018282A1 (en) 2022-06-29
US20210057071A1 (en) 2021-02-25

Similar Documents

Publication Publication Date Title
US11037685B2 (en) Method and process for predicting and analyzing patient cohort response, progression, and survival
US11295841B2 (en) Unsupervised learning and prediction of lines of therapy from high-dimensional longitudinal medications data
US11798689B2 (en) Generating customizable personal healthcare treatment plans
US20200381087A1 (en) Systems and methods of clinical trial evaluation
US11295867B2 (en) Generating and applying subject event timelines
US20220319652A1 (en) Systems and Methods for Interrogating Clinical Documents for Characteristic Data
US11715565B2 (en) Evaluating effect of event on condition using propensity scoring
US20220059240A1 (en) Method and process for predicting and analyzing patient cohort response, progression, and survival
US20220044826A1 (en) Method and process for predicting and analyzing patient cohort response, progression, and survival
Beesley et al. EM algorithms for fitting multistate cure models
US11640859B2 (en) Data based cancer research and treatment systems and methods
WO2020081795A1 (en) Data based cancer research and treatment systems and methods
US20230187074A1 (en) Method and process for predicting and analyzing patient cohort response, progression, and survival
García S et al. The challenge of managing the evolution of genomics data over time: a conceptual model-based approach
Pandey et al. Risk Assessment in the Field of Oncology Using Big Data
EP4307315A1 (en) Machine learning predictive models of treatment response
US20230245788A1 (en) Data based cancer research and treatment systems and methods
EP4287212A1 (en) Machine learning predictive models of treatment response
Bairagee et al. Big Data as a Source of Innovation for Disease Diagnosis
Chan CoSMIC: Colorectal cancer and synchronous liver-limited metastases: an inception cohort and qualitative study
Chen Comparison of natural language processing algorithms for medical texts
Manilich Hereditary Colorectal Cancer: Information-Based Approach

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230824

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20230824