JP2021527874A - 生存イベントのジョイントモデリングによる潜在的ながん治療標的の決定 - Google Patents

生存イベントのジョイントモデリングによる潜在的ながん治療標的の決定 Download PDF

Info

Publication number
JP2021527874A
JP2021527874A JP2020568811A JP2020568811A JP2021527874A JP 2021527874 A JP2021527874 A JP 2021527874A JP 2020568811 A JP2020568811 A JP 2020568811A JP 2020568811 A JP2020568811 A JP 2020568811A JP 2021527874 A JP2021527874 A JP 2021527874A
Authority
JP
Japan
Prior art keywords
cancer
active genetic
component
different types
genetic factors
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2020568811A
Other languages
English (en)
Other versions
JP7332173B2 (ja
Inventor
サン、ジャオナン
シャン、ザカリー
チャン、ピング
ワン、フェイ
ヒュー、ジャニング
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of JP2021527874A publication Critical patent/JP2021527874A/ja
Application granted granted Critical
Publication of JP7332173B2 publication Critical patent/JP7332173B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B5/00ICT specially adapted for modelling or simulations in systems biology, e.g. gene-regulatory networks, protein interaction networks or metabolic networks
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B20/00ICT specially adapted for functional genomics or proteomics, e.g. genotype-phenotype associations
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16BBIOINFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR GENETIC OR PROTEIN-RELATED DATA PROCESSING IN COMPUTATIONAL MOLECULAR BIOLOGY
    • G16B40/00ICT specially adapted for biostatistics; ICT specially adapted for bioinformatics-related machine learning or data mining, e.g. knowledge discovery or pattern finding
    • G16B40/20Supervised data analysis
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H10/00ICT specially adapted for the handling or processing of patient-related medical or healthcare data
    • G16H10/60ICT specially adapted for the handling or processing of patient-related medical or healthcare data for patient-specific data, e.g. for electronic patient records
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H20/00ICT specially adapted for therapies or health-improving plans, e.g. for handling prescriptions, for steering therapy or for monitoring patient compliance
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/20ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for computer-aided diagnosis, e.g. based on medical expert systems
    • GPHYSICS
    • G16INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR SPECIFIC APPLICATION FIELDS
    • G16HHEALTHCARE INFORMATICS, i.e. INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR THE HANDLING OR PROCESSING OF MEDICAL OR HEALTHCARE DATA
    • G16H50/00ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics
    • G16H50/30ICT specially adapted for medical diagnosis, medical simulation or medical data mining; ICT specially adapted for detecting, monitoring or modelling epidemics or pandemics for calculating health indices; for individual health risk assessment

Abstract

がん生存イベントのジョイントモデリングによって潜在的ながん遺伝子治療標的を決定するためのコンピュータ実装方法は、異なる種類のがんにそれぞれ関連付けられる活性遺伝因子を、異なる種類のがんをそれぞれ生き延びた患者群のがん生存データ及び患者ゲノムデータに基づいて判定するために、プロセッサに動作可能に結合されたデバイスによってマルチタスク学習モデルを使用することを含む。コンピュータ実装方法はさらに、デバイスによって、異なる種類のがんの2種類以上のがんの間で共有される活性遺伝因子の共通活性遺伝因子を判定することを含む。

Description

本出願は、実世界の患者の生存イベントのジョイントモデリング(joint modeling)によって、潜在的ながん治療標的を系統的に決定する技術に関する。
以下では、本発明の1つ又は複数の実施形態の基本的な理解を提供するための概要を提示する。この概要は、重要又は決定的な要素を特定することを意図したものでもなく、異なる実施形態のいずれかの範囲又は請求項のいずれかの範囲を規定することを意図したものでもない。その唯一の目的は、後に提示されるより詳細な説明の前段として、概念を簡略化した形で提示することである。本明細書に記載される1つ又は複数の実施形態において、実世界の患者生存イベントのジョイントモデリングによって潜在的ながん治療標的を系統的に決定するための技術を提供するシステム、コンピュータ実装方法、装置、もしくはコンピュータプログラム製品又はそれらの組合せが提示される。
本発明の実施形態によれば、システムは、コンピュータ実行可能コンポーネントを格納するメモリと、メモリに格納されたコンピュータ実行可能コンポーネントを実行するプロセッサとを含むことができる。コンピュータ実行可能コンポーネントは、マルチタスク学習モデルを用いて、異なる種類のがんをそれぞれ生き延びた患者群についてのがん生存データ及び患者ゲノムデータを評価して、異なる種類のがんにそれぞれ関連付けられる活性遺伝因子を同定する、活性遺伝因子同定コンポーネントを含むことができる。コンピュータ実行可能コンポーネントはさらに、異なる種類のがんの2種類以上のがんの間で共有される活性遺伝因子の共通活性遺伝因子を判定する疾患関連性コンポーネントを含むことができる。いくつかの実施形態において、システムは、マルチタスク学習モデルの機能として、活性遺伝因子と活性遺伝因子がそれぞれ関連付けられる異なる種類のがんとの間の関連度をそれぞれ表す活性遺伝因子のスコアを決定する、スコア付けコンポーネントをさらに含むことができる。システムはまた、活性遺伝因子のうちの1つ又は複数の活性遺伝因子を、1つ又は複数の活性遺伝因子にそれぞれ関連付けられたスコアに基づいて遺伝子治療標的として選択する、選択コンポーネントを含むことができる。
いくつかの実施形態において、マルチタスク学習モデルは、異なる種類のがんにそれぞれ関連付けられる活性遺伝因子を判定する複数のタスクを最適化問題としてモデル化する。これらの実施形態では、疾患関連性コンポーネントは、異なる種類のがんのサブセット間の関係を表す関係パラメータを、サブセットに含まれるそれぞれの種類のがんの間で共有される共通活性遺伝因子の数に基づいて決定することができる。いくつかの実装において、関係パラメータは、サブセットに含まれるそれぞれの種類のがんの間で共有される共通活性遺伝因子の数に基づいて決定された、サブセットの関連性スコアを含むことができ、ここで関連性スコアは、それぞれの種類のがんが関係している度合いを反映する。システムは、関係パラメータに基づいてマルチタスク学習モデルを更新し、それによって更新されたマルチタスク学習モデルを生成する最適化コンポーネントであって、活性遺伝因子同定コンポーネントに対して、更新されたマルチタスク学習モデルを使用してがん生存データ及び患者ゲノムデータに基づいて異なる種類のがんにそれぞれ関連付けられる更新された活性遺伝因子を同定するよう指示する最適化コンポーネントをさらに含むことができる。いくつかの実施形態において、疾患関連性コンポーネントは、異なる種類のがんのサブセット間の歴史的(historical)関係を表す、異なる種類のがんについての歴史的疾患関連性情報を評価することができる。これらの実施形態では、最適化コンポーネントは、歴史的疾患関連性パラメータ及び関係パラメータの両方を用いて、マルチタスク学習モデルを更新することができる。
いくつかの実施形態において、開示されたシステムに関して説明される要素は、コンピュータ実装方法、コンピュータプログラム製品、又は別の形態などの異なる形態で具体化することができる。
開示された主題の1つ又は複数の実施形態に従って、実世界の患者生存イベントのジョイントモデリングによって潜在的ながん治療標的を系統的に決定することを容易にする、例示的かつ非限定的システムのブロック図を示す。 開示された主題の1つ又は複数の実施形態に従って、がん種ごとに活性遺伝因子の関連性を同定する情報を含む、例示的かつ非限定的な表を示す。 開示された主題の1つ又は複数の実施形態に従って、異なるがん種について同定された活性遺伝因子を同定及びスコア付けする情報を含む、例示的かつ非限定的は表を示す。 開示された主題の1つ又は複数の実施形態に従って、異なるがん種間の関連性の関係を同定及びスコア付けする情報を含む、例示的かつ非限定的な表を示す。 開示された主題の1つ又は複数の実施形態に従って、実世界の患者生存イベントのジョイントモデリングによって潜在的ながん治療標的を決定するための例示的なコンピュータ実装プロセスの高水準フロー図を提供する。 開示された主題の1つ又は複数の実施形態に従って、実世界の患者生存イベントのジョイントモデリングによって潜在的ながん治療標的を系統的に決定することを容易にする、別の例示的な非限定的システムのブロック図を示す。 開示された主題の1つ又は複数の実施形態に従って、実世界の患者生存イベントのジョイントモデリングによって潜在的ながん治療標的を決定するための別の例示的なコンピュータ実装プロセスの高水準フロー図を提供する。 開示された主題の1つ又は複数の実施形態に従った、マルチタスク生存分析フレームワークの例示的な実装を示す。 開示された主題の1つ又は複数の実施形態に従って、実世界の患者生存イベントのジョイントモデリングによって潜在的ながん治療標的を系統的に決定することを容易にする、別の例示的な非限定的システムのブロック図を示す。 開示された主題の1つ又は複数の実施形態に従って、実世界の患者生存イベントのジョイントモデリングによって潜在的ながん治療標的を決定するための別の例示的なコンピュータ実装プロセスの高水準フロー図を提供する。 開示された主題の1つ又は複数の実施形態に従って、実世界の患者生存イベントのジョイントモデリングによって潜在的ながん治療標的を決定するための別の例示的なコンピュータ実装プロセスの高水準フロー図を提供する。 本明細書に記載の1つ又は複数の実施形態を容易にすることができる例示的かつ非限定的な動作環境のブロック図を示す。
以下の詳細な説明は、単に例示的なものであり、実施形態、もしくは実施形態の適用又は使用、又はその両方を制限することを意図するものではない。さらに、前記の概要セクション又は詳細な説明セクションで提示される明示的又は暗示的な情報に拘束されることを意図するものではない。
がんは、細胞の異常増殖であり、その近因は、正常な生理学的な抑制均衡システム(checks and balances system)を破壊する、細胞の増殖と死滅との不均衡である。がんは、様々な遺伝子の変化のうちの1つ又は複数によって引き起こされる。遺伝子治療は、生細胞に遺伝物質(例えば、デオキシリボ核酸(DNA)、リボ核酸(RNA)など)を導入することを試みる治療法の一形態である。特定の種類のがんを対象とした遺伝子治療を研究する数多くの臨床試験が行われており、新しいタイプの遺伝子治療法が継続的に開発されている。遺伝子治療は有望ながん治療技術であるが、現在のがん遺伝子治療の開発プロセスは、高コストで手間のかかるインビトロ(in−vitro)及びインビボ(in−vivo)の臨床実験と前臨床動物モデルとを組み合わせたものに基づく。
本開示は、実世界の患者の生存イベントのジョイントモデリングによって潜在的ながん遺伝子治療標的を系統的に決定するためのシステム、コンピュータ実装方法、装置もしくはコンピュータプログラム製品又はそれらの組合せを提供する。同定された潜在的ながん遺伝子治療標的は、特定の種類のがんとの高い関連性を示す遺伝因子のみならず複数の種類のがんと高度に関連付けられる遺伝因子を含むことができる。結果として、高コストの臨床遺伝子治療の開発を、比較的高い有効性の可能性を有する遺伝子治療、もしくは複数の種類のがんに適用可能な遺伝子治療、又はその両方に向けて合理化することができる。特に、多くの異なる種類のがんが共通の遺伝機序を有しており、したがって異なる種類のがんを互いに関連付けることができるであろう。開示される技術は、実世界の観察的健康データの解析を用い、かつ異なる種類のがん間の関連を活用して、異なる種類のがんの遺伝子治療標的についての仮説を生成する系統的な方法を提供する。実世界の観察的健康データは、それぞれ異なる種類のがんと診断された患者の異なるコホートの生存データと、それぞれの患者の遺伝情報とを含むものとすることができる。いくつかの実施形態において、実世界の観察的健康データは、2種類以上のがんの間の関連に関する(例えば、臨床試験などを通じて作成された臨床文献において提供される)既存の又は歴史的な知識をさらに組み入れることができる。
1つ又は複数の実施形態において、開示技術は、マルチタスク機械学習生存モデルを使用して、遺伝子治療標的の仮説を生成するタスクを最適化問題として定式化する。マルチタスク生存モデルは、がんの種類ごとに個別の生存モデルを含むことができる。各生存モデルは、特定の種類のがんについての患者の生存データ及び患者の遺伝データを評価して、それぞれの患者の生存期間に寄与している可能性がある遺伝因子を同定するように構成されることができる。がんの生存期間に対する寄与(例えば、正の寄与又は負の寄与)を有すると判定された遺伝因子を本明細書では活性遺伝因子と呼ぶ。2種類以上のがんの間の関連を定義する疾患関連性パラメータを導入することによって、個々の生存モデルをマルチタスク学習フレームワークにおいて互いに結合することができる。これに関して、開示される技術は、統一されたモデルフレームワークの下で、異なるがん種についての個々の生存モデルを共同で(jointly)又は同時に解くことができ、疾患−疾患関連性を活用して、改善された生存モデル性能を達成することができる。例えば、1つ又は複数の実施形態において、マルチタスク生存モデルを適用して、がんの種類ごとの個別の生存モデルを用いて、がんの種類ごとの活性遺伝因子を同時に同定することができる。次いで、2種類以上のがんの間で共有される共通活性遺伝因子を同定することができ、同定された共通活性遺伝因子に基づいて新たな疾患関連性パラメータを開発することができる。次いで、新たな疾患関連性パラメータを入力として用いて、個々の生存モデルを最適化又は更新するたことができ、それによって、更新された生存モデルが活性遺伝因子のより強化された同定を提供することができるようになる。このマルチタスク学習フレームワークを、収束に達するまで反復的に適用することができる。マルチタスク学習分析の出力は、各種類のがんの活性遺伝因子を同定する情報、2種類以上のがんの間で共有される共通遺伝因子、並びに、2種類以上のがんの間の関連を定義する関連性パラメータを含む。
1つ又は複数の実施形態において、各種類のがんに関連付けられる活性遺伝因子を判定するプロセスは、関連付けられた各活性遺伝因子の寄与スコアを生成することを含むことができる。寄与スコアは、ある活性遺伝因子が特定の種類のがんの生存期間に寄与すると考えられる度合いを表すことができる。例えば、いくつかの実施形態において、特定の種類のがんに関して、ある活性遺伝因子のスコアがより高いことは、その種類のがんの生存期間に対するその活性遺伝因子の寄与度がより高いことを示すものとすることができる。この点に関して、ある特定の種類のがんに関連付けられ、そのがん種に関連付けられる他の活性遺伝因子よりも比較的高い寄与スコアを有する活性遺伝子を、潜在的な遺伝子治療標的として選択し及び推奨することができる。さらに、2種類以上のがんの群の中で共有されており、かつ比較的高い寄与スコアを有する共通活性遺伝因子を、その群の中のすべての種類のがんの潜在的な遺伝子治療標的として選択することができる。結果として、これらの共通活性遺伝因子に焦点を合わせた新たな遺伝子治療の臨床開発を行って、(一種類のがんのみではなく)複数種のがんに適用可能な新たな遺伝子治療を開発することが可能となる。
ここで図面を参照して1つ又は複数の実施形態を説明するが、図中、類似の符号は、全体を通して類似の要素を参照するために用いられる。以下の説明において、説明の目的で、1つ又は複数の実施形態のより徹底した理解を提供するために多数の特定の詳細が述べられている。しかしながら、様々な場合において、これらの特定の詳細なしで1つ又は複数の実施形態を実施することができることは明らかである。
ここで図面に目を向けると、図1は、開示された主題の1つ又は複数の実施形態に従って、実世界の患者の生存イベントのジョイントモデリングによって潜在的ながん治療標的を系統的に決定することを容易にする、例示的かつ非限定的なシステム100のブロック図を示す。システム100及び本明細書で詳述する他のシステムは、様々な種類のがんを治療することに関連して、遺伝子治療を開発すべき対象となる有望な遺伝子標的を同定することに関連して、実質的な技術的改善を提供することができる。
特に、システム100もしくはシステム100(及び本明細書に開示される他のシステム)のコンポーネント又はその両方を使用して、ハードウェアもしくはソフトウェア又はその両方を用いて、本質的に高度に技術的問題であって、抽象的な問題ではなく、人間が一組の精神的行為として行うことができない問題を解決することができる。例えば、人間は、有望ながん遺伝子治療標的を絞り込むために、膨大な量の患者生存データ、遺伝データ、及び疾患関連性データを自動的に(例えば、数秒以内に)かつ一貫して評価することはできないであろう。開示される技術は、インビボ及びインビトロ実験を用いてさらに調査すべき有望な遺伝子治療標的を、系統的(例えば、機械学習を用いて)かつ効率的に決定することを規定する。開示される技術は、複数の種類のがんに適用可能な遺伝子治療標的を決定することをさらに規定する。結果として、有望で費用対効果の高い遺伝子治療標的を、顕著に増大した又は増強された処理速度で同定することができる。システム100もしくはシステム100のコンポーネント又はその両方、又は本明細書に記載された他のシステムを、技術、コンピュータネットワーク、インターネットなどの進歩によって生じる新たな問題を解決するために使用することもできる。例えば、システム100もしくはシステム100(及び本明細書に記載の他のシステム)のコンポーネント又はその両方は、既存の患者生存データ及び遺伝データの機械学習分析に基づいて、実時間で、有望な遺伝子治療標的を自動的に決定することを規定する。
本明細書に記載されるシステムの実施形態は、1つ又は複数のマシン内に具体化された(例えば、1つ又は複数のマシンに関連付けられた1つ又は複数のコンピュータ可読ストレージ媒体内に具体化された)1つ又は複数のマシン実行可能なコンポーネントを含むことができる。そうしたコンポーネントは、1つ又は複数のマシン(例えば、プロセッサ、コンピュータ、コンピューティングデバイス、仮想マシンなど)によって実行されると、1つ又は複数のマシンに、記載された動作を実行させることができる。例えば、図示された実施形態において、システム100は、マルチタスク生存分析コンポーネント104を含むコンピューティングデバイス102を含む。マルチタスク生存分析コンポーネント104は、モデル化コンポーネント106、活性因子同定コンポーネント108、スコア付けコンポーネント110、疾患関連性コンポーネント112、及び最適化コンポーネント114をさらに含む。この点に関して、マルチタスク生存分析コンポーネント104、モデル化コンポーネント106、活性因子同定コンポーネント108、スコア付けコンポーネント110、疾患関連性コンポーネント112、及び最適化コンポーネント114は、それぞれ、機械実行可能なコンポーネントに対応することができる。システム100はまた、マルチタスク生存分析コンポーネント104によって読み出され、使用され、もしくは生成されることができる情報又はそれらの組合せである情報を含む、様々な電子データソース及びデータ構造を含む。例えば、これらのデータソース及びデータ構造は、患者生存情報124、患者遺伝情報126、マルチタスク生存モデルデータ122、活性因子情報128、及び疾患関連性情報130を含むことができるが、これらに限定されない。
コンピューティングデバイス102は、少なくとも1つのメモリ120及び少なくとも1つのプロセッサ118を含むことができ、又はこれらに動作可能に結合されることができる。少なくとも1つのメモリ120は、実行可能命令(例えば、マルチタスク生存分析コンポーネント104、モデル化コンポーネント106、活性因子同定コンポーネント108、スコア付けコンポーネント110、疾患関連性コンポーネント112、及び最適化コンポーネント114)をさらに格納することができ、これらは、少なくとも1つのプロセッサ118によって実行されると、実行可能命令によって定義された動作の実行を容易にする。いくつかの実施形態において、メモリ120はまた、システム100の様々なデータソースもしくは構造又はその両方(例えば、患者生存情報124、患者遺伝情報126、マルチタスク生存モデルデータ122、活性因子情報128、及び疾患関連性情報130)を格納することもできる。他の実施形態において、システム100の様々なデータソース及び構造は、コンピューティングデバイス102が(例えば、1つ又は複数のネットワークを介して)アクセス可能な他のメモリ(例えば、遠隔デバイス又はシステム)に格納されてもよい。コンピューティングデバイス102は、コンピューティングデバイス102の様々なコンポーネント及びデータソースを通信可能に結合するデバイスバス116をさらに含むことができる。上記プロセッサ118及びメモリ120、ならびに他の好適なコンピュータ又はコンピューティングベースの要素の例は、図12を参照して見いだすことができ、図1又は本明細書に開示された他の図に関して示され説明されるシステム又はコンポーネントのうちの1つ又は複数を実装することに関して用いることができる。
いくつかの実施形態において、コンピューティングデバイス102、もしくはシステム100の様々なコンポーネント及びデータソース、又はその両方は、1つ又は複数のネットワークを介して通信可能に接続することができる。そのようなネットワークは、セルラーネットワーク、広域ネットワーク(WAD、例えばインターネット)、又はローカルエリアネットワーク(LAN)を含むがこれらに限定されない、有線ネットワーク及び無線ネットワークを含むことができる。例えば、コンピューティングデバイス102は、ワイヤレスフィディリティ(Wi−Fi)、global system for mobile communications (GSM)、universal mobile telecommunications system(UMTS)、worldwide interoperability for microwave access(WiMAX)、enhanced general packet radio service(enhanced GPRS)、第3世代パートナーシッププロジェクト(3GPP)long term evolution(LTE)、第3世代パートナーシッププロジェクト2(3GPP2)ultra mobile broadband(UMB)、high speed packet access(HSPA)、Zigbee及び他の802.XX無線技術もしくはレガシー遠距離通信技術又はその両方、BLUETOOTH(登録商標)、セッション開始プロトコル(SIP)、ZIGBEE(登録商標)、RF4CEプロトコル、WirelessHARTプロトコル、6LoWPAN(IPv6 over Low power Wireless Area Networks)、Z−Wave、ANT、ウルトラワイドバンド(UWB)標準プロトコル、もしくは他の専有及び非専有の通信プロトコル、又はそれらの組合せを含むがこれらに限定されない事実上あらゆる所望の有線又は無線技術を使用して、患者生存情報124もしくは患者遺伝情報126又はその両方を提供する外部デバイス、もしくは、活性因子情報128もしくは疾患関連性情報130又はその両方が提供される別の外部デバイス(及びその逆も含む)、又はその両方と通信することができる。したがって、コンピューティングデバイス102は、コンピューティングデバイス102と外部システム、ソース、及びデバイスとの間の情報の通信を容易にする、ハードウェア(例えば、中央処理装置(CPU)、送受信機、デコーダ)、ソフトウェア(例えば、スレッドのセット、プロセスのセット、実行中のソフトウェア)、又はハードウェアとソフトウェアとの組合せを含むことができる。
様々な実施形態において、マルチタスク生存分析コンポーネント104は、マルチタスク学習モデル又はフレームワークを用いて、患者生存情報124及び患者遺伝情報126の機械学習分析を実行して、様々な種類のがんの治療に関連して、新しい遺伝子治療を開発するための強力な候補である潜在的な遺伝子治療標的に関する情報を系統的に判定することができる。これに関して、患者生存情報124は、異なる種類のがんと診断された多くの(例えば、数千人、数万人、数十万人などの)異なる患者についての照合された生存情報を含むことができる。患者生存情報124は、各患者について、少なくともその患者が診断されたがんの種類、及び、診断から死亡又は患者が無病になった(又はそれ以外に患者が診断されたがんが一掃された)との決定という2つの事象のうちの一方までの期間を同定することができる。患者生存情報124で表されるがん種は、様々なものとすることができ、本質的にあらゆる既知のがんの種類を含むことができる。ヒトに影響を及ぼす既知のがんの種類は100を超える。システム100によって評価することができるがんのいくつかの一般的な種類は、例えば、多形膠芽腫(GBM)、リンパ芽球性急性骨髄性白血病(LAML)、頭頸部扁平上皮がん(HNSC)、肺腺がん(LUAD)、肺扁平上皮がん(LUSC)、乳がん(BRCA)、腎臓腎明細胞がん(KIRC)、卵巣がん(OV)、膀胱がん(BLCA)、大腸腺がん(COAD)、子宮頸部・子宮内膜がん(UCEC)、直腸腺がん(READ)などを含むことができる。
患者遺伝情報126は、患者生存情報124で表される患者の各々についての遺伝情報又はオミックス情報を含むことができる。遺伝情報又はオミックス情報は、1つ又は複数の種類のがんによって利用される遺伝的メカニズムに関与しているかもしれない本質的にあらゆるタイプの生物学的特徴を含むことができる。例えば、患者遺伝情報126は、患者の各々(又はいくつかの実施形態では患者のうちの1人以上)について、DNA配列データ、遺伝子発現データ、マイクロRNA(miRNA)発現データ、コピー数変動データ、遺伝子変異データ、DNAメチル化データ、逆相タンパク質アレイ(RPPA)データなどを含むことができるが、これらに限定されない。いくつかの実施形態において、患者遺伝情報126もしくは患者生存情報124又はその両方は、それぞれの患者に関する、人口統計学的情報、病歴情報などのような追加情報を含むこともできる。
1つ以上の実施形態において、マルチタスク生存分析コンポーネント104は、マルチタスク生存最適化問題として、患者遺伝情報126を考慮して患者生存情報124を評価することによって、異なる種類のがんに対する遺伝子治療標的を決定することができる。これに関して、マルチタスク生存モデルを用いてマルチタスク生存最適化問題をモデル化することができる。マルチタスク生存モデルは、患者生存情報124で表される異なる種類のがんに対する個別の生存モデルを含むことができる。異なる生存モデルの各々は、1つ又は複数の機械学習分析機能(例えば、教師なし、教師あり、ニューラルネットワークなど)を使用して、遺伝因子と、その生存モデルの評価対象であるそれぞれの種類のがんと診断された患者の生存期間との間の相関を判定するように構成することができる。がんの生存期間(例えば、相対的に短い生存期間もしくは相対的に長い生存期間又はその両方)に対して強い相関を有すると判定された遺伝因子を、潜在的な遺伝子治療標的として推奨することができる。
マルチタスク生存モデルはさらに、疾患関連性パラメータを導入することによって、異なる生存モデルをマルチタスク学習フレームワークの中で一緒に結合することができる。これに関して、マルチタスク生存分析コンポーネント104は、異なる生存モデル間の共通性もしくは相違点又はその両方を利用しながら、統一されたモデルフレームワークの下で異なるがん種に対する異なる生存モデルを共同で解くことによって、マルチタスク最適化問題を解決するように構成することができ、それによって、モデルを個別に訓練するのと比較して、タスク固有の生存モデルに対する学習効率及び予測精度の改善を容易にすることができる。異なる生存モデル間の共通性及び相違点は、2つ以上の異なる種類のがんの間の関連(associations)もしくは解離(disassociations)又はその両方を定義する、学習された疾患関連性パラメータ(及び、いくつかの実施においては、既知の疾患関連性パラメータ)に基づくものとすることができる。例えば、疾患関連性パラメータは、関係する2つ以上のがん種を同定する情報、2つ以上のがん種がどのように関係しているか(例えば、どのような活性遺伝因子を共有しているか)、もしくは2つ以上のがん種が関係している度合い、又はそれらの組合せを含むことができる。例えば、1つ又は複数の実施形態において、マルチタスク最適化問題を解決するための高水準プロセスは、異なる種類のがんに対する個別の生存モデルを用いて、異なる種類のがんにそれぞれ関連付けられる活性遺伝因子を特定することを含むことができる。次に、2種類以上のがんの間で共有されている共通活性遺伝因子を同定することができ、この共通活性遺伝因子に基づいて疾患関連性パラメータを決定することができる。このプロセスをさらに、各反復において決定された疾患関連性パラメータを用いて反復的に実行して、個別の生存モデルの性能を収束に達するまで最適化することができる。
図示された実施形態において、マルチタスク生存分析の性能を促進するために、マルチタスク生存分析コンポーネント104は、モデル化コンポーネント106、活性因子同定コンポーネント108、スコア付けコンポーネント110、疾患関連性コンポーネント112、及び最適化コンポーネントを含むことができる。1つ又は複数の実施形態において、モデル化コンポーネント106は、患者生存情報124及び患者遺伝情報126をマルチタスク生存モデルに適用することを容易にすることができる。例えば、いくつかの実施形態において、モデル化コンポーネント106は、異なる種類のがんに関連付けられた異なる患者コホートについての患者生存情報124及び患者遺伝情報126のサブセットにアクセスすることができる。患者生存情報124及び患者遺伝情報126の各サブセットは、異なる種類のがんと診断された患者についての情報を含むことができる。モデル化コンポーネント106はさらに、患者生存情報124及び患者遺伝情報126のサブセットを、異なるがん種に対して開発された対応する個々の生存モデルに適用することができる。異なる種類のがんに対するマルチタスク生存モデル及び関連した個々の生存モデルを定義する情報を(例えば、マルチタスク生存モデルデータ122として)メモリに格納することができる。
生存モデルを用いた患者生存情報124及び患者遺伝情報126の分析に関連して、活性因子同定コンポーネント108は、がんの各種類について、それぞれのがん種によって利用される増殖の遺伝的メカニズムに関与する、患者遺伝情報126に含まれる活性遺伝因子を同定することができる。これに関して、活性因子同定コンポーネント108は、遺伝因子と、患者生存情報124でもたらされるがん生存期間との間の観察された相関に基づいて、活性遺伝因子を同定することができる。例えば、ある特定の種類のがんの短い生存期間に関連して頻繁に観察され、その特定の種類のがんの長い生存期間との関連ではあまり頻繁に観察されない遺伝因子を、その特定の種類のがんの遺伝的メカニズムにおいて活性な役割を有する活性遺伝因子として同定することができる。
活性因子同定コンポーネント108は、異なるがん種間の関連に関する疾患関連性パラメータをさらに使用して、異なるがん種に関連付けられる活性遺伝因子の同定を容易にすることができる。例えば、関連性の高いがん種は、1つ又は複数の、共通の、重要な基礎をなす遺伝因子を共有する場合がある。疾患関連性情報を活用することによって、関連するがん種の生存モデルが互いに情報を借用することが可能になり、それによって、全ての種類のがんにわたる活性遺伝因子のより効率的かつ正確な同定を容易にすることができる。様々な実施形態において、以下でさらに議論されるように、活性遺伝因子の同定を容易にするために活性因子同定コンポーネント108によって適用される疾患関連性パラメータは、マルチタスク生存分析モデルの下で疾患関連性コンポーネント112によって決定される。図示された実施形態において、疾患関連性コンポーネント112によって決定された疾患関連性パラメータは、疾患関連性情報130として識別されたデータベースに格納されることができる。これに関して、活性因子同定コンポーネント108は、疾患関連性情報130にアクセスして、異なるがん種に関連付けられる活性遺伝因子の同定を容易にすることができる。他の(図6を参照して詳細に論じる)実施形態において、異なる種類のがんに関連付けられる活性遺伝因子の同定を容易するために、歴史的又は既知の疾患関連性パラメータを活性因子同定コンポーネント108が使用することもできる。個々の生存モデルは、1つ又は複数の機械学習アルゴリズムを使用して、患者生存情報124、並びに患者遺伝情報126及び疾患関連性パラメータに基づいて、特定の種類のがんにそれぞれ関連付けられる活性遺伝因子の同定を容易にすることができる。
いくつかの実施形態において、各がん種に関連付けられる活性遺伝因子の同定と関連して、スコア付けコンポーネント110は、活性遺伝因子の寄与スコアを決定することができる。特定の種類のがんに関する活性遺伝因子の寄与スコアは、その活性遺伝因子がその特定の種類のがんの生存期間に寄与する度合いを反映することができ、そのことがひいては、その活性遺伝因子が特定の種類のがんの遺伝的メカニズムにおいて役割を果たす度合いを反映する。例えば、寄与スコアは、特定のがん種と診断された患者について特定の遺伝因子が同定される頻度に基づくものとすることができる。別の例では、寄与スコアは、特定のがん種と診断された患者の特定の生存期間に関連して活性遺伝因子が同定される頻度に基づくものとすることができる。例えば、生存期間は、定義された閾値より短い、定義された閾値より長い、などであり得る。いくつかの実施形態において、特定の活性遺伝因子及びがん種に関連付けられた寄与スコアが高いほど、がんの生存期間に対するその活性遺伝因子の寄与が大きい(したがって、そのがん種によって増殖のために実行される遺伝的メカニズムに対するその活性遺伝因子の寄与が大きい)。
がんのそれぞれの種類について同定された活性遺伝因子に関する情報と、その活性遺伝因子に対して決定された寄与スコアとを、適切なデータ構造で照合することができる。例えば、図示された実施形態では、活性因子同定コンポーネント108もしくはスコア付けコンポーネント110又はその両方によって判定された、異なる種類のがんに対して同定された活性遺伝因子に関する情報を、活性因子情報128として識別されたデータベースにおいて整理することができる。
図2は、開示された主題の1つ又は複数の実施形態に従って、がん種ごとに活性遺伝因子の関連性を同定する情報を含む、例示的かつ非限定的な表200を示す。特に、表200は、let−7ファミリーに含まれる13種類のmiRNA遺伝因子(例えば、has.let.7a、hsa.let.7a.1、has.let.7a.2など)を同定する。let−7 miRNAファミリーは、細胞の分化に関係していることが判明している。表200はさらに、腎臓がん、結腸がん、GBM、及び肺がんを含む4種の異なる種類のがんを特定している。それぞれのがん種とmiRNA遺伝因子の組合せには、そのがん種がそのmiRNA遺伝因子と関連付けられることを識別するチェックマークが付されている。表200に示すように、let−7ファミリーの様々なmiRNA遺伝因子の多くは、2種類以上のがんに関連付けられる。例えば、図示された実施形態では、has.let.7a.1は、腎臓がん、結腸がん及び肺がんと関連付けられる。表200は、1つ又は複数の実施形態に従って、活性因子同定コンポーネント108によって判定することができる活性遺伝因子情報のタイプの一例を提供する。これに関して、表200もしくは表200によって提供される情報と同様の情報又はその両方を、活性因子情報128によって提供することができる。
図3は、本明細書に記載された1つ又は複数の実施形態に従って、活性因子同定コンポーネント108及びスコア付けコンポーネント110によって判定することができる情報を含む例示的な表300を示す。これに関して、表300もしくは表300によって提供される情報と同様の情報又はその両方を、活性因子情報128において提供することもできる。表300は、開示された主題の1つ又は複数の実施形態に従って、異なるがん種に対して同定された活性遺伝因子を同定し及びスコア付けする情報を含む。図示された実施形態において、表300の各行は、特定のがん種と活性遺伝因子との組合せに対応する。例えば、第1の行は、がん種A(C−A)及び活性遺伝因子1(G−1)に対応する。第2の行は、がん種A(C−A)及び活性遺伝因子2(G−2)に対応する。第3の行は、がん種B(C−B)及び活性遺伝因子1(G−1)に対応する。表300はさらに、各がん種と活性遺伝因子との組合せに対して(例えば、スコア付けコンポーネント110によって決定される)寄与スコアを提供するスコア列を含む。寄与スコアは、その活性遺伝因子が、対応するがん種の増殖の遺伝的メカニズムに寄与していると考えられる度合いを反映する。これに関して、寄与スコアの値が高いほど、その活性遺伝因子がその対応するがん種の強力な遺伝子治療標的となる可能性が高いことを示す。
再び図1を参照すると、様々な実施形態において、疾患関連性コンポーネント112は、活性因子同定コンポーネント108によって異なる種類のがんの各々に対して同定された活性遺伝因子を評価して、2つ以上のがん種の間で共有される共通活性遺伝因子を判定することができる。疾患関連性コンポーネント112は、2種類以上のがんの間で共有される共通活性遺伝因子に少なくとも部分的に基づいて、2種類以上のがんの間の関係に関する疾患関連性情報130をさらに生成することができる。例えば、再び表200を参照すると、疾患関連性コンポーネント112は、腎臓がん、結腸がん、及び肺がんは、それらの間で活性遺伝因子has.let.7a.1が共有されているので、関係していると判定することができる。様々な実施形態において、疾患関連性コンポーネント112もしくはスコア付けコンポーネント110又はその両方はさらに、2つ以上のがん種が関係している度合いを判定することができる。疾患関連性コンポーネント112もしくはスコア付けコンポーネント110又はその両方はさらに、2つ以上のがん種の関連度を反映する、2つ以上のがん種の群に対する関連性スコアを生成することができる。例えば、より高い関連性スコアは、より低い関連性スコアと比較して、2種類以上のがんの間のより強い関連性を示すものとすることができる。
例えば、図4は、本明細書に記載された1つ又は複数の実施形態に従って、疾患関連性コンポーネント112もしくはスコア付けコンポーネント110又はその両方によって判定することができる情報を含む例示的な表400を示す。これに関して、表400もしくは表400によって提供される情報と同様の情報又はその両方を、疾患関連性情報130によって提供することができる。表400は、開示された主題の1つ又は複数の実施形態に従って、異なるがん種間の関連性の関係(associative relationship)を同定し、スコア付けする情報を含む。例えば、C−A及びC−Bのがんのペアは0.25の関連性スコアを有し、C−A及びC−Cのがんのペアは0.23の関連性スコアを有し、C−B及びC−Dのがんのペアは0.22の関連性スコアを有する。
図1に戻って参照すると、様々な実施形態において、疾患関連性コンポーネント112もしくはスコア付けコンポーネント110又はその両方は、2つ以上のがん種の間で共有される共通活性遺伝因子の数に基づいて、2つ以上のがん種が関係している度合いを表す関連性スコアを決定することができる。これに関して、共通活性遺伝因子の数が多いほど、それぞれのがんの間の関連性が大きくなり、関連性スコアが高くなる。例えば、再び表200を参照すると、Let−7ファミリーに関して、腎臓がんと肺がんは、腎臓がんと結腸がんと比較して、より多数の共通活性遺伝因子を共有している。この例によれば、腎臓がんと肺がんとの組合せの関連性スコアを、腎臓がんと結腸がんとの組み合わせの関連性スコアよりも高くすることができる。
いくつかの実施形態において、疾患関連性コンポーネント112もしくはスコア付けコンポーネント110又はその両方はさらに、がん種間で共有される遺伝因子にそれぞれ関連付けられた寄与スコアに基づいて、2種類以上のがんの関連性スコアを決定することができる。これに関して、寄与スコアが高い遺伝因子には、寄与スコアが低い遺伝因子よりも大きな重みを与えることができる。例えば、がん種D(C−D)とがん種E(C−E)が活性遺伝因子G−1及びG−2を共有しているとする。この例によれば、関連性スコアは、各がん種と遺伝因子とのペアに関連付けられた合計寄与スコアに基づいて決定することができ、合計寄与スコアが高いほど関連性スコアが高くなる。例えば、C−D及びG−1の寄与スコアが0.25、C−E及びG−1の寄与スコアが0.30、C−D及びG−2の寄与スコアが0.15、C−E及びG−2の寄与スコアが0.75であるとする。この例によれば、合計寄与スコアは、1.45(例えば、0.25+0.30+0.15+0.75)となるであろう。別の実施形態において、2種類以上のがんの間の関連度は、共通活性遺伝因子に関連付けられた寄与スコア間の差又は偏位度(degree of deviation)に基づくものとすることもできる。例えば、上記の例をさらに補足すると、C−D及びC−Eに関するG−1の寄与スコアは、わずかしか偏位しておらず、差は0.05に過ぎない。しかし、C−D及びC−Eに関するG−2の寄与スコアは、0.6の差があり、大きく偏位している。このように、この例によれば、がん種のペアC−D/C−Eに対して決定された関連性スコアは、G−2の寄与スコア間の偏位度が高いことに基づいて調整される、又は関連性スコアにペナルティを課すことができる。
上述したように、様々な実施形態において、マルチタスク生存モデルを最適化問題として定式化もしくは評価する、又は定式化及び評価することができる。これに関して、1つ又は複数の実施形態において、異なるがん種に対するそれぞれの生存モデルを用いて、活性因子同定コンポーネント108及びスコア付けコンポーネント110は、最初に、患者生存情報124及び患者遺伝情報126に基づいて、異なるがん種に対する活性遺伝因子及び活性遺伝因子寄与スコアを決定することができる。次に、疾患関連性コンポーネント112もしくはスコア付けコンポーネント110又はその両方は、2種類以上のがんの間で共有される共通活性遺伝因子に基づいて、初期の疾患関連性パラメータを決定することができる。これらの実施形態において、初期活性遺伝因子及び初期疾患関連性パラメータが決定された後、初期疾患関連性パラメータをマルチタスク生存モデルにフィードバックして、個々の生存モデルの性能及び効率を最適化するために用いることができる。これに関して、最適化コンポーネント114は、初期疾患関連性パラメータを用いて、個々の生存モデルのうちの1つ又は複数を更新もしくは最適化する又は更新及び最適化することができる。更新された生存モデルは、マルチタスク生存モデルデータ122に格納されることができる。次に、活性因子同定コンポーネント108、スコア付けコンポーネント110、及び疾患関連性コンポーネント112は、更新された生存モデルを用いてマルチタスク生存分析を繰り返して、患者生存情報124及び患者遺伝情報に基づいて、更新された活性遺伝因子、更新された活性遺伝因子寄与スコア、及び更新された疾患関連性パラメータを決定することができる。活性因子同定コンポーネント108、スコア付けコンポーネント110、疾患関連性コンポーネント112、及び最適化コンポーネントは、各反復後に決定された新しい疾患関連性パラメータに基づいて、収束に達するまで、この生存分析及びモデル更新/最適化プロセスをさらに反復的に繰り返すことができる。
1つ又は複数の実施形態において、最適化コンポーネント114は、現在のモデル出力と以前のモデル出力との間の変化の度合いに基づいて、収束に達したときを決定することができる。例えば、モデルの現在の出力が情報データセットkによって表されると仮定すると、最適化コンポーネントは、情報データセットkと情報データセットk−1とを比較することができる。kとk−1との間の差が定義された偏位度以下であれば、最適化コンポーネントは、収束に達したと判定することができる。最終的なデータセットkは、次いで格納される。これに関して、各反復の出力データは、がんの種類ごとに、そのがん種に関連付けられる同定された活性遺伝因子と、活性遺伝因子の寄与スコアとを含む。各反復の出力データはまた、更新された疾患関連性パラメータも含む。したがって、最適化コンポーネント114は、前の反復から決定された活性遺伝因子、活性遺伝因子の寄与スコア、及び疾患関連性パラメータに対して、現在決定された活性遺伝因子、活性遺伝因子の寄与スコア、及び疾患関連性パラメータがほとんど又は全く変化していないことに基づいて、収束に達したときを判定することができる。
図5は、開示された主題の1つ又は複数の実施形態に従って、実世界の患者生存イベントのジョイントモデリングによって潜在的ながん治療標的を決定するための、例示的なコンピュータ実装プロセス500の高水準フロー図を提供する。これに関して、プロセス500は、開示された主題の1つ又は複数の実施形態に従って、疾患関連性情報130及び活性因子情報128を判定するためにマルチタスク生存分析コンポーネント104によって実行することができるマルチタスク生存分析の例示的な実施形態を反映している。それぞれの実施形態で使用されている類似要素の反復的な説明は、簡潔にするために省略する。
患者生存情報124及び患者遺伝情報126を入力として使用して、502において、(例えば、モデル化コンポーネント106によって)マルチタスク学習生存モデルを使用して、がんの種類ごとに個別のタスクを有する異なる種類のがんの生存イベントをジョイントモデリングすることができる。504において、(例えば、活性因子同定コンポーネント108によって)異なる種類のがんの各々に対する活性遺伝因子が、個別のタスクの出力に基づいて同定される。同定された活性遺伝因子は、活性因子データ514によって表すことができる。いくつかの実施形態において、活性因子データ514は、それぞれの活性遺伝因子に対して決定された寄与スコアを含むことができる。1つ又は複数の実施形態において、活性因子データ514を、活性因子情報128に追加して格納することができる。506において、(例えば、疾患関連性コンポーネント112を介して)2種類以上のがんの間で共有される活性遺伝因子の共通活性遺伝因子の同定に基づいて、疾患関連性データ512を生成することができる。例えば、疾患関連性コンポーネント112は、活性因子データ514を処理して、2種類以上のがんからなる群の中で共有される1つ又は複数の共通活性遺伝因子を同定することができる。疾患関連性コンポーネント112もしくはスコア付けコンポーネント110又はその両方はまた、2種類以上のがんの間で共有される共通活性遺伝因子の数に部分的に基づいて、2種類以上のがんの間の関連度を表す関連性スコアを決定することができる。したがって、疾患関連性データ512は、プロセス500によって評価された異なる種類のがんの異なるサブセット間の関係を定義する疾患関連性パラメータを含むことができる。疾患関連性データ512を、疾患関連性情報130に追加して格納することもできる。
508において、活性因子データ514及び疾患関連性データ512が、プロセス502−506の最初の反復の結果であるかどうかが判断される。そうであれば、マルチタスク学習分析は、性能を最適化するために、疾患関連性データ512を用いてプロセス502−506を繰り返すことによって継続される。これに関して、疾患関連性データ512を用いて、(例えば、最適化コンポーネント114を介して)別個のタスクの生存モデルを最適化又は更新することができ、プロセス502−506を、更新された生存モデルと、(元の)患者生存情報124及び患者遺伝情報126とを入力として用いて繰り返すことができる。プロセス502−506が繰り返されるたびに、更新された活性因子データ514及び疾患関連性データ512が生成される。
508において、活性因子データ514及び疾患関連性データ512がプロセス502−506の最初の反復の結果ではないと判断された場合、510において、収束に達したかどうかが判断される。例えば、最適化コンポーネント114は、現在の疾患関連性データ512及び現在の活性因子データ514を、プロセス502−506の前の反復で決定された疾患関連性データ及び活性因子データと比較することができる。前のデータセットと現在のデータセットとの間の変化の度合いが閾値偏位度未満である場合、最適化コンポーネント114は、収束に達したと判断し、プロセス500は終了することができる。そのとき疾患関連性情報130及び活性因子情報128にそれぞれ格納される最終的な疾患関連性データ512及び活性因子データ514が、マルチタスク生存問題の最適解を反映することになる。収束に達していないと510において判断された場合、プロセス500は、収束に達するまで、更新された疾患関連性データを用いてプロセス502−506を再び繰り返すことができる。
図6は、開示された主題の1つ又は複数の実施形態に従って、実世界の患者生存イベントのジョイントモデリングによって潜在的ながん治療標的を系統的に決定することを容易にする、別の例示的な非限定的システム600のブロック図を示す。システム600は、システム100と同じ又は類似の特徴及び機能を含み、歴史的疾患関連性情報602が追加されている。それぞれの実施形態で使用されている類似要素の反復的な説明は、簡潔にするために省略する。
歴史的疾患関連性情報602は、マルチタスク生存分析コンポーネント104によるマルチタスク生存分析の実行前に既知であった、2種類以上のがんの間の関連性に関する情報を含むことができる。例えば、いくつかの実施形態において、歴史的疾患関連性情報602は、2種類以上の異なるがんと関連付けられることが知られている活性遺伝因子、2種類以上の関係のあるがんの群、2種類以上のがんの関係の度合いなどを同定することができる。歴史的疾患関連性情報602は、臨床的な様々な臨床研究データソースによって提供され得る。例えば、歴史的疾患関連性情報602は、既存の科学報告書、白書、オープンソースのmiRNAがんデータベースなどから創り出すことができる。いくつかの実施形態において、疾患関連性コンポーネント112は、特定のがん種に関連付けられる活性遺伝因子に関する情報を含む様々なデータソースにアクセスし、1つ又は複数の機械学習技術を使用して、既存の臨床研究に基づいて、定義された歴史的疾患関連性情報を判定することができる。
いくつかの実施形態において、マルチタスク生存分析コンポーネント104は、歴史的疾患関連性情報602を用いて、マルチタスク生存分析の性能をさらに強化し又は最適化することができる。これに関して、患者生存情報124及び患者遺伝情報126に加えて、歴史的疾患関連性情報602をマルチタスク生存モデルに対する入力として用いることができる。したがって、歴史的疾患関連性情報602を用いて、分析の最初の反復時に個々の生存モデルを互いに結合することができる。
例えば、図7は、開示された主題の1つ又は複数の実施形態に従って、実世界の患者生存イベントのジョイントモデリングによって潜在的ながん治療標的を決定するための、別の例示的なコンピュータ実装プロセス700の高水準フロー図を提供する。プロセス700は、プロセス500と実質的に同様であり、入力としての歴史的疾患関連性情報602が追加されている。それぞれの実施形態で使用されている類似要素の反復的な説明は、簡潔にするために省略する。
702において、患者生存情報124、患者遺伝情報126、及び歴史的疾患関連性情報602が、マルチタスク学習生存モデルに対する入力として用いられる。マルチタスク生存モデルは、(例えば、モデル化コンポーネント106によって)がんの種類ごとに個別のタスクを有する異なる種類のがんの生存イベントをジョイントモデリングするために用いられる。歴史的疾患関連性情報602を用いて、2つ以上のそれぞれのタスクを連結することができる。704において、(例えば、活性因子同定コンポーネント108によって)異なる種類のがんのそれぞれについての活性遺伝因子が、個別のタスクの出力に基づいて同定される。同定された活性遺伝因子は、活性因子データ714によって表すことができる。いくつかの実施形態において、活性因子データ714は、それぞれの活性遺伝因子に対して決定された寄与スコアを含むことができる。1つ又は複数の実施形態において、活性因子データ714を、活性因子情報128に追加して格納することができる。706において、(例えば、疾患関連性コンポーネント112を介して)2種類以上のがんの間で共有される活性遺伝因子の共通活性遺伝因子の同定に基づいて、疾患関連性データ712を生成することができる。例えば、疾患関連性コンポーネント112は、活性因子データ714を処理して、2種類以上のがんからなる群の中で共有される1つ又は複数の共通活性遺伝因子を同定することができる。疾患関連性コンポーネント112もしくはスコア付けコンポーネント110又はその両方はまた、2種類以上のがんの間で共有される共通活性遺伝因子の数に部分的に基づいて、2種類以上のがんの間の関連度を表す関連性スコアを決定することができる。したがって、疾患関連性データ712は、プロセス700によって評価された異なる種類のがんの異なるサブセット間の関係を定義する疾患関連性パラメータを含むことができる。疾患関連性データ712を、疾患関連性情報130に追加して格納することもできる。
708において、活性因子データ714及び疾患関連性データ712が、プロセス702−706の最初の反復の結果であるかどうかが判断される。そうであれば、マルチタスク学習分析は、性能を最適化するために、疾患関連性データ712を用いてプロセス702−706を繰り返すことによって継続される。これに関して、疾患関連性データ712を用いて、(例えば、最適化コンポーネント114を介して)別個のタスクの生存モデルを最適化又は更新することができ、プロセス702−706を、更新された生存モデルと、(元の)患者生存情報124及び患者遺伝情報126とを入力として用いて繰り返すことができる。プロセス702−706が繰り返されるたびに、更新された活性因子データ714及び疾患関連性データ712が生成される。
708において、活性因子データ714及び疾患関連性データ712がプロセス702−706の最初の反復の結果ではないと判断された場合、710において、収束に達したかどうかが判断される。例えば、最適化コンポーネント114は、現在の疾患関連性データ712及び現在の活性因子データ714を、プロセス702−706の前の反復で決定された疾患関連性データ及び活性因子データと比較することができる。前のデータセットと現在のデータセットとの間の変化の度合いが閾値偏位度未満である場合、最適化コンポーネント114は、収束に達したと判断し、プロセス700は終了することができる。そのとき疾患関連性情報130及び活性因子情報128にそれぞれ格納される最終的な疾患関連性データ712及び活性因子データ714が、マルチタスク生存問題の最適解を反映することになる。収束に達していないと710において判断された場合、プロセス700は、収束に達するまで、更新された疾患関連性データを用いてプロセス702−706を再び繰り返すことができる。
図8は、開示された主題の1つ又は複数の実施形態に従った、マルチタスク生存分析フレームワーク800の例示的な実装を示す。それぞれの実施形態で使用されている類似要素の反復的な説明は、簡潔にするために省略する。
図示された実施形態において、マルチタスク生存分析フレームワーク800は、がん種1−kの集合内の複数のがん種に対する複数の生存モデル801−801を含むことができる。これに関して、各種類のがんは、別個の生存モデルを使用してモデル化される。集合に含まれるがん種の数kは様々であり得る。係数の凡例で使用される記号iは、集合1−k内の任意の単一の特定の種類のがんを表すために用いられる。各種類のがんの生存モデルを用いて、係数ベクトルβを、がん種群に含まれるそれぞれの患者の生存期間及びそれぞれの患者に関連付けられる遺伝的特徴の関数として決定することができる。係数ベクトルβは、それぞれが遺伝因子に対応する複数の要素を含むことができる。例えば、図示された実施形態では、要素はブロックで表され、各ブロックは異なる遺伝因子に対応するものとすることができる。各(又はいくつかの実施形態では1つ以上の)遺伝因子を、生存期間に対するその遺伝因子の寄与を表す寄与スコアと関連付けることができ、ここで、より高い絶対スコアはより高い寄与を反映し、より低い絶対スコアはより低い寄与を反映する。各種類のがんに対する係数ベクトルβを用いて、潜在的な遺伝子治療標的となり得る活性遺伝因子を判定することができる。これに関して、がんの種類ごとに、そのがん種の増殖に関連付けられる、群内で観察される異なる遺伝要素の寄与を表す1つの係数ベクトルβが存在する。
マルチスタック生存分析のために、個々の係数ベクトルβ1−βによってそれぞれ表される1つ又は複数のがん種に対する疾患関連性パラメータを用いて、これらの係数ベクトルβ−βを一緒にスタックして、係数行列β802にすることができる。係数行列β802を使用して、活性遺伝因子もしくは活性遺伝因子が各種類のがんに関連付けられる寄与スコア又はその両方のより良い同定を容易にすることができる。例えば、1つ又は複数の実施形態において、潜在的な遺伝子治療標的となり得る遺伝因子の新たな仮説を、βに対する閾値によって決定することができる。図示された実施形態において、疾患関連性パラメータは、疾患関連性行列Ω803によって表される。いくつかの実施形態において、疾患関連性行列Ωは、任意に、歴史的な又は既知の疾患関連性情報(例えば、歴史的疾患関連性情報602)を用いて初期化されることができる。他の実施形態において、疾患関連性行列Ω803は、マルチタスク生存分析の最初の反復後に各がん種について同定された活性遺伝因子に基づいて決定される、2つ以上のがん種間で共有される共通活性遺伝因子に基づいて生成することができる。マルチスタック分析フレームワークの最終的な注目パラメータは、最適化された係数行列β802及び疾患関連性行列Ω803である。
1つ又は複数の実施形態において、マルチタスク生存分析フレームワーク800は、以下の部分尤度目的関数で表すことができる。
Figure 2021527874

ここで
Figure 2021527874

は、βを係数行列としたときの、個々のCoxモデル由来の部分尤度を表し、
Figure 2021527874

は、Ωを疾患関連性行列としたときの、タスクを一緒に結合するためのβについての以前のモデルを表し、

Figure 2021527874

は、βに対するスパース性(sparsity)仮定、又は各種類のがんに対する治療標的を同定するためのL1正則化項(regularizer)を表す。
1つ以上の実施形態において、マルチタスク生存分析コンポーネント104は、β(0)及びΩ(0)を初期化することによってブロック座標降下(BCD:block coordinate descent)法を用いて上記目的関数を解くように構成することができる。マルチタスク生存分析コンポーネント104は、収束に達するまで、目的関数を解くことをさらに反復し又は繰り返すことができ、そのたびにβの列のスパース性パターンを比較することによって共通活性遺伝因子を同定してβを更新し、患者生存情報124及び患者遺伝情報126を用いて疾患関連性情報であるΩを更新する。
図9は、開示された主題の1つ又は複数の実施形態に従って、実世界の患者生存イベントのジョイントモデリングによって潜在的ながん治療標的を系統的に決定することを容易にする、別の例示的な非限定的システム900のブロック図を示す。それぞれの実施形態で使用されている類似要素の反復的な説明は、簡潔にするために省略する。
システム900は、システム100と同じ又は類似の特徴を含むことができ、インデックス付けコンポーネント902及び選択コンポーネント904が追加されている。1つ又は複数の実施形態において、インデックス付けコンポーネント902は、マルチタスク生存分析コンポーネント104によって判定された活性因子情報128もしくは疾患関連性情報130又はその両方を含む1つ又は複数のインデックス付きデータ構造を生成することができる。例えば、インデックス付けコンポーネント902は、表200、表300、表400などを生成することができる。選択コンポーネント904はさらに、インデックス付きデータ構造のうちの1つ又は複数を使用して、強力な遺伝子治療標的である1つ又は複数の特定の活性遺伝因子の効率的な選択及び推奨を容易にすることができる。
これに関して、いくつかの実施形態において、インデックス付けコンポーネント902は、複数の異なる種類のがんの各種類の(又はいくつかの実施形態では1つ又は複数の)がんについて、活性因子同定コンポーネント108によってその種類のがんに関連付けられると判定された活性遺伝因子を同定する第1のデータベースを生成することができる。いくつかの実施形態において、第1のデータベースは、スコア付けコンポーネント110によってそれぞれの活性遺伝因子に対して決定された寄与スコアをさらに含むことができる。例えば、第1のデータベースは、活性因子情報128又は別の適切なデータソース内に設けることができる。1つ又は複数の実施形態において、第1のデータベースを使用して、選択コンポーネント904は、有望な遺伝子治療標的として推薦するための、1つ又は複数のがん種に関連付けられる1つ又は複数の活性遺伝因子を選択することができる。例えば、一実施形態において、選択コンポーネント904は、定義された閾値スコアを上回る寄与スコアを有する活性遺伝因子を選択するように構成されることができる。これに関して、選択コンポーネント904は、定義された閾値を上回る寄与スコアを有する、がんの各種類に関連付けられる活性因子のサブセットを選択することができる。別の実施形態において、選択コンポーネント904は、そのがん種に関連付けられる他の活性遺伝因子よりも相対的に高い寄与スコアを有する、特定の種類のがんに関連付けられる活性遺伝因子のサブセットを選択するように構成されることができる。例えば、選択コンポーネント904は、遺伝子治療標的として推薦するために活性遺伝因子の上位N個又は上位Xパーセントを選択することができる。
インデックス付けコンポーネント902はまた、2種類以上のがんの間で共有される共通活性遺伝因子又は遺伝子治療標的を同定する第2のデータベースを生成することができる。この第2のデータベースは、疾患関連性情報130又は別の適切なデータソース内に設けることができる。例えば、インデックス付けコンポーネント902は、活性遺伝因子もしくは遺伝子治療標的又はその両方を同定するデータベースを生成し、次いでそれぞれに関連付けられるがんの種類をリストにすることができる。いくつかの実施形態において、特定の活性遺伝因子に関連付けられるがん種を寄与スコアに従ってランク付けして、各種類のがんがその活性遺伝因子に関連付けられる度合いを示すことができる。インデックス付けコンポーネント902はさらに、それぞれの活性遺伝因子をそれに関連付けられるがんの数に基づいてランク付けすることができる。いくつかの実施形態において、インデックス付けコンポーネント902はさらに、それぞれの活性遺伝因子を、それに関連付けられる異なるがん種の数、並びに異なるがん種及び活性遺伝因子に関連付けられる寄与スコアの関数として、ランク付けすることができる。1つ又は複数の実施形態において、選択コンポーネント904は、潜在的な遺伝子治療標的として推薦するための1つ又は複数の活性遺伝因子を、それに関連付けられるがん種の数もしくは寄与スコア又はその両方に基づいて選択するように構成することができる。
インデックス付けコンポーネント902はまた、2種類以上の異なる種類のがんの間の関係を同定する第3のインデックス付きデータ構造を生成することができる。第3のインデックス付きデータ構造は、疾患関連性情報130又は別の適切なデータソース内に設けることができる。例えば、第3のインデックス付きデータ構造は、2種類以上の関係のあるがんを含む群を同定することができる。がん群はまた、その群に含まれるそれぞれのがん種間の関連度を反映する関連性スコア(例えば、疾患関連性コンポーネント112もしくはスコア付けコンポーネント110又はその両方によって決定される)を含むことができる。
図10は、開示された主題の1つ又は複数の実施形態に従って、実世界の患者生存イベントのジョイントモデリングによって潜在的ながん治療標的を決定するための、別の例示的なコンピュータ実装プロセス1000の高水準フロー図を提供する。それぞれの実施形態で使用されている類似要素の反復的な説明は、簡潔にするために省略する。
1002において、プロセッサに動作可能に結合されたデバイス(例えば、コンピューティングデバイス102)は、異なる種類のがんにそれぞれ関連付けられる活性遺伝因子を、異なる種類のがんをそれぞれ生き延びた患者群のがん生存データ及び患者ゲノムデータに基づいて(例えば、活性因子同定コンポーネント108を介して)決定するために、マルチタスク学習モデル(例えば、マルチタスク生存分析フレームワーク800)を使用うることができる。1004において、デバイスはさらに、異なる種類のがんの2種類以上のがんの間で共有される活性遺伝因子の共通活性遺伝因子を(例えば、疾患関連性コンポーネント112を介して)判定することができる。
図11は、開示された主題の1つ又は複数の実施形態に従って、実世界の患者生存イベントのジョイントモデリングによって潜在的ながん治療標的を決定するための、別の例示的なコンピュータ実装プロセス1100の高水準フロー図を提供する。
1102において、プロセッサに動作可能に結合されたデバイス(例えば、コンピューティングデバイス102)は、異なる種類のがんにそれぞれ関連付けられる活性遺伝因子を、異なる種類のがんをそれぞれ生き延びた患者群のがん生存データ及び患者ゲノムデータに基づいて、さらにまた、異なる種類のがんに含まれるがん種のサブセット間の関係に関する関係パラメータに基づいて、(例えば、活性因子同定コンポーネント108を介して)反復的に決定するために、マルチタスク学習モデル(例えば、マルチタスク生存分析フレームワーク800)を使用することができる。1104において、デバイスはさらに、異なる種類のがんの2種類以上のがんの間で共有される活性遺伝因子の共通活性遺伝因子を(例えば、疾患関連性コンポーネント112を使用して)判定することができる。1106において、デバイスは、共通活性遺伝因子に基づいて(例えば、疾患関連性コンポーネント112を使用して)疾患関連性パラメータを決定することができる。
1つ又は複数の実施形態は、任意の可能な技術的詳細レベルの統合において、システム、方法、もしくはコンピュータプログラム製品又はそれらの組合せとすることができる。コンピュータプログラム製品は、本実施形態の1つ又は複数の態様をプロセッサに実行させるためのコンピュータ可読プログラム命令を有するコンピュータ可読ストレージ媒体を含むことができる。
コンピュータ可読ストレージ媒体は、命令実行デバイスによる使用のために命令を保持及び格納することができる有形デバイスとすることができる。コンピュータ可読ストレージ媒体は、例えば、電子ストレージデバイス、磁気ストレージデバイス、光ストレージデバイス、電磁気ストレージデバイス、半導体ストレージデバイス、又は上記のものの任意の適切な組合せとすることができるがこれらに限定されない。コンピュータ可読ストレージ媒体のより具体的な例の非網羅的なリストは、ポータブル・コンピュータ・ディスケット、ハードディスク、ランダムアクセスメモリ(RAM)、読み出し専用メモリ(ROM)、消去可能プログラム可能読み出し専用メモリ(EPROM又はフラッシュメモリ)、静的ランダムアクセスメモリ(SRAM)、ポータブル・コンパクトディスク読み出し専用メモリ(CD−ROM)、デジタル多目的ディスク(DVD)、メモリスティック、フロッピーディスク、記録された命令を有するパンチカードもしくは溝内に隆起した構造等の機械式コード化デバイス、及び上記のものの任意の適切な組合せを含む。コンピュータ可読ストレージ媒体は、本明細書で用いられる場合、無線波もしくは他の自由に伝搬する電磁波、導波路もしくは他の伝送媒体を通って伝搬する電磁波(例えば光ファイバケーブルを通る光パルス)、又は電線を通って伝送される電気信号のような、一時的な信号自体と解釈されるべきではない。
本明細書で説明されるコンピュータ可読プログラム命令は、コンピュータ可読ストレージ媒体からそれぞれのコンピューティング/処理デバイスにダウンロードすることも、又は、例えばインターネット、ローカルエリアネットワーク、広域ネットワークもしくは無線ネットワーク又はそれらの組合せを経由して、外部コンピュータもしくは外部ストレージデバイスにダウンロードすることもできる。ネットワークは、銅伝送ケーブル、光伝送ファイバ、無線伝送、ルータ、ファイアウォール、スイッチ、ゲートウェイ・コンピュータもしくはエッジサーバ又はそれらの組合せを含むことができる。各コンピューティング/処理デバイス内のネットワーク・アダプタ・カード又はネットワーク・インタフェースは、ネットワークからコンピュータ可読プログラム命令を受け取り、そのコンピュータ可読プログラム命令をそれぞれのコンピューティング/処理デバイス内のコンピュータ可読ストレージ媒体にストレージのために転送する。
本発明の動作を実行するためのコンピュータ可読プログラム命令は、アセンブラ命令、命令セット・アーキテクチャ(ISA)命令、機械語命令、機械依存命令、マイクロコード、ファームウェア命令、状態設定データ、集積回路用構成データ、又は、Smalltalk、もしくはC++などのオブジェクト指向プログラミング言語及び「C」プログラミング言語もしくは類似のプログラミング言語のような従来の手続き型プログラミング言語を含む1つもしくは複数のプログラミング言語の任意の組合せで記述されたソースコードもしくはオブジェクトコードのいずれかとすることができる。コンピュータ可読プログラム命令は、完全にエンティティのコンピュータ上で実行される場合もあり、一部がエンティティのコンピュータ上で独立型ソフトウェア・パッケージとして実行される場合もあり、一部がエンティティのコンピュータ上で実行され、一部が遠隔コンピュータ上で実行される場合もあり、又は完全に遠隔コンピュータもしくはサーバ上で実行される場合もある。後者のシナリオにおいては、遠隔コンピュータは、ローカル・エリア・ネットワーク(LAN)もしくは広域ネットワーク(WAN)を含むいずれかのタイプのネットワークを通じてエンティティのコンピュータに接続される場合もあり、又は外部コンピュータへの接続が行われる場合もある(例えば、インターネット・サービス・プロバイダを用いたインターネットを通じて)。いくつかの実施形態において、例えばプログラマブル論理回路、フィールドプログラマブルゲートアレイ(FPGA)、又はプログラマブル論理アレイ(PLA)を含む電子回路は、本発明の態様を実施するために、コンピュータ可読プログラム命令の状態情報を利用して電子回路を個別化することにより、コンピュータ可読プログラム命令を実行することができる。
本発明の態様は、本明細書において、本発明の実施形態による方法、装置(システム)、及びコンピュータプログラム製品のフローチャート図もしくはブロック図又はその両方を参照して説明される。フローチャート図もしくはブロック図又はその両方の各ブロック、並びにフローチャート図もしくはブロック図又はその両方のブロックの組合せは、コンピュータ可読プログラム命令によって実装することができることが理解されるであろう。
これらのコンピュータ可読プログラム命令を、汎用コンピュータ、専用コンピュータ、又は他のプログラム可能データ処理装置のプロセッサに与えてマシンを製造し、それにより、コンピュータ又は他のプログラム可能データ処理装置のプロセッサによって実行される命令が、フローチャートもしくはブロック図又はその両方の1つ又は複数のブロック内で指定された機能/動作を実装するための手段を作り出すようにすることができる。これらのコンピュータ可読プログラム命令を、コンピュータ、プログラム可能データ処理装置、もしくは他のデバイス又はそれらの組合せを特定の方式で機能させるように指示することができるコンピュータ可読ストレージ媒体内に格納し、それにより、その中に格納された命令を有するコンピュータ可読媒体が、フローチャートもしくはブロック図又はその両方の1つ又は複数のブロックにおいて指定された機能/動作の態様を実装する命令を含む製品を含むようにすることもできる。
コンピュータ可読プログラム命令を、コンピュータ、他のプログラム可能データ処理装置又は他のデバイス上にロードして、一連の動作ステップをコンピュータ、他のプログラム可能データ処理装置又は他のデバイス上で行わせてコンピュータ実装のプロセスを生成し、それにより、コンピュータ、他のプログラム可能装置又は他のデバイス上で実行される命令が、フローチャートもしくはブロック図又はその両方の1つ又は複数のブロックにおいて指定された機能/動作を実装するようにすることもできる。
図面内のフローチャート及びブロック図は、本開示の種々の実施形態による、システム、方法、及びコンピュータプログラム製品の可能な実装の、アーキテクチャ、機能及び動作を示す。この点に関して、フローチャート又はブロック図内の各ブロックは、指定された論理機能を実装するための1つ又は複数の実行可能命令を含む、モジュール、セグメント、又は命令の一部を表すことができる。幾つかの代替的な実装において、ブロック内に記された機能は、図中に記された順序とは異なる順序で行われることがある。例えば、連続して示された2つのブロックは、関与する機能に応じて、実際には実質的に同時に実行されることもあり、又はこれらのブロックはときとして逆順で実行されることもある。
ブロック図もしくはフローチャート図又はその両方の各ブロック、及びブロック図もしくはフローチャート図又はその両方の中のブロックの組合せは、指定された機能又は動作を実行する専用ハードウェア・ベースのシステムによって実装することもでき、又は専用ハードウェアとコンピュータ命令との組合せを実行することもできることにも留意されたい。
図12に関して、以下に説明するシステム及びプロセスは、単一の集積回路(IC)チップ、複数のIC、特定用途向け集積回路(ASIC)などのハードウェア内で具体化することができる。さらに、各プロセスにおいてプロセスブロックの一部又は全部が現れる順序は、限定的とみなされるべきではない。むしろ、プロセスブロックのいくつかは、様々な順序で実行されることができることを理解すべきであり、それらのすべてを本明細書に明示的に図示することができるわけではない。
図12を参照すると、特許請求される主題の様々な態様を実装するための例示的な環境1200は、コンピュータ1202を含む。コンピュータ1202は、処理ユニット1204、システムメモリ1206、コーデック1235、及びシステムバス1208を含む。システムバス1208は、システムメモリ1206を含むがこれに限定されないシステムコンポーネントを処理ユニット1204に結合する。処理ユニット1204は、様々な利用可能なプロセッサのいずれであってもよい。デュアルマイクロプロセッサ及び他のマルチプロセッサアーキテクチャを処理ユニット1204として使用することもできる。
システムバス1208は、メモリバス又はメモリコントローラ、周辺バス又は外部バス、又はインダストリアル・スタンダード・アーキテクチャ(ISA)、マイクロ・チャネル・アーキテクチャ(MSA)拡張ISA(EISA)、インテリジェント・ドライブ・エレクトロニクス(IDE)、VESAローカルバス(VLB)、ペリフェラル・コンポーネント・インターコネクト(PCI)、カードバス、ユニバーサル・シリアル・バス(USB)、アドバンスト・グラフィックス・ポート(AGP)、パーソナル・コンピュータ・メモリ・カード・インターナショナル・アソシエーション・バス(PCMCIA)、ファイアウォール(IEEE 13124)、及びスモール・コンピュータ・システム・インタフェース(SCSI)を含むがこれらに限定されない任意の様々な利用可能なバスアーキテクチャを使用するローカルバスを含む、複数のタイプのバス構造のいずれであってもよい。
システムメモリ1206は、様々な実施形態において、開示されたメモリアーキテクチャのうちの1つ又は複数を使用することができる揮発性メモリ1210及び不揮発性メモリ1212を含む。起動時などにコンピュータ1202内の要素間で情報を転送するための基本的なルーチンを含む基本入出力システム(BIOS)は、不揮発性メモリ1212に格納される。さらに、現在の技術革新によれば、コーデック1235は、エンコーダ又はデコーダのうちの少なくとも1つを含むことができ、エンコーダ又はデコーダのうちの少なくとも1つは、ハードウェア、ソフトウェア、又はハードウェアとソフトウェアとの組合せからなるものとすることができる。コーデック1235は、別個のコンポーネントとして描かれているが、コーデック1235は、不揮発性メモリ1212内に収容されていてもよい。限定ではなく例示として、不揮発性メモリ1212は、読み出し専用メモリ(ROM)、プログラム可能ROM(PROM)、電気的プログラム可能ROM(EPROM)、電気的に消去可能なプログラム可能ROM(EEPROM)、フラッシュメモリ、3Dフラッシュメモリ、又は抵抗性ランダムアクセスメモリ(RRAM)のような抵抗性メモリを含むことができる。不揮発性メモリ1212は、少なくともいくつかの実施形態において、開示されたメモリデバイスのうちの1つ又は複数を使用することができる。さらに、不揮発性メモリ1212は、コンピュータメモリ(例えば、コンピュータ1202又はそのメインボードと物理的に一体化されている)、又は取り外し可能メモリとすることができる。開示された実施形態を実装することができる適切なリムーバブルメモリの例は、セキュア・デジタル(SD)カード、コンパクト・フラッシュ(CF)カード、ユニバーサル・シリアル・バス(USB)メモリスティックなどを含むことができる。揮発性メモリ1210は、外部キャッシュメモリとして機能するランダムアクセスメモリ(RAM)を含み、また、様々な実施形態において開示された1つ又は複数のメモリデバイスを使用することもできる。限定ではなく例示として、RAMは、静的RAM(SRAM)、動的RAM(DRAM)、同期DRAM(SDRAM)、ダブルデータレートSDRAM(DDR SDRAM)、エンハンスドSDRAM(ESDRAM)などの多くの形態で利用可能である。
コンピュータ1202は、取り外し可能/取り外し不能な揮発性/非揮発性のコンピュータストレージ媒体を含むこともできる。図12は、例えば、ディスク・ストレージ1214を示す。ディスク・ストレージ1214は、磁気ディスクドライブ、ソリッドステートディスク(SSD)、フラッシュメモリカード、又はメモリスティックのようなデバイスを含むが、これらに限定されない。さらに、ディスク・ストレージ1214は、コンパクトディスクROMデバイス(CD−ROM)、CD記録可能ドライブ(CD−Rドライブ)、CD書き換え可能ドライブ(CD−RWドライブ)、又はデジタル多目的ディスクROMドライブ(DVD−ROM)のような光ディスクドライブを含むがこれらに限定されないストレージ媒体を、個別に又は他のストレージ媒体との組合せで含むことができる。ディスク・ストレージ1214をシステムバス1208に接続することを容易にするために、インタフェース1216などの取り外し可能又は取り外し不能なインタフェースが通常用いられる。ディスク・ストレージ1214は、エンティティに関係した情報を格納することができることが理解される。そうした情報は、サーバに格納されるか、又はサーバに提供されるか、又はエンティティのデバイス上で実行されるアプリケーションに提供されるであろう。一実施形態において、エンティティに対して、ディスク・ストレージ1214に格納されるか又はサーバもしくはアプリケーションに送信されるタイプの情報を(例えば、出力デバイス1236を介して)通知することができる。収集される又はサーバもしくはアプリケーションと共有されるこのような情報の入手を(例えば、入力デバイス1228からの入力によって)オプトイン又はオプトアウトする機会をエンティティに対して提供することができる。
図12は、エンティティと好適な動作環境1200内で記述される基本的なコンピュータリソースとの間の仲介者として機能するソフトウェアを記述していることを理解されたい。そのようなソフトウェアは、オペレーティングシステム1218を含む。オペレーティングシステム1218は、ディスク・ストレージ1214に格納されていてもよく、コンピュータ1202のリソースを制御して割り当てるように機能する。アプリケーション1220は、システムメモリ1206又はディスク・ストレージ1214に格納された、プログラムモジュール1224、及びブート/シャットダウントランザクションテーブルなどのプログラムデータ1226を通じて、オペレーティングシステム1218によるリソースの管理を利用する。特許請求される主題は、様々なオペレーティングシステム又はオペレーティングシステムの組合せで実装できることが理解されるであろう。
エンティティは、入力デバイス1228を介してコンピュータ1202にコマンド又は情報を入力する。入力デバイス1228は、マウス、トラックボール、スタイラス、タッチパッド、キーボード、マイク、ジョイスティック、ゲームパッド、衛星放送アンテナ、スキャナ、テレビチューナーカード、デジタルカメラ、デジタルビデオカメラ、ウェブカメラなどのポインティングデバイスを含むが、これらに限定されない。これら及び他の入力デバイスは、インタフェースポート1230を介してシステムバス1208を通じて処理ユニット1204に接続する。インタフェースポート1230は、例えば、シリアルポート、パラレルポート、ゲームポート、ユニバーサルシリアルバス(USB)などを含む。出力デバイス1236は、入力デバイス1228と同じタイプのポートのいくつかを使用する。そのため、例えばUSBポートを、コンピュータ1202に入力を提供するため、及び、コンピュータ1202から出力デバイス1236に情報を出力するために使用することができる。出力アダプタ1234は、他の出力デバイス1236のうち特別なアダプタを必要とするモニタ、スピーカ、プリンタのようないくつかの出力デバイス1236があることを例示するために提供される。出力アダプタ1234は、限定ではなく例示として、出力デバイス1236とシステムバス1208との間の接続手段を提供するビデオカード及びサウンドカードを含む。他のデバイス又はデバイスのシステムは、遠隔コンピュータ1238のように入力及び出力の両方の機能を提供することに留意されたい。
コンピュータ1202は、遠隔コンピュータ1238などの1つ又は複数の遠隔コンピュータへの論理接続を用いて、ネットワーク環境において動作することができる。遠隔コンピュータ1238は、パーソナルコンピュータ、サーバ、ルータ、ネットワークPC、ワークステーション、マイクロプロセッサベースの器具、ピアデバイス、スマートフォン、タブレット、又は他のネットワークノードとすることができ、典型的には、コンピュータ1202に関して説明した要素の多くを含む。簡潔にするために、リモートコンピュータ1238と共にメモリストレージデバイス1240のみが図示されている。リモートコンピュータ1238は、ネットワーク・インタフェース1242を通じ、次いで通信接続1244を介して、コンピュータ1202に論理的に接続される。ネットワーク・インタフェース1242は、ローカルエリアネットワーク(LAN)及び広域ネットワーク(WAN)並びにセルラーネットワークなどの有線又は無線通信ネットワークを包含する。LAN技術には、ファイバ分散データインタフェース(FDDI)、銅分散データインタフェース(CDDI)、イーサネット、トークンリングなどが含まれる。WAN技術には、ポイント・ツー・ポイント・リンク、統合サービス・デジタル・ネットワーク(ISDN)などの回線交換ネットワーク及びそのバリエーション、パケット交換ネットワーク、デジタル加入者回線(DSL)などが含まれるが、これらに限定されるものではない。
通信接続1244は、ネットワーク・インタフェース1242をバス1208に接続するために使用されるハードウェア/ソフトウェアを指す。通信接続1244は、明確に例示するためにコンピュータ1202の内部に示されているが、コンピュータ1202の外部にあってもよい。ネットワーク・インタフェース1242への接続に必要なハードウェア/ソフトウェアは、単なる例示の目的で、通常の電話グレードのモデム、ケーブルモデム及びDSLモデムを含むモデム、ISDNアダプタ、及び、有線及び無線のイーサネットカード、ハブ、及びルータなどの内部及び外部技術を含む。
本主題を、1つのコンピュータもしくは複数のコンピュータ又はその両方の上で実行されるコンピュータプログラム製品のコンピュータ実行可能命令の一般的な文脈で、上記で説明してきたが、当業者は、本開示はまた、他のプログラムモジュールと組み合わせて実装できることを認識するであろう。一般に、プログラムモジュールは、特定のタスクを実行し、もしくは特定の抽象的なデータ型を実装する、又はその両方である、ルーチン、プログラム、コンポーネント、データ構造などを含む。さらに、当業者であれば、本発明のコンピュータ実装方法は、シングルプロセッサ又はマルチプロセッサコンピュータシステム、ミニコンピューティングデバイス、メインフレームコンピュータ、及びコンピュータ、携帯型コンピューティングデバイス(例えば、PDA、電話)、マイクロプロセッサベース又はプログラム可能な民生用又は産業用電子機器などを含む他のコンピュータシステム構成でも実施できることを理解するであろう。図示された態様は、通信ネットワークを介してリンクされたリモート処理装置によってタスクが実行される分散コンピューティング環境において実施することもできる。しかしながら、本開示の全部ではないとしても一部の態様は、独立型コンピュータ上で実施することができる。分散コンピューティング環境では、プログラムモジュールをローカル及び遠隔両方のメモリストレージデバイスに配置することができる。
本出願で使用される場合、「コンポーネント」、「システム」、「プラットフォーム」、「インタフェース」などの用語は、コンピュータ関係のエンティティ、又は1つ又は複数の特定の機能を有する動作機械に関係したエンティティを指すことができ、もしくは含むことができ、又はその両方とすることができる。本明細書に開示されるエンティティは、ハードウェア、ハードウェアとソフトウェアの組合せ、ソフトウェア、又は実行中のソフトウェアのいずれかとすることができる。例えば、エンティティは、プロセッサ上で実行されるプロセス、プロセッサ、オブジェクト、実行可能ファイル、実行スレッド、プログラム、もしくはコンピュータ又はそれらの組合せとすることができるが、これらに限定されない。例示として、サーバ上で実行されるアプリケーションとサーバの両方がコンポーネントであってもよい。1つ又は複数のコンポーネントは、プロセスもしくは実行スレッド内又はその両方に存在することができ、コンポーネントは、1つのコンピュータ上に局在していてもよく、もしくは2つ以上のコンピュータ間に分散されてもよく、その両方であってもよい。別の例では、各コンポーネントは、様々なデータ構造が格納された様々なコンピュータ可読媒体から実行することができる。コンポーネントは、1つ又は複数のデータパケットを有する信号に従って、ローカルプロセスもしくは遠隔プロセス又はその両方を介して通信することができる(例えば、1つのコンポーネントからのデータが、ローカルシステム内、分散システム内、もしくは他のシステムとのインターネットなどのネットワーク上で、又はそれらの組合せにおいて、信号を介して別のコンポーネントと相互作用する)。別の例として、コンポーネントは、プロセッサによって実行されるソフトウェア又はファームウェアアプリケーションによって動作する電気回路又は電子回路によって動作する機械部品によって提供される特定の機能を有する装置であってもよい。このような場合、プロセッサは、装置の内部にあっても又は外部にあってもよく、ソフトウェア又はファームウェアアプリケーションの少なくとも一部を実行することができる。さらに別の例として、コンポーネントは、機械的な部品を持たない電子部品を通じて特定の機能を提供する装置であってもよく、ここで、電子部品は、プロセッサ、又は電子部品の機能を少なくとも部分的に付与するソフトウェア又はファームウェアを実行する他の手段を含むことができる。ある態様において、コンポーネントは、仮想マシンを介して、例えばクラウドコンピューティングシステム内で、電子コンポーネントをエミュレートすることができる。
さらに、用語「又は」は、排他的な「又は」ではなく、包括的な「又は」を意味することが意図されている。つまり、別段の指定がない限り、あるいは文脈から明らかでない限り、「XはA又はBを使用する」は、自然な包含的な組合せのいずれかを意味することが意図される。つまり、XがAを使用し、XがBを使用し、あるいはXがAとBの両方を使用する場合、「XはA又はBを使用する」ということは、前述のいずれの場合でも満たされることになる。さらに、本明細書及び添付図面で使用される「a」及び「an」という冠詞は、別段の指定がない限り、又は文脈から単数形が指示されていることが明らかでない限り、一般的に「1つ又は複数、1つ以上」を意味すると解釈されるべきである。本明細書で使用される場合、用語「例」もしくは「例示(的)」又はその両方は、例、事例、又は例証として機能することを意味するために使用され、非限定的であることが意図されている。疑義を避けるために、本明細書に開示される主題は、そのような例によって限定されるものではない。さらに、「例」もしくは「例示(的)」又はその両方として本明細書に記載されているいずれの態様又は設計も、必ずしも他の態様又は設計よりも好ましい又は有利であると解釈されるものではなく、また、当業者に知られている同等の例示的な構造及び技術を排除することを意味するものでもない。
本明細書で使用される場合、「プロセッサ」という用語は、シングルコアプロセッサ、ソフトウェアマルチスレッド実行能力を有するシングルプロセッサ、マルチコアプロセッサ、ソフトウェアマルチスレッド実行能力を有するマルチコアプロセッサ、ハードウェアマルチスレッド技術を有するマルチコアプロセッサ、並列プラットフォーム、及び分散共有メモリを有する並列プラットフォームを含むが、これらに限定されない、実質的にあらゆるコンピューティング処理ユニット又はデバイスを指すものとすることができる。さらに、プロセッサは、集積回路、特定用途向け集積回路(ASIC)、デジタル信号プロセッサ(DSP)、フィールド・プログラマブル・ゲートアレイ(FPGA)、プログラマブル・ロジック・コントローラ(PLC)、コンプレックス・プログラマブル・ロジックデバイス(CPLD)、ディスクリートゲート又はトランジスタロジック、ディスクリートハードウェアコンポーネント、又は本明細書に記載された機能を実行するように設計されたそれらの任意の組合せを指すことができる。さらに、プロセッサは、スペース使用量を最適化し、又はエンティティの機器の性能を向上させるために、限定されないが、分子及び量子ドットベースのトランジスタ、スイッチ及びゲートなどのナノスケールのアーキテクチャを利用することができる。プロセッサは、コンピューティング処理ユニットの組合せとして実装することもできる。本開示において、「ストア」、「ストレージ」、「データストア」、「データストレージ」、「データベース」などの用語、及びコンポーネントの動作及び機能に関連する実質的にあらゆる他の情報ストレージコンポーネントは、「メモリコンポーネント」、「メモリ」内に具体化されたエンティティ、又はメモリを含むコンポーネントを指すために利用される。本明細書に記載されるメモリもしくはメモリコンポーネント又はその両方は、揮発性メモリ又は不揮発性メモリのいずれかであってもよく、又は揮発性メモリと不揮発性メモリの両方を含んでもよいことを理解されたい。限定ではなく例示として、不揮発性メモリは、読み出し専用メモリ(ROM)、プログラム可能ROM(PROM)、電気的プログラム可能ROM(EPROM)、電気的消去可能ROM(EEPROM)、フラッシュメモリ、又は不揮発性ランダムアクセスメモリ(RAM)(例えば、強誘電体RAM(FeRAM))を含むことができる。揮発性メモリは、例えば、外部キャッシュメモリとして機能することができるRAMを含むことができる。限定ではなく例示として、RAMは、同期RAM(SRAM)、動的RAM(DRAM)、同期DRAM(SDRAM)、ダブルデータレートSDRAM(DDR SDRAM)、エンハンストSDRAM(ESDRAM)、Synchlink DRAM(SLDRAM)、ダイレクトRambus RAM(DRRAM)、ダイレクトRambus動的RAM(DRDRAM)、Rambus動的RAM(RDRAM)などの多くの形態で利用可能である。さらに、本明細書に開示されたシステム又はコンピュータ実装方法のメモリコンポーネントは、これら及び任意の他の適切なタイプのメモリを含むことが意図されているが、含むことに限定されることはない。
上記で説明したことは、システム及びコンピュータ実装方法の単なる例を含む。もちろん、本開示を記載する目的のために、構成要素又はコンピュータ実装方法の考えられるすべての組合せを記載することは不可能であるが、当業者は、本開示の多くのさらなる組合せ及び置換が可能であることを認識することができる。さらに、「含む(includes)」、「有する(has)」、「所有する(possesses)」などの用語が詳細な説明、請求項、付録、及び図面において使用される範囲において、これらの用語は、請求項において移行語として使用される場合に「含む(comprising)」という用語が解釈される場合の「含む(comprising)」という用語と同様に、包括的であることが意図されている。様々な実施形態の説明は、例示の目的で提示されているが、網羅的であることを意図したものではなく、開示された実施形態に限定されるものでもない。記載された実施形態の範囲から逸脱することなく、多くの修正及び変形が当業者には明らかであろう。本明細書で使用される用語は、実施形態の原理、実用的な適用又は市場で見いだされる技術に対する技術的な改良を最もよく説明するために、又は当業者が本明細書に開示された実施形態を理解することを可能にするために選択された。

Claims (20)

  1. コンピュータ実行可能コンポーネントを格納するメモリと、
    前記メモリに格納された前記コンピュータ実行可能コンポーネントを実行するプロセッサと、
    を含むシステムであって、前記コンピュータ実行可能コンポーネントは、
    マルチタスク学習モデルを用いて、異なる種類のがんをそれぞれ生き延びた患者群についてのがん生存データ及び患者ゲノムデータを評価して、前記異なる種類のがんにそれぞれ関連付けられる活性遺伝因子を同定する活性遺伝因子同定コンポーネントと、
    前記異なる種類のがんの2種類以上のがんの間で共有される前記活性遺伝因子の共通活性遺伝因子を判定する疾患関連性コンポーネントと、
    を含む、システム。
  2. 前記マルチタスク学習モデルの機能として、前記活性遺伝因子と前記活性遺伝因子がそれぞれ関連付けられる前記異なる種類のがんとの間の関連度をそれぞれ表す前記活性遺伝因子のスコアを決定する、スコア付けコンポーネントをさらに含む、請求項1に記載のシステム。
  3. 前記活性遺伝因子のうちの1つ又は複数の活性遺伝因子を、前記1つ又は複数の活性遺伝因子にそれぞれ関連付けられたスコアに基づいて遺伝子治療標的として選択する、選択コンポーネントをさらに含む、請求項2に記載のシステム。
  4. 前記疾患関連性コンポーネントが、前記異なる種類のがんのサブセット間の関係を表す関係パラメータを、前記サブセットに含まれるそれぞれの種類のがんの間で共有される前記共通活性遺伝因子の数に基づいてさらに決定する、請求項1に記載のシステム。
  5. 前記サブセットに含まれる前記それぞれの種類のがんの間で共有される前記共通活性遺伝因子の前記数に基づいて、前記サブセットの関連性スコアを決定するスコア付けコンポーネントをさらに含み、前記関連性スコアは前記それぞれの種類のがんが関係している度合いを反映する、請求項4に記載のシステム。
  6. 前記関係パラメータに基づいて前記マルチタスク学習モデルを更新し、それによって更新されたマルチタスク学習モデルを生成する最適化コンポーネントであって、前記活性遺伝因子同定コンポーネントに対して、前記更新されたマルチタスク学習モデルを使用して前記がん生存データ及び前記患者ゲノムデータに基づいて前記異なる種類のがんにそれぞれ関連付けられる更新された活性遺伝因子を同定するよう指示する最適化コンポーネントをさらに含む、請求項4に記載のシステム。
  7. 前記共通活性遺伝因子に基づいて、前記共通活性遺伝因子のそれぞれの共通活性遺伝因子について、前記それぞれの共通活性遺伝因子に関連付けられる前記異なる種類のがんの各々を同定するインデックス付きデータ構造を生成する、インデックス付けコンポーネントをさらに含む、請求項1に記載のシステム。
  8. 前記疾患関連性コンポーネントが、前記異なる種類のがんについての歴史的疾患関連性情報をさらに評価して、前記異なる種類のがんのサブセット間の歴史的関係を表す歴史的関係パラメータを決定する、請求項1に記載のシステム。
  9. 前記疾患関連性コンポーネントが、前記歴史的関係及び前記共通活性遺伝因子に基づいて、前記異なる種類のがんの前記サブセット間の更新された関係を表す更新された関係パラメータをさらに決定する、請求項8に記載のシステム。
  10. 前記マルチタスク学習コンポーネントが、前記歴史的関係パラメータをさらに評価して、前記異なる種類のがんにそれぞれ関連付けられる前記活性遺伝因子を同定する、請求項8に記載のシステム。
  11. 前記マルチタスク学習モデルが、前記異なる種類のがんにそれぞれ関連付けられる前記活性遺伝因子を判定する複数のタスクを最適化問題としてモデル化する、請求項1のシステム。
  12. 異なる種類のがんにそれぞれ関連付けられる活性遺伝因子を、前記異なる種類のがんをそれぞれ生き延びた患者群のがん生存データ及び患者ゲノムデータに基づいて判定するために、プロセッサに動作可能に結合されたデバイスによってマルチタスク学習モデルを使用することと、
    前記デバイスによって、前記異なる種類のがんの2種類以上のがんの間で共有される活性遺伝因子の共通活性遺伝因子を判定することと、
    を含む、コンピュータ実装方法。
  13. 前記マルチタスク学習モデルの機能として、前記活性遺伝因子と前記活性遺伝因子がそれぞれ関連付けられる前記異なる種類のがんとの間の関連度をそれぞれ表す前記活性遺伝因子のスコアを決定することと、
    前記デバイスによって、前記活性遺伝因子のうちの1つ又は複数の活性遺伝因子を、前記1つ又は複数の活性遺伝因子にそれぞれ関連付けられるスコアに基づいて遺伝子治療標的として選択することと、
    をさらに含む、請求項12に記載のコンピュータ実装方法。
  14. 前記デバイスによって、前記異なる種類のがんのサブセット間の関係を表す関係パラメータを、前記サブセットに含まれるそれぞれの種類のがんの間で共有される前記共通活性遺伝因子の数に基づいて決定することをさらに含む、請求項12に記載のコンピュータ実装方法。
  15. 前記デバイスによって、前記サブセットに含まれる前記それぞれの種類のがんの間で共有される前記共通活性遺伝因子の前記数に基づいて、前記サブセットの関連性スコアを決定することをさらに含み、前記関連性スコアは前記それぞれの種類のがんが関係している度合いを反映する、請求項14に記載のコンピュータ実装方法。
  16. 前記がん生存データ及び前記患者ゲノムデータに基づくとともに、さらに前記関係パラメータに基づいて、前記異なる種類のがんにそれぞれ関連付けられる更新された活性遺伝因子を判定するために、前記デバイスによって前記マルチタスク学習モデルを使用することをさらに含む、請求項15に記載のコンピュータ実装方法。
  17. 前記マルチタスク学習モデルを使用することが、前記異なる種類のがんのサブセット間の関係に関する疾患関連性パラメータを用いて、前記異なる種類のがんにそれぞれ関連付けられる異なる生存モデルを共同で訓練して、前記異なる生存モデルのうちの2つ以上を連結させることを含む、請求項12に記載のコンピュータ実装方法。
  18. 潜在的ながん遺伝子治療標的を決定するためのコンピュータプログラム製品であって、具体化されたプログラム命令を有するコンピュータ可読ストレージ媒体を含み、前記プログラム命令は、処理コンポーネントによって実行可能であって、前記処理コンポーネントに、
    異なる種類のがんにそれぞれ関連付けられる活性遺伝因子を、前記異なる種類のがんをそれぞれ生き延びた患者群のがん生存データ及び患者ゲノムデータに基づいて判定するために、マルチタスク学習モデルを使用することと、
    前記異なる種類のがんの2種類以上のがんの間で共有される活性遺伝因子の共通活性遺伝因子を判定することと、
    を行わせる、コンピュータプログラム製品
  19. 前記処理コンポーネントによって実行される前記プログラム命令が、前記処理コンポーネントに、
    前記マルチタスク学習モデルの機能として、前記活性遺伝因子と前記活性遺伝因子がそれぞれ関連付けられる前記異なる種類のがんとの間の関連度をそれぞれ表す前記活性遺伝因子のスコアを決定することと、
    前記活性遺伝因子のうちの1つ以上の活性遺伝因子を、前記1つ以上の活性遺伝因子にそれぞれ関連付けられるスコアに基づいて前記潜在的な遺伝子治療標的として選択することと、
    をさらに行わせる、請求項18に記載のコンピュータプログラム製品。
  20. 前記処理コンポーネントによって実行される前記プログラム命令が、前記処理コンポーネントに、
    前記異なる種類のがんのサブセット間の関係を表す関係パラメータを、前記サブセットに含まれるそれぞれのがん種の間で共有される前記共通活性遺伝因子の数に基づいて決定することと、
    前記がん生存データ及び前記患者ゲノムデータに基づくとともに、さらに前記関係パラメータに基づいて、前記異なる種類のがんにそれぞれ関連付けられる更新された活性遺伝因子を判定するために、前記マルチタスク学習モデルを使用することと、
    をさらに行わせる、請求項18に記載のコンピュータプログラム製品。
JP2020568811A 2018-06-18 2019-05-13 生存イベントのジョイントモデリングによる潜在的ながん治療標的の決定 Active JP7332173B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US16/011,231 2018-06-18
US16/011,231 US11410745B2 (en) 2018-06-18 2018-06-18 Determining potential cancer therapeutic targets by joint modeling of survival events
PCT/IB2019/053920 WO2019243909A1 (en) 2018-06-18 2019-05-13 Determining potential cancer therapeutic targets by joint modeling of survival events

Publications (2)

Publication Number Publication Date
JP2021527874A true JP2021527874A (ja) 2021-10-14
JP7332173B2 JP7332173B2 (ja) 2023-08-23

Family

ID=68840713

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020568811A Active JP7332173B2 (ja) 2018-06-18 2019-05-13 生存イベントのジョイントモデリングによる潜在的ながん治療標的の決定

Country Status (5)

Country Link
US (1) US11410745B2 (ja)
JP (1) JP7332173B2 (ja)
CN (1) CN112204667A (ja)
GB (1) GB2589745A (ja)
WO (1) WO2019243909A1 (ja)

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20090080731A1 (en) * 2007-09-26 2009-03-26 Siemens Medical Solutions Usa, Inc. System and Method for Multiple-Instance Learning for Computer Aided Diagnosis
JP2010516291A (ja) * 2007-01-31 2010-05-20 ジ・オハイオ・ステイト・ユニバーシティ・リサーチ・ファウンデイション 急性骨髄性白血病(aml)の診断、予後及び治療のためのマイクロrnaに基づく方法及び組成物
JP2010523156A (ja) * 2007-04-10 2010-07-15 ナショナル タイワン ユニバーシティ マイクロrnaによる癌患者における治療後生存の予測
WO2015190542A1 (ja) * 2014-06-11 2015-12-17 東レ株式会社 胆道がんの検出キット又はデバイス及び検出方法
WO2018015080A1 (en) * 2016-07-19 2018-01-25 Siemens Healthcare Gmbh Medical image segmentation with a multi-task neural network system

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8078407B1 (en) * 1997-03-28 2011-12-13 Health Hero Network, Inc. System and method for identifying disease-influencing genes
KR101987477B1 (ko) * 2012-05-07 2019-06-10 엘지전자 주식회사 바이오마커 발굴 방법
EP3164824B1 (en) * 2014-07-03 2024-04-17 Predilife Method for prognosing a risk of occurrence of a disease
EP3297566A4 (en) * 2015-05-22 2019-02-20 CSTS Health Care Inc. BIOMARKER-CONTROLLED TARGETED MOLECULAR THERAPEUTIC COMBINATIONS BASED ON KNOWLEDGE REPRESENTATION PATH ANALYSIS
CN105701365B (zh) 2016-01-12 2018-09-07 西安电子科技大学 发现癌症相关基因的方法及相关系统、药物制备方法
CN107358062B (zh) 2017-06-02 2020-05-22 西安电子科技大学 一种双层基因调控网络的构建方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2010516291A (ja) * 2007-01-31 2010-05-20 ジ・オハイオ・ステイト・ユニバーシティ・リサーチ・ファウンデイション 急性骨髄性白血病(aml)の診断、予後及び治療のためのマイクロrnaに基づく方法及び組成物
JP2010523156A (ja) * 2007-04-10 2010-07-15 ナショナル タイワン ユニバーシティ マイクロrnaによる癌患者における治療後生存の予測
US20090080731A1 (en) * 2007-09-26 2009-03-26 Siemens Medical Solutions Usa, Inc. System and Method for Multiple-Instance Learning for Computer Aided Diagnosis
WO2015190542A1 (ja) * 2014-06-11 2015-12-17 東レ株式会社 胆道がんの検出キット又はデバイス及び検出方法
WO2018015080A1 (en) * 2016-07-19 2018-01-25 Siemens Healthcare Gmbh Medical image segmentation with a multi-task neural network system

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
FANTINE MORDELET ET AL.: "ProDiGe: Prioritization Of Disease Genes with multitask machine learning from positive and unlabeled", BMC BIOINFORMATICS, vol. 12, no. 389, JPN6022050932, 2011, pages 1 - 15, ISSN: 0004937862 *
YONGSHENG LI ET AL.: "Comprehensive analysis of the functional microRNA-mRNA regulatory network identifies miRNA signature", NUCLEIC ACID RESEARCH, vol. 41, no. 22, JPN6022050931, 2013, pages 1 - 17, ISSN: 0004937863 *

Also Published As

Publication number Publication date
US11410745B2 (en) 2022-08-09
WO2019243909A1 (en) 2019-12-26
GB2589745A (en) 2021-06-09
GB202019896D0 (en) 2021-01-27
CN112204667A (zh) 2021-01-08
US20190384889A1 (en) 2019-12-19
JP7332173B2 (ja) 2023-08-23

Similar Documents

Publication Publication Date Title
Shimizu et al. Artificial intelligence in oncology
US20210249108A1 (en) Artificial intelligence engine for generating candidate drugs
Chen et al. A gradient boosting algorithm for survival analysis via direct optimization of concordance index
Kristensen et al. Principles and methods of integrative genomic analyses in cancer
Chang et al. Identification of human housekeeping genes and tissue-selective genes by microarray meta-analysis
Batin et al. Artificial intelligence in life extension: from deep learning to superintelligence
Zhang et al. Review of the applications of deep learning in bioinformatics
Barbiero et al. Graph representation forecasting of patient's medical conditions: Toward a digital twin
Zhavoronkov et al. Deep biomarkers of aging and longevity: from research to applications
Yang et al. Predicting gene regulatory interactions based on spatial gene expression data and deep learning
CN114203296A (zh) 基于患者数据的用于健康护理诊断和治疗的贝叶斯因果关系网络模型
CN110633786A (zh) 用于确定人工神经网络拓扑的技术
Chen et al. Learning and interpreting the gene regulatory grammar in a deep learning framework
Lin et al. De novo peptide and protein design using generative adversarial networks: an update
Barh et al. In silico models: from simple networks to complex diseases
Sadasivan Accelerated Systems for Portable DNA Sequencing
Nandhini et al. Hybrid CNN-LSTM and modified wild horse herd Model-based prediction of genome sequences for genetic disorders
Yaqoob et al. Optimizing gene selection and cancer classification with hybrid sine cosine and cuckoo search algorithm
Chen et al. Owl reasoning over big biomedical data
US11830625B2 (en) Generation of a disease status index using a probabilistic model and observational data
JP2021527874A (ja) 生存イベントのジョイントモデリングによる潜在的ながん治療標的の決定
CN115954112A (zh) 药物治疗效果预测方法、装置、计算设备及存储介质
Messaoudi et al. A performance evaluation of NoSQL databases to manage proteomics data
Lin et al. Logic synthesis for genetic diseases: modeling disease behavior using Boolean networks
Milenković et al. Topological characteristics of molecular networks

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20210204

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20201221

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210927

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20220502

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20221206

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20230306

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20230427

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20230718

RD14 Notification of resignation of power of sub attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7434

Effective date: 20230718

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20230803

R150 Certificate of patent or registration of utility model

Ref document number: 7332173

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150